A AILab, com sede em Xangai, disse na segunda-feira que seu mais recente modelo Flash de fase 3.5 foi projetado para fornecer raciocínio avançado e recursos de agência, mantendo o desempenho.
Apesar de seu tamanho relativamente modesto de cerca de 196 bilhões de parâmetros – muito menor que o Kimi K2.5 da Moonshot AI com 1 trilhão de parâmetros ou o DeepSeq V3.2 com 671 bilhões de parâmetros – o flash da Fase 3.5 superou seus concorrentes maiores em uma série de testes de benchmark, raciocínio e capacidades de codificação.
Parâmetros são variáveis que codificam a “inteligência” de um sistema de IA, com números maiores geralmente indicando um desempenho mais forte.
Etapa 3.5 O Flash superou quatro benchmarks de raciocínio, incluindo AIME 2025 e IMOANSWERBENCH, superando os sistemas líderes de DeepSeq, Moonshot AI, Zappo AI e MINIMAX, e em alguns testes superando apenas OpenAI apoiado pela Microsoft.



