Início NOTÍCIAS A corrida armamentista de IA da China vê o setor se preparar...

A corrida armamentista de IA da China vê o setor se preparar para a semana de lançamento de um grande modelo carro-chefe

15
0

O setor de IA da China está a preparar-se para uma semana monumental, com uma enxurrada de novos modelos – incluindo um poderoso concorrente “furtivo” – surgindo à medida que gigantes da tecnologia locais se preparam para revelar os seus principais produtos.

Corrida para lançar novos modelos Antes do feriado do Ano Novo Lunar Após os lançamentos de alto perfil dos pesos pesados ​​norte-americanos Anthropic e OpenAI, o início de 2026 marca uma intensa competição global entre empresas fronteiriças pela atenção do consumidor, no meio de uma rápida aceleração no ritmo do progresso da IA.

No domingo, um membro da equipe de desenvolvimento de modelos do Alibaba Cloud lançou solicitações pull – uma proposta do desenvolvedor para adicionar novo código a um projeto de software compartilhado – para sua família de modelos de próxima geração em plataformas de desenvolvedores de código aberto e adotando o GitHub. Essas plataformas são repositórios online onde os programadores podem compartilhar, colaborar e gerenciar código de software, tornando-o publicamente acessível para uso e modificação.

A peça central desta nova família é o tão aguardado QWEN-3.5, que deverá chegar quase um ano após o lançamento da geração anterior de modelos da gigante tecnológica com sede em Hangzhou, o QWEN-3, que a ajudou a tornar-se a família de modelos abertos mais popular a nível mundial durante 2025 devido ao seu forte desempenho, licenciamento legítimo e muito mais.

Alibaba Cloud é a unidade de IA e computação em nuvem do Alibaba Group Holding, proprietário do South China Morning Post.

Com base nas informações preliminares divulgadas como parte das solicitações pull, o QWEN-3.5 incluirá dois modelos – um em 9 bilhões de parâmetros e outro em 35 bilhões de parâmetros – com suporte multimodal nativo pela primeira vez. Parâmetros são variáveis ​​que codificam a “inteligência” de um modelo que são ajustados durante o treinamento. Em geral, um maior número de variáveis ​​significa um modelo mais poderoso, embora também seja mais exigente computacionalmente. E o suporte multimodal significa que a IA pode compreender e processar diferentes tipos de dados, como texto, imagens e áudio.

Ambos os modelos também contarão com a arquitetura de próxima geração da empresa, que foi apresentada pela primeira vez em setembro em um modelo experimental chamado QWEN3-NEXT.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui