Início NOTÍCIAS Depsec inicia 2026 com sinalização em papel para treinar minimamente modelos grandes

Depsec inicia 2026 com sinalização em papel para treinar minimamente modelos grandes

113
0

A startup chinesa de inteligência artificial Deepsec iniciou 2026 com um novo artigo técnico, de coautoria do fundador Liang Wenfeng, que propõe uma arquitetura básica a ser considerada para o treinamento de modelos básicos de IA.

O método – apelidado de hiperconexões múltiplas (MHC) – faz parte do esforço da empresa de Hangzhou para tornar os seus modelos mais rentáveis, à medida que tenta acompanhar o ritmo dos rivais norte-americanos mais bem financiados e com acesso mais profundo ao poder computacional.

Refletiu também a cultura cada vez mais aberta e colaborativa entre as empresas chinesas de IA, que publicaram publicamente uma proporção cada vez maior da sua investigação.

Para os observadores da indústria, os artigos do Depsec geralmente fornecem uma indicação inicial importante das escolhas de engenharia que moldarão o próximo grande lançamento de modelo da startup.

Em um artigo divulgado na quinta-feira, uma equipe de 19 pesquisadores da Deepsec relatou que testou o MHC em modelos com 3 bilhões, 9 bilhões e 27 bilhões de parâmetros e o escalou sem adicionar carga computacional significativa.

“Os resultados experimentais confirmam que o MHC com maior escalabilidade em comparação com o HC convencional (hiperconexões) efetivamente… (permite) treinamento estável em larga escala”, escreveram os pesquisadores, liderados por Xinda Xie, Yixuan Wei e Hongqi Cao.

Source link