Nvidia fez isso Fortune fornecendo chips para empresas que trabalham com inteligência artificial, hoje a fabricante de chips deu um passo em direção a uma produtora de modelos mais séria ao lançar uma série de recortes para modelos abertos, juntamente com dados e ferramentas para ajudar os engenheiros a utilizá-los.
A mudança, que ocorre num momento em que empresas de IA como OpenAI, Google e Anthropic estão aumentando seus chips mais capazes, pode ser uma proteção contra essas empresas que enfrentam a tecnologia Nvidia ao longo do tempo.
Os modelos abertos já são uma parte importante do ecossistema de IA, com muitos pesquisadores e startups os utilizando para experimentar, prototipar e construir. Embora a OpenAI e o Google ofereçam pequenos modelos de código aberto, eles não os atualizam com tanta frequência quanto seus rivais na China. Por esta e outras razões, os exemplos abertos de empresas chinesas são muito mais populares, de acordo com informações de Abraçando o Rostoplataforma de hospedagem para projetos de código aberto.
Os novos modelos Nvidia Nemotron 3 estão entre os melhores que podem ser instalados, modificados e executados em seu próprio hardware, de acordo com as pontuações do Community Benchmark da empresa antes do lançamento.
“A inovação aberta é a base do desenvolvimento da IA”, disse o CEO Jensen Huang em comunicado antes da notícia. “Com o Nemotron, estamos transformando a IA em uma plataforma aberta que oferece aos desenvolvedores a transparência e a eficiência necessárias para construir sistemas de agente em escala.
A Nvidia está adotando uma abordagem mais transparente do que muitos de seus rivais nos EUA, divulgando dados de uso do Nemotron para ajudar os engenheiros a mudar de modelo com mais facilidade. A empresa também fornece ferramentas para ajudar na customização e ajuste fino. Isso inclui uma nova arquitetura híbrida de modelo especialista composto latente, que a Nvidia diz ser especialmente boa para construir agentes de IA que podem realizar ações em um computador ou na Internet. A empresa também está lançando bibliotecas que permitem aos usuários treinar agentes para fazer coisas usando recursos de aprendizagem que fornecem exemplos de recompensas e punições simuladas.
Os modelos Nemotron 3 vêm em três tamanhos: Nano, que possui 30 bilhões de parâmetros; Super, que tem 100 bilhões; e Ultra, que tem 500 bilhões. Os parâmetros do modelo correspondem vagamente à sua capacidade e ao quão anormal ele deve ser executado. Até precisar engravidar, ele precisa se odiar.
Fundações Modelo
Kari Ann Briski, presidente do programa de IA generativa da Nvidia, disse que os modelos estão abertos aos construtores de IA por três razões: os construtores precisam cada vez mais projetar modelos para tarefas específicas; muitas vezes ajuda procurar outros exemplos disponíveis; e é mais fácil a partir desses modelos, depois de treinados, simulando uma espécie de raciocínio, expressar respostas mais inteligentes. “Acreditamos que a IA de código aberto é a base da inovação, continuando a acelerar a economia global”, disse Briski.
A gigante da mídia social Meta lançou os primeiros modelos abertos avançados sob o nome Llama em fevereiro de 2023. No entanto, quando se tratou da competição, a Meta indicou que seu lançamento futuro não seria de código aberto.
A mudança faz parte de uma tendência maior na indústria de IA. Ao longo do último ano, as empresas norte-americanas retiraram-se do espaço aberto, tornaram-se mais secretas relativamente às suas investigações e abrandaram os seus rivais relativamente aos mais recentes truques de engenharia.



