Construída a partir da mesma pesquisa do Gemini 3, a nova família foi projetada desde uma borda 2B para o modelo que roda no Raspberry Pi, até um modelo denso 31B que agora é o terceiro líder de modelo aberto na AI Arena. A licença Apache 2.0 é uma mudança significativa em relação às versões anteriores do Gem.
O Google lançou a Gema 4Os modelos de última geração de sua família de quatro tamanhos com patente pendente são projetados para funcionar em tudo, desde o processo de fabricação até a implantação de smartphones.
Os modelos são construídos a partir da mesma pesquisa e técnicas que sustentam o Gemini 3, o modelo proprietário do Google, e são lançados sob a licença Apache 2.0, um termo mais permissivo do que as gerações anteriores do Gem, e uma mudança descrita pelo cofundador da Hugging Face, Clément Delangue. “Uma pedra enorme.”
Demis Hassabis, CEO do Google DeepMind, chamou os novos modelos “Os melhores modelos abertos do mundo para todos os tamanhos.”
Espaço TNW City Coworking – onde o melhor trabalho é feito
Um espaço de trabalho para crescimento, colaboração e oportunidades infinitas de networking no coração da tecnologia.
As quatro variantes são modelos de borda efetivos 2B (E2B) e 4B efetivos (E4B), que foram desenvolvidos para rodar no dispositivo em telefones, Raspberry Pi e hardware Jetson Nano em colaboração com a equipe Pixel, Qualcomm e MediaTek; e modelos 26B Mix-of-Experts (MoE) e 31B Dense, destinados ao uso offline em GPUs de desenvolvedores e consumidores.
O modelo Dense 31B está agora em terceiro lugar entre todos os modelos abertos na AI Text Authority Arena; o 26B MoE fica em sexto lugar. O Google afirma que modelos maiores têm desempenho até 20 vezes maior nesse benchmark.
Eles pesam até 31B com uma única GPU Nvidia H100 de 80GB; As versões quantizadas são executadas no computador host.
Todos os quatro modelos são multimodais, abertos ao processamento de vídeo e imagem e suportam mais de 140 idiomas. Os modelos E2B e E4B fornecem entrada de áudio nativa adicional para reconhecimento de fala. O contexto do Windows é de 128 mil caracteres para os modelos Edge e 256 mil para as duas variantes maiores.
Em termos de recursos, o Google destaca o raciocínio multinível, chamada de função nativa e saída JSON estruturada para tarefas de agente e geração de código offline. Em termos de desempenho, o Android Developers Blog observa que o modelo E2B funciona três vezes mais rápido que o E4B, enquanto a família carro-chefe é quatro vezes mais rápida que as versões anteriores do Gem e usa até 60% menos bateria.
Os modelos E2B e E4B também são a base do Gemini Nano 4, o modelo Android de próxima geração do Google para o dispositivo, que chegará aos dispositivos de consumo ainda este ano.
Gem acumulou mais de 400 milhões de downloads e mais de 100.000 variantes criadas pela comunidade desde seu primeiro lançamento, um número que o Google aponta como evidência da adoção em grande escala pelos desenvolvedores.
Gem 4 está disponível imediatamente em Hugging Face, Kaggle e Ollama, com modelos 31B e 26B acessíveis por meio do Google AI Studio e modelos de borda por meio da AI Edge Gallery.
A decisão de licenciamento do Apache 2.0 é a mais importante do lançamento comercial: ela remove as restrições que impediam certos projetos e projetos comerciais sob os termos anteriores do Gemma, abrindo o ecossistema para uma gama mais ampla de casos de uso de produção.



