Início NOTÍCIAS Os mais novos modelos da DeepSeek enfrentam o Vale do Silício por...

Os mais novos modelos da DeepSeek enfrentam o Vale do Silício por uma fração do custo

65
0

A DeepSeek está lançando hoje versões econômicas de seus tão aguardados modelos de IA V4, mais uma vez estreitando a lacuna com as principais empresas de modelagem de IA do mundo.

Uma startup chinesa lançado duas versões de código aberto, o modelo V4 Pro de alto desempenho e o modelo V4 Flash menor e mais barato. A empresa também está corrigindo a convergência com sistemas limítrofes, destacando fortes resultados em codificação, melhor contabilidade e capacidades de agente mais avançadas.

Uma das atualizações mais atraentes é o salto para a janela de contexto de 1 milhão, que permite aos modelos processar bases de código inteiras ou documentos muito longos em um só lugar.

Mas o que realmente diferencia esses modelos é o foco na eficiência.

Os modelos V4 são baseados em uma arquitetura de mistura de especialistas (MoE), que funciona apenas em um subconjunto de parâmetros do modelo em um determinado momento. Como um sistema pode ter trilhões de parâmetros no total, apenas uma fração é usada por função, o que resulta em menor custo.

Os novos modelos chegam pouco mais de um ano depois que o DeepSeek ganhou as manchetes com seu modelo R1. Esse sistema correspondia a modelos desenvolvidos por empresas como OpenAI e Google, mas foi construído por uma fração do custo e utilizou menos chips de IA para treinamento. Mensagem ou acionamento de uma Venda de trilhões de dólares em Wall StreetA Nvidia perdeu 600 milhões de dólares em um dia.

Em um artigo técnicoA empresa afirma que é o modelo mais recente da concorrência, reconhecendo que existe uma pequena lacuna de trabalho.

“Através da expansão dos benchmarks contábeis, o DeepSeek-V4-Pro-Max demonstra desempenho superior ao GPT-5.2 e Gemini-3.0-Pro em benchmarks contábeis padrão”, disse a empresa. “No entanto, seu desempenho fica ligeiramente aquém do GPT-5.4 e Gemini-3.1-Pro, sugerindo uma trajetória de desenvolvimento de modelos de limite de última geração por aproximadamente 3 a 6 meses.”

No entanto, para muitos utilizadores, a poupança de custos pode compensar qualquer ligeiro défice operacional.

O criador do Datasette, Simon Willison, comparou o ingresso a uma grande corrida em seus modelos blog considerou o DeepSeek o mais barato de sua classe.

É DeepSeek carregando US$ 0,14 por milhão de sinais de entrada e US$ 0,28 por milhão de sinais de saída para seu modelo V4 Flash. Para efeito de comparação, o GPT-5.4 Nano custa US$ 0,20 por milhão de sinais de entrada e US$ 1,25 milhão de sinais de saída, enquanto o Claudius Haiku 4.5 custa US$ 1 e US$ 5 por milhão de entrada e sinais, respectivamente.

A diferença torna-se ainda mais evidente quando se trata de modelos. DeepSeek inscreveu US$ 1,74 por milhão de tokens e US$ 3,48 por milhão de tokens para seu modelo V4 Pro. Em comparação, o Gemini 3.1 Pro custa US$ 2 por milhão de sinais de entrada e US$ 12 por milhão de sinais de saída, enquanto o GPT-5.5 custa US$ 5 e US$ 30 por milhão de entradas e sinais, respectivamente.

E, claro, de acordo com o lançamento anterior do DeepSeek, o V4 é licenciado pelo MIT e de código aberto, portanto, se você tiver os recursos para executá-lo, é “gratuito”, assim como um filme no Netflix é “gratuito”. Ninguém está forçando você a jogar no momento, mas ainda assim correr um metro em algum lugar. Neste caso, sua conta de luz.

Source link