GPT-5 é a versão mais recente do modelo de linguagem em larga escala da OpenAI
Imagens de Chen Xin/Getty
Os últimos avanços na IA são mais uma mudança provisória do que um grande salto em frente. OpenAI lançou seu mais recente modelo de IA. GPT-5dois anos após o lançamento do GPT-4, seu sucesso impulsionou o ChatGPT ao domínio mundial. Mas, apesar das promessas de saltos semelhantes em capacidade, o GPT-5 parece mostrar poucas melhorias em comparação com outros modelos líderes de IA, sugerindo que a indústria pode necessitar de novas abordagens para construir sistemas de IA mais inteligentes.
O próprio anúncio da OpenAI elogia o GPT-5 como um “grande salto em inteligência” em relação aos modelos anteriores da empresa, com melhorias claras em programação, matemática, escrita, informações de saúde e compreensão visual. Também reduzirá a frequência de alucinações, onde a IA apresenta informações falsas como verdadeiras. Em relação aos benchmarks internos que medem o “desempenho em tarefas de conhecimento complexas e economicamente valiosas”, a OpenAI afirma que o GPT-5 “iguala ou supera os especialistas em aproximadamente metade dos casos em tarefas de mais de 40 profissões, incluindo jurídico, logística, vendas e engenharia”.
No entanto, o desempenho do GPT-5 em benchmarks públicos não é dramaticamente melhor do que os modelos líderes de outras empresas de IA, como Claude da Anthropic e Gemini do Google. Embora haja uma melhoria no GPT-4, a diferença para muitos benchmarks é menor do que o salto do GPT-3 para o GPT-4. Muitos dos clientes do ChatGPT também Não impressionadoum exemplo da incapacidade do GPT-5 de responder a uma consulta aparentemente simples atraiu ampla atenção nas redes sociais.
“Muitas pessoas esperavam que houvesse um avanço, mas não é um avanço”, diz ele. Mirella Lapata Na Universidade de Edimburgo, Reino Unido. “Parece uma atualização e uma progressão gradual.”
A medida mais abrangente do desempenho do GPT-5 vem do próprio OpenAI. Isso ocorre porque apenas o OpenAI tem acesso total ao modelo. Ele disse que poucos detalhes sobre benchmarks internos foram divulgados. Ana Rogers na Copenhagen IT University, na Dinamarca. “Portanto, isto não é algo que possa ser seriamente discutido como uma afirmação científica”.
Na conferência de imprensa de pré-lançamento, Sam, CEO da OpenAI Altman afirmou: “GPT-5 é a primeira vez que parece que você está realmente conversando com especialistas sobre qualquer assunto, incluindo especialistas em nível de doutorado.” No entanto, isto não é apoiado por referências, e não está claro como um doutoramento se relaciona com a inteligência em geral, diz Rogers. “Pessoas altamente inteligentes não têm necessariamente um doutorado, e ter tal diploma não garante necessariamente alta inteligência”, diz Rogers.
As melhorias aparentemente modestas do GPT-5 podem ser um sinal de dificuldades mais amplas para os desenvolvedores de IA. Até recentemente, pensava-se que esses modelos de linguagem em larga escala (LLMs) poderiam se tornar mais poderosos com mais dados de treinamento e poder computacional. Isso não parece mais ser confirmado pelos resultados do modelo mais recente, e as empresas não conseguem encontrar um design de sistema de IA melhor do que aquele desenvolvido pelo ChatGPT. “Neste momento, todos têm a mesma receita e sabemos qual é essa receita”, diz Lapata, referindo-se ao processo de pré-treinamento de modelos em grandes quantidades de dados e depois ajustá-los no processo pós-treinamento.
Mas ele disse que é difícil dizer o quão próximo o LLM está da estagnação porque não sabemos exatamente como modelos como o GPT-5 são projetados. Nikos Aretras Na Universidade de Sheffield, Reino Unido. “Pode ser prematuro tentar generalizar sobre se os modelos de linguagem em grande escala atingiram um obstáculo. Sem informações sobre os detalhes técnicos, não é possível realmente fazer tais afirmações.”
A OpenAI também está trabalhando em outras maneiras de aumentar a eficiência de seus produtos, como um novo sistema de roteamento para GPT-5. Ao contrário das instâncias anteriores do ChatGPT, que permitiam aos usuários escolher qual modelo de IA usar, o GPT-5 verifica as solicitações e as direciona para um modelo específico que usa a quantidade apropriada de poder de computação.
Lapata diz que esta abordagem poderia ser adotada de forma mais ampla. “Os modelos de inferência usam muito (computação), por isso são demorados e caros”, diz ele. “Se pudermos responder a isso com um modelo menor, veremos mais no futuro”. Mas a mudança irritou alguns clientes do ChatGPT, com Altman dizendo: empresa está procurando Para melhorar o processo de roteamento.
Outro modelo OpenAI mostra sinais mais positivos para o futuro da IA. O modelo ganhou medalhas de ouro em competições de elite de matemática e codificação no mês passado. Isto é algo que os principais modelos de IA não conseguiram alcançar há um ano. Detalhes sobre como o modelo funciona novamente faltam, mas Os funcionários da OpenAI são Ele disse que seu sucesso sugere que o sistema possui capacidades de raciocínio mais gerais.
Aletras diz que tais concursos podem ajudar a testar modelos em dados que não viram durante o treinamento, mas ainda são testes de inteligência restritos. Segundo Lapata, à medida que o desempenho de um modelo melhora numa área, também pode degradar-se noutras áreas, o que pode ser difícil de monitorizar.
Uma área onde o GPT-5 melhorou significativamente Esse é o preçoque agora é muito mais barato que outros modelos – por exemplo, o modelo Claude topo de linha da Anthropic; Custa cerca de 10 vezes mais Ele lida com o mesmo número de solicitações no momento da escrita. Mas isto poderá colocar os seus próprios problemas a longo prazo se a receita da OpenAI não cobrir os enormes custos de construção e operação de novos centros de dados. “O preço é uma loucura. É tão barato que não sei como alguém pode pagar isso”, disse Lapata.
A concorrência entre os principais modelos de IA é feroz, esperando-se que os primeiros modelos conquistem a maior parte da quota de mercado, especialmente à frente dos outros. “Todas essas grandes empresas estão tentando ser as únicas vencedoras, o que é difícil”, diz Lapata. “Você é um vencedor por três meses.”
tópico:



