Início NOTÍCIAS GPT-5.5 da OpenAI vs Close Work 4.7: Qual é melhor?

GPT-5.5 da OpenAI vs Close Work 4.7: Qual é melhor?

115
0

A OpenAI lançou sua versão mais recente, GPT-5.5, em 23 de abril, apenas uma semana após o lançamento do antropogênico Close Opus 4.7.

Com dois modelos principais de dois laboratórios líderes de IA, queríamos ver como os novos modelos se comparam.

Alerta de spoiler: Consideramos Claudius Opus 4.7 o que há de mais moderno em codificação ativa e avançada, mas o GPT-5.5 tem melhor desempenho na maioria dos benchmarks.

Veja também:

Close Opus 4.7 diz que antrópico tem uma taxa de honestidade de 92%, menos bajulação

Quer saber mais sobre como obter a melhor tecnologia? Inscreva-se no boletim informativo de notícias e ofertas principais do Mashable hoje

GPT-5.5 e Opus 4.7: Tabelas de classificação

GPT-5.5 ainda não é preferido em todos os drivers de IA, mas com Close Work 4.7. Nas tabelas de classificação dos testes reais que Prêmio ArcusGPT-5.5 funciona com 4.7 (mais sobre isso abaixo).

Dos populares Tabela de classificação da arenaFechar Opus 4.7 Thinking tem a pontuação geral mais alta. Curiosamente, o Opus 4.7 está atualmente listado abaixo do Opus 4.6, mas isso provavelmente mudará com o tempo. Atualmente, os novos modelos antropogénicos ocupam os quatro primeiros lugares. Além disso, o Mythos Anthropicus de Cláudio não foi publicado, e ele diz que o Anthropicus teve um desempenho ainda melhor que o Opus 4.7.

No Índice de Capacidades (ICE) tabela de classificação, GPT-5.4 Pro atualmente tem a pontuação mais alta. (ECI combina vários benchmarks em uma pontuação.) Você encontrará o Gemini 3.1 Pro e o GPT-5.4 em segundo e terceiro lugares.

Veja também:

A. A capacidade de encontrar os principais bugs de software está crescendo 490% ano após ano

GPT-5.5 e Trabalho 4.7: Benchmarks

Qual é o desempenho dos novos modelos nos testes de benchmark mais comuns? Devemos confiar principalmente nas pontuações auto-relatadas da OpenAI e da Anthropic para esses testes. Ambos alcançam notas altas, como você poderia esperar, mas o GPT-5.5 definitivamente tem vantagem.

Veja como eles se comparam em alguns dos principais testes de teste de IA:

  • SWE-Bennum Pro: GPT-5,5 pontuou 58,6; O trabalho 4,7 obteve 64,3 por cento

  • Terminal-banco 2.0: GPT-5.5 obteve 82,7 por cento; Trabalho 4,7 obteve 69,4 por cento

  • Último IV da Humanidade: GPT-5.5 obteve 40,6 por cento; O trabalho 4,7 obteve 31,2 por cento*

  • Último Exame da Humanidade (com ferramentas); GPT-5,5 obteve 52,2 por cento; O trabalho 4,7 obteve 54,7 por cento

  • NavegarComp: GPT-5,5 obteve 84,4 por cento; O trabalho 4,7 obteve 79,3 por cento

  • Diamante GPQA: GPT-5.5 pontua 93,6 por cento; O trabalho 4,7 obteve 94,2 por cento

  • ARC-AGI-I (verificado): GPT-5.5 (Alto) obteve 94,5 por cento; Fechar 4,7 (Alto) obteve 92 por cento**

  • ARC-AGI-2 (verificado): GPT-5.5 (Alto) obteve 83,3 por cento; Fechar 4,7 (Alto) obteve 68,3 por cento**

* Para o Exame de Humanidades, traremos Análise artificial verificou resultados de HLE. Notavelmente, o Antrópico Opus 4.7 obteve 46,9 por cento neste teste.

**Veja o anúncio de resultados completo Site do Prêmio Arcus.

GPT 5.5 e Work 4.7: Disponibilidade e preços

OpenAI diz que GPT 5.5 é “nosso modelo mais limpo e intuitivo de usar até agora”. Claude Opus 4.7 é o modelo Antrópico mais avançado disponível para usuários de Claude, embora a Anthropic tenha dito que o Claudius Mythos Preview absoluto é o modelo mais capaz em geral.

Como tal, apenas assinantes pagos podem aceder a estas edições limitadas.

GPT 5.5 está disponível apenas para usuários OpenAI Plus, Pro, Business e Enterprise no ChatGPT e Codex (desculpe, usuários do ChatGPT Go). Os usuários Pro, Business e Enterprise podem acessar o GPT-5.5 Pro, enquanto os clientes Plus, Pro, Business e Enterprise podem acessar o GPT-5.5 ThinkPad.

A OpenAI está aumentando os preços do GPT-5.5 em sua API, embora a empresa afirme que mais documentação é necessária. O preço da API começa em “US$ 5 por 1 milhão de tokens de entrada e US$ 30 por 1 milhão de tokens de saída, com uma janela de contexto de 1 milhão”.

O Work 4.7 está disponível para clientes Pro e Max; de acordo com a API, está disponível por “US$ 5 por milhão de tokens de entrada e US$ 25 por milhão de tokens de saída”.

GPT-5.5 e Work 4.7: conjunto de recursos

A OpenAI afirma que o GPT-5.5 traz melhorias significativas em “codificação de agentes, computação, ciência do trabalho e pesquisas científicas iniciais”. Anthropic diz Close Opus 4.7 em codificação avançada, inteligência e visual, melhor análise de documentos.

ChatGPT e Claude têm características gerais semelhantes, embora haja algumas exceções. Em termos gerais, você pode usar esses dois chatbots de IA para pesquisa, codificação, projetos criativos e trabalho profissional diário. Você também pode usar os dois novos modelos nas camadas de código OpenAI e Antrópico, Code e Claude.

É mais fácil falar de diferenças do que de semelhanças. Embora GPT-5.5 não seja um modelo de imagem, você pode usar o novo ChatGPT Modelo de imagens ChatGPT 2.0. Antrópico acabado de embrulhar Cláudio Designmas fornece apenas visualizações, gráficos e slides, e não uma imagem completa da geração. Portanto, se você precisar gerar imagens ou um projeto gráfico interativo, o GPT-5.5 terá diversas ferramentas disponíveis para você recorrer.

GPT-5.5 pode ser usado para criar visualizações de dados complexas e interativas.
Crédito: OpenAI

ChatGPT tem várias integrações de aplicativos e compras, embora graças à recente aquisição do OpenClaw, tenha vantagem em recursos de processamento centrados no ser humano.

DR: Se escolhêssemos um desses modelos para o trabalho profissional diário, o GPT-5.5 teria vantagem graças ao perfil geral maior do ChatGPT. Mas com Trabalho Próximo 4.7


Divulgação: Ziff Davis, empresa-mãe da Mashable, entrou com uma ação judicial contra a OpenAI em abril de 2025, observando que Ziff Davis está infringindo a forma como os sistemas de IA funcionam e operam.

Source link