Início COMPETIÇÕES Claude Fable não responde questões biológicas básicas

Claude Fable não responde questões biológicas básicas

87
0

A Anthropic acaba de lançar Claude Fable 5, que chama de modelo de IA mais poderoso já amplamente disponível. louvar Suas capacidades em biologia, entre outras. Mas o modelo não responde a questões biológicas básicas – do tipo que esperaríamos que um estudante do ensino médio abordasse. Em vez disso, consulta o antigo modelo primário, Claude Opus 4.8.

Não porque Fable não saiba as respostas. Porque a Anthropic não permite isso intencionalmente.

Myth é um modelo da classe Mythos voltado para o público, uma família altamente qualificada no trabalho de segurança cibernética, que a Antthropic disse ser muito arriscado para ser publicado publicamente. Mas embora o mito estendido da segurança cibernética antropomórfica gaste grande parte do alerta, os guardiões de Fable são uma biologia mais transparente e mais controlável.

Quando experimentei o modelo, ele recusou-se a responder a muitas questões biológicas básicas. Não responder “Fale-me sobre as membranas celulares” ou “O que são mitocôndrias” é a famosa potência da célula. Recusou-se a explicar “o que é um príon”, as partículas proteicas por trás da doença da vaca louca ou “como funcionam as vacinas de mRNA”.

“Fizemos esta transferência para que os clientes possam beneficiar rapidamente das capacidades do modelo sem riscos.”

As restrições também se aplicam a questões médicas mundanas e objetivamente inócuas. O mito não responde “o que causa a febre dos fenos”, explica como funciona o medicamento para a asma, não explica como surge a resistência aos antibióticos ou não nos diz o que é o Ébola e como se espalha. Algumas das minhas perguntas mais básicas ocasionalmente passaram pela fábula, como “O que é câncer” e “O que é DNA?” Quando o mito foi refutado, o Opus 4.8 geralmente respondeu bem.

A Anthropic diz que os biofiltros amplos são deliberadamente seletivos e deliberadamente conservadores, sendo as armas biológicas a principal preocupação. “Com a introdução do Clad Fable 5, nosso primeiro modelo da classe Mythos, acreditamos que os modelos têm maior potencial para realizar tarefas científicas do mundo real e permitir que atores mal-intencionados usem nossos modelos para pesquisas biológicas mais perigosas”, disse o porta-voz Parul Maheshwari. borda. “Sempre usamos classificadores para evitar que nossos modelos atendam a solicitações relacionadas a armas biológicas. Acreditamos que é necessário ser mais conservadores com nossa segurança para evitar a maioria das consultas relacionadas a armas biológicas para usar o Fable 5 com segurança.”

Antrópico é antes destacado As respostas da Fable à segurança se enquadram em quatro áreas principais: química, biologia, segurança cibernética e filtragem, uma técnica para treinar pequenas IAs usando os resultados de IAs grandes. A empresa acusou rivais chineses como a DeepSeek de usar filtragem de nível “industrial” em seus modelos.

Embora eu não tenha conseguido testar a filtragem de maneira significativa, Fable parecia mais do que disposto a responder perguntas sobre química e segurança cibernética. Por exemplo, deu uma visão geral básica do explosivo TNT, mas omitiu instruções de síntese por “razões óbvias”. Ele respondeu imediatamente a perguntas sobre o uso de gás cloro como arma química, ameaças comuns de senhas e fusão e fissão nuclear, além de explicar como proteger o iPhone contra hackers. Ainda há limites: adiado para a fábula, perguntei sobre o gás sarin, agente nervoso altamente tóxico. Tanto Fable quanto Opus se recusam a “como fazer antraz” e Claude interrompe completamente a conversa. entendi isso. A rejeição imediata das mitocôndrias parece um falso positivo.

“Fizemos esta transferência para que os clientes pudessem beneficiar das capacidades do modelo mais cedo, sem os riscos”, explicou Maheswari, acrescentando que a Anthropic está a trabalhar arduamente para melhorar a sua detecção e reduzir os falsos positivos. “Pretendemos disponibilizar modelos da classe Mithos para a comunidade mais ampla das ciências biológicas e da vida sem essas salvaguardas, para que essas capacidades possam ser usadas para acelerar a pesquisa biomédica e a descoberta de medicamentos”.

A Anthropic não respondeu às perguntas sobre se esse tipo de liberação controlada se tornará a nova norma para modelos futuros.

Siga tópicos e autores Veja mais como este no feed da sua página inicial personalizada e receba atualizações desta história por e-mail.


Source link