Início NOTÍCIAS A longa história antrópica 5 foi deixada de lado e recebeu luz...

A longa história antrópica 5 foi deixada de lado e recebeu luz verde para um retorno

24
0

Depois de semanas de negociações com a administração Trump, finalmente chegou a hora de colocar o coxo Fable 5 novamente online. Em filtro X *A Anthropic disse que planeja começar a restaurar o acesso na quarta-feira para usuários globais em plataformas de nuvem e que a empresa restaurará o acesso à AWS, Google Cloud e Microsoft Foundry em breve, mas não há um prazo definido.

Recebemos notificação de que o Departamento de Comércio suspendeu os controles de exportação de Claudio’s Fable 5 e Mythos 5.

Começaremos a restaurar o acesso amanhã e compartilharemos uma atualização em breve.

Somos gratos aos nossos usuários pela paciência e a todos que trabalharam conosco no modelo de repetição.

A empresa também emitiu um postagem no blog Numa declaração na noite de terça-feira, os preparativos para o evento em questão, as suas salvaguardas revistas, os novos processos da indústria de IA e os planos para partilhar informações com o governo de novas formas, bem como para testar futuros modelos de preconceito.

No início de junho, o Antrópico Mythos deixou de lado o 5 – o seu modelo de consumo baseado na mesma tecnologia subjacente do Antrópico Mythos 5, mas com mais salvaguardas – depois do ultimato de sexta-feira à noite ter sido elaborado pela administração Trump. Devido a preocupações com potenciais cadeias tecnológicas, o governo da Antrópico opôs-se ao poder da directiva de exportação, dissuadindo qualquer nação estrangeira (incluindo empresas não-membros dos EUA, empresas clientes e até vários funcionários da própria Antrópico) de usar o Mythos 5 ou o Fable V, ou seja, ambos os modelos que passaram a última semana a ser alardeados.

Devido a preocupações com possíveis prisões, o governo atingiu a Antrópico com poder diretivo de exportação, afetando ambos os modelos que a Antrópico passou a semana passada exaltando.

Para resolver os problemas em questão, que os pesquisadores da Amazon sinalizaram e foram os grandes responsáveis ​​​​por colocar em ação a diretiva de controle de exportação, a Anthropic disse em uma postagem no blog que “o exercício de classificador de segurança aprimorado visa e bloqueia” adicionando comportamento “Os usuários serão notificados se a solicitação do Fable 5 for bloqueada, e a solicitação deverá ser enviada no Opus 4.8. O novo classificador nas ferramentas descritas.

A administração Trump deu recentemente luz verde ao regresso do Mythos 5, mas apenas numa lista pré-aprovada de instituições. Fora dos EUA os membros dessas organizações, bem como os seus próprios funcionários estrangeiros, podem ter acesso ao modelo. A decisão veio logo depois que a OpenAI revelou o GPT-5.6, que a administração Trump só permitiu estrear sob regras semelhantes: a implementação foi transferida, inicialmente apenas para uma lista pré-aprovada de agências e departamentos governamentais.

Na terça-feira, a Anthropic escreveu que a empresa “continua a coordenar-se com o governo para expandir o acesso a uma gama mais ampla de famílias nacionais e internacionais” para Mythos 5. A empresa também incluiu uma seção inteira em seu blog sobre seu novo plano de trabalhar em estreita colaboração com a administração Trump – em muitos esforços para voltar às boas graças do governo após meses de drama público, ações judiciais e ações do presidente.

A empresa escreveu que planeia oferecer “acesso e avaliação governamental pré-lançamento”, especialmente para modelos relacionados com capacidades de segurança nacional, para que os parceiros governamentais possam realizar avaliações independentes das capacidades e detentores do modelo para testar antes de uma divulgação mais ampla. (O governo também terá acesso à equipe técnica da Anthropic durante os períodos de teste pré-julgamento.) A Anthropic também disse que planeja introduzir “compartilhamento rápido de informações” quando “ligações ou padrões de abuso significativos forem identificados”.

Ele disse que trabalharia com o governo e outros laboratórios líderes de IA para criar “um padrão de segurança comum e voluntário e um sistema de classificação para fornecedores vinculados a modelos”. Por fim, a Anthropic disse que “as equipes antrópicas estão dedicadas a trabalhar em prioridades governamentais comuns, fornecem recursos computacionais significativos para apoiar testes e pesquisas governamentais e disponibilizam nossa experiência em segurança e recuperação para avançar no estado da arte na avaliação de IA”.

A Anthropic disse que trabalhará com o governo e outros laboratórios líderes de IA para criar um padrão “voluntário” para segurança e avaliação compartilhadas.

A primeira directiva de controlo de exportações da administração Trump chega num momento oportuno, enquanto se prepara para uma IPO e o governo tem estudado e gerido os riscos da cadeia de abastecimento durante meses.

A empresa destacou em um blog que “simplesmente não há consenso na indústria de IA” para decidir sobre a gravidade da prisão, um problema que “se tornará mais agudo nos próximos meses, à medida que mais modelos com poderosas capacidades de segurança cibernética (e outras) forem treinados, avaliados e liberados”. Então ele disse que se comunicou com Amazon, Microsoft, Google e outras empresas que fazem parte do programa Projeto Glasswing, de modo que no quadro de avaliação das prisões de IA, com quatro categorias de objetivos, ele concordou de forma mais ampla, a capacidade de ganho, a amplitude da capacidade do atacante, a facilidade de armas e detecção (ou quão fácil é para alguém repetir). A Anthropic disse que também criou uma nova ferramenta para “fornecer monitoramento 24 horas por dia, 7 dias por semana, dos envios de canais para cadeias fechadas” e em breve lançará um programa HackerOne para pesquisadores sinalizarem possíveis cadeias quebradas para enviar para Fable 5.

Anthropica também incluiu o desafio em sua postagem no blog, escrevendo “é provável que algum modelo de IA o torne completamente robusto (ou seja, impermeável) na quebra de vínculos. Esperamos que algumas prisões sejam encontradas em nossos modelos, e elas variarão em gravidade: haverá mais vínculos pequenos, alguns estreitos e nocivos, e embora nenhuma prisão universal tenha sido encontrada na Fábula 5 no momento da escrita, explorada por especialistas.

Acompanhe os temas e autores desta história para ver mais sobre isso em sua própria página para alimentar o protocolo e receber atualizações por e-mail.


Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui