Início NOTÍCIAS Um pesquisador de segurança da Meta AI disse que executou o agente...

Um pesquisador de segurança da Meta AI disse que executou o agente OpenClaw em sua caixa

16
0

O agora viral 10 postagens lê o pesquisador de segurança da Meta AI, Summer Yue, o primeiro tipo de sátira. Ele disse a ele que o agente OpenClaw AI deveria verificar a caixa de e-mail excluída e sugerir o que ou como excluir o arquivo.

O agente começou a correr. Ele começou excluindo todos os e-mails dela em “speed run”, enquanto as mensagens dela não paravam naquele telefone.

“Tenho que correr para o meu Mac Mini quando a bomba explodiu”, escreveu ele, postando fotos da parada negligenciada para receber os recibos.

O Mac Mini, um computador Apple acessível que fica em uma mesa e cabe na palma da sua mão, tornou-se o dispositivo preferido atualmente para executar o OpenClaw. (O mini vende “como pão quente”, um funcionário da Apple aparentemente “confuso”. o famoso pesquisador de IA Andrej Karpathy quando comprou um para rodar o OpenClaw, outro chamado NanoClaw.)

OpenClaw, é claro, é um agente de IA de código aberto que ganhou fama por meio da rede social somente de IA do Moltbook. Os agentes do OpenClaw estavam no centro daquele episódio agora amplamente desmascarado no Moltbook, no qual parecia que as IAs estavam conspirando contra os humanos.

Mas a missão do OpenClaw é incomparável Página GitHubEles não estão focados nas mídias sociais. Seu objetivo é ser um assistente pessoal de IA que funciona com base em seus próprios pensamentos.

A turma do Vale do Silício se apaixonou pelo OpenClaw quando eles se tornaram “garras” e “garras”. chavões de escolha para agentes que operam com ódio pessoal. Outros agentes incluem Garra Zero, Garra de ferroe Pico Garra. A equipe de podcast do Y Combinator até apareceu em seu a coisa mais recente roupas de lagosta

Coisa tecnológica

Boston, MA
|
9 de junho de 2026

Mas o escritor de Yue serve como um lembrete. Como outros em X observaram, se um pesquisador de segurança de IA pudesse se deparar com esse problema, que esperança teriam os meros mortais?

“Você tentou as grades de proteção de propósito ou cometeu um erro de novato?” desenvolvedor de software em X

“Erro de novato para ser honesto”, ele respondeu. Ele testou seu agente com um “brinquedo” menor na caixa, como ele o chamava, e funcionou bem em um dispositivo eletrônico menor e menos volumoso. Ele havia conquistado sua confiança, então pensou em se dedicar ao assunto.

Yue acredita que a grande quantidade de informações na caixa é uma verdadeira “complexidade urgente”, escreveu ele. A compactação ocorre quando a janela de contexto – o fluxo de tudo o que a IA diz e faz na sessão – fica muito grande, forçando o agente a começar a entender, compactar e organizar a conversa.

Nesse ponto, a IA é instruída a ignorar o que o humano considera importante o suficiente.

Nesse caso, ele pode pular o último prompt – onde diz para não agir – e retornar ao seu comando da caixa de “brinquedos”.

Com muitos outros disse em X, Ele não confia para pensar aos seguranças. Os exemplos podem ser distorcidos ou ignorados.

Eles ofereceram várias sugestões que se desviariam da sintaxe exata que Yue usava como agente, para fornecer mais aderência em diversas formas de manter a segurança, como escrever instruções para dedicar arquivos ou usar outras ferramentas abertas.

No interesse da total transparência, o TechCrunch não conseguiu determinar exatamente o que aconteceu na caixa de Yue. (Ele não respondeu ao nosso pedido de comentários, embora tenha enviado muitas perguntas e comentários a caminho de X).

Mas isso não importa.

O ponto principal da história é que os agentes que criaram os trabalhadores científicos, no atual estágio de desenvolvimento, queriam ser perigosos. As pessoas que afirmam usá-lo com sucesso usam uma combinação de métodos para se protegerem.

Algum dia, talvez em breve (em 2027? 2028?), eles estarão prontos para uso generalizado. Deus sabe que muitos de nós adoramos ajuda com e-mails, pedidos de supermercado e agendamento de consultas no dentista. Mas esse dia ainda não chegou.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui