Um hacker enganou uma popular ferramenta de codificação de IA para instalar o OpenClaw, um agente viral de IA de código aberto que “realmente faz alguma coisa” em todos os lugares. É uma façanha engraçada, mas é um prenúncio do que está por vir, à medida que mais e mais pessoas permitem que softwares autônomos usem seus computadores para elas.
O hacker aproveitou uma vulnerabilidade descoberta pelo pesquisador de segurança Adnan Khan no Cline, um agente de codificação de IA de código aberto popular entre os desenvolvedores. veio à tona Apenas alguns dias atrás, como prova de conceito. Resumindo, o fluxo de trabalho de Cline estava usando Claude da Anthropic. Esta é uma técnica conhecida como injeção imediata, em que uma pessoa recebe instruções sorrateiras e pode ser obrigada a fazer algo que não deveria fazer.
Os hackers usaram esse acesso para ignorar as instruções de instalação automática de software nos computadores dos usuários. Eu poderia ter instalado qualquer coisa, mas escolhi o OpenClaw. Felizmente, o agente não foi ativado durante a instalação. Caso contrário, esta teria sido uma história completamente diferente.
Isso mostra a rapidez com que as coisas podem se desenrolar quando os agentes de IA conseguem assumir o controle de nossos computadores. Isto pode parecer um jogo de palavras inteligente – um grupo usou poesia para convencer chatbots a cometer crimes – mas num mundo de software cada vez mais autónomo, as injeções instantâneas representam um enorme risco de segurança contra o qual é extremamente difícil proteger. Reconhecendo isso, algumas empresas limitam o que suas ferramentas de IA podem fazer se forem sequestradas. Por exemplo, a OpenAI introduziu recentemente um novo modo de bloqueio no ChatGPT para evitar vazamento de dados.
Obviamente, ignorar os pesquisadores que relatam falhas em particular torna difícil a proteção contra injeção imediata. Khan disse que alertou Klein sobre a vulnerabilidade semanas antes de publicar suas descobertas. Essa exploração só foi corrigida depois que ele a denunciou publicamente.



