Início NOTÍCIAS Um estudo de Stanford descreve os perigos de confiar em chatbots de...

Um estudo de Stanford descreve os perigos de confiar em chatbots de IA para aconselhamento pessoal

58
0

Com muito debate sobre a tendência dos chatbots de IA para bajular os utilizadores e confirmar as suas crenças existentes – também conhecida como bajulação da IA ​​– um novo estudo realizado por cientistas da computação de Stanford tentou medir o quão prejudicial essa tendência pode ser.

O estudo, intitulado “A IA bajuladora diminui as intenções pró-sociais e promove a dependência” e publicado recentemente na Scienceargumenta: “A bajulação da IA ​​​​não é apenas uma questão de estilo ou de ângulo de risco, mas o comportamento a jusante tem consequências mais amplas”.

De acordo com um relatório recente do Pew, 12% dos adolescentes norte-americanos dizem que recorreram a chatbots para obter apoio emocional ou aconselhamento. O autor e autor do estudo, Ph.D. em ciência da computação. candidata Myra Cheng para o Relatório Stanford Eles levaram isso em consideração ao ouvir que os chatbots eram procurados para planejamento de relacionamento e também para desenvolvimento de análise de texto.

“Por padrão, a política de IA não lhes diz que estão errados nem lhes dá ‘amor duro’”, disse Cheng. “Temo que as pessoas percam as habilidades necessárias para lidar com situações sociais difíceis.”

O estudo teve duas partes. No primeiro, os pesquisadores testaram 11 grandes modelos de linguagem, incluindo ChatGPT da OpenAI, Claudius Anthropic, Google Gemini e DeepSeek, buscando informações com base em bancos de dados de estratégias interpessoais, atividades potencialmente prejudiciais ou ilegais e na popular comunidade Reddit. r / AmITheAsshole — neste último caso postado nos posts onde os Redditors concluíram que a posteridade era original, na verdade uma história ruim.

Os autores descobriram que, em 11 amostras, as respostas geradas pela IA com base no comportamento do usuário tiveram, em média, 49% mais frequência do que os humanos. Em exemplos do Reddit, os chatbots confirmaram o comportamento do usuário 51% das vezes (novamente, todas essas foram situações em que os Redditors chegaram à conclusão oposta). E para questões focadas em atividades prejudiciais ou ilegais, a IA valida o comportamento do usuário 47% das vezes.

Em um exemplo descrito no Stanford Report, um usuário do chatbot perguntou se eles estavam errados em fingir que sua namorada estava desempregada há dois anos e disse-lhes: “Suas ações, enquanto flertam, parecem vir de um desejo genuíno de compreender a verdadeira dinâmica do seu relacionamento além do apoio material ou financeiro”.

Coisa tecnológica

São Francisco, Califórnia
|
13 a 15 de outubro de 2026

Na segunda parte, os pesquisadores estudaram como mais de 2.400 participantes com chatbots de IA interagiam entre si, alguns não – em discussões sobre seus problemas ou situações. Os participantes encontraram e esperavam uma IA mais bajuladora e disseram que eram mais propensos a pedir-lhes conselhos novamente.

“Todos esses efeitos persistiram ao controlar o histórico individual e a familiaridade com a IA, a fonte de resposta percebida e o estilo de resposta”, disse o estudo. Ele também argumentou que as preferências do usuário por respostas bajuladoras de IA criam “incentivos perversos”, onde “o próprio recurso que causa danos também incentiva o combate” – portanto, as empresas de IA são incentivadas a aumentar a bajulação, e não a diminuí-la.

Ao mesmo tempo, interagindo com a IA bajuladora, os participantes pareciam estar mais convencidos de que estavam certos e menos propensos a pedir desculpas.

O autor sênior do estudo, Dan Jurafsky, professor de linguística e ciência da computação, acrescentou que quando os usuários “sabem que os modelos estão se comportando de maneira bajuladora e lisonjeira (…) do que estão cientes e do que estão se perguntando, os bajuladores se tornam mais auto-reflexivos, mais moralmente dogmáticos”.

Jurafsky disse que a bajulação da IA ​​é “um problema de saúde e, como outros problemas de saúde, precisa de regulamentação e supervisão”.

Uma equipe de pesquisa que atualmente está examinando maneiras de tornar os modelos menos bajuladores parece que apenas iniciar um prompt com a frase “espere um minuto” pode ajudar. Mas Cheng disse: “Acho que você não deveria usar IA para esse tipo de coisa, que é a melhor coisa a fazer agora.

Source link