Um novo estudo publicado em 24 de março em RadiologiaO Journal of the Radiological Society of North America (RSNA), mostra que tanto os radiologistas quanto os modelos multimodais de grande linguagem (LLMs) têm dificuldade em distinguir raios X reais de imagens “profundamente falsas” geradas por inteligência artificial (IA). As descobertas levantam preocupações sobre os riscos associados às imagens médicas sintéticas e destacam a necessidade de ferramentas e treinamento aprimorados para ajudar a proteger a precisão das imagens médicas e treinar os profissionais de saúde para reconhecer falsificações.
Um “deepfake” é um arquivo de vídeo, foto, imagem ou áudio que parece genuíno, mas foi criado ou alterado por inteligência artificial.
“Nosso estudo demonstra que essas imagens falsas de raios X são realistas o suficiente para enganar os radiologistas, os profissionais de imagem médica mais treinados, mesmo quando eles sabem que as imagens geradas por IA estão presentes”, disse o principal autor do estudo, Mikael Torjman, MD, estudante de graduação na Escola de Medicina Icahn em Mount Sinai, Nova York. “Isso cria uma enorme vulnerabilidade à fraude no processo legal onde, por exemplo, uma fratura fabricada é indistinguível de uma fratura real. Há também um risco significativo de segurança cibernética se hackers obtiverem acesso à rede de um hospital e injetarem imagens sintéticas para manipular diagnósticos de pacientes ou causarem caos clínico generalizado, minando a confiabilidade fundamental do registro de saúde digital.”
Detalhes do estudo e teste de imagem
Dezessete radiologistas de 12 instituições de seis países (EUA, França, Alemanha, Turquia, Reino Unido e Emirados Árabes Unidos) participaram do estudo. Sua experiência variou de iniciantes a profissionais com até 40 anos de experiência. No total, o estudo examinou 264 radiografias, divididas igualmente entre exames reais e aqueles obtidos por IA.
Os participantes visualizaram dois conjuntos separados de imagens sem sobreposição. Um conjunto continha uma combinação de imagens reais e raios X de várias partes do corpo geradas pelo ChatGPT. O segundo conjunto se concentrou em radiografias de tórax, metade das quais eram reais e metade criadas usando RoentGen, um modelo de difusão de IA generativa de código aberto desenvolvido por pesquisadores da Stanford Medicine.
Precisão de detecção para radiologistas e inteligência artificial
Quando os radiologistas não foram informados de que foram incluídas imagens falsas, apenas 41% reconheceram os raios X gerados por IA após avaliarem a sua qualidade técnica. Assim que foram informados sobre a presença de imagens sintéticas, a precisão média em distinguir o real do falso aumentou para 75%.
O desempenho variou amplamente entre os indivíduos. Os radiologistas identificaram corretamente entre 58% e 92% das imagens geradas pelo ChatGPT. Os sistemas de IA mostraram limitações semelhantes. Quatro LLMs multimodais – GPT-4o (OpenAI), GPT-5 (OpenAI), Gemini 2.5 Pro (Google) e Llama 4 Maverick (Meta) – alcançaram taxas de precisão que variam de 57% a 85%. Mesmo o ChatGPT-4o, que foi usado para gerar imagens deepfake, não detectou todas elas, embora tenha tido um desempenho melhor que os outros modelos.
Para radiografias de tórax realizadas pela RoentGen, os radiologistas alcançaram uma precisão de 62% a 78%, enquanto os modelos de IA variaram de 52% a 89%.
A experiência não garante a detecção
O estudo não encontrou nenhuma relação entre os anos de experiência de um radiologista e sua capacidade de identificar raios X falsos. No entanto, os radiologistas musculoesqueléticos tiveram desempenho significativamente melhor do que outros subespecialistas.
Pistas visuais em raios X Deepfake
Os pesquisadores descobriram vários padrões que podem aparecer em imagens sintéticas.
“As imagens médicas de Deepke muitas vezes parecem perfeitas demais”, disse o Dr. Torjman. “Os ossos são excessivamente lisos, as vértebras são anormalmente retas, os pulmões são excessivamente simétricos, o padrão dos vasos sanguíneos é excessivamente uniforme e as fraturas parecem incomumente limpas e consistentes, muitas vezes confinadas a um lado do osso”.
Riscos e precauções de segurança para imagens médicas
Os resultados apontam para sérios riscos no uso indevido de raios X falsos. As imagens fabricadas podem ser utilizadas em processos judiciais ou inseridas em sistemas hospitalares para influenciar o diagnóstico e interromper o tratamento.
Para reduzir estas ameaças, os investigadores recomendam defesas digitais mais fortes. Isso inclui marcas d’água invisíveis incorporadas diretamente nas imagens e assinaturas criptográficas associadas ao tecnólogo no momento em que a imagem é capturada, o que pode ajudar a verificar a autenticidade.
O futuro da inteligência artificial em imagens médicas
“Potencialmente, estamos vendo apenas a ponta do iceberg”, disse o Dr. Torjman. “O próximo passo lógico nesta evolução é a inteligência artificial para criar imagens sintéticas em 3D, como tomografia computadorizada e ressonância magnética. Construir conjuntos de dados educacionais e ferramentas de descoberta é fundamental agora.”
Para apoiar a educação e a conscientização, os pesquisadores lançaram um conjunto de dados deepfake que inclui questionários interativos para fins educacionais.



