• Un nuovo studio dimostra che gli esseri umani possono convincere molti modelli di IA ad accettare informazioni false come verità attraverso una conversazione naturale.
  • Il team di ricerca ha iniziato lo studio dopo che ChatGPT ha inventato da solo una scena con un accenno a Hitler nel film “Good Will Hunting”, nonostante tale scena non esista affatto.
  • L’IA ha descritto in dettaglio questa scena falsa con grande sicurezza, invece di correggere la premessa errata dell’utente.
  • I ricercatori hanno definito questo metodo di test “hallucination audit under nudge trial” (verifica dell’allucinazione sotto test di stimolo).
  • Hanno testato 5 dei principali modelli di IA discutendo di 1.000 film famosi e 1.000 romanzi celebri.
  • Il team di ricerca ha inserito deliberatamente elementi falsi ma plausibili come Hitler, i dinosauri o una macchina del tempo in contenuti che non li includevano affatto.
  • La procedura comprendeva 3 passaggi: lasciare che l’IA generasse le informazioni, chiedere all’IA di autoverificarsi e poi usare quella stessa informazione falsa per “suggerire” all’IA di accettarla di nuovo.
  • I risultati mostrano che molti modelli inizialmente riconoscevano l’informazione falsa, ma in seguito cambiavano idea quando venivano influenzati dalla conversazione.
  • Claude è stato valutato come il più resistente alle informazioni false, seguito da Grok e ChatGPT; Gemini e DeepSeek sono risultati più deboli.
  • Lo studio avverte che le conversazioni nella vita reale sono già piene di falsi ricordi, false ipotesi o informazioni incerte.
  • Questo fenomeno è particolarmente pericoloso in medicina, giurisprudenza o nelle politiche pubbliche se l’IA viene guidata dalle false ipotesi dell’utente.
  • Il team di ricerca ha affermato che non è ancora chiaro il motivo per cui alcune IA resistano all’effetto “compiacimento” (sycophancy) e alla pressione della conversazione meglio di altri modelli.
  • 📌 Conclusione: Lo studio dimostra che una delle grandi debolezze dell’IA generativa non risiede solo nei dati di addestramento, ma anche nella facilità con cui può essere “piegata” dal modo in cui gli umani pongono le domande. Basta un suggerimento che suoni plausibile e molti modelli possono ignorare la verità e costruire un’intera storia falsa in modo convincente. Ciò è particolarmente preoccupante dal momento che l’IA viene sempre più utilizzata in settori delicati come la sanità, la legge e l’istruzione, dove la sicurezza mostrata dall’IA può indurre gli utenti a credere a informazioni del tutto inesistenti.

Share.
VIET NAM CONSULTING AND MEASUREMENT JOINT STOCK COMPANY
CONTATTI

Email: info@vietmetric.vn
Indirizzo: Numero 34, Vicolo 91, Via Tran Duy Hung, Quartiere Yen Hoa, Città di Hanoi

© 2026 Vietmetric
Exit mobile version