- Un professore di psicologia norvegese ha scoperto che un articolo che era stato invitato a revisionare citava il suo stesso lavoro, ma quella ricerca non esisteva affatto: un chiaro esempio di “citazione allucinata” causata dall’IA generativa.
- Questo fenomeno si sta diffondendo nel mondo accademico, dalle riviste prestigiose ai rapporti politici, dimostrando che l’IA generativa sta erodendo la credibilità dell’editoria scientifica.
- Il volume di invii alle riviste è aumentato drasticamente dopo la popolarità dei grandi modelli linguistici, sia per un legittimo aumento della produttività che per frodi organizzate.
- Le “fabbriche di paper” vendono articoli di ricerca prodotti in serie, riutilizzando modelli di testo e immagini, particolarmente comuni in settori come la ricerca sul cancro, la blockchain e l’IA.
- L’IA non scrive solo testi, ma crea anche immagini scientifiche false come istologia, gel per elettroforesi e persino illustrazioni biologiche errate che superano la revisione paritaria.
- Alcune importanti conferenze sull’IA hanno registrato un raddoppio degli invii in 5 anni; oltre 50 articoli con citazioni inventate hanno superato la fase di revisione.
- Circa il 50% delle revisioni in alcune conferenze è scritto con il supporto dell’IA e circa il 20% è interamente generato dall’IA.
- Anche i server di preprint come arXiv, bioRxiv, medRxiv assistono a un’ondata di articoli IA, con casi di autori mai pubblicati prima che inviano fino a 50 articoli all’anno.
- Se il rapporto “rumore” supera il “segnale”, la comunità scientifica rischia una crisi esistenziale, con la vera conoscenza sommersa.
Conclusione: Alcune grandi conferenze sull’IA hanno visto raddoppiare gli invii in 5 anni; più di 50 articoli con citazioni false hanno superato la revisione. Oltre il 50% delle recensioni in alcune conferenze è assistito dall’IA, il 20% è interamente generato. Gli invii sono aumentati per l’efficienza dei LLM e per frode. La scienza rischia un “inquinamento cognitivo” a lungo termine, dove l’IA scrive, l’IA revisiona e l’IA impara di nuovo dalla spazzatura di dati da lei stessa creata.

