- 挪威的一位心理学教授发现,他受邀评审的一篇论文引用了他自己的研究,但该研究根本不存在。这生动地展示了生成式AI引起的“幻觉引用”现象。
- 这一现象正从权威期刊蔓延到政策报告,表明生成式AI正在侵蚀科学出版的公信力。
- 自大语言模型普及以来,向期刊投稿的数量激增,这既源于合法的生产力提升,也源于有组织的欺诈。
- “论文工厂”出售批量生产的研究论文,重复使用文本和图像模板,特别是在癌症研究、区块链和AI等领域。
- AI不仅能撰写文本,还能生成虚假的科学图像,如组织学切片、电泳凝胶,甚至误导性的生物插图,且这些图像仍能通过评审。
- 一些大型AI会议的投稿量在五年内翻了一番;超过50篇含有伪造引用的论文通过了评审环节。
- 在某些会议中,约50%的评审意见是在AI协助下完成的,约20%完全由生成式AI生成。
- arXiv、bioRxiv、medRxiv等预印本服务器也见证了AI论文潮,甚至出现此前未发表过论文的作者一年投递50篇的情况。
- 如果“噪声”比例超过“信号”,科学界将面临生存危机,真实知识将被淹没。
结论: 一些大型AI会议的投稿量在五年内翻了一番;50多篇含有伪造引用的论文通过了评审。某些会议中超过50%的评审由AI协助,20%完全由AI生成。大语言模型普及后,投稿量因合法增产和组织欺诈而激增。科学正面临长期的“认知污染”风险,即:AI写——AI审——AI从自己创造的数据垃圾中再学习。
