• 全球顶级的机器学习会议——**ICLR 2026(国际学习表征会议)**爆出丑闻,提交的同行评审(peer review)中,有 21% 被发现完全由生成式AI撰写。
  • 纽约Pangram Labs在卡内基梅隆大学(Carnegie Mellon University)的格雷厄姆·诺伊比格(Graham Neubig)教授的呼吁下进行了调查。诺伊比格教授怀疑他收到的许多评审存在“幻觉引用”(hallucinated citations)以及漫无边际、毫无意义的回复。
  • Pangram使用其AI检测工具扫描了提交给ICLR 2026的19,490篇研究论文和75,800份评审。结果显示:
    • 15,899份评审(约21%)完全由AI生成。
    • 其余超过50%的评审有AI辅助编辑的迹象。
    • 199篇研究论文(约1%)被怀疑完全由AI撰写。
    • 9%的论文有一半以上内容由AI生成。
  • 哥本哈根大学的德斯蒙德·艾略特(Desmond Elliott)等几位研究人员证实,他们收到的评审包含错误数据、奇怪的措辞,并且遗漏了研究的重点——这些都是大型语言模型(LLM)生成的回复的典型特征。
  • 由康奈尔大学(Cornell University)的巴拉特·哈里哈兰(Bharath Hariharan)负责的ICLR组委会表示,将部署自动化工具来核查评审和提交论文中滥用AI的情况。
  • 尽管ICLR允许使用AI进行语言编辑、编写实验代码,但严格禁止用于起草学术内容或泄露机密信息。
  • 一些作者因收到误导性评审而撤回了论文,而许多其他人则对如何回应感到困惑。
  • 诺伊比格承认:由于过去五年提交的论文数量增加了数倍,评审系统“超负荷”;每位评审员必须在两周内阅读5篇论文,这使得依赖AI成为“捷径”。
  • Pangram警告说,其检测工具仍存在误报率,因此对违规行为的处理需要谨慎和透明。

📌 总结: 全球顶级的机器学习会议 ICLR 2026 爆出丑闻,多达 21% 的同行评审(相当于近 1.6万篇 评审)被发现完全由生成式AI撰写。这些收到的评审包含错误数据、奇怪的措辞并遗漏研究重点,这是生成式AI回复的典型特征。

Share.
联系方式
© 2025 Vietmetric
Exit mobile version