只需“轻微暗示”，AI 就会将错误的事情信以为真。

一项新研究表明，人类可以通过自然对话说服许多 AI 模型将错误信息视作事实接受。
研究团队在发现 ChatGPT 自行编造了电影《心灵捕手》（Good Will Hunting）中提到希特勒的场景后展开了这项研究，而该场景根本不存在。
AI 非常自信地详细描述了这个虚假场景，而不是去纠正用户错误的假设前提。
研究人员将这种测试方法称为“暗示实验下的幻觉审计”（hallucination audit under nudge trial）。
他们通过讨论 1,000 部著名电影和 1,000 部著名小说，对 5 款主流 AI 模型进行了测试。
研究团队故意在完全不包含这些内容的题材中，引入了诸如希特勒、恐龙或时光机等错误但看似合理的元素。
流程包含 3 个步骤：让 AI 生成信息、要求 AI 自我验证，然后利用该错误信息进行“暗示”，让 AI 再次接受它。
结果显示，许多模型最初能识别出错误信息，但在受到对话影响后便动摇并改变了主意。
Claude 被评为对抗错误信息表现最好的模型，其次是 Grok 和 ChatGPT；Gemini 和 DeepSeek 表现较弱。
该研究警告称，现实生活中的对话本就充满了错误记忆、错误假设或不确定信息。
如果 AI 被用户的错误假设所引导，这种现象在医疗、法律或公共政策领域将尤其危险。
研究团队表示，目前尚不清楚为什么某些 AI 比其他模型更擅长抵制“奉承”（sycophancy）和对话压力。
📌 结论： 研究表明，生成式 AI 的一大致命弱点不仅在于训练数据，还在于其容易被人类提问的方式所“扭曲”。只需一个听起来合理的暗示，许多模型就会忽视事实，并令人信服地构建出整个虚假故事。随着 AI 越来越多地应用于医疗、法律和教育等敏感领域，这一点尤其令人担忧，因为 AI 的盲目自信可能会诱导用户相信完全不存在的信息。

What's Hot

中国拟收紧开源AI：作者呼吁美国通过开放AI而非禁止中国AI来回应

月之暗面（Moonshot AI）被指控违规使用英伟达芯片：中美AI竞赛持续升级

日本试用“AI员工”：AI不仅是辅助，更开始像同事一样工作

只需“轻微暗示”，AI 就会将错误的事情信以为真。

中国拟收紧开源AI：作者呼吁美国通过开放AI而非禁止中国AI来回应

月之暗面（Moonshot AI）被指控违规使用英伟达芯片：中美AI竞赛持续升级

日本试用“AI员工”：AI不仅是辅助，更开始像同事一样工作

联系方式

What's Hot

中国拟收紧开源AI：作者呼吁美国通过开放AI而非禁止中国AI来回应

月之暗面（Moonshot AI）被指控违规使用英伟达芯片：中美AI竞赛持续升级

日本试用“AI员工”：AI不仅是辅助，更开始像同事一样工作

只需“轻微暗示”，AI 就会将错误的事情信以为真。

Related Posts

中国拟收紧开源AI：作者呼吁美国通过开放AI而非禁止中国AI来回应

月之暗面（Moonshot AI）被指控违规使用英伟达芯片：中美AI竞赛持续升级

日本试用“AI员工”：AI不仅是辅助，更开始像同事一样工作

联系方式