- 2026年2月24日,由麻省理工学院斯隆管理学院 Kate Kellogg 教授和哈佛医学院 Danielle Bitterman 参与的 10 家机构联合研究指出,临床医疗中部署智能体 AI(Agentic AI)的理想与现实之间存在差距。
- 智能体 AI 是指能够以高度自主性自动完成多步骤流程的 AI 智能体系统。
- 研究重点是通过非结构化电子病历检测接受免疫疗法的癌症患者的副作用。
- 该系统可以在几分钟内处理数百份笔记,而人工通常需要数小时至数天。
- 副作用检测的准确性与临床研究协调员执行的标准流程相当,甚至更稳定。
- 然而,不到 20% 的部署精力用于提示工程和模型开发;超过 80% 用于“社会技术”工作。
- 每投入 1 小时优化模型,组织就需要约 4 小时来进行实际部署。 5 大主要“负担”:
- 数据集成:需要稳定的数据管道和基础设施;如果数据未标准化,智能体系统将“链条卡死”。
- 模型验证:不仅要检查输出,还要确保 AI 智能体遵守政策、记录完整日志并仅访问授权工具。
- 确保经济价值:ROI 难以计算,因为成本随流程复杂度和智能体间的协作程度而波动。
- 模型/数据漂移监控:需要“自适应监控”来持续跟踪多个动态指标,而非静态的 if-then 阈值。
- 治理:明确发生错误时的责任归属、法律风险、安全性和问责机制。
- 研究强调,由于医疗行业风险极高,需要更严格的控制,但所有行业都需要这 5 个要素的指南。
结论: 部署智能体 AI 不仅是算法问题,更是组织变革:超过 80% 的精力集中在基础设施、治理和数据集成上。该系统能在几分钟内高精度处理数百份医疗记录,但每 1 小时的模型优化就需要 4 小时的实际落地。成功取决于对 5 大关键“负担”的管理,特别是在医疗等高风险环境中。
