- 2026년 2월 24일, MIT 슬론의 케이트 켈로그(Kate Kellogg) 교수와 하버드 의과대학의 다니엘 비터먼(Danielle Bitterman) 등이 참여한 10개 기관의 연구는 임상 의료 분야에서 에이전틱 AI 도입의 기대와 현실 사이의 격차를 지적했다.
- 에이전틱 AI(Agentic AI)는 높은 자율성을 바탕으로 다단계 프로세스를 자동으로 완료할 수 있는 AI 에이전트 시스템을 말한다.
- 연구는 비정형 전자 건강 기록(EHR)을 통해 면역요법을 받는 암 환자의 부작용을 감지하는 AI 시스템에 집중했다.
- 이 시스템은 수 시간에서 수일이 걸리던 수백 건의 기록 처리를 단 몇 분 만에 완료할 수 있다.
- 부작용 감지 정확도는 임상 연구 코디네이터가 수행하는 표준 프로세스와 동등하거나 더 안정적이었다.
- 그러나 도입 노력의 20% 미만이 프롬프트 엔지니어링 및 모델 개발에 사용되었고, 80% 이상은 “사회기술적(sociotechnical)” 작업에 투입되었다.
- 모델 최적화에 1시간을 쓸 때마다 조직은 실제 구현을 위해 약 4시간이 필요했다. 5가지 주요 “부담”:
- 데이터 통합: 안정적인 데이터 파이프라인과 인프라가 필수적이다. 데이터가 표준화되지 않으면 에이전트 시스템은 “연쇄 마비”를 겪게 된다.
- 모델 검증: 결과값 확인뿐만 아니라 AI 에이전트가 정책을 준수하고, 로그를 완벽히 기록하며, 허용된 도구에만 액세스하는지 보장해야 한다.
- 경제적 가치 확보: 프로세스 복잡성과 에이전트 간 협업 수준에 따라 비용이 변동하므로 ROI 계산이 어렵다.
- 드리프트 모니터링(모델/데이터): 정적인 if-then 임계값 대신 동적인 지표를 지속적으로 추적하는 “적응형 모니터링”이 필요하다.
- 거버넌스: 오류 발생 시 책임 소재, 법적 리스크, 보안 및 책임 메커니즘을 명확히 하는 것.
- 연구는 의료 분야의 높은 리스크 때문에 더 엄격한 통제가 요구되지만, 모든 산업에서 이 5가지 요소에 대한 플레이북이 필요하다고 강조했다.
결론: 에이전틱 AI 도입은 단순한 알고리즘 문제가 아니라 조직적 전환이다. 노력의 80% 이상이 인프라, 거버넌스, 데이터 통합에 집중된다. 시스템은 수백 개의 의료 기록을 고정밀도로 단 몇 분 만에 처리할 수 있지만, 모델 최적화 1시간당 4시간의 실제 구현 작업이 요구된다. 성공은 특히 의료와 같은 고위험 환경에서 5가지 핵심 “부담”을 관리하는 데 달려 있다.
