• 세계 최고의 머신러닝 콘퍼런스인 **ICLR 2026(국제 학습 표현 콘퍼런스)**이 제출된 동료 심사(peer review)의 **21%**가 생성형 AI에 의해 전적으로 작성된 것으로 밝혀져 충격에 휩싸였습니다.
  • 이 조사는 카네기 멜런 대학교의 그레이엄 노이비그(Graham Neubig) 교수의 요청에 따라 뉴욕의 Pangram Labs에서 수행되었습니다. 노이비그 교수는 자신이 받은 많은 심사에서 “환각적 인용(hallucinated citations)” 및 장황하고 무의미한 응답의 징후를 발견하고 의심했습니다.
  • Pangram은 AI 감지 도구를 사용하여 ICLR 2026에 제출된 19,490편의 연구 논문과 75,800개의 심사를 스캔했습니다. 결과는 다음과 같습니다.
    • 15,899개의 심사(≈21%)가 AI에 의해 완전히 생성되었습니다.
    • 나머지 50% 이상은 AI의 보조 편집 흔적을 보였습니다.
    • 199편의 연구 논문(≈1%)이 AI에 의해 전적으로 작성된 것으로 의심됩니다.
    • 9%의 논문은 내용의 절반 이상이 AI에 의해 생성되었습니다.
  • 코펜하겐 대학교의 데스몬드 엘리엇(Desmond Elliott)과 같은 여러 연구자들은 자신들이 받은 심사에 부정확한 데이터, 기이한 표현이 포함되어 있고 연구의 핵심을 놓치고 있음을 확인했습니다. 이는 대규모 언어 모델(LLM)에 의해 생성된 응답의 특징입니다.
  • 코넬 대학교의 바라트 하리하란(Bharath Hariharan)이 이끄는 ICLR 조직위원회는 심사 및 제출물에서 AI 남용을 검증하기 위한 자동화 도구를 구현할 것이라고 밝혔습니다.
  • ICLR은 AI를 언어 편집 및 실험 코드 작성에 사용하는 것은 허용하지만, 학술 콘텐츠 초안 작성이나 기밀 정보 공개에는 엄격히 금지하고 있습니다.
  • 일부 저자는 오해의 소지가 있는 심사를 받아 논문 제출을 철회했으며, 많은 다른 사람들은 어떻게 응답해야 할지 혼란스러워하고 있습니다.
  • 노이비그 교수는 지난 5년간 제출 수가 몇 배로 증가하여 심사 시스템이 “과부하”되었다고 인정했습니다. 각 심사자는 2주 동안 5편의 논문을 읽어야 하므로 AI에 의존하는 것이 “손쉬운 지름길”이 되었다는 것입니다.
  • Pangram은 감지 도구에 여전히 오탐(false positives) 비율이 있으므로, 위반 사항 처리에는 신중함과 투명성이 필요하다고 경고합니다.

📌 요약: 세계 최고의 머신러닝 콘퍼런스인 ICLR 2026은 **21%**의 동료 심사(거의 1만 6천 건에 해당)가 생성형 AI에 의해 전적으로 작성된 것으로 밝혀져 충격에 빠졌습니다. 받은 심사에는 부정확한 데이터, 기이한 표현, 연구 핵심 누락이 포함되어 있었으며, 이는 생성형 AI가 생성한 응답의 특징입니다.

Share.
VIET NAM CONSULTING AND MEASUREMENT JOINT STOCK COMPANY
연락처

이메일: info@vietmetric.vn
주소: 베트남 하노이시 옌호아 동 쩐주이흥 거리 91번 골목 34번

© 2026 Vietmetric
Exit mobile version