- 많은 수학자는 AI가 수학 문제 풀이 및 정리 증명 능력을 빠르게 향상시킴에 따라 수학 분야가 역사상 가장 빠른 변화 중 하나를 겪고 있다고 믿습니다.
- 2025년 수학자 다니엘 리트(Daniel Litt)는 2030년 이전에 AI가 일류 수학자 수준의 논문을 작성할 확률이 25%에 불과하다고 내기를 걸었으나, 불과 1년 만에 자신이 내기에서 질 수도 있다고 인정했습니다.
- 불과 몇 년 전만 해도 AI는 고등학교 수준의 수학 문제도 거의 풀지 못했지만, 현재는 실제 수학 연구에서 발생하는 문제들을 처리할 수 있게 되었습니다.
- OpenAI와 Google DeepMind 같은 기업의 AI 시스템은 국제 수학 올림피아드(IMO)에서 금메달에 해당하는 성적을 거두었습니다.
- 2026년 1월, 수학자들은 폴 에르되시(Paul Erdős)가 제안한 오랜 미해결 문제들을 풀기 위해 AI를 사용하기 시작했습니다.
- UC 버클리의 니킬 스리바스타바(Nikhil Srivastava)가 주도하는 ‘First Proof’라는 새로운 프로젝트는 AI의 수학적 능력을 평가하기 위해 실제 연구 문제 세트를 만드는 것을 목표로 합니다.
- 첫 번째 테스트 세트는 다양한 수학 분야의 중급에서 고급 난이도 문제 10개로 구성되었습니다.
- 전문가 평가에 따르면 OpenAI의 AI는 약 5/10개를, Google DeepMind의 시스템은 6/10개를 정확히 해결했습니다.
- 구글은 ‘Aletheia’라는 수학 AI 도구를 개발했는데, 이는 제미나이(Gemini) 챗봇과 검증 알고리즘을 결합하여 풀이의 오류를 감지하고 반복을 통해 결과를 개선합니다.
- 문제 해결 외에도 AI는 수기로 작성된 증명을 컴퓨터로 검증 가능한 코드 형태로 변환하는 ‘포멀라이제이션(formalisation)’ 분야에서도 진보하고 있습니다.
- Math, Inc.는 자사의 AI ‘Gauss’가 구 충전 문제에 대한 마리나 비아조우스카(Maryna Viazovska)의 필즈상 수상 증명을 자동으로 포멀라이즈하고 검증하여 놀라움을 안겼습니다.
- AI가 생성한 증명은 약 20만 줄의 코드로 이루어져 있으며, 이는 전 세계에 포멀라이즈된 전체 수학의 약 10%에 해당합니다.
- 연구자들은 미래에 AI가 새로운 수학 논문을 자동으로 검토하고 학술 심사 과정에서 오류를 찾아낼 수 있을 것이라고 믿습니다.
📌 결론: AI는 수학 연구 방식을 깊게 변화시키고 있습니다. AI 시스템은 First Proof 프로젝트의 연구 문제에서 5/10에서 6/10의 정답률을 기록했으며, 필즈상급 증명을 약 20만 줄의 코드로 자동 포멀라이즈했습니다. 이 기술은 증명 자동 검증과 연구 지원을 가능하게 하지만, 기계가 문제를 너무 빨리 풀면서 인간이 학습할 기회를 잃을 수 있다는 우려도 낳고 있습니다.

