- 현재 AI 시스템은 종종 일관성이 부족합니다. 비디오나 시뮬레이션에서 물체가 변형되거나 공간이 바뀌고 시간이 “끊기는” 현상이 발생합니다.
- 근본적인 원인은 생성형 AI가 확률적 예측 메커니즘으로 작동하며, 이해를 업데이트할 수 있는 연속적인 세계 모델을 유지하지 않기 때문입니다.
- 해결책으로 월드 모델이 제안되고 있으며, 이는 AI가 시공간 지도(4D: 3D + 시간)를 구축하고 업데이트하도록 돕습니다.
- 예를 들어, 현재 비디오 AI는 안정적인 장면 모델이 없기 때문에 의자나 개의 목걸이를 “기억”하지 못합니다.
- 새로운 연구에 따르면 4D 월드 모델은 AI가 물체와 움직임의 일관성을 유지하는 데 도움이 됩니다.
- NeRF(2020년~)와 같은 기술은 여러 각도에서 3D 장면을 재구성할 수 있게 해주지만 여전히 데이터에 의존합니다.
- NeoVerse 및 TeleWorld와 같은 새로운 연구는 단일 비디오를 4D 모델로 변환하여 다각도에서 비디오를 생성합니다.
- 월드 모델은 비디오뿐만 아니라 AR, 로봇 공학 및 자율 주행 차에도 중요합니다.
- AR에서 월드 모델은 가상 물체가 제자리에 있고, 올바르게 가려지며, 합리적인 조명과 원근감을 갖도록 돕습니다.
- 로봇과 자율 주행 차는 월드 모델을 사용하여 환경의 다음 전개를 예측할 수 있습니다.
- 2025년 벤치마크에 따르면 현재 시각-언어 AI는 움직임 궤적을 구별할 때 거의 무작위적인 것으로 나타났습니다.
- ChatGPT와 같은 LLM은 세계에 대한 “암묵적 이해”를 가지고 있지만 실시간으로 업데이트할 수는 없습니다.
- OpenAI는 GPT-4가 배포 후 경험을 통해 학습하지 않는다고 인정했습니다.
- 많은 연구자들은 시공간 기억을 가진 월드 모델 없이는 AGI(범용 인공지능)를 달성할 수 없다고 생각합니다.
- 월드 모델은 기반 계층으로 간주되며, LLM은 의사소통 및 언어 추론 역할을 합니다.
- 거물들이 월드 모델로 방향을 틀고 있습니다. 페이페이 리(Fei-Fei Li)가 World Labs를 설립(2024년), 얀 르쿤(Yann LeCun)이 AMI Labs를 설립(2025년)했습니다.
- DreamerV3 연구(Nature, 2025년 4월)는 월드 모델을 갖춘 AI가 행동을 개선하기 위해 미래를 “상상”할 수 있음을 보여줍니다.
- 4D 월드 모델은 실제 배포 전 AI를 테스트하기 위한 안전한 시뮬레이션 환경이기도 합니다.
📌 현재 AI 시스템은 종종 일관성이 부족합니다. 비디오나 시뮬레이션에서 물체가 변형되거나 공간이 바뀌고 시간이 “끊기는” 현상이 발생합니다. 근본적인 원인은 생성형 AI가 확률적 예측 메커니즘으로 작동하며, 이해를 업데이트할 수 있는 연속적인 세계 모델을 유지하지 않기 때문입니다. 월드 모델은 현재 AI의 가장 큰 약점인 공간과 시간에 대한 안정적인 이해 부족을 해결하며 차세대 AI 물결의 기반으로 부상하고 있습니다. 비디오, AR, 로봇 공학에서 AGI에 이르기까지 연속적인 세계 모델을 구축하고 업데이트하는 능력은 AI가 단순히 “모방”만 할지 아니면 현실 세계를 진정으로 이해하고 올바르게 행동할지를 결정할 수 있습니다.

