• Các hệ thống AI hiện nay thường thiếu tính nhất quán: vật thể biến dạng, không gian thay đổi, thời gian bị “đứt gãy” trong video hoặc mô phỏng.
  • Nguyên nhân cốt lõi là AI tạo sinh hoạt động theo cơ chế dự đoán xác suất, không duy trì một mô hình thế giới liên tục để cập nhật hiểu biết.
  • World models được đề xuất như giải pháp, giúp AI xây dựng và cập nhật bản đồ không gian – thời gian (4D: 3D + thời gian).
  • Ví dụ, AI video hiện nay không “nhớ” chiếc ghế hay vòng cổ của con chó vì thiếu mô hình cảnh ổn định.
  • Nghiên cứu mới cho thấy 4D world models giúp AI duy trì tính nhất quán vật thể và chuyển động.
  • Các kỹ thuật như NeRF (từ 2020) cho phép tái tạo cảnh 3D từ nhiều góc nhìn, nhưng còn phụ thuộc dữ liệu.
  • Các nghiên cứu mới như NeoVerse và TeleWorld chuyển video đơn lẻ thành mô hình 4D để sinh video từ nhiều góc.
  • World models không chỉ phục vụ video mà còn quan trọng cho AR, robot và xe tự hành.
  • Với AR, world model giúp vật thể ảo đứng yên, che khuất đúng, ánh sáng và phối cảnh hợp lý.
  • Robot và xe tự hành có thể dùng world models để dự đoán diễn biến tiếp theo của môi trường.
  • Benchmark năm 2025 cho thấy AI thị giác–ngôn ngữ hiện nay gần như ngẫu nhiên khi phân biệt quỹ đạo chuyển động.
  • LLM như ChatGPT có “hiểu biết ngầm” về thế giới nhưng không thể cập nhật theo thời gian thực.
  • OpenAI thừa nhận GPT-4 không học từ trải nghiệm sau khi triển khai.
  • Nhiều nhà nghiên cứu cho rằng AGI không thể đạt được nếu thiếu world models có trí nhớ không–thời gian.
  • World models được xem là lớp nền, còn LLM đóng vai trò giao tiếp và suy luận ngôn ngữ.
  • Các tên tuổi lớn chuyển hướng sang world models: Fei-Fei Li lập World Labs (2024), Yann LeCun lập AMI Labs (2025).
  • Nghiên cứu DreamerV3 (Nature, 4.2025) cho thấy AI có world model có thể “tưởng tượng” tương lai để cải thiện hành vi.
  • 4D world models cũng là môi trường mô phỏng an toàn để kiểm thử AI trước khi triển khai thực tế.

📌 Các hệ thống AI hiện nay thường thiếu tính nhất quán: vật thể biến dạng, không gian thay đổi, thời gian bị “đứt gãy” trong video hoặc mô phỏng. Nguyên nhân cốt lõi là AI tạo sinh hoạt động theo cơ chế dự đoán xác suất, không duy trì một mô hình thế giới liên tục để cập nhật hiểu biết. World models đang nổi lên như nền móng cho làn sóng AI tiếp theo, giải quyết điểm yếu lớn nhất của AI hiện nay: thiếu hiểu biết ổn định về không gian và thời gian. Từ video, AR, robot đến AGI, khả năng xây dựng và cập nhật mô hình thế giới liên tục có thể quyết định việc AI chỉ “bắt chước” hay thực sự hiểu và hành động đúng trong thế giới thực.

Tổng hợp.

Share.
Liên hệ:

Địa chỉ: Số 34 Ngõ 91 Đường Trần Duy Hưng, Phường Yên Hòa, Thành phố Hà Nội, Việt Nam

© 2026 Vietmetric
Exit mobile version