- Aktuellen KI-Systemen mangelt es oft an Konsistenz: verformte Objekte, sich verändernde Räume und „gebrochene“ Zeit in Videos oder Simulationen.
- Die Hauptursache ist, dass generative KI nach einem Mechanismus der Wahrscheinlichkeitsvorhersage arbeitet, ohne ein kontinuierliches Weltmodell aufrechtzuerhalten, um ihr Verständnis zu aktualisieren.
- „World Models“ (Weltmodelle) werden als Lösung vorgeschlagen, um KI beim Aufbau und der Aktualisierung von Raum-Zeit-Karten (4D: 3D + Zeit) zu unterstützen.
- Beispielsweise „erinnert“ sich aktuelle Video-KI nicht an den Stuhl oder das Halsband eines Hundes, weil ihr ein stabiles Szenenmodell fehlt.
- Neue Forschungen zeigen, dass 4D-Weltmodelle der KI helfen, Objekt- und Bewegungskonsistenz zu wahren.
- Techniken wie NeRF (seit 2020) ermöglichen die 3D-Szenenrekonstruktion aus mehreren Blickwinkeln, sind aber noch datenabhängig.
- Neue Studien wie NeoVerse und TeleWorld wandeln einzelne Videos in 4D-Modelle um, um Videos aus mehreren Blickwinkeln zu generieren.
- Weltmodelle dienen nicht nur Video, sondern sind auch wichtig für AR, Robotik und autonome Fahrzeuge.
- Bei AR hilft ein Weltmodell virtuellen Objekten, an Ort und Stelle zu bleiben, mit korrekter Verdeckung, Beleuchtung und Perspektive.
- Roboter und autonome Fahrzeuge können Weltmodelle nutzen, um die nächsten Entwicklungen der Umgebung vorherzusagen.
- Benchmarks aus dem Jahr 2025 zeigen, dass aktuelle Visuell-Sprach-KI bei der Unterscheidung von Bewegungsbahnen fast zufällig agiert.
- LLMs wie ChatGPT haben ein „implizites Verständnis“ der Welt, können sich aber nicht in Echtzeit aktualisieren.
- OpenAI gibt zu, dass GPT-4 nicht aus Erfahrungen nach der Bereitstellung lernt.
- Viele Forscher glauben, dass AGI (Künstliche Allgemeine Intelligenz) ohne Weltmodelle mit Raum-Zeit-Gedächtnis nicht erreicht werden kann.
- Weltmodelle werden als Basisschicht angesehen, während LLMs die Rolle der Kommunikation und des sprachlichen Denkens spielen.
- Große Namen wenden sich Weltmodellen zu: Fei-Fei Li gründete World Labs (2024), Yann LeCun gründete AMI Labs (2025).
- Die Forschung zu DreamerV3 (Nature, April 2025) zeigt, dass KI mit einem Weltmodell die Zukunft „imaginieren“ kann, um ihr Verhalten zu verbessern.
- 4D-Weltmodelle sind auch sichere Simulationsumgebungen, um KI vor dem realen Einsatz zu testen.
📌 Aktuellen KI-Systemen mangelt es oft an Konsistenz: verformte Objekte, sich verändernde Räume und „gebrochene“ Zeit in Videos oder Simulationen. Die Hauptursache ist, dass generative KI nach einem Mechanismus der Wahrscheinlichkeitsvorhersage arbeitet, ohne ein kontinuierliches Weltmodell aufrechtzuerhalten, um ihr Verständnis zu aktualisieren. Weltmodelle entwickeln sich zum Fundament für die nächste KI-Welle und lösen die derzeit größte Schwäche der KI: den Mangel an stabilem Verständnis von Raum und Zeit. Von Video, AR und Robotik bis hin zu AGI könnte die Fähigkeit, kontinuierliche Weltmodelle aufzubauen und zu aktualisieren, darüber entscheiden, ob KI nur „nachahmt“ oder die reale Welt wirklich versteht und richtig handelt.

