Die Anfänge eines Welt-Simulators
World-Simulator sind Modelle, die darauf trainiert sind, vorherzusagen, wie sich die Welt im Laufe der Zeit entwickelt. In den letzten Jahren haben wir gelernt, dass einfache, kausale Vorhersageziele zu überraschend allgemeiner Intelligenz führen können. Diese Erkenntnis erstreckt sich nun über die Sprachverarbeitung hinaus zu Weltmodellen, was zur Entstehung naszierender Welt-Simulatoren führt.
Ein neuer Typ von audio-visueller Intelligenz
Ein frühes Beispiel für einen Welt-Simulator ist Odyssey-2, ein Modell, das darauf trainiert ist, vorherzusagen, wie sich die Welt von Bild zu Bild entwickelt, indem es große Mengen an Video- und Interaktionsdaten nutzt. Anstatt sich auf handgefertigte Regeln zu verlassen, lernt es latente Zustände, Dynamiken und Ursache-Wirkung-Beziehungen direkt aus Beobachtungen.
Die Bedeutung des Lernens durch Beobachtung
Warum sind Vorhersagen des nächsten Frames oder Tokens als Vortraining wichtig? Diese einfachen Ziele erfordern, dass Modelle mit sehr wenig eingebautem Wissen lernen, wie die Welt direkt aus Daten funktioniert. Das Vortraining reduziert die Unsicherheit darüber, was als Nächstes in einer Sequenz kommt – sei es ein Frame oder ein Wort. Wenn diese Unsicherheit abnimmt, beginnen intelligente Fähigkeiten zu entstehen.
Das Lernen von Video und den Aktionen, die es formen
Das gleiche Prinzip gilt für Welt-Modelle. Um die nächste Beobachtung vorherzusagen, muss ein Welt-Modell den zugrunde liegenden Zustand der Welt und dessen Entwicklung im Laufe der Zeit ableiten. In der Praxis ist die beste Quelle dafür groß angelegtes, allgemeines Video. Dies zwingt das Modell dazu, Strukturen über Physik, Kausalität und Persistenz zu lernen.
Langfristiges Lernen und verborgene Zustände
Dies wird besonders deutlich in langfristigen Szenarien. Stellen Sie sich vor, jemand lässt ein Bad einlaufen, verlässt den Raum für mehrere Minuten und kommt dann zurück. Während das Bad nicht im Blickfeld ist, steigt der Wasserstand, die Temperatur ändert sich und die Badewanne könnte überlaufen. Um eine sinnvolle Vorhersage zu treffen, wenn die Person zurückkommt, muss das Modell einen internen Zustand der Welt aufrechterhalten und darüber nachdenken, wie sich dieser Zustand entwickelt hat, während er nicht beobachtet wurde.
Von engen zu allgemeinen Simulationen
Simulation bedeutet, vorherzusagen, wie sich der Zustand eines Systems im Laufe der Zeit entwickelt, unter Verwendung von Modellen, Daten oder beidem. In der Praxis sind die meisten realen Simulationen heute stark eingegrenzt. Handgefertigte Modelle erfassen nur genug Struktur, um ein bestimmtes Verhalten zu reproduzieren, während irrelevante Details ignoriert oder gemittelt werden.
Das Lernen, die Welt aus Videos zu simulieren
Welt-Modelle nähern sich der Simulation aus einer neuen Perspektive. Anstatt einen Simulator für jedes Gebiet zu entwerfen, trainieren wir allgemeine, kausale Modelle auf großen Mengen von Video- und Interaktionsdaten und beauftragen sie damit, vorherzusagen, was als Nächstes passiert. Diese Herangehensweise verändert die Art und Weise, wie Simulation skaliert.
Interaktive Simulationen
Heute werden Simulationen hauptsächlich als Validierungstools verwendet. Sie laufen offline, beantworten eng definierte Fragen und produzieren Ausgaben, die nachträglich überprüft werden. Welt-Modelle verändern dies, indem sie die Simulation in einen fortlaufenden Prozess verwandeln. Wenn ein Modell in Echtzeit einen Video-Stream generiert, der auf vergangenen Beobachtungen und Benutzeraktionen basiert, wird die Simulation von Natur aus interaktiv.
Schlussfolgerung und Einladung zur Zusammenarbeit
Wenn diese Richtung für Sie von Interesse ist, bauen wir bei Odyssey daran. Wir sind ein KI-Labor, das sich auf allgemeine Welt-Modelle konzentriert: kausale, multimodale Systeme, die lernen, die Welt über lange Horizonte hinweg vorherzusagen und mit ihr zu interagieren. Wenn Sie ein Forscher sind, der über enge Modelle hinausgehen möchte und an Problemen arbeiten möchte, die nicht sauber in bestehende Paradigmen passen, würden wir uns freuen, von Ihnen zu hören.










Hinterlasse einen Kommentar
An der Diskussion beteiligen?Hinterlasse uns deinen Kommentar!