De tweet is verwijderd door de auteur.
Maar we hebben alles opgeslagen 🙂.
Kunstmatige intelligentie gaat verder dan tekst en afbeeldingen - het leert geleidelijk virtuele omgevingen te creëren en daarin te handelen. Deze benadering staat bekend als wereldmodellen: systemen die de ruimte, objecten en interactieregels nabootsen, waarbij elke actie een gevolg heeft. Dit paradigma zou de sleutel kunnen worden tot robotica, autonoom transport en complexe AI-agenten, maar er zit een addertje onder het gras dat de vooruitgang momenteel afremt.
Dit artikel is vertaald vanuit het origineel. Lees de originele versie van onze correspondent hier.
De meeste moderne modellen zijn uitstekend in het analyseren van gegevens en het genereren van antwoorden, maar ze missen een "intuïtie" voor ruimte en oorzaak-en-gevolgrelaties. Ze kunnen beschrijven wat er gedaan moet worden, maar begrijpen vaak niet wat er na een actie zal gebeuren: waar een object precies terecht zal komen, wat er zal botsen, of hoe de omgeving zal veranderen.
Wereldmodellen dichten deze kloof. Ze geven AI een oefenterrein waar beslissingen veilig kunnen worden getest, routes kunnen worden gepland, fouten kunnen worden vermeden en uitkomsten kunnen worden voorspeld. Voor robotica, autonome voertuigen en AI-agenten is dit geen bonus, maar een fundament, de basis waarop betrouwbaar gedrag in de echte wereld wordt gebouwd.
In de praktijk worden tegenwoordig twee belangrijke benaderingen gebruikt. De eerste is realtime dynamische simulatie. In dit geval wordt de omgeving niet van tevoren opgeslagen. Het wordt frame voor frame gegenereerd wanneer een gebruiker of agent door de ruimte beweegt, van gezichtspunt verandert of interactie heeft met objecten. Het model voorspelt continu hoe de toestand van de omgeving zou moeten veranderen, rekening houdend met de fysica en het gedrag van objecten.
Deze aanpak biedt een hoge flexibiliteit en maakt het mogelijk omgevingen te maken zonder starre, vooraf gedefinieerde scenario's. Tegelijkertijd vereist het aanzienlijke rekenkracht, waardoor de stabiliteit van dergelijke simulaties momenteel beperkt is tot slechts enkele minuten.
Dit is het pad dat Google bewandelt met zijn onderzoeksplatform Genie 3, dat kortstondige maar logisch consistente 3D-omgevingen creëert. Een soortgelijke benadering wordt gebruikt door Meta in zijn Habitat 3-platform, dat is ontworpen voor het trainen van fysieke AI-agenten en robots.
De tweede benadering richt zich op persistente, opgeslagen omgevingen. Hier zet het model tekst, afbeeldingen of video om in een volwaardige driedimensionale scène met geometrie, digitale objecten en metadata die fysieke processen beschrijven. Zo'n wereld kan worden opgeslagen, geïmporteerd in andere softwareomgevingen en hergebruikt.
Deze richting wordt ontwikkeld door World Labs onder leiding van Fei-Fei Li. Hun Marble-model is gericht op het creëren van draagbare 3D-omgevingen die geschikt zijn voor technische, wetenschappelijke en ontwerptaken, waarbij stabiliteit en reproduceerbaarheid van resultaten van cruciaal belang zijn.
Het ontwikkelen van al deze modellen vereist aanzienlijke investeringen, en dit wordt al weerspiegeld in de strategieën van grote technologiebedrijven.
Meta Platforms is van plan om de kapitaalinvesteringen te verhogen tot 135 miljard dollar en zet in op AI als de kerninfrastructuur van zijn toekomstige producten. Na het herstructureren van zijn AI-divisie bereidt het bedrijf nieuwe modellen en platforms voor, terwijl de sterke financiële prestaties in zijn advertentiebusiness het mogelijk maken om deze investeringen te financieren. De markt heeft positief gereageerd op deze strategie.
Tesla en Elon Musk's xAI hebben voor een andere aanpak gekozen. Het bedrijf is van plan om ongeveer 20 miljard dollar te besteden aan AI, autonoom rijden en robotica, met aanvullende investeringen in xAI. Musk heeft publiekelijk de noodzaak van een eigen halfgeleiderinfrastructuur benadrukt, waarmee hij zijn inzet voor volledige controle over de hele stapel - van modellen tot berekeningen - onderstreept.
Voor beide strategieën zijn wereldmodellen geen eindproduct, maar een trainingsomgeving zonder welke verdere vooruitgang in autonome systemen vertraagt of te riskant wordt.
Voor de markt zijn wereldmodellen noch een op zichzelf staand product, noch een nieuw AI-segment voor consumenten. Investeerders zien ze als een infrastructuurlaag die het concurrentievermogen van bedrijven in de volgende ontwikkelingscyclus van de industrie zal bepalen.
Dit is een gok voor de lange termijn. Bedrijven die als eerste AI leren werken met ruimte, beweging en oorzaak-en-gevolgrelaties zullen een voorsprong krijgen op alle gebieden die met autonomie te maken hebben, van robotica tot industriële toepassingen en transport. Daarom is de markt vandaag bereid om een sterke stijging van de kapitaaluitgaven en de afwezigheid van snel rendement te tolereren.
De reactie van investeerders op de plannen van Meta is veelzeggend. Ondanks de enorme AI-investeringen stegen de aandelen van het bedrijf na de winst. De markten geloofden dat de kernactiviteiten deze kosten konden financieren zonder aan stabiliteit in te boeten. In dit geval worden de wereldmodellen eerder beschouwd als een uitbreiding van een bestaand platform dan als een riskant experiment.
De inzet van Musk heeft een ander risicoprofiel. Tesla-investeerders financieren in feite niet alleen de ontwikkeling van AI, maar ook een poging tot verticale integratie - van modellen tot chips. Deze strategie is duurder en complexer, maar als ze succesvol is, geeft ze het bedrijf volledige controle over de belangrijkste onderdelen van autonome systemen.
Uiteindelijk zet de markt niet in op een specifieke technologie, maar op een benadering. Investeerders beoordelen of een bedrijf een lange investeringscyclus kan doorstaan en of het een bedrijf heeft dat de ontwikkeling van wereldmodellen kan financieren zonder de winstgevendheid op korte termijn onder druk te zetten.