Világok teremtői: Ahol a technológiai óriások milliárdokat fektetnek be

Világok teremtői: Ahol a technológiai óriások milliárdokat fektetnek be
Világokat teremtő mesterséges intelligencia: Miért fektetnek a vállalatok világmodellekbe?

A mesterséges intelligencia egyre inkább túllép a szövegeken és képeken - fokozatosan megtanul virtuális környezeteket létrehozni és azokban cselekedni. Ezt a megközelítést világmodelleknek nevezik: olyan rendszerek, amelyek újrateremtik a teret, a tárgyakat és az interakció szabályait, ahol minden cselekvésnek következménye van. Ez a paradigma lehet a robotika, az autonóm közlekedés és az összetett mesterséges intelligencia-ügynökök kulcsa - de van egy csapda, amely jelenleg lassítja a fejlődést.

Ezt a cikket az eredetiből fordítottuk. Olvassa el tudósítónk eredeti változatát itt.

A legtöbb modern modell kiválóan elemzi az adatokat és generálja a válaszokat, de hiányzik belőlük a tér és az ok-okozati összefüggések "megérzése". Le tudják írni, hogy mit kellene tenni, de gyakran nem értik, hogy mi fog történni egy akció után: pontosan hol fog kikötni egy tárgy, mi fog ütközni, vagy hogyan fog változni a környezet.

A világmodellek ezt a rést zárják be. Olyan gyakorlóterepet biztosítanak a mesterséges intelligenciának, ahol a döntések biztonságosan tesztelhetők, az útvonalak megtervezhetők, a hibák elkerülhetők, és a kimenetel megjósolható. A robotika, az autonóm járművek és az AI-ügynökök számára ez nem bónusz - ez az alap, az alap, amelyre a valós világban való megbízható viselkedés épül.

Hogyan jönnek létre ezek a világok

A gyakorlatban ma két fő megközelítést alkalmaznak. Az első a valós idejű dinamikus szimuláció. Ebben az esetben a környezetet nem tárolják el előre. Képkockánként generálódik, ahogy a felhasználó vagy az ágens mozog a térben, változtatja a nézőpontot, vagy interakcióba lép az objektumokkal. A modell folyamatosan megjósolja, hogy a környezet állapotának hogyan kell változnia, figyelembe véve a fizikát és a tárgyak viselkedését.

Ez a megközelítés nagy rugalmasságot kínál, és lehetővé teszi a környezetek létrehozását merev, előre meghatározott forgatókönyvek nélkül. Ugyanakkor jelentős számítási erőforrásokat igényel, ezért az ilyen szimulációk stabilitása jelenleg mindössze néhány percre korlátozódik.

Ezt az utat járja be a Google a Genie 3 nevű kutatási platformjával, amely rövid életű, de logikailag konzisztens 3D-s környezeteket hoz létre. Hasonló megközelítést alkalmaz a Meta a Habitat 3 platformjában, amelyet fizikai mesterséges intelligencia-ügynökök és robotok kiképzésére terveztek.

A második megközelítés a tartós, elmentett környezetekre összpontosít. Itt a modell a szöveget, képeket vagy videót teljes értékű háromdimenziós jelenetté alakítja át, geometriával, digitális objektumokkal és fizikai folyamatokat leíró metaadatokkal. Egy ilyen világ elmenthető, más szoftverkörnyezetekbe importálható és újrafelhasználható.

Ezt az irányt a World Labs fejleszti Fei-Fei Li vezetésével. Marble modelljük célja olyan hordozható 3D környezetek létrehozása, amelyek alkalmasak mérnöki, tudományos és tervezési feladatokhoz, ahol a stabilitás és az eredmények reprodukálhatósága kritikus fontosságú.

Ki és miért fektet be

Mindezen modellek kifejlesztése jelentős tőkekiadásokat igényel, és ez már tükröződik a nagy technológiai vállalatok stratégiáiban.

A Meta Platforms a tőkebefektetéseket 135 milliárd dollárra tervezi növelni, és a mesterséges intelligenciára, mint jövőbeli termékeinek alapvető infrastruktúrájára fogad. Az AI-részlegének átszervezése után a vállalat új modelleket és platformokat készít elő, miközben a hirdetési üzletág erős pénzügyi teljesítménye lehetővé teszi, hogy finanszírozza ezeket a beruházásokat. A piac pozitívan reagált erre a stratégiára.

A Tesla és Elon Musk xAI-ja más megközelítést választott. A vállalat mintegy 20 milliárd dollárt tervez költeni a mesterséges intelligenciára, az autonóm vezetésre és a robotikára, további befektetésekkel az xAI-ba. Musk nyilvánosan hangsúlyozta a saját félvezető-infrastruktúra szükségességét, ezzel is aláhúzva a teljes stack feletti teljes kontrollra tett tétjét - a modellektől a számításokig.

Mindkét stratégia számára a világmodellek nem végtermék, hanem olyan képzési környezet, amely nélkül az autonóm rendszerek további fejlődése lelassul vagy túl kockázatossá válik.

Hogyan látják ezt a befektetők

A piac számára a világmodellek nem jelentenek sem önálló terméket, sem új fogyasztói AI-szegmenst. A befektetők úgy tekintenek rájuk, mint egy olyan infrastrukturális rétegre, amely meghatározza a vállalatok versenyképességét az iparág következő fejlesztési ciklusában.

Ez egy hosszú távú fogadás. Azok a vállalatok, amelyek elsőként tanítják meg a mesterséges intelligenciát a térrel, a mozgással és az ok-okozati összefüggésekkel való munkára, az autonómiához kapcsolódó valamennyi területen - a robotikától az ipari alkalmazásokon át a közlekedésig - előnyre tesznek szert. Ezért a piac ma hajlandó elviselni a tőkekiadások erőteljes növekedését és a gyors megtérülés hiányát.

A Meta terveire adott befektetői reakciók sokatmondóak. A masszív AI-beruházások ellenére a vállalat részvényei az eredmény után emelkedtek - a piacok úgy vélték, hogy az alaptevékenység stabilitásvesztés nélkül képes finanszírozni ezeket a költségeket. Ebben az esetben a világmodelleket egy meglévő platform kiterjesztésének tekintik, nem pedig kockázatos kísérletnek.

Musk fogadása más kockázati profilt hordoz. A Tesla befektetői gyakorlatilag nemcsak a mesterséges intelligencia fejlesztését finanszírozzák, hanem a vertikális integrációra tett kísérletet is - a modellektől a chipekig. Ez a stratégia drágább és összetettebb, de ha sikeres, akkor a vállalat teljes ellenőrzést kap az autonóm rendszerek kulcsfontosságú elemei felett.

Végső soron a piac nem egy konkrét technológiára, hanem egy megközelítésre fogad. A befektetők azt értékelik, hogy egy vállalat képes-e hosszú befektetési ciklust elviselni, és hogy rendelkezik-e olyan üzleti tevékenységgel, amely képes finanszírozni a világmodellek fejlesztését anélkül, hogy a rövid távú nyereségességre nyomást gyakorolna.

Ez az anyag harmadik felek véleményét tartalmazhatja, a weboldalon található adatok és információk egyike sem minősül befektetési tanácsnak a Jogi nyilatkozatunk szerint. Bár szigorú Szerkesztői Integritást követünk, ez a bejegyzés tartalmazhat hivatkozásokat partnereink termékeire.