Tweet byl autorem smazán.
Ale my jsme všechno uložili 🙂.
Umělá inteligence překračuje hranice textu a obrázků - postupně se učí vytvářet virtuální prostředí a jednat v něm. Tento přístup je známý jako modely světa: systémy, které znovu vytvářejí prostor, objekty a pravidla interakce, kde každá akce má svůj důsledek. Toto paradigma by se mohlo stát klíčem k robotice, autonomní dopravě a komplexním agentům umělé inteligence - ale je tu háček, který v současnosti brzdí pokrok.
Tento článek byl přeložen z originálu. Přečtěte si původní verzi od našeho korespondenta zde.
Většina moderních modelů umí výborně analyzovat data a generovat reakce, ale chybí jim "intuice" pro prostor a příčinné vztahy. Dokážou popsat, co by se mělo udělat, ale často nechápou, co se stane po akci: kde přesně objekt skončí, co se srazí nebo jak se změní prostředí.
Modely světa tuto mezeru zaplňují. Poskytují umělé inteligenci cvičiště, kde lze bezpečně testovat rozhodnutí, plánovat trasy, vyvarovat se chyb a předvídat výsledky. Pro robotiku, autonomní vozidla a agenty UI to není bonus - je to základ, na kterém je postaveno spolehlivé chování v reálném světě.
V praxi se dnes používají dva hlavní přístupy. Prvním je dynamická simulace v reálném čase. V tomto případě není prostředí uloženo předem. Je generováno snímek po snímku, jak se uživatel nebo agent pohybuje prostorem, mění úhel pohledu nebo interaguje s objekty. Model průběžně předpovídá, jak by se měl stav prostředí měnit, přičemž bere v úvahu fyziku a chování objektů.
Tento přístup nabízí vysokou flexibilitu a umožňuje vytvářet prostředí bez rigidních, předem definovaných scénářů. Zároveň vyžaduje značné výpočetní prostředky, a proto je stabilita takových simulací v současné době omezena na pouhých několik minut.
Touto cestou se vydává společnost Google se svou výzkumnou platformou Genie 3, která vytváří krátkodobá, ale logicky konzistentní 3D prostředí. Podobný přístup používá i společnost Meta ve své platformě Habitat 3, která je určena k výcviku fyzických agentů a robotů s umělou inteligencí.
Druhý přístup se zaměřuje na trvalá, uložená prostředí. Zde model převádí text, obrázky nebo video na plnohodnotnou trojrozměrnou scénu s geometrií, digitálními objekty a metadaty popisujícími fyzikální procesy. Takový svět lze uložit, importovat do jiných softwarových prostředí a znovu použít.
Tento směr vyvíjí společnost World Labs pod vedením Fei-Fei Li. Jejich model Marble je zaměřen na vytváření přenosných 3D prostředí vhodných pro inženýrské, vědecké a návrhářské úlohy, kde je rozhodující stabilita a reprodukovatelnost výsledků.
Vývoj všech těchto modelů vyžaduje značné kapitálové výdaje, což se již odráží ve strategiích velkých technologických společností.
Společnost Meta Platforms plánuje zvýšit kapitálové investice na 135 miliard dolarů a sází na umělou inteligenci jako na základní infrastrukturu svých budoucích produktů. Po restrukturalizaci své divize AI připravuje nové modely a platformy, přičemž dobré finanční výsledky v oblasti reklamy jí umožňují tyto investice financovat. Trh na tuto strategii reaguje pozitivně.
Tesla a xAI Elona Muska zvolily jiný přístup. Společnost plánuje utratit přibližně 20 miliard dolarů za umělou inteligenci, autonomní řízení a robotiku a další investice do xAI. Musk veřejně zdůraznil potřebu vlastní polovodičové infrastruktury, čímž podtrhl svou sázku na plnou kontrolu nad celým stackem - od modelů až po výpočty.
Pro obě strategie nejsou světové modely konečným produktem, ale tréninkovým prostředím, bez něhož se další pokrok v autonomních systémech zpomalí nebo se stane příliš riskantním.
Pro trh nejsou světové modely ani samostatným produktem, ani novým spotřebitelským segmentem umělé inteligence. Investoři je vnímají jako infrastrukturní vrstvu, která bude určovat konkurenceschopnost společností v dalším vývojovém cyklu odvětví.
Jedná se o dlouhodobou sázku. Společnosti, které jako první naučí AI pracovat s prostorem, pohybem a příčinnými vztahy, získají výhodu ve všech oblastech souvisejících s autonomií - od robotiky po průmyslové aplikace a dopravu. Proto je dnes trh ochoten tolerovat prudké zvýšení kapitálových výdajů a absenci rychlé návratnosti.
Reakce investorů na plány společnosti Meta je výmluvná. Navzdory masivním investicím do umělé inteligence akcie společnosti po výsledcích rostly - trhy věřily, že hlavní činnost dokáže tyto náklady financovat bez ztráty stability. V tomto případě jsou světové modely považovány spíše za rozšíření stávající platformy než za riskantní experiment.
Muskova sázka s sebou nese jiný rizikový profil. Investoři společnosti Tesla fakticky financují nejen vývoj umělé inteligence, ale také pokus o vertikální integraci - od modelů po čipy. Tato strategie je dražší a složitější, ale v případě úspěchu dává společnosti plnou kontrolu nad klíčovými součástmi autonomních systémů.
Trh nakonec nesází na konkrétní technologii, ale na přístup. Investoři posuzují, zda společnost vydrží dlouhý investiční cyklus a zda má podnik schopný financovat vývoj světových modelů bez tlaku na krátkodobou ziskovost.