Tweetul a fost șters de autor.
Dar noi am salvat totul 🙂.
Inteligența artificială merge dincolo de text și imagini - învață treptat să creeze medii virtuale și să acționeze în cadrul acestora. Această abordare este cunoscută sub denumirea de modele ale lumii: sisteme care recreează spațiul, obiectele și regulile de interacțiune, în care fiecare acțiune are o consecință. Această paradigmă ar putea deveni cheia roboticii, a transportului autonom și a agenților AI complecși, dar există o piedică care încetinește în prezent progresul.
Acest articol a fost tradus din original. Citiți versiunea originală a corespondentului nostru aici.
Majoritatea modelelor moderne sunt excelente în analizarea datelor și generarea de răspunsuri, dar le lipsește "intuiția" spațiului și a relațiilor cauză-efect. Ele pot descrie ce ar trebui făcut, dar adesea nu înțeleg ce se va întâmpla după o acțiune: unde anume va ajunge un obiect, ce se va ciocni sau cum se va schimba mediul.
Modelele lumii acoperă această lacună. Ele oferă inteligenței artificiale un teren de antrenament în care deciziile pot fi testate în siguranță, rutele pot fi planificate, greșelile pot fi evitate și rezultatele pot fi prezise. Pentru robotică, vehicule autonome și agenți AI, acesta nu este un bonus - este un fundament, baza pe care se construiește un comportament fiabil în lumea reală.
În practică, două abordări principale sunt utilizate în prezent. Prima este simularea dinamică în timp real. În acest caz, mediul nu este stocat în avans. Acesta este generat cadru cu cadru pe măsură ce un utilizator sau un agent se deplasează în spațiu, schimbă punctul de vedere sau interacționează cu obiecte. Modelul prezice în permanență modul în care ar trebui să se schimbe starea mediului, luând în considerare fizica și comportamentul obiectelor.
Această abordare oferă o flexibilitate ridicată și permite crearea de medii fără scenarii rigide, predefinite. În același timp, aceasta necesită resurse de calcul semnificative, motiv pentru care stabilitatea unor astfel de simulări este limitată în prezent la doar câteva minute.
Aceasta este calea urmată de Google cu platforma sa de cercetare Genie 3, care creează medii 3D de scurtă durată, dar coerente din punct de vedere logic. O abordare similară este utilizată de Meta în platforma sa Habitat 3, concepută pentru formarea agenților și roboților AI fizici.
A doua abordare se concentrează pe medii persistente, salvate. Aici, modelul convertește textul, imaginile sau înregistrările video într-o scenă tridimensională completă, cu geometrie, obiecte digitale și metadate care descriu procesele fizice. O astfel de lume poate fi salvată, importată în alte medii software și reutilizată.
Această direcție este dezvoltată de World Labs sub conducerea lui Fei-Fei Li. Modelul lor Marble vizează crearea unor medii 3D portabile adecvate pentru sarcini inginerești, științifice și de proiectare, în care stabilitatea și reproductibilitatea rezultatelor sunt esențiale.
Dezvoltarea tuturor acestor modele necesită cheltuieli de capital substanțiale, iar acest lucru se reflectă deja în strategiile marilor companii tehnologice.
Meta Platforms intenționează să crească investițiile de capital la 135 de miliarde de dolari, mizând pe inteligența artificială ca infrastructură de bază a produselor sale viitoare. După restructurarea diviziei sale de inteligență artificială, compania pregătește noi modele și platforme, în timp ce performanțele financiare puternice din activitatea sa de publicitate îi permit să finanțeze aceste investiții. Piața a reacționat pozitiv la această strategie.
Tesla și xAI a lui Elon Musk au ales o abordare diferită. Compania intenționează să cheltuiască aproximativ 20 de miliarde de dolari pentru AI, conducere autonomă și robotică, cu investiții suplimentare în xAI. Musk a subliniat în mod public necesitatea unei infrastructuri de semiconductori proprietare, subliniind pariul său pe un control deplin asupra întregii stive - de la modele la calcul.
Pentru ambele strategii, modelele mondiale nu sunt un produs final, ci un mediu de antrenament fără de care progresul în sistemele autonome încetinește sau devine prea riscant.
Pentru piață, modelele mondiale nu sunt nici un produs de sine stătător, nici un nou segment de consum al IA. Investitorii le văd ca pe un strat de infrastructură care va determina competitivitatea companiilor în următorul ciclu de dezvoltare al industriei.
Acesta este un pariu pe termen lung. Companiile care sunt primele care învață inteligența artificială să lucreze cu spațiul, mișcarea și relațiile cauză-efect vor obține un avantaj în toate domeniile legate de autonomie - de la robotică la aplicații industriale și transport. Acesta este motivul pentru care piața actuală este dispusă să tolereze creșteri semnificative ale cheltuielilor de capital și absența unor randamente rapide.
Reacția investitorilor la planurile Meta este revelatoare. În ciuda investițiilor masive în inteligență artificială, acțiunile companiei au crescut după profituri - piețele au crezut că activitatea de bază poate finanța aceste costuri fără a-și pierde stabilitatea. În acest caz, modelele mondiale sunt considerate o extensie a unei platforme existente, mai degrabă decât un experiment riscant.
Pariul lui Musk are un profil de risc diferit. Investitorii Tesla finanțează efectiv nu numai dezvoltarea inteligenței artificiale, ci și o încercare de integrare verticală - de la modele la cipuri. Această strategie este mai costisitoare și mai complexă, dar dacă va avea succes, va oferi companiei controlul deplin asupra componentelor-cheie ale sistemelor autonome.
În cele din urmă, piața nu pariază pe o tehnologie specifică, ci pe o abordare. Investitorii evaluează dacă o societate poate suporta un ciclu lung de investiții și dacă are o activitate capabilă să finanțeze dezvoltarea modelelor mondiale fără a pune presiune pe rentabilitatea pe termen scurt.