Tweetin poisti sen kirjoittaja.
Mutta me tallensimme kaiken 🙂.
Tekoäly on siirtymässä tekstiä ja kuvia pidemmälle - se oppii vähitellen luomaan virtuaaliympäristöjä ja toimimaan niissä. Tämä lähestymistapa tunnetaan nimellä maailmanmallit: järjestelmät, jotka luovat uudelleen tilan, esineet ja vuorovaikutussäännöt, joissa jokaisella toiminnalla on seurauksensa. Tästä paradigmasta voi tulla avain robotiikkaan, autonomiseen liikenteeseen ja monimutkaisiin tekoälyagentteihin, mutta edistystä hidastaa eräs ongelma.
Tämä artikkeli on käännetty alkuperäisestä tekstistä. Lue kirjeenvaihtajamme alkuperäinen versio täältä.
Useimmat nykyaikaiset mallit ovat erinomaisia tietojen analysoinnissa ja vastausten tuottamisessa, mutta niistä puuttuu "intuitio" tilasta ja syy-seuraussuhteista. Ne voivat kuvata, mitä pitäisi tehdä, mutta eivät useinkaan ymmärrä, mitä toiminnan jälkeen tapahtuu: mihin esine tarkalleen ottaen päätyy, mitä törmää tai miten ympäristö muuttuu.
Maailmamallit paikkaavat tämän puutteen. Ne tarjoavat tekoälylle harjoituskentän, jossa päätöksiä voidaan testata turvallisesti, reittejä voidaan suunnitella, virheitä voidaan välttää ja lopputuloksia voidaan ennustaa. Robotiikan, autonomisten ajoneuvojen ja tekoälyagenttien kannalta tämä ei ole mikään bonus, vaan perusta, jonka varaan luotettava käyttäytyminen todellisessa maailmassa rakentuu.
Käytännössä käytetään nykyään kahta pääasiallista lähestymistapaa. Ensimmäinen on reaaliaikainen dynaaminen simulointi. Tällöin ympäristöä ei tallenneta etukäteen. Se luodaan ruutu kerrallaan, kun käyttäjä tai agentti liikkuu tilassa, vaihtaa näkökulmaa tai on vuorovaikutuksessa esineiden kanssa. Malli ennustaa jatkuvasti, miten ympäristön tilan pitäisi muuttua, ottaen huomioon fysiikan ja esineiden käyttäytymisen.
Tämä lähestymistapa tarjoaa suurta joustavuutta ja mahdollistaa ympäristöjen luomisen ilman jäykkiä, ennalta määriteltyjä skenaarioita. Samaan aikaan se vaatii huomattavia laskentaresursseja, minkä vuoksi tällaisten simulaatioiden vakaus rajoittuu tällä hetkellä vain muutamaan minuuttiin.
Tätä tietä Google kulkee tutkimusalustallaan Genie 3, joka luo lyhytaikaisia mutta loogisesti johdonmukaisia 3D-ympäristöjä. Meta käyttää samanlaista lähestymistapaa Habitat 3 -alustassaan, joka on suunniteltu fyysisten tekoälyagenttien ja robottien kouluttamiseen.
Toinen lähestymistapa keskittyy pysyviin, tallennettuihin ympäristöihin. Tässä malli muuntaa tekstin, kuvat tai videon täysimittaiseksi kolmiulotteiseksi kohtaukseksi, jossa on geometriaa, digitaalisia objekteja ja fysikaalisia prosesseja kuvaavia metatietoja. Tällainen maailma voidaan tallentaa, tuoda muihin ohjelmistoympäristöihin ja käyttää uudelleen.
Tätä suuntaa kehittää World Labs Fei-Fei Li:n johdolla. Heidän Marble-mallinsa tavoitteena on luoda siirrettäviä 3D-ympäristöjä, jotka soveltuvat insinööri-, tiede- ja suunnittelutehtäviin, joissa tulosten vakaus ja toistettavuus ovat kriittisiä.
Kaikkien näiden mallien kehittäminen edellyttää huomattavia pääomamenoja, mikä näkyy jo suurten teknologiayritysten strategioissa.
Meta Platforms aikoo lisätä pääomasijoituksia 135 miljardiin dollariin ja panostaa tekoälyyn tulevien tuotteidensa ydininfrastruktuurina. Tekoälyosastonsa rakenneuudistuksen jälkeen yhtiö valmistelee uusia malleja ja alustoja, ja mainosliiketoimintansa vahva taloudellinen tulos mahdollistaa näiden investointien rahoittamisen. Markkinat ovat suhtautuneet tähän strategiaan myönteisesti.
Tesla ja Elon Muskin xAI ovat valinneet erilaisen lähestymistavan. Yhtiö aikoo käyttää noin 20 miljardia dollaria tekoälyyn, autonomiseen ajamiseen ja robotiikkaan, ja lisäksi se aikoo investoida xAI:hen. Musk on julkisesti korostanut tarvetta omaan puolijohdeinfrastruktuuriin, mikä korostaa hänen panostustaan koko pinon täydelliseen hallintaan - malleista laskentaan.
Molemmissa strategioissa maailmanmallit eivät ole lopputuote vaan harjoitusympäristö, jota ilman autonomisten järjestelmien kehitys hidastuu tai muuttuu liian riskialttiiksi.
Markkinoille maailmanmallit eivät ole itsenäinen tuote eivätkä uusi kuluttajien tekoälysegmentti. Sijoittajat pitävät niitä infrastruktuurikerroksena, joka määrittää yritysten kilpailukyvyn alan seuraavassa kehityssyklissä.
Tämä on pitkän aikavälin veto. Yritykset, jotka opettavat ensimmäisenä tekoälyn toimimaan tilan, liikkeen ja syy-seuraussuhteiden kanssa, saavat etulyöntiaseman kaikilla autonomiaan liittyvillä aloilla robotiikasta teollisiin sovelluksiin ja liikenteeseen. Siksi markkinat ovat nykyään valmiita sietämään pääomamenojen jyrkkää kasvua ja nopeiden tuottojen puuttumista.
Sijoittajien reaktio Metan suunnitelmiin on kuvaava. Massiivisista tekoälyinvestoinneista huolimatta yhtiön osakkeet nousivat tuloksen jälkeen - markkinat uskoivat, että ydinliiketoiminta pystyy rahoittamaan nämä kustannukset menettämättä vakautta. Tällöin maailmanmalleja pidetään pikemminkin olemassa olevan alustan laajennuksena kuin riskialttiina kokeiluna.
Muskin vedossa on erilainen riskiprofiili. Teslan sijoittajat rahoittavat tehokkaasti paitsi tekoälyn kehittämistä myös yritystä vertikaaliseen integraatioon - malleista siruihin. Tämä strategia on kalliimpi ja monimutkaisempi, mutta onnistuessaan se antaa yhtiölle täyden määräysvallan autonomisten järjestelmien keskeisiin komponentteihin.
Loppujen lopuksi markkinat eivät panosta tiettyyn teknologiaan vaan lähestymistapaan. Sijoittajat arvioivat, kestääkö yritys pitkän investointisyklin ja pystyykö sen liiketoiminta rahoittamaan maailmanmallien kehittämisen ilman, että lyhyen aikavälin kannattavuuteen kohdistuu paineita.