Твіт було видалено автором.
Але ми все зберегли 🙂.
Штучний інтелект виходить за межі текстів і картинок — він поступово вчиться створювати віртуальні середовища і діяти в них. Це називають world models: системи, які відтворюють простір, об’єкти та правила взаємодії, де кожна дія має наслідок. Саме цей підхід може стати ключем до роботів, автономного транспорту і складних ШІ-агентів — але є нюанс, який зараз гальмує прогрес.
Ця стаття була перекладена з оригіналу. Читайте оригінальну версію від нашого кореспондента тут.
Більшість сучасних моделей чудово аналізують дані й генерують відповіді, але їм бракує «інтуїції» про простір і причинно-наслідкові зв’язки. Вони можуть описати, що треба зробити, але часто не розуміють, що станеться після дії: де саме опиниться об’єкт, що зіштовхнеться, що зміниться в середовищі.
World models закривають цю прогалину: вони дають ШІ тренувальний майданчик, де можна безпечно перевіряти рішення, вчитися планувати маршрут, уникати помилок і прогнозувати наслідки. Для робототехніки, автономного транспорту та «агентних» систем це не бонус, а фундамент — те, на чому взагалі будується надійна поведінка в реальному світі.
На практиці сьогодні застосовуються два підходи. Перший — динамічне моделювання в реальному часі. У цьому випадку середовище не зберігається наперед. Воно генерується покадрово у міру того, як користувач або агент рухається простором, змінює напрямок огляду чи взаємодіє з об’єктами. Модель постійно прогнозує, як має змінитися стан середовища з урахуванням фізики та поведінки об’єктів.
Цей підхід забезпечує високу гнучкість і дозволяє створювати середовища без жорстко заданих сценаріїв. Водночас він потребує значних обчислювальних ресурсів, тому стабільність таких симуляцій наразі обмежена кількома хвилинами.
Саме цим шляхом іде Google зі своєю дослідницькою платформою Genie 3, яка створює короткотривалі, але логічно узгоджені 3D-середовища. Аналогічний підхід використовує Meta у платформі Habitat 3, орієнтованій на тренування фізичних ШІ-агентів і роботів.
Другий підхід — створення стійких, збережених середовищ. Тут модель перетворює текст, зображення або відео на повноцінну тривимірну сцену з геометрією, цифровими об’єктами та метаданими фізичних процесів. Такий світ можна зберегти, імпортувати в інші програмні середовища та використовувати повторно.
Цей напрям розвиває World Labs під керівництвом Фей-Фей Лі. Їхня модель Marble орієнтована на створення переносних 3D-середовищ, придатних для інженерних, наукових і дизайнерських завдань, де важлива стабільність і відтворюваність результатів.
Розвиток усіх цих моделей вимагає значних капітальних витрат, і це вже відображається у стратегіях великих технологічних компаній.
Meta Platforms планує збільшити капітальні інвестиції до $135 млрд, роблячи ставку на ШІ як ключову інфраструктуру майбутніх продуктів. Після реструктуризації ШІ-напрямку компанія готує нові моделі та платформи, а сильні фінансові результати рекламного бізнесу дозволяють фінансувати ці витрати. Ринок сприйняв таку стратегію позитивно.
Tesla і xAI Ілона Маска обрали інший підхід. Компанія планує витратити близько $20 млрд на ШІ, автономне водіння та робототехніку, а також додатково інвестувати в xAI. Маск публічно заявляє про необхідність власної напівпровідникової інфраструктури, що підкреслює його ставку на повний контроль над ланцюгом — від моделей до обчислень.
Для обох стратегій світові моделі є не кінцевим продуктом, а середовищем навчання, без якого подальший розвиток автономних систем уповільнюється або стає занадто ризикованим.
Для ринку світові моделі — це не окремий продукт і не новий сегмент споживчого ШІ. Інвестори розглядають їх як інфраструктурний шар, який визначатиме конкурентоспроможність компаній у наступному циклі розвитку галузі.
Йдеться про довгострокову ставку. Компанії, що першими навчать ШІ працювати з простором, рухом і причинно-наслідковими зв’язками, отримають перевагу у всіх напрямах, пов’язаних з автономією — від робототехніки до промислових застосувань і транспорту. Саме тому ринок сьогодні готовий миритися з різким зростанням капітальних витрат і відсутністю швидкої віддачі.
Реакція інвесторів на плани Meta показова. Попри масштабні інвестиції в ШІ, акції компанії зросли після звітності — ринок повірив, що базовий бізнес здатен профінансувати ці витрати без втрати стійкості. У цьому випадку світові моделі сприймаються як розширення наявної платформи, а не як ризикований експеримент.
Ставка Маска несе інший профіль ризику. Інвестори Tesla фактично фінансують не лише розробку ШІ, а й спробу вертикальної інтеграції — від моделей до чипів. Така стратегія дорожча і складніша, але у разі успіху дає компанії повний контроль над ключовими компонентами автономних систем.
У підсумку ринок робить не ставку на конкретну технологію, а на підхід. Інвестори оцінюють, чи здатна компанія витримати довгий інвестиційний цикл і чи має вона бізнес, який може фінансувати розвиток світових моделей без тиску на прибутковість у короткостроковій перспективі.