Твит был удалён автором.
Но мы всё сохранили 🙂.
Искусственный интеллект выходит за пределы текстов и картинок — он постепенно учится создавать виртуальные среды и действовать в них. Это называют world models: системы, которые воспроизводят пространство, объекты и правила взаимодействия, где каждое действие имеет следствие. Именно этот подход может стать ключом к роботам, автономному транспорту и сложным ИИ-агентам — но есть нюанс, который сейчас тормозит прогресс.
Эта статья была переведена с оригинала. Читайте оригинальную версию от нашего корреспондента здесь.
Большинство современных моделей прекрасно анализируют данные и генерируют ответы, но им не хватает «интуиции» о пространстве и причинно-следственных связях. Они могут описать, что нужно сделать, но часто не понимают, что произойдет после действия: где именно окажется объект, что столкнется, что изменится в среде.
World models закрывают этот пробел: они дают ИИ тренировочную площадку, где можно безопасно проверять решения, учиться планировать маршрут, избегать ошибок и прогнозировать последствия. Для робототехники, автономного транспорта и «агентных» систем это не бонус, а фундамент — то, на чем вообще строится надежное поведение в реальном мире.
На практике сегодня применяются два подхода. Первый — динамическое моделирование в реальном времени. В этом случае среда не сохраняется заранее. Она генерируется покадрово по мере того, как пользователь или агент движется по пространству, меняет направление обзора или взаимодействует с объектами. Модель постоянно прогнозирует, как должно измениться состояние среды с учетом физики и поведения объектов.
Этот подход обеспечивает высокую гибкость и позволяет создавать среды без жестко заданных сценариев. В то же время он требует значительных вычислительных ресурсов, поэтому стабильность таких симуляций пока ограничена несколькими минутами.
Именно по этому пути идет Google со своей исследовательской платформой Genie 3, которая создает кратковременные, но логически согласованные 3D-среды. Аналогичный подход использует Meta в платформе Habitat 3, ориентированной на тренировку физических ИИ-агентов и роботов.
Второй подход — создание устойчивых, сохраненных сред. Здесь модель преобразует текст, изображение или видео в полноценную трехмерную сцену с геометрией, цифровыми объектами и метаданными физических процессов. Такой мир можно сохранить, импортировать в другие программные среды и использовать повторно.
Это направление развивает World Labs под руководством Фэй-Фэй Ли. Их модель Marble ориентирована на создание переносных 3D-сред, пригодных для инженерных, научных и дизайнерских задач, где важна стабильность и воспроизводимость результатов.
Развитие всех этих моделей требует значительных капитальных затрат, и это уже отражается в стратегиях крупных технологических компаний.
Meta Platforms планирует увеличить капитальные инвестиции до $135 млрд, делая ставку на ИИ как ключевую инфраструктуру будущих продуктов. После реструктуризации ИИ-направления компания готовит новые модели и платформы, а сильные финансовые результаты рекламного бизнеса позволяют финансировать эти расходы. Рынок воспринял такую стратегию положительно.
Tesla и xAI Илона Маска выбрали другой подход. Компания планирует потратить около $20 млрд на ИИ, автономное вождение и робототехнику, а также дополнительно инвестировать в xAI. Маск публично заявляет о необходимости собственной полупроводниковой инфраструктуры, что подчеркивает его ставку на полный контроль над цепочкой — от моделей до вычислений.
Для обеих стратегий мировые модели являются не конечным продуктом, а средой обучения, без которой дальнейшее развитие автономных систем замедляется или становится слишком рискованным.
Для рынка модели миров — это не отдельный продукт и не новый сегмент потребительского ИИ. Инвесторы рассматривают их как инфраструктурный слой, который будет определять конкурентоспособность компаний в следующем цикле развития отрасли.
Речь идет о долгосрочной ставке. Компании, которые первыми научат ИИ работать с пространством, движением и причинно-следственными связями, получат преимущество во всех направлениях, связанных с автономией — от робототехники до промышленных приложений и транспорта. Именно поэтому рынок сегодня готов мириться с резким ростом капитальных затрат и отсутствием быстрой отдачи.
Реакция инвесторов на планы Meta показательна. Несмотря на масштабные инвестиции в ИИ, акции компании выросли после отчетности — рынок поверил, что базовый бизнес способен профинансировать эти расходы без потери устойчивости. В этом случае мировые модели воспринимаются как расширение существующей платформы, а не как рискованный эксперимент.
Ставка Маска несет другой профиль риска. Инвесторы Tesla фактически финансируют не только разработку ИИ, но и попытку вертикальной интеграции — от моделей до чипов. Такая стратегия дороже и сложнее, но в случае успеха дает компании полный контроль над ключевыми компонентами автономных систем.
В конечном итоге рынок делает ставку не на конкретную технологию, а на подход. Инвесторы оценивают, способна ли компания выдержать длительный инвестиционный цикл и имеет ли она бизнес, который может финансировать развитие мировых моделей без давления на прибыльность в краткосрочной перспективе.