트윗이 작성자에 의해 삭제되었습니다.
하지만 우리는 모든 것을 저장했습니다 🙂.
인공 지능은 텍스트와 이미지를 넘어 점차 가상 환경을 만들고 그 안에서 행동하는 방법을 학습하고 있습니다. 이러한 접근 방식을 세계 모델이라고 하는데, 모든 행동에 결과가 따르는 공간, 사물, 상호작용 규칙을 재현하는 시스템입니다. 이 패러다임은 로봇 공학, 자율 운송, 복잡한 AI 에이전트의 핵심이 될 수 있지만 현재 진전을 더디게 하는 문제가 있습니다.
이 기사는 원문을 번역한 것입니다. 당사 특파원이 작성한 원문은 여기에서 확인하실 수 있습니다.
대부분의 최신 모델은 데이터를 분석하고 응답을 생성하는 데는 탁월하지만 공간과 인과 관계에 대한 '직관'이 부족합니다. 무엇을 해야 하는지는 설명할 수 있지만, 물체가 정확히 어디로 향하는지, 무엇이 충돌하는지, 환경이 어떻게 변화하는지 등 작업 후에 어떤 일이 일어날지는 이해하지 못하는 경우가 많습니다.
월드 모델은 이러한 간극을 좁혀줍니다. 월드 모델은 의사 결정을 안전하게 테스트하고, 경로를 계획하고, 실수를 피하고, 결과를 예측할 수 있는 훈련의 장을 AI에 제공합니다. 로봇 공학, 자율 주행 차량, AI 에이전트의 경우 이는 보너스가 아니라 실제 세계에서 신뢰할 수 있는 동작을 구축하는 기반이 되는 토대입니다.
실제로 오늘날에는 두 가지 주요 접근 방식이 사용됩니다. 첫 번째는 실시간 동적 시뮬레이션입니다. 이 경우 환경은 미리 저장되지 않습니다. 사용자나 에이전트가 공간을 이동하거나 시점을 변경하거나 오브젝트와 상호 작용할 때 프레임 단위로 생성됩니다. 이 모델은 물리 및 오브젝트 동작을 고려하여 환경의 상태가 어떻게 변해야 하는지 지속적으로 예측합니다.
이 접근 방식은 높은 유연성을 제공하며 경직되고 미리 정의된 시나리오 없이도 환경을 만들 수 있습니다. 동시에 상당한 컴퓨팅 리소스가 필요하기 때문에 현재 이러한 시뮬레이션의 안정성은 단 몇 분으로 제한되어 있습니다.
Google은 짧지만 논리적으로 일관된 3D 환경을 생성하는 연구 플랫폼 Genie 3를 통해 이러한 문제를 해결하고 있습니다. Meta는 실제 AI 에이전트와 로봇을 훈련하기 위해 설계된 해비타트 3 플랫폼에서 유사한 접근 방식을 사용합니다.
두 번째 접근 방식은 지속적이고 저장된 환경에 중점을 둡니다. 여기서 모델은 텍스트, 이미지 또는 비디오를 지오메트리, 디지털 객체, 물리적 프로세스를 설명하는 메타데이터가 포함된 본격적인 3차원 장면으로 변환합니다. 이러한 월드는 저장하고 다른 소프트웨어 환경으로 가져와서 재사용할 수 있습니다.
이 방향은 페이 페이 리의 주도하에 월드 랩에서 개발 중입니다. 이들의 Marble 모델은 결과의 안정성과 재현성이 중요한 엔지니어링, 과학 및 디자인 작업에 적합한 휴대용 3D 환경을 만드는 것을 목표로 합니다.
이 모든 모델을 개발하려면 상당한 자본 지출이 필요하며, 이는 이미 주요 기술 기업의 전략에 반영되어 있습니다.
메타플랫폼은 미래 제품의 핵심 인프라로 AI에 투자하면서 자본 투자를 1,350억 달러로 늘릴 계획입니다. AI 사업부를 재편한 후 새로운 모델과 플랫폼을 준비하고 있으며, 광고 사업의 견조한 재무 성과로 이러한 투자 자금을 마련할 수 있게 되었습니다. 시장은 이러한 전략에 긍정적인 반응을 보이고 있습니다.
테슬라와 엘론 머스크의 xAI는 다른 접근 방식을 선택했습니다. 테슬라는 AI, 자율 주행, 로봇 공학에 약 200억 달러를 투자할 계획이며, xAI에 대한 추가 투자도 계획하고 있습니다. 머스크는 모델에서 연산에 이르기까지 전체 스택을 완전히 제어할 수 있는 독점적인 반도체 인프라의 필요성을 공개적으로 강조해 왔습니다.
두 전략 모두에서 월드 모델은 최종 제품이 아니라 자율 시스템의 발전 속도가 느려지거나 너무 위험해질 수 있는 훈련 환경입니다.
시장에서 월드 모델은 독립형 제품도 아니고 새로운 소비자 AI 부문도 아닙니다. 투자자들은 이를 업계의 다음 개발 주기에서 기업의 경쟁력을 결정할 인프라 계층으로 보고 있습니다.
이는 장기적인 베팅입니다. AI에 공간, 동작, 인과 관계를 학습시키는 데 가장 먼저 성공한 기업은 로봇 공학에서 산업 애플리케이션, 운송에 이르기까지 모든 자율성 관련 분야에서 우위를 점하게 될 것입니다. 그렇기 때문에 오늘날 시장은 급격한 자본 지출 증가와 빠른 수익률의 부재를 기꺼이 용인하고 있습니다.
메타의 계획에 대한 투자자들의 반응은 이를 잘 말해줍니다. 대규모 AI 투자에도 불구하고 핵심 비즈니스가 안정성을 잃지 않고 이러한 비용을 조달 할 수 있다고 믿은 수익 시장 이후 회사의 주가는 상승했습니다. 이 경우 월드 모델은 위험한 실험이라기보다는 기존 플랫폼의 확장으로 간주됩니다.
머스크의 베팅은 다른 위험 프로필을 수반합니다. Tesla 투자자들은 AI 개발뿐만 아니라 모델에서 칩에 이르는 수직 통합 시도에 효과적으로 자금을 조달하고 있습니다. 이 전략은 더 비싸고 복잡하지만, 성공하면 자율 시스템의 핵심 구성 요소를 완전히 통제할 수 있게 됩니다.
결국 시장은 특정 기술에 베팅하는 것이 아니라 접근 방식에 베팅하고 있습니다. 투자자들은 기업이 긴 투자 주기를 견딜 수 있는지, 단기 수익성에 대한 압박 없이 세계 모델 개발에 자금을 지원할 수 있는 비즈니스 역량을 갖추고 있는지를 평가하고 있습니다.