Criadores de mundos: onde as gigantes da tecnologia estão investindo bilhões

Criadores de mundos: onde as gigantes da tecnologia estão investindo bilhões
IA que pode criar mundos: por que as empresas estão investindo em modelos mundiais

A inteligência artificial está indo além de textos e imagens - ela está aprendendo gradualmente a criar ambientes virtuais e a agir dentro deles. Essa abordagem é conhecida como modelos mundiais: sistemas que recriam o espaço, os objetos e as regras de interação, em que cada ação tem uma consequência. Esse paradigma pode se tornar a chave para a robótica, o transporte autônomo e os agentes complexos de IA, mas há um problema que atualmente está retardando o progresso.

Este artigo foi traduzido do original. Leia a versão original do nosso correspondente aqui.

A maioria dos modelos modernos é excelente na análise de dados e na geração de respostas, mas carece de uma "intuição" para o espaço e para as relações de causa e efeito. Eles podem descrever o que deve ser feito, mas muitas vezes não entendem o que acontecerá depois de uma ação: onde exatamente um objeto irá parar, o que irá colidir ou como o ambiente irá mudar.

Os modelos de mundo preenchem essa lacuna. Eles oferecem à IA um campo de treinamento onde as decisões podem ser testadas com segurança, as rotas podem ser planejadas, os erros podem ser evitados e os resultados podem ser previstos. Para a robótica, os veículos autônomos e os agentes de IA, isso não é um bônus - é um alicerce, a base sobre a qual se constrói um comportamento confiável no mundo real.

Como esses mundos são criados

Na prática, duas abordagens principais são usadas atualmente. A primeira é a simulação dinâmica em tempo real. Nesse caso, o ambiente não é armazenado antecipadamente. Ele é gerado quadro a quadro à medida que um usuário ou agente se move pelo espaço, muda de ponto de vista ou interage com objetos. O modelo prevê continuamente como o estado do ambiente deve mudar, levando em conta a física e o comportamento do objeto.

Essa abordagem oferece alta flexibilidade e permite que os ambientes sejam criados sem cenários rígidos e predefinidos. Ao mesmo tempo, requer recursos computacionais significativos, razão pela qual a estabilidade de tais simulações está atualmente limitada a apenas alguns minutos.

Esse é o caminho que o Google está seguindo com sua plataforma de pesquisa Genie 3, que cria ambientes 3D de curta duração, mas logicamente consistentes. Uma abordagem semelhante é usada pela Meta em sua plataforma Habitat 3, projetada para treinar agentes físicos de IA e robôs.

A segunda abordagem se concentra em ambientes persistentes e salvos. Aqui, o modelo converte texto, imagens ou vídeo em uma cena tridimensional completa com geometria, objetos digitais e metadados que descrevem processos físicos. Esse mundo pode ser salvo, importado para outros ambientes de software e reutilizado.

Essa direção está sendo desenvolvida pela World Labs sob a liderança de Fei-Fei Li. Seu modelo Marble tem como objetivo criar ambientes 3D portáteis adequados para tarefas de engenharia, científicas e de design, em que a estabilidade e a reprodutibilidade dos resultados são fundamentais.

Quem está investindo e por quê

O desenvolvimento de todos esses modelos exige um gasto de capital substancial, e isso já se reflete nas estratégias das principais empresas de tecnologia.

A Meta Platforms planeja aumentar os investimentos de capital para US$ 135 bilhões, apostando na IA como a infraestrutura principal de seus futuros produtos. Depois de reestruturar sua divisão de IA, a empresa está preparando novos modelos e plataformas, enquanto o forte desempenho financeiro em seu negócio de publicidade permite que ela financie esses investimentos. O mercado respondeu positivamente a essa estratégia.

A Tesla e a xAI de Elon Musk optaram por uma abordagem diferente. A empresa planeja gastar cerca de US$ 20 bilhões em IA, direção autônoma e robótica, com investimentos adicionais em xAI. Musk enfatizou publicamente a necessidade de uma infraestrutura proprietária de semicondutores, ressaltando sua aposta no controle total de toda a pilha - dos modelos à computação.

Para ambas as estratégias, os modelos mundiais não são um produto final, mas um ambiente de treinamento sem o qual o progresso dos sistemas autônomos fica mais lento ou se torna muito arriscado.

Como os investidores veem isso

Para o mercado, os modelos mundiais não são um produto autônomo nem um novo segmento de IA para o consumidor. Os investidores os veem como uma camada de infraestrutura que determinará a competitividade das empresas no próximo ciclo de desenvolvimento do setor.

Essa é uma aposta de longo prazo. As empresas que forem as primeiras a ensinar a IA a trabalhar com espaço, movimento e relações de causa e efeito obterão uma vantagem em todos os campos relacionados à autonomia - da robótica às aplicações industriais e ao transporte. É por isso que o mercado atual está disposto a tolerar aumentos acentuados nas despesas de capital e a ausência de retornos rápidos.

A reação dos investidores aos planos da Meta é reveladora. Apesar dos investimentos maciços em IA, as ações da empresa subiram após os lucros - os mercados acreditavam que o negócio principal poderia financiar esses custos sem perder a estabilidade. Nesse caso, os modelos mundiais são considerados uma extensão de uma plataforma existente em vez de um experimento arriscado.

A aposta de Musk tem um perfil de risco diferente. Os investidores da Tesla estão efetivamente financiando não apenas o desenvolvimento de IA, mas também uma tentativa de integração vertical - de modelos a chips. Essa estratégia é mais cara e mais complexa, mas, se for bem-sucedida, dará à empresa controle total sobre os principais componentes dos sistemas autônomos.

No final, o mercado não está apostando em uma tecnologia específica, mas em uma abordagem. Os investidores estão avaliando se uma empresa pode suportar um longo ciclo de investimento e se ela tem um negócio capaz de financiar o desenvolvimento de modelos mundiais sem pressionar a lucratividade de curto prazo.

Este material pode conter opiniões de terceiros, nenhum dos dados e informações nesta página constitui aconselhamento de investimento de acordo com o nosso Aviso Legal. Embora sigamos rigorosos Padrões Editoriais, este post pode conter referências a produtos de nossos parceiros.