El tuit fue eliminado por el autor.
Pero guardamos todo 🙂.
La inteligencia artificial va más allá del texto y las imágenes: poco a poco aprende a crear entornos virtuales y a actuar en ellos. Este enfoque se conoce como modelos del mundo: sistemas que recrean el espacio, los objetos y las reglas de interacción, donde cada acción tiene una consecuencia. Este paradigma podría convertirse en la clave de la robótica, el transporte autónomo y los agentes complejos de inteligencia artificial, pero hay un problema que está frenando el progreso.
Este artículo ha sido traducido del original. Lea la versión original de nuestro corresponsal aquí.
La mayoría de los modelos modernos son excelentes para analizar datos y generar respuestas, pero carecen de "intuición" para el espacio y las relaciones causa-efecto. Pueden describir lo que hay que hacer, pero a menudo no entienden lo que ocurrirá después de una acción: dónde acabará exactamente un objeto, qué chocará o cómo cambiará el entorno.
Los modelos de mundo colman esta laguna. Proporcionan a la IA un campo de entrenamiento en el que se pueden probar decisiones con seguridad, planificar rutas, evitar errores y predecir resultados. Para la robótica, los vehículos autónomos y los agentes de IA, esto no es un extra: es un fundamento, la base sobre la que se construye un comportamiento fiable en el mundo real.
En la práctica, hoy en día se utilizan dos enfoques principales. El primero es la simulación dinámica en tiempo real. En este caso, el entorno no se almacena de antemano. Se genera fotograma a fotograma a medida que un usuario o agente se desplaza por el espacio, cambia de punto de vista o interactúa con los objetos. El modelo predice continuamente cómo debe cambiar el estado del entorno, teniendo en cuenta la física y el comportamiento de los objetos.
Este planteamiento ofrece una gran flexibilidad y permite crear entornos sin escenarios rígidos y predefinidos. Al mismo tiempo, requiere importantes recursos informáticos, por lo que la estabilidad de estas simulaciones se limita actualmente a unos pocos minutos.
Este es el camino que sigue Google con su plataforma de investigación Genie 3, que crea entornos 3D de corta duración pero lógicamente coherentes. Meta utiliza un enfoque similar en su plataforma Habitat 3, diseñada para entrenar agentes y robots físicos de IA.
El segundo enfoque se centra en entornos persistentes y guardados. En este caso, el modelo convierte texto, imágenes o vídeo en una escena tridimensional completa con geometría, objetos digitales y metadatos que describen procesos físicos. Un mundo así puede guardarse, importarse a otros entornos de software y reutilizarse.
Esta dirección está siendo desarrollada por World Labs bajo la dirección de Fei-Fei Li. Su modelo Marble pretende crear entornos 3D portátiles adecuados para tareas de ingeniería, ciencia y diseño, en las que la estabilidad y la reproducibilidad de los resultados son fundamentales.
El desarrollo de todos estos modelos requiere importantes inversiones de capital, lo que ya se refleja en las estrategias de las principales empresas tecnológicas.
Meta Platforms tiene previsto aumentar sus inversiones de capital hasta los 135.000 millones de dólares, apostando por la IA como infraestructura central de sus futuros productos. Tras reestructurar su división de IA, la empresa está preparando nuevos modelos y plataformas, mientras que los buenos resultados financieros de su negocio publicitario le permiten financiar estas inversiones. El mercado ha respondido positivamente a esta estrategia.
Tesla y la xAI de Elon Musk han optado por un enfoque diferente. La empresa planea gastar unos 20.000 millones de dólares en IA, conducción autónoma y robótica, con inversiones adicionales en xAI. Musk ha insistido públicamente en la necesidad de una infraestructura de semiconductores propia, subrayando su apuesta por el control total de toda la pila, desde los modelos hasta la computación.
Para ambas estrategias, los modelos mundiales no son un producto final, sino un entorno de entrenamiento sin el cual los avances en sistemas autónomos se ralentizan o resultan demasiado arriesgados.
Para el mercado, los modelos mundiales no son ni un producto independiente ni un nuevo segmento de consumo de IA. Los inversores los ven como una capa de infraestructura que determinará la competitividad de las empresas en el próximo ciclo de desarrollo de la industria.
Se trata de una apuesta a largo plazo. Las empresas que sean las primeras en enseñar a la IA a trabajar con el espacio, el movimiento y las relaciones causa-efecto obtendrán una ventaja en todos los campos relacionados con la autonomía, desde la robótica hasta las aplicaciones industriales y el transporte. Por eso el mercado está dispuesto hoy a tolerar fuertes aumentos de los gastos de capital y la ausencia de rendimientos rápidos.
La reacción de los inversores a los planes de Meta es reveladora. A pesar de las enormes inversiones en IA, las acciones de la empresa subieron tras los resultados: los mercados creían que la actividad principal podía financiar estos costes sin perder estabilidad. En este caso, los modelos mundiales se consideran una extensión de una plataforma existente más que un experimento arriesgado.
La apuesta de Musk conlleva un perfil de riesgo diferente. Los inversores de Tesla están financiando de hecho no sólo el desarrollo de la IA, sino también un intento de integración vertical: de los modelos a los chips. Esta estrategia es más cara y compleja, pero si tiene éxito, dará a la empresa el control total sobre los componentes clave de los sistemas autónomos.
Al final, el mercado no apuesta por una tecnología concreta, sino por un planteamiento. Los inversores están valorando si una empresa puede soportar un largo ciclo de inversión y si tiene un negocio capaz de financiar el desarrollo de modelos mundiales sin presionar la rentabilidad a corto plazo.