OpenAI y Anthropic intensifican la carrera por la codificación de IA con GPT-5.3 Codex y Claude Opus 4.6.
La industria de la inteligencia artificial cruzó un notable umbral el 5 de febrero de 2026, cuando OpenAI y Anthropic lanzaron sus últimos modelos de codificación insignia el mismo día.
Este artículo ha sido traducido del original. Lea la versión original de nuestro corresponsal aquí.
OpenAI presentó GPT-5.3 Codex, mientras que Anthropic lanzó Claude Opus 4.6, marcando lo que muchos desarrolladores ven como el inicio de una nueva fase en la creación de software basado en IA. En lugar de centrarse en acelerar la finalización del código, ambos sistemas pretenden actuar como agentes semiautónomos capaces de gestionar flujos de trabajo complejos de varios pasos.
OpenAI presenta Codex como algo más que una ayuda para desarrolladores. La empresa lo describió como un agente especializado diseñado para gestionar el ciclo de vida completo del trabajo informático profesional, desde la depuración y el despliegue de aplicaciones hasta la redacción de documentación. Codex se utilizó incluso internamente para ayudar a depurar sus propios procesos de formación y despliegue, un hito que OpenAI enmarcó en la idea de que los sistemas de IA son cada vez más capaces de contribuir a su propio desarrollo.
Puntos fuertes divergentes en rendimiento y diseño
Codex hace hincapié en la ejecución. OpenAI obtuvo buenos resultados en las pruebas comparativas de ingeniería de software, incluido un 56,8% en SWE-Bench Pro y un 77,3% en Terminal-Bench 2.0, que mide el dominio de la línea de comandos. Para respaldar estas capacidades, la empresa ha lanzado una aplicación dedicada a macOS Codex, que permite a los usuarios gestionar varios agentes de IA que trabajan en paralelo.
Claude Opus 4.6 de Anthropic refleja una filosofía diferente. Creado para el razonamiento complejo y el trabajo colaborativo, su característica definitoria es una ventana contextual de un millón de tokens, actualmente en fase beta. Esa capacidad permite al modelo procesar bases de código enteras o documentos extensos sin perder el contexto. Anthropic también introdujo los equipos de agentes en Claude Code, que permiten a varios agentes de IA coordinarse en componentes separados de un proyecto, como tareas de frontend, backend y base de datos.
Los resultados de las pruebas ponen de manifiesto puntos fuertes divergentes
En las pruebas comparativas centradas en el razonamiento y la síntesis de información, Opus 4.6 lideró pruebas como GDPval-AA y BrowseComp. Mientras que su puntuación en Terminal-Bench 2.0 (65,4%) fue inferior a la de Codex, Anthropic informó de que las instrucciones específicas produjeron un resultado del 81,42% en SWE-Bench Verified, lo que pone de manifiesto su adaptabilidad.
Cuando las empresas sopesan estas herramientas, la elección puede depender de si dan prioridad a la automatización bruta o a la colaboración analítica en profundidad. En cualquier caso, la rápida evolución de la IA basada en agentes sugiere que los equipos de software pronto trabajarán junto a homólogos digitales cada vez más autónomos.
OpenAI tiene previsto lanzar su primer dispositivo de hardware en la segunda mitad de 2026, lo que convierte a los "dispositivos" en un foco estratégico clave para la empresa. En su intervención en el Foro Económico Mundial, los directivos afirmaron que el producto, desarrollado en colaboración con el antiguo diseñador de Apple Jony Ive, pretende integrar la IA más profundamente en las herramientas cotidianas.
Últimas noticias sobre OpenAI
- Forex
- Crypto