OpenAI et Anthropic intensifient la course au codage IA avec GPT-5.3 Codex et Claude Opus 4.6.

OpenAI et Anthropic intensifient la course au codage IA avec GPT-5.3 Codex et Claude Opus 4.6.
OpenAI et Anthropic ont lancé GPT-5.3 Codex et Claude Opus 4.6.

L'industrie de l'intelligence artificielle a franchi un seuil important le 5 février 2026, lorsque OpenAI et Anthropic ont publié le même jour leurs derniers modèles de codage phares.

Cet article a été traduit de l'original. Lisez la version originale de notre correspondant ici.

OpenAI a présenté le Codex GPT-5.3, tandis qu'Anthropic a lancé Claude Opus 4.6, marquant ce que de nombreux développeurs considèrent comme le début d'une nouvelle phase dans la création de logiciels basés sur l'IA. Plutôt que de se concentrer sur l'achèvement rapide du code, les deux systèmes visent à agir comme des agents semi-autonomes capables de gérer des flux de travail complexes en plusieurs étapes.

OpenAI a positionné Codex comme étant plus qu'une aide au développement. L'entreprise l'a décrit comme un agent spécialisé conçu pour gérer le cycle de vie complet du travail informatique professionnel, depuis le débogage et le déploiement d'applications jusqu'à la rédaction de documentation. Codex a même été utilisé en interne pour aider à déboguer ses propres processus de formation et de déploiement, une étape importante pour l'OpenAI qui considère que les systèmes d'IA sont de plus en plus capables de contribuer à leur propre développement.

Des forces divergentes en matière de performance et de conception

Codex met l'accent sur l'exécution. OpenAI a obtenu d'excellents résultats aux tests d'ingénierie logicielle, notamment 56,8 % à SWE-Bench Pro et 77,3 % à Terminal-Bench 2.0, qui mesure la maîtrise de la ligne de commande. Pour soutenir ces capacités, l'entreprise a lancé une application Codex dédiée à macOS, permettant aux utilisateurs de gérer plusieurs agents d'IA travaillant en parallèle.

Claude Opus 4.6 d'Anthropic reflète une philosophie différente. Conçu pour le raisonnement complexe et le travail collaboratif, sa caractéristique principale est une fenêtre contextuelle d'un million de mots-clés, actuellement en version bêta. Cette capacité permet au modèle de traiter des bases de code entières ou des documents volumineux sans perdre le contexte. Anthropic a également introduit les équipes d'agents dans Claude Code, permettant à plusieurs agents d'IA de se coordonner sur des composants distincts d'un projet, tels que les tâches frontales, dorsales et de base de données.

Les résultats des tests mettent en évidence des forces divergentes

Sur les benchmarks axés sur le raisonnement et la synthèse d'informations, Opus 4.6 a mené des tests tels que GDPval-AA et BrowseComp. Alors que son score de 65,4 % au Terminal-Bench 2.0 est inférieur à celui de Codex, Anthropic a indiqué qu'une incitation ciblée a produit un résultat de 81,42 % au SWE-Bench Verified, soulignant ainsi sa capacité d'adaptation.

Lorsque les entreprises évaluent ces outils, le choix peut dépendre de la priorité qu'elles accordent à l'automatisation brute ou à la collaboration analytique approfondie. Quoi qu'il en soit, l'évolution rapide de l'IA basée sur les agents suggère que les équipes logicielles travailleront bientôt aux côtés d'homologues numériques de plus en plus autonomes.

OpenAI prévoit de lancer son premier appareil matériel au cours du second semestre 2026, faisant des "appareils" un axe stratégique clé pour l'entreprise. S'exprimant lors du Forum économique mondial, les dirigeants ont déclaré que le produit, développé en collaboration avec l'ancien designer d'Apple Jony Ive, vise à intégrer plus profondément l'IA dans les outils de tous les jours.

Ce matériel peut contenir des opinions de tiers, aucune des données et informations sur cette page web ne constitue un conseil en investissement selon notre Avertissement. Bien que nous respections une stricte Intégrité Éditoriale, ce post peut contenir des références à des produits de nos partenaires.