OpenAI en Anthropic intensiveren de race om AI-codering met GPT-5.3 Codex en Claude Opus 4.6.

OpenAI en Anthropic intensiveren de race om AI-codering met GPT-5.3 Codex en Claude Opus 4.6.
OpenAI en Anthropic hebben GPT-5.3 Codex en Claude Opus 4.6 gelanceerd.

De kunstmatige intelligentie-industrie overschreed een opmerkelijke drempel op 5 februari 2026, toen OpenAI en Anthropic hun nieuwste coderingsmodellen op dezelfde dag uitbrachten.

Dit artikel is vertaald vanuit het origineel. Lees de originele versie van onze correspondent hier.

OpenAI introduceerde GPT-5.3 Codex, terwijl Anthropic Claude Opus 4.6 lanceerde. Dit markeert wat veel ontwikkelaars zien als het begin van een nieuwe fase in AI-gedreven softwarecreatie. In plaats van zich te richten op het sneller voltooien van code, willen beide systemen fungeren als semi-autonome agenten die complexe, uit meerdere stappen bestaande workflows kunnen beheren.

OpenAI positioneerde Codex als meer dan een hulpmiddel voor ontwikkelaars. Het bedrijf beschreef het als een gespecialiseerde agent die is ontworpen om de volledige levenscyclus van professioneel computerwerk af te handelen, van het debuggen en implementeren van applicaties tot het schrijven van documentatie. Codex werd zelfs intern gebruikt om te helpen bij het debuggen van de eigen trainings- en implementatieprocessen, een mijlpaal die OpenAI ziet als AI-systemen die steeds beter in staat zijn om bij te dragen aan hun eigen ontwikkeling.

Uiteenlopende sterke punten in prestaties en ontwerp

De nadruk van Codex ligt op uitvoering. OpenAI rapporteerde sterke resultaten op software engineering benchmarks, waaronder 56,8% op SWE-Bench Pro en 77,3% op Terminal-Bench 2.0, dat commandoregelvaardigheid meet. Ter ondersteuning van deze mogelijkheden heeft het bedrijf een speciale macOS Codex-app gelanceerd, waarmee gebruikers meerdere AI-agenten kunnen beheren die parallel werken.

Anthropic's Claude Opus 4.6 weerspiegelt een andere filosofie. Gebouwd voor complexe redeneringen en samenwerking, is de belangrijkste functie een contextvenster met 1 miljoen tokens, momenteel in bèta. Deze capaciteit stelt het model in staat om hele codebases of uitgebreide documenten te verwerken zonder de context te verliezen. Anthropic introduceerde ook Agent Teams in Claude Code, waarmee meerdere AI-agenten kunnen samenwerken aan afzonderlijke onderdelen van een project, zoals frontend-, backend- en databasetaken.

Benchmarkresultaten tonen uiteenlopende sterke punten

Bij benchmarks gericht op redeneren en informatiesynthese was Opus 4.6 de beste in tests zoals GDPval-AA en BrowseComp. Terwijl de Terminal-Bench 2.0 score van 65,4% achterbleef bij Codex, rapporteerde Anthropic dat gerichte prompting een resultaat van 81,42% opleverde op SWE-Bench Verified, wat het aanpassingsvermogen benadrukt.

Als bedrijven deze tools tegen elkaar afwegen, kan de keuze afhangen van de vraag of ze prioriteit geven aan ruwe automatisering of aan diepgaande analytische samenwerking. Hoe dan ook, de snelle evolutie van agentgebaseerde AI suggereert dat softwareteams binnenkort zullen samenwerken met steeds autonomer wordende digitale tegenhangers.

OpenAI kondigt plannen aan om zijn eerste hardwareapparaat in de tweede helft van 2026 te lanceren en positioneert "apparaten" als een belangrijke strategische focus voor het bedrijf. Tijdens een toespraak op het World Economic Forum zeiden leidinggevenden dat het product, dat is ontwikkeld in samenwerking met voormalig Apple-ontwerper Jony Ive, erop is gericht om AI dieper in alledaagse hulpmiddelen te verankeren.

Dit materiaal kan meningen van derden bevatten, geen van de gegevens en informatie op deze webpagina vormt beleggingsadvies volgens onze Disclaimer. Hoewel we ons houden aan strikte Redactionele Integriteit, kan deze post verwijzingen bevatten naar producten van onze partners.