OpenAI og Anthropic intensiverer AI-kodningskapløbet med GPT-5.3 Codex og Claude Opus 4.6.
Industrien for kunstig intelligens krydsede en bemærkelsesværdig tærskel den 5. februar 2026, da OpenAI og Anthropic udgav deres seneste flagskibsmodeller for kodning på samme dag.
Denne artikel er oversat fra originalen. Læs den oprindelige version af vores korrespondent her.
OpenAI introducerede GPT-5.3 Codex, mens Anthropic lancerede Claude Opus 4.6, hvilket markerer, hvad mange udviklere ser som starten på en ny fase i AI-drevet softwarekreation. I stedet for at fokusere på hurtigere kodefærdiggørelse sigter begge systemer mod at fungere som semi-autonome agenter, der er i stand til at styre komplekse workflows i flere trin.
OpenAI positionerede Codex som mere end en hjælp til udviklere. Virksomheden beskrev det som en specialiseret agent, der er designet til at håndtere hele livscyklussen for professionelt computerarbejde, fra fejlfinding og implementering af applikationer til skrivning af dokumentation. Codex blev endda brugt internt til at hjælpe med at debugge sine egne trænings- og implementeringsprocesser, en milepæl, som OpenAI indrammede som AI-systemer, der i stigende grad er i stand til at bidrage til deres egen udvikling.
Forskellige styrker inden for performance og design
Codex lægger vægt på udførelse. OpenAI rapporterede stærke resultater på software engineering benchmarks, herunder 56,8 % på SWE-Bench Pro og 77,3 % på Terminal-Bench 2.0, som måler kommandolinjefærdigheder. For at understøtte disse evner lancerede virksomheden en dedikeret macOS Codex-app, som giver brugerne mulighed for at administrere flere AI-agenter, der arbejder parallelt.
Anthropics Claude Opus 4.6 afspejler en anden filosofi. Den er bygget til komplekse ræsonnementer og samarbejde, og dens vigtigste funktion er et kontekstvindue med 1 million symboler, som i øjeblikket er i beta. Denne kapacitet gør det muligt for modellen at behandle hele kodebaser eller omfattende dokumenter uden at miste konteksten. Anthropic introducerede også Agent Teams i Claude Code, som gør det muligt for flere AI-agenter at koordinere separate komponenter i et projekt, f.eks. frontend-, backend- og databaseopgaver.
Benchmark-resultater fremhæver forskellige styrker
I benchmarks med fokus på ræsonnement og informationssyntese var Opus 4.6 bedst i tests som GDPval-AA og BrowseComp. Mens dens Terminal-Bench 2.0-score på 65,4 % lå bag Codex, rapporterede Anthropic, at målrettet prompting gav et resultat på 81,42 % i SWE-Bench Verified, hvilket understreger dens tilpasningsevne.
Når virksomheder afvejer disse værktøjer, kan valget afhænge af, om de prioriterer rå automatisering eller dybt analytisk samarbejde. Uanset hvad tyder den hurtige udvikling af agentbaseret AI på, at softwareteams snart vil arbejde sammen med stadig mere autonome digitale modparter.
OpenAI signalerer planer om at lancere sin første hardwareenhed i anden halvdel af 2026 og placerer "enheder" som et vigtigt strategisk fokus for virksomheden. På World Economic Forum sagde lederne, at produktet, der er udviklet i samarbejde med den tidligere Apple-designer Jony Ive, har til formål at integrere AI dybere i hverdagens værktøjer.
Seneste OpenAI nyheder
- Forex
- Crypto