Az OpenAI és az Anthropic a GPT-5.3 Codex és a Claude Opus 4.6 segítségével fokozza az AI kódolási versenyt.

Az OpenAI és az Anthropic a GPT-5.3 Codex és a Claude Opus 4.6 segítségével fokozza az AI kódolási versenyt.
Az OpenAI és az Anthropic elindította a GPT-5.3 Codex és a Claude Opus 4.6 programot.

A mesterséges intelligencia ipar 2026. február 5-én egy figyelemre méltó küszöböt lépett át, amikor az OpenAI és az Anthropic ugyanazon a napon adta ki legújabb zászlóshajó kódoló modelljeit.

Ezt a cikket az eredetiből fordítottuk. Olvassa el tudósítónk eredeti változatát itt.

Az OpenAI bemutatta a GPT-5.3 Codexet, míg az Anthropic a Claude Opus 4.6-ot, ami sok fejlesztő szerint az AI-vezérelt szoftverkészítés új szakaszának kezdetét jelenti. A gyorsabb kódkitöltés helyett mindkét rendszer célja, hogy félautonóm ágensként működjön, amely képes kezelni az összetett, többlépcsős munkafolyamatokat.

Az OpenAI a Codexet többnek pozícionálta, mint egy fejlesztői segédprogramot. A vállalat úgy jellemezte, mint egy olyan speciális ügynököt, amelyet a professzionális számítógépes munka teljes életciklusának kezelésére terveztek, az alkalmazások hibakeresésétől és telepítésétől a dokumentáció megírásáig. A Codexet még belsőleg is használták a saját képzési és telepítési folyamatainak hibakeresésére, ami az OpenAI szerint mérföldkő, mivel az AI-rendszerek egyre inkább képesek hozzájárulni saját fejlesztésükhöz.

Eltérő erősségek a teljesítmény és a tervezés terén

A Codex a végrehajtásra helyezi a hangsúlyt. Az OpenAI a szoftvermérnöki benchmarkokon erős eredményekről számolt be, többek között a SWE-Bench Pro-n 56,8%-os, a parancssori jártasságot mérő Terminal-Bench 2.0-n pedig 77,3%-os eredményt ért el. E képességek támogatására a vállalat elindított egy dedikált macOS Codex alkalmazást, amely lehetővé teszi a felhasználók számára több párhuzamosan dolgozó AI-ügynök kezelését.

Az Anthropic Claude Opus 4.6 más filozófiát tükröz. Az összetett gondolkodásra és kollaboratív munkára épített program meghatározó jellemzője a jelenleg béta-verzióban lévő, 1 millió kulcsszóval rendelkező kontextusablak. Ez a kapacitás lehetővé teszi a modell számára, hogy teljes kódbázisokat vagy kiterjedt dokumentumokat dolgozzon fel anélkül, hogy elveszítené a kontextust. Az Anthropic a Claude Code-ban bevezette az Agent Team-eket is, amelyek lehetővé teszik, hogy több AI-ügynök koordinálja a projekt különböző összetevőit, például a frontend, a backend és az adatbázis feladatokat.

A benchmark eredmények rávilágítanak az eltérő erősségekre

Az érvelésre és az információszintézisre összpontosító benchmarkokon az Opus 4.6 olyan teszteket vezetett, mint a GDPval-AA és a BrowseComp. Míg a Terminal-Bench 2.0 65,4%-os eredménye elmaradt a Codexétől, az Anthropic arról számolt be, hogy a célzott felszólítás 81,42%-os eredményt ért el a SWE-Bench Verified-en, ami kiemeli az alkalmazkodóképességét.

Ahogy a vállalkozások mérlegelik ezeket az eszközöket, a választás attól függhet, hogy a nyers automatizálást vagy a mély analitikai együttműködést helyezik-e előtérbe. Akárhogy is, az ágensalapú AI gyors fejlődése azt sugallja, hogy a szoftvercsapatok hamarosan egyre autonómabb digitális társaikkal fognak együtt dolgozni.

Az OpenAI jelzi, hogy 2026 második felében tervezi első hardvereszközének piacra dobását, ezzel az "eszközöket" a vállalat kulcsfontosságú stratégiai fókuszpontjaként pozícionálja. A Világgazdasági Fórumon felszólalva a vezetők elmondták, hogy a Jony Ive, az Apple korábbi dizájnerével, Jony Ive-val együttműködésben kifejlesztett termék célja, hogy a mesterséges intelligenciát mélyebben beágyazzák a mindennapi eszközökbe.

Ez az anyag harmadik felek véleményét tartalmazhatja, a weboldalon található adatok és információk egyike sem minősül befektetési tanácsnak a Jogi nyilatkozatunk szerint. Bár szigorú Szerkesztői Integritást követünk, ez a bejegyzés tartalmazhat hivatkozásokat partnereink termékeire.