OpenAI a Anthropic zintenzivňují závod v oblasti kódování AI s GPT-5.3 Codex a Claude Opus 4.6.
Odvětví umělé inteligence překročilo 5. února 2026 pozoruhodnou hranici, když společnosti OpenAI a Anthropic vydaly ve stejný den své nejnovější vlajkové modely kódování.
Tento článek byl přeložen z originálu. Přečtěte si původní verzi od našeho korespondenta zde.
Společnost OpenAI představila kód GPT-5.3, zatímco Anthropic uvedl Claude Opus 4.6, což mnozí vývojáři považují za začátek nové fáze tvorby softwaru založeného na umělé inteligenci. Oba systémy se spíše než na rychlejší dokončování kódu zaměřují na to, aby fungovaly jako poloautonomní agenti schopní řídit složité, vícekrokové pracovní postupy.
Společnost OpenAI představila Codex jako více než jen pomůcku pro vývojáře. Společnost jej popsala jako specializovaného agenta určeného ke zvládnutí celého životního cyklu profesionální práce s počítačem, od ladění a nasazování aplikací až po psaní dokumentace. Codex byl dokonce interně používán k pomoci při ladění vlastních procesů školení a nasazování, což OpenAI zarámovala jako milník, kdy jsou systémy umělé inteligence stále více schopny přispívat k vlastnímu vývoji.
Rozdílné silné stránky v oblasti výkonu a designu
Codex klade důraz na výkon. OpenAI vykázala dobré výsledky v benchmarcích softwarového inženýrství, včetně 56,8 % v testu SWE-Bench Pro a 77,3 % v testu Terminal-Bench 2.0, který měří zdatnost v příkazovém řádku. Na podporu těchto schopností společnost spustila speciální aplikaci pro macOS Codex, která uživatelům umožňuje spravovat více paralelně pracujících agentů AI.
Claude Opus 4.6 společnosti Anthropic odráží jinou filozofii. Je vytvořen pro komplexní uvažování a spolupráci a jeho určující funkcí je kontextové okno s 1 milionem znaků, které je v současné době ve fázi beta. Tato kapacita umožňuje modelu zpracovávat celé databáze kódů nebo rozsáhlé dokumenty bez ztráty kontextu. Anthropic také představil v Claude Code týmy agentů, které umožňují více agentům AI koordinovat práci na samostatných součástech projektu, jako jsou úlohy frontendu, backendu a databáze.
Výsledky srovnávacích testů zdůrazňují rozdílné silné stránky
V benchmarcích zaměřených na uvažování a syntézu informací vedl Opus 4.6 v testech jako GDPval-AA a BrowseComp. Zatímco jeho výsledek v testu Terminal-Bench 2.0 ve výši 65,4 % zaostal za výsledkem v testu Codex, v testu SWE-Bench Verified dosáhl podle společnosti Anthropic díky cílenému zadávání podnětů výsledku 81,42 %, což podtrhuje jeho přizpůsobivost.
Při zvažování těchto nástrojů může volba záviset na tom, zda podniky upřednostní hrubou automatizaci, nebo hlubokou analytickou spolupráci. Ať tak či onak, rychlý vývoj umělé inteligence založené na agentech naznačuje, že softwarové týmy budou brzy pracovat po boku stále autonomnějších digitálních protějšků.
Společnost OpenAI signalizuje plány na uvedení svého prvního hardwarového zařízení v druhé polovině roku 2026, čímž staví "zařízení" do pozice klíčového strategického zaměření společnosti. V projevu na Světovém ekonomickém fóru vedoucí pracovníci uvedli, že cílem produktu, vyvinutého ve spolupráci s bývalým designérem společnosti Apple Jony Ivem, je hlouběji začlenit umělou inteligenci do každodenních nástrojů.
Nejnovější zprávy OpenAI
- Forex
- Crypto