OpenAI e Anthropic intensificano la corsa alla codifica dell'IA con GPT-5.3 Codex e Claude Opus 4.6.

OpenAI e Anthropic intensificano la corsa alla codifica dell'IA con GPT-5.3 Codex e Claude Opus 4.6.
OpenAI e Anthropic hanno lanciato GPT-5.3 Codex e Claude Opus 4.6.

Il 5 febbraio 2026 l'industria dell'intelligenza artificiale ha varcato una soglia importante: OpenAI e Anthropic hanno rilasciato i loro ultimi modelli di codifica nello stesso giorno.

Questo articolo è stato tradotto dall'originale. Leggi la versione originale del nostro corrispondente qui.

OpenAI ha presentato GPT-5.3 Codex, mentre Anthropic ha lanciato Claude Opus 4.6, segnando quello che molti sviluppatori vedono come l'inizio di una nuova fase nella creazione di software guidati dall'intelligenza artificiale. Piuttosto che concentrarsi su un più rapido completamento del codice, entrambi i sistemi mirano ad agire come agenti semi-autonomi in grado di gestire flussi di lavoro complessi e in più fasi.

OpenAI ha posizionato Codex come qualcosa di più di un aiuto agli sviluppatori. L'azienda lo ha descritto come un agente specializzato progettato per gestire l'intero ciclo di vita del lavoro professionale al computer, dal debug e dalla distribuzione delle applicazioni alla stesura della documentazione. Codex è stato persino utilizzato internamente per aiutare il debug dei propri processi di formazione e distribuzione, una pietra miliare che OpenAI ha inquadrato come sistemi di intelligenza artificiale sempre più capaci di contribuire al proprio sviluppo.

Punti di forza divergenti in termini di prestazioni e design

Codex si concentra sull'esecuzione. OpenAI ha ottenuto ottimi risultati nei benchmark di ingegneria del software, tra cui il 56,8% in SWE-Bench Pro e il 77,3% in Terminal-Bench 2.0, che misura la competenza della riga di comando. Per supportare queste capacità, l'azienda ha lanciato un'applicazione macOS Codex dedicata, che consente agli utenti di gestire più agenti AI che lavorano in parallelo.

Claude Opus 4.6 di Anthropic riflette una filosofia diversa. Costruito per ragionamenti complessi e lavoro collaborativo, la sua caratteristica principale è una finestra contestuale da 1 milione di token, attualmente in beta. Questa capacità consente al modello di elaborare intere basi di codice o documenti estesi senza perdere il contesto. Anthropic ha anche introdotto i team di agenti in Claude Code, consentendo a più agenti AI di coordinarsi su componenti separati di un progetto, come le attività di frontend, backend e database.

I risultati dei benchmark evidenziano punti di forza divergenti

Nei benchmark incentrati sul ragionamento e sulla sintesi delle informazioni, Opus 4.6 ha primeggiato in test come GDPval-AA e BrowseComp. Mentre il punteggio di Terminal-Bench 2.0, pari al 65,4%, è inferiore a quello di Codex, Anthropic ha riferito che la richiesta mirata ha prodotto un risultato dell'81,42% su SWE-Bench Verified, evidenziando la sua adattabilità.

Quando le aziende valutano questi strumenti, la scelta può dipendere dalla priorità data all'automazione pura o alla collaborazione analitica profonda. In ogni caso, la rapida evoluzione dell'IA basata su agenti suggerisce che i team di software lavoreranno presto a fianco di controparti digitali sempre più autonome.

OpenAI sta segnalando l'intenzione di lanciare il suo primo dispositivo hardware nella seconda metà del 2026, posizionando i "dispositivi" come un obiettivo strategico chiave per l'azienda. Parlando al World Economic Forum, i dirigenti hanno detto che il prodotto, sviluppato in collaborazione con l'ex designer di Apple Jony Ive, mira a incorporare l'IA più profondamente negli strumenti di uso quotidiano.

Questo materiale può contenere opinioni di terze parti, nessuno dei dati e delle informazioni su questa pagina web costituisce consulenza sugli investimenti secondo il nostro Disclaimer. Sebbene aderiamo a una rigorosa Integrità Editoriale, questo post può contenere riferimenti a prodotti dei nostri partner.