OpenAI dan Anthropic memperketat persaingan pengembangan AI dengan GPT-5.3 Codex dan Claude Opus 4.6.

OpenAI dan Anthropic memperketat persaingan pengembangan AI dengan GPT-5.3 Codex dan Claude Opus 4.6.
OpenAI dan Anthropic telah meluncurkan GPT-5.3 Codex dan Claude Opus 4.6.

Industri kecerdasan buatan melewati ambang batas yang penting pada 5 Februari 2026, ketika OpenAI dan Anthropic merilis model pengkodean unggulan terbaru mereka pada hari yang sama.

Artikel ini diterjemahkan dari aslinya. Baca versi asli oleh koresponden kami di sini.

OpenAI memperkenalkan GPT-5.3 Codex, sementara Anthropic meluncurkan Claude Opus 4.6, menandai apa yang dilihat oleh banyak pengembang sebagai awal dari fase baru dalam pembuatan perangkat lunak berbasis AI. Alih-alih berfokus pada penyelesaian kode yang lebih cepat, kedua sistem ini bertujuan untuk bertindak sebagai agen semi-otonom yang mampu mengelola alur kerja multi-langkah yang kompleks.

OpenAI memposisikan Codex lebih dari sekadar alat bantu pengembang. Perusahaan menggambarkannya sebagai agen khusus yang dirancang untuk menangani siklus kerja komputer profesional secara penuh, mulai dari debugging dan penerapan aplikasi hingga penulisan dokumentasi. Codex bahkan digunakan secara internal untuk membantu men-debug proses pelatihan dan penerapannya sendiri, sebuah tonggak sejarah yang dibingkai OpenAI sebagai sistem AI yang semakin mampu berkontribusi pada pengembangannya sendiri.

Kekuatan yang berbeda dalam kinerja dan desain

Penekanan Codex adalah pada eksekusi. OpenAI melaporkan hasil yang kuat pada tolok ukur rekayasa perangkat lunak, termasuk 56,8% pada SWE-Bench Pro dan 77,3% pada Terminal-Bench 2.0, yang mengukur kemahiran baris perintah. Untuk mendukung kemampuan ini, perusahaan meluncurkan aplikasi macOS Codex khusus, yang memungkinkan pengguna untuk mengelola beberapa agen AI yang bekerja secara paralel.

Claude Opus 4.6 dari Anthropic mencerminkan filosofi yang berbeda. Dibangun untuk penalaran yang kompleks dan pekerjaan kolaboratif, fitur yang menentukan adalah jendela konteks 1 juta token, yang saat ini masih dalam versi beta. Kapasitas tersebut memungkinkan model untuk memproses seluruh basis kode atau dokumen yang luas tanpa kehilangan konteks. Anthropic juga memperkenalkan Tim Agen di Claude Code, yang memungkinkan beberapa agen AI untuk berkoordinasi dalam komponen proyek yang terpisah, seperti tugas frontend, backend, dan basis data.

Hasil benchmark menyoroti kekuatan yang berbeda

Pada benchmark yang berfokus pada penalaran dan sintesis informasi, Opus 4.6 memimpin pengujian seperti GDPval-AA dan BrowseComp. Sementara skor Terminal-Bench 2.0 sebesar 65,4% berada di belakang Codex, Anthropic melaporkan bahwa permintaan yang ditargetkan menghasilkan hasil 81,42% di SWE-Bench Verified, yang menyoroti kemampuan adaptasinya.

Ketika perusahaan mempertimbangkan alat ini, pilihannya mungkin bergantung pada apakah mereka memprioritaskan otomatisasi mentah atau kolaborasi analitik yang mendalam. Apa pun itu, evolusi cepat AI berbasis agen menunjukkan bahwa tim perangkat lunak akan segera bekerja bersama mitra digital yang semakin otonom.

OpenAI mengisyaratkan rencana untuk meluncurkan perangkat keras pertamanya pada paruh kedua tahun 2026, memposisikan "perangkat" sebagai fokus strategis utama bagi perusahaan. Berbicara di World Economic Forum, para eksekutif mengatakan bahwa produk tersebut, yang dikembangkan bekerja sama dengan mantan desainer Apple, Jony Ive, bertujuan untuk menanamkan AI secara lebih mendalam ke dalam perangkat sehari-hari.

Materi ini mungkin mengandung opini pihak ketiga, tidak ada data dan informasi di halaman web ini yang merupakan nasihat investasi menurut Disclaimer kami. Meskipun kami mematuhi Integritas Editorial yang ketat, postingan ini mungkin mengandung referensi ke produk dari mitra kami.