OpenAI та Anthropic посилюють конкуренцію в галузі кодування ШІ за допомогою GPT-5.3 Codex та Claude Opus 4.6
Індустрія штучного інтелекту перетнула помітний поріг 5 лютого 2026 року, коли OpenAI та Anthropic в один день випустили свої останні флагманські моделі кодування.
Ця стаття була перекладена з оригіналу. Читайте оригінальну версію від нашого кореспондента тут.
OpenAI представила GPT-5.3 Codex, а Anthropic запустила Claude Opus 4.6, ознаменувавши те, що багато розробників вважають початком нового етапу у створенні програмного забезпечення на основі ШІ. Замість того, щоб зосередитися на швидшому завершенні коду, обидві системи прагнуть діяти як напівавтономні агенти, здатні керувати складними, багатоетапними робочими процесами.
OpenAI позиціонує Codex як щось більше, ніж просто помічник розробника. Компанія описувала його як спеціалізований агент, призначений для обробки повного життєвого циклу професійної комп'ютерної роботи, від налагодження і розгортання додатків до написання документації. Codex навіть використовувався всередині компанії для налагодження власних процесів навчання та розгортання, що стало важливою віхою в розвитку OpenAI як системи штучного інтелекту, які стають все більш здатними робити внесок у власний розвиток.
Сильні сторони в продуктивності та дизайні
Codex робить акцент на виконанні. OpenAI продемонстрував високі результати в тестах на програмну інженерію, в тому числі 56,8% на SWE-Bench Pro і 77,3% на Terminal-Bench 2.0, який вимірює вміння працювати з командним рядком. Для підтримки цих можливостей компанія запустила спеціальний додаток Codex для macOS, що дозволяє користувачам керувати кількома агентами штучного інтелекту, які працюють паралельно.
Claude Opus 4.6 від Anthropic відображає іншу філософію. Створений для складних міркувань і спільної роботи, його визначальною особливістю є контекстне вікно на 1 мільйон тегів, яке наразі перебуває в стадії бета-версії. Це дозволяє моделі обробляти цілі бази коду або об'ємні документи без втрати контексту. Anthropic також впровадила в Claude Code агентські команди, що дозволяють декільком агентам ШІ координувати роботу над окремими компонентами проекту, такими як фронтенд, бекенд і завдання з базами даних.
Результати бенчмарків демонструють різні сильні сторони
У тестах, орієнтованих на міркування та синтез інформації, Opus 4.6 очолив такі тести, як GDPval-AA та BrowseComp. У той час як його результат у тесті Terminal-Bench 2.0 на 65,4% відстає від Codex, Anthropic повідомила, що цільові підказки дали 81,42% у тесті SWE-Bench Verified, що підкреслює його адаптивність.
Коли компанії зважують ці інструменти, вибір може залежати від того, що для них є пріоритетом - автоматизація чи глибока аналітична співпраця. У будь-якому випадку, швидкий розвиток агентного ШІ свідчить про те, що незабаром команди розробників програмного забезпечення працюватимуть разом із все більш автономними цифровими колегами.
OpenAI сигналізує про плани запустити свій перший апаратний пристрій у другій половині 2026 року, позиціонуючи "пристрої" як ключовий стратегічний фокус для компанії. Виступаючи на Всесвітньому економічному форумі, керівники компанії заявили, що продукт, розроблений у співпраці з колишнім дизайнером Apple Джоні Айвом, має на меті глибше впровадити ШІ в повсякденні інструменти.
Найсвіжіші новини OpenAI
- Forex
- Crypto