OpenAI e Anthropic intensificam a corrida pela codificação de IA com GPT-5.3 Codex, Claude Opus 4.6
O setor de inteligência artificial ultrapassou um limite notável em 5 de fevereiro de 2026, quando a OpenAI e a Anthropic lançaram seus modelos de codificação mais recentes no mesmo dia.
Este artigo foi traduzido do original. Leia a versão original do nosso correspondente aqui.
A OpenAI apresentou o GPT-5.3 Codex, enquanto a Anthropic lançou o Claude Opus 4.6, marcando o que muitos desenvolvedores veem como o início de uma nova fase na criação de software orientado por IA. Em vez de se concentrarem na conclusão mais rápida do código, ambos os sistemas visam atuar como agentes semiautônomos capazes de gerenciar fluxos de trabalho complexos e de várias etapas.
A OpenAI posicionou o Codex como mais do que um auxílio ao desenvolvedor. A empresa o descreveu como um agente especializado projetado para lidar com todo o ciclo de vida do trabalho profissional com computadores, desde a depuração e implantação de aplicativos até a redação de documentação. O Codex foi usado até mesmo internamente para ajudar a depurar seus próprios processos de treinamento e implantação, um marco que a OpenAI enquadrou como sistemas de IA cada vez mais capazes de contribuir para seu próprio desenvolvimento.
Pontos fortes divergentes em desempenho e design
A ênfase do Codex está na execução. A OpenAI registrou resultados sólidos em benchmarks de engenharia de software, incluindo 56,8% no SWE-Bench Pro e 77,3% no Terminal-Bench 2.0, que mede a proficiência em linha de comando. Para dar suporte a esses recursos, a empresa lançou um aplicativo dedicado ao macOS Codex, que permite aos usuários gerenciar vários agentes de IA trabalhando em paralelo.
O Claude Opus 4.6 da Anthropic reflete uma filosofia diferente. Criado para raciocínio complexo e trabalho colaborativo, seu recurso definidor é uma janela de contexto de 1 milhão de tokens, atualmente em versão beta. Essa capacidade permite que o modelo processe bases de código inteiras ou documentos extensos sem perder o contexto. A Anthropic também introduziu as equipes de agentes no Claude Code, permitindo que vários agentes de IA se coordenem em componentes separados de um projeto, como tarefas de front-end, back-end e banco de dados.
Resultados de benchmark destacam pontos fortes divergentes
Em benchmarks focados em raciocínio e síntese de informações, o Opus 4.6 liderou testes como o GDPval-AA e o BrowseComp. Embora sua pontuação no Terminal-Bench 2.0 de 65,4% tenha ficado atrás do Codex, a Anthropic informou que a solicitação direcionada produziu um resultado de 81,42% no SWE-Bench Verified, destacando sua adaptabilidade.
À medida que as empresas avaliam essas ferramentas, a escolha pode depender do fato de priorizarem a automação bruta ou a colaboração analítica profunda. De qualquer forma, a rápida evolução da IA baseada em agentes sugere que as equipes de software logo estarão trabalhando ao lado de contrapartes digitais cada vez mais autônomas.
A OpenAI está sinalizando planos para lançar seu primeiro dispositivo de hardware no segundo semestre de 2026, posicionando os "dispositivos" como um foco estratégico fundamental para a empresa. Em discurso no Fórum Econômico Mundial, os executivos disseram que o produto, desenvolvido em colaboração com o ex-designer da Apple, Jony Ive, tem como objetivo incorporar a IA mais profundamente às ferramentas do dia a dia.
Últimas notícias OpenAI
- Forex
- Crypto