
A fronteira entre a criação humana e a automação continua a esbater-se nos corredores da OpenAI. A empresa confirmou recentemente que o seu agente de programação, o Codex, atingiu um marco impressionante no desenvolvimento de sistemas de inteligência artificial auto-aperfeiçoáveis: a ferramenta é agora responsável por construir a vasta maioria de si mesma.
Em declarações à Ars Technica, Alexander Embiricos, líder de produto do Codex na OpenAI, revelou que "a grande maioria do Codex é construída pelo próprio Codex", sublinhando que o sistema está a ser utilizado quase inteiramente para o seu próprio aperfeiçoamento. Esta revelação surge num momento em que a empresa intensifica os seus esforços num mercado cada vez mais competitivo, onde enfrenta rivais de peso como o Claude Code da Anthropic e o GitHub Copilot.
Adoção interna massiva e eficiência
Desde o seu lançamento em maio de 2025, o Codex posicionou-se como um agente de engenharia de software baseado na nuvem, capaz de gerir tarefas complexas como a criação de funcionalidades, correção de erros (bugs) e sugestão de "pull requests". A ferramenta opera em ambientes isolados (sandboxed), ligados aos repositórios de código dos utilizadores.
Os dados internos da OpenAI demonstram uma integração profunda desta tecnologia nos seus processos de desenvolvimento. A adoção entre a equipa técnica ultrapassa os 92%, com o agente de IA a rever cada "pull request" interno. O impacto na produtividade é notável: os engenheiros que utilizam o Codex enviam aproximadamente 70% mais código finalizado, com o sistema a detetar falhas antes mesmo de chegarem à fase de produção. Um exemplo prático desta capacidade foi a criação da ferramenta "Agent Builder", onde o Codex escreveu 80% do código em menos de seis semanas.
O motor por trás desta eficiência é o "codex-1", uma variante especializada do modelo de raciocínio o3 da OpenAI, refinada através de aprendizagem por reforço. A evolução continuou com o lançamento do GPT-5.1-Codex-Max em dezembro, uma versão otimizada para programação autónoma capaz de trabalhar de forma independente durante mais de sete horas em tarefas complexas.
Código vermelho e a rivalidade com a Google
Esta confirmação chega num período crítico para a OpenAI, dias antes do lançamento do seu novo modelo, numa altura em que o CEO Sam Altman declarou um "código vermelho" interno para acelerar o desenvolvimento face à pressão do mercado. A empresa lançou recentemente o GPT-5.2, precisamente para responder aos avanços da concorrência.
Nos testes de referência (benchmarks) de programação, o novo GPT-5.2 obteve uma pontuação de 55,6% no SWE-Bench Pro. Este resultado não só supera o seu antecessor, o GPT-5.1, em quase cinco pontos percentuais, como também deixa para trás o Gemini 3 Pro da Google por uma margem superior a 12%.
Embora a OpenAI tenha evitado comparações diretas quando questionada sobre a influência do Claude Code no design do Codex, a empresa reconhece o ambiente altamente competitivo. A estratégia passa agora por manter a liderança através de modelos que não só assistem os programadores humanos, mas que contribuem ativamente para a sua própria evolução.










Nenhum comentário
Seja o primeiro!