
No ano passado, a criadora do popular chatbot iniciou os testes do Aardvark, um agente de investigação de segurança alimentado pelo modelo GPT-5. Este sistema autónomo foi desenhado para analisar bases de código de forma contínua, com o objetivo de detetar vulnerabilidades e propor as respetivas correções. Agora, o projeto deu o próximo grande passo.
De acordo com o anúncio oficial da OpenAI, o Aardvark evoluiu e foi rebatizado como Codex Security. A ferramenta encontra-se atualmente disponível numa versão de antevisão para pesquisa, destinada aos clientes dos planos Pro, Team, Enterprise e Edu do ChatGPT. O acesso é realizado através da interface web do Codex e a utilização será totalmente gratuita até ao próximo mês.
Combate aos falsos positivos e análise inteligente
A empresa salienta que o Codex Security procura resolver dois problemas centrais no desenvolvimento atual de software. O primeiro é o grande volume de código gerado de forma rápida por agentes de inteligência artificial, o que transforma as revisões manuais de segurança num processo extremamente complexo. O segundo problema prende-se com as ferramentas de segurança já existentes no mercado, que frequentemente sinalizam falhas de baixo impacto e geram inúmeros falsos positivos, forçando os programadores a perderem horas na triagem.
Para ultrapassar estas barreiras, o sistema utiliza um raciocínio baseado em agentes com validação automatizada. Esta abordagem permite descobrir problemas de alto impacto e fornecer correções práticas que se adaptam especificamente à base de código de cada projeto.
Melhorias significativas desde a fase beta
As lições retiradas durante a implementação privada do Aardvark foram fundamentais para refinar esta nova versão. Durante o período beta, a empresa colaborou de perto com testadores externos para otimizar a forma como os utilizadores fornecem o contexto relevante do produto, facilitando a transição da configuração inicial para a proteção efetiva do código.
Os resultados indicam uma melhoria substancial na precisão das descobertas ao longo do tempo. Num dos exemplos revelados, a realização de análises repetidas no mesmo repositório resultou numa redução de ruído de 84% em comparação com o lançamento inicial.
Além disso, a taxa de problemas com gravidade exagerada caiu mais de 90%, enquanto os falsos positivos em vários repositórios diminuíram mais de 50%. Estas alterações foram pensadas para ajudar as equipas de segurança a concentrarem-se em vulnerabilidades reais, poupando tempo em processos desnecessários. A expectativa é que o rácio sinal-ruído do Codex Security continue a melhorar gradualmente.












Nenhum comentário
Seja o primeiro!