
A OpenAI apresentou oficialmente o seu mais recente modelo de fundação, o GPT-5.4, classificado pela empresa como o seu modelo de fronteira mais capaz e eficiente para o trabalho profissional. Esta nova geração desdobra-se em três variantes principais para responder a diferentes necessidades: a versão padrão, o GPT-5.4 Thinking, concebido especificamente para raciocínio complexo, e o GPT-5.4 Pro, otimizado para cenários que exigem alto desempenho.
Maior contexto e eficiência nas tarefas diárias
Para os programadores e empresas, a grande novidade é a introdução de uma janela de contexto colossal na versão da API, que atinge agora 1 milhão de tokens. Trata-se da maior capacidade alguma vez disponibilizada pela tecnológica, permitindo o processamento de quantidades massivas de informação de uma só vez. Além de oferecer mais espaço, a empresa sublinha a elevada eficiência do sistema, que consegue resolver os mesmos problemas utilizando significativamente menos tokens do que o seu antecessor.
Os resultados nos testes de desempenho acompanham estas melhorias. O modelo registou pontuações recorde em avaliações exigentes de uso de computador, nomeadamente no OSWorld-Verified e no WebArena Verified. Conquistou também uma marca de 83% no teste GDPval, focado em tarefas de conhecimento. No setor financeiro e jurídico, a nova geração assumiu a liderança no benchmark APEX-Agents da Mercor. Segundo Brendan Foody, diretor executivo da Mercor, o modelo brilha na criação de projetos extensos, como apresentações, modelos financeiros e análises jurídicas, oferecendo um desempenho de topo a um custo inferior ao da concorrência.
Redução de erros e nova pesquisa de ferramentas
A precisão dos factos continua a ser uma prioridade, com a nova versão a dar um passo expressivo na redução de alucinações. O novo modelo apresenta uma probabilidade 33% menor de cometer erros em afirmações individuais quando comparado diretamente com o GPT 5.2. A nível geral, as respostas fornecidas têm 18% menos probabilidade de conter qualquer tipo de falha factual.
No que toca à integração em sistemas externos, a tecnológica reformulou a forma como a API gere a chamada de ferramentas, introduzindo o novo Tool Search. Anteriormente, era necessário que o sistema carregasse as definições de todas as ferramentas disponíveis sempre que o modelo era chamado, o que consumia demasiados tokens. O novo sistema permite que os modelos pesquisem as definições apenas quando são efetivamente precisas, tornando os pedidos mais rápidos e económicos para os programadores.
Segurança e transparência na cadeia de pensamento
A pensar na fiabilidade a longo prazo, o lançamento inclui uma nova avaliação de segurança destinada a testar a cadeia de pensamento (chain-of-thought) do modelo, que consiste no comentário contínuo que demonstra a lógica utilizada em tarefas de múltiplos passos. Embora os investigadores temam que os modelos de raciocínio possam ocultar as suas verdadeiras intenções, as novas avaliações revelam resultados positivos.
Os testes indicam que a versão Thinking é menos propensa a utilizar táticas de engano, sugerindo que o sistema não tem a capacidade de ocultar o seu processo lógico e que a monitorização contínua continua a ser uma barreira de segurança eficaz, conforme detalhado no comunicado partilhado pela OpenAI.












Nenhum comentário
Seja o primeiro!