1. TugaTech » Internet e Redes » Noticias da Internet e Mercados
  Login     Registar    |                      
Siga-nos

Google recorde em teste de benchmark matemático com IA do Gemini

 

As Olimpíadas Internacionais de Matemática (IMO), uma das mais prestigiadas competições para jovens matemáticos a nível mundial, tornaram-se o mais recente campo de batalha para os gigantes da inteligência artificial. Numa reviravolta notável, tanto a OpenAI como a Google anunciaram que os seus modelos de linguagem de grande escala (LLM) atingiram um desempenho digno de uma medalha de ouro no evento deste ano.

 

A competição, que desafia estudantes pré-universitários com seis problemas de complexidade extrema, premeia apenas cerca de 8% dos participantes com a cobiçada medalha de ouro. É neste patamar de excelência que a IA parece ter entrado.

 

OpenAI abre as hostilidades

 

Durante o fim de semana, a OpenAI foi a primeira a declarar vitória, afirmando que o seu LLM de raciocínio experimental alcançou um resultado de nível de medalha de ouro nos problemas da IMO de 2025. Segundo a empresa, os seus modelos foram avaliados sob as mesmas regras impostas aos estudantes: duas sessões de 4,5 horas, sem qualquer acesso à internet ou a outras ferramentas, e com a obrigação de apresentar as provas em linguagem natural.

 

A resposta da Google com o Gemini Deep Think

 

Pouco depois, a Google respondeu à altura. A empresa revelou que uma versão avançada do seu modelo Gemini Deep Think resolveu corretamente cinco dos seis problemas da olimpíada, um feito que também lhe confere o estatuto de medalha de ouro.

 

Esta versão melhorada do Gemini Deep Think é potenciada por um modo de raciocínio aprimorado, fruto das mais recentes investigações da Google DeepMind. Uma das chaves do seu sucesso é o "pensamento paralelo", uma capacidade que permite ao Gemini explorar múltiplas vias de solução em simultâneo, em vez de analisar apenas uma de cada vez.

 

A equipa da Google DeepMind explicou que, para além desta arquitetura, o modelo foi treinado com novas técnicas de aprendizagem por reforço e teve acesso a um corpo de dados curado com soluções de alta qualidade para problemas matemáticos. Foram ainda adicionadas dicas gerais sobre como abordar os desafios da IMO.

 

O futuro dos génios artificiais

 

A Google anunciou que esta nova e poderosa versão do modelo Deep Think será disponibilizada em breve a um conjunto de "trusted testers" (testadores de confiança). Posteriormente, o acesso será alargado aos subscritores do plano Google AI Ultra, prometendo colocar estas capacidades de resolução de problemas de elite nas mãos de um público mais vasto.




Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech