1. TugaTech » Internet e Redes » Noticias da Internet e Mercados
  Login     Registar    |                      
Siga-nos

Gemini 2.5

 

A Google DeepMind está a preparar o lançamento daquele que afirma ser o seu mais avançado modelo de inteligência artificial focado em raciocínio, o Gemini 2.5 Deep Think. A nova tecnologia promete responder a questões complexas ao explorar e ponderar múltiplas ideias em simultâneo para, no fim, selecionar a melhor solução. A partir desta sexta-feira, os subscritores do plano Ultra da Google, com um custo de 250 dólares mensais (cerca de 230 euros, embora o preço em Portugal possa variar), terão acesso a esta novidade na aplicação Gemini.

 

O que torna o Deep Think especial? A abordagem multi-agente

 

Apresentado pela primeira vez em maio, durante o evento Google I/O 2025, o Gemini 2.5 Deep Think é o primeiro modelo "multi-agente" que a empresa disponibiliza ao público. Em vez de um único "cérebro" a resolver um problema, o sistema lança vários "agentes" de IA que trabalham em paralelo para analisar a questão por diferentes ângulos. Embora esta abordagem consuma significativamente mais recursos computacionais, tende a produzir respostas de qualidade superior.

 

Foi precisamente uma variante deste sistema que permitiu à Google conquistar uma medalha de ouro nas Olimpíadas Internacionais de Matemática (IMO) deste ano. A empresa vai agora disponibilizar esse modelo específico das IMO a um grupo restrito de matemáticos e académicos, notando que esta versão "leva horas a raciocinar", em contraste com os segundos ou minutos dos modelos de consumo. O objetivo é impulsionar a investigação e recolher feedback para otimizar o sistema para casos de uso académicos.

 

Superioridade nos benchmarks: os números não mentem

 

A Google afirma que o Gemini 2.5 Deep Think representa uma melhoria significativa face ao que foi anunciado no I/O, graças a "novas técnicas de aprendizagem por reforço" que otimizam as suas capacidades de raciocínio. Os resultados em testes de desempenho parecem comprovar esta evolução.

 

No exigente teste Humanity's Last Exam (HLE), que mede a capacidade da IA para responder a milhares de perguntas de matemática, humanidades e ciência, o modelo da Google alcançou 34,8% (sem ferramentas). Este valor supera os 25,4% do Grok 4 da xAI e os 20,3% do o3 da OpenAI. O domínio estende-se à programação, com o Deep Think a atingir 87,6% no LiveCodeBench6, um teste de desafios de código competitivo, deixando para trás o Grok 4 (79%) e o o3 da OpenAI (72%).

 

Mais do que apenas números: criatividade e descoberta

 

Segundo a Google, o novo modelo pode "ajudar as pessoas a resolver problemas que exigem criatividade, planeamento estratégico e melhorias passo a passo". O Gemini 2.5 Deep Think integra-se automaticamente com ferramentas como execução de código e a Pesquisa Google, sendo capaz de produzir "respostas muito mais longas" e detalhadas do que os modelos tradicionais. Nos testes da empresa, o sistema produziu tarefas de desenvolvimento web com maior detalhe e apelo estético em comparação com outros modelos de IA, sugerindo um potencial para acelerar a investigação e "o caminho para a descoberta".

 

dados de teste da Google ao modelo Gemini

 

 

Uma tendência na indústria (e um custo elevado)

 

A Google não está sozinha nesta corrida. A abordagem multi-agente parece ser a nova fronteira para os principais laboratórios de IA. A xAI, de Elon Musk, lançou recentemente o Grok 4 Heavy, um sistema semelhante. A OpenAI também confirmou que o modelo usado para vencer as IMO era multi-agente, e a Anthropic utiliza a mesma tecnologia no seu "Research agent".

 

Contudo, este poder tem um preço. Os sistemas multi-agente são ainda mais caros de operar do que os modelos de IA tradicionais. Este fator explica por que razão tanto a xAI como, agora, a Google, estão a reservar esta tecnologia para os seus planos de subscrição mais caros. Nas próximas semanas, a Google planeia partilhar o Gemini 2.5 Deep Think com um grupo selecionado de testadores através da sua API, procurando entender como programadores e empresas poderão tirar partido do seu novo e poderoso sistema.




Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech