A Google aproveitou a sua conferência de programadores, a Google I/O, para revelar uma série de novidades significativas para a sua família de modelos de inteligência artificial Gemini. Entre os destaques estão um novo modelo de raciocínio denominado Deep Think para o Gemini 2.5 Pro e uma versão otimizada do Gemini 2.5 Flash, focada em velocidade e eficiência.
Gemini 2.5 Pro com "Deep Think": um salto no raciocínio
A tecnológica de Mountain View está a testar um novo modelo de raciocínio chamado Deep Think, integrado no Gemini 2.5 Pro. Segundo Demis Hassabis, CEO da DeepMind, o Deep Think utiliza "a mais recente investigação de ponta", conferindo ao modelo a capacidade de ponderar múltiplas hipóteses antes de apresentar uma resposta.
A Google afirma que o Deep Think alcançou uma "pontuação impressionante" quando avaliado com questões da competição Olimpíada de Matemática dos Estados Unidos da América de 2025. No entanto, a empresa pretende dedicar mais tempo a avaliações de segurança e a recolher feedback de especialistas na área antes de um lançamento alargado. Por este motivo, o Deep Think será inicialmente disponibilizado a um grupo restrito de testers de confiança através da API do Gemini, permitindo recolher as suas impressões.
Gemini 2.5 Flash: ainda mais rápido e eficiente
Outra novidade é a introdução de um modelo Gemini 2.5 Flash melhorado, otimizado para velocidade e eficiência. Esta nova versão é mais eficiente que a anterior, utiliza menos tokens e obteve pontuações superiores em benchmarks de raciocínio, multimodalidade, programação e contexto longo em comparação com o seu predecessor.
A disponibilidade geral do Gemini 2.5 Flash está prevista para o início de junho. De momento, esta versão melhorada encontra-se disponível em modo de pré-visualização através do Google AI Studio para programadores, da Vertex AI para clientes empresariais e da aplicação Gemini para os restantes utilizadores.
"Thinking Budgets" chegam ao Gemini 2.5 Pro
Apesar de grande parte dos ganhos de eficiência destacados no palco da I/O se terem centrado no 2.5 Flash, a Google anunciou que irá transpor o conceito de "Thinking Budgets" (orçamentos de processamento) do 2.5 Flash para o seu modelo mais avançado, o 2.5 Pro. Esta funcionalidade permitirá aos utilizadores equilibrar os tokens gastos com a precisão e a velocidade da resposta.
Project Mariner: agentes IA para navegar na web por si
Separadamente, a Google está a integrar o Project Mariner na API do Gemini e na Vertex AI. O Project Mariner consiste em agentes de IA baseados no Gemini, capazes de navegar em páginas web para completar tarefas em nome dos utilizadores. A empresa planeia disponibilizar estes agentes de forma mais alargada durante o verão, para que os programadores possam experimentá-los.
Novidades em conversão de texto para voz
Adicionalmente, a empresa está a lançar novas pré-visualizações para a funcionalidade de conversão de texto para voz nos modelos 2.5 Pro e 2.5 Flash, através da API do Gemini. Esta novidade inclui suporte para duas vozes em 24 idiomas.
Nenhum comentário
Seja o primeiro!