
A Google acaba de anunciar uma atualização significativa para a sua família de modelos de inteligência artificial, com melhorias importantes nos modelos Gemini 2.5 Flash e a introdução do Gemini 2.5 Flash-Lite. As novidades prometem uma experiência mais rica para os utilizadores finais e ferramentas mais eficientes e económicas para os programadores.
As novidades foram detalhadas pela empresa no seu blog oficial para programadores, que destaca avanços tanto na aplicação Gemini como nas versões de pré-visualização disponíveis para a comunidade de desenvolvimento.
Uma experiência mais rica para o utilizador comum
Para quem usa a aplicação Gemini no dia a dia, as melhorias no modelo 2.5 Flash são bastante visíveis. As respostas são agora apresentadas com uma formatação mais clara, recorrendo a cabeçalhos, listas e tabelas que tornam a informação mais fácil de digerir.
A ajuda com os trabalhos de casa também ficou mais robusta, oferecendo um raciocínio passo a passo mais detalhado. Além disso, a capacidade de interpretação de imagens e diagramas foi aprimorada, permitindo agora que os utilizadores façam o upload de notas manuscritas para as resumir, organizar ou até transformar em cartões de estudo (flashcards).

Novidades a pensar nos programadores
O grande foco desta atualização está, no entanto, nos programadores, que já podem aceder às versões de pré-visualização dos modelos Gemini 2.5 Flash e Flash-Lite através do Google AI Studio e do Vertex AI.
O Gemini 2.5 Flash, em particular, duplicou a sua eficiência de tokens, o que na prática significa uma redução de custos e de latência, mantendo uma qualidade superior. O modelo demonstra também uma melhor capacidade de utilização de ferramentas, registando um ganho de cinco pontos no benchmark SWE-Bench Verified, uma métrica que avalia o desempenho em tarefas de programação.
Por sua vez, a nova versão Flash-Lite foi otimizada para seguir melhor as instruções e gerar respostas mais concisas, reduzindo a verbosidade e, consequentemente, os custos. Esta versão reforça ainda as suas capacidades multimodais e de tradução, com uma melhor compreensão de imagens, transcrição de áudio e maior precisão nas traduções.