
A Google oficializou o lançamento do Gemini 3.1 Flash Live, o seu mais avançado modelo de voz e áudio focado em inteligência artificial, desenhado para proporcionar conversas incrivelmente naturais. Segundo a publicação no blogue da Google, esta novidade impulsiona grandes atualizações em serviços da marca, trazendo novas capacidades que se assemelham cada vez mais à interação humana.
O novo modelo traz capacidades de áudio e vídeo, integração com o Google Lens e suporta conversas multimodais em tempo real em mais de 90 idiomas, estando disponível em mais de 200 países. Com esta atualização, a inteligência artificial da empresa dá um salto significativo para alimentar ferramentas como o Gemini Live e o Search Live.
Desempenho ajustável consoante a necessidade
Os programadores ganham agora a capacidade de configurar o nível de raciocínio do modelo, permitindo equilibrar a velocidade e a qualidade da resposta consoante o cenário de utilização. Na configuração mais alta, o Gemini 3.1 Flash Live atinge uma pontuação de 95,9% no Big Bench Audio Benchmark, ficando apenas atrás do Step Audio R1.1 Realtime, com um tempo de resposta de 2,98 segundos.
Por outro lado, se a prioridade for a extrema rapidez para interações instantâneas, a configuração mínima reduz o tempo de espera para apenas 0,96 segundos, embora a qualidade da resposta desça para os 70,5%.
Emoção e clareza em ambientes ruidosos
A gigante tecnológica sublinha ainda que o novo modelo é muito mais capaz de detetar o tom de voz e os sinais emocionais durante a fala do utilizador. Além disso, apresenta um desempenho mais fiável em ambientes com muito ruído e melhorou o suporte para acionar ferramentas externas ou fornecer informações de forma contínua durante conversas ao vivo. Estas características em conjunto tornam cada vez mais difícil distinguir a voz da máquina da de um ser humano real.
Disponibilidade e preços para os programadores
O Gemini 3.1 Flash Live já se encontra disponível através do Google AI Studio, da API do serviço e na vertente Enterprise for Customer Experience. No que diz respeito aos custos, a empresa revelou que os preços se mantêm inalterados face às versões anteriores: cerca de 0,32 euros por hora para a entrada de áudio e perto de 1,29 euros por hora para a saída de áudio.












Nenhum comentário
Seja o primeiro!