1. TugaTech » Software » Noticias de Software
  Login     Registar    |                      
Siga-nos

Gemini 3.1 Flash TTS

A Google acaba de apresentar o Gemini 3.1 Flash TTS, a sua mais recente evolução na tecnologia de conversão de texto em voz, que promete elevar a fasquia do realismo emocional. Este novo modelo foi desenhado para oferecer um controlo e uma expressividade sem precedentes, permitindo que a inteligência artificial replique as nuances da fala humana de uma forma muito mais orgânica e menos mecânica, estando já disponível em fase de antevisão para programadores e empresas.

Controlo emocional através de comandos naturais

Uma das características mais inovadoras desta atualização é a introdução de etiquetas de áudio, um sistema que permite aos utilizadores moldar o comportamento da voz através de instruções simples em linguagem corrente. De forma semelhante ao que acontece em plataformas de criação musical, é agora possível pedir ao sistema para dizer algo com emoção ou adotar um tom específico, bastando inserir a indicação no texto. Esta flexibilidade garante que a entonação e o ritmo da fala se adaptem ao contexto da conversa, tornando o Gemini muito mais capaz de dar vida a personagens ou assistentes virtuais.

O modelo suporta atualmente mais de 70 idiomas e destaca-se pela capacidade de gerir diálogos com múltiplos interlocutores, o que o torna uma solução extremamente versátil para diversas aplicações profissionais. Nos testes de referência realizados, o Gemini 3.1 Flash TTS demonstrou um desempenho superior a soluções conhecidas do mercado, como o ElevenLabs v3, equilibrando de forma eficiente a elevada qualidade sonora com os custos de processamento.

 

Segurança e marcas de água invisíveis

Apesar do realismo que pode facilmente ser confundido com uma voz humana, a tecnológica não descurou a segurança. Todas as vozes geradas por esta IA incluem a marcação invisível SynthID, uma tecnologia de proteção que permite identificar se um conteúdo foi criado artificialmente. Esta medida é fundamental para combater utilizações abusivas e garantir a transparência no consumo de conteúdos digitais. Para já, o novo modelo será integrado em ferramentas como o Google Vids, permitindo que os utilizadores criem vídeos com narrações profissionais de forma automática.

Foto do Autor

Aficionado por tecnologia desde o tempo dos sistemas a preto e branco

Ver perfil do usuário Enviar uma mensagem privada Enviar um email Facebook do autor Twitter do autor Skype do autor

conectado
Encontrou algum erro neste artigo?



Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech