
A Google acaba de apresentar o Gemini 3.1 Flash TTS, a sua mais recente evolução na tecnologia de conversão de texto em voz, que promete elevar a fasquia do realismo emocional. Este novo modelo foi desenhado para oferecer um controlo e uma expressividade sem precedentes, permitindo que a inteligência artificial replique as nuances da fala humana de uma forma muito mais orgânica e menos mecânica, estando já disponível em fase de antevisão para programadores e empresas.
Controlo emocional através de comandos naturais
Uma das características mais inovadoras desta atualização é a introdução de etiquetas de áudio, um sistema que permite aos utilizadores moldar o comportamento da voz através de instruções simples em linguagem corrente. De forma semelhante ao que acontece em plataformas de criação musical, é agora possível pedir ao sistema para dizer algo com emoção ou adotar um tom específico, bastando inserir a indicação no texto. Esta flexibilidade garante que a entonação e o ritmo da fala se adaptem ao contexto da conversa, tornando o Gemini muito mais capaz de dar vida a personagens ou assistentes virtuais.
O modelo suporta atualmente mais de 70 idiomas e destaca-se pela capacidade de gerir diálogos com múltiplos interlocutores, o que o torna uma solução extremamente versátil para diversas aplicações profissionais. Nos testes de referência realizados, o Gemini 3.1 Flash TTS demonstrou um desempenho superior a soluções conhecidas do mercado, como o ElevenLabs v3, equilibrando de forma eficiente a elevada qualidade sonora com os custos de processamento.
Segurança e marcas de água invisíveis
Apesar do realismo que pode facilmente ser confundido com uma voz humana, a tecnológica não descurou a segurança. Todas as vozes geradas por esta IA incluem a marcação invisível SynthID, uma tecnologia de proteção que permite identificar se um conteúdo foi criado artificialmente. Esta medida é fundamental para combater utilizações abusivas e garantir a transparência no consumo de conteúdos digitais. Para já, o novo modelo será integrado em ferramentas como o Google Vids, permitindo que os utilizadores criem vídeos com narrações profissionais de forma automática.












Nenhum comentário
Seja o primeiro!