
A Google acaba de anunciar o lançamento do Veo 3.1 e do Veo 3.1 Fast, as mais recentes versões do seu modelo de inteligência artificial para a criação de vídeos. As novidades prometem dar aos programadores e criadores de conteúdo um maior controlo sobre a narrativa e a qualidade dos seus projetos, com melhorias significativas tanto a nível visual como sonoro.
Estas novas ferramentas já estão disponíveis em regime de paid preview através da API do Gemini e podem ser exploradas no Google AI Studio e no Vertex AI. A integração estende-se ainda à aplicação Gemini e à plataforma Flow.
As grandes novidades do Veo 3.1
De acordo com a informação partilhada no blog oficial para programadores da Google, o Veo 3.1 introduz um conjunto de capacidades que elevam a fasquia da geração de vídeo por IA. Uma das principais melhorias é a capacidade de gerar áudio nativo mais rico, que vai desde conversas naturais a efeitos sonoros sincronizados com a imagem, algo que faltava em versões anteriores.
O modelo demonstra também uma maior compreensão de estilos cinematográficos, permitindo um controlo mais apurado sobre a narrativa visual. A capacidade de transformar imagens em vídeo foi igualmente otimizada, garantindo uma maior fidelidade ao pedido original (prompt) e mantendo a consistência das personagens ao longo de múltiplas cenas.
Novas ferramentas para potenciar a criatividade
Para além das melhorias no modelo base, a Google introduziu três novas funcionalidades criativas que prometem revolucionar a forma como os vídeos são gerados:
‘Ingredients to video’: Esta ferramenta permite guiar a criação do vídeo fornecendo até três imagens de referência. Seja uma personagem, um objeto ou um cenário específico, a IA utiliza estas "ingredientes" para manter a consistência visual ou aplicar um estilo particular ao longo de várias cenas.
‘Scene extension’: Os vídeos já não estão limitados pela duração da geração inicial. Com a extensão de cena, é possível criar vídeos mais longos, com um minuto ou mais, gerando novos clipes que se ligam de forma contínua ao vídeo anterior. A IA baseia-se no último segundo do clipe precedente para garantir uma transição suave.
‘First and last frame’: Esta funcionalidade permite criar transições fluidas e naturais entre duas imagens distintas. Ao fornecer uma imagem de início e uma de fim, o Veo 3.1 gera toda a sequência de transição, incluindo o áudio correspondente.
O que já está a ser criado com o Veo 3.1
Apesar de recente, a nova tecnologia já está a ser explorada por estúdios e empresas. A Promise Studios, um estúdio de cinema focado em GenAI, está a usar o Veo 3.1 para melhorar a criação de storyboards generativos e a pré-visualização de cenas. Já a Latitude está a experimentar o modelo no seu motor de narrativas generativas para dar vida instantânea às histórias criadas pelos utilizadores.
Os programadores interessados em explorar o potencial do Veo 3.1 podem aceder à documentação detalhada na API do Gemini, utilizar a nova aplicação de demonstração Veo Studio ou seguir os guias de programação já disponíveis.











Nenhum comentário
Seja o primeiro!