
Parece que a OpenAI decidiu responder à altura ao Veo 3 da Google, lançando o Sora 2, o seu mais avançado modelo de geração de vídeo e áudio até à data. Esta nova versão surge apenas 10 meses após o lançamento do Sora original, que a empresa descreveu como um “momento GPT-1 para o vídeo”. Agora, o Sora 2 representa o “momento GPT-3.5” nesta área, capaz de produzir cenas complexas que obedecem às leis da física de uma forma que os modelos anteriores não conseguiam.
Segundo a OpenAI, o Sora 2 compreende a dinâmica física do mundo real. Enquanto sistemas de IA anteriores frequentemente distorciam a realidade — como fazer uma bola de basquetebol teletransportar-se para o cesto após um lançamento falhado —, o novo modelo consegue gerar movimentos complexos e realistas. Exemplos incluem rotinas de ginástica olímpica, manobras de paddleboard que respeitam a flutuabilidade e rigidez da prancha, e até triplos axels executados por personagens virtuais, tudo isto mantendo o diálogo e os efeitos sonoros sincronizados.
Um novo patamar de realismo e controlo
Uma das principais melhorias do Sora 2 reside no controlo oferecido ao utilizador. O modelo é capaz de seguir instruções detalhadas com múltiplos planos e manter a consistência do cenário ao longo de sequências de vídeo. Suporta também vários estilos visuais, incluindo estéticas realistas, cinematográficas e de anime, o que aumenta a sua versatilidade para os criadores de conteúdo.
Talvez a funcionalidade mais inovadora seja a capacidade de injetar elementos do mundo real nos vídeos gerados através de “cameos”. Ao carregar um pequeno vídeo e uma amostra de áudio, os utilizadores podem inserir representações digitais fiéis de si próprios, de amigos ou de objetos em qualquer ambiente criado pelo Sora. A capacidade do modelo para simular falhas de forma precisa, e não apenas o sucesso, é um avanço fundamental para uma simulação realista do mundo.
Nova app para iOS aposta na criação e segurança
A par do novo modelo, a OpenAI lançou uma nova aplicação do Sora para iOS, que permite aos utilizadores criar e remisturar vídeos uns dos outros, incluindo os seus “cameos”. A app inclui um feed de vídeos com conteúdos gerados por IA, mas a empresa garante que a prioridade é a criação de conteúdo em vez do consumo passivo.
A OpenAI destacou também as medidas de segurança implementadas. A empresa afirma estar ciente dos perigos de feeds viciantes e do isolamento, e por isso emprega algoritmos de recomendação que podem ser controlados através de instruções em linguagem natural. A aplicação inclui funcionalidades como verificações de bem-estar e algoritmos de feed ajustáveis. Para os utilizadores adolescentes, existem limites predefinidos de consumo de conteúdo, e os pais podem usar controlos baseados no ChatGPT para gerir as definições, como detalhado pela OpenAI num post sobre a sua filosofia.
Disponibilidade e acesso
A aplicação Sora já está disponível para download na App Store para iOS, funcionando através de um sistema de convites. Os utilizadores podem inscrever-se para receber um convite e serão notificados quando tiverem acesso. Durante a fase inicial de lançamento, o Sora 2 também pode ser acedido gratuitamente no site oficial. Os subscritores do ChatGPT Pro terão acesso a um modelo de maior qualidade, o Sora 2 Pro, além do já existente Sora 1 Turbo. A OpenAI anunciou ainda que o modelo estará acessível via API em breve.










Nenhum comentário
Seja o primeiro!