
A Google DeepMind anunciou a mais recente evolução da sua família de sistemas de Inteligência Artificial, o Genie 3. Estes sistemas, conhecidos como "modelos de mundo", são capazes de gerar ambientes interativos e simulados, permitindo que um utilizador ou um agente de IA navegue e interaja com eles. Embora o resultado se assemelhe a um videojogo, o objetivo principal do Genie 3 é servir como uma plataforma avançada para treinar outros sistemas de IA, tornando-os mais eficientes e seguros.
O que há de novo no Genie 3?
À primeira vista, o salto do Genie 2, lançado no início de dezembro, para o Genie 3 pode não parecer tão dramático como a introdução de mundos 3D do seu antecessor. No entanto, as melhorias são fundamentais. O novo modelo eleva a qualidade visual, gerando imagens a 720p em vez dos anteriores 360p. Além disso, a consistência ambiental, um ponto fraco em modelos mais antigos que por vezes se "esqueciam" do layout de um cenário, foi aprimorada. Um dos grandes desafios era a consistência, um problema notório em sistemas como o Oasis da Decart, que tinha dificuldade em memorizar os níveis que gerava.
Outro avanço significativo é a longevidade da simulação. Enquanto o Genie 2 tinha um limite teórico de 60 segundos antes de começar a gerar inconsistências ("alucinações"), o Genie 3 é capaz de manter um mundo estável e coerente por vários minutos.
A "magia" está nos eventos personalizáveis
A característica mais disruptiva do Genie 3 é a capacidade de introduzir "eventos de mundo personalizáveis". O modelo anterior já permitia interatividade através de comandos de movimento, mas o Genie 3 processa estas ações em tempo real. Mais importante ainda, permite modificar a simulação através de comandos de texto. Numa demonstração, a equipa da DeepMind instruiu o modelo a inserir uma manada de veados numa cena de uma pessoa a esquiar numa montanha. Embora o movimento dos animais não fosse perfeitamente realista, esta capacidade de alterar o estado do mundo em tempo real é considerada a funcionalidade "matadora" do novo sistema.
Mais do que um jogo: uma ferramenta para treinar o futuro da IA
A visão da DeepMind para o Genie 3 é clara: utilizá-lo como uma ferramenta de treino e avaliação para outros agentes de IA. O sistema pode ser usado para ensinar IAs a lidar com cenários hipotéticos ("what if") que não estão cobertos nos seus dados de treino originais. Shlomi Fruchter, diretor de pesquisa na DeepMind, deu o exemplo de como o Genie 3 poderia ser usado para ensinar um carro autónomo a evitar de forma segura um peão que surja inesperadamente na estrada, aumentando a fiabilidade e segurança destes sistemas.
Limitações e o caminho a percorrer
Apesar dos avanços, a equipa da DeepMind reconhece que ainda há muito trabalho pela frente. O modelo atual tem dificuldades com a renderização de texto e não consegue gerar locais do mundo real com precisão fotográfica. Para que o Genie seja verdadeiramente transformador, a DeepMind acredita que precisa de ser capaz de sustentar um mundo simulado por horas, e não apenas por minutos.
Ainda assim, o laboratório acredita que o modelo já está num ponto em que pode ter um impacto real, permitindo identificar comportamentos inseguros em agentes de IA, mesmo que os cenários não sejam perfeitos. "Já se consegue ver para onde isto vai. Tornar-se-á cada vez mais útil à medida que os modelos melhorarem", afirmou Jack Parker-Holder, cientista de pesquisa na DeepMind.
Por enquanto, o Genie 3 não está disponível para o público em geral. No entanto, a DeepMind está a trabalhar para disponibilizar o modelo a um grupo mais alargado de testadores.










Nenhum comentário
Seja o primeiro!