1. TugaTech » Software » Noticias de Software
  Login     Registar    |                      
Siga-nos

Pokemon em folha de árvores

 

Parece que o modelo de inteligência artificial (IA) mais avançado da Google, o Gemini, alcançou um marco significativo: completar um videojogo com quase 30 anos. Sundar Pichai, o CEO da Google, celebrou o feito na rede social X (anteriormente Twitter), escrevendo: "Que final! O Gemini 2.5 Pro acabou de completar Pokémon Blue!"

 

No entanto, é importante esclarecer que a transmissão ao vivo "Gemini Plays Pokemon" não é uma iniciativa oficial da Google. Foi criada por Joel Z, um engenheiro de software de 30 anos sem afiliação direta com a gigante tecnológica, conforme ele próprio descreve. Apesar disso, vários executivos da Google têm demonstrado entusiasmo pelo projeto.

 

Logan Kilpatrick, responsável pelo produto Google AI Studio, já tinha comentado no mês passado que o Gemini estava a "fazer grandes progressos para completar Pokémon" e que já tinha "ganho a sua 5ª insígnia (o modelo concorrente mais próximo só tem 3, embora com uma estrutura de agente diferente)". Isto levou Pichai a brincar sobre o desenvolvimento de uma "API, Artificial Pokémon Intelligence".

 

Porquê jogar Pokémon?

 

A utilização de Pokémon como um teste para modelos de IA ganhou destaque em fevereiro, quando a Anthropic realçou os avanços dos seus modelos Claude em "Pokémon Red". A empresa afirmou que o "pensamento alargado e treino como agente" do Claude lhe dava um impulso significativo em tarefas "mais inesperadas", como jogar um clássico. Tanto "Pokémon Red" como "Pokémon Blue" são versões do jogo lançado originalmente para o GameBoy em 1996, ligado à popular franquia Pokémon. Joel Z mencionou que se inspirou num canal da Twitch dedicado ao Claude a jogar Pokémon ("Claude Plays Pokemon").

 

Uma vitória com condições

 

Apesar do seu progresso, parece que o Claude ainda não conseguiu terminar "Pokémon Red". Significará isto que o Gemini é objetivamente superior no jogo? Na sua página Twitch, Joel Z apela à cautela: "Por favor, não considerem isto um benchmark [parâmetro de referência] sobre quão bem um LLM [Modelo de Linguagem Grande] consegue jogar Pokémon. Não se podem fazer comparações diretas — Gemini e Claude têm ferramentas diferentes e recebem informações diferentes."

 

Ambos os modelos de IA necessitam de ajuda para interagir com o jogo. É aqui que entram as "estruturas de agente" (agent harnesses). Estas fornecem aos modelos capturas de ecrã do jogo, sobrepostas com informação adicional, permitindo ao modelo decidir como responder (o que pode envolver chamar agentes especializados). Posteriormente, essa decisão é traduzida no pressionar do botão correspondente no jogo.

 

Intervenções humanas foram necessárias

 

Joel Z reconheceu que existiram outras "intervenções do programador" para ajudar o Gemini a completar o jogo, mas insiste que não se trata de batota. "As minhas intervenções melhoram as capacidades gerais de tomada de decisão e raciocínio do Gemini", explica. "Não dou dicas específicas — não há guias passo a passo ou instruções diretas para desafios específicos como o Mt. Moon." A única exceção, admite, foi informar o Gemini que precisava de falar com um membro da Team Rocket duas vezes para obter a Lift Key, um problema que era um bug no jogo original e foi corrigido mais tarde em Pokémon Yellow.

 

Além disso, Joel Z salienta que "o 'Gemini Plays Pokémon' ainda está a ser ativamente desenvolvido, e a estrutura continua a evoluir." Assim, embora seja um feito interessante, a conclusão de Pokémon Blue pelo Gemini parece ser mais um exemplo da colaboração entre IA e a intervenção humana do que uma prova definitiva da autonomia da IA neste tipo de desafio complexo.




Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech