1. TugaTech » Internet e Redes » Noticias da Internet e Mercados
  Login     Registar    |                      
Siga-nos

Google Gemini banana

A Google está a intensificar a sua aposta na inteligência artificial com uma atualização significativa para o seu chatbot Gemini. A gigante tecnológica lançou um novo modelo de imagem, denominado Gemini 2.5 Flash Image, que promete dar aos utilizadores um controlo mais refinado sobre a edição de fotografias, numa tentativa clara de alcançar as populares ferramentas da OpenAI e atrair utilizadores do ChatGPT.

A atualização, que começa a ser disponibilizada esta terça-feira, chega a todos os utilizadores através da aplicação Gemini e também aos programadores por via da API, do Google AI Studio e da plataforma Vertex AI.

Uma edição de imagem mais precisa e consistente

O grande trunfo do novo modelo de IA do Gemini reside na sua capacidade de realizar edições precisas em imagens com base em pedidos em linguagem natural. A promessa é manter a consistência de rostos, animais e outros detalhes, um desafio com que muitas ferramentas rivais ainda se debatem. Na prática, isto significa que será possível pedir para mudar a cor da camisola de alguém numa fotografia sem que o rosto da pessoa fique distorcido ou o fundo seja alterado.

Segundo Nicole Brichtova, gestora de produto na Google DeepMind, esta atualização melhora drasticamente a integração das edições, tornando os resultados mais úteis e realistas. O modelo foi desenhado com casos de uso do dia a dia em mente, como ajudar a visualizar projetos de decoração ou jardinagem, e possui um "conhecimento do mundo" melhorado, permitindo combinar múltiplas referências num único pedido.

imagem criada pelo gemini nano banana

O segredo por detrás do "nano-banana"

Curiosamente, esta nova e poderosa ferramenta já tinha captado a atenção da comunidade online nas últimas semanas. A plataforma de avaliação colaborativa LMArena testou anonimamente um editor de imagens sob o pseudónimo "nano-banana" que impressionou os utilizadores pela sua qualidade. A Google confirmou agora ser a autora do modelo, que é, na verdade, a capacidade de imagem nativa do seu modelo Gemini 2.5 Flash.

A guerra das IAs geradoras de imagem

Este lançamento não acontece no vácuo. O campo das imagens geradas por IA tornou-se um campo de batalha crucial para as gigantes da tecnologia. Quando a OpenAI lançou o gerador de imagens nativo do GPT-4o, o uso do ChatGPT disparou, impulsionado por uma onda de memes virais.

Para não ficar para trás, a Meta anunciou recentemente que vai licenciar modelos de imagem da startup Midjourney. Com este novo editor, a Google espera conseguir diminuir a diferença para a concorrência. Atualmente, o ChatGPT regista mais de 700 milhões de utilizadores semanais, enquanto em julho, Sundar Pichai, CEO da Google, revelou que o Gemini tinha 450 milhões de utilizadores mensais.

Segurança e o combate aos deepfakes

Apesar de facilitar a criação e edição de imagens realistas, a Google garante ter salvaguardas para limitar o que pode ser criado, uma lição aprendida após polémicas passadas com a geração de imagens historicamente imprecisas. "Queremos dar aos utilizadores controlo criativo, mas não é como se tudo fosse permitido", afirmou Brichtova.

Os termos de serviço da empresa proíbem a criação de "imagens íntimas não consensuais", uma medida de segurança que contrasta com a abordagem de outras plataformas, como o Grok de Elon Musk, que permitiu a criação de imagens explícitas de celebridades. Para combater a proliferação de deepfakes, a Google aplica marcas de água visuais (watermarks) e identificadores nos metadados das imagens geradas por IA.




Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech