1. TugaTech » Internet e Redes » Noticias da Internet e Mercados
  Login     Registar    |                      
Siga-nos

Google Gemini banana

A Google está a intensificar a sua aposta na inteligência artificial com uma atualização significativa para o seu chatbot Gemini. A gigante tecnológica lançou um novo modelo de imagem, denominado Gemini 2.5 Flash Image, que promete dar aos utilizadores um controlo mais refinado sobre a edição de fotografias, numa tentativa clara de alcançar as populares ferramentas da OpenAI e atrair utilizadores do ChatGPT.

A atualização, que começa a ser disponibilizada esta terça-feira, chega a todos os utilizadores através da aplicação Gemini e também aos programadores por via da API, do Google AI Studio e da plataforma Vertex AI.

Uma edição de imagem mais precisa e consistente

O grande trunfo do novo modelo de IA do Gemini reside na sua capacidade de realizar edições precisas em imagens com base em pedidos em linguagem natural. A promessa é manter a consistência de rostos, animais e outros detalhes, um desafio com que muitas ferramentas rivais ainda se debatem. Na prática, isto significa que será possível pedir para mudar a cor da camisola de alguém numa fotografia sem que o rosto da pessoa fique distorcido ou o fundo seja alterado.

Segundo Nicole Brichtova, gestora de produto na Google DeepMind, esta atualização melhora drasticamente a integração das edições, tornando os resultados mais úteis e realistas. O modelo foi desenhado com casos de uso do dia a dia em mente, como ajudar a visualizar projetos de decoração ou jardinagem, e possui um "conhecimento do mundo" melhorado, permitindo combinar múltiplas referências num único pedido.

imagem criada pelo gemini nano banana

O segredo por detrás do "nano-banana"

Curiosamente, esta nova e poderosa ferramenta já tinha captado a atenção da comunidade online nas últimas semanas. A plataforma de avaliação colaborativa LMArena testou anonimamente um editor de imagens sob o pseudónimo "nano-banana" que impressionou os utilizadores pela sua qualidade. A Google confirmou agora ser a autora do modelo, que é, na verdade, a capacidade de imagem nativa do seu modelo Gemini 2.5 Flash.

A guerra das IAs geradoras de imagem

Este lançamento não acontece no vácuo. O campo das imagens geradas por IA tornou-se um campo de batalha crucial para as gigantes da tecnologia. Quando a OpenAI lançou o gerador de imagens nativo do GPT-4o, o uso do ChatGPT disparou, impulsionado por uma onda de memes virais.

Para não ficar para trás, a Meta anunciou recentemente que vai licenciar modelos de imagem da startup Midjourney. Com este novo editor, a Google espera conseguir diminuir a diferença para a concorrência. Atualmente, o ChatGPT regista mais de 700 milhões de utilizadores semanais, enquanto em julho, Sundar Pichai, CEO da Google, revelou que o Gemini tinha 450 milhões de utilizadores mensais.

Segurança e o combate aos deepfakes

Apesar de facilitar a criação e edição de imagens realistas, a Google garante ter salvaguardas para limitar o que pode ser criado, uma lição aprendida após polémicas passadas com a geração de imagens historicamente imprecisas. "Queremos dar aos utilizadores controlo criativo, mas não é como se tudo fosse permitido", afirmou Brichtova.

Os termos de serviço da empresa proíbem a criação de "imagens íntimas não consensuais", uma medida de segurança que contrasta com a abordagem de outras plataformas, como o Grok de Elon Musk, que permitiu a criação de imagens explícitas de celebridades. Para combater a proliferação de deepfakes, a Google aplica marcas de água visuais (watermarks) e identificadores nos metadados das imagens geradas por IA.

Foto do Autor

Aficionado por tecnologia desde o tempo dos sistemas a preto e branco

Ver perfil do usuário Enviar uma mensagem privada Enviar um email Facebook do autor Twitter do autor Skype do autor

conectado
Encontrou algum erro neste artigo?



Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech