1. TugaTech » Internet e Redes » Noticias da Internet e Mercados
  Login     Registar    |                      
Siga-nos

ChatGPT Images 2.0

A empresa norte-americana revelou o ChatGPT Images 2.0, uma nova versão do seu gerador que promete criar composições gráficas com texto perfeito e detalhado. Segundo a publicação oficial da OpenAI, esta atualização introduz capacidades avançadas para lidar com componentes visuais complexos e suporta uma vasta gama de novos idiomas, procurando segurar os milhões de utilizadores que aderiram à plataforma no início do ano passado.

Uma resposta direta à concorrência

A batalha pela liderança na criação visual continua intensa. Depois de a Google ter apresentado o Gemini Nano Banana 2 no início deste ano, com qualidade de nível Pro, a criadora do ChatGPT apresentou a sua resposta no evento de hoje liderado por Sam Altman. O novo modelo foca-se em corrigir uma das maiores frustrações tecnológicas: a renderização de palavras dentro das imagens. Agora, é possível pedir para desenhar a janela de um sistema operativo ou uma interface de conversação, e o texto aparecerá de forma exata ao longo de toda a imagem.

A equipa de desenvolvimento explicou que a versão 2.0 segue as instruções dadas com muito mais rigor. O sistema preserva os pequenos detalhes exigidos e lida de forma exímia com elementos finos como ícones, botões de interface, composições densas e estilos estéticos subtis. O salto tecnológico permite ainda desenhar obras com resolução máxima de 2K, suportando diferentes formatos de ecrã que vão desde a perspetiva muito panorâmica de 3:1 até à verticalidade extrema de 1:3.

Duas versões e otimização para vários idiomas

A novidade vai chegar dividida em duas variantes: a versão instant e a versão thinking. Quando o modo focado em reflexão é ativado, a ferramenta adquire a capacidade de consultar a internet em tempo real para procurar informações associadas ao pedido, gerando assim representações mais precisas. Este modo ganha também autonomia para criar múltiplas imagens a partir de um único pedido e de rever internamente os seus próprios resultados antes da entrega final.

Para quem interage noutras línguas, a estrutura base sofreu uma grande otimização na compreensão multilingue. O sistema consegue agora processar e exibir caracteres não latinos de forma correta, incluindo escrita em japonês, coreano, chinês, hindi e bengali.

 

Custos de acesso para programadores

Os programadores que pretendam integrar estas novidades nas suas próprias plataformas através da API gpt-image-2 já têm uma tabela de preços definida. Considerando a conversão da moeda norte-americana, o processamento de entrada custa cerca de 7,50 euros, enquanto a entrada em cache desce para perto de 1,80 euros. O custo dos dados de saída fixa-se na casa dos 28 euros.

A versão rápida da nova ferramenta já está acessível a todos os utilizadores regulares e do Codex. No entanto, se quiseres utilizar a variante de processamento avançado, terás de garantir uma subscrição ativa nos planos Plus, Pro ou Business.

Foto do Autor

Aficionado por tecnologia desde o tempo dos sistemas a preto e branco

Ver perfil do usuário Enviar uma mensagem privada Enviar um email Facebook do autor Twitter do autor Skype do autor

conectado
Encontrou algum erro neste artigo?



Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech