
A empresa norte-americana revelou o ChatGPT Images 2.0, uma nova versão do seu gerador que promete criar composições gráficas com texto perfeito e detalhado. Segundo a publicação oficial da OpenAI, esta atualização introduz capacidades avançadas para lidar com componentes visuais complexos e suporta uma vasta gama de novos idiomas, procurando segurar os milhões de utilizadores que aderiram à plataforma no início do ano passado.
Uma resposta direta à concorrência
A batalha pela liderança na criação visual continua intensa. Depois de a Google ter apresentado o Gemini Nano Banana 2 no início deste ano, com qualidade de nível Pro, a criadora do ChatGPT apresentou a sua resposta no evento de hoje liderado por Sam Altman. O novo modelo foca-se em corrigir uma das maiores frustrações tecnológicas: a renderização de palavras dentro das imagens. Agora, é possível pedir para desenhar a janela de um sistema operativo ou uma interface de conversação, e o texto aparecerá de forma exata ao longo de toda a imagem.
A equipa de desenvolvimento explicou que a versão 2.0 segue as instruções dadas com muito mais rigor. O sistema preserva os pequenos detalhes exigidos e lida de forma exímia com elementos finos como ícones, botões de interface, composições densas e estilos estéticos subtis. O salto tecnológico permite ainda desenhar obras com resolução máxima de 2K, suportando diferentes formatos de ecrã que vão desde a perspetiva muito panorâmica de 3:1 até à verticalidade extrema de 1:3.
Duas versões e otimização para vários idiomas
A novidade vai chegar dividida em duas variantes: a versão instant e a versão thinking. Quando o modo focado em reflexão é ativado, a ferramenta adquire a capacidade de consultar a internet em tempo real para procurar informações associadas ao pedido, gerando assim representações mais precisas. Este modo ganha também autonomia para criar múltiplas imagens a partir de um único pedido e de rever internamente os seus próprios resultados antes da entrega final.
Para quem interage noutras línguas, a estrutura base sofreu uma grande otimização na compreensão multilingue. O sistema consegue agora processar e exibir caracteres não latinos de forma correta, incluindo escrita em japonês, coreano, chinês, hindi e bengali.
Custos de acesso para programadores
Os programadores que pretendam integrar estas novidades nas suas próprias plataformas através da API gpt-image-2 já têm uma tabela de preços definida. Considerando a conversão da moeda norte-americana, o processamento de entrada custa cerca de 7,50 euros, enquanto a entrada em cache desce para perto de 1,80 euros. O custo dos dados de saída fixa-se na casa dos 28 euros.
A versão rápida da nova ferramenta já está acessível a todos os utilizadores regulares e do Codex. No entanto, se quiseres utilizar a variante de processamento avançado, terás de garantir uma subscrição ativa nos planos Plus, Pro ou Business.












Nenhum comentário
Seja o primeiro!