
A corrida pela supremacia na geração de imagens por Inteligência Artificial continua ao rubro e acaba de receber um novo concorrente de peso. A Black Forest Labs revelou oficialmente o FLUX.2, uma nova linha de modelos de geração de imagem concebida para entrar em competição direta com as ofertas mais recentes do mercado, incluindo o recém-lançado Nano Banana Pro da Google. Esta nova série destaca-se não só pela qualidade visual, mas também pela flexibilidade oferecida à comunidade de desenvolvimento.
Resolução massiva e consistência de personagens
Uma das grandes apostas desta nova geração é a fidelidade e a escala das imagens produzidas. O FLUX.2 permite gerar resultados com uma resolução de até quatro megapíxeis, suportando tanto a criação de raiz como a edição em alta definição.
No entanto, a verdadeira revolução parece estar no fluxo de trabalho com múltiplas imagens. O sistema consegue processar até dez imagens de referência em simultâneo. Esta funcionalidade é crucial para criadores que necessitam de manter a consistência de personagens ou estilos visuais ao longo de várias gerações, algo que tem sido um dos maiores desafios na indústria da IA generativa.
Arquitetura híbrida e tipografia precisa
Debaixo do "capô", o FLUX.2 utiliza uma arquitetura híbrida inovadora. O sistema combina o modelo de linguagem visual Mistral 3 24B com um "Rectified Flow Transformer", uma abordagem técnica que visa garantir uma disposição (layout) mais precisa dos elementos na imagem. Além disso, foi incluído um codificador "variational autoencoder" (VAE), que permite guardar e restaurar dados de imagem de forma eficiente, minimizando a perda de qualidade.
Esta base técnica resulta numa melhoria significativa na renderização de texto. Tarefas que dependem de tipografia precisa, como a criação de mockups de interface de utilizador (UI) ou layouts estruturados, beneficiam grandemente desta evolução. O modelo demonstra também uma maior aderência aos prompts, especialmente quando confrontado com instruções complexas ou composições visuais densas.
Versões para todos os utilizadores
A família FLUX.2 foi desenhada para abranger diferentes tipos de utilização, dividindo-se nas versões Pro, Flex, Dev e Klein. O modelo Pro foca-se na qualidade máxima e está acessível através da API e do "Playground" da empresa.
Para a comunidade de código aberto, a versão "dev" é a grande atração: oferece pesos abertos (open weights) num modelo com uma escala de 32 mil milhões de parâmetros, com downloads disponíveis no Hugging Face e código de referência no GitHub.
A pensar nos utilizadores domésticos, existem versões otimizadas para correr em placas gráficas de consumo, como as GeForce RTX da NVIDIA, através de interfaces como o ComfyUI. Por fim, a versão "klein" será lançada sob a licença Apache 2.0, com uma fase beta já disponível, conforme detalhado no blog oficial da Black Forest Labs.










Nenhum comentário
Seja o primeiro!