
A guerra pela supremacia na tradução baseada em Inteligência Artificial está ao rubro. Poucas horas após a OpenAI ter revelado o seu ChatGPT Translate, focado no tom e contexto, a Google respondeu com o lançamento de uma nova suite de modelos de tradução abertos: o TranslateGemma.
Baseada na arquitetura do Gemma 3, esta nova coleção representa, segundo a tecnológica, um "passo significativo na tradução aberta". O sistema é capaz de lidar com até 55 idiomas, incluindo línguas amplamente faladas como o espanhol, francês, chinês e hindi, posicionando-se como uma alternativa robusta e acessível para programadores e investigadores.
Três tamanhos para todas as necessidades: do telemóvel à nuvem
O TranslateGemma não é uma solução de tamanho único. A Google disponibilizou os modelos em três variantes de parâmetros: 4B, 12B e 27B (mil milhões). O destaque vai para a eficiência do modelo intermédio de 12B, que, segundo a empresa, consegue superar o desempenho do modelo base Gemma 3 de 27B quando testado no benchmark WMT24++. Para os programadores, isto traduz-se num maior rendimento e menor latência, sem que seja necessário sacrificar a precisão da tradução.

A versatilidade do hardware foi um dos focos deste lançamento. A versão de 4B está otimizada para inferência em dispositivos móveis, permitindo tradução local em smartphones, enquanto a versão de 12B é adequada para correr em portáteis de consumo. Já o "peso pesado" de 27B exige infraestrutura mais potente na nuvem, como uma única GPU NVIDIA H100, para funcionar em pleno. Testes realizados no benchmark Vistra mostraram ainda que o TranslateGemma apresenta uma capacidade superior para traduzir texto inserido em imagens, mesmo não tendo sido especificamente ajustado para essa tarefa.
Treino avançado com ajuda do Gemini e disponibilidade imediata
Para alcançar este nível de "densidade de inteligência", a gigante tecnológica recorreu a um processo especializado de duas fases. Inicialmente, utilizou-se o Ajuste Fino Supervisionado (Supervised Fine-Tuning), treinando os modelos base Gemma 3 com uma mistura de textos traduzidos por humanos e dados sintéticos de alta qualidade gerados pelos modelos Gemini.
Na segunda fase, foi implementada a Aprendizagem por Reforço (Reinforcement Learning). Esta etapa utilizou um grupo de modelos de recompensa, incluindo métricas avançadas como MetricX-QE e AutoMQM, para orientar o sistema na produção de traduções mais naturais e contextualmente precisas, conforme detalhado no blog oficial da Google.
Os novos modelos TranslateGemma já se encontram disponíveis para download nas plataformas Kaggle e Hugging Face, permitindo que qualquer pessoa possa começar a experimentar ou a construir novas soluções sobre esta tecnologia.










Nenhum comentário
Seja o primeiro!