
A Nvidia continua a apostar forte na evolução da inteligência artificial e apresentou agora a família Nemotron 3 de modelos abertos. Esta nova linha, acompanhada por bibliotecas e conjuntos de dados específicos, tem como grande objetivo avançar a IA baseada em agentes ("agentic AI") em diversas indústrias.
Os novos modelos utilizam uma arquitetura híbrida de mistura latente de especialistas (latent mixture of experts), desenhada especificamente para reduzir a sobrecarga de comunicação, limitar o desvio de contexto e baixar os custos de inferência, suportando ao mesmo tempo sistemas multiagente escaláveis.
Três variantes para diferentes níveis de complexidade
A gama Nemotron 3 divide-se em três variantes distintas, permitindo aos programadores alinhar a escolha do modelo com a complexidade da tarefa e os objetivos de custo. O modelo de entrada é o Nemotron 3 Nano, com 30 mil milhões de parâmetros (sendo 3 mil milhões ativos por tarefa).
Para cargas de trabalho mais exigentes, a marca apresenta o Nemotron 3 Super, com 100 mil milhões de parâmetros (10 mil milhões ativos por token), e o topo de gama Nemotron 3 Ultra, que atinge os impressionantes 500 mil milhões de parâmetros (com 50 mil milhões ativos por token).
Segundo revela a Nvidia em comunicado oficial, esta estrutura flexível visa otimizar os recursos computacionais necessários para cada tipo de aplicação.
Desempenho e disponibilidade futura
Comparativamente ao seu antecessor, o Nemotron 2 Nano, a nova versão Nano oferece um débito até quatro vezes superior e reduz a geração de tokens de raciocínio em até sessenta por cento. Além disso, suporta tarefas de longo horizonte graças a uma janela de contexto de um milhão de tokens.
Os modelos Super e Ultra tiram partido do treino NVFP4 de 4 bits na arquitetura Blackwell da Nvidia, o que permite reduzir o uso de memória e acelerar o treino. Testes independentes colocam o Nemotron 3 Nano no topo da sua classe em termos de abertura, eficiência e precisão.
O Nemotron 3 Nano já se encontra disponível através do Hugging Face e de vários fornecedores de inferência, bem como através de um microserviço NVIDIA NIM. Já as variantes mais robustas, Super e Ultra, têm chegada prevista para a primeira metade de 2026.










Nenhum comentário
Seja o primeiro!