NVIDIA anuncia Nemotron 3: o superagente de inteligência artificial que planifica e executa tarefas

Escrito por **Pedro Fernandes (DJPRMF)** · 12/03/2026

sistema de IA da Nvidia

Depois de recentemente termos abordado os desenvolvimentos com o NemoClaw, a empresa deu agora mais um passo de gigante na evolução do seu ecossistema. Conforme detalhado no blog oficial da NVIDIA, a gigante tecnológica lançou o Nemotron 3, uma nova família de modelos que promete transformar a forma como interagimos com a tecnologia através de ferramentas descritas como superagentes.

Ao contrário dos chatbots tradicionais, que se limitam a responder a perguntas de forma passiva, este novo modelo de código aberto, equipado com 120 mil milhões de parâmetros, foi desenhado para raciocinar, planear e executar tarefas complexas do início ao fim. Trata-se de uma mudança de paradigma que afeta diretamente o setor empresarial e tecnológico.

A grande diferença deste sistema reside na sua capacidade de entender contextos profundos e agir com autonomia em ambientes digitais, permitindo que a inteligência artificial não apenas sugira soluções, mas as implemente de forma direta e independente. A arquitetura foi otimizada para oferecer uma precisão de excelência em tarefas de raciocínio lógico e manuseamento de dados, focando-se na multimodalidade e na integração fluida em fluxos de trabalho diários, onde a coordenação entre aplicações e bases de informação é exigida.

Eficiência otimizada com Mamba e Transformer

Para garantir que este nível de capacidade não resulta num consumo descontrolado de recursos, o sistema utiliza uma estrutura MoE (Mixture of Experts), onde apenas 12 mil milhões de parâmetros estão ativos durante a fase de inferência. Isto permite executar processos em larga escala sem penalizar o consumo.

A verdadeira inovação técnica encontra-se na combinação de camadas Mamba, que quadruplicam a eficiência da memória e computação, com as tradicionais camadas Transformer, que assumem o raciocínio avançado. Esta junção tecnológica evita que o modelo perca o objetivo original em tarefas prolongadas, uma caraterística considerada essencial para áreas críticas como a cibersegurança ou o design de semicondutores.

Desempenho superior e disponibilidade global

Além de apresentar a técnica Latent MoE, que ativa quatro especialistas pelo custo computacional de apenas um para melhorar a precisão sem sacrificar a velocidade, o novo modelo acelera a inferência em três vezes graças à previsão simultânea de múltiplos tokens. O resultado prático é um rendimento cinco vezes superior ao do seu antecessor.

A nova solução é executada no formato NVFP4, o que reduz a dependência de memória e permite um desempenho até quatro vezes superior na arquitetura gráfica Blackwell, quando comparada com a anterior geração Hopper, que assentava em FP8.

O Nemotron 3 já se encontra totalmente disponível de forma aberta para programadores e empresas, podendo ser explorado também através de plataformas parceiras no mercado, como é o caso do Perplexity, OpenRouter e Hugging Face.

Nenhum comentário

Seja o primeiro!