
Depois de recentemente termos abordado os desenvolvimentos com o NemoClaw, a empresa deu agora mais um passo de gigante na evolução do seu ecossistema. Conforme detalhado no blog oficial da NVIDIA, a gigante tecnológica lançou o Nemotron 3, uma nova família de modelos que promete transformar a forma como interagimos com a tecnologia através de ferramentas descritas como superagentes.
Ao contrário dos chatbots tradicionais, que se limitam a responder a perguntas de forma passiva, este novo modelo de código aberto, equipado com 120 mil milhões de parâmetros, foi desenhado para raciocinar, planear e executar tarefas complexas do início ao fim. Trata-se de uma mudança de paradigma que afeta diretamente o setor empresarial e tecnológico.
A grande diferença deste sistema reside na sua capacidade de entender contextos profundos e agir com autonomia em ambientes digitais, permitindo que a inteligência artificial não apenas sugira soluções, mas as implemente de forma direta e independente. A arquitetura foi otimizada para oferecer uma precisão de excelência em tarefas de raciocínio lógico e manuseamento de dados, focando-se na multimodalidade e na integração fluida em fluxos de trabalho diários, onde a coordenação entre aplicações e bases de informação é exigida.
Eficiência otimizada com Mamba e Transformer
Para garantir que este nível de capacidade não resulta num consumo descontrolado de recursos, o sistema utiliza uma estrutura MoE (Mixture of Experts), onde apenas 12 mil milhões de parâmetros estão ativos durante a fase de inferência. Isto permite executar processos em larga escala sem penalizar o consumo.
A verdadeira inovação técnica encontra-se na combinação de camadas Mamba, que quadruplicam a eficiência da memória e computação, com as tradicionais camadas Transformer, que assumem o raciocínio avançado. Esta junção tecnológica evita que o modelo perca o objetivo original em tarefas prolongadas, uma caraterística considerada essencial para áreas críticas como a cibersegurança ou o design de semicondutores.
Desempenho superior e disponibilidade global
Além de apresentar a técnica Latent MoE, que ativa quatro especialistas pelo custo computacional de apenas um para melhorar a precisão sem sacrificar a velocidade, o novo modelo acelera a inferência em três vezes graças à previsão simultânea de múltiplos tokens. O resultado prático é um rendimento cinco vezes superior ao do seu antecessor.
A nova solução é executada no formato NVFP4, o que reduz a dependência de memória e permite um desempenho até quatro vezes superior na arquitetura gráfica Blackwell, quando comparada com a anterior geração Hopper, que assentava em FP8.
O Nemotron 3 já se encontra totalmente disponível de forma aberta para programadores e empresas, podendo ser explorado também através de plataformas parceiras no mercado, como é o caso do Perplexity, OpenRouter e Hugging Face.












Nenhum comentário
Seja o primeiro!