1. TugaTech » Internet e Redes » Noticias da Internet e Mercados
  Login     Registar    |                      
Siga-nos

sistema de IA da Nvidia

Depois de recentemente termos abordado os desenvolvimentos com o NemoClaw, a empresa deu agora mais um passo de gigante na evolução do seu ecossistema. Conforme detalhado no blog oficial da NVIDIA, a gigante tecnológica lançou o Nemotron 3, uma nova família de modelos que promete transformar a forma como interagimos com a tecnologia através de ferramentas descritas como superagentes.

Ao contrário dos chatbots tradicionais, que se limitam a responder a perguntas de forma passiva, este novo modelo de código aberto, equipado com 120 mil milhões de parâmetros, foi desenhado para raciocinar, planear e executar tarefas complexas do início ao fim. Trata-se de uma mudança de paradigma que afeta diretamente o setor empresarial e tecnológico.

A grande diferença deste sistema reside na sua capacidade de entender contextos profundos e agir com autonomia em ambientes digitais, permitindo que a inteligência artificial não apenas sugira soluções, mas as implemente de forma direta e independente. A arquitetura foi otimizada para oferecer uma precisão de excelência em tarefas de raciocínio lógico e manuseamento de dados, focando-se na multimodalidade e na integração fluida em fluxos de trabalho diários, onde a coordenação entre aplicações e bases de informação é exigida.

Eficiência otimizada com Mamba e Transformer

Para garantir que este nível de capacidade não resulta num consumo descontrolado de recursos, o sistema utiliza uma estrutura MoE (Mixture of Experts), onde apenas 12 mil milhões de parâmetros estão ativos durante a fase de inferência. Isto permite executar processos em larga escala sem penalizar o consumo.

A verdadeira inovação técnica encontra-se na combinação de camadas Mamba, que quadruplicam a eficiência da memória e computação, com as tradicionais camadas Transformer, que assumem o raciocínio avançado. Esta junção tecnológica evita que o modelo perca o objetivo original em tarefas prolongadas, uma caraterística considerada essencial para áreas críticas como a cibersegurança ou o design de semicondutores.

Desempenho superior e disponibilidade global

Além de apresentar a técnica Latent MoE, que ativa quatro especialistas pelo custo computacional de apenas um para melhorar a precisão sem sacrificar a velocidade, o novo modelo acelera a inferência em três vezes graças à previsão simultânea de múltiplos tokens. O resultado prático é um rendimento cinco vezes superior ao do seu antecessor.

A nova solução é executada no formato NVFP4, o que reduz a dependência de memória e permite um desempenho até quatro vezes superior na arquitetura gráfica Blackwell, quando comparada com a anterior geração Hopper, que assentava em FP8.

O Nemotron 3 já se encontra totalmente disponível de forma aberta para programadores e empresas, podendo ser explorado também através de plataformas parceiras no mercado, como é o caso do Perplexity, OpenRouter e Hugging Face.

Foto do Autor

Aficionado por tecnologia desde o tempo dos sistemas a preto e branco

Ver perfil do usuário Enviar uma mensagem privada Enviar um email Facebook do autor Twitter do autor Skype do autor

conectado
Encontrou algum erro neste artigo?



Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech