
A Nvidia anunciou um novo produto que promete acelerar ainda mais a revolução da Inteligência Artificial. Chama-se Rubin CPX e é uma nova classe de GPU, desenhada de raiz para o processamento de contexto massivo. Isto abrange tarefas extremamente exigentes, como a programação em larga escala e a geração de vídeo.
O novo hardware foi concebido para separar a tarefa de compreender um pedido de IA da tarefa de gerar a resposta, um processo que, segundo a Nvidia, tornará todo o fluxo de trabalho muito mais eficiente para os seus clientes.
Uma arquitetura inteligente para maior eficiência
Esta nova peça de hardware foi projetada para funcionar como parte da plataforma mais ampla Vera Rubin, que integra tanto os CPUs Vera como as GPUs Rubin. A Nvidia afirma que a versão completa para bastidores, a Vera Rubin NVL144 CPX, consegue atingir uns impressionantes 8 exaflops de desempenho em IA.
A GPU Rubin CPX autónoma vem equipada com 128GB de memória GDDR7. A empresa promete que o novo hardware tem capacidades de atenção 3x mais rápidas e oferece até 30 petaflops de computação, utilizando a precisão de 4 bits NVFP4 da empresa.
A visão do CEO e o ecossistema de software
Jensen Huang, CEO e fundador da Nvidia, comparou a nova aposta à icónica RTX, afirmando que "tal como a RTX revolucionou os gráficos e a IA física, a Rubin CPX é a primeira GPU CUDA construída de raiz para IA de contexto massivo, onde os modelos raciocinam através de milhões de tokens de conhecimento de uma só vez". Huang também tentou quantificar o retorno do investimento para os clientes, sugerindo que uma implementação de 100 milhões de dólares do novo hardware poderia gerar 5 mil milhões de dólares em receita.
A Nvidia garante que o hardware será suportado por todo o seu ecossistema de software. Isto inclui o Nemotron, a sua família de modelos abertos e multimodais, concebidos para construir agentes de IA empresariais, ou seja, sistemas destinados a lidar com tarefas complexas de forma autónoma. Os modelos Nemotron são oferecidos em diferentes tamanhos, desde o Nano para aplicações no dispositivo, ao Super para configurações de GPU única, e o Ultra para grandes centros de dados.
As primeiras reações e a data de chegada
A empresa revela que companhias como a Cursor e a Runway já estão a explorar o potencial do novo sistema de chips. Cristóbal Valenzuela, CEO da Runway, afirmou que este representa um "salto no desempenho" para os fluxos de trabalho criativos.
"Vemos a Rubin CPX como um grande salto de desempenho, apoiando estas cargas de trabalho exigentes para construir ferramentas criativas mais gerais e inteligentes. Isto significa que os criadores — desde artistas independentes a grandes estúdios — podem obter uma velocidade, realismo e controlo sem precedentes no seu trabalho", explicou Valenzuela.
A Nvidia espera que o novo chip esteja disponível no final de 2026.