1. TugaTech » Software » Noticias de Software
  Login     Registar    |                      
Siga-nos

modelo AI Mamba 3

A Together AI revelou o Mamba-3, uma nova arquitetura de modelos de estado (SSM) que promete elevar a fasquia da eficiência computacional. Com um foco claro na rapidez de resposta, este novo design utiliza uma fórmula de recorrência mais expressiva e um sistema de rastreio de estados com valores complexos. Segundo o blog oficial da Together AI, o objetivo principal é priorizar a rapidez no momento da utilização (inferência) em vez de se focar apenas nos tempos de treino dos sistemas.

Uma das grandes inovações apresentadas é a introdução de uma variante MIMO (Multi-Input, Multi-Output), que permite aumentar a precisão dos resultados sem introduzir qualquer atraso na descodificação dos dados. Trata-se de um avanço significativo para quem desenvolve soluções de IA, garantindo respostas mais velozes em ambientes de produção e maior fluidez na interação.

Eficiência de processamento e arquitetura aberta

Para garantir que esta tecnologia possa ser aproveitada ao máximo pela comunidade, a equipa optou por lançar os kernels em regime de código aberto. Através da utilização de ferramentas como Triton, TileLang e CuTe DSL, os programadores conseguem agora otimizar o desempenho do hardware de forma mais direta. Esta abertura permite que os especialistas explorem novas formas de implementar o Mamba-3 em diferentes cenários, desde servidores de grande escala até aplicações que correm localmente em computadores pessoais.

A estrutura foi desenhada para ser totalmente compatível com o hardware atual, minimizando os estrangulamentos que muitas vezes ocorrem no processamento de grandes volumes de informação. Ao remover estas barreiras técnicas, o Mamba-3 consegue manter um desempenho constante, mesmo em tarefas que exigem um processamento de dados mais intenso e complexo por parte do sistema.

Resultados superam os modelos da concorrência

Os testes de benchmark realizados pela empresa colocam o Mamba-3 numa posição de destaque no mercado tecnológico. Na escala de 1,5 mil milhões de parâmetros, a versão SISO (Single-Input, Single-Output) conseguiu bater recordes de latência tanto no carregamento inicial de dados (prefill) como na descodificação de texto.

Os dados técnicos mostram que esta nova arquitetura supera o anterior Mamba-2, o Gated DeltaNet e até o Llama-3.2-1B da Meta. Estes resultados comprovam que, para determinadas cargas de trabalho, os modelos baseados em espaços de estados podem ser substancialmente mais eficazes do que os modelos de linguagem tradicionais, oferecendo uma alternativa sólida e rápida para o setor da tecnologia.

Foto do Autor

Aficionado por tecnologia desde o tempo dos sistemas a preto e branco

Ver perfil do usuário Enviar uma mensagem privada Enviar um email Facebook do autor Twitter do autor Skype do autor

conectado
Encontrou algum erro neste artigo?



Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech