
A gigante tecnológica chinesa Alibaba oficializou o lançamento do Qwen3.5, disponibilizando o modelo Qwen3.5-397B-A17B com pesos abertos (open-weight) para impulsionar a investigação e o desenvolvimento. Como um modelo de linguagem visual nativa, esta nova versão tem demonstrado resultados sólidos em diversos testes de referência, abrangendo áreas complexas como o raciocínio matemático, a programação, as capacidades de agente e a compreensão multimodal.
Arquitetura híbrida e eficiência computacional
Para alcançar este patamar de desempenho, a Alibaba implementou uma arquitetura híbrida inovadora. Esta estrutura combina a atenção linear através de "Gated Delta Networks" com um sistema esparso de mistura de especialistas (Mixture-of-Experts).
Apesar de o modelo abrigar um total impressionante de 397 mil milhões de parâmetros, a sua arquitetura permite que apenas 17 mil milhões de parâmetros estejam ativos durante cada inferência. Esta otimização é crucial, pois ajuda a reduzir os custos operacionais e a exigência computacional, mantendo intacta a capacidade de processamento da IA. A fase de pré-treino foi igualmente aprimorada para focar na potência, na eficiência energética e na versatilidade do sistema.
Mais idiomas e infraestrutura dividida
Para além dos avanços puramente técnicos, o Qwen3.5 deu um salto substancial na sua acessibilidade global. O suporte para idiomas e dialetos foi expandido de 119 para 201, permitindo que uma base de utilizadores muito mais ampla possa interagir com a plataforma. Os ganhos de desempenho face à série Qwen3 derivam também de um aumento significativo na escala das tarefas de aprendizagem por reforço e da expansão dos ambientes suportados.
Estas melhorias são sustentadas por uma infraestrutura heterogénea que separa de forma inteligente as abordagens de paralelismo para os componentes visuais e de linguagem, ajudando a evitar as ineficiências frequentemente encontradas em sistemas totalmente unificados. Os utilizadores já podem testar as capacidades do Qwen3.5 através do Qwen Chat, que agora oferece três modos de resposta: automático, pensamento e rápido. Adicionalmente, a versão de topo, o Qwen3.5-Plus, está disponível para experimentação através do Alibaba Cloud ModelStudio, conforme detalhado no blog oficial da Qwen.












Nenhum comentário
Seja o primeiro!