1. TugaTech » Software » Noticias de Software
  Login     Registar    |                      
Siga-nos

Qwen logo

A gigante tecnológica chinesa Alibaba oficializou o lançamento do Qwen3.5, disponibilizando o modelo Qwen3.5-397B-A17B com pesos abertos (open-weight) para impulsionar a investigação e o desenvolvimento. Como um modelo de linguagem visual nativa, esta nova versão tem demonstrado resultados sólidos em diversos testes de referência, abrangendo áreas complexas como o raciocínio matemático, a programação, as capacidades de agente e a compreensão multimodal.

Arquitetura híbrida e eficiência computacional

Para alcançar este patamar de desempenho, a Alibaba implementou uma arquitetura híbrida inovadora. Esta estrutura combina a atenção linear através de "Gated Delta Networks" com um sistema esparso de mistura de especialistas (Mixture-of-Experts).

Apesar de o modelo abrigar um total impressionante de 397 mil milhões de parâmetros, a sua arquitetura permite que apenas 17 mil milhões de parâmetros estejam ativos durante cada inferência. Esta otimização é crucial, pois ajuda a reduzir os custos operacionais e a exigência computacional, mantendo intacta a capacidade de processamento da IA. A fase de pré-treino foi igualmente aprimorada para focar na potência, na eficiência energética e na versatilidade do sistema.

Mais idiomas e infraestrutura dividida

Para além dos avanços puramente técnicos, o Qwen3.5 deu um salto substancial na sua acessibilidade global. O suporte para idiomas e dialetos foi expandido de 119 para 201, permitindo que uma base de utilizadores muito mais ampla possa interagir com a plataforma. Os ganhos de desempenho face à série Qwen3 derivam também de um aumento significativo na escala das tarefas de aprendizagem por reforço e da expansão dos ambientes suportados.

Estas melhorias são sustentadas por uma infraestrutura heterogénea que separa de forma inteligente as abordagens de paralelismo para os componentes visuais e de linguagem, ajudando a evitar as ineficiências frequentemente encontradas em sistemas totalmente unificados. Os utilizadores já podem testar as capacidades do Qwen3.5 através do Qwen Chat, que agora oferece três modos de resposta: automático, pensamento e rápido. Adicionalmente, a versão de topo, o Qwen3.5-Plus, está disponível para experimentação através do Alibaba Cloud ModelStudio, conforme detalhado no blog oficial da Qwen.

Foto do Autor

Aficionado por tecnologia desde o tempo dos sistemas a preto e branco

Ver perfil do usuário Enviar uma mensagem privada Enviar um email Facebook do autor Twitter do autor Skype do autor

conectado
Encontrou algum erro neste artigo?



Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech