1. TugaTech » Software » Noticias de Software
  Login     Registar    |                      
Siga-nos

Logo do modelo de IA da Alibaba Qwen

 

A gigante tecnológica chinesa Alibaba apresentou recentemente a sua mais recente família de modelos de inteligência artificial, denominada Qwen3. A empresa afirma que estes novos modelos não só rivalizam como, em certos cenários, superam as capacidades dos modelos mais avançados da Google e da OpenAI, intensificando a corrida global pela supremacia em IA.

 

Grande parte desta nova família de modelos Qwen3 já se encontra, ou estará em breve, disponível para download sob uma licença "aberta" (open-source) através de plataformas populares como Hugging Face e GitHub. A gama de modelos é vasta, variando desde uns modestos 0.6 mil milhões de parâmetros até uns impressionantes 235 mil milhões. Os parâmetros, de forma simplificada, correlacionam-se com a complexidade e a capacidade de resolução de problemas de um modelo, sendo que, geralmente, mais parâmetros indicam um melhor desempenho.

 

O que Traz de Novo o Qwen3?

 

Segundo a Alibaba, os modelos Qwen3 destacam-se por serem "híbridos". Isto significa que possuem a capacidade de dedicar tempo a "raciocinar" sobre problemas complexos, analisando-os passo a passo, mas também conseguem responder rapidamente a solicitações mais simples. Este modo de "raciocínio", semelhante ao que se vê em modelos como o o3 da OpenAI, permite uma espécie de auto-verificação, embora possa implicar uma maior latência na resposta. A equipa Qwen salienta que esta integração "permite aos utilizadores configurar orçamentos específicos para cada tarefa com maior facilidade".

 

Alguns modelos da família Qwen3 adotam também uma arquitetura de "Mistura de Especialistas" (MoE - Mixture of Experts). Esta abordagem pode ser computacionalmente mais eficiente, dividindo tarefas complexas em sub-tarefas que são delegadas a modelos "especialistas" mais pequenos e focados.

A capacidade multilingue é outro ponto forte, com os modelos Qwen3 a suportarem 119 línguas e dialetos, um avanço significativo face a versões anteriores. Foram treinados num conjunto massivo de dados, com cerca de 36 biliões de tokens (as unidades de dados processadas pelos modelos), provenientes de fontes diversas como manuais, código, pares de pergunta-resposta e até dados gerados por IA.

 

Desempenho em Testes: Como se Compara?

 

A Alibaba afirma que estas melhorias resultaram num salto qualitativo face à geração anterior, Qwen2/2.5. Embora nenhum modelo Qwen3 individualmente destrone completamente os modelos de topo mais recentes, como o o4-mini da OpenAI, os resultados em testes comparativos (benchmarks) são notáveis.

 

  • Programação e Matemática: Em plataformas como Codeforces (competições de programação) e no exigente teste de matemática AIME, o modelo mais potente da família, Qwen-3-235B-A22B (com 22 mil milhões de parâmetros ativos), demonstrou superar o o3-mini da OpenAI e igualar ou superar o Gemini 2.5 Pro da Google em certos aspetos. No entanto, este modelo de topo ainda não está publicamente disponível.
  • Modelos Públicos: O maior modelo Qwen3 acessível ao público, o Qwen3-32B (32 mil milhões de parâmetros), mostra-se bastante competitivo, superando modelos como o o1 da OpenAI em vários testes, incluindo o benchmark de codificação LiveCodeBench. Resultados recentes indicam também um desempenho impressionante de modelos mais pequenos da família, com o Qwen3-4B a rivalizar com o anterior Qwen2.5-72B nalguns testes.
  • Capacidades Adicionais: A Alibaba destaca ainda a excelência do Qwen3 na capacidade de utilizar ferramentas externas (tool-calling), seguir instruções complexas e replicar formatos de dados específicos.

Testes de desempenho do modelo

 

Acesso Aberto e Implicações no Mercado

 

A disponibilização da maioria dos modelos Qwen3 em regime open-source reforça a tendência de modelos de código aberto a aproximarem-se do desempenho de sistemas proprietários. Esta estratégia não só pressiona laboratórios como a OpenAI a inovar, mas também contorna, em parte, as restrições impostas por alguns países à exportação de chips avançados necessários para treinar estes modelos.

 

Como refere Tuhin Srivastava, cofundador da Baseten (plataforma cloud de IA), modelos de ponta e abertos como o Qwen3 serão, sem dúvida, utilizados internamente na China e demonstram que as empresas estão tanto a construir as suas próprias ferramentas como a utilizar soluções de empresas como a Anthropic e a OpenAI.

 

Para além do download direto em plataformas como Hugging Face, GitHub e ModelScope, os modelos Qwen3 estão também acessíveis através de fornecedores de cloud, como Fireworks AI e Hyperbolic, e podem ser integrados localmente com ferramentas como Ollama e LMStudio.

O lançamento do Qwen3 marca mais um passo significativo na evolução da inteligência artificial, demonstrando a crescente capacidade dos laboratórios chineses e a importância estratégica dos modelos de código aberto no panorama tecnológico global.

 




Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech