1. TugaTech » Internet e Redes » Noticias da Internet e Mercados
  Login     Registar    |                      
Siga-nos

DeepSeek a funcionar sobre um smartphone

 

Parece que a empresa chinesa DeepSeek está prestes a lançar um novo modelo de Inteligência Artificial (IA) no mercado. Detalhes sobre o seu próximo modelo, apelidado de "DeepSeek R2", começaram a surgir online, gerando expectativa sobre o seu potencial impacto.

 

O primeiro modelo de grande destaque da DeepSeek demonstrou que a China possui capacidade para desenvolver modelos de IA de ponta, surpreendendo os mercados ocidentais. Agora, informações não oficiais veiculadas por meios de comunicação chineses e leakers de IA sugerem que o DeepSeek R2 poderá voltar a agitar o panorama da inteligência artificial.

 

É fundamental, no entanto, abordar estas informações com cautela, uma vez que a DeepSeek ainda não confirmou oficialmente quaisquer detalhes sobre o novo modelo.

 

Arquitetura Híbrida e Desempenho Promissor

 

Segundo os rumores, o R2 adotará uma arquitetura híbrida MoE (Mixture of Experts), potencialmente uma versão mais avançada da implementação existente. Esta abordagem combina diferentes "especialistas" dentro do modelo, otimizando-o para tarefas complexas.

 

Especula-se que o DeepSeek R2 poderá apresentar um número de parâmetros substancialmente maior que os modelos anteriores da empresa, como o DeepSeek V2 (com 236 mil milhões de parâmetros), colocando-o teoricamente como um concorrente direto de gigantes como o GPT-4 Turbo da OpenAI ou o Gemini Pro da Google. Embora o desempenho exato permaneça desconhecido, os modelos anteriores da DeepSeek já demonstraram capacidades impressionantes, especialmente em áreas como programação e raciocínio.

 

A Revolução nos Custos?

 

Um dos aspetos mais disruptivos apontados pelos rumores é o custo. Alega-se que o DeepSeek R2 poderá oferecer um custo por token drasticamente inferior ao de modelos como o GPT-4.

 

Fontes não oficiais mencionam reduções que poderiam tornar o R2 numa das opções mais económicas do mercado para empresas que necessitem de implementar IA em larga escala. Embora os valores exatos para o R2 sejam especulativos, modelos como o DeepSeek V3 já apresentam preços significativamente mais baixos que os concorrentes diretos. Se confirmado, este fator económico poderá ser decisivo para a sua adoção.

 

Aposta em Hardware Nacional: Chips Huawei Ascend

 

Outro dado interessante revelado pelas fugas de informação é a alegada utilização predominante de hardware chinês no treino do R2. O modelo terá sido treinado utilizando clusters de chips Ascend 910B da Huawei, atingindo uma impressionante taxa de utilização de 82% e uma capacidade de computação de 512 PetaFLOPS (FP16).

 

Esta aposta em equipamento doméstico sugere um movimento da DeepSeek no sentido de uma "integração vertical" da cadeia de fornecimento de IA, diminuindo a dependência de tecnologia estrangeira. Fugas de informação recentes chegam a afirmar que esta abordagem permitiu reduzir os custos de treino em mais de 97% comparativamente a obter desempenho semelhante com hardware concorrente mais antigo.

 

Expectativa vs. Realidade

 

É crucial reiterar que toda a informação sobre o DeepSeek R2 é, neste momento, especulativa e baseada em rumores e fugas de informação não confirmadas oficialmente pela empresa. A DeepSeek já desmentiu rumores anteriores sobre datas de lançamento.

 

Contudo, o potencial descrito nestas informações não oficiais é suficiente para colocar o mercado de IA em alerta. Resta aguardar por um anúncio oficial para confirmar se o DeepSeek R2 corresponderá às elevadas expectativas geradas.




Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech