1. TugaTech » Internet e Redes » Noticias da Internet e Mercados
  Login     Registar    |                      
Siga-nos

IA

 

A empresa DeepSeek AI, uma entidade chinesa focada no desenvolvimento de tecnologias de IA, encontra-se a trabalhar num novo “padrão” para a base de modelos LLM abertos, que podem ser livremente usados para tecnologias de IA no mercado.

 

A entidade tem vindo a trabalhar no seu próprio modelo de IA, que será inteiramente open source, e poderá ser usado por qualquer pessoa interessada para desenvolver as suas tecnologias de IA. O DeepSeek-V3 é a sua mais recente criação, apontando várias melhorias face às gerações anteriores, e até a outros modelos abertos LLM.

 

O DeepSeek-V3 conta com um total de 671 mil milhões de parâmetros, e 37 mil milhões ativados por cada token. O mesmo é considerado um modelo Mixture-of-Experts (MoE), e segundo os testes da entidade, demonstra-se como um dos modelos open source mais avançados atualmente existentes.

Na realidade, este modelo até pode apresentar um desempenho superior ao de modelos fechados, como o GPT-4o da OpenAI e o Claude 3.5.

 

testes benchmark DeepSeek-V3

 

Nos principais testes realizados a sistemas de modelos LLM, o DeepSeek-V3 supera praticamente todas as alternativas no mercado, demarcando-se como uma solução poderosa para integrar em novas tecnologias de IA. Ao mesmo tempo, o DeepSeek-V3 é também mais eficiente na forma como pode ser treinado com novas informações, além de ter custos mais reduzidos para uso em geral.

A partir de 8 de fevereiro, a entrada do DeepSeek-V3 custará US$ 0,27/milhão de tokens (US$ 0,07/milhão de tokens com cache), e a saída custará US$ 1,10/milhão de tokens. Esse preço é quase um décimo do que a OpenAI e outras empresas líderes de IA cobram atualmente por seus principais modelos de fronteira.

 

Segundo a equipa de desenvolvimento do modelo, “A missão da DeepSeek é inabalável. Estamos entusiasmados em compartilhar nosso progresso com a comunidade e ver a lacuna entre modelos abertos e fechados diminuindo. Isso é só o começo! Aguarde o suporte multimodal e outros recursos de ponta no ecossistema DeepSeek”.

 

Mais detalhes sobre o modelo podem ser encontrados diretamente no GitHub do projeto.




Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech