1. TugaTech » Internet e Redes » Noticias da Internet e Mercados
  Login     Registar    |                      
Siga-nos

IA

A empresa DeepSeek AI, uma entidade chinesa focada no desenvolvimento de tecnologias de IA, encontra-se a trabalhar num novo “padrão” para a base de modelos LLM abertos, que podem ser livremente usados para tecnologias de IA no mercado.

A entidade tem vindo a trabalhar no seu próprio modelo de IA, que será inteiramente open source, e poderá ser usado por qualquer pessoa interessada para desenvolver as suas tecnologias de IA. O DeepSeek-V3 é a sua mais recente criação, apontando várias melhorias face às gerações anteriores, e até a outros modelos abertos LLM.

O DeepSeek-V3 conta com um total de 671 mil milhões de parâmetros, e 37 mil milhões ativados por cada token. O mesmo é considerado um modelo Mixture-of-Experts (MoE), e segundo os testes da entidade, demonstra-se como um dos modelos open source mais avançados atualmente existentes.

Na realidade, este modelo até pode apresentar um desempenho superior ao de modelos fechados, como o GPT-4o da OpenAI e o Claude 3.5.

testes benchmark DeepSeek-V3

Nos principais testes realizados a sistemas de modelos LLM, o DeepSeek-V3 supera praticamente todas as alternativas no mercado, demarcando-se como uma solução poderosa para integrar em novas tecnologias de IA. Ao mesmo tempo, o DeepSeek-V3 é também mais eficiente na forma como pode ser treinado com novas informações, além de ter custos mais reduzidos para uso em geral.

A partir de 8 de fevereiro, a entrada do DeepSeek-V3 custará US$ 0,27/milhão de tokens (US$ 0,07/milhão de tokens com cache), e a saída custará US$ 1,10/milhão de tokens. Esse preço é quase um décimo do que a OpenAI e outras empresas líderes de IA cobram atualmente por seus principais modelos de fronteira.

Segundo a equipa de desenvolvimento do modelo, “A missão da DeepSeek é inabalável. Estamos entusiasmados em compartilhar nosso progresso com a comunidade e ver a lacuna entre modelos abertos e fechados diminuindo. Isso é só o começo! Aguarde o suporte multimodal e outros recursos de ponta no ecossistema DeepSeek”.

Mais detalhes sobre o modelo podem ser encontrados diretamente no GitHub do projeto.

Foto do Autor

Aficionado por tecnologia desde o tempo dos sistemas a preto e branco

Ver perfil do usuário Enviar uma mensagem privada Enviar um email Facebook do autor Twitter do autor Skype do autor

conectado
Encontrou algum erro neste artigo?



Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech