A DeepSeek confirmou o lançamento do seu novo modelo LLM de IA, que pretende melhorar ainda mais as capacidades do sistema existente. A DeepSeek entrou no mercado da IA de forma inesperada, com um modelo criado na China e com várias vantagens face aos existentes até então.
Os modelos da DeepSeek, além de serem de licença aberta, possuem um custo bastante mais reduzido em comparação com o uso dos modelos de empresas como a OpenAI. Isto tornou os mesmos uma vantagem para várias utilizações.
E a acompanhar a evolução dos mesmos, a DeepSeek acaba de confirmar a chegada da nova versão do modelo DeepSeek-V3-0324, que melhorar ainda mais as suas capacidades face ao existente.
Este modelo já se encontra disponível na plataforma Hugging Face, embora tenha quase 641 GB de tamanho total. E embora seja aberto, necessita certamente de recursos elevados para o processamento dos dados no mesmo.
Ainda assim, os testes realizados ao DeepSeek-V3-0324 apontam que o mesmo pode ser executado em sistemas modestos que se encontram em alguns lares, como é o caso do Mac Studio da Apple com o chip M3.
Segundo os testes realizados pela DeepSeek, o modelo conta com várias vantagens face à versão anterior, e deve ter um desempenho final consideravelmente superior em vários testes. Nos testes realizados este demonstrou-se mais avançado que o Claude Sonnet 3.5 da Anthropic, embora não tenham sido feitos testes com o sistema de raciocínio.
Para os interessados, o modelo encontra-se inteiramente disponível na plataforma Hugging Face, onde pode ser descarregar e usado livremente para várias tarefas. Como se trata de um modelo open source, pode ser usado igualmente em aplicações comerciais.
Nenhum comentário
Seja o primeiro!