1. TugaTech » Software » Noticias de Software
  Login     Registar    |                      
Siga-nos

Aplicação do DeepSeek

 

Ainda se lembra do burburinho que a DeepSeek causou no início do ano? Esta startup chinesa, até então relativamente desconhecida, abanou o setor tecnológico com o lançamento do R1, um modelo de IA de raciocínio, gratuito e de código aberto. O mais impressionante? Apresentava um desempenho equiparável aos modelos de topo de gigantes como a OpenAI, Anthropic e Google. Agora, a DeepSeek volta à carga com a primeira grande atualização: o DeepSeek-R1-0528.

 

O "terramoto" inicial da DeepSeek com o R1

 

O primeiro modelo R1 não se destacou apenas por ser open-source e altamente performante. A sua eficiência foi notável, utilizando consideravelmente menos recursos para treino. Este feito foi alcançado através de uma combinação de técnicas, incluindo uma arquitetura refinada de "mistura de peritos" (MoE), métodos de compressão avançados, capacidades de previsão multi-token e uma metodologia de treino que prioriza a aprendizagem por reforço. Basicamente, mostraram que é possível fazer mais com menos, democratizando o acesso a IA de ponta.

 

A nova vaga: DeepSeek-R1-0528 chega com promessas

 

Recentemente, a DeepSeek disponibilizou a sua mais recente atualização, o DeepSeek-R1-0528. O novo modelo e os seus pesos já se encontram acessíveis na popular plataforma Hugging Face. Embora a empresa ainda não tenha publicado benchmarks oficiais, a comunidade de entusiastas e programadores de IA não perdeu tempo e já começou a partilhar os primeiros resultados – e estes parecem ser, no mínimo, impressionantes.

 

Primeiros testes já colocam R1-0528 no topo

 

De acordo com o LiveCodeBench, uma plataforma de referência para avaliar as capacidades de programação de modelos de linguagem extensos (LLM), o DeepSeek-R1-0528 já garantiu um impressionante 4º lugar. Esta classificação coloca-o à frente de modelos bem conhecidos como o o4 Mini (Low), Grok-3-mini (High) e até o Gemini 2.5 Flash Preview da Google. Um feito notável que demonstra o potencial desta nova iteração.

 

Raciocínio profundo e prolongado: a cereja no topo do bolo?

 

Para além dos benchmarks de programação, chegam também relatos entusiasmantes sobre as capacidades de raciocínio do modelo. O utilizador @Chetaslua na plataforma X (anteriormente Twitter) referiu que esta última atualização do DeepSeek R1 demonstra agora um raciocínio profundo, semelhante aos modelos da Google. Mais surpreendente ainda é a alegação de que o modelo consegue "refletir" ou processar informação durante períodos que podem ir de 30 a 60 minutos, dependendo da tarefa. Esta capacidade de "pensamento" prolongado pode abrir portas a novas aplicações e a uma resolução de problemas mais complexa.

 

O que esperar da DeepSeek?

 

A DeepSeek continua a provar que não é preciso ser um gigante tecnológico para inovar significativamente no campo da inteligência artificial. Com o lançamento do DeepSeek-R1-0528, a fasquia volta a subir, especialmente no que diz respeito a modelos open-source. Resta agora aguardar pelos benchmarks oficiais e por mais testes da comunidade para perceber a real dimensão do impacto desta nova versão. Uma coisa é certa: o mundo da IA tem mais um forte candidato a observar de perto.




Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech