
A empresa chinesa DeepSeek, que agitou o mercado no início de 2025 ao lançar modelos de pensamento de acesso livre, está de volta com uma nova ferramenta focada na exatidão científica. A empresa acaba de lançar o DeepSeekMath-V2, um modelo desenhado com o objetivo de alcançar um raciocínio matemático auto-verificável e uma derivação passo a passo rigorosa.
O grande foco desta nova iteração é a prova de teoremas, afastando-se da simples dependência de respostas numéricas finais corretas, que muitas vezes podem ser "alucinadas" ou obtidas por caminhos errados noutros modelos de linguagem.
Raciocínio passo a passo e verificação rigorosa
Segundo a empresa, o novo modelo utiliza um ciclo de "geração-verificação". Para tal, foi treinado um verificador preciso, baseado em LLM (Large Language Model), especificamente para a prova de teoremas. A DeepSeek treinou também um gerador de provas utilizando este verificador como modelo de recompensa.
O sistema foi desenhado para incentivar o gerador de provas a identificar e resolver problemas nas suas próprias deduções. Além disso, é utilizada uma escala de verificação para rotular automaticamente novas provas difíceis de verificar, fornecendo dados de treino contínuos para melhorar o próprio verificador. O objetivo é que a Inteligência Artificial não se limite a apresentar um resultado, mas que consiga demonstrar matematicamente como lá chegou de forma lógica e irrepreensível.
Desempenho de "ouro" e acesso aberto
O DeepSeekMath-V2 já demonstrou capacidades robustas em competições de matemática recentes. O modelo alcançou pontuações de nível ouro nas Olimpíadas Internacionais de Matemática (IMO) de 2025 e na CMO 2024. Destaca-se ainda um desempenho quase perfeito de 118/120 na competição Putnam 2024, utilizando computação escalada durante o teste.
O novo modelo é construído sobre a base do DeepSeek-V3.2-Exp-Base. Embora não se espere que resolva os "Problemas do Milénio" de imediato, o lançamento representa um passo importante para ajudar a comunidade científica a desbloquear uma melhor compreensão da matemática, o que poderá levar a novas descobertas na saúde e tecnologia.
Podes encontrar mais detalhes sobre o modelo e consultar o artigo de investigação na página dedicada no GitHub. O modelo está também disponível para download no HuggingFace.










Nenhum comentário
Seja o primeiro!