DeepSeek Aprimora seu Modelo de IA Orientado à Matemática, Prover

Crédito: Depositphotos
O laboratório chinês de IA DeepSeek aprimorou discretamente o Prover, seu modelo de IA projetado para resolver provas e teoremas matemáticos.
Conforme relatado pelo South China Morning Post, a DeepSeek publicou a versão mais recente do Prover, V2, juntamente com uma variante destilada, na plataforma de desenvolvimento de IA Hugging Face na noite de quarta-feira. A nova versão parece ser baseada no modelo V3 da startup, que apresenta 671 bilhões de parâmetros e utiliza uma arquitetura de mistura de especialistas (MoE).
“Os parâmetros normalmente determinam a capacidade de um modelo de resolver problemas, enquanto a MoE (Mistura de Especialistas) divide as tarefas em subtarefas menores e as atribui ativamente a componentes ‘especialistas’ especializados.”
A DeepSeek atualizou o Prover pela última vez em agosto, caracterizando-o então como um modelo de IA personalizado e de acesso público, projetado para prova formal de teoremas e raciocínio matemático.
Em fevereiro, a Reuters noticiou que a DeepSeek estaria explorando a possibilidade de captar financiamento externo pela primeira vez. “A empresa lançou recentemente uma versão atualizada do V3, um modelo de uso geral, e está pronta para atualizar seu modelo de ‘raciocínio’ R1 em breve.”
Leia o Artigo Original Techcrunch
Leia mais DeepSeek: Um Guia Completo para o Aplicativo AI Chatbot
Deixe um comentário