DeepSeek da China Abala a Indústria de IA, Tornando-se uma Mudança de Jogo de Triliões de Dólares da noite para o dia

O modelo de código aberto da DeepSeek mostra que a forma de atuação dos EUA não é a única forma de atuação da IA. Depositphotos
Esta semana, os gigantes da IA dos EUA receberam um forte alerta quando a empresa chinesa emergente DeepSeek apagou um trilião de dólares sem precedentes das avaliações de líderes da indústria como a Nvidia e a OpenAI. Os players de tecnologia estabelecidos estão abalados – e por um bom motivo – já que o modelo R1 da DeepSeek prova que o caminho caro e tradicional não é mais a única opção para o progresso.
Esse momento inovador ocorre após o lançamento do mais recente modelo de IA da empresa, o DeepSeek-R1, que agora está disponível para smartphones em todo o mundo, após sua estreia no desktop em 10 de janeiro.
O DeepSeek tem estado no nosso radar há algumas semanas, após o lançamento do seu chatbot V3 em 26 de dezembro, que alegadamente teve um desempenho equivalente ao dos principais GPTs (transformadores generativos pré-treinados) dos EUA. Surpreendentemente, este feito recebeu pouca cobertura na altura – incluindo da nossa parte. Com os líderes de IA dos EUA a correrem para lançar novas funcionalidades, parecia improvável que um modelo de linguagem grande (LLM) desconhecido, por mais promissor ou fundamentalmente diferente que parecesse no papel, pudesse perturbar a indústria.
A ascensão meteórica do DeepSeek
Essa perceção mudou drasticamente da noite para o dia em 27 de janeiro de 2025. Enquanto a China se preparava para a véspera do Ano Novo Lunar, o DeepSeek disparou para se tornar o aplicativo nº 1 no espaço de IA/GPT, desencadeando uma mudança sísmica no mercado. A ascensão da empresa provocou ondas de choque em toda a indústria, eliminando milhares de milhões em valor de acções de grandes empresas como a Nvidia, a OpenAI, a Meta, a Alphabet (empresa-mãe da Google), a parceira da Nvidia, a Oracle, e várias empresas de energia e centros de dados. Elon Musk evitou por pouco as consequências, uma vez que a X já não é transaccionada publicamente.
Embora a queda do mercado seja provavelmente temporária, o DeepSeek mudou irrevogavelmente a trajetória do desenvolvimento da IA. Até agora, os EUA dominavam o campo de forma tão completa que a maioria esperava que os outros países produzissem apenas imitações abaixo da média dos seus modelos “padrão ouro”. A abordagem do DeepSeek, no entanto, abriu um novo caminho, posicionando a China como um formidável concorrente no que muitos estão agora a chamar uma corrida ao armamento digital.

O LLM da empresa foi construído utilizando antigos chips Nvidia por uma fração do custo investido por empresas como a Anthropic e a OpenAI nos seus respectivos modelos. Depositphotos
A vantagem econômica e de código aberto do DeepSeek
O DeepSeek se destaca por usar chips mais antigos e baratos e pular etapas caras no desenvolvimento do chatbot, levando seu custo de treinamento a apenas US$ 5,6 milhões – muito menos que os US$ 60 milhões do Llama 3.1 ou os mais de US$ 100 milhões do GPT-4. Ao contrário dos modelos proprietários, o R1 é de código aberto, o que lhe permite ultrapassar as restrições regionais e democratizar o desenvolvimento da IA.
Este facto abalou a indústria de IA dominada pelos EUA, levantando questões sobre se modelos eficientes e de baixo custo podem rivalizar com sistemas de última geração. Casey Newton referiu a enorme dimensão do R1 – 680 mil milhões de parâmetros – e o seu custo de formação inovador, descrevendo-o como um fator de mudança.
As origens do DeepSeek contribuem para a sua intriga. O fundador Liang Wenfung, inicialmente rejeitado pelos colegas, começou a desenvolver o modelo em 2021 usando chips Nvidia mais antigos. Em 2023, o DeepSeek foi estabelecido, e o mesmo hardware contribuiu para a maior perda de valor de mercado de todos os tempos da Nvidia. A inovação do R1 está em seu treinamento, ignorando o ajuste fino supervisionado em favor do aprendizado por reforço, reduzindo custos e melhorando o desempenho.
A versão de peso aberto do R1 distingue-o ainda mais, dando aos investigadores com recursos limitados acesso a IA de ponta. Mini versões “destiladas” tornam a experimentação ainda mais acessível. No entanto, o DeepSeek tem enfrentado desafios, incluindo ciberataques, críticas de censura e acesso restrito para utilizadores fora da China.
Apesar destes problemas, os especialistas vêem o DeepSeek como um ponto de viragem. O professor Geoff Webb observou o seu potencial para perturbar a monopolização da IA pelos gigantes tecnológicos dos EUA, promovendo a concorrência e reduzindo os custos. Salientou também a oportunidade de uma maior diversidade e acessibilidade global nas aplicações de IA.
Em poucas semanas, o DeepSeek redefiniu o desenvolvimento da IA, provando que a inovação não exige orçamentos imensos ou tecnologias exclusivas, abrindo caminho para um futuro de IA mais inclusivo.
Leia o Artigo Original: New Atlas
Leia mais: As Suas Bactérias Intestinais São a Culpa Oculta das Doenças Cardíacas?
Deixe um comentário