DeepSeek da China Abala a Indústria de IA, Tornando-se uma Mudança de Jogo de Triliões de Dólares da noite para o dia

DeepSeek da China Abala a Indústria de IA, Tornando-se uma Mudança de Jogo de Triliões de Dólares da noite para o dia

O modelo de código aberto da DeepSeek mostra que a forma de atuação dos EUA não é a única forma de atuação da IA. Depositphotos

Esta semana, os gigantes da IA dos EUA receberam um forte alerta quando a empresa chinesa emergente DeepSeek apagou um trilião de dólares sem precedentes das avaliações de líderes da indústria como a Nvidia e a OpenAI. Os players de tecnologia estabelecidos estão abalados – e por um bom motivo – já que o modelo R1 da DeepSeek prova que o caminho caro e tradicional não é mais a única opção para o progresso.

Esse momento inovador ocorre após o lançamento do mais recente modelo de IA da empresa, o DeepSeek-R1, que agora está disponível para smartphones em todo o mundo, após sua estreia no desktop em 10 de janeiro.

O DeepSeek tem estado no nosso radar há algumas semanas, após o lançamento do seu chatbot V3 em 26 de dezembro, que alegadamente teve um desempenho equivalente ao dos principais GPTs (transformadores generativos pré-treinados) dos EUA. Surpreendentemente, este feito recebeu pouca cobertura na altura – incluindo da nossa parte. Com os líderes de IA dos EUA a correrem para lançar novas funcionalidades, parecia improvável que um modelo de linguagem grande (LLM) desconhecido, por mais promissor ou fundamentalmente diferente que parecesse no papel, pudesse perturbar a indústria.

A ascensão meteórica do DeepSeek

Essa perceção mudou drasticamente da noite para o dia em 27 de janeiro de 2025. Enquanto a China se preparava para a véspera do Ano Novo Lunar, o DeepSeek disparou para se tornar o aplicativo nº 1 no espaço de IA/GPT, desencadeando uma mudança sísmica no mercado. A ascensão da empresa provocou ondas de choque em toda a indústria, eliminando milhares de milhões em valor de acções de grandes empresas como a Nvidia, a OpenAI, a Meta, a Alphabet (empresa-mãe da Google), a parceira da Nvidia, a Oracle, e várias empresas de energia e centros de dados. Elon Musk evitou por pouco as consequências, uma vez que a X já não é transaccionada publicamente.

Embora a queda do mercado seja provavelmente temporária, o DeepSeek mudou irrevogavelmente a trajetória do desenvolvimento da IA. Até agora, os EUA dominavam o campo de forma tão completa que a maioria esperava que os outros países produzissem apenas imitações abaixo da média dos seus modelos “padrão ouro”. A abordagem do DeepSeek, no entanto, abriu um novo caminho, posicionando a China como um formidável concorrente no que muitos estão agora a chamar uma corrida ao armamento digital.

O LLM da empresa foi construído utilizando antigos chips Nvidia por uma fração do custo investido por empresas como a Anthropic e a OpenAI nos seus respectivos modelos. Depositphotos

A vantagem econômica e de código aberto do DeepSeek

O DeepSeek se destaca por usar chips mais antigos e baratos e pular etapas caras no desenvolvimento do chatbot, levando seu custo de treinamento a apenas US$ 5,6 milhões – muito menos que os US$ 60 milhões do Llama 3.1 ou os mais de US$ 100 milhões do GPT-4. Ao contrário dos modelos proprietários, o R1 é de código aberto, o que lhe permite ultrapassar as restrições regionais e democratizar o desenvolvimento da IA.

Este facto abalou a indústria de IA dominada pelos EUA, levantando questões sobre se modelos eficientes e de baixo custo podem rivalizar com sistemas de última geração. Casey Newton referiu a enorme dimensão do R1 – 680 mil milhões de parâmetros – e o seu custo de formação inovador, descrevendo-o como um fator de mudança.

As origens do DeepSeek contribuem para a sua intriga. O fundador Liang Wenfung, inicialmente rejeitado pelos colegas, começou a desenvolver o modelo em 2021 usando chips Nvidia mais antigos. Em 2023, o DeepSeek foi estabelecido, e o mesmo hardware contribuiu para a maior perda de valor de mercado de todos os tempos da Nvidia. A inovação do R1 está em seu treinamento, ignorando o ajuste fino supervisionado em favor do aprendizado por reforço, reduzindo custos e melhorando o desempenho.

A versão de peso aberto do R1 distingue-o ainda mais, dando aos investigadores com recursos limitados acesso a IA de ponta. Mini versões “destiladas” tornam a experimentação ainda mais acessível. No entanto, o DeepSeek tem enfrentado desafios, incluindo ciberataques, críticas de censura e acesso restrito para utilizadores fora da China.

Apesar destes problemas, os especialistas vêem o DeepSeek como um ponto de viragem. O professor Geoff Webb observou o seu potencial para perturbar a monopolização da IA pelos gigantes tecnológicos dos EUA, promovendo a concorrência e reduzindo os custos. Salientou também a oportunidade de uma maior diversidade e acessibilidade global nas aplicações de IA.

Em poucas semanas, o DeepSeek redefiniu o desenvolvimento da IA, provando que a inovação não exige orçamentos imensos ou tecnologias exclusivas, abrindo caminho para um futuro de IA mais inclusivo.


Leia o Artigo Original: New Atlas

Leia mais: As Suas Bactérias Intestinais São a Culpa Oculta das Doenças Cardíacas?

Share this post

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *