DeepSeek da China Abala a Indústria de IA, Tornando-se uma Mudança de Jogo de Triliões de Dólares da noite para o dia

By Jorge Paka Inteligência Artificial China, DeepSeek, Indústria de IA 0 Comments

O modelo de código aberto da DeepSeek mostra que a forma de atuação dos EUA não é a única forma de atuação da IA. Depositphotos

Esta semana, os gigantes da IA dos EUA receberam um forte alerta quando a empresa chinesa emergente DeepSeek apagou um trilião de dólares sem precedentes das avaliações de líderes da indústria como a Nvidia e a OpenAI. Os players de tecnologia estabelecidos estão abalados – e por um bom motivo – já que o modelo R1 da DeepSeek prova que o caminho caro e tradicional não é mais a única opção para o progresso.

Esse momento inovador ocorre após o lançamento do mais recente modelo de IA da empresa, o DeepSeek-R1, que agora está disponível para smartphones em todo o mundo, após sua estreia no desktop em 10 de janeiro.

O DeepSeek tem estado no nosso radar há algumas semanas, após o lançamento do seu chatbot V3 em 26 de dezembro, que alegadamente teve um desempenho equivalente ao dos principais GPTs (transformadores generativos pré-treinados) dos EUA. Surpreendentemente, este feito recebeu pouca cobertura na altura – incluindo da nossa parte. Com os líderes de IA dos EUA a correrem para lançar novas funcionalidades, parecia improvável que um modelo de linguagem grande (LLM) desconhecido, por mais promissor ou fundamentalmente diferente que parecesse no papel, pudesse perturbar a indústria.

A ascensão meteórica do DeepSeek

Essa perceção mudou drasticamente da noite para o dia em 27 de janeiro de 2025. Enquanto a China se preparava para a véspera do Ano Novo Lunar, o DeepSeek disparou para se tornar o aplicativo nº 1 no espaço de IA/GPT, desencadeando uma mudança sísmica no mercado. A ascensão da empresa provocou ondas de choque em toda a indústria, eliminando milhares de milhões em valor de acções de grandes empresas como a Nvidia, a OpenAI, a Meta, a Alphabet (empresa-mãe da Google), a parceira da Nvidia, a Oracle, e várias empresas de energia e centros de dados. Elon Musk evitou por pouco as consequências, uma vez que a X já não é transaccionada publicamente.

Embora a queda do mercado seja provavelmente temporária, o DeepSeek mudou irrevogavelmente a trajetória do desenvolvimento da IA. Até agora, os EUA dominavam o campo de forma tão completa que a maioria esperava que os outros países produzissem apenas imitações abaixo da média dos seus modelos “padrão ouro”. A abordagem do DeepSeek, no entanto, abriu um novo caminho, posicionando a China como um formidável concorrente no que muitos estão agora a chamar uma corrida ao armamento digital.

O LLM da empresa foi construído utilizando antigos chips Nvidia por uma fração do custo investido por empresas como a Anthropic e a OpenAI nos seus respectivos modelos. Depositphotos

A vantagem econômica e de código aberto do DeepSeek

O DeepSeek se destaca por usar chips mais antigos e baratos e pular etapas caras no desenvolvimento do chatbot, levando seu custo de treinamento a apenas US$ 5,6 milhões – muito menos que os US$ 60 milhões do Llama 3.1 ou os mais de US$ 100 milhões do GPT-4. Ao contrário dos modelos proprietários, o R1 é de código aberto, o que lhe permite ultrapassar as restrições regionais e democratizar o desenvolvimento da IA.

Este facto abalou a indústria de IA dominada pelos EUA, levantando questões sobre se modelos eficientes e de baixo custo podem rivalizar com sistemas de última geração. Casey Newton referiu a enorme dimensão do R1 – 680 mil milhões de parâmetros – e o seu custo de formação inovador, descrevendo-o como um fator de mudança.

As origens do DeepSeek contribuem para a sua intriga. O fundador Liang Wenfung, inicialmente rejeitado pelos colegas, começou a desenvolver o modelo em 2021 usando chips Nvidia mais antigos. Em 2023, o DeepSeek foi estabelecido, e o mesmo hardware contribuiu para a maior perda de valor de mercado de todos os tempos da Nvidia. A inovação do R1 está em seu treinamento, ignorando o ajuste fino supervisionado em favor do aprendizado por reforço, reduzindo custos e melhorando o desempenho.

A versão de peso aberto do R1 distingue-o ainda mais, dando aos investigadores com recursos limitados acesso a IA de ponta. Mini versões “destiladas” tornam a experimentação ainda mais acessível. No entanto, o DeepSeek tem enfrentado desafios, incluindo ciberataques, críticas de censura e acesso restrito para utilizadores fora da China.

Apesar destes problemas, os especialistas vêem o DeepSeek como um ponto de viragem. O professor Geoff Webb observou o seu potencial para perturbar a monopolização da IA pelos gigantes tecnológicos dos EUA, promovendo a concorrência e reduzindo os custos. Salientou também a oportunidade de uma maior diversidade e acessibilidade global nas aplicações de IA.

Em poucas semanas, o DeepSeek redefiniu o desenvolvimento da IA, provando que a inovação não exige orçamentos imensos ou tecnologias exclusivas, abrindo caminho para um futuro de IA mais inclusivo.

Leia o Artigo Original: New Atlas

Cookie	Duração	Descrição
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

DeepSeek da China Abala a Indústria de IA, Tornando-se uma Mudança de Jogo de Triliões de Dólares da noite para o dia