DeepSeek: Um Guia Completo para o Aplicativo AI Chatbot

DeepSeek: Um Guia Completo para o Aplicativo AI Chatbot

Créditos da imagem: GREG BAKER/AFP / Getty Images

O DeepSeek está fazendo sucesso. Esta semana, o laboratório chinês de IA DeepSeek ganhou destaque quando seu aplicativo de chatbot liderou as paradas da Apple App Store e do Google Play. Treinados com técnicas de eficiência computacional, os modelos de IA do DeepSeek geraram discussões entre analistas de Wall Street e especialistas em tecnologia sobre a capacidade dos EUA de manter seu domínio de IA e a demanda de longo prazo por chips de IA.

Mas como o DeepSeek surgiu e o que levou à sua rápida ascensão ao reconhecimento global?

O DeepSeek é apoiado pela High-Flyer Capital Management, um fundo de hedge quantitativo chinês que alavanca IA para estratégias de negociação.

O entusiasta de IA Liang Wenfeng foi cofundador da High-Flyer em 2015. Enquanto estudava na Universidade de Zhejiang, ele começou a explorar a negociação, eventualmente lançando a High-Flyer Capital Management em 2019 para se concentrar em algoritmos financeiros baseados em IA.

Em 2023, a High-Flyer estabeleceu o DeepSeek como um laboratório de pesquisa de IA separado, distinto de suas operações financeiras. Com o apoio da High-Flyer, a DeepSeek mais tarde se tornou uma empresa independente.

Superando Restrições de Hardware

Desde o início, a DeepSeek construiu seus próprios clusters de data center para treinar modelos de IA. No entanto, como outras empresas chinesas de IA, ela enfrentou desafios devido às restrições de exportação dos EUA para hardware avançado. Para treinar um de seus modelos recentes, a empresa teve que contar com os chips H800 da Nvidia, uma alternativa menos potente ao H100, que continua disponível para empresas dos EUA.

A equipe técnica da DeepSeek é supostamente composta por um grupo de talentos mais jovens, com a empresa recrutando ativamente pesquisadores de IA de nível de doutorado de importantes universidades chinesas. De acordo com o The New York Times, a DeepSeek também traz indivíduos sem formação em ciência da computação para aprimorar a compreensão de sua IA em diversas áreas de estudo.

A DeepSeek apresentou seus primeiros modelos — DeepSeek Coder, DeepSeek LLM e DeepSeek Chat — em novembro de 2023. No entanto, foi somente com o lançamento de seus modelos DeepSeek-V2 de próxima geração na primavera de 2024 que a indústria de IA tomou conhecimento sério.

Desestabilizando o Mercado de IA

O DeepSeek-V2, um modelo versátil capaz de analisar texto e imagens, teve um desempenho forte em benchmarks de IA, sendo significativamente mais econômico do que os modelos concorrentes na época. Sua chegada pressionou rivais nacionais como ByteDance e Alibaba a reduzir as taxas de uso de alguns de seus modelos e até mesmo oferecer outros gratuitamente.

O DeepSeek-V3, lançado em dezembro de 2024, consolidou ainda mais a reputação da empresa.

Os testes de benchmark internos sugerem que o DeepSeek V3 supera modelos de código aberto como o Llama da Meta e modelos proprietários acessíveis apenas via API, como o GPT-4o da OpenAI.

Outro destaque é o modelo de “raciocínio” R1 da DeepSeek, lançado em janeiro de 2025. De acordo com a DeepSeek, o R1 corresponde ao modelo o1 da OpenAI em testes de desempenho importantes. Ao contrário dos modelos de IA padrão, modelos de raciocínio como o R1 podem autoverificar suas saídas, reduzindo erros comuns. Embora levem mais tempo — às vezes segundos ou minutos a mais — para gerar respostas, eles tendem a ser mais precisos, especialmente em áreas como física, ciência e matemática.

Restrições Regulatórias no DeepSeek

No entanto, os modelos da DeepSeek vêm com certas limitações. Como uma IA desenvolvida na China, eles devem cumprir as regulamentações definidas pelo órgão fiscalizador da internet da China, garantindo que suas respostas estejam alinhadas com os “valores socialistas essenciais”. Por exemplo, no aplicativo de chatbot da DeepSeek, o R1 se recusa a responder perguntas sobre tópicos como a Praça da Paz Celestial ou o status político de Taiwan.

O modelo de negócios da DeepSeek permanece obscuro, oferecendo produtos abaixo das taxas de mercado e evitando investimentos externos, apesar do interesse de capital de risco. A empresa alega que avanços na eficiência impulsionam sua vantagem de custo, embora alguns especialistas discordem.

Licenças Permissivas 

Os desenvolvedores adotaram amplamente os modelos do DeepSeek sob licenças permissivas, com mais de 500 derivados do R1 no Hugging Face e 2,5 milhões de downloads. Sua rápida ascensão gerou elogios e ceticismo, contribuindo para uma queda de 18% nas ações da Nvidia e atraindo críticas da OpenAI, que o chamou de “subsidiado pelo estado” e pediu uma proibição nos EUA.

A Microsoft adicionou o DeepSeek ao Azure AI Foundry, enquanto a Meta reafirmou seus gastos com infraestrutura de IA em resposta. O CEO da Nvidia, Jensen Huang, elogiou sua inovação, observando que seus modelos de raciocínio exigem poder de computação significativo.

Apesar do sucesso, o DeepSeek enfrenta restrições crescentes, com proibições na Coreia do Sul, no estado de Nova York e potencial ação do governo dos EUA sobre preocupações estrangeiras com IA.


Leia o Artigo Original TechCrunch

Leia mais Apple revela o Novo MacBook Air com o Chip M4

Share this post

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *