DeepSeek: Um Guia Completo para o Aplicativo AI Chatbot

DeepSeek: Um Guia Completo para o Aplicativo AI Chatbot

Créditos da imagem:GREG BAKER/AFP / Getty Images

Esta semana, o laboratório chinês de IA DeepSeek ganhou ampla atenção, pois seu aplicativo de chatbot subiu ao topo das paradas da Apple App Store e do Google Play. Treinados usando técnicas de eficiência computacional, os modelos de IA da DeepSeek geraram debates entre analistas e tecnólogos de Wall Street sobre a capacidade dos EUA de manter sua liderança em IA e a demanda de longo prazo por chips de IA.

Mas quais são as origens da DeepSeek e como ela alcançou reconhecimento global tão rapidamente?

A DeepSeek é apoiada pela High-Flyer Capital Management, um fundo de hedge quantitativo chinês que alavanca IA para estratégias de negociação.

O entusiasta de IA Liang Wenfeng foi cofundador da High-Flyer em 2015. Enquanto estudava na Universidade de Zhejiang, ele desenvolveu um interesse em negociação e mais tarde lançou a High-Flyer Capital Management em 2019 como um fundo de hedge especializado em algoritmos orientados por IA.

Do laboratório de IA da High-Flyer para empresa independente

Em 2023, a High-Flyer estabeleceu a DeepSeek como um laboratório de pesquisa de IA separado, distinto de suas operações financeiras. Com o investimento da High-Flyer, o laboratório mais tarde se transformou em uma empresa independente, também chamada DeepSeek.

Desde o início, a DeepSeek construiu seus próprios clusters de data center para treinar modelos de IA. No entanto, como outras empresas chinesas de IA, ela enfrentou desafios devido às restrições de exportação de hardware dos EUA. Para treinar um de seus modelos mais recentes, a empresa teve que contar com chips Nvidia H800 — uma alternativa menos potente aos chips H100 disponíveis para empresas dos EUA.

A equipe técnica da DeepSeek é supostamente composta principalmente por jovens profissionais. A empresa recruta ativamente pesquisadores de IA com doutorados de importantes universidades chinesas e também traz indivíduos sem formação em ciência da computação para aprimorar a compreensão de sua tecnologia sobre diversos assuntos, de acordo com o The New York Times.

A DeepSeek apresentou seus primeiros modelos — DeepSeek Coder, DeepSeek LLM e DeepSeek Chat — em novembro de 2023. No entanto, a indústria de IA realmente percebeu isso na primavera de 2024, quando a empresa lançou sua família de modelos DeepSeek-V2 de próxima geração.

O DeepSeek-V2, um sistema versátil capaz de analisar texto e imagens, teve um desempenho forte em benchmarks de IA, sendo significativamente mais econômico do que os modelos concorrentes. Sua eficiência levou rivais nacionais como ByteDance e Alibaba a reduzir os preços de alguns modelos de IA e tornar outros gratuitos.

O lançamento do DeepSeek-V3 em dezembro de 2024 consolidou ainda mais a reputação da empresa. De acordo com testes de benchmark internos, o DeepSeek-V3 superou modelos de código aberto como o Llama da Meta e modelos proprietários como o GPT-4o da OpenAI.

DeepSeek R1: Uma IA de autoverificação para raciocínio avançado

Igualmente notável é o modelo de “raciocínio” R1 da DeepSeek, lançado em janeiro de 2025. A DeepSeek afirma que o R1 corresponde ao modelo o1 da OpenAI em benchmarks importantes. Ao contrário dos modelos tradicionais, o R1 pode verificar os fatos sozinho, reduzindo erros que comumente afetam os sistemas de IA. Embora os modelos de raciocínio levem mais tempo — às vezes de segundos a minutos — para gerar respostas, eles tendem a ser mais confiáveis, principalmente em áreas como física, ciência e matemática.

No entanto, como uma IA desenvolvida na China, os modelos da DeepSeek devem estar em conformidade com os padrões regulatórios definidos pela autoridade de internet da China, o que garante que o conteúdo esteja alinhado com os “valores socialistas essenciais”. Por exemplo, no aplicativo de chatbot da DeepSeek, o R1 evita responder a perguntas sobre a Praça da Paz Celestial ou o status político de Taiwan.

O modelo de negócios da DeepSeek permanece obscuro, pois precifica produtos abaixo das taxas de mercado e oferece alguns de graça. A empresa alega que a eficiência de custos permite isso, embora alguns especialistas contestem.

Apesar das incertezas, os desenvolvedores adotaram os modelos do DeepSeek, que, embora não sejam totalmente de código aberto, estão disponíveis para uso comercial. No Hugging Face, mais de 500 modelos derivados do R1 foram criados, totalizando 2,5 milhões de downloads.

A ascensão do DeepSeek foi elogiada e criticada. Seu impacto contribuiu para uma queda de 18% nas ações da Nvidia e atraiu uma resposta do CEO da OpenAI. A Microsoft integrou o DeepSeek ao Azure AI Foundry, enquanto a Meta e a Nvidia reconheceram sua crescente influência.

No entanto, várias empresas e governos, incluindo a Coreia do Sul e o estado de Nova York, baniram o DeepSeek. Relatórios sugerem que os EUA podem seguir devido a preocupações com influência estrangeira.

Embora o DeepSeek deva refinar seus modelos, seu futuro permanece incerto em meio ao escrutínio regulatório.


Leia o Artigo Original TechCrunch

Leia mais O CEO da Nvidia, Jensen Huang, Descarta o DeepSeek Enquanto as Vendas Continuam a Aumentar

Share this post

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *