Um Guia Completo para o Aplicativo AI Chatbot

Crédito:Depositphotos
O laboratório chinês de IA DeepSeek ganhou grande atenção esta semana, com seu aplicativo de chatbot alcançando o topo das paradas da Apple App Store e do Google Play. Os modelos de IA da empresa, desenvolvidos com métodos computacionais eficientes, levaram analistas de Wall Street e especialistas em tecnologia a questionar a capacidade dos EUA de manter sua liderança em IA e se a demanda por chips de IA permanecerá forte.
Então, quais são as origens da DeepSeek e como ela alcançou reconhecimento global tão rapidamente?
A DeepSeek é apoiada pela High-Flyer Capital Management, um fundo de hedge quantitativo chinês que utiliza IA para suas estratégias de negociação.
De estudante de trading a fundador de fundo de hedge impulsionado por IA
O entusiasta de IA Liang Wenfeng foi cofundador da High-Flyer em 2015. Tendo começado a explorar a negociação como estudante na Universidade de Zhejiang, Wenfeng fundou a High-Flyer Capital Management como um fundo de hedge em 2019, com foco na criação e implementação de algoritmos de IA.
Em 2023, a High-Flyer lançou o DeepSeek como um laboratório separado, dedicado à pesquisa em IA, distinto de suas operações financeiras. Com a High-Flyer como investidora, a DeepSeek acabou se tornando uma empresa independente com o mesmo nome.
Construindo Infraestrutura em Meio às Restrições à Exportação de Hardware dos EUA
Desde o início, a DeepSeek desenvolveu seus próprios clusters de data center para treinamento de modelos. No entanto, como muitas empresas chinesas de IA, enfrentou desafios devido às restrições de exportação de hardware impostas pelos EUA. Para treinar um de seus modelos mais recentes, a DeepSeek precisou contar com chips Nvidia H800 — uma alternativa menos potente aos chips H100 disponíveis para empresas americanas.
A equipe técnica da DeepSeek é supostamente bastante jovem. A empresa é conhecida por recrutar ativamente pesquisadores de IA com nível de doutorado de importantes universidades chinesas. Além disso, a DeepSeek contrata pessoas sem formação em ciência da computação para ajudar sua equipe de tecnologia a obter uma compreensão mais ampla de diversos tópicos, de acordo com o The New York Times.
A DeepSeek lançou seus modelos iniciais — DeepSeek Coder, DeepSeek LLM e DeepSeek Chat — em novembro de 2023. No entanto, foi somente na primavera passada, com o lançamento de seus modelos DeepSeek-V2 de última geração, que a comunidade de IA começou a prestar atenção.
O DeepSeek-V2, um sistema versátil para análise de texto e imagens, apresentou excelente desempenho em vários benchmarks de IA e era significativamente mais econômico de operar do que modelos comparáveis da época. Isso pressionou concorrentes nacionais como ByteDance e Alibaba a reduzir os preços de alguns de seus modelos e oferecer outros gratuitamente.
O lançamento do DeepSeek-V3 em dezembro de 2024 impulsionou ainda mais a reputação da empresa.
DeepSeek V3 supera modelos de IA abertos e fechados líderes
De acordo com testes internos, o DeepSeek V3 supera modelos abertos para download, como o Llama da Meta, e modelos fechados somente para API, como o GPT-4o da OpenAI.
Outro destaque é o modelo de “raciocínio” R1 da DeepSeek, lançado em janeiro, que, segundo a DeepSeek, corresponde ao desempenho do modelo o1 da OpenAI em benchmarks importantes.
Como modelo de raciocínio, o R1 pode efetivamente verificar seus próprios fatos, ajudando a evitar erros comuns que normalmente desafiam os modelos de IA. Embora os modelos de raciocínio levem mais tempo — geralmente de segundos a minutos a mais — para chegar a conclusões em comparação com os modelos padrão, eles oferecem maior confiabilidade em áreas como física, ciências e matemática.
Restrições regulatórias limitam as respostas de IA da DeepSeek
Há uma desvantagem no R1, no DeepSeek V3 e nos outros modelos da empresa. Como IAs desenvolvidas na China, elas passam por avaliação do regulador de internet da China para garantir que suas respostas estejam alinhadas aos “valores socialistas fundamentais”. Por exemplo, o chatbot do DeepSeek não responde a perguntas sobre a Praça da Paz Celestial ou a autonomia de Taiwan.
Em março, o DeepSeek registrou mais de 16,5 milhões de visitas. “Em março, o DeepSeek ocupa o segundo lugar, apesar de uma queda de 25% no tráfego em comparação com fevereiro, com base em visitas diárias“, disse David Carr, editor da Similarweb, ao TechCrunch. No entanto, ainda está muito atrás do ChatGPT, que ultrapassou 500 milhões de usuários ativos semanais em março.
Em maio, o DeepSeek lançou uma versão atualizada de seu modelo de IA de raciocínio R1 na plataforma para desenvolvedores Hugging Face.
Se o DeepSeek tem um modelo de negócios, não está totalmente claro qual é. A empresa oferece seus produtos e serviços a preços bem abaixo do mercado — e até mesmo fornece alguns gratuitamente. Apesar do interesse significativo de capitalistas de risco, a DeepSeek não está aceitando financiamento de investidores no momento.
Alegações de eficiência impulsionam custos baixos, mas especialistas permanecem céticos
A DeepSeek afirma que avanços em eficiência permitem manter os custos extremamente baixos, embora alguns especialistas questionem a veracidade dessas alegações.
Independentemente disso, os desenvolvedores adotaram os modelos da DeepSeek. Embora não sejam de código aberto no sentido tradicional, eles estão disponíveis sob licenças permissivas que permitem o uso comercial. Clem Delangue, CEO da Hugging Face — uma plataforma que hospeda os modelos da DeepSeek — relatou que os desenvolvedores criaram mais de 500 modelos “derivativos” baseados no R1, baixados coletivamente 2,5 milhões de vezes.
A rápida ascensão da DeepSeek em relação a concorrentes maiores e estabelecidos foi descrita como “uma reviravolta na IA” por alguns e “superestimada” por outros. Seu sucesso contribuiu para uma queda de 18% no preço das ações da Nvidia em janeiro e provocou uma resposta pública do CEO da OpenAI, Sam Altman. De acordo com a Reuters, agências do Departamento de Comércio dos EUA anunciaram em março que o DeepSeek seria banido em dispositivos governamentais.
Integração, Investimento e Controvérsia em Torno do DeepSeek
A Microsoft integrou o DeepSeek ao seu serviço Azure AI Foundry, que consolida serviços de IA para empresas. Questionado sobre o impacto do DeepSeek nos investimentos em IA da Meta, Zuckerberg afirmou que os gastos com infraestrutura seguem como “vantagem estratégica“. Em março, a OpenAI classificou o DeepSeek como “subsidiado e controlado pelo Estado“, sugerindo que os EUA considerem banir seus modelos.
Durante a teleconferência de resultados do quarto trimestre da Nvidia, o CEO Jensen Huang elogiou a “excelente inovação” do DeepSeek, observando que modelos de raciocínio como o do DeepSeek exigem um poder computacional significativo, beneficiando a Nvidia.
Ao mesmo tempo, algumas organizações, países e governos — incluindo a Coreia do Sul e o Estado de Nova York — baniram o DeepSeek em dispositivos oficiais. Em maio, o vice-presidente e presidente da Microsoft, Brad Smith, testemunhou perante o Senado que os funcionários da Microsoft estão proibidos de usar o DeepSeek devido a preocupações com a segurança de dados e propaganda.
Quanto ao futuro do DeepSeek, ele permanece incerto. Modelos aprimorados são esperados, mas o governo dos EUA parece cada vez mais cauteloso quanto à potencial influência estrangeira. O Wall Street Journal noticiou em março que os EUA provavelmente proibirão o DeepSeek em dispositivos governamentais.
Leia o artigo original em: Techcrunch