A DeepSeek anunciou no último sábado (23) que a redução de 75% nos custos de uso da API do seu modelo V4-Pro será permanente. O que inicialmente era uma promoção limitada até 31 de maio foi transformado em uma diminuição definitiva, fixando o preço em apenas um quarto do valor original.
Com essa mudança, os custos para acessar o V4-Pro pela API agora variam entre 0,025 e 6 yuans por milhão de tokens — o que equivale a aproximadamente US$ 0,003625 a US$ 0,87, dependendo do tipo de uso. Antes, os valores variavam de 0,1 a 24 yuans, cerca de US$ 0,0145 a US$ 3,48 por milhão de tokens.
Para os usuários que acessam o modelo diretamente via API, a economia é direta e imediata.
O V4-Pro é o modelo mais avançado da geração V4 da empresa, que foi lançado há cerca de um mês. A linha também inclui o V4-Flash, que é projetado para tarefas menos exigentes e com um custo reduzido.
Além disso, os modelos da DeepSeek são open source, permitindo que desenvolvedores baixem o código, o executem em suas máquinas e façam modificações conforme necessário.
Chips da Huawei em Foco
A DeepSeek não revelou oficialmente os motivos que possibilitaram essa redução de custos. No entanto, a startup já havia mencionado que o preço elevado era devido a "restrições de capacidade de computação de alto nível". Com a chegada em maior volume dos servidores de alta performance Ascend 950 da Huawei, espera-se que os preços diminuam ainda mais, com previsão para o segundo semestre de 2026.
Os chips Ascend se tornaram essenciais para empresas de IA na China, especialmente após restrições de exportação dos EUA que impediram a Nvidia de vender seus semicondutores mais avançados para o país. A Huawei, por sua vez, ainda enfrenta desafios de produção devido a limitações no acesso a equipamentos de fabricação de chips.
Pressão sobre Fornecedores Ocidentais
A estratégia da DeepSeek intensifica a concorrência com grandes fornecedores ocidentais de IA. Segundo Neil Shah, vice-presidente da Counterpoint Research, o V4-Pro conseguiu reduzir a diferença de desempenho em tarefas complexas quando comparado a modelos como Gemini, GPT e Claude.
Entretanto, mesmo com essas melhorias, a startup chinesa ainda enfrenta desafios em termos de adoção global, suporte e integrações nativas com plataformas como AWS, Microsoft Azure e Google Cloud.
Shah observa que a política de precificação por consumo de tokens dos principais laboratórios ocidentais "dificulta a justificativa para muitas cargas de trabalho corporativas", especialmente diante da oferta de alternativas abertas a preços significativamente mais baixos. Essa tendência pode levar a uma migração gradual dessas empresas para modelos que cobrem com base em resultado ou valor entregue.
Especialistas também alertam sobre os riscos associados ao uso da API externa da DeepSeek: o envio de dados para servidores na China pode trazer questões relacionadas à soberania de dados, conformidade regulatória e potencial exposição de informações sensíveis.