China Desafia EUA com Lançamento do DeepSeek V4: O Novo Desafio na Guerra da Inteligência Artificial

DeepSeek V4 aposta em programação e independência tecnológica para desafiar rivais americanos de inteligência artificial

A startup chinesa DeepSeek disponibilizou nesta sexta-feira, dia 24 de abril, uma prévia oficial do seu novo modelo de linguagem de grande porte, batizado de DeepSeek V4. A principal novidade dessa versão é o reforço nas capacidades de codificação, uma área cada vez mais estratégica para o desenvolvimento de agentes autônomos de inteligência artificial, sistemas que conseguem executar tarefas complexas de forma independente, sem intervenção humana contínua. Com o lançamento, a empresa reforça sua intenção de concorrer diretamente com as gigantes americanas do setor, como Google, OpenAI e Anthropic.

O V4 foi apresentado em duas variantes principais. A primeira, chamada DeepSeek V4 Pro, possui 1,6 trilhão de parâmetros totais, dos quais 49 bilhões são ativados a cada resposta, utilizando uma arquitetura de mistura de especialistas, técnica em que apenas partes especializadas do modelo são ativadas conforme a demanda da tarefa. A segunda variante, denominada V4 Flash, é mais enxuta, com 284 bilhões de parâmetros e 13 bilhões ativados por resposta. Ambas suportam um contexto de até 1 milhão de tokens, o que equivale a processar milhares de páginas de texto de uma só vez, ampliando significativamente a capacidade do sistema de lidar com informações longas e complexas.

A DeepSeek publicou um extenso documento técnico na plataforma Hugging Face detalhando as mudanças realizadas na arquitetura neural do modelo. Segundo a equipe de pesquisadores da empresa, os refinamentos introduzidos na estrutura do V4 permitem que o sistema resolva problemas lógicos de programação sofisticados consumindo menos capacidade de processamento bruto. Esse tipo de otimização é particularmente relevante para o mercado corporativo, onde a eficiência no uso de recursos computacionais pode representar economias substanciais na operação de sistemas de inteligência artificial em larga escala.

A aposta na codificação como diferencial competitivo reflete uma tendência clara do mercado. A habilidade de escrever, corrigir e interpretar código de software tornou-se um dos pilares fundamentais para a criação de agentes de inteligência artificial que operam de maneira autônoma dentro de ambientes corporativos. Atualmente, esse segmento é dominado por ferramentas proprietárias como o ChatGPT Codex, da OpenAI, e o Claude Code, da Anthropic. Ao direcionar seus esforços para essa área, a DeepSeek busca se posicionar como uma alternativa viável para empresas que desejam integrar agentes autônomos em seus fluxos de trabalho sem depender exclusivamente das soluções pagas oferecidas pelas empresas do Vale do Silício.

Além dos aprimoramentos técnicos, a companhia manteve a decisão de lançar o V4 sob uma licença de código aberto. Essa estratégia visa atrair a comunidade global de desenvolvedores, que tem demonstrado crescente interesse em modelos que podem ser baixados, modificados e executados localmente, sem a necessidade de pagar por acesso via interfaces de programação de aplicações. No entanto, vale destacar que, embora o código do modelo seja aberto, o termo "código aberto" na indústria de inteligência artificial frequentemente se refere apenas à disponibilização dos pesos do modelo para uso e pesquisa, sem necessariamente liberar todos os detalhes do processo de treinamento.

Um dos aspectos que mais chamou atenção no anúncio foi a confirmação de que o novo modelo possui compatibilidade nativa com os processadores de inteligência artificial desenvolvidos pela Huawei, uma das maiores empresas de tecnologia da China. A fabricante afirmou que seu cluster de computação Ascend é capaz de suportar a execução do V4, embora o grau de participação desses chips na fase de treinamento do modelo ainda não tenha sido esclarecido. Historicamente, o treinamento de modelos de linguagem de grande porte depende de data centers equipados com milhares de aceleradores gráficos, um mercado dominado pela americana Nvidia.

A compatibilidade com a infraestrutura da Huawei ganha relevância no contexto geopolítico atual. Desde 2022, o governo dos Estados Unidos impõe restrições severas à exportação de chips de alto desempenho para a China, com o objetivo de frear o avanço tecnológico militar e de inteligência artificial do país asiático. A capacidade de treinar e executar um modelo de ponta utilizando equipamentos fabricados nacionalmente indica que a China avança na construção de uma cadeia de suprimentos tecnológica própria, reduzindo sua dependência de componentes americanos. A DeepSeek, porém, já enfrentou acusações de que modelos anteriores foram treinados com chips da Nvidia adquiridos por meio de rotas alternativas que contornavam as sanções, o que a empresa nunca confirmou publicamente.

O lançamento do V4 também precisa ser compreendido à luz do impacto provocado pelo seu antecessor. Há aproximadamente um ano, a DeepSeek lançou o modelo R1, que demonstrou ser possível obter desempenho comparável ao dos sistemas mais avançados do mercado gastando uma fração dos recursos financeiros normalmente exigidos por seus concorrentes americanos. O anúncio do R1 provocou uma queda acentuada nas ações de empresas de tecnologia dos Estados Unidos e reacendeu o debate global sobre a viabilidade de desenvolver inteligência artificial de ponta a custos menores. Com o V4, a expectativa da empresa é consolidar essa trajetória, agora com foco mais direcionado na codificação e na criação de agentes autônomos.

Apesar dos avanços, a DeepSeek optou por não divulgar os custos exatos do treinamento do V4. Em comunicado, a empresa afirmou que os gastos foram "drasticamente reduzidos" em comparação com gerações anteriores, mas, ao contrário do que fez em lançamentos passados, não apresentou números específicos. Essa ausência de transparência financeira contrasta com a postura adotada durante a apresentação do R1, quando a companhia divulgou detalhes precisos dos investimentos realizados, reforçando sua narrativa de eficiência econômica.

Paralelamente ao desenvolvimento tecnológico, a startup chinesa acumula controvérsias. A Anthropic, empresa criadora da família de modelos Claude, acusou a DeepSeek de utilizar respostas geradas por seus sistemas para criar dados sintéticos que serviram de base para o treinamento dos produtos chineses. Segundo a Anthropic, essa prática configuraria uma violação dos termos de uso de sua plataforma. Até o momento, a DeepSeek não se manifestou publicamente sobre as acusações de uso indevido de propriedade intelectual, mantendo uma postura de silêncio diante das críticas.

Os primeiros testes de benchmark divulgados pela própria DeepSeek indicam que o modelo V4 Pro Max, sua configuração mais robusta com maior capacidade de raciocínio, lidera entre os modelos de código aberto em avaliações de conhecimento geral e fica ligeiramente atrás apenas do Gemini Pro 3.1, da Google, entre os modelos proprietários de ponta. Já a variante V4 Flash Max demonstrou desempenho de raciocínio comparável ao da versão Pro quando recebe um orçamento maior de tokens de pensamento, embora sua escala menor de parâmetros o coloque em desvantagem em tarefas que exigem conhecimento enciclopédico amplo ou fluxos de trabalho autônomos mais elaborados.

O lançamento do DeepSeek V4 ocorre em um momento de intensificação da disputa entre Estados Unidos e China pelo domínio da inteligência artificial. De um lado, as empresas americanas continuam investindo bilhões no desenvolvimento de sistemas cada vez mais poderosos, amparadas por uma infraestrutura de hardware consolidada. De outro, companhias chinesas como a DeepSeek buscam demonstrar que é possível alcançar resultados competitivos utilizando alternativas mais baratas e, cada vez mais, infraestrutura nacional. O desdobramento dessa competição nos próximos meses dependerá, em grande parte, da capacidade da DeepSeek de converter a prévia do V4 em um produto estável e amplamente adotado pelo mercado, bem como da resposta das rivais americanas, que já trabalham em suas próprias próximas gerações de modelos de linguagem.

China Desafia EUA com Lançamento do DeepSeek V4: O Novo Desafio na Guerra da Inteligência Artificial

Leitura recomendada

Comentários

Artigos em Destaque

SpaceX firma acordo bilionário com Google para infraestrutura de IA antes do IPO

iOS 27 Estende Longevidade ao iPhone 11 e Revela Siri AI Exclusiva para Modelos 15 Pro e 17

Falha em Sistemas de IA: ChatGPT e Gemini Criam Imagens Perturbadoras a Partir de Comandos Enganosos

Mais Acessados

TIM Reinventa o Meu TIM: Seu Portal Digital Ganha Superpoderes!

Radioatividade à Solta: Relembre os 10 Piores Desastres Nucleares da História e Seus Legados Sombrios

YouTube: Maratona Forçada de Propaganda? Usuário Enfurecido Relata Anúncio Impossível de Ignorar!

Fique por dentro

China Desafia EUA com Lançamento do DeepSeek V4: O Novo Desafio na Guerra da Inteligência Artificial

Leitura recomendada

SpaceX firma acordo bilionário com Google para infraestrutura de IA antes do IPO

Falha em Sistemas de IA: ChatGPT e Gemini Criam Imagens Perturbadoras a Partir de Comandos Enganosos

IA em Foco: Desvendando o Impacto Econômico da Inteligência Artificial com o Economic Research Exchange

Comentários

Artigos em Destaque

SpaceX firma acordo bilionário com Google para infraestrutura de IA antes do IPO

iOS 27 Estende Longevidade ao iPhone 11 e Revela Siri AI Exclusiva para Modelos 15 Pro e 17

Falha em Sistemas de IA: ChatGPT e Gemini Criam Imagens Perturbadoras a Partir de Comandos Enganosos

Mais Acessados

TIM Reinventa o Meu TIM: Seu Portal Digital Ganha Superpoderes!

Radioatividade à Solta: Relembre os 10 Piores Desastres Nucleares da História e Seus Legados Sombrios

YouTube: Maratona Forçada de Propaganda? Usuário Enfurecido Relata Anúncio Impossível de Ignorar!

Fique por dentro