Finalmente: o CEO da Nvidia, Jensen Huang, alertou no Dwarkesh Podcast que a otimização da DeepSeek de seus modelos de IA para o hardware Ascend da Huawei para hardware americano seria um “resultado horrível” para os Estados Unidos, enquanto o laboratório chinês de IA se prepara para lançar seu modelo básico no processador Huawei Ascend 950PR. A migração do CUDA da Nvidia para a estrutura CANN da Huawei ameaça quebrar a dependência de software-hardware que domina a IA americana, mesmo quando os legisladores dos EUA estão prestes a colocar o DeepSeek na lista de entidades para controle de exportação.
O CEO da Nvidia, Jensen Huang, disse no Dwarkesh Podcast na quarta-feira que se a DeepSeek otimizasse seus novos modelos de IA para rodar em chips Huawei em vez de hardware americano, seria um “resultado terrível” para os Estados Unidos. O alerta enquadra a parceria emergente entre o laboratório de IA da China e o seu principal fabricante de chips como uma ameaça direta à alavancagem tecnológica que sustentou o domínio americano da IA ao longo da última década.
“Se os futuros modelos de IA forem otimizados de maneira muito diferente da pilha de tecnologia americanaHuang disse eO resto espalha IA para o mundo” com padrões e técnicas chinesas, a China”se tornará superior a”É digno de nota que vem do CEO de uma empresa que mais se beneficiou do acordo atual, em que quase todos os modelos de IA de ponta do mundo são executados em GPUs Nvidia usando a estrutura de software Nvidia CUDA.
É isso que o DeepSeek está construindo
DeepSeek está se preparando para lançar o V4, um modelo de base multimodal esperado ainda este mês. Foi relatado anteriormente em abril que o V4 funcionaria no mais recente processador Ascend 950PR da Huawei, enquanto um relatório separado da Reuters sugeria que o modelo havia sido treinado em chips Nvidia Blackwell, o que constituiria uma violação dos controles de exportação dos EUA. As duas afirmações não são necessariamente contraditórias: um modelo pode ser instalado em um conjunto de hardware e implantado como consequência em outro.
O que torna a integração significativa da Huawei é o software de migração por trás dela. DeepSeek passou meses reescrevendo seu código principal para funcionar com a estrutura CANN da Huawei, afastando-se do ecossistema CUDA que a Nvidia passou duas décadas construindo como base para o desenvolvimento de IA. O domínio da CUDA no segundo mapa do domínio americano sobre a IA serviu como uma função além dos próprios chips. Eles podem exportar as instruções que o hardware da Nvidia chega à China, mas embora os chineses tenham escrito seus laboratórios para programação CUDA, eles permaneceram dependentes do ecossistema da Nvidia, mesmo com os processadores que usam. A mudança do DeepSeek para CANN quebra essa dependência.
Espaço TNW City Coworking – onde o melhor trabalho é feito
Um espaço de trabalho para crescimento, colaboração e oportunidades infinitas de networking no coração da tecnologia.
O modelo DeepSeek V3, lançado no final de 2024, foi treinado em GPUs Nvidia H800 2.048, um chip feito sob medida para o mercado chinês, que foi proibido de ser vendido na China em 2023, a empresa já demonstrou que pode produzir. modelos competitivos de fronteira com menos recursos do que os seus rivais americanos. O R1 igualou ou superou seus modelos de modelagem de desempenho que custam muito mais para instalar. A V4 ampliou sua abordagem para provar que a empresa poderia viver sem o hardware americano.
A lacuna de hardware e por que isso não importa
Em termos de desempenho bruto, os chips da Huawei não são competitivos com os melhores da Nvidia. O Ascend 910C, antecessor do 950PR, entrega quase 60% do desempenho da Nvidia H100, que é o melhor das duas categorias depois da recente Nvidia. Os chips americanos são cerca de cinco vezes mais poderosos do que os seus equivalentes chineses hoje, e essa diferença é projetada para 17 vezes até 2027. A Huawei tem como meta 750.000 usuários de IA em 2026, mas sua produção total representa apenas 3 a 5% do poder computacional agregado da Nvidia.
Mas Huang não está preocupado com a atual lacuna de desempenho. Ele disse no podcast que mesmo que a China tivesse menos chips, ainda poderia alcançar os EUA no desenvolvimento de IA.a energia é abundante“e” um grande grupo de pesquisadores de IA “. A consequência é que o desempenho bruto do hardware é apenas uma variável, e software de otimização, rastreador de talentos e disponibilidade de energia podem compensar as desvantagens do Pi. Se o V4 tiver um bom desempenho nos chips Ascend, ele confirma um caminho alternativo para o desenvolvimento de IA que não depende da Nvidia em nenhum ponto da cadeia de fornecimento.
O paradoxo do controle de exportações
O estado de tensão no centro das exportações americanas de chips. A Nvidia interrompeu a produção do H200, um chip mais potente, para venda na China, conforme Huang confirmou em março. Mas a China está bloqueando as importações do H200 para proteger os negócios domésticos de chips da Huawei, e o CFO da Nvidia disse que a empresa não gerou nenhuma receita com as vendas do H200 na China. Os controles são projetados para limitar as capacidades de IA da China, acelerando em vez disso o desenvolvimento de outra IA chinesa.
A experiência profunda com os modelos R2 ilustra tanto a promessa quanto as limitações do roteador da Huawei. O R2 foi adiado repetidamente devido à falta de treinamento em hardware da Huawei. As autoridades chinesas incentivaram a instalação do DeepSeek em dispositivos domésticos, mas a empresa encontrou problemas de estabilidade, o que a forçou a reverter para GPUs Nvidia para instalação, enquanto a Huawei usava chips apenas para sequenciamento. A distinção é importante: o treinamento é a parte mais demorada do desenvolvimento da IA, e o fato de os chips da Huawei não conseguirem lidar com isso de maneira confiável sugere que as falhas de hardware são reais. Mas, como consequência, o momento em que os modelos servem os utilizadores é onde a receita comercial é gerada, e os chips da Huawei parecem ser bons o suficiente para esse fim.
Entretanto, os legisladores dos EUA estão a pressionar para que as restrições sejam ainda mais rigorosas. Na quinta-feira, na Ceia do Senhor, legisladores e especialistas acusaram a compra “que eles podem“E ser roubado”que eles não podem“na indústria de IA e pediu ao governo que avaliasse DeepSeek, Moonshot AI e MiniMax na lista do governo de entidades para exportação.
Que Huang realmente aconselhou
O último aviso de Huang é sobre o design de software co-hardware. O domínio da Nvidia se baseia não apenas nos nós de processamento mais rápidos, mas na posição do CUDA como ambiente de desenvolvimento de IA padrão. Quando os pesquisadores escrevem código, eles o escrevem para CUDA. Quando as startups constroem produtos, elas se baseiam em CUDA. Quando os governos investem em infraestrutura de IA, eles compram GPUs Nvidia porque é isso que o software exige. A migração do DeepSeek para CANN ameaça criar um ecossistema paralelo no qual não existe tal sistema.
O a escala dos negócios da Nvidia faz apostas concretas. A capitalização de mercado da empresa ultrapassa US$ 3 trilhões. A receita do seu centro cresceu 93% ano a ano no trimestre mais recente. O treinamento de energia de seu grupo é executado para modelar IA em quase todas as grandes empresas fora da China. Se o laboratório chinês de IA mais capaz demonstrar que modelos competitivos podem ser construídos sem a Nvidia, isso enfraquece o argumento para controlar as exportações, enfraquece o argumento para comprar a Nvidia; princípios geográficos que informaram a política de IA nos últimos três anos.
Nada vai pegar a Huawei Nvidia desta forma. O conjunto de efeitos é grande e crescente. As falhas no treinamento do R2 mostram que o hardware chinês ainda não está pronto para o trabalho da IA mais séria. Mas Huang não avisa hoje. Ele alerta para a trajetória em que o DeepSeek prova o conceito, outros laboratórios seguem e a vala CUDA que a Nvidia aproveitou ao máximo. empresa valiosa na IA, a cadeia de abastecimento está a começar a sofrer perturbações.
É o CEO da Nvidia quem sugere publicamente este argumento e acredita que não se trata de um risco teórico. DeepSeek V4 será a primeira testemunha. Se o modelo de base multimodal funcionar de forma competitiva no Huawei Pi, o alerta de Huang emitido na quarta-feira parecerá menos com lobby corporativo e mais com ele. o mais importante será anunciado apenas na guerra de chips de IA.



