DeepSeek若选择华为,黄仁勋口中的“灾难”究竟指向何方?
本文来自微信公众号:心智观察所,作者:心智观察所
4月15日,黄仁勋在接受Dwarkesh Patel的播客专访时,抛出了一句分量极重的话:“如果DeepSeek率先在华为平台发布,对我们国家而言将是灾难性的。”
在这场长达一个半小时的访谈中,这句话显得格外突兀。它既非供应链技术的阐述,也不是TPU竞争的商业分析,而是充满情绪化的判断。要理解其深意,需回溯事件背景。
就在访谈前一周,多家媒体爆料DeepSeek下一代旗舰模型V4正全面迁移至华为昇腾950PR,底层代码从CUDA重写为华为自研的CANN框架,计划4月下旬发布。黄仁勋口中假设的“坏消息”,实则已在推进中。
Patel直接追问:DeepSeek是开源的,理论上可在任何加速器运行,即便在华为昇腾首发,也能在英伟达GPU上运行,区别何在?黄仁勋的回答暴露了核心顾虑——“若它针对华为架构优化,我们将陷入劣势”。
他将“全球最强模型运行在美国技术栈”定义为“好消息”,反之,若中国优秀开源模型以非美国硬件为首要优化目标且运行最佳,才是真正的坏消息。这精准揭示:英伟达真正恐惧的并非中国做出好模型,而是好模型不再以CUDA生态为默认优化起点。
当这层面纱被Patel的追问揭开,访谈中诸多看似“关心国家利益”的表述,便显露出商业本能的底色。
英伟达真正的护城河并非GPU算力,而是CUDA作为“事实标准”的软件生态位。近二十年来,几乎所有主流AI框架、算子库、开源模型的首发优化,都以CUDA为默认起点。
这条生态护城河的逻辑很简单:只要新模型先在CUDA上调通,即便华为、谷歌TPU、AMD MI300纸面单卡性能不差,在客户眼中也只是“备选方案”。迁移需重写算子、校准精度、重新调参,工程代价以月计。“事实标准”一旦确立便自我强化:优化CUDA的人越多,其运行效果越好;在CUDA上做研究的人越多,新工作自然延续这一路径。
DeepSeek若在昇腾首发,恰恰戳破了链条的起点:这意味着存在一条真实、可运行、经顶级模型验证的非CUDA路径,还会沉淀熟练工程师、可复制的优化经验及首批用户信心。这才是黄仁勋“灾难性”评价的真实分量:不怕单款芯片被替换,怕“开源模型必须以CUDA为首要优化目标”的默认规则出现首个公开反例。
结合中国算力基础设施的实际情况,黄仁勋的焦虑便不夸张。
华为昇腾910C单卡FP16算力约800TFLOPS,虽不及英伟达Blackwell旗舰,SemiAnalysis估算单卡性能差距约三倍;但华为不走单卡硬拼路线,而是系统工程层面的群体战术。2025年4月推出的CloudMatrix384超节点,将384颗910C通过6912个400G光模块全互联堆叠,BF16集群算力达300PFLOPS,约为英伟达GB200NVL72旗舰集群的1.7倍,HBM总容量更是后者的3.6倍。功耗虽惊人,整体功率近560千瓦,约为英伟达同级方案的四倍,但中国可再生能源装机全球第一,“便宜的瓦特”可部分消化这一代价。
2025年9月华为全联接大会上,徐直军公布了更激进的路线图:Atlas950超节点规模8192卡、四季度上市,Atlas960超节点规模15488卡、2027年四季度上市,昇腾950PR/DT、960、970三年路线依次推进。这是“以规模换效率,以系统换单点”的清晰策略,黄仁勋访谈中提出的“五层蛋糕”(底层是能源,能源充足则芯片够用,中国能源充足故7nm也足够),正是从对手视角对这一策略的另一种表述。
黄仁勋并非未意识到华为打法的商业意义,只是不便在镜头前直白表述。访谈中他反复强调:中国是全球第二大计算市场,拥有约一半的AI研究人员,算力总量庞大,“若整合资源,完全能满足需求”。
这些话常被解读为黄仁勋为重返中国市场铺垫舆论,实则构成完整推理链:算力、能源、研究人员充足,唯一缺的是让这些要素沿非英伟达路径组织的粘合剂;而粘合剂,正是一款能让全球开发者看到“非CUDA栈也能跑出世界级结果”的旗舰模型。
2025年初DeepSeekV3和R1曾引发全球震动,以低成本训出接近OpenAI的表现,首次让市场质疑“算力决定一切”的范式。如今V4若真在昇腾首发,象征意义远超V3。V3证明中国能做好模型,V4则证明中国能在自研硬件上做好模型,这是“客户”与“对手”的本质区别。
理解这一点,黄仁勋访谈中看似不连贯的逻辑便清晰了。Patel多次尖锐反问,都被黄仁勋策略性模糊处理。
Patel问:既然美国AI实验室都受限于算力,让中国算力少于美国、更早达到“Mythos级别”能力上限,难道不符合美国利益?黄仁勋回答:这种结果需极端情况,即中国完全无算力,而这不可能。
这个回答回避了核心问题:出口管制目的是维持12到18个月的能力窗口,黄仁勋将时间差问题偷换成绝对值问题。
这种辩论技巧在访谈中多次出现,解释了一个矛盾:黄仁勋一方面用DeepSeek的成功证明“出口管制无效,中国会创新”,另一方面又以“再不卖芯片中国将彻底脱离生态”论证应继续对华销售。
若前者为真,后者逻辑便不成立,因为脱离与否中国都会创新,卖芯片换来的“忠诚”是虚构的。这种内在不自洽提示:黄仁勋的真实目标并非国家战略推理,而是保住中国市场收入盘子的同时,维护CUDA的事实标准生态位——这两者正同步滑落,他必须双向发力。
访谈中一段常被忽略的对话,完整呈现了黄仁勋的策略图景。Patel问:英伟达为何不同时开发晶圆级芯片、大封装芯片、不用CUDA的芯片?黄仁勋回答“模拟过,效果更差”。
这实则是坚守战略:英伟达不会稀释CUDA的标准地位,哪怕内部也如此。但他紧接着承认,英伟达最近将Groq整合进CUDA生态,因token平均售价上涨,高价值用户愿为低延迟付费,开辟了全新推理细分市场。
即英伟达的策略是“向外吸纳、向内收敛”:所有能跑CUDA的加速器都可纳入生态,但CUDA必须是不可替代的中心。这套打法过去十年很成功,让英伟达在专用芯片面前始终是“平台”而非“玩家”。但面对华为时,首次失灵了。
华为不仅做芯片,还做网络、光模块、超节点互联、CANN框架、MindSpore、故障容错训练软件,是在英伟达全栈覆盖面上构建另一个全栈。无法将平行全栈“纳入”生态,只能视其为对手。一旦DeepSeek这样的顶级开源模型为平行全栈背书,英伟达“平台vs玩家”的身份优势就会松动。
回到中国大陆相关内容,访谈中还有几处值得关注。一是黄仁勋罕见用“研究性对话”这样软性的表达,称“把中国变成敌人可能非最佳方案”,警告建立“美国封闭栈vs外国开源栈”割裂生态对美国“极其愚蠢”。这段话看似战略分析,背后的商业现实是:英伟达在华业务正被逐步削弱。
从A100/H100被禁、A800/H800出炉又被禁、H20专供中国版2025年4月一度需申请许可、7月恢复销售但交付有限。报道称,字节、阿里、腾讯在被禁前三个月仍向英伟达下了超160亿美元的H20订单,说明中国市场真实需求仍在。
黄仁勋每呼吁一次“不要脱钩”,对应一次可见的市场份额转移。二是他承认中国算法能力:“人工智能进步多源于算法,而非仅硬件改进”,加上中国拥有全球最庞大的AI研究人员队伍,“这难道不是他们最根本的优势?”
这种表述向美国政策圈传递“制裁无法阻止中国AI赶超”的信号,为解除出口限制铺路;但同一逻辑被中国接受后,结论却是“算法优势在手、算力可通过系统工程补齐,全面去CUDA化有机会成功”,这是把双刃剑,黄仁勋想要前半段效果,却附带制造了后半段影响。
综合所有线索,访谈的真正看点不在黄仁勋说了什么,而在他选择的时间与方式。
4月15日卡在DeepSeekV4昇腾首发消息与正式发布之间;选择以硬核提问著称的Patel播客而非传统财经媒体,说明英伟达希望将信息直接传递到技术社群与政策圈的交集;访谈中关于中国的内容(五层蛋糕、能源优势、算法优势、50%研究人员、庞大计算市场等)都指向同一结论:无法通过阻断取胜,只能通过保持在场取胜。这是典型的“让我继续卖”的论证,只是包装在国家利益框架下。
因此逻辑清晰:第一,黄仁勋决策优先级中,CUDA生态的标准地位高于单款产品甚至单一市场份额,所以他宁可被视为为中国说话,也不愿看到非CUDA栈出现成功的全栈范本;
第二,他对竞争的判断是“时间维度而非终点维度”,华为最终能否追上不重要,重要的是追上之前英伟达必须保持在场;
第三,他对“开源”的态度具工具理性,开源好不好取决于开源模型首发时优化的硬件,这与2025年7月北京之行公开盛赞DeepSeek是“革命性开源推理模型”相比,已有明显情绪落差。
他在访谈中同时向华盛顿和北京喊话:向华盛顿说“请让我继续卖,否则会输掉生态”,向北京说“请继续用我的芯片,否则会被迫走更贵的路”。

所以,黄仁勋对“DeepSeek与华为合作”的“灾难性”评论,是一次精心择机的战略喊话,针对的是中国顶级开源模型与全栈厂商共同背书“另一条技术路径”的现实可能。若DeepSeekV4迁移至昇腾,代表顶级模型、顶级硬件、开源传播三个变量首次在中国大陆完整合体;一旦在全球开源社群形成首发效应,过去二十年英伟达统治AI产业的“模型-框架-硬件”默认栈,就会出现首个被主流证实可用的备份栈。
技术上未必立刻动摇CUDA,但叙事上动摇了“CUDA是唯一起点”的认知。在快速演化的产业中,叙事往往比技术更早决定资金流向。这就是黄仁勋为何在这个四月,用“灾难性”三个字,将整场关于供应链、TPU、蛋糕和架构的访谈,引向他最不想谈却必须表态的主题。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



