计算率就是权力,英伟达为什么会变成权力? 硅谷恶龙?

2024-08-11

卖铲子是个好生意,但是如果总是卖给为数不多的挖掘者,总是暴露在“关键客户风险”之中,那就不一定了。


正如英伟达显然是AI芯片的霸主一样,黄仁勋“每天早晨醒来都担心公司会倒闭”。


可以看出,英伟达的用户一直都很集中,CR5长期占一半以上。2002年巅峰时期,前五大客户收入占65%,前两大客户占比惊人的40%。当时大金主微软撤单后,英伟达业绩暴跌,股价暴跌90%。


2008年,苹果、戴尔、惠普三大PC巨头集体停止了类似的“大客户困境”,后来谷歌、特斯拉等标杆客户开发自己的芯片时,再次上演。


到目前为止(2024财年),英伟达前两大客户的收入占比仍然高达32%,前五大客户估计也接近50%,以至于华尔街分析师的保留项目之一就是每一次英伟达发完财务报告后,计算其大客户集中度。


不过,超级金主们虽然掌握了英伟达的命门,但是他们现在已经不敢轻易举桌了。


那些被撤单逼迫英伟达降价的巨头,变成了英伟达的追随者。黄老板每次发一个新的GPU,都会毫不犹豫地排队加价抢购。


所以,从任人把握到喧宾夺主,英伟到底是怎样反杀的?


这篇文章回顾了它与大客户的三轮斗争,发觉英伟达的发家史,是一部浓缩的技术产业进化史。从暂时领先到绝对领先,从可替代到不可替代,它一步一步地夺回话语权,直至成为新时代的“硅谷恶龙”


充当PC游戏“万金油”,站在顾客的肩膀上


对于黄仁勋来说,2002年一定是难忘的一年。


今年,英伟达股价暴跌90%,他的个人财富也缩水了10倍,直接在“亿万富翁”中跌回“千万富翁”队伍。


他的痛苦来自大金主微软:两家公司合作的Xbox游戏机项目到了打价格战的时候了。微软要求英伟达降低GPU价格,但当时英伟达也踩成本线造芯,自然拒绝讨价还价。微软一怒之下撕毁了双方的合作。


要知道,微软这份合同占英伟达年销售额的近七成,合作破裂后,英伟达的收益迅速收窄,市值也一落千丈。


黄仁勋不得不妥协,同意“降低Xbox未来的成本”,以享受大欺店的味道。


不过,六年后,GeForce对苹果、戴尔和惠普不满。 集体撤单6000-9000系列芯片,股价暴跌95%的“显卡门”事件,黄老板却选择了得罪顾客爸爸。


他轻轻地揭露了显卡导致电脑过热、烧机的问题,随后苹果主动寻求定制化合作,也一口否决。


这两种完全不同的态度,很大程度上是由于话语权的转移。


世纪初的主机时代,游戏机厂商掌握“流量入口”,索尼、任天堂等巨头通过游戏发行、运营等方式一站式吃掉。芯片供应商一般只能“抬起鼻子”



即使英伟达开创性地提出了GPU概念,并在显卡领域骑行——显卡技术自划时代商品Geforce256以来不断快速迭代,拿着游戏行业从2D到3D的钥匙,也无法逃脱被锤定的生死。


在与微软分手后,英伟达又直接错过了新规格的DirectX9微软,导致新推出的GeForce FX与微软标准不兼容,产品本身不成熟,销量惨淡。


而且得到微软支持的ATI,推出了吊打英伟达GeForce。 FX的Radeon 在GPU市场,9700发展迅速。2004年第三季度,ATI市场份额为59%,英伟达市场份额仅为37%。


但是,到了PC游戏行业,游戏机厂商“流量入口”的垄断地位已经被打破。


在这个领域,行业的核心在于游戏本身,更倾向于“游戏厂商自由奔跑,硬件公司拼命追逐”,行业内的R&D、发行、硬件、软件都有自己的分工。



这意味着,与索尼、任天堂、微软这几个游戏机时代相比,芯片厂商的潜在用户突然扩大到产业链的角落。


如下图所示,英伟达在2004-2006年的利润持续增长,而前五大客户贡献的收入份额却持续下降。



与此同时,这波由显卡技术推动的“真实3D”落地,叠加了网络和宽带的普及,也对产业链上下游的芯片能力提出了更高的要求。



以消费者为例。由于复杂的3D建模,这些酷炫的游戏也被称为电脑杀手,玩家的电脑升级无法停止。然而,他们对设备性能的追求迫使PC制造商选择擅长性能的芯片。


比如2007年,《孤岛困境》在国内外疯狂扫荡,画面真的让人爱不释手,但却极大地考验了显卡的性能。有玩家回忆说:“大学暑假,老板玩了一天,每次发完核弹都要暂停冷却电脑。”



它使得英伟达Geforce9800GT显卡能够顺利运行《孤岛困境》,在全球范围内销售超过500万片。


说白了,与主机行业相比,PC游戏的上游只要做好性能、良率、价格的平衡,就可以完全靠商品说话,不用做“低三四”的乙方。


可以看出,自2004年以来,英伟达GPU在PC游戏行业大行其道,“每一轮更新,性能翻倍,价格持续下降”。


然而,不仅英伟达盯上了这块蛋糕,芯片巨头们也不甘落后。


老牌CPU玩家如英特尔、AMD等迅速切入GPU,宿敌ATI也步步紧逼,AMD甚至在2005年宣布与ATI合并,希望通过CPU和GPU强强联手,称霸行业。


一场激烈的战斗就在眼前。没想到ATI为了卖个好价钱,买了大量过时的GPU技术专利,不仅让AMD连年负债,还减缓了GPU的整合节奏。AMD在不断迭代的芯片行业消失了。


对手的落后让英伟达非常自豪,就像黄仁勋炫耀的那样:“这是天上掉馅饼的礼物。我们成为世界上唯一一家独立的图形芯片公司。”


而且技术在手,一家独大的英伟达,也从此有了与顾客掰手腕的能力。


比如上面提到的“显卡门”事件中取消订单的戴尔和惠普,在英伟达推出新产品后,纷纷下单;AMD后,苹果不得不咬紧牙关,重启英伟达的合作,因为效果不好。


但是黄老板还没笑多久,新的困境又悄然而至。


坚持GPU通用性,让大客户无法避免。


黄仁勋的一个著名故事是,他在2013年的小米发布会上声称自己是米粉,并大喊:“请给我一个介绍英伟达的机会!”


那时吃瓜的人纷纷感叹黄老板能伸能屈,以为英伟达要死磕手机芯片市场。


没想到,下一年,黄仁勋就放弃了自己一直狠舔的机会,宣布“智能手机和平板电脑芯片市场将逐步退出”。


当时黄仁勋给出的解释是:手机厂商激烈的价格战,让上游也不断地降低价格,但是价格并非英伟达的强项,只能退出。


但是现在我们知道,价格战只是一个表象,更深层次的原因是:移动终端的芯片需求与英伟达追求的极致性能相悖。


PC市场的成功让黄仁勋比任何人都清楚,在芯片领域,拥有领先(甚至独特)技术的企业往往可以获得更多的蛋糕和更深的环城河。


因此,对于手机端芯片,英伟达实施了“技术取胜”路线:Tegra系列一直疯狂积累算率,Tegra 2到Tegra GPU核心由8个变为12个,Tegra4更是猛增至72个,整个系列被视为跑分利器。


然而,配备在智能手机和平板电脑上的移动芯片需要在有限的空间和电量下工作,并且更加注重均衡的设备。拼接特性的英伟达芯片很快就出现了严重的能耗失控和燃烧问题。


更为重要的是,通信信号技术被高通牢牢把握,手机厂商若与英伟达合作,又要花高价自制基带,便纷纷退缩。


在这种情况下,要想继续追求移动化,英伟达必然会在性能上妥协,这与“技术狂”黄仁勋的风格不符。,他决定“专注于高性能、需要视觉计算或游戏导向的设备”。


然而,市场并不买账。当时,英伟达的主要市场PC游戏已经结束,加速渗透。整个互联网正处于一个热门的移动换挡期。移动失败不仅让英伟达的业务陷入了绿色和黄色,也意味着它放弃了一个蓬勃的市场来追求技术。


而且英伟达不止一次这样一意孤行,再一次可以追溯到2006年。


当时在世人眼里,GPU只是一个游戏装备。黄仁勋偶然看到一些在华尔街做高频交易和金融量化的人在用英伟达GPU进行交易,但他们只能编写大量的低级机器代码,不能像CPU那样使用CPU。 等待语言编程。


这让黄仁勋意识到市场对一般计算场景有一定的需求。当他回去的时候,他喊着要加码软件开发(也就是CUDA平台),让GPU承担各种任务,而不仅仅是为了在游戏领域画图。


项目一开始,每年砸到上面的R&D费用预计将达到5亿美元,当时英伟达的年收入只有30亿美元。


当时并行计算带来的巨大通用计算率没有明显的市场需求,最多用于先进物理实验室、量化交易等冷门领域。单个项目所需的GPU仅限于个位,华尔街曾经将CUDA技术估值为零。


换句话说,在一个与核心业务几乎无关,前景一目了然的软件平台上,黄老板将企业1/6的收入下注。


英伟达的芯片不仅需要烧钱,还需要增加更多的逻辑电路来搭载适合CUDA平台的芯片,这增加了芯片面积,增加了排热需求,显著提高了故障率。


上述惠普、戴尔、苹果等撤单事件,正是由于英伟达芯片发热严重,导致大量笔记本电脑卡住,出现故障。


但是黄仁勋坚信“这种制作软件的方式可以改变一切”,即使为客户支付了2亿巨款,他仍然在CUDA上偏执地投资。


事实证明,他赌对了


基于英伟达芯片计算的卷积神经网络AlexNet在2012年底的ImageNet大赛中,一举将识别准确率提高到84%,从而开启了未来十年的AI革命。


它还使英伟达GPU CUDA组合在深度学习领域一鸣惊人。曾经讽刺过“GPU只是用来玩游戏的”的谷歌,瞬间成为了英伟达的粉丝,微软、Facebook等巨头也为人工智能训练下了大量的GPU订单。


而且这只是开始,伴随着深度学习领域的不断突破,巨头们逐渐围绕着英伟达在多个场景中的“转”


比如2015年,当深度学习在图像识别领域的误差率低于人类时,自动驾驶市场爆发,而在汽车端,燃烧的能耗不再是问题,被手机厂商拒绝的Tegra芯片受到汽车公司的青睐。



AlphaGo代表AI在2016年击败了李世石,再次点燃了整个B端市场。


可以看出,各大厂商开始为各行各业的B端客户提供图像识别、认证、检索等一系列基于深度学习的AI服务产品。



除了互联网、自动驾驶等领域对GPU的高需求外,能够应用AI技术的生物医药和量化交易领域的企业也加入了英伟达客户团队。


资料显示,截至2016年,英伟达在深度学习领域的市场份额达到97%。


到目前为止,英伟达坚持GPU和CUDA的特点,等待着“算率就是权力”的兑现时间:大客户的业务处处无法避免英伟达,也就失去了掀桌资质。


这种话语权的提高使英伟达如沐春风,但也埋下了隐患。


自研芯片的大客户,反而被英伟达钳制


2017年,英伟达的“一纸禁令”引起了全球科技界的公愤:不再允许客户在数据中心使用GeForce产品进行深入学习。


当时,英伟达正在支持Tesla系列的高端新产品,它的服务器与GeForce系列相同,但是价格却大不相同,顶级版本的价格却高了近10倍。禁令的颁布意味着客户不能再使用GeForce来替代Tesla,家境较薄的创业公司甚至可能会断送生路。


“恶龙行为”最终在一片抗议声中被暂停,但是但是,科技公司对英伟达的防范日益加重。


回放那些年,谷歌,Meta、互联网巨头,如微软、特斯拉等电动汽车公司,纷纷自主研发芯片,试图减少对英伟达GPU的依赖。


除讨厌“英伟达税”外,自研芯片也比向英伟达购买更香。


以汽车行业为例,智能驾驶系统是汽车最需要的计算能力,但英伟达芯片是一个通用的“六边形战士”,不仅计算速度不尽如人意,而且占据了很大的空间。


与巴掌大的英伟达DRIVE相比,自研芯片是专门为无人驾驶而制造的,例如特斯拉的FSD芯片, PX 二是大幅度降低,能耗降至三分之一。


FSD芯片还优先安排了NPU的深度学习和预测。与GPU相比,它在AI机器学习方面更有效率,计算率提高了5倍。


泛AI领域也差不多。芯片可以从架构、上层操作系统、中间件到业务代码等环节进行适配和改造。谷歌的TPU芯片和亚马逊的Graviton芯片都是如此。


在推理计算领域,谷歌TPU比英伟达GPU快15-30倍,性能功耗比大约30-80倍。



换句话说,自研芯片不仅可量身定做,而且在性能、尺寸、功耗等方面也碾压了英伟达的通用芯片。


此外,目前的芯片虽然被称为“自研”,但并不需要全栈研发。以特斯拉为例,除了NPU自研,其他CPU、GPU、接口等采购标准IP,短短18个月就完成了开发。


因此,大客户掀起自主研发狂潮后,英伟达一直陷入“被颠覆”的质疑之中。然而,虽然大客户有造芯的气魄,但要取代英伟达并不容易。


众所周知,芯片制造的R&D设计、场所设施等固定成本高得惊人,光流片是一笔丰厚的开支,7纳米芯片的一次性流片成本约为2亿元。



基于此,这个行业一直以“成本规模”为核心:对于R&D方来说,芯片可用场景越多,R&D成本就越能稀释;制造商一次订单越多,产能利用率就越能充分调动,出货利润就越能保持在一定水平。


可以看出,通用架构的英伟达,可以稀释单个场景的R&D费用。比如汽车芯片Thor采用的Hopper架构,成本可能已经被同一架构的H100摊出来了。


而且这显然是自研芯片多用于特殊情况的大客户所没有的。因此,巨大的R&D费用可能会使他们望而却步。


在制造方面也是如此。有些机构曾经算过一笔账:假设汽车公司每年有120万辆汽车,使用120万元的高算力芯片,每月就有10万元,如果每个12寸晶圆有500个芯片,那么每个月只需要200个晶圆。


有了这么少的需求,台积电只能算是最小的客户,封装测试厂也是如此。当Fab和封装测试能力供不应求时,会优先保证大客户的供应,延长排单等待时间。


再加上检测等链接的连锁反应,芯片的实际应用可能会延长落地周期。例如,特斯拉FSD芯片在2017年底完成了第一次试生产,但两年后才开始装载,更新迭代更加缓慢。相比之下,英伟达基本上可以每18个月升级一次汽车芯片。


这迫使很多公司重返英伟达的怀抱,尤其是大模型和生成式AI热潮来袭后,计算率成为必争资源。即使是还在坚持自主研发的大厂,也不敢放弃购买英伟达的先进GPU。


英伟达的算率芯片已经成为名副其实的硬通货。有传言称,Oracle创始人和马斯克曾在一家日本食品办公室跪下求黄仁勋一个小时,只是为了得到GPU芯片配送。


据悉,英伟达每卖一张H100,可以含泪赚1000%。AI相关行业50%的收入,都流向了英伟达的口袋。


面临得寸进尺的“英伟达税”,大客户咬牙切齿,但无计可施。——目前芯片竞争软硬件并重,而英伟达不仅手持芯片,而且软件环城河CUDA。


在过去的十年里,CUDA作为一个函数库和代码库,长期以来一直向开发者开放,吸引了数百万开发者。他们开发了更多的工具,使CUDA的生态日益完善,几乎成为“基础设施”。


假如GPU被比作电厂,那么开发者就像造电器的人,而CUDA就像“电网系统”,电器的电压规格与电网相适应。


这也注定了CUDA的地位难以替代。英伟达的大客户去年发起了“反CUDA联盟”,试图重建一个适合CUDA的编译工具,以打破CUDA在软件-芯片协同设计方面的垄断地位。


但是,当第三方软件企业的计划达到接近CUDA的水平时,英伟达已经发布了下一代GPU,软硬件齐头并进,使得挑战者始终处于追逐状态。


此外,闻到危险气息的英伟达已经开始筑起高墙:首先,他威胁“购买服务器机架,优先获得GB200”,将昂贵的定制架捆绑起来,增加客户的转移成本;然后收紧反编译政策,堵塞其他工具适应CUDA的道路。


这样,那些自研芯片的大客户,最终还是要沦为英伟达砧板上的肉。


国内显卡吧的英伟达“信众”,曾经用《史记》体来评价黄仁勋:“先有仁勋后有一天,显卡在手虐仙人。


在众多风口的加持下,正如黄仁勋所坚信的那样,算率的确改变了世界,他的信仰得到了广泛的认可,他的力量甚至可以主宰市场。


但是创造历史的人永远无法预测他们在历史进程中的坐标。这就决定了对于黄仁勋来说,每一天都处于“枕戈待旦”的状态。


本文来自微信微信官方账号“表面内”,作者:洞察数据研究所,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com