14亿高薪留不住庞若鸣,Meta算力困局下扎克伯格如何破局?

1天前

本文来自微信公众号:腾讯科技,编辑:徐青阳,作者:值得关注的



Meta的2026年开局充满挑战。



刚过去的2月,中国AI模型忙着“春节大战”,硅谷模型在比拼“天级别更新”,Meta却几乎没有动作,甚至连花费14亿重金(约2亿美金薪酬)挖来的苹果基模负责人庞若鸣,入职仅半年就离职转投OpenAI。



不少人猜测,若硅谷大厂中有人要退出AI竞争,Meta可能是第一个。



模型开发进展迟缓,核心团队不稳定,如今算力也面临危机——据The information援引知情人士消息,Meta内部代号为Olympus的最先进AI训练芯片项目已被叫停。



为应对自研芯片的困境,扎克伯格选择加速外部采购,在原有英伟达供应基础上,新增AMD和谷歌作为算力供应商。



2月24日,Meta与AMD达成超1000亿美元协议,未来五年将采购足够支撑6吉瓦计算能力的AMD MI450系列芯片。



两天后,有消息称Meta与谷歌也达成合作,Meta将租用谷歌的TPU(张量处理单元)开发新AI模型,协议为期数年,价值数十亿美元。双方还在进一步洽谈,Meta或于明年直接购买TPU部署在自家数据中心。



01



自研遇阻,转向外部采购



Meta自研芯片的尝试已持续两年多,困境比外界想象更严峻。



多位知情人士透露,Meta内部代号Olympus的顶尖AI训练芯片项目已终止。该项目本是Meta对标英伟达的关键布局,采用与英伟达类似的SIMT架构。



据悉,Olympus的核心GPU设计来自Meta去年收购的初创公司Rivos。Rivos曾承诺其GPU可运行英伟达的CUDA代码,但能运行与运行稳定、能否大规模量产是两回事。



Meta原计划最早2026年第四季度完成Olympus设计,加上量产周期,规模化部署还需大幅延后。



这并非Meta首次在自研芯片上受挫。



此前内部代号Iris的第二代训练芯片也已被放弃。Iris采用SIMD架构,硬件设计相对简单,但软件编程难度大,训练AI模型时效率不高。



一位参与Meta芯片项目的人士表示,公司内部一直有质疑声:要造出性能媲美英伟达的芯片风险过高,延迟、重新设计、功耗控制等任一环节出问题,都可能让芯片失去实用价值。解决这些问题需要庞大的工程师团队,且无法保证最终成功。



Meta高管层最终做出务实决定:与其继续在自研芯片上消耗时间,不如直接外部采购。



扎克伯格1月在Threads上透露,到2030年前要部署“几十吉瓦”的数据中心算力,未来目标是“数百吉瓦甚至更多”。仅2025年,Meta就投入720亿美元建设AI数据中心,今年计划投入1350亿美元。



巨大的算力需求要求Meta制定多元采购策略,无法依赖单一供应商,这正是Meta“算力三角合作”的根源。



02



Gemini为TPU训练“正名”



自研芯片缺位,Meta需找到能与英伟达在训练环节形成互补的选项,谷歌TPU与Anthropic的合作也加速了Meta与谷歌的合作落地。



据参与谈判的人士透露,Meta租用谷歌TPU用于开发新AI模型,意味着将其用于训练而非推理。训练是英伟达最优势的领域,多数分析师曾认为短期内难有对手挑战英伟达的训练技术。



基于TPU训练的谷歌Gemini模型,为Meta采购TPU提供了参考。



不过,过去的阻碍在于谷歌TPU只能通过谷歌云使用,客户需将数据和计算任务放入谷歌数据中心,这对很多公司来说涉及数据安全、合规要求、成本控制等问题,是不小的障碍。



自Anthropic合作开始,谷歌调整策略支持外部采购,Meta与谷歌在TPU上的合作也遵循此模式,预计明年直接购买TPU部署在自家数据中心。



另一个促使Meta下决心的因素是:去年包括OpenAI和Meta在内的部分客户,在部署英伟达最新Blackwell芯片时遇到技术故障和其他复杂问题,未能按预期规模上线,这给了谷歌TPU一个窗口期。



同时,谷歌也在拓展更多渠道。据知情人士透露,谷歌正与私募股权公司洽谈成立合资企业,谷歌出芯片,投资方出钱,共同将TPU租给更多客户,这与英伟达扶持CoreWeave等“新云厂商”的思路类似。



消息称,谷歌已与一家大型投资公司签署投资意向书,由谷歌云资深人士本杰明·特雷纳·斯洛斯(Benjamin Treynor Sloss)领导的团队主导TPU融资工作。



有知情人士透露,部分谷歌云高管曾在内部表示,TPU业务有望拿下英伟达10%的市场份额。按英伟达过去12个月约2000亿美元收入计算,10%就是200亿美元。



当然,谷歌也需处理微妙关系:它既是英伟达的竞争对手,也是其大客户。谷歌云部门必须持续购买英伟达GPU,因为很多开发者指定使用。若谷歌云没有英伟达芯片,这些用户可能转向其他云平台。



因此谷歌采取“两头下注”策略,一边销售自家TPU,一边继续采购英伟达GPU。



03



携手AMD布局“推理”环节



训练问题有了方向,推理环节的需求同样巨大,AMD由此进入Meta视野。



2月24日,Meta与AMD宣布超1000亿美元协议,未来五年将采购足够支撑6吉瓦计算能力的AMD MI450系列芯片。AMD方面表示,每吉瓦计算能力对应数百亿美元收入。





这笔交易的特别之处在于股权绑定。



作为协议一部分,AMD授予Meta认股权证,允许后者以“低价”收购约10%的股份。不过这需满足特定业绩里程碑,且全部行权的前提是AMD股价涨到600美元,而目前AMD股价约200美元,意味着其市值需在现有基础上增长两倍。



AMD CEO苏姿丰在合作公告前的记者会上坦言:“Meta有很多选择,我希望确保他们在考虑下一步需求时,我们始终是明确的选项。”



值得注意的是,Meta与AMD这种“循环融资”模式在AI芯片行业并非首次。2025年10月,AMD与OpenAI达成的协议条款几乎一致。



MI450系列采用Chiplet设计,将多个小芯片组合,定制化空间更大。Meta采购后可针对自身应用场景优化,主要用于推理环节。



04



英伟达的预判与博通的“隐形收益”



Meta这种多供应商的“算力合作”模式,黄仁勋早有预判。



“大多数科技公司最终会放弃自研AI芯片。”2025年黄仁勋在分析师会议上表示,理由是英伟达GPU性能将持续领先,竞争对手的芯片永远慢一步。



但英伟达面临的现实是,仅靠性能领先不够,台积电的产能是关键:只要供给不足,市场就会有缺口,竞争对手就有机会。



因此,除了与大客户签订长期协议锁定订单,英伟达也推动“循环融资”:



去年,英伟达投资Anthropic,条件是对方继续使用其芯片;同时与OpenAI讨论过300亿美元股权投资。在客户方面,英伟达2月中旬与Meta达成“多代”合作伙伴关系,承诺未来几年供应数百万颗GPU。



现阶段,英伟达还有一张无法替代的王牌——CUDA生态护城河。



“硬件不是护城河,大家都能设计,AMD投了几百亿美金,性能也不错,但始终无法超越英伟达,核心就在于CUDA生态。”一位国产芯片创业者此前透露。



该创业者强调,CUDA生态的工具包集成度极高,无需编写的函数和代码都能快速找到。



在这场算力竞争中,博通虽低调却收益丰厚。



谷歌TPU的生产与封装一直由博通负责,博通与台积电对接,提供关键的SerDes IP,实现TPU间高速互联并行计算。分析师估算,仅这一业务博通就能入账至少80亿美元。



博通的角色不止于此,它既为谷歌供货,也开展定制芯片业务,手握核心封装技术和IP,短期内难以被替代。



不过谷歌与博通并非毫无矛盾。外媒援引知情人士消息,两家公司常因定价产生分歧,谷歌已开始寻找替代合作伙伴。



联发科的出现是关键信号——其很快将生产低配版TPU,帮助谷歌降低AI运行成本。



据了解,联发科作为台积电2026年CoWoS新晋客户,已投入大量人力支持ASIC业务(未来将成重点板块),2026年下半年主要承担侧重推理的TPU v7e出货,2027年将成为出货主力。



05



结语:算力焦虑下的现实选择



在英伟达近期业绩会上,黄仁勋被问及硅谷巨头7000亿美元年度资本支出时表示对客户有信心,更关键的是后半句:



“在AI新世界里,计算直接创造收入。没有计算,就无法生成token;没有token,收入增长就无从谈起。”



Meta的焦虑正源于计算,源于对算力不足的恐惧。



梳理Meta近期的几笔交易,可见这家老牌巨头在自研不顺后的现实选择:



训练离不开英伟达芯片,就继续采购并以长期协议锁定供应;训练市场需后备选项,就租用谷歌TPU增加筹码;推理市场需求大,自研芯片跟不上就找AMD定制,同时获取股权。



从扎克伯格的多次分享来看,他清楚算力是AI时代的资源储备,与黄仁勋“计算创造收入”的观点一致,谁储备多谁就能跑得更快。



对英伟达、谷歌、AMD、博通等供应商而言,Meta的多供应商策略既是机会也是压力:机会在于市场蛋糕在扩大;压力在于无法再靠独家供应“躺赚”。



特约编译金鹿对本文亦有贡献


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com