黄仁勋千亿收购Groq背后:200亿美元锁定AI推理时代的时间与护城河

01-01 06:42

英伟达斥资200亿美元拿下Groq核心技术与团队,旨在补齐AI推理领域短板。随着AI从训练转向实时交互类推理场景,传统GPU显存延迟瓶颈凸显,而Groq的SRAM架构能实现数据近在咫尺的低延迟计算。此举让英伟达既省去两年研发时间,又封锁技术防止落入竞争对手之手,巩固算力统治地位。



硅谷圣诞前夜,黄仁勋向全球半导体行业投下一枚重磅“炸弹”——不是新品发布,而是一张200亿美元的支票。英伟达宣布与AI芯片独角兽Groq达成非排他性技术授权协议,同时将包括创始人Jonathan Ross在内的核心工程团队收入麾下。



Jonathan Ross


就在数月前,Groq估值仅69亿美元,英伟达却给出近三倍溢价,且未全面收购公司,只是买走技术图纸与核心人才。这笔看似疯狂的交易背后,是黄仁勋对AI下半场战局的精准判断与布局。


算力赛道分裂:GPU卡车与SRAM短跑选手


要理解交易逻辑,需先看清AI算力市场的分化。瑞士银行研报将AI推理市场比作双车道高速公路:



第一条车道是英伟达的统治区,跑着GB300这类通用GPU“重型卡车”,搭载海量HBM内存如同拖挂集装箱,灵活且适合大模型训练或高吞吐量、低延迟敏感度任务。


第二条车道则暴露了GPU短板。当AI转向推理阶段(用户实际使用场景),如实时语音对话、高频交易、自动驾驶决策时,GPU需频繁从外部HBM内存搬运数据,像卡车司机反复回仓库取货,物理距离导致的延迟成了瓶颈。


Groq正处于第二条车道的“ASIC类架构”领域。其设计激进:抛弃外部内存,将数据存于芯片内部SRAM中。若说GPU是拖集装箱的卡车,Groq的LPU就是把行李背在身上的短跑选手,数据伸手即得,实现极致低延迟与确定性,完美适配推理市场需求。黄仁勋深知,若仅靠GPU单腿走路,一旦市场转向低延迟,英伟达可能被侧翼突破。


押注“慢思考”模型:思维链推理的硬件刚需


除硬件架构差异,AI模型的新形态——具备“慢思考”能力的推理模型,也是交易关键诱因。这类模型回答复杂问题前会进行思维链推理,类似蒙特卡洛树搜索,需在无数路径中快速试错跳转,对低延迟硬件需求极高。Groq的SRAM架构恰好适配这种高频数据调用场景,这让英伟达坚定了收购决心。


200亿美元的双重价值:时间入场券与防御性封锁


英伟达并非造不出SRAM架构芯片,但其Rubin路线图的相关技术落地需时间。而Groq最核心的资产是打磨数年的软件栈——创始人Jonathan Ross曾是谷歌TPU核心设计者,团队构建的软件系统能让编译器完美调度芯片数据流。对AI芯片而言,软件是灵魂,硬件是肉体,从头搭建类似生态需18-24个月,在AI战场落后18个月等于退赛,英伟达买的是当下的入场券。


这更是一次防御性“掐尖”。Groq是唯一能对英伟达形成技术差异化威胁的初创公司,若其技术落入谷歌、微软等云巨头手中,将对英伟达形成合围。英伟达通过“非独家授权+挖人”的结构,既绕过反垄断审查,又掏空Groq竞争力:剩下的云服务业务成壳公司待售,核心技术与人才已归英伟达。


垄断护城河再加深:豪赌未来算力霸权


200亿美元对现金储备600亿美元的英伟达而言,是一笔巩固霸权的保险费。交易释放信号:英伟达要通吃训练与推理市场、HBM与SRAM架构,不仅做AI“石油商”,还要掌控所有“新能源”实验室。Jonathan Ross这位曾挑战巨头的创业者,最终带着财富归顺,成了硅谷创业现实注脚:若无法打败垄断者,就成为其最昂贵的猎物。尘埃落定后,英伟达的护城河更宽更深,竞争者的突围难度进一步加大。


参考资料:


https://x.com/rohanpaul_ai/status/2005658206543233378


本文来自微信公众号“新智元”,作者:新智元,编辑:艾伦,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com