房租在10个月内暴跌50%,为什么英伟达H100不香?聚焦分析

1天前

作者邱晓芬


苏建勋的编辑


近日,英伟达卡租赁价格崩溃的话题引起了AI行业的热议。在一篇广为流传的外网文章中,用“英伟达GPU租赁泡沫破裂”的恐怖表达来描述当前的趋势。


据36Kr介绍,英伟达核心产品在中国的租赁价格剧烈波动确实是事实。2024年英伟达热门芯片租赁价格走势如下。——


英伟达H100通常以8卡为节点出租。一个节点年初的市场价格波动在12-18万/年之间,现在在七万元左右徘徊;


消费级显卡“英伟达4090”,之前的“采矿热”一度被炒到1.8万、9万,很难找到一张卡。今年年初,“英伟达4090”单片的年租金价格约为1.3万元,目前的租金价格约为七八千。


换言之,英伟达这两个热门芯片的租赁价格在10个月内。双方都下降了50%,不再是往年一卡难找的香饽饽。


然而,很多业内人士表示,没有外网文章那么耸人听闻,没有必要恐慌。据业内人士计算,过去,在五年内,常规计算率芯片租赁价格大约下降了80%。——英伟达H100、在2022年之前,4090的发布时间大致符合价格下跌的客观规律。


当然,还有其他原因的综合作用。英伟达热门芯片租赁价格的下跌,本质上是英伟达产品周期的作用力,以及市场供需变化的算率。


而且面临着市场的新变化,国内算率行业也在紧急调整。


计算供求天平倾斜

英伟达芯片租赁价格下降,与英伟达目前处于新旧商品交接期有关。


据一位业内人士透露,与H100相比,英伟达今年Blackwell架构新产品GB200,单位计算率成本较低,而大多数AI公司基本上都选择了“蹲新产品”,这在一定程度上导致了老产品的寒冷。


根据黄仁勋的描述,新产品完全是另一副光景——它的名字,Blackwell芯片需求旺盛,导致份额分配就像“走钢丝”,一不小心,他就会“得罪大客户”。


但是即使万众期待,这款新产品也面临着尴尬的延迟。


英伟达的工程师将困境归咎于台积电使用了一种全新的包装技术;台积电指责英伟达疯狂催促生产过程,给他们比过去更短的验证时间。结果,英伟达本应该在今年第三季度推向市场的新芯片,现在推迟到第四季度甚至明年。


在GB200正式问世之后,一位芯片行业人士向36氪预测,英伟达老芯片租赁价格下跌趋势极有可能进一步加剧,其判断是“预计近半年内不会恢复”。


另外,英伟达商品租赁价格大幅下降,与当前计算市场供需关系不匹配有关。


计算行业在国内的规划模式与海外相反。——在国内,首先要搭好计算能力的水池,然后逐步发展AI应用,就是“拿着钢钉找锤子”;而且国外的算率行业更加商业化,更倾向于在找到准确的客户后,重建与之匹配的算力中心。


一些行业数据显示,近两年来,国内总共出现了大大小小的情况。智算中心13,000个,截至2024年上半年,国内算率已达世界第三(246) EFLOPS),智能化计算率同比增长65%以上。


在这次建设浪潮中,英伟达H100芯片囤积浪潮也在中国掀起。因此,当芯片以中国香港和新加坡为转运站时,它们最终以各种秘密方式进入中国,但计算率行业悲观地发现。最初消耗计算能力的预训练,需求普遍下降。(点击详细信息:大模型「六小虎」里面,至少两个要放弃大模型了。 | 焦点分析


与此同时,自2024年以来,虽然推理和模型微调的需求有所超越,有超越预训练的趋势,但也没有达到原来想象中的“爆发”趋势,“AI的超级应用还没有看到,或者说是清晰的场景”。


如果近两年囤积了大量芯片所形成的算率,短期内还没有广泛的AI应用,天平倾斜,计算行业的供需。,价格的下跌也是意料之中的。


以前买卡,现在租卡

过去,计算率行业的一个常见商业模式是销售英伟达的“裸金属”,这个行业通常被称为“卖铁”。然而,随着计算率行业供求的变化,纯硬件销售方式过于简单直接,难以持续。尤其是英伟达的租赁价格今年以来出现了“崩溃”,对于算率芯片的概念,下游AI行业也悄然发生了变化。


如果说几年前谁能买断更多的英伟达芯片,那就意味着谁最有机会更快地训练出更强大的模型。如今,AI企业更倾向于选择。通过租用芯片获得计算率,而不是直接买断芯片的重资产,挤压现金流。


所以,上游算率行业也做出了适当的调整,以适应这一趋势,试图推出更加多元化的租赁。


一位业内人士表示,过去AI制造商如果租用英伟达卡,基本上需要多个节点,按年起租。但是今年的变化是,需要计算能力的用户不仅变得分散,而且对成本也变得特别敏感,对分时租赁的需求也变得非常高。


有些算力中心也允许你一次只租几张英伟达卡,只租几个小时。这个有点像,在过去,你需要每年租一到两层楼,但是现在允许你短租一个房间。


然而,这些变化的直接后果是计算率行业的回报周期变得更长。有业内人士粗略计算了36氪,“一个由H100芯片构建的计算能力中心,硬件回报周期超过5年”。


同时,算率行业从业人员也在努力提高算率服务的粒度,模型层、网络层逐渐向上延伸的趋势。


36氪了解到,部分智算中心运营商在销售计算率的同时,也会顺便帮助下游AI客户进行模型微调;


或者直接深入几个对计算能力需求较强的行业,比如金融、药业、新能源,结合具体情况,挖掘更多可以出售计算率/租赁计算能力的隐性需求。


上面提到的业内人士表示,他们经过计算,配合各种AI服务,“硬件成本回到这个周期,最短能缩减到2年左右”。


这些调整都不是坏事。经过两年的高速飞行,AI行业和计算率行业的供需关系变得更加清晰,双方都在以更加理性的眼光对待英伟达芯片,这些芯片在过去几年被视为珍宝。



end


end


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com