GPT-5.5涨价翻倍,Gemini暴涨三倍:当前AI涨价潮还能持续多久?

1分钟前

AI前沿大模型的这场涨价博弈,究竟还能走多远?


从今年一月开始,全球GPU租赁价格涨幅已经超过两倍。



根据Counterpoint在今年2月推出的《内存价格追踪报告》数据,2026年第一季度至今,内存价格环比上涨幅度已经达到80%-90%,创下了历史最大涨幅记录。



上游成本的暴涨,已经直接传导到了AI行业的下游终端。


AI研究机构Epoch AI最新发布的《梯度更新》报告做了一个直白测算:把全球所有Blackwell芯片的算力加总,算出能处理的Token总量,再和当前市场的实际需求做比对。


最终结论很残酷——供给完全跟不上需求


暴涨的Token需求已经吞噬了算力供给


先看供给端的情况。


Epoch AI的测算以Kimi K2.6大模型为基准,该模型是拥有万亿总参数、320亿活跃参数的MoE架构。



在输入输出比为8000:1000的标准场景下,全球所有Blackwell芯片集群的理论吞吐量极限,是每秒约200亿输出Token


这个数字听起来很大?换算一下,相当于全球每个人每月能分到700万Token。



但这只是理想场景下的理论值。如果把上下文窗口拉长到现在常用的128k,Blackwell的吞吐量会直接暴跌50倍,降到每秒仅约5亿输出Token。


再来看需求端。


Google不久前披露,自家产品现在每秒就要处理约12亿Token(包含输入+输出)。


按照行业常见的8k输入对应1k输出的请求比例换算,Google每秒的输出Token需求约为1.3亿。Exponential View估算,Google的需求大约占全球总Token需求的25%。



也就是说,以现在的需求来看,把全球所有Blackwell芯片全产能拉满,全部用来跑大模型,也只是刚好能勉强撑住。


那需求现在的增长速度是多少呢?


每年10倍。


从2024年开始,Google处理的Token量每年增长10倍,其他AI服务商的增长速度也基本和这个水平一致。


反观供给侧呢?全球AI算力每年只增长3.4倍,芯片内存带宽的年增速也只有4.1倍。



供给年增3.4倍对上需求年增10倍,供需缺口每年都在被越拉越大。


Meta员工日均消耗百万Token,企业端需求已经爆炸


算力紧缺从来不是抽象的数字,已经真实发生在企业日常运营中。


看看头部科技公司内部的情况就知道了。


The Information报道显示,Meta的8.5万名员工,每个月就要消耗掉60万亿Token



换算下来,Meta每一位员工平均每天就要烧掉约100万输出Token。



Apple的消耗规模更惊人。


Apple部分工程团队,每天的Token使用预算就高达300美元——按照Kimi K2.6的定价计算,这笔钱足够一个人生成2500万输出Token。



这还只是两家头部公司的消耗。


现在全球大约有1400万软件工程师每天都在使用AI工具。


如果所有工程师的使用强度都达到Meta或者Apple员工的水平,全球Token吞吐需求将会直接飙升到每秒2亿到40亿Token


40亿的需求,对比Blackwell在长上下文场景下5亿每秒的极限供给,差了整整一个数量级。


涨价持续,但增长开始放缓


更值得玩味的变化已经出现。


METR最新研究结果显示,Claude Code在实际开发测试中,反而让资深开发者的任务完成速度变慢了19%


同时,VS Code相关AI编码插件的安装增速,从今年年初开始就已经明显放缓。



编码AI工具增长放缓,背后其实是两个因素的叠加:一方面是算力资源本身已经捉襟见肘,另一方面很多企业今年的AI预算已经提前花完。



和增长放缓形成鲜明对比的,是前沿大模型的一轮接一轮涨价:ChatGPT Pro上调订阅价格,Claude API价格持续上涨,Gemini的涨幅最夸张,部分场景价格直接暴涨3倍,GPT-5.5的定价更是直接翻倍。



现在企业用AI,用量越来越大、花费越来越高,但获得的效果却不一定能跟上成本涨幅,这笔账企业很快就算明白了。


高性价比替代方案成新选择,前沿模型定价权动摇


市场已经出现了新的分流路线,很多企业开始转向高性价比的替代方案。


DeepSeek V3的训练成本只有头部前沿模型的1/10到1/20,API价格更是低到同类前沿产品的1/16。



那性能呢?DeepSeek V3的实际表现已经逼近GPT-5的水平。


国外技术社区Hacker News上有一个热门帖子,创作者做了一个11个月回本的投资回报模型,帮企业算清楚:从GPT-5.5切换到DeepSeek,每年能省下多少成本。



评论区的开发者和企业管理者形成了一个共识:前沿大模型的定价权正在逐步崩塌


当一个高性价比模型只用1/16的价格,就能跑出头部模型90%的效果,涨价对头部模型来说就不再是利润增长的手段,反而会变成加速客户流失的推手。


本来,「企业不断增加Token用量榨取AI价值」是前沿大模型厂商的核心增长逻辑,但现在The Information的报道显示,这种增长逻辑已经开始反噬AI厂商自身的利润空间。


用户越多,亏损越多;靠涨价止血,用户就会流向替代方案。这已经形成了典型的死亡螺旋。



AI行业走到算力经济悬崖边,格局正在重塑


把视角拉远来看整个行业。


当前全球的AI算力里,OpenAI、Anthropic、Google DeepMind这些顶级前沿实验室,只占据了20%-30%的份额。


剩下70%-80%的算力,都掌握在企业自用算力、云服务商、推理服务商手里。


这也就意味着,哪怕是最顶级的AI实验室,也没办法靠自建算力填满供需缺口,它们和所有参与者一样,都在抢同一批芯片产能。


算力年增3.4倍,需求年增10倍,这个供需剪刀差不会自动消失。


确实,小模型已经在替代一部分市场需求,蒸馏模型生态的崛起就能证明这一点,但模型能力提升又在不断催生新的更大需求,缺口依然无法填补。


现在整个AI行业其实已经站在了悬崖边上,这不是技术能力的悬崖——大模型的能力还在不断变强,这是经济模型的悬崖,现在的商业逻辑已经算不通了。


当GPU租金翻倍上涨、API价格接连暴涨、开源高性价比替代品性能逼近头部、企业开始质疑AI编码工具的投资回报,一个核心问题已经被抛到了行业面前:


前沿大模型的核心护城河,到底是模型本身的智能,还是堆出来的算力?


如果答案是算力,那么控制芯片产能的玩家,就能掌控AI的未来;如果答案是模型智能,那么DeepSeek用1/16的成本就能逼近同等效果,已经动摇了这个结论。


参考资料:


https://counterpointresearch.com/en/insights/Memory-Prices-Surge-Up-to-90-From-Q4-2025


https://www.signalbloom.ai/posts/outsourcing-plus-localai-will-soon-become-more-economical-vs-frontier-labs/https://news.ycombinator.com/item?id=48278610


本文来自微信公众号“新智元”,作者:ASI启示录;编辑:大卫,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com