GPT-5.5涨价翻倍，Gemini暴涨三倍：当前AI涨价潮还能持续多久？

05-29 06:39

AI前沿大模型的这场涨价博弈，究竟还能走多远？

从今年一月开始，全球GPU租赁价格涨幅已经超过两倍。

根据Counterpoint在今年2月推出的《内存价格追踪报告》数据，2026年第一季度至今，内存价格环比上涨幅度已经达到80%-90%，创下了历史最大涨幅记录。

上游成本的暴涨，已经直接传导到了AI行业的下游终端。

AI研究机构Epoch AI最新发布的《梯度更新》报告做了一个直白测算：把全球所有Blackwell芯片的算力加总，算出能处理的Token总量，再和当前市场的实际需求做比对。

最终结论很残酷——供给完全跟不上需求。

暴涨的Token需求已经吞噬了算力供给

先看供给端的情况。

Epoch AI的测算以Kimi K2.6大模型为基准，该模型是拥有万亿总参数、320亿活跃参数的MoE架构。

在输入输出比为8000:1000的标准场景下，全球所有Blackwell芯片集群的理论吞吐量极限，是每秒约200亿输出Token。

这个数字听起来很大？换算一下，相当于全球每个人每月能分到700万Token。

但这只是理想场景下的理论值。如果把上下文窗口拉长到现在常用的128k，Blackwell的吞吐量会直接暴跌50倍，降到每秒仅约5亿输出Token。

再来看需求端。

Google不久前披露，自家产品现在每秒就要处理约12亿Token（包含输入+输出）。

按照行业常见的8k输入对应1k输出的请求比例换算，Google每秒的输出Token需求约为1.3亿。Exponential View估算，Google的需求大约占全球总Token需求的25%。

也就是说，以现在的需求来看，把全球所有Blackwell芯片全产能拉满，全部用来跑大模型，也只是刚好能勉强撑住。

那需求现在的增长速度是多少呢？

每年10倍。

从2024年开始，Google处理的Token量每年增长10倍，其他AI服务商的增长速度也基本和这个水平一致。

反观供给侧呢？全球AI算力每年只增长3.4倍，芯片内存带宽的年增速也只有4.1倍。

供给年增3.4倍对上需求年增10倍，供需缺口每年都在被越拉越大。

Meta员工日均消耗百万Token，企业端需求已经爆炸

算力紧缺从来不是抽象的数字，已经真实发生在企业日常运营中。

看看头部科技公司内部的情况就知道了。

The Information报道显示，Meta的8.5万名员工，每个月就要消耗掉60万亿Token。

换算下来，Meta每一位员工平均每天就要烧掉约100万输出Token。

Apple的消耗规模更惊人。

Apple部分工程团队，每天的Token使用预算就高达300美元——按照Kimi K2.6的定价计算，这笔钱足够一个人生成2500万输出Token。

这还只是两家头部公司的消耗。

现在全球大约有1400万软件工程师每天都在使用AI工具。

如果所有工程师的使用强度都达到Meta或者Apple员工的水平，全球Token吞吐需求将会直接飙升到每秒2亿到40亿Token。

40亿的需求，对比Blackwell在长上下文场景下5亿每秒的极限供给，差了整整一个数量级。

涨价持续，但增长开始放缓

更值得玩味的变化已经出现。

METR最新研究结果显示，Claude Code在实际开发测试中，反而让资深开发者的任务完成速度变慢了19%。

同时，VS Code相关AI编码插件的安装增速，从今年年初开始就已经明显放缓。

编码AI工具增长放缓，背后其实是两个因素的叠加：一方面是算力资源本身已经捉襟见肘，另一方面很多企业今年的AI预算已经提前花完。

和增长放缓形成鲜明对比的，是前沿大模型的一轮接一轮涨价：ChatGPT Pro上调订阅价格，Claude API价格持续上涨，Gemini的涨幅最夸张，部分场景价格直接暴涨3倍，GPT-5.5的定价更是直接翻倍。

现在企业用AI，用量越来越大、花费越来越高，但获得的效果却不一定能跟上成本涨幅，这笔账企业很快就算明白了。

高性价比替代方案成新选择，前沿模型定价权动摇

市场已经出现了新的分流路线，很多企业开始转向高性价比的替代方案。

DeepSeek V3的训练成本只有头部前沿模型的1/10到1/20，API价格更是低到同类前沿产品的1/16。

那性能呢？DeepSeek V3的实际表现已经逼近GPT-5的水平。

国外技术社区Hacker News上有一个热门帖子，创作者做了一个11个月回本的投资回报模型，帮企业算清楚：从GPT-5.5切换到DeepSeek，每年能省下多少成本。

评论区的开发者和企业管理者形成了一个共识：前沿大模型的定价权正在逐步崩塌。

当一个高性价比模型只用1/16的价格，就能跑出头部模型90%的效果，涨价对头部模型来说就不再是利润增长的手段，反而会变成加速客户流失的推手。

本来，「企业不断增加Token用量榨取AI价值」是前沿大模型厂商的核心增长逻辑，但现在The Information的报道显示，这种增长逻辑已经开始反噬AI厂商自身的利润空间。

用户越多，亏损越多；靠涨价止血，用户就会流向替代方案。这已经形成了典型的死亡螺旋。

AI行业走到算力经济悬崖边，格局正在重塑

把视角拉远来看整个行业。

当前全球的AI算力里，OpenAI、Anthropic、Google DeepMind这些顶级前沿实验室，只占据了20%-30%的份额。

剩下70%-80%的算力，都掌握在企业自用算力、云服务商、推理服务商手里。

这也就意味着，哪怕是最顶级的AI实验室，也没办法靠自建算力填满供需缺口，它们和所有参与者一样，都在抢同一批芯片产能。

算力年增3.4倍，需求年增10倍，这个供需剪刀差不会自动消失。

确实，小模型已经在替代一部分市场需求，蒸馏模型生态的崛起就能证明这一点，但模型能力提升又在不断催生新的更大需求，缺口依然无法填补。

现在整个AI行业其实已经站在了悬崖边上，这不是技术能力的悬崖——大模型的能力还在不断变强，这是经济模型的悬崖，现在的商业逻辑已经算不通了。

当GPU租金翻倍上涨、API价格接连暴涨、开源高性价比替代品性能逼近头部、企业开始质疑AI编码工具的投资回报，一个核心问题已经被抛到了行业面前：

前沿大模型的核心护城河，到底是模型本身的智能，还是堆出来的算力？

如果答案是算力，那么控制芯片产能的玩家，就能掌控AI的未来；如果答案是模型智能，那么DeepSeek用1/16的成本就能逼近同等效果，已经动摇了这个结论。

参考资料：

https://counterpointresearch.com/en/insights/Memory-Prices-Surge-Up-to-90-From-Q4-2025

https://www.signalbloom.ai/posts/outsourcing-plus-localai-will-soon-become-more-economical-vs-frontier-labs/https://news.ycombinator.com/item?id=48278610

本文来自微信公众号“新智元”，作者：ASI启示录；编辑：大卫，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

刘强东最新内部讲话：京东启动涅槃项目，被机器替代的一线员工一个都不裁

全国首个！聆动通用工业级具身智能机器人拿下CR认证，创行业新里程碑

算力重构能源格局：AIDC储能全球发展分析与中国发展机遇

Costco开市客登陆京东：双轨会员制能适应中国市场吗？

盒马舆情频发引反思：严筱磊不妨向胖东来于东来学习

项目推荐

康小虎百岁计划・健康大使招募计划

康老板 · 氧疗堂