中国token消耗两年增千倍,各地缘何将快速公布数据
本文来自微信公众号:未尽研究,作者:未尽研究
从训练到推理,AI的核心衡量标准正从算力投入(FLOPS,每秒浮点运算次数)转向实际产出(tokens)。
2024年,未尽研究发布《AI改变能源》报告,以FLOPS为指标估算2030年中国智能算力及电力需求总量;2026年的《首届AI世界杯》报告,则用tokens指标测算赛事期间全球AI推理规模与观众使用情况——这是FIFA继统计世界杯收视(人数)、流媒体流量(比特数)后,首次以token刻画这一大型科技应用场景。
智算如何引领新型电力系统:《AI改变能源》报告发布
2024/08/07完整阅读>
首届AI世界杯:场景的胜利
2026/03/08完整阅读>
算力基础设施正复刻电力设施的统计逻辑:FLOPS对应“装机量”,tokens对应“消耗量”,衡量数据中心实际负载。在智能经济时代,围绕token使用强度、终端用户结构与边际成本的统计分析,将如用电量之于工业经济,成为理解智能经济运行的关键,也体现中国宏观经济高质量发展的一面。
企业是公布token消耗量的先行者,未尽研究较早跟踪国内主要AI企业的token数据。谷歌曾披露2024年4月当月消耗约9.7万亿tokens,这是科技巨头较早公开token消耗的官方记录之一。此后,谷歌与字节跳动不定期公开该指标,以展示AI应用落地速度。虽token并非完美指标,但仍是衡量AI巨头市场地位的重要维度。
对token消耗量的重视正延伸至企业内部,定义部分企业战略方向。部分硅谷企业将员工每日token消耗量(TDP)作为运营考核指标;今年阿里巴巴重组AI业务至阿里token事业群(ATH),围绕token的创造、输送与应用布局,使其成为基础运营指标,未来或如谷歌、字节般在电话会议中披露季度token数据。
官方统计也在跟进智能经济发展,中国此次走在美国前面。虽token尚未纳入官方统计文件,但已在重要政策场合频繁被引用。
在中国发展高层论坛2026年年会上,国家数据局局长刘烈宏提到:2024年初中国日均token调用量1000亿,2025年底跃升至100万亿,2026年3月突破140万亿,两年增长超千倍。国新办新闻发布会上,他再次引用该数据,并明确其中文名为“词元”——源于自然语言单词切分,后扩展至图像、视频、声音等模态。
官方定义中,token是大模型处理信息的最小单元,具有可计量、可定价、可交易的潜在属性。围绕token的调用、分发与结算,新价值体系正在形成,它既是智能时代的“用量指标”,也可能成为连接技术供给与商业需求的“结算单位”,为AI商业模式提供量化基础。
但与电力不同,token统计远未标准化,测算存在不确定性。token产出既取决于算力供给,也受算力需求增长影响。两年前中国曾短暂出现智算中心“闲置”,芯片及基础设施性能、模型算法、应用场景对工作负荷的选择等,都会显著改变token的生成与消耗结构。
2026年3月19日华为中国合作伙伴大会上,华为高级副总裁李鹏称中国日均token消耗量已达180万亿,略高于国家数据局数据,但处于同一数量级,差异反映统计口径与方法尚未统一。
更早前,“AI 2028危机”报告刷屏时,未尽研究估算春节期间全球日均token消耗超300万亿,结合中美在全球AI竞争中的地位,该估算与官方及企业数据基本一致。
“AI 2028危机”,究竟有多少已然发生
2026/02/24完整阅读>
未尽研究的估算逻辑是:当前阶段算力紧缺,token增长主要受算力供给约束,属卖方市场,因此需关注英伟达CEO黄仁勋的相关表述。
算力紧缺证据充足:美国科技巨头、云巨头及新云企业2025年才开始大规模投资AI基础设施,中国科技公司亦然。此前AI应用渗透率低,导致供给与需求波动会大幅放大token消耗量,这也是过去两年中国token调用量“千倍增长”的原因。
供给约束在企业层面尤为明显:AI应用向代理化(Agentic)与多模态发展,今年编码及工作智能体渗透知识经济、OpenClaw掀起个人智能体热潮、视频生成借春节场景在中国普及,新增需求不断,算力资源分配紧张,处于“拆东墙补西墙”阶段。Anthropic所有套餐(消费者版、专业版、企业版、API版)均有使用量限制和费率上限;腾讯则“减少对外出售,保证自用算力充足”。

算力供给紧张将持续一段时间,这是系统性难题:全球范围内AI芯片与HBM的先进制造及封装产能长期不足;美国更面临电力基础设施供给不足;分析师Dylan Patel认为,AI产业瓶颈很快将转移至下游半导体制造设备,尤其是EUV光刻机产能。
当前token增长本质是算力供给释放而非用户需求释放,因此英伟达代表的算力供给侧居于统计核心。黄仁勋围绕设计高效产出token的工厂,联合200多家合作伙伴,是最接近全面掌握token经济的人。
今年CES主旨演讲中,黄仁勋提到推理阶段每年生成的token数量增长5倍;GTC 2026上他表示,下一代VR NVL72的token产出比GB NVL72高35倍。

这两个数据并不矛盾:VR NVL72无法立即部署,AI芯片出货需产能爬坡,截至2026年一季度Blackwell系列出货量尚未完全超过Hopper系列;且电力、数据中心建筑(Warm Shell)不到位,GPU再多也无法使用,微软CEO纳德拉就承认公司曾犯此类错误。
简单推算:2025年10月谷歌公布日均消耗43万亿tokens,当时其模型在OpenRouter市场占比25%,全球日均消耗约170万亿tokens;综合多因素保守估算,2026年世界杯6 - 7月(共39天)全球日均token消耗量超535万亿。
不过,随着英伟达逐步失去算力市场垄断地位、中国加快形成自主AI算力生态、AI从供给约束转向需求驱动,统一的token计量标准将愈发重要,这是智能经济市场成熟的标志。
伴随地方政府通过“养龙虾”政策展现的AI+热情,以及国家对智能体经济与社会建设里程碑的确立,预计地方政府很快将公布本地token消耗数据,北京、上海、杭州、深圳等城市将形成你追我赶的态势。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




