Jiayun's Blog

探索与分享

一个令人震惊的数字

中国工信部下属机构公布的数据显示:2026年3月,中国日均AI Token消耗量突破140万亿,较2025年底增长超过40%。

把这个数字放进上下文:140万亿Token大约相当于每秒处理16亿个Token,或者说每天生成相当于7000万本书的文本量。这不是一个线性增长曲线——这是指数爆发。

更值得深思的是:这个数字还不包括私有部署和边缘推理。实际消耗量可能是公开数据的2-3倍。

增长从何而来?

价格战驱动的需求爆发

中国大模型市场在2025年经历了惨烈的价格战。以通义千问为代表,输入Token价格从年初的每百万Token ¥20降至年末的不到¥1。当价格降低95%时,用量必然爆发。

这与中国互联网和电商的发展路径完全一致:先用补贴打出规模,再用规模摊薄成本,最后用成本优势建立壁垒。

阿里Qwen3.6-Max-Preview:开源模型的持续推进

阿里最新发布的Qwen3.6-Max-Preview继续了其"开源+商业"双轨策略。Qwen系列已经成为全球下载量最大的开源大模型之一,大量中小企业基于Qwen进行私有部署。

这些私有部署的Token消耗不在官方统计中,但它们构成了真实需求的重要部分。

各大厂的Claw(爪子)生态

一个有趣的现象:2026年中国互联网巨头几乎同时推出了各自的AI Agent产品——腾讯QClaw开放国际测试、小米MiClaw通过CAICT评估。“Claw”(爪子)已经成为中国版的"Copilot",每个大厂都在推自己的AI助手。

这些Agent产品是Token消耗的最大增量来源。一次Agent任务执行可能消耗数万到数十万Token,远超传统对话场景。

字节跳动的豪赌

最耐人寻味的数据来自字节跳动:2025年利润同比下降超过70%,原因是AI投资的激增。

这意味着字节跳动可能在2025年一年内向AI投入了超过千亿人民币。对比:

公司估计2025年AI投入占收入比策略
字节跳动>1000亿¥~15%全面All-in
阿里~800亿¥~10%云+开源
腾讯~500亿¥~8%社交+Agent
百度~300亿¥~25%搜索+自动驾驶

字节跳动的策略清晰:用利润换时间。当竞争对手还在犹豫时,字节选择了最激进的投入。它的赌注是:AI将重构内容推荐、电商、广告等所有核心业务,而这些业务恰好是字节的命脉。

半导体供应链的紧张信号

140万亿日均Token意味着巨大的算力需求。这些算力从哪来?

Tesla完成AI5芯片tape-out,由TSMC和三星制造——这个消息表面看是Tesla的进展,实际上暗示了一个更大的趋势:AI芯片需求已经超越了NVIDIA的供应能力,大玩家开始自研芯片。

Stratechery对TSMC财报的分析指出:TSMC的N3(3纳米)产线正在疯狂扩产,主要驱动力就是AI芯片订单。NVIDIA的采购量还在持续增长。

对中国而言,先进芯片的获取仍是最大瓶颈。但一个变化正在发生:中国企业开始用更多的普通芯片+更好的软件优化来弥补硬件差距。DeepSeek V3的成功证明了这条路径的可行性——它用远少于GPT-4的算力达到了接近的性能。

AI"数字分身"与劳动力市场

MIT Technology Review报道了一个引人深思的现象:中国科技公司的员工正在训练自己的AI分身——然后开始反抗

一些公司要求员工录制工作过程,用于训练能替代他们的AI系统。员工们一方面配合训练,一方面开始组织抵制。这个矛盾不仅是中国的——Pandaily的分析指出,中美在"一人公司"模式上走向了完全不同的方向:

  • 美国:AI赋能个人创业者,出现大量AI原生的一人公司
  • 中国:AI更多被企业用来替代员工,而非赋能个人

这个分化的根源在制度环境和市场结构的不同,但它将深刻影响两个经济体的AI应用路径。

预判:中国AI的三个拐点

第一,应用层领先将在2026年确立。 中国在模型能力上可能落后6-12个月,但在应用部署速度上已经领先。140万亿日均Token就是证据——没有任何其他市场有这个消耗规模。

第二,算力自主将成为国家优先级。 当AI成为经济核心基础设施,芯片供应的安全性就不再只是商业问题。预计2026-2027年将看到更多国产AI芯片的突破性进展。

第三,AI原生应用将率先在中国出现。 不是把AI加到现有产品中,而是从零开始围绕AI能力设计的产品。中国巨大的用户基数和快速迭代的文化是天然优势。

对从业者的建议:关注Token消耗量这个指标——它比任何融资数据都更真实地反映AI的实际采用情况。当日均Token消耗达到1000万亿级别时,就是AI真正"入侵"实体经济的信号。


参考来源