一个令人震惊的数字
中国工信部下属机构公布的数据显示:2026年3月,中国日均AI Token消耗量突破140万亿,较2025年底增长超过40%。
把这个数字放进上下文:140万亿Token大约相当于每秒处理16亿个Token,或者说每天生成相当于7000万本书的文本量。这不是一个线性增长曲线——这是指数爆发。
更值得深思的是:这个数字还不包括私有部署和边缘推理。实际消耗量可能是公开数据的2-3倍。
增长从何而来?
价格战驱动的需求爆发
中国大模型市场在2025年经历了惨烈的价格战。以通义千问为代表,输入Token价格从年初的每百万Token ¥20降至年末的不到¥1。当价格降低95%时,用量必然爆发。
这与中国互联网和电商的发展路径完全一致:先用补贴打出规模,再用规模摊薄成本,最后用成本优势建立壁垒。
阿里Qwen3.6-Max-Preview:开源模型的持续推进
阿里最新发布的Qwen3.6-Max-Preview继续了其"开源+商业"双轨策略。Qwen系列已经成为全球下载量最大的开源大模型之一,大量中小企业基于Qwen进行私有部署。
这些私有部署的Token消耗不在官方统计中,但它们构成了真实需求的重要部分。
各大厂的Claw(爪子)生态
一个有趣的现象:2026年中国互联网巨头几乎同时推出了各自的AI Agent产品——腾讯QClaw开放国际测试、小米MiClaw通过CAICT评估。“Claw”(爪子)已经成为中国版的"Copilot",每个大厂都在推自己的AI助手。
这些Agent产品是Token消耗的最大增量来源。一次Agent任务执行可能消耗数万到数十万Token,远超传统对话场景。
字节跳动的豪赌
最耐人寻味的数据来自字节跳动:2025年利润同比下降超过70%,原因是AI投资的激增。
这意味着字节跳动可能在2025年一年内向AI投入了超过千亿人民币。对比:
| 公司 | 估计2025年AI投入 | 占收入比 | 策略 |
|---|---|---|---|
| 字节跳动 | >1000亿¥ | ~15% | 全面All-in |
| 阿里 | ~800亿¥ | ~10% | 云+开源 |
| 腾讯 | ~500亿¥ | ~8% | 社交+Agent |
| 百度 | ~300亿¥ | ~25% | 搜索+自动驾驶 |
字节跳动的策略清晰:用利润换时间。当竞争对手还在犹豫时,字节选择了最激进的投入。它的赌注是:AI将重构内容推荐、电商、广告等所有核心业务,而这些业务恰好是字节的命脉。
半导体供应链的紧张信号
140万亿日均Token意味着巨大的算力需求。这些算力从哪来?
Tesla完成AI5芯片tape-out,由TSMC和三星制造——这个消息表面看是Tesla的进展,实际上暗示了一个更大的趋势:AI芯片需求已经超越了NVIDIA的供应能力,大玩家开始自研芯片。
Stratechery对TSMC财报的分析指出:TSMC的N3(3纳米)产线正在疯狂扩产,主要驱动力就是AI芯片订单。NVIDIA的采购量还在持续增长。
对中国而言,先进芯片的获取仍是最大瓶颈。但一个变化正在发生:中国企业开始用更多的普通芯片+更好的软件优化来弥补硬件差距。DeepSeek V3的成功证明了这条路径的可行性——它用远少于GPT-4的算力达到了接近的性能。
AI"数字分身"与劳动力市场
MIT Technology Review报道了一个引人深思的现象:中国科技公司的员工正在训练自己的AI分身——然后开始反抗。
一些公司要求员工录制工作过程,用于训练能替代他们的AI系统。员工们一方面配合训练,一方面开始组织抵制。这个矛盾不仅是中国的——Pandaily的分析指出,中美在"一人公司"模式上走向了完全不同的方向:
- 美国:AI赋能个人创业者,出现大量AI原生的一人公司
- 中国:AI更多被企业用来替代员工,而非赋能个人
这个分化的根源在制度环境和市场结构的不同,但它将深刻影响两个经济体的AI应用路径。
预判:中国AI的三个拐点
第一,应用层领先将在2026年确立。 中国在模型能力上可能落后6-12个月,但在应用部署速度上已经领先。140万亿日均Token就是证据——没有任何其他市场有这个消耗规模。
第二,算力自主将成为国家优先级。 当AI成为经济核心基础设施,芯片供应的安全性就不再只是商业问题。预计2026-2027年将看到更多国产AI芯片的突破性进展。
第三,AI原生应用将率先在中国出现。 不是把AI加到现有产品中,而是从零开始围绕AI能力设计的产品。中国巨大的用户基数和快速迭代的文化是天然优势。
对从业者的建议:关注Token消耗量这个指标——它比任何融资数据都更真实地反映AI的实际采用情况。当日均Token消耗达到1000万亿级别时,就是AI真正"入侵"实体经济的信号。
参考来源
- China daily AI token usage exceeds 140 trillion - TechNode
- ByteDance 2025 profit drops over 70% - TechNode
- Alibaba releases Qwen3.6-Max-Preview - Pandaily
- Tencent QClaw opens international beta - TechNode
- Xiaomi MiClaw passes CAICT evaluation - TechNode
- Tesla AI5 chip tape-out - TechNode
- TSMC Earnings, N3 Fabs, Nvidia Ramp - Stratechery
- Chinese tech workers training AI doubles - MIT Tech Review
- US-China divide in one-person companies - Pandaily