Jiayun's Blog

探索与分享

一个被多数人忽视的数字:中国2026年3月的日均AI Token消耗量已突破140万亿,较2025年底增长超过40%。这不是一个简单的统计数据——它是中国AI产业从"模型竞赛"转向"规模应用"的标志性拐点。


140万亿Token:中国AI的"用电量"

3月17日,中国国家统计局高级官员披露了这一数据。为了理解140万亿Token意味着什么,做一个简单的换算:

  • GPT-4级别模型处理一次完整的对话约消耗2000-5000 Token
  • 140万亿Token意味着每天约280亿到700亿次AI推理调用
  • 这相当于中国14亿人口中,每人每天进行了20-50次AI交互

当然,实际使用并非均匀分布。真正的消耗大户是:

企业级应用的爆发

  • 智能客服和内容审核:电商、社交平台的AI处理量占比巨大
  • 代码辅助和开发工具:中国开发者群体对AI编程工具的采用率正在快速攀升
  • 工业质检和自动化:制造业场景中的AI推理调用增长迅猛

三个月40%的增速意味着什么?

如果这个增速持续,到2026年底中国的日均Token消耗将达到400万亿以上。这将带来两个核心挑战:

  1. 算力供给缺口加剧:即使考虑国产芯片的产能提升,如此规模的推理需求仍将严重考验基础设施
  2. 推理成本将成为关键竞争力:谁能以更低的成本处理每个Token,谁就能在价格战中胜出

GPT-Rosalind:当AI开始做药物发现

在中国AI应用规模激增的同时,OpenAI选择了另一条路线——垂直深耕。本周发布的GPT-Rosalind是一个专为生命科学设计的推理模型,覆盖:

  • 药物发现:分析分子结构,预测药物-靶点相互作用
  • 基因组学分析:处理大规模基因测序数据,识别致病变异
  • 蛋白质推理:理解蛋白质折叠和功能关系(延续AlphaFold的方向)
  • 科研工作流加速:自动化文献综述、实验设计建议

这反映了一个更深层的行业趋势

通用大模型的竞争正在进入收益递减阶段。当GPT-5和Claude 4的通用能力已经"足够好"时,垂直领域的专业化成为新的价值创造点。

OpenAI几乎同步发布了GPT-5.4-Cyber(网络安全专用),配合1000万美元的API资助计划和"Trusted Access"项目,向安全行业定向输出AI能力。Anthropic则推出了Claude Design进军设计领域。

大模型公司的竞争重心,正从"谁更聪明"转向"谁能解决更多具体问题"。


Tesla AI5芯片流片:算力自主化的另一条路

本周另一条重磅消息是Tesla完成了下一代AI芯片AI5的流片(tape-out),由TSMC和Samsung共同负责制造。

为什么Tesla要自研AI芯片?

Tesla的AI芯片不是为了卖给别人,而是为了支撑三大核心业务:

  1. 自动驾驶(FSD):每辆车上的实时推理需求
  2. Dojo超算集群:训练自动驾驶和机器人的大规模神经网络
  3. Optimus人形机器人:具身智能需要定制化的推理芯片

更值得关注的是Tesla同时在考虑在上海超级工厂生产人形机器人。这意味着Tesla正在将其AI软硬件一体化的垂直整合模式从汽车延伸到机器人领域。

自研芯片的深层逻辑

TSMC的CC Wei在本周的财报电话会议上暗示了一个行业真相:“造芯片工厂没有捷径。” 这是对所有试图快速进入芯片制造领域的参与者(包括Intel、三星、甚至试图将TSMC引入美国的政策制定者)的警示。

但对于Tesla这样的AI应用公司来说,它们不需要建工厂——它们需要的是定义芯片架构,然后交给TSMC生产。这种fabless + 自研架构的模式,正在成为AI时代的新标配。


全球AI竞赛的三个层次

把这些看似独立的事件串联起来,一幅清晰的全球AI竞争地图浮现了:

第一层:模型层(已近成熟)

GPT-5、Claude 4、Gemini 3——通用模型的能力已经进入"足够好"的阶段。差异化越来越难,竞争转向效率和成本。

第二层:应用层(正在爆发)

中国140万亿Token的数据说明,AI应用层的爆发不是"未来时",而是"进行时"。谁能最快地将AI能力转化为可规模化的产品,谁就能占据市场。

第三层:基础设施层(决定胜负)

芯片、数据中心、能源——这才是最终决定AI竞赛胜负的层次。Tesla自研AI5、中国推进国产芯片替代、美国数据中心面临40%延期——基础设施的约束将在未来2-3年内成为最大的变量。


写在最后

当我们讨论AI竞赛时,容易被模型参数和跑分吸引目光。但真正的竞争发生在更深的层次:谁能以最低的成本、最大的规模,将AI能力渗透到每一个产业的每一个环节?

中国140万亿Token的日均消耗,不声不响地回答了这个问题的一部分。


参考来源