硅光子+Chiplet：数据中心的下一个十年由光和小芯片定义

摩尔定律之后，增长引擎在哪里？

半导体产业正在经历一个有趣的分裂：一方面，传统的晶体管微缩变得越来越困难和昂贵；另一方面，AI驱动的算力需求正以每年3-4倍的速度增长。TSMC最新财报显示N3产线满负荷运行，新的N3晶圆厂正在扩建，NVIDIA的订单持续攀升。

但这个方程式的两端不可能永远靠"更小的晶体管"来平衡。半导体行业正在押注两个关键技术来延续增长：硅光子（Silicon Photonics）和Chiplet（小芯片）标准化。

硅光子：用光速解决数据中心的能耗危机

SemiEngineering的深度报道"Silicon Photonics Lights The Way To More Efficient Data Centers"揭示了一个被低估的技术革命。

为什么是光？

传统数据中心的能耗分布大致如下：

能耗来源	占比	硅光子的影响
计算（GPU/CPU）	~40%	间接降低（减少数据搬运等待）
数据传输（电信号）	~25%	直接替代，降低80%+
散热	~30%	因传输能耗下降而显著减少
其他	~5%	微弱影响

核心突破在于：光信号传输的能耗仅为电信号的1/5到1/10。 当AI训练集群中GPU之间的通信带宽需求达到TB/s级别时，用铜线传输已经成为不可逾越的物理瓶颈——不仅是速度问题，更是能耗问题。

当前进展

硅光子技术的成熟度正在快速提升：

1
2
3
4
5
2020: 实验室验证 → 单通道100Gbps
2022: 小规模部署 → 数据中心内部互联
2024: 量产导入   → TSMC/Intel整合光子IP
2026: 标准化     → Chiplet间光互联成为选项
2028: 大规模普及 → AI集群标配光互联（预测）

NVIDIA在其博客中讨论的"AI Factory"概念和"Power-Flexible AI Factories"都暗示了对光互联的依赖。当你构建一个消耗整个城市电力的AI训练集群时，任何能降低25%能耗的技术都是战略级别的。

Chiplet标准：从"能用"到"即插即用"

SemiEngineering的另一篇重磅报道"Chiplet Standards Aim For Plug-n-Play"和Panel-Level Packaging的报道，揭示了Chiplet生态正在经历从混乱到有序的关键转折。

什么是Chiplet？

简单来说：不再做一个巨大的单片芯片（monolithic），而是把不同功能的小芯片（chiplet）像乐高积木一样拼在一起。

单片芯片 (Monolithic)	Chiplet架构
一个大die，全部功能	多个小die，各司其职
良率随面积指数下降	每个小die良率高
全部用最先进工艺	不同chiplet用不同工艺
设计周期长	可复用、可组合
供应商锁定	跨厂商互操作（目标）

标准化的关键突破

2026年的关键进展是UCIe（Universal Chiplet Interconnect Express）标准的成熟和proteanTecs在Chiplet Summit上展示的"健康和性能监控"能力。

当chiplet来自不同供应商时，你需要解决三个核心问题：

物理互联：chiplet之间怎么连接？（UCIe标准）
协议互通：chiplet之间怎么通信？（CXL/UCIe协议栈）
运行时监控：如何知道每个chiplet的健康状态？（proteanTecs的方案）

Analog Bits在TSMC 2026技术研讨会上展示的N2P工艺上的实时片上功率传感和交付，解决了Chiplet架构中最后一个关键难题：精确的功率管理。当多个chiplet共享封装时，每个chiplet的功率波动都会影响其他chiplet的稳定性。实时功率传感让动态功率分配成为可能。

TSMC的角色：从代工到平台

Stratechery的报道"TSMC Earnings, New N3 Fabs, The Nvidia Ramp"揭示了TSMC正在从传统的芯片代工厂转型为半导体平台公司。

TSMC的战略转变：

过去：客户设计芯片 → TSMC制造
现在：TSMC提供工艺 + 封装 + Chiplet互联 + 硅光子IP → 客户组合使用

这意味着TSMC正在成为半导体行业的"AWS"——不仅提供基础设施，还提供越来越多的上层服务。

Intel的困境和潜力（SemiWiki: “Is Intel About to Take Flight?"）也与此相关。Intel拥有自己的晶圆厂和先进封装技术（Foveros、EMIB），理论上可以提供与TSMC竞争的chiplet平台。但执行力一直是Intel的软肋。

AI算力需求如何驱动这一切

把硅光子和Chiplet放在AI算力需求的背景下：

1
2
3
4
5
6
7
8
9
AI训练集群需求增长：
2024: ~10,000 GPU/集群 → 电互联够用
2025: ~50,000 GPU/集群 → 电互联成为瓶颈
2026: ~100,000+ GPU/集群 → 必须引入光互联
2027+: 百万GPU级别 → Chiplet+光互联+液冷的综合方案

NVIDIA的ramp（Stratechery报道）：
→ 每一代GPU的互联带宽需求增长2-3x
→ NVLink从电互联走向光互联是必然路径

NVIDIA博客中反复强调的"Cost per Token”（每token成本）和"Power-Flexible AI Factories"概念，本质上都指向同一个问题：AI的成本瓶颈正在从算力转向互联和能耗。

三个产业预判

2027年，硅光子互联将成为高端AI训练集群的标配。NVIDIA的下一代NVLink很可能原生支持光互联选项。
UCIe标准将在2026年底达到商业可用的成熟度，第一批跨厂商chiplet产品将在2027年上半年出货。这将打破目前AMD、Intel、NVIDIA各自封闭的chiplet生态。
TSMC将在2027年推出"Chiplet-as-a-Service"平台，允许客户从标准化的chiplet库中选择和组合，大幅降低定制芯片的门槛。这将催生一批专注于特定领域chiplet的初创公司。

给从业者的建议

芯片设计工程师：学习UCIe协议和先进封装技术（CoWoS、InFO），这将是未来5年最有价值的技能
数据中心架构师：开始在新建数据中心中预留光互联的布线空间和设备位置
投资者：关注硅光子和先进封装供应链中的关键公司——Coherent、Broadcom（光收发器）、ASE/Amkor（封装）

Jiayun's Blog