Jiayun's Blog

探索与分享

摩尔定律之后,增长引擎在哪里?

半导体产业正在经历一个有趣的分裂:一方面,传统的晶体管微缩变得越来越困难和昂贵;另一方面,AI驱动的算力需求正以每年3-4倍的速度增长。TSMC最新财报显示N3产线满负荷运行,新的N3晶圆厂正在扩建,NVIDIA的订单持续攀升。

但这个方程式的两端不可能永远靠"更小的晶体管"来平衡。半导体行业正在押注两个关键技术来延续增长:硅光子(Silicon Photonics)和Chiplet(小芯片)标准化。

硅光子:用光速解决数据中心的能耗危机

SemiEngineering的深度报道"Silicon Photonics Lights The Way To More Efficient Data Centers"揭示了一个被低估的技术革命。

为什么是光?

传统数据中心的能耗分布大致如下:

能耗来源占比硅光子的影响
计算(GPU/CPU)~40%间接降低(减少数据搬运等待)
数据传输(电信号)~25%直接替代,降低80%+
散热~30%因传输能耗下降而显著减少
其他~5%微弱影响

核心突破在于:光信号传输的能耗仅为电信号的1/5到1/10。 当AI训练集群中GPU之间的通信带宽需求达到TB/s级别时,用铜线传输已经成为不可逾越的物理瓶颈——不仅是速度问题,更是能耗问题。

当前进展

硅光子技术的成熟度正在快速提升:

1
2
3
4
5
2020: 实验室验证 → 单通道100Gbps
2022: 小规模部署 → 数据中心内部互联
2024: 量产导入   → TSMC/Intel整合光子IP
2026: 标准化     → Chiplet间光互联成为选项
2028: 大规模普及 → AI集群标配光互联(预测)

NVIDIA在其博客中讨论的"AI Factory"概念和"Power-Flexible AI Factories"都暗示了对光互联的依赖。当你构建一个消耗整个城市电力的AI训练集群时,任何能降低25%能耗的技术都是战略级别的。

Chiplet标准:从"能用"到"即插即用"

SemiEngineering的另一篇重磅报道"Chiplet Standards Aim For Plug-n-Play"和Panel-Level Packaging的报道,揭示了Chiplet生态正在经历从混乱到有序的关键转折。

什么是Chiplet?

简单来说:不再做一个巨大的单片芯片(monolithic),而是把不同功能的小芯片(chiplet)像乐高积木一样拼在一起。

单片芯片 (Monolithic)Chiplet架构
一个大die,全部功能多个小die,各司其职
良率随面积指数下降每个小die良率高
全部用最先进工艺不同chiplet用不同工艺
设计周期长可复用、可组合
供应商锁定跨厂商互操作(目标)

标准化的关键突破

2026年的关键进展是UCIe(Universal Chiplet Interconnect Express)标准的成熟和proteanTecs在Chiplet Summit上展示的"健康和性能监控"能力。

当chiplet来自不同供应商时,你需要解决三个核心问题:

  1. 物理互联:chiplet之间怎么连接?(UCIe标准)
  2. 协议互通:chiplet之间怎么通信?(CXL/UCIe协议栈)
  3. 运行时监控:如何知道每个chiplet的健康状态?(proteanTecs的方案)

Analog Bits在TSMC 2026技术研讨会上展示的N2P工艺上的实时片上功率传感和交付,解决了Chiplet架构中最后一个关键难题:精确的功率管理。当多个chiplet共享封装时,每个chiplet的功率波动都会影响其他chiplet的稳定性。实时功率传感让动态功率分配成为可能。

TSMC的角色:从代工到平台

Stratechery的报道"TSMC Earnings, New N3 Fabs, The Nvidia Ramp"揭示了TSMC正在从传统的芯片代工厂转型为半导体平台公司

TSMC的战略转变:

  • 过去:客户设计芯片 → TSMC制造
  • 现在:TSMC提供工艺 + 封装 + Chiplet互联 + 硅光子IP → 客户组合使用

这意味着TSMC正在成为半导体行业的"AWS"——不仅提供基础设施,还提供越来越多的上层服务。

Intel的困境和潜力(SemiWiki: “Is Intel About to Take Flight?")也与此相关。Intel拥有自己的晶圆厂和先进封装技术(Foveros、EMIB),理论上可以提供与TSMC竞争的chiplet平台。但执行力一直是Intel的软肋。

AI算力需求如何驱动这一切

把硅光子和Chiplet放在AI算力需求的背景下:

1
2
3
4
5
6
7
8
9
AI训练集群需求增长:
2024: ~10,000 GPU/集群 → 电互联够用
2025: ~50,000 GPU/集群 → 电互联成为瓶颈
2026: ~100,000+ GPU/集群 → 必须引入光互联
2027+: 百万GPU级别 → Chiplet+光互联+液冷的综合方案

NVIDIA的ramp(Stratechery报道):
→ 每一代GPU的互联带宽需求增长2-3x
→ NVLink从电互联走向光互联是必然路径

NVIDIA博客中反复强调的"Cost per Token”(每token成本)和"Power-Flexible AI Factories"概念,本质上都指向同一个问题:AI的成本瓶颈正在从算力转向互联和能耗。

三个产业预判

  1. 2027年,硅光子互联将成为高端AI训练集群的标配。NVIDIA的下一代NVLink很可能原生支持光互联选项。

  2. UCIe标准将在2026年底达到商业可用的成熟度,第一批跨厂商chiplet产品将在2027年上半年出货。这将打破目前AMD、Intel、NVIDIA各自封闭的chiplet生态。

  3. TSMC将在2027年推出"Chiplet-as-a-Service"平台,允许客户从标准化的chiplet库中选择和组合,大幅降低定制芯片的门槛。这将催生一批专注于特定领域chiplet的初创公司。

给从业者的建议

  • 芯片设计工程师:学习UCIe协议和先进封装技术(CoWoS、InFO),这将是未来5年最有价值的技能
  • 数据中心架构师:开始在新建数据中心中预留光互联的布线空间和设备位置
  • 投资者:关注硅光子和先进封装供应链中的关键公司——Coherent、Broadcom(光收发器)、ASE/Amkor(封装)

参考链接