Jiayun's Blog

探索与分享

一、单片SoC的末路

半导体行业正面临一个冷酷的物理现实:在先进制程上制造巨大的单片芯片(Monolithic SoC),良率和成本已经逼近工程极限。

一颗面向AI推理的大芯片,动辄数百平方毫米的Die面积,在3nm或2nm制程上的良率可能低于40%。这意味着超过一半的芯片在制造完成后就要报废。对于需要海量芯片的AI训练和推理集群来说,这种经济模型正在变得不可持续。

Chiplet(小芯片)架构的崛起不是技术趋势的跟风,而是物理定律驱动的必然转向。

二、三个关键技术突破

突破一:可扩展的片上网络(Network-on-Chip)

SemiWiki近期的深度分析揭示了Chiplet架构面临的核心挑战:当你把一个SoC拆成多个小芯片时,它们之间如何高效通信?

传统的总线架构无法满足AI工作负载的带宽需求。新一代NoC(Network-on-Chip)设计采用了模块化的拓扑结构:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
┌──────────┐    ┌──────────┐    ┌──────────┐
│ Compute  │◄──►│   NoC    │◄──►│ Compute  │
│ Chiplet  │    │  Router  │    │ Chiplet  │
└──────────┘    └────┬─────┘    └──────────┘
                ┌────┴─────┐
                │   NoC    │
                │  Router  │
                └────┬─────┘
        ┌────────────┼────────────┐
        │            │            │
  ┌─────┴────┐ ┌────┴─────┐ ┌───┴──────┐
  │ Memory   │ │  I/O     │ │ Accel.   │
  │ Chiplet  │ │ Chiplet  │ │ Chiplet  │
  └──────────┘ └──────────┘ └──────────┘

关键创新在于模块化平台理念——NoC路由器本身也是可更换的chiplet,允许根据工作负载动态调整互连拓扑。这意味着同一个基础平台可以组装出面向训练(高带宽)、推理(低延迟)或端侧(低功耗)的不同芯片配置。

突破二:AI芯片的先进封装

SemiEngineering的深度报告详细分析了AI芯片面临的硅设计和封装挑战:

  • 2.5D封装(硅中介层):多个chiplet并排放置在硅中介层上,通过微米级的硅通孔(TSV)互连。这是目前NVIDIA B200和AMD MI400系列采用的主流方案。
  • 3D封装(芯片堆叠):将计算chiplet和存储chiplet垂直堆叠,大幅缩短数据传输距离。佐治亚理工的最新研究展示了用氧化铝纳米线增强的热管理材料,将3D封装中的散热效率提升了3倍以上。
  • ESD保护挑战:加州大学河滨分校的研究指出,3D chiplet系统中的静电放电保护需要全新的设计范式。传统的ESD保护方案会在chiplet间引入过多寄生电容,拖慢信号传输。

突破三:量子计算的Chiplet化

一个容易被忽视的趋势:量子计算也在走向chiplet架构。

慕尼黑工业大学发布的Chipmunq编译器,专门解决量子电路在chiplet架构上的映射和路由问题。这意味着未来的量子处理器可能不是单片的,而是由多个量子chiplet通过光互连或微波互连组成。

这对AI行业的启示是:chiplet架构不仅是经典计算的未来,也将是量子计算的基础形态。 掌握chiplet设计能力的团队,在量子-经典混合计算时代也将占据优势。

三、产业格局分析

玩家Chiplet策略关键产品互连技术优势
NVIDIAGPU + HBM chipletB200/B300NVLink-C2C生态+规模
AMD计算+I/O分离MI400系列Infinity Fabric性价比
IntelFoveros 3DLunar LakeEMIB+Foveros封装技术
Apple统一内存架构M5 UltraUltraFusion集成度
华为自研互连昇腾910CHCCS供应链自主

关键观察:Chiplet的竞争已经从"谁的芯片更快"转向"谁的互连更高效"。 芯片本身可以用成熟制程生产,但chiplet间的互连必须达到接近片上互连的带宽和延迟——这是新的技术护城河。

四、对AI产业链的深层影响

1. 降低AI芯片创业门槛

Chiplet架构最深远的影响可能是:AI芯片创业公司不再需要从头设计一颗完整的SoC。 它们可以聚焦设计自己的计算核心chiplet,搭配市售的存储、I/O和互连chiplet,快速组装出可工作的AI加速器。

这就像软件行业的微服务革命——从"一个巨大的单体应用"变成"多个可组合的服务"。

2. 供应链韧性

当芯片被拆分成多个chiplet后,每个chiplet可以使用不同的制程节点、不同的代工厂生产。计算核心用3nm先进制程,I/O用成熟的7nm,存储控制器用5nm——这种灵活性在地缘政治风险加剧的今天尤为重要。

3. 散热成为核心瓶颈

AI芯片的功耗已经突破1000W大关(NVIDIA B200单卡超过1200W)。当多个高功耗chiplet被封装在一起时,热管理成为决定系统性能的关键因素。佐治亚理工的氧化铝纳米线研究正是针对这个瓶颈。

我的判断:2026-2027年,散热技术将成为AI芯片性能提升的主要制约因素,而非计算架构本身。 液冷、浸没式冷却和新型热界面材料的突破将直接转化为AI训练和推理的效率提升。

五、可执行洞察

  • 如果你是芯片工程师:深入学习UCIe(Universal Chiplet Interconnect Express)标准和先进封装技术,这是未来5年最有价值的技能方向。
  • 如果你是AI系统架构师:在选择AI加速器时,关注互连带宽和内存层次结构,而不仅仅是峰值算力。Chiplet架构下,瓶颈往往在数据搬运而非计算。
  • 如果你是投资者:关注先进封装设备和材料领域的公司。这是一个被低估的细分市场,但它是chiplet革命的物理基础。

参考来源

  • SemiWiki:Scalable Network-on-Chip Enables a Modular Chiplet Platform
  • SemiEngineering:Building An AI Chip - Silicon Design And Advanced Packaging
  • SemiEngineering:Rethinking ESD Protection for System-On-Integrated Chiplets (UC Riverside)
  • SemiEngineering:Alumina Nanowires Improve Thermal Management in Advanced Packaging (Georgia Tech)
  • SemiEngineering:Mapping and Routing Fault-Tolerant Quantum Circuits Onto Chiplet Architectures (TU Munich)
  • IEEE Spectrum:Better Hardware Could Turn Zeros into AI Heroes
  • IEEE Spectrum:The Chip That Made Hardware Rewriteable