Jiayun's Blog

探索与分享

一、被忽略的真相:算力扩张不是被晶圆卡住的

2026 年最被高估的事情之一,是把 AI 算力短缺归因于"先进制程产能"。事实正好相反:N3/N2 的逻辑晶圆即便满载,也不是当前 GPU 出货的瓶颈。真正卡住所有玩家的是 HBM 堆叠良率CoWoS-L 中介层产能

NVIDIA 一颗 Rubin 级 GPU 的物料价值,HBM4 占比已经接近 55%;如果算上封装基板与中介层,“封装+存储"在整颗芯片成本里超过逻辑 die 本身。这意味着,2026 的算力供给曲线不是由 fab 决定的,而是由 SK Hynix、三星、Micron 三家的堆叠良率和台积电南科 AP6/AP7 厂的产能爬坡决定的。

二、HBM4 难在哪里:从 12Hi 到 16Hi 的非线性陡坡

HBM3E 的主流堆叠是 8Hi/12Hi,HBM4 直接进入 12Hi 起步、16Hi 路线。每多堆一层,问题不是线性增加:

维度HBM3E (12Hi)HBM4 (12Hi)HBM4 (16Hi)
Die 厚度~30µm~24µm~20µm
TSV 间距40µm30µm30µm
单 stack I/O102420482048
带宽/stack~1.2TB/s~2.0TB/s~2.0TB/s
键合方式TC-NCF混合键合(部分)混合键合
量产良率70-80%50-60%30-45%

16Hi 的死穴在三处:第一,die 减薄到 20µm 后翘曲(warpage)难以控制,热压键合的对位公差从 ±3µm 收紧到 ±1µm;第二,I/O 翻倍意味着 buffer die 的设计复杂度不再是简单的物理层重排,而要重新做信号完整性收敛;第三,混合键合(Cu-Cu hybrid bonding)需要的洁净度比传统 TC-NCF 高一个数量级,任何一颗颗粒污染就毁掉整个 stack。

SK Hynix 之所以保持领先,不在于内存 die 本身做得多好,而在于它最早把 MR-MUF 工艺产线化;三星到 2025 年下半年才在 HBM4 上接近 50% 良率,Micron 的 16Hi 至今仍在样品阶段。这个差距在 2026 年会进一步放大成市场份额差距。

三、CoWoS-L 的真正瓶颈:不是机台,是中介层

外界经常误以为 CoWoS 扩产是"多买几台键合机"的事。实际上 CoWoS-L 的瓶颈在 RDL 中介层(Redistribution Layer interposer):

1
2
3
4
5
6
7
8
       GPU die        HBM stack × 8
         │                │
   ┌─────┴────────────────┴─────┐
   │   RDL interposer (硅基)    │   ← 真正的窄门
   │   线宽/线距 < 2µm/2µm      │
   ├────────────────────────────┤
   │   ABF substrate (基板)     │
   └────────────────────────────┘

CoWoS-S 用的是大尺寸硅 interposer,受光罩尺寸(reticle limit)限制;CoWoS-L 改用 LSI(local silicon interconnect)+RDL 的组合,可以做到 5x reticle 以上的封装面积。但 RDL 的问题是:超过 3 倍光罩尺寸时,曝光对位、CMP 平整度、warpage 都会非线性恶化。台积电 2026 的 CoWoS-L 月产能预期从年初的 4 万片爬升到年底 7-8 万片,但任何一台 ASML 的 i-line stepper 出问题,整条产线都要停。

更隐蔽的问题是 ABF 载板。日本味之素一家把持的 ABF 树脂,2025-2026 年的扩产节奏明显跟不上 GPU 出货。基板是没有什么"性感技术"的环节,但它就是真实存在的瓶颈。

四、对资本开支节奏的影响

我的判断是:2026 H2 会出现一次"算力供给的预期差修正”。当前各大云厂商的 capex guidance 是按"GPU 想买多少就有多少"假设建模的,但 HBM4 16Hi 的爬坡曲线大概率会让 H2 的实际交付低于 guidance 15-20%。这会引发两个连锁反应:

  1. 二手 H100/H200 市场升温。当 Rubin 拿不到货,去年贬值预期最猛的 Hopper 系列会出现一次价格反弹,租金 $/hour 不会像市场预测的那样暴跌。
  2. HBM 自研开始被严肃讨论。Meta、Google 已经在和韩系存储厂谈 custom HBM base die,把控制器逻辑从内存 die 搬下来集成到 buffer die,这是绕开 SK Hynix 议价权的唯一办法。

五、谁会赢

不要赌 GPU 设计公司,要赌封装与设备链:

  • 赢家:日月光(ASE)的 VIPack、Amkor 在亚利桑那的 CoWoS-S 复刻线、Besi 的混合键合机台、Disco 的减薄/划片设备。
  • 输家:纯封装基板厂如果押错 ABF 路线、还在做大宗 BT 基板的玩家会被边缘化;中国大陆 OSAT 在 HBM4 这一代基本无缘头部供应链,要等 HBM5 周期才有机会切入。
  • 变量:Intel Foundry 的 EMIB-T 路线如果 2026 H2 在 Clearwater Forest 上跑通,会变成 NVIDIA 之外大客户的第二供应商选项。

六、结语

我们正在见证一个有趣的反转:摩尔定律最先进的逻辑制程不再是行业的限速器,真正限速的是把这些 die 拼成系统的能力。半导体行业正从"晶体管竞赛"全面切换到"封装与互联竞赛",这个范式转移会持续到 2030 年代。任何忽略封装与 HBM 的 AI 算力预测,都是在沙上建塔。


参考资料