一、被忽略的真相:算力扩张不是被晶圆卡住的
2026 年最被高估的事情之一,是把 AI 算力短缺归因于"先进制程产能"。事实正好相反:N3/N2 的逻辑晶圆即便满载,也不是当前 GPU 出货的瓶颈。真正卡住所有玩家的是 HBM 堆叠良率 与 CoWoS-L 中介层产能。
NVIDIA 一颗 Rubin 级 GPU 的物料价值,HBM4 占比已经接近 55%;如果算上封装基板与中介层,“封装+存储"在整颗芯片成本里超过逻辑 die 本身。这意味着,2026 的算力供给曲线不是由 fab 决定的,而是由 SK Hynix、三星、Micron 三家的堆叠良率和台积电南科 AP6/AP7 厂的产能爬坡决定的。
二、HBM4 难在哪里:从 12Hi 到 16Hi 的非线性陡坡
HBM3E 的主流堆叠是 8Hi/12Hi,HBM4 直接进入 12Hi 起步、16Hi 路线。每多堆一层,问题不是线性增加:
| 维度 | HBM3E (12Hi) | HBM4 (12Hi) | HBM4 (16Hi) |
|---|---|---|---|
| Die 厚度 | ~30µm | ~24µm | ~20µm |
| TSV 间距 | 40µm | 30µm | 30µm |
| 单 stack I/O | 1024 | 2048 | 2048 |
| 带宽/stack | ~1.2TB/s | ~2.0TB/s | ~2.0TB/s |
| 键合方式 | TC-NCF | 混合键合(部分) | 混合键合 |
| 量产良率 | 70-80% | 50-60% | 30-45% |
16Hi 的死穴在三处:第一,die 减薄到 20µm 后翘曲(warpage)难以控制,热压键合的对位公差从 ±3µm 收紧到 ±1µm;第二,I/O 翻倍意味着 buffer die 的设计复杂度不再是简单的物理层重排,而要重新做信号完整性收敛;第三,混合键合(Cu-Cu hybrid bonding)需要的洁净度比传统 TC-NCF 高一个数量级,任何一颗颗粒污染就毁掉整个 stack。
SK Hynix 之所以保持领先,不在于内存 die 本身做得多好,而在于它最早把 MR-MUF 工艺产线化;三星到 2025 年下半年才在 HBM4 上接近 50% 良率,Micron 的 16Hi 至今仍在样品阶段。这个差距在 2026 年会进一步放大成市场份额差距。
三、CoWoS-L 的真正瓶颈:不是机台,是中介层
外界经常误以为 CoWoS 扩产是"多买几台键合机"的事。实际上 CoWoS-L 的瓶颈在 RDL 中介层(Redistribution Layer interposer):
| |
CoWoS-S 用的是大尺寸硅 interposer,受光罩尺寸(reticle limit)限制;CoWoS-L 改用 LSI(local silicon interconnect)+RDL 的组合,可以做到 5x reticle 以上的封装面积。但 RDL 的问题是:超过 3 倍光罩尺寸时,曝光对位、CMP 平整度、warpage 都会非线性恶化。台积电 2026 的 CoWoS-L 月产能预期从年初的 4 万片爬升到年底 7-8 万片,但任何一台 ASML 的 i-line stepper 出问题,整条产线都要停。
更隐蔽的问题是 ABF 载板。日本味之素一家把持的 ABF 树脂,2025-2026 年的扩产节奏明显跟不上 GPU 出货。基板是没有什么"性感技术"的环节,但它就是真实存在的瓶颈。
四、对资本开支节奏的影响
我的判断是:2026 H2 会出现一次"算力供给的预期差修正”。当前各大云厂商的 capex guidance 是按"GPU 想买多少就有多少"假设建模的,但 HBM4 16Hi 的爬坡曲线大概率会让 H2 的实际交付低于 guidance 15-20%。这会引发两个连锁反应:
- 二手 H100/H200 市场升温。当 Rubin 拿不到货,去年贬值预期最猛的 Hopper 系列会出现一次价格反弹,租金 $/hour 不会像市场预测的那样暴跌。
- HBM 自研开始被严肃讨论。Meta、Google 已经在和韩系存储厂谈 custom HBM base die,把控制器逻辑从内存 die 搬下来集成到 buffer die,这是绕开 SK Hynix 议价权的唯一办法。
五、谁会赢
不要赌 GPU 设计公司,要赌封装与设备链:
- 赢家:日月光(ASE)的 VIPack、Amkor 在亚利桑那的 CoWoS-S 复刻线、Besi 的混合键合机台、Disco 的减薄/划片设备。
- 输家:纯封装基板厂如果押错 ABF 路线、还在做大宗 BT 基板的玩家会被边缘化;中国大陆 OSAT 在 HBM4 这一代基本无缘头部供应链,要等 HBM5 周期才有机会切入。
- 变量:Intel Foundry 的 EMIB-T 路线如果 2026 H2 在 Clearwater Forest 上跑通,会变成 NVIDIA 之外大客户的第二供应商选项。
六、结语
我们正在见证一个有趣的反转:摩尔定律最先进的逻辑制程不再是行业的限速器,真正限速的是把这些 die 拼成系统的能力。半导体行业正从"晶体管竞赛"全面切换到"封装与互联竞赛",这个范式转移会持续到 2030 年代。任何忽略封装与 HBM 的 AI 算力预测,都是在沙上建塔。
参考资料
- SK hynix Newsroom, “HBM4 12-High Mass Production Update” — https://news.skhynix.com/
- TSMC 2026 Technology Symposium, “Advanced Packaging Roadmap: CoWoS-L and SoIC” — https://www.tsmc.com/english/dedicatedFoundry/technology/advanced_packaging
- TrendForce, “HBM Supply-Demand Outlook 2026” — https://www.trendforce.com/research/hbm
- SemiAnalysis, “The Real Bottleneck in AI Compute is Packaging” — https://www.semianalysis.com/