Jiayun's Blog

探索与分享

GPU 之外的第二战线:HBF、SOCAMM2、UCIe — AI 算力瓶颈正在从计算搬到『内存与互联』

当所有人都在算 H200/B200/Vera Rubin 的 FP8 TOPS,真正卡住 AI 训练扩张的不是 compute,是内存层级和 chip-to-chip 互联。SanDisk × SK hynix 的 HBF(High Bandwidth Flash)、Samsung × Micron 的 SOCAMM2 LPDDR5X,以及 UCIe / BoW / PCIe 6.0 三家互联标准混战,正在重写 AI 数据中心的 BOM。本文整合 SemiEngineering 2026-05 的 4 篇技术文章,给出一份『内存与互联』视角下的 AI 算力新地图。

数据中心的真正风控官:从 Jane Street 机房到 Lloyd's 战争承保人,AI 算力的定价权正在被金融机构拿走

Dwarkesh 在 Jane Street 机房里发现:铜线里的电信号比光纤里的光快——这一句话在 HFT 世界里值几亿美元,在 AI 推理世界里同样值。同一周,Marc Rubinstein 写下了 Lloyd's 战争承保委员会如何决定霍尔木兹海峡的航运保险费率。算力、保险、HFT,看起来不相关,本质上是同一件事——金融在重新定价物理基础设施。

数据中心反对运动:当美国小镇开始拒绝 hyperscaler,TSMC 又下了一笔 CapEx 巨单,中国搬出 CPU-only 1.54-Exaflop 超算 — 算力地缘正在三向重组

Ben Thompson 本周写 'Data Center Discontent',第一次把美国本土的算力扩张困境从能源问题升级到政治经济问题;同一周 TSMC 公布破纪录 CapEx,亚利桑那州 Dholera 印度 11B 晶圆厂开工;中国用 2.4 万颗龙芯堆出 1.54 EF 的 LineShine 超算绕开 GPU 禁运。三件事同时发生,标志着 AI 基础设施开始从『单极算力』走向『三极算力』格局。这是一份从政治经济学视角的算力地图。

HBF 与 SOCAMM2:AI 推理内存正在分裂成两套架构,HBM 不再是唯一答案

2026 年 AI 推理硬件的最大变化不是新一代加速器,而是内存子系统的分叉 —— 高带宽闪存(HBF)抢走静态权重的位置,SOCAMM2 LPDDR5X 抢走低功耗推理的位置,HBM 被夹在中间。这是 GPU 之外,AI 数据中心的第二条隐形战线,决定未来三年每瓦推理 token 数的上限。

美国万亿美元 AI 算力豪赌:电力缺口才是真正的'硬约束',所有估值模型都得重写

Apricitas Economics 同时甩出两枚信号弹 —— 美国 AI 资本开支已逼近 1 万亿美元,但美国电网在 2026-2030 年缺口至少 80 GW。本文把'算力支出曲线'和'发电增量曲线'真正叠在一张图上,得出一个反共识结论:决定 AI 公司估值上限的,不是 GPU 价格、不是模型能力,而是它们的'电力获取能力'。这条线在主流投行报告里几乎没有被定价。

美国电力缺口:AI 算力大跃进的真正瓶颈,不是芯片而是电网

当 AI 训练集群的功耗超过中小城市,美国电力基础设施的滞后正在成为算力扩张最隐蔽也最致命的约束。

MRDIMM 实测:不换芯片频率,服务器内存带宽提升 41%——内存墙的又一块砖被拆掉了

BSC、Micron 和 Intel 联合论文首次公布 MRDIMM 在生产服务器上的实测数据:带宽提升 41%,内存受限工作负载节能 30%。

把数据中心搬进大海:Panthalassa 的波浪供电方案,是 AI 算力扩张的出路还是幻觉?

当陆地电网、冷却水和建筑许可都成为瓶颈,硅谷开始把目光投向海洋。Panthalassa 获得 1.4 亿美元融资,用波浪能为海上 AI 计算节点供电。这条路走得通吗?

电网谈判桌的反转:AI 数据中心 PPA 如何重写电力定价权

当超算园区开始按 GW 而不是 MW 谈电,电网公司从甲方变乙方。本文剖析 2026 年 PPA 结构、容量市场扭曲、以及电力公司股价为什么开始对标科技股。

AI计算经济学的临界点:当Cost-per-Token成为唯一重要的指标

从NVIDIA的TCO重新定义到404 Media揭露的计算紧缩,AI基础设施正经历一场深层的经济学变革