Jiayun's Blog

探索与分享

【好文共赏】把"一分钟世界"塞进一块 H100:NVIDIA SANA-WM 用混合线性注意力,把世界模型从 14B 砍到 2.6B

SANA-WM 用 Frame-wise Gated DeltaNet × Softmax 的杂交注意力、Plücker × UCPE 的双轨相机控制,把一分钟 720p 可控视频从「8 卡 14B」压成「单卡 2.6B」——一篇关于世界模型如何降本三个数量级的技术拆解。

Nvidia 90% 成本卡在亚洲:AI 算力霸权的地理单点故障

Nvidia 最新披露生产成本 90% 来自亚洲供应链。这不是 CHIPS Act 能解决的问题——晶圆可以搬,封装/HBM/基板搬不动。AI 算力霸权正坐在一个不可分散的地理单点上。

Edge AI的速度困局:当模型进化快过芯片迭代

模型开发速度正在超越硅片设计周期——Edge AI架构必须在适应性、功耗和性能之间找到新的平衡点

Cerebras IPO与AI芯片战争:350亿美元估值背后的晶圆级野心

从Cerebras天价IPO到SambaNova异构推理,AI芯片格局正在经历GPU单一霸权的终结