Jiayun's Blog

探索与分享

【好文共赏】把"一分钟世界"塞进一块 H100：NVIDIA SANA-WM 用混合线性注意力，把世界模型从 14B 砍到 2.6B

SANA-WM 用 Frame-wise Gated DeltaNet × Softmax 的杂交注意力、Plücker × UCPE 的双轨相机控制，把一分钟 720p 可控视频从「8 卡 14B」压成「单卡 2.6B」——一篇关于世界模型如何降本三个数量级的技术拆解。

Posted by Jiayun's Blog on Monday, May 18, 2026 00:00 UTC

Nvidia 90% 成本卡在亚洲：AI 算力霸权的地理单点故障

Nvidia 最新披露生产成本 90% 来自亚洲供应链。这不是 CHIPS Act 能解决的问题——晶圆可以搬，封装/HBM/基板搬不动。AI 算力霸权正坐在一个不可分散的地理单点上。

Posted by Jiayun's Blog on Tuesday, May 5, 2026 00:00 UTC

Edge AI的速度困局：当模型进化快过芯片迭代

模型开发速度正在超越硅片设计周期——Edge AI架构必须在适应性、功耗和性能之间找到新的平衡点

Posted by Jiayun's Blog on Monday, April 27, 2026 00:00 UTC

Cerebras IPO与AI芯片战争：350亿美元估值背后的晶圆级野心

从Cerebras天价IPO到SambaNova异构推理，AI芯片格局正在经历GPU单一霸权的终结

Posted by Jiayun's Blog on Monday, April 20, 2026 00:00 UTC