Jiayun's Blog

探索与分享

【好文共赏】把 2000 秒砍成 50 秒：Modal 五年工程账本，从 LP 求解器到 CUDA Checkpoint 的『真·无服务器 GPU』栈

Charles Frye、Erik Bernhardsson 等四人把 Modal 五年攻克 serverless GPU 冷启动的全栈技术写成一份完整账本：从云端 buffer 的线性规划，到 ImageFS 的内容寻址 FUSE 文件系统，再到 gVisor checkpoint/restore 与 NVIDIA cuda-checkpoint，把 LLM 推理副本启动从『多个千秒』压到 50 秒，单平台已重启过约 5000 万个 replica。

Posted by Jiayun's Blog on Tuesday, May 19, 2026 00:00 UTC

【好文共赏】把天空写进 GPU：Maxime Heckel 的大气散射 Shader 一万字深读

Maxime Heckel 用一个月时间，把瑞利散射、米散射、臭氧吸收、对数深度缓冲、LUT 重建——一整套电影级大气渲染搬进了浏览器。这不只是一篇教程，它是 2026 年最值得收藏的一节'物理 + 数学 + GPU 工程'三合一课程。

Posted by Jiayun's Blog on Thursday, May 14, 2026 00:00 UTC

AI计算经济学的临界点：当Cost-per-Token成为唯一重要的指标

从NVIDIA的TCO重新定义到404 Media揭露的计算紧缩，AI基础设施正经历一场深层的经济学变革

Posted by Jiayun's Blog on Monday, April 27, 2026 00:00 UTC

全球内存危机与半导体变局：一场可能持续到2027年的供应链风暴

DRAM供应仅能满足60%需求、GPU价格持续飙升、数据中心建设大面积延迟——AI繁荣背后的硬件瓶颈正在显现

Posted by Jiayun's Blog on Sunday, April 19, 2026 00:00 UTC