Jiayun's Blog

探索与分享

【好文共赏】把 2000 秒砍成 50 秒:Modal 五年工程账本,从 LP 求解器到 CUDA Checkpoint 的『真·无服务器 GPU』栈

Charles Frye、Erik Bernhardsson 等四人把 Modal 五年攻克 serverless GPU 冷启动的全栈技术写成一份完整账本:从云端 buffer 的线性规划,到 ImageFS 的内容寻址 FUSE 文件系统,再到 gVisor checkpoint/restore 与 NVIDIA cuda-checkpoint,把 LLM 推理副本启动从『多个千秒』压到 50 秒,单平台已重启过约 5000 万个 replica。

【好文共赏】把天空写进 GPU:Maxime Heckel 的大气散射 Shader 一万字深读

Maxime Heckel 用一个月时间,把瑞利散射、米散射、臭氧吸收、对数深度缓冲、LUT 重建——一整套电影级大气渲染搬进了浏览器。这不只是一篇教程,它是 2026 年最值得收藏的一节'物理 + 数学 + GPU 工程'三合一课程。

AI计算经济学的临界点:当Cost-per-Token成为唯一重要的指标

从NVIDIA的TCO重新定义到404 Media揭露的计算紧缩,AI基础设施正经历一场深层的经济学变革

全球内存危机与半导体变局:一场可能持续到2027年的供应链风暴

DRAM供应仅能满足60%需求、GPU价格持续飙升、数据中心建设大面积延迟——AI繁荣背后的硬件瓶颈正在显现