Jiayun's Blog

探索与分享

【好文共赏】把 200 万行 Haskell 跑在每年 2480 亿美元的资金流上:Mercury 把语言学家当作可靠性工程师的十年

Ian Duncan 在 Haskell.org 官方博客发表 5 万字长文,第一次系统拆开 Mercury 这家 1500 人 fintech 怎么把 200 万行 Haskell 跑成银行级生产系统——纯函数式是 Safety-II 的载体,类型是制度记忆的保险柜,Temporal 是后悔药,理想主义才是真正的生产风险。

【好文共赏】把 3 GB SQLite 压成 10 MB:一位芬兰语词典作者重新发现 FST 的周末

Andrew Quinn 周末用 Rust 把 3 GB 的 SQLite 字典塞进 10 MB 二进制,300x 压缩比的背后是 finite-state transducer 这一被 Lucene 和 ripgrep 作者反复验证、却在主流 CRUD 思维里隐身了 20 年的数据结构。本文沿着他的路径,重读 BurntSushi 那篇 2015 年的经典《Index 1.6 billion keys》,把 trie、DAFSA、FST 三层迭代一次讲清楚。

【好文共赏】把车里的「告密者」物理拔除:一位安全工程师的 2024 RAV4 隐私手术

Arkadiy Tetelman 用一把 8mm 套筒、一根 USB 线和一份 14 分钟读物,把 2026 年最尖锐的隐私悖论摆到了排挡杆下方——当 opt-out 已经失效,撬棒成了最后一道用户协议。

【好文共赏】把天空写进 GPU:Maxime Heckel 的大气散射 Shader 一万字深读

Maxime Heckel 用一个月时间,把瑞利散射、米散射、臭氧吸收、对数深度缓冲、LUT 重建——一整套电影级大气渲染搬进了浏览器。这不只是一篇教程,它是 2026 年最值得收藏的一节'物理 + 数学 + GPU 工程'三合一课程。

【好文共赏】当 AI 不再等你说完:Thinking Machines 把 "实时交互" 写进了模型权重

Mira Murati 的 Thinking Machines Lab 在 2026 年 5 月 11 日丢出了第一份真材实料:TML-Interaction-Small,一个 276B / 12B active 的 MoE,把 200ms 微轮次、音视频流、双模型协作变成模型的 native 能力。这不只是又一个语音模型,它是对 Sutton《苦涩教训》的一次顺延:交互性也必须 scale with intelligence。

【好文共赏】当"空闲"不是空闲:Cloudflare 一次 14ms 的 CUBIC 死亡螺旋,与跨越十年的网络协议时间债

Cloudflare 工程师 Esteban Carisimo 与 Antonio Vicente 写下了一篇教科书级的根因分析:QUIC 拥塞控制器在 cwnd 跌到最小后陷入每 14ms 一次的状态翻转、连续 999 次仍爬不出来——而这个 bug 的种子,是 2017 年 Linux 内核里一段被 port 到 user-space 的代码,外加一个被错过的 follow-up 补丁。

【好文共赏】教会 Claude"为什么":Anthropic 把对齐训练从"演示动作"升级为"传授原则",效率提升 28 倍

Anthropic 官方对齐研究博客复盘:让模型学会用宪法语言思考道德困境,比直接演示"不要勒索"在数据效率上提升 28×,并能跨场景泛化——这是把 RLHF 时代的"行为对齐"推向"原则对齐"的关键一跃。

【好文共赏】资深开发者为何"说不清"自己的价值:Speed 与 Scale 的两个循环

Tuhin Nair 用一个文案人的视角拆解了 AI 时代一场看不见的沟通错位:业务害怕的是不确定性,资深开发者害怕的是复杂度——同一个 "AI 让开发者过时" 的口号,对两群人意味着完全相反的东西。