Jiayun's Blog

探索与分享

【好文共赏】第三个难题:Roman Kashitsyn 把"树映射"提升为继命名与缓存失效之后的计算机科学第三难

mmapped.blog 的 Roman Kashitsyn 写了一篇横跨文件系统、写作、城市规划、生物分类与 Rust 借用检查器的元论文,把"把一个图嵌入到一棵树"这件每天都在悄悄折磨我们的事——命名为 tree mapping,与 Phil Karlton 的命名和缓存失效并列,封为第三个 hard problem。

【好文共赏】把 3 GB SQLite 压成 10 MB:一位芬兰语词典作者重新发现 FST 的周末

Andrew Quinn 周末用 Rust 把 3 GB 的 SQLite 字典塞进 10 MB 二进制,300x 压缩比的背后是 finite-state transducer 这一被 Lucene 和 ripgrep 作者反复验证、却在主流 CRUD 思维里隐身了 20 年的数据结构。本文沿着他的路径,重读 BurntSushi 那篇 2015 年的经典《Index 1.6 billion keys》,把 trie、DAFSA、FST 三层迭代一次讲清楚。