Jiayun's Blog

探索与分享

【好文共赏】把"金门大桥 Claude"的开关递给你:Sean Goedecke 谈 DS4 之后 LLM Steering 为什么重新有趣了

Sean Goedecke 在 2026-05-16 这篇短文里,把 Anthropic 2024 年的 Golden Gate Claude、antirez 八天前刚把 dir-steering 写进 DS4 的提交、以及 sparse autoencoder 整条研究线索捏到了一起。他给出的诊断很冷:steering 是个『中产阶级』研究方向——大厂用不上、API 用户碰不到,只有'本地权重 + 强模型'两边都凑齐的人才会真的动手。而 DeepSeek V4 Flash 之后,这个条件第一次成了普通工程师的事。本文是这篇诊断的深度导读,附带 12 张概念卡和 40+ 术语表。

【好文共赏】antirez 一周写出 DS4:当 Redis 之父把 GPT 5.5 当结对程序员,把 DeepSeek v4 Flash 装进 128GB MacBook

Salvatore Sanfilippo 在五月中旬扔出 DwarfStar 4——一个只为 DeepSeek v4 Flash 写的本地推理引擎,七天 8.8k stars。他在 antirez.com/news/165 用一篇短文说清楚了:这一次不是又一个 GGUF runner,而是把 KV cache 当成一等磁盘公民、用 2/8 bit 不对称量化把 284B MoE 塞进 128GB Mac、用 GPT 5.5 在一周内把整个 stack 写完的赌注。它真正回答的是:在 GPT 5.5 之后,'本地 AI 主权' 还剩多少现实可能。