Jiayun's Blog

探索与分享

【好文共赏】把"金门大桥 Claude"的开关递给你：Sean Goedecke 谈 DS4 之后 LLM Steering 为什么重新有趣了

Sean Goedecke 在 2026-05-16 这篇短文里，把 Anthropic 2024 年的 Golden Gate Claude、antirez 八天前刚把 dir-steering 写进 DS4 的提交、以及 sparse autoencoder 整条研究线索捏到了一起。他给出的诊断很冷：steering 是个『中产阶级』研究方向——大厂用不上、API 用户碰不到，只有'本地权重 + 强模型'两边都凑齐的人才会真的动手。而 DeepSeek V4 Flash 之后，这个条件第一次成了普通工程师的事。本文是这篇诊断的深度导读，附带 12 张概念卡和 40+ 术语表。

Posted by Jiayun's Blog on Monday, May 18, 2026 00:00 UTC

【好文共赏】antirez 一周写出 DS4：当 Redis 之父把 GPT 5.5 当结对程序员，把 DeepSeek v4 Flash 装进 128GB MacBook

Salvatore Sanfilippo 在五月中旬扔出 DwarfStar 4——一个只为 DeepSeek v4 Flash 写的本地推理引擎，七天 8.8k stars。他在 antirez.com/news/165 用一篇短文说清楚了：这一次不是又一个 GGUF runner，而是把 KV cache 当成一等磁盘公民、用 2/8 bit 不对称量化把 284B MoE 塞进 128GB Mac、用 GPT 5.5 在一周内把整个 stack 写完的赌注。它真正回答的是：在 GPT 5.5 之后，'本地 AI 主权' 还剩多少现实可能。

Posted by Jiayun's Blog on Friday, May 15, 2026 00:00 UTC

中国AI生态的三重张力：人才流失、资本管制与自主突围

DeepSeek V4人才流失、Manus AI外资被叫停、小米自研芯片突破——中国AI生态正在三重张力中寻找新平衡

Posted by Jiayun's Blog on Thursday, April 30, 2026 00:00 UTC

DeepSeek V4深度解析：1.6万亿参数MoE如何重塑开源AI格局

DeepSeek V4双版本齐发，百万Token上下文+华为昇腾适配，技术架构、人才隐忧与定价策略全面剖析

Posted by Jiayun's Blog on Wednesday, April 29, 2026 00:00 UTC

DeepSeek V4延期与去CUDA化：中国AI生态的关键抉择

DeepSeek V4一再推迟发布，背后是适配华为昇腾芯片的艰难工程——这场去CUDA运动将重塑全球AI计算生态

Posted by Jiayun's Blog on Tuesday, April 21, 2026 00:00 UTC