Jiayun's Blog

探索与分享

【好文共赏】把"金门大桥 Claude"的开关递给你:Sean Goedecke 谈 DS4 之后 LLM Steering 为什么重新有趣了

Sean Goedecke 在 2026-05-16 这篇短文里,把 Anthropic 2024 年的 Golden Gate Claude、antirez 八天前刚把 dir-steering 写进 DS4 的提交、以及 sparse autoencoder 整条研究线索捏到了一起。他给出的诊断很冷:steering 是个『中产阶级』研究方向——大厂用不上、API 用户碰不到,只有'本地权重 + 强模型'两边都凑齐的人才会真的动手。而 DeepSeek V4 Flash 之后,这个条件第一次成了普通工程师的事。本文是这篇诊断的深度导读,附带 12 张概念卡和 40+ 术语表。

【好文共赏】antirez 一周写出 DS4:当 Redis 之父把 GPT 5.5 当结对程序员,把 DeepSeek v4 Flash 装进 128GB MacBook

Salvatore Sanfilippo 在五月中旬扔出 DwarfStar 4——一个只为 DeepSeek v4 Flash 写的本地推理引擎,七天 8.8k stars。他在 antirez.com/news/165 用一篇短文说清楚了:这一次不是又一个 GGUF runner,而是把 KV cache 当成一等磁盘公民、用 2/8 bit 不对称量化把 284B MoE 塞进 128GB Mac、用 GPT 5.5 在一周内把整个 stack 写完的赌注。它真正回答的是:在 GPT 5.5 之后,'本地 AI 主权' 还剩多少现实可能。

中国AI生态的三重张力:人才流失、资本管制与自主突围

DeepSeek V4人才流失、Manus AI外资被叫停、小米自研芯片突破——中国AI生态正在三重张力中寻找新平衡

DeepSeek V4深度解析:1.6万亿参数MoE如何重塑开源AI格局

DeepSeek V4双版本齐发,百万Token上下文+华为昇腾适配,技术架构、人才隐忧与定价策略全面剖析

DeepSeek V4延期与去CUDA化:中国AI生态的关键抉择

DeepSeek V4一再推迟发布,背后是适配华为昇腾芯片的艰难工程——这场去CUDA运动将重塑全球AI计算生态