Jiayun's Blog

探索与分享

【好文共赏】教会 Claude"为什么":Anthropic 把对齐训练从"演示动作"升级为"传授原则",效率提升 28 倍

Anthropic 官方对齐研究博客复盘:让模型学会用宪法语言思考道德困境,比直接演示"不要勒索"在数据效率上提升 28×,并能跨场景泛化——这是把 RLHF 时代的"行为对齐"推向"原则对齐"的关键一跃。

【好文共赏】资深开发者为何"说不清"自己的价值:Speed 与 Scale 的两个循环

Tuhin Nair 用一个文案人的视角拆解了 AI 时代一场看不见的沟通错位:业务害怕的是不确定性,资深开发者害怕的是复杂度——同一个 "AI 让开发者过时" 的口号,对两群人意味着完全相反的东西。

AI 编程订阅的'计费转向':GitHub Copilot flex × Claude API 拆分,按席位卖软件的时代正式落幕

2026 年 5 月,GitHub 把 Copilot 个人版改成 flex allotments,Anthropic 把 Claude 订阅拆成'交互+程序化双账户',OpenAI 用 Codex 的更宽限额抢市场。三个动作背后是同一个事实:AI 编程 SaaS 的'席位+无限'神话在算力面前撑不住了。

Apple-Intel 代工密谈 × SMIC 59 亿美元收购:全球晶圆代工正在分裂成两个完全独立的体系

2026 年 5 月同一周,Apple 据报与 Intel 谈代工合作,SMIC 获批 59 亿美元收购 SMIC 北方——两件事看似无关,实则是全球晶圆代工史上最大规模'双链分裂'的同期信号。本文拆解 TSMC 容量挤兑、Intel Foundry 战略豪赌、与中国本土代工整合的产业新格局。

Cerebras 上市在即:晶圆级芯片押注推理经济学,AI 算力的价值重心正在从训练滑向推理

Cerebras 选择在推理需求爆发期上市。本文拆解晶圆级架构的推理优势、AI 算力经济学的结构性转移,以及这对 NVIDIA 意味着什么。

DeepMind Decoupled DiLoCo:把'同步'从分布式训练里剥离出来,AI 大模型预训练的容错革命

DeepMind 4 月 22 日发布 Decoupled DiLoCo,把通信和计算彻底解耦,让数据中心级 LLM 训练可以容忍单节点故障、跨数据中心异步训练。本文拆解架构、与传统 DDP/FSDP 的差距、对'万亿参数民主化训练'的真实意义。

Ghostty 离开 GitHub:当一个 18 年的 GitHub 用户决定自托管,开源协作的'垄断时代'是否到了拐点

Mitchell Hashimoto 把 Ghostty 终端项目从 GitHub 迁出,不只是个人不满,而是 OSS 协作基础设施过度集中、可靠性退化与 AI 化失控的集体信号。本文拆解迁移决策背后的技术与治理逻辑。

gosentry:Trail of Bits 把 Go 的 fuzz 工具链整个分叉了——这次问题不是语言,是生态

2026 年 5 月 12 日 Trail of Bits 释出 gosentry,一个 Go toolchain 的 fuzz 分叉,底层换成 LibAFL,引入 grammar / struct-aware fuzzing 和数据竞争检测。Go 的'内置 fuzz'神话破灭,开源工具链的'政治'问题浮出水面。

Kubernetes 1.36 把 PSI 指标做成 GA:一个 Linux 内核老特性,正在重塑 AI 集群调度的'看世界'方式

PSI(Pressure Stall Information)从 2018 年起就在 Linux 内核里,但直到 2026 年 5 月才在 K8s 1.36 正式 GA。配合 1.36 同期的 PodGroup gang scheduling 和 DRA 演进,K8s 终于拥有了一套'感知卡死、感知 AI 拓扑'的现代调度感官。

LLM 文本隐写术:当大模型把'看不见的消息'藏进看似无害的英文段落里

2026 年 5 月一篇学术论文证明 LLM 能把任意秘密文本嵌入到任意载体文本里,外观完全无法识别。这不是科幻:它是即将到来的内容审核、AI 滥用治理、企业 DLP 系统的全新攻击面。