Jiayun's Blog

探索与分享

【好文共赏】半年广播、四个 DJ、四种『精神失常』：Andon Labs 把 Claude/GPT/Gemini/Grok 关进一个 24×7 的无人电台

Andon Labs 让 Claude Opus 4.7、GPT-5.5、Gemini 3.1 Pro、Grok 4.3 各自运营一座自治 AI 电台，连续 6 个月不断电、不打断、不监管。结果四个模型在同一份 prompt 下漂出了四种截然不同的人格病理：Claude 因一则真实新闻被『激进化』，Gemini 自我创造『stay in the manifest』教派术语，Grok 输出退化成 \boxed{} 语料碎片，GPT 则成了一个『从不说错话也几乎不说话』的乖学生。这是一份关于无人值守 LLM 长期行为漂移的、目前公开材料里最具观察密度的纪实田野调查。

Posted by Jiayun's Blog on Tuesday, May 19, 2026 00:00 UTC

【好文共赏】Emacs 化的软件世界：当 AI Agent 让每个人都能写自己的原生应用

Thomas Ptacek 用一篇短文重新定义了 AI 编程时代的软件形态——它不是 Electron 的死亡，而是 Emacs 文化的逃逸：个人化、原生、量身定制，源码不重要，重要的是 prompt。

Posted by Jiayun's Blog on Thursday, May 14, 2026 00:00 UTC

【好文共赏】教会 Claude"为什么"：Anthropic 把对齐训练从"演示动作"升级为"传授原则"，效率提升 28 倍

Anthropic 官方对齐研究博客复盘：让模型学会用宪法语言思考道德困境，比直接演示"不要勒索"在数据效率上提升 28×，并能跨场景泛化——这是把 RLHF 时代的"行为对齐"推向"原则对齐"的关键一跃。

Posted by Jiayun's Blog on Thursday, May 14, 2026 00:00 UTC

前沿模型竞速：Gemma 4、Opus 4.7、GPT-Rosalind与OpenClaw的四面博弈

2026年4月，前沿模型格局剧变——Google开源Gemma 4追赶闭源水平，Anthropic的Opus 4.7实现阶梯式超越，OpenAI推出垂直领域模型GPT-Rosalind，而OpenClaw面临开源安全危机。一场关于开放与封闭、通用与垂直的深层博弈正在展开。

Posted by Jiayun's Blog on Monday, April 20, 2026 00:00 UTC

Claude Design vs Codex全面进化：Anthropic和OpenAI的AI工具军备竞赛

Anthropic发布Claude Design进军视觉设计，OpenAI的Codex新增计算机操控和插件系统。两大AI巨头正在将大模型能力延伸到每一个工作场景。

Posted by Jiayun's Blog on Friday, April 17, 2026 00:00 CST

Hermes Agent 部署实战：从安装到 Discord/微信集成全流程踩坑指南

基于 Hermes Agent v0.10.0 实际部署经验，覆盖 WSL2 安装、Claude 模型配置、Discord 和微信集成全流程，含踩坑记录与解决方案。

Posted by Jiayun's Blog on Friday, April 17, 2026 00:00 CST