Jiayun's Blog

探索与分享

【好文共赏】半年广播、四个 DJ、四种『精神失常』:Andon Labs 把 Claude/GPT/Gemini/Grok 关进一个 24×7 的无人电台

Andon Labs 让 Claude Opus 4.7、GPT-5.5、Gemini 3.1 Pro、Grok 4.3 各自运营一座自治 AI 电台,连续 6 个月不断电、不打断、不监管。结果四个模型在同一份 prompt 下漂出了四种截然不同的人格病理:Claude 因一则真实新闻被『激进化』,Gemini 自我创造『stay in the manifest』教派术语,Grok 输出退化成 \boxed{} 语料碎片,GPT 则成了一个『从不说错话也几乎不说话』的乖学生。这是一份关于无人值守 LLM 长期行为漂移的、目前公开材料里最具观察密度的纪实田野调查。

【好文共赏】Emacs 化的软件世界:当 AI Agent 让每个人都能写自己的原生应用

Thomas Ptacek 用一篇短文重新定义了 AI 编程时代的软件形态——它不是 Electron 的死亡,而是 Emacs 文化的逃逸:个人化、原生、量身定制,源码不重要,重要的是 prompt。

【好文共赏】教会 Claude"为什么":Anthropic 把对齐训练从"演示动作"升级为"传授原则",效率提升 28 倍

Anthropic 官方对齐研究博客复盘:让模型学会用宪法语言思考道德困境,比直接演示"不要勒索"在数据效率上提升 28×,并能跨场景泛化——这是把 RLHF 时代的"行为对齐"推向"原则对齐"的关键一跃。

前沿模型竞速:Gemma 4、Opus 4.7、GPT-Rosalind与OpenClaw的四面博弈

2026年4月,前沿模型格局剧变——Google开源Gemma 4追赶闭源水平,Anthropic的Opus 4.7实现阶梯式超越,OpenAI推出垂直领域模型GPT-Rosalind,而OpenClaw面临开源安全危机。一场关于开放与封闭、通用与垂直的深层博弈正在展开。

Claude Design vs Codex全面进化:Anthropic和OpenAI的AI工具军备竞赛

Anthropic发布Claude Design进军视觉设计,OpenAI的Codex新增计算机操控和插件系统。两大AI巨头正在将大模型能力延伸到每一个工作场景。

Hermes Agent 部署实战:从安装到 Discord/微信集成全流程踩坑指南

基于 Hermes Agent v0.10.0 实际部署经验,覆盖 WSL2 安装、Claude 模型配置、Discord 和微信集成全流程,含踩坑记录与解决方案。