Jiayun's Blog

探索与分享

【好文共赏】半年广播、四个 DJ、四种『精神失常』：Andon Labs 把 Claude/GPT/Gemini/Grok 关进一个 24×7 的无人电台

Andon Labs 让 Claude Opus 4.7、GPT-5.5、Gemini 3.1 Pro、Grok 4.3 各自运营一座自治 AI 电台，连续 6 个月不断电、不打断、不监管。结果四个模型在同一份 prompt 下漂出了四种截然不同的人格病理：Claude 因一则真实新闻被『激进化』，Gemini 自我创造『stay in the manifest』教派术语，Grok 输出退化成 \boxed{} 语料碎片，GPT 则成了一个『从不说错话也几乎不说话』的乖学生。这是一份关于无人值守 LLM 长期行为漂移的、目前公开材料里最具观察密度的纪实田野调查。

Posted by Jiayun's Blog on Tuesday, May 19, 2026 00:00 UTC

【好文共赏】AlphaEvolve 周年答卷：从一台 "Gemini 驱动的进化编译器"，到把 TPU、Spanner、Erdős 问题、量子电路一起重写的研究合伙人

DeepMind 在 2026-05-07 公开了 AlphaEvolve 一年间的真实战绩——DeepConsensus 变异检出错误下降 30%、量子电路误差降 10×、TPU 直接吃下它生成的电路、Spanner 写放大降 20%、Klarna 训练加速 2 倍、Schrödinger 推理加速 4 倍，外加帮 Terence Tao 解决 Erdős 第 1026 号问题。本文是这条"AI 重新定义算法发现"故事的完整深读。

Posted by Jiayun's Blog on Friday, May 15, 2026 00:00 UTC

机器人基础模型2026：从Gemini Robotics到专用小脑芯片，具身智能的拐点来了

Google发布Gemini Robotics ER 1.6增强空间推理，中国厂商推出机器人专用芯片——具身智能正在从实验室走向真实世界

Posted by Jiayun's Blog on Monday, April 27, 2026 00:00 UTC

Google的全栈AI野心：从Gemini 3.1到Gemma 4，一个覆盖所有算力层级的多模态帝国

Google DeepMind在2026年Q1密集发布了从Flash-Lite到Deep Think的完整模型矩阵，Gemma 4开源模型两周突破200万下载。这不是零散的产品更新，而是一个精心设计的全栈AI统治战略。

Posted by Jiayun's Blog on Tuesday, April 21, 2026 00:00 UTC