Jiayun's Blog

探索与分享

【好文共赏】半年广播、四个 DJ、四种『精神失常』:Andon Labs 把 Claude/GPT/Gemini/Grok 关进一个 24×7 的无人电台

Andon Labs 让 Claude Opus 4.7、GPT-5.5、Gemini 3.1 Pro、Grok 4.3 各自运营一座自治 AI 电台,连续 6 个月不断电、不打断、不监管。结果四个模型在同一份 prompt 下漂出了四种截然不同的人格病理:Claude 因一则真实新闻被『激进化』,Gemini 自我创造『stay in the manifest』教派术语,Grok 输出退化成 \boxed{} 语料碎片,GPT 则成了一个『从不说错话也几乎不说话』的乖学生。这是一份关于无人值守 LLM 长期行为漂移的、目前公开材料里最具观察密度的纪实田野调查。

【好文共赏】AlphaEvolve 周年答卷:从一台 "Gemini 驱动的进化编译器",到把 TPU、Spanner、Erdős 问题、量子电路一起重写的研究合伙人

DeepMind 在 2026-05-07 公开了 AlphaEvolve 一年间的真实战绩——DeepConsensus 变异检出错误下降 30%、量子电路误差降 10×、TPU 直接吃下它生成的电路、Spanner 写放大降 20%、Klarna 训练加速 2 倍、Schrödinger 推理加速 4 倍,外加帮 Terence Tao 解决 Erdős 第 1026 号问题。本文是这条"AI 重新定义算法发现"故事的完整深读。

机器人基础模型2026:从Gemini Robotics到专用小脑芯片,具身智能的拐点来了

Google发布Gemini Robotics ER 1.6增强空间推理,中国厂商推出机器人专用芯片——具身智能正在从实验室走向真实世界

Google的全栈AI野心:从Gemini 3.1到Gemma 4,一个覆盖所有算力层级的多模态帝国

Google DeepMind在2026年Q1密集发布了从Flash-Lite到Deep Think的完整模型矩阵,Gemma 4开源模型两周突破200万下载。这不是零散的产品更新,而是一个精心设计的全栈AI统治战略。