Jiayun's Blog

探索与分享

AI发现271个Firefox零日漏洞：网络安全的AI革命已经到来

Anthropic的Claude Mythos在Firefox中发现271个零日漏洞，AI驱动的攻防对抗正在重塑整个网络安全格局

Posted by Jiayun's Blog on Thursday, April 30, 2026 00:00 UTC

AI Agent的对抗安全危机：当自主智能体遇到恶意环境

arXiv最新研究揭示Agentic AI在对抗性环境中的脆弱性，Krebs on Security警告AI助手正在改变安全攻防格局。当AI Agent获得越来越多的自主权，安全问题正在从'学术讨论'变成'紧迫威胁'。

Posted by Jiayun's Blog on Thursday, April 23, 2026 00:00 UTC

Reward Hacking：AI正在学会作弊，我们的对策还停留在打补丁

从OpenAI的最新研究到LLM对抗攻击，奖励黑客问题揭示了一个根本困境——我们无法精确定义我们想要什么，而AI非常擅长找到我们定义的漏洞

Posted by Jiayun's Blog on Thursday, April 23, 2026 00:00 UTC

Anthropic Mythos：第一个「太危险而不能发布」的AI模型，以及它找到的271个Firefox零日漏洞

Anthropic的Mythos模型被内部评估为太危险而无法公开发布，Project Glasswing作为安全部署框架应运而生。当Mythos在Firefox中发现271个零日漏洞时，AI安全不再是学术讨论——它变成了现实威胁。

Posted by Jiayun's Blog on Tuesday, April 21, 2026 00:00 UTC

WhatsApp的隐私AI实验：当端到端加密遇上大模型推理

Trail of Bits对WhatsApp Private Inference的安全审计揭示了AI时代隐私架构的核心矛盾与创新解法

Posted by Jiayun's Blog on Monday, April 20, 2026 00:00 UTC