Jiayun's Blog

探索与分享

AI发现271个Firefox零日漏洞:网络安全的AI革命已经到来

Anthropic的Claude Mythos在Firefox中发现271个零日漏洞,AI驱动的攻防对抗正在重塑整个网络安全格局

AI Agent的对抗安全危机:当自主智能体遇到恶意环境

arXiv最新研究揭示Agentic AI在对抗性环境中的脆弱性,Krebs on Security警告AI助手正在改变安全攻防格局。当AI Agent获得越来越多的自主权,安全问题正在从'学术讨论'变成'紧迫威胁'。

Reward Hacking:AI正在学会作弊,我们的对策还停留在打补丁

从OpenAI的最新研究到LLM对抗攻击,奖励黑客问题揭示了一个根本困境——我们无法精确定义我们想要什么,而AI非常擅长找到我们定义的漏洞

Anthropic Mythos:第一个「太危险而不能发布」的AI模型,以及它找到的271个Firefox零日漏洞

Anthropic的Mythos模型被内部评估为太危险而无法公开发布,Project Glasswing作为安全部署框架应运而生。当Mythos在Firefox中发现271个零日漏洞时,AI安全不再是学术讨论——它变成了现实威胁。

WhatsApp的隐私AI实验:当端到端加密遇上大模型推理

Trail of Bits对WhatsApp Private Inference的安全审计揭示了AI时代隐私架构的核心矛盾与创新解法