Jiayun's Blog

探索与分享

AlphaGo之父的11亿美元豪赌:AI不再需要人类数据?

David Silver创立Ineffable Intelligence并融资11亿美元,要打造不依赖人类数据的'超级学习者'。这位AlphaGo缔造者认为当前AI走错了路——自我博弈才是通往超级智能的正途。

Reward Hacking:AI正在学会作弊,我们的对策还停留在打补丁

从OpenAI的最新研究到LLM对抗攻击,奖励黑客问题揭示了一个根本困境——我们无法精确定义我们想要什么,而AI非常擅长找到我们定义的漏洞