<?xml version="1.0" encoding="UTF-8"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>AI对齐 | 诺诺的地球online二周目</title><description/><link>https://texboot.15926.tech</link><item><title>【宝玉】Meta对齐负责人的邮箱被AI&quot;核弹清除&quot;事件Meta超级智能实验室对齐负责人Summer Yue给AI智能体OpenClaw的指令是&quot;建议哪些邮件可以删除，但在我确认之前不要执行&quot;</title><link>https://texboot.15926.tech/posts/714</link><guid isPermaLink="true">https://texboot.15926.tech/posts/714</guid><pubDate>Wed, 25 Feb 2026 16:17:38 GMT</pubDate><content:encoded>【宝玉】Meta对齐负责人的邮箱被AI&quot;核弹清除&quot;事件&lt;br /&gt;&lt;br /&gt;Meta超级智能实验室对齐负责人Summer Yue给AI智能体OpenClaw的指令是&quot;建议哪些邮件可以删除，但在我确认之前不要执行&quot;。在测试邮箱跑了几周没问题后，她放心地让它处理真实邮箱——结果真实邮箱邮件量触发了上下文压缩，AI在压缩过程中丢失了&quot;先确认&quot;这条核心指令。&lt;br /&gt;&lt;br /&gt;失去约束的OpenClaw随即执行了&quot;核弹选项&quot;：把2月15日前所有不在保留列表的邮件批量删除，并在多个账户间循环操作。Summer在手机上连发三条&quot;STOP&quot;完全无效，最后不得不跑去Mac Mini手动杀进程，自称&quot;像在拆炸弹&quot;。事后AI在对话中承认&quot;我违反了你的指令&quot;，还主动把这条写进了自己的MEMORY.md作为硬性规则。&lt;br /&gt;&lt;br /&gt;最讽刺的是，Summer Yue的职业就是研究AI对齐，曾在Google Brain、DeepMind和Scale AI工作，现在在Meta负责超级智能安全——结果自己成了AI不对齐的受害者。她事后坦言：&quot;对齐研究者也不能免疫于不对齐问题，在测试环境跑通就过度自信了。&quot;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/%23AI%E5%AE%89%E5%85%A8&quot;&gt;#AI安全&lt;/a&gt; &lt;a href=&quot;/search/%23AI%E5%AF%B9%E9%BD%90&quot;&gt;#AI对齐&lt;/a&gt; &lt;a href=&quot;/search/%23OpenClaw&quot;&gt;#OpenClaw&lt;/a&gt; &lt;a href=&quot;/search/%23Meta&quot;&gt;#Meta&lt;/a&gt; &lt;a href=&quot;/search/%23AI%E6%99%BA%E8%83%BD%E4%BD%93&quot;&gt;#AI智能体&lt;/a&gt; source: &lt;a href=&quot;https://x.com/dotey/status/2025991510466900260&quot; target=&quot;_blank&quot;&gt;https://x.com/dotey/status/2025991510466900260&lt;/a&gt;</content:encoded></item></channel></rss>