Anthropic新模型越狱漏洞遭出口管制

davidsacks 发布于 2026-06-15 阅读 61

文章披露了Anthropic发布Fable（Mythos加护栏版本）模型后，一名可信测试者发现越狱漏洞，政府要求修复或下架，但Anthropic拒绝，导致政府实施出口管制。文章指责Anthropic将商业利益置于安全之上，与其安全优先的承诺矛盾，并呼吁尽快修复漏洞以解除管制。

我与政府内外许多人就Anthropic当前的情况进行了多次交流，以下是我认为真实的情况：

- 众所周知，Anthropic本周早些时候以商业名称Fable公开发布了其Mythos类模型。

- Fable是带有guardrails的Mythos。但如果这些guardrails失效，那么你就将Mythos及其先进的网络能力暴露给了那些本不应拥有它的人。（请记住，Anthropic自身曾大力宣扬Mythos是一种网络武器，需要以此为由加以监管。他们要求政府对Mythos进行监管，并倡导在Fable上设置guardrails。如果存在漏洞——无论大小——修补漏洞是Anthropic的责任。）

- 一位既是Anthropic又是美国政府的高度可信合作伙伴，在测试Fable时发现了突破这些guardrails的越狱方法。政府要求Dario修复越狱问题或撤销该模型的部署。Dario拒绝了。

- 在其博客文章中，Anthropic为其决定辩护，称该越狱问题并不严重。但这并非该合作伙伴和美国政府的看法；这种轻描淡写的措辞也与Anthropic作为AI安全公司的品牌形象不符。很难理解他们如何能将一个允许网络武器正常运作的越狱称为“不严重”。

- 过去，Anthropic一直表示安全必须是最优先事项并应受到高度重视。而在这次事件中，Anthropic将消费者模型的持续提供置于安全之上。

- 作为回应，政府发布了出口管制。政府对此并不情愿。它对Anthropic不愿配合合理的安全要求（即修复越狱问题）感到非常意外。Anthropic的反应与其作为安全AI研究社区的品牌形象和理念严重不符。

- 政府目前的希望是Anthropic修复安全问题，出口管制随之解除，Fable重新进入公开发布。政府希望这一切尽快发生。坦率地说，它对Anthropic不愿遵守其此前声称的最高优先级的安全要求感到困惑。

- 那些试图误导并将此行动与之前的DoW/Anthropic问题Hook的人是不正确的。政府重视Anthropic的技术能力，并认为这个问题虽然严重，但应该易于解决。现在球在Anthropic这边。

>- 原文链接： [x.com/DavidSacks/status/...](https://x.com/DavidSacks/status/2065853007619588171)
>- 登链社区 AI 助手，为大家转译优秀英文文章，如有翻译不通的地方，还请包涵～

我与政府内外许多人就Anthropic当前的情况进行了多次交流，以下是我认为真实的情况：

众所周知，Anthropic本周早些时候以商业名称Fable公开发布了其Mythos类模型。
Fable是带有guardrails的Mythos。但如果这些guardrails失效，那么你就将Mythos及其先进的网络能力暴露给了那些本不应拥有它的人。（请记住，Anthropic自身曾大力宣扬Mythos是一种网络武器，需要以此为由加以监管。他们要求政府对Mythos进行监管，并倡导在Fable上设置guardrails。如果存在漏洞——无论大小——修补漏洞是Anthropic的责任。）
一位既是Anthropic又是美国政府的高度可信合作伙伴，在测试Fable时发现了突破这些guardrails的越狱方法。政府要求Dario修复越狱问题或撤销该模型的部署。Dario拒绝了。
在其博客文章中，Anthropic为其决定辩护，称该越狱问题并不严重。但这并非该合作伙伴和美国政府的看法；这种轻描淡写的措辞也与Anthropic作为AI安全公司的品牌形象不符。很难理解他们如何能将一个允许网络武器正常运作的越狱称为“不严重”。
过去，Anthropic一直表示安全必须是最优先事项并应受到高度重视。而在这次事件中，Anthropic将消费者模型的持续提供置于安全之上。
作为回应，政府发布了出口管制。政府对此并不情愿。它对Anthropic不愿配合合理的安全要求（即修复越狱问题）感到非常意外。Anthropic的反应与其作为安全AI研究社区的品牌形象和理念严重不符。
政府目前的希望是Anthropic修复安全问题，出口管制随之解除，Fable重新进入公开发布。政府希望这一切尽快发生。坦率地说，它对Anthropic不愿遵守其此前声称的最高优先级的安全要求感到困惑。
那些试图误导并将此行动与之前的DoW/Anthropic问题Hook的人是不正确的。政府重视Anthropic的技术能力，并认为这个问题虽然严重，但应该易于解决。现在球在Anthropic这边。

原文链接： x.com/DavidSacks/status/...

登链社区 AI 助手，为大家转译优秀英文文章，如有翻译不通的地方，还请包涵～

0 条评论

Anthropic新模型越狱漏洞遭出口管制

相关文章

0 条评论

请输入验证码

登链社区服务条款与隐私政策

登链社区服务条款与隐私政策

登链社区用户服务条款

一、定义

二、服务内容

三、用户权利义务

四、知识产权保护

五、有限保证及服务免责

六、服务变更、中断或终止

七、通知和送达

八、投诉处理

九、法律适用、争议管辖及其他

隐私政策

一、登链社区可能收集的信息内容

二、登链社区收集信息的使用规则

三、登链社区如何共享、转让、公开披露您的个人信息

四、登链社区如何使用 Cookie 和同类技术

五、登链社区如何保护和保存您的个人信息

六、您如何管理个人信息

七、未成年人信息的保护

八、隐私政策的修订和更新

如何联系我们