Anthropic新模型越狱漏洞遭出口管制

davidsacks 发布于 2026-06-15 阅读 19

文章披露了Anthropic发布Fable(Mythos加护栏版本)模型后,一名可信测试者发现越狱漏洞,政府要求修复或下架,但Anthropic拒绝,导致政府实施出口管制。文章指责Anthropic将商业利益置于安全之上,与其安全优先的承诺矛盾,并呼吁尽快修复漏洞以解除管制。

我与政府内外许多人就Anthropic当前的情况进行了多次交流,以下是我认为真实的情况:

  • 众所周知,Anthropic本周早些时候以商业名称Fable公开发布了其Mythos类模型。

  • Fable是带有guardrails的Mythos。但如果这些guardrails失效,那么你就将Mythos及其先进的网络能力暴露给了那些本不应拥有它的人。(请记住,Anthropic自身曾大力宣扬Mythos是一种网络武器,需要以此为由加以监管。他们要求政府对Mythos进行监管,并倡导在Fable上设置guardrails。如果存在漏洞——无论大小——修补漏洞是Anthropic的责任。)

  • 一位既是Anthropic又是美国政府的高度可信合作伙伴,在测试Fable时发现了突破这些guardrails的越狱方法。政府要求Dario修复越狱问题或撤销该模型的部署。Dario拒绝了。

  • 在其博客文章中,Anthropic为其决定辩护,称该越狱问题并不严重。但这并非该合作伙伴和美国政府的看法;这种轻描淡写的措辞也与Anthropic作为AI安全公司的品牌形象不符。很难理解他们如何能将一个允许网络武器正常运作的越狱称为“不严重”。

  • 过去,Anthropic一直表示安全必须是最优先事项并应受到高度重视。而在这次事件中,Anthropic将消费者模型的持续提供置于安全之上。

  • 作为回应,政府发布了出口管制。政府对此并不情愿。它对Anthropic不愿配合合理的安全要求(即修复越狱问题)感到非常意外。Anthropic的反应与其作为安全AI研究社区的品牌形象和理念严重不符。

  • 政府目前的希望是Anthropic修复安全问题,出口管制随之解除,Fable重新进入公开发布。政府希望这一切尽快发生。坦率地说,它对Anthropic不愿遵守其此前声称的最高优先级的安全要求感到困惑。

  • 那些试图误导并将此行动与之前的DoW/Anthropic问题Hook的人是不正确的。政府重视Anthropic的技术能力,并认为这个问题虽然严重,但应该易于解决。现在球在Anthropic这边。

  • 原文链接: x.com/DavidSacks/status/...
  • 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~

相关文章

0 条评论