把模型吹成军火吹了三年，美国政府这次当真了：Fable 5 上线 72 小时被全球下架

周一还是整个行业争相测评的当红炸子鸡，周五晚上就成了连造它的人都不能合法碰的违禁品，只要你手里那本护照"不对"。

Anthropic 的 Fable 5 经历的就是这么个 72 小时。6 月 9 日，它作为首个面向公众开放的 Mythos 级模型发布，官方宣称它在几乎所有测试基准上都是 SOTA，软件工程、科研、视觉样样领先。6 月 12 日周五傍晚 17 点 21 分（美东时间），美国商务部一纸指令送到 Anthropic，援引国家安全出口管制，要求禁止任何外籍人士访问 Fable 5 和它背后的 Mythos 5，不管这个人在美国境内还是境外，连 Anthropic 自己雇的非美籍员工也不例外。

为了合规，Anthropic 干脆把这两个模型对所有用户全部下线，美国人也一起用不了了。一刀切，全球断网。Claude 其余的模型，包括 Opus 4.8，不受影响。

这件事这两天的报道铺天盖地，大多在两个方向上打转：一是"特朗普政府又在搞技术封锁"，二是"中国和外籍开发者又要被卡脖子了"。这两个角度都没错，但都不是我想说的。我想说的是一件更别扭、也更值得 IT 圈琢磨的事：这一刀，有相当一部分是 Anthropic 自己递的刀。

"危险"是它卖了三年的人设

要理解政府为什么会下这么一道在外人看来近乎"漫画式荒诞"（这是前特朗普政府官员 Dean Ball 的原话）的命令，得先看 Anthropic 这家公司是怎么把自己包装出来的。

在所有大模型公司里，Anthropic 是把"安全"和"危险"这两个词挂在嘴边最勤的一家。别家发布模型，主打更聪明、更便宜；Anthropic 发布模型，总要附带一整套关于"这东西有多危险、我们为此做了多少防护"的叙事。ASL 安全等级、动辄数千小时的红队测试、为高危能力专设的访问审批，都是它的标配。

Mythos 就是这套叙事的顶点。这个模型家族今年早些时候问世时，Anthropic 给它的定位是"具备超人级网络漏洞挖掘与利用能力"。说白了，就是能自动找出并利用软件里的安全漏洞，强到吓人。强到什么程度？强到它不对公众开放，只通过一个叫 Project Glasswing 的项目，发给少数已获批准的机构，用于敏感的网络安全和生物领域。而这次被禁的 Fable 5，是 Anthropic 第一次尝试把 Mythos 级的能力"阉割"后端给普通人用：在网络安全、生物、化学这些高危领域，它会主动拒答，把请求甩回给更老实的 Opus 4.8。

你品一下这个产品设计本身传递的信号：我们造了一个危险到不能直接给你用的东西，现在给你一个戴了嚼子的阉割版。这是一种很聪明的营销，危险本身就是护城河。越强调它危险，就越显得它强，越显得只有 Anthropic 驾驭得了。

把"危险"挂成价签陈列，危险本身就是护城河

问题是，营销话术说给投资人和媒体听，和说给手握出口管制权力的商务部听，是两码事。

政府只是把它的新闻稿当真了

安全研究员 Peter Girnus 对这件事的评论，我认为是所有报道里最一针见血的一句：

"如果你在每一篇新闻稿里都把自己的产品形容成军火，那么迟早有一天，政府会按你说的字面意思办。"

这句话是整件事的钥匙。回头看商务部这道指令的触发点：政府方面认为，他们掌握了一种能"越狱"Fable 5 的方法，具体做法是让模型去读一个代码库，然后修复其中的软件缺陷。在他们眼里，一个被宣传成"近 Mythos 级网络武器"的模型，一旦护栏能被绕过，那就是货真价实的、可被外国势力利用的危险能力外流。于是顺理成章地，把它归到出口管制的"军火"那一类去管。

政府拿着新闻稿，照字面把模型当军火盖上出口管制印章

从监管者的逻辑链条看，这一步并不疯。疯的地方在于，喂给这个逻辑链条的前提，恰恰是 Anthropic 自己花了三年时间、不遗余力往所有人脑子里灌的那套话。政府没有误读它，政府是照单全收了它。

这就是我说的"作茧自缚"。你不能一边对着镜头把自家模型说得危险到能改变国家安全格局、借此抬高身价，一边又指望监管者听完之后摆摆手："哦那其实没那么严重，你们接着卖。"没有哪个监管者会这么配合。

一周之内，控方变成了辩方

最微妙、也最能说明问题的，是 Anthropic 这次的官方回应。

在那份声明里，Anthropic 的姿态和它过去三年完全调了个个儿。过去它是"控方"，逢人就讲自己的模型多有威胁；这次它成了"辩方"，急着证明 Fable 5 其实没那么危险。它的反驳大致是这么几条：

第一，这只是一个"狭窄的越狱"（narrow jailbreak），不是能绕过所有护栏的通用越狱，被演示出来的那点漏洞既轻微又是早就知道的。第二，能找小漏洞这种能力，竞争对手的公开模型也有，比如 OpenAI 的 GPT-5.5，凭什么单挑我。第三，Fable 5 上线前做了数千小时红队测试，护栏比以往任何模型都强。第四，也是它说得最重的一句："我们不认同：仅仅因为发现一个狭窄的潜在越狱，就召回一个已经部署给数亿人的商用模型。"

这些话单独看，每一条我都觉得站得住。一个商用模型不可能做到对越狱的完美免疫，这是行业常识，Anthropic 自己也承认"任何模型厂商目前都做不到这一点"。如果按"发现一个狭窄越狱就召回"的标准执行下去，那全行业以后谁都别想发新模型了。这个滑坡，Anthropic 点得很准。

但你把这四条反驳和它过去三年的人设并排放在一起看，尴尬就出来了：它现在为了自救而说的每一句"我没那么危险"，都在拆它当初为了卖货而立的"我很危险"的台。如果 Fable 5 真像你声明里说的这么安全可控、和 GPT-5.5 也没本质区别，那你当初把 Mythos 包装成超人级网络武器、搞 Project Glasswing 审批制、把发布会开成安全发布会，又是图什么？

这不是文字游戏，这是一家公司两套话术在同一周内迎头相撞。Anthropic 这次叫屈，我觉得叫得不冤。倒不是政府这道命令有多英明，而是它现在憋的这口气，本来就是它自己亲手喂大的那套逻辑憋出来的。

一周之内，控方席上的"我很危险"变成辩方席上的"我没那么危险"

挨刀的不止外籍开发者

把视线从 Anthropic 的尴尬上移开，看看这刀子实际落在了哪几处。

最直接挨刀的是外籍工程师，包括 Anthropic 自己人。一家把多元国籍人才当核心竞争力的硅谷公司，现在要面对一个荒诞局面：自家非美籍的工程师，可能没资格访问自己亲手参与训练的模型。Gary Marcus 提到的一个后果我觉得值得记下来：这种政策拖久了，可能会把在美的中国研究者往回赶。对一个靠全球人才密度吃饭的行业来说，这不是小事。

比这更让管理层睡不着的，是悬在头顶的那场 IPO。时间点太要命了。Anthropic 据报道刚刚保密递交了上市申请，估值约 9650 亿美元。再往前，五角大楼已经把它列为"供应链风险"。现在又添一道"旗舰模型被以国家安全名义全球召回"。叠在一起，对一家正要敲钟、急需向投资人证明"我和美国政府关系稳固、业务可预期"的公司，全是连环的负面信号。上市前最不想要的故事，就是"我的核心产品随时可能因为一封政府来信而一夜下线"。

但这件事划得最深的一道痕，IT 从业者尤其该记住，是它立下的先例。据我所知，这是大语言模型第一次被套上出口管制、近乎"军火"的框架，对特定国籍人群实施访问封锁。先例一旦立住，这次禁了谁反倒是小事。要命的是它顺手立了一套能反复套用的逻辑：模型 = 受管制技术，越狱 = 武器扩散风险，外籍访问 = 出口行为。而这套逻辑的触发门槛低得吓人。按 Anthropic 自己的说法，"发现一个狭窄越狱"就足以拉闸，可任何模型都不可能没有狭窄越狱。也就是说，理论上任何一家公司的任何一个前沿模型，都活在这把随时可能落下的铡刀底下。

一刀落下，外籍工程师、IPO、行业先例三处同时挨刀

它会恢复，但话术会变吗

把话说回到最前面那个 72 小时。一个模型从万众瞩目到全球下架只用了三天，这件事本身的荒诞，会诱使很多人把它简单归类为"特朗普政府又乱来"。我不否认行政命令这一面，但只盯着这一面，会错过更要紧的一层：Anthropic 这家最擅长讲 AI 安全故事的公司，第一次尝到了自己故事讲得太好的代价。

它接下来大概率能把模型恢复，毕竟连它自己都说这是"一个误解"，双方都有台阶下。但我更关心的，不是它什么时候恢复，而是它恢复之后，叙事会不会变。一家公司可以更新一个模型的护栏，却很难更新一套讲了三年、已经写进品牌基因里的话术。如果下一次发布会，Anthropic 还是照旧把新模型往"危险到能威胁国家安全"上夸，那说明它根本没从这次回旋镖里学到东西；如果它的措辞开始变得收敛、开始强调"可控""可用"而不是"危险""强大"，那才是这次事件留下的真正改变。

所以，给你一个具体的、不用等结论的观察点：盯着 Anthropic 下一款前沿模型的发布通稿，数一数里面"危险""安全风险""国家安全"这类词出现的频率，和这次比一比。词频的变化，会比任何官方道歉或复盘都更诚实地告诉你，它到底有没有意识到，那把砍向自己的刀，最初是谁递出去的。

"危险叙事"如回旋镖飞回，盯住下一份通稿里的危险词频