Anthropic 已就其 AI 模型 Claude Fable 5 通过隐形护栏秘密实施节流措施致歉,这些措施阻碍了包括研究人员和竞争对手在内的用户的使用。该公司宣布,现在将更加透明地告知何时激活这些限制,即使这会导致《神鬼寓言》拒绝更多查询。
We’re rolling out changes to make Fable 5’s safeguards for frontier LLM development visible.
Starting this week, flagged requests will visibly fall back to Opus 4.8—the same as our safeguards for cyber and bio. You will see this every time it happens. On the API, any flagged…
— ClaudeDevs (@ClaudeDevs) June 11, 2026
Fable 是 Anthropic 神话类人工智能系统中的首个模型,该公司警告称,如果广泛发布,可能会带来重大风险。为了应对这些风险,Anthropic 推出了 Fable,其中内置了专门的防护措施,以防止其回答某些“高风险”查询,特别是与模型蒸馏相关的查询。
在《神鬼寓言》的系统卡中,Anthropic 透露,如果用户在没有通知的情况下尝试蒸馏,它将修改和降低模型的答案。展望未来,被识别为蒸馏尝试的查询将自动恢复为 Claude Opus 4.8(之前的旗舰模型)。 Anthropic 致力于在用户的查询恢复到 Opus 4.8 时通知用户,并表示:“每次发生时您都会看到这一点。”
这种改变的方法反映了《Fable》管理其他高风险查询的方式,通过 Opus 4.8 路由它们,除非被涉及毒品或武器等主题的更广泛的安全规则阻止。然而,正如 Anthropic 指出的那样,一些限制因过于宽泛而招致批评,导致 Fable 几乎无法用于生物学等领域的基本查询。
Anthropic 承认其最初关于隐形防护措施的决定是错误的,并表示:“隐形防护措施的目标范围可以更窄,使我们能够快速发货,且误报率极低……这是错误的权衡。”
这些调整是在人工智能研究界对 Anthropic 动态限制涉嫌出于竞争目的而试图提炼《神鬼寓言》的用户的策略做出的强烈反应之后做出的。 Anthropic 在其系统卡中证明了有必要针对此类请求,并解释说使用其模型创建竞争系统违反了该公司的服务条款。该公司还指责某些竞争对手,包括 DeepSeek 等中国公司,不公平地以“工业”规模稀释其模型。
<小时/>





