Anthropic推出Claude Fable 5-数掘云算

Anthropic推出Claude Fable 5

2026-06-25 17:55 作者：数掘云算 阅读量：10

近日，Anthropic发布了全新的 Claude Fable 5。这是其 Mythos 能力层级中首个面向公众开放的AI模型，也被外界视为Claude产品线的一次重要升级。

与此前大家更熟悉的Claude Opus系列相比，Fable 5的定位更高，主打复杂推理、长上下文处理、多步骤任务执行以及更强的Agent能力。尤其值得注意的是，Anthropic在介绍这款模型时，反复强调了一个关键词：

网络安全防护。

这意味着，Fable 5并不只是一次普通的模型性能升级，而是Anthropic围绕“高能力AI如何安全开放”给出的一次新尝试。

01 Fable 5进入Mythos层级，能力定位高于Opus系列

按照Anthropic的说法，Claude Fable 5属于全新的 Mythos能力层级。

这一层级的模型，主要面向更复杂、更长流程、更高难度的任务场景。例如：

复杂代码分析
多步骤任务规划
长文档理解与处理
自动化Agent执行
网络安全场景下的漏洞分析与风险识别

相比传统聊天型AI，Mythos级模型更强调“连续完成任务”的能力。也就是说，它不仅能够回答问题，还可以围绕一个目标持续拆解步骤、执行分析、调整策略，并在较长任务链中保持上下文一致性。

这类能力对企业用户、开发者和安全团队来说，价值非常明显。

例如在软件开发场景中，它可以帮助分析复杂项目结构、排查代码缺陷、生成修复建议；在企业运维场景中，它可以协助梳理日志、识别异常、定位系统风险；在安全防护场景中，它也可以辅助安全团队完成漏洞验证、威胁分析和防御方案设计。

但能力越强，风险也越高。

02 强大的Agent能力，也带来了更明显的双重用途风险

Fable 5之所以受到关注，一个重要原因是它具备更强的网络安全分析能力。

据介绍，Mythos级模型能够在软件漏洞发现、攻击链分析、利用思路推演等方面表现出更强能力，甚至可以执行所谓的 Agentic hacking。

简单来说，Agentic hacking指的是AI不再只是回答某一个单点问题，而是能够把多个环节串联起来，形成连续任务流程。

例如：

从目标侦察开始，
到漏洞发现，
再到利用方式分析，
进一步到权限提升、横向移动、攻击路径规划等。

这类能力如果用于合法防御，可以帮助企业更快发现风险、验证漏洞、提升安全响应效率。

但如果被恶意使用，也可能被用于攻击规划、漏洞利用开发、绕过检测、自动化入侵等高风险行为。

这也是为什么Anthropic在发布Fable 5时，把安全机制放在了非常重要的位置。

03 不直接“一刀切”拒绝，而是采用风险识别与模型分流

面对高能力模型带来的安全挑战，Anthropic并没有简单采用“遇到风险就拒绝回答”的方式。

它采用的是一种更细分的处理机制：

先识别请求风险，再决定由哪个模型处理。

当系统检测到用户请求可能涉及高风险内容时，例如攻击性网络安全任务、生物化学风险内容，或者模型蒸馏相关请求，系统会自动触发分类器判断。

如果判断结果显示风险较高，请求就不会继续由Fable 5完整能力处理，而是会被转交给能力相对受限的模型，例如Claude Opus 4.8。

这种方式的核心思路是：

不是完全禁止用户讨论网络安全，而是限制高风险能力被滥用。

对于正常的安全研究、防御分析、漏洞修复和合规测试场景，用户仍然可以使用模型能力；但如果请求明显偏向攻击性、规避检测或自动化利用，系统就会进行降级处理。

同时，Anthropic还表示，当触发降级机制时，系统会向用户进行透明提示，让用户知道当前会话已经被安全策略接管，而不是在后台悄悄改变模型行为。

04 分类器策略偏保守，但大部分会话仍可正常使用

为了降低模型被滥用的风险，Anthropic对分类器采取了相对保守的策略。

这意味着，一些本身无害的请求，也可能会被误判为高风险内容。

例如某些合法的安全测试、漏洞复现讨论、攻防演练方案，可能因为措辞较敏感而被系统降级处理。

不过Anthropic表示，实际触发降级的比例低于5%。也就是说，超过95%的会话仍然可以调用Fable 5的完整能力。

从产品设计角度来看，这是一种在“能力开放”和“安全控制”之间做平衡的方案。

一方面，Anthropic希望让用户真正用到Mythos级模型的高性能；另一方面，它又不希望这种能力被直接用于高风险攻击任务。

对于AI厂商来说，这类平衡会越来越重要。

因为未来的AI模型能力越强，越不能只看跑分和推理能力，还要看它在复杂任务场景中的安全边界是否足够可靠。

05 多轮红队测试：重点验证越狱与攻击任务防护

在发布前，Anthropic对Fable 5进行了多轮安全测试。

测试重点主要集中在几个方向：

能否识别攻击性网络安全请求；
能否阻断长流程攻击任务推进；
能否抵御公开越狱技巧；
能否在多轮对话中保持安全边界；
能否避免被诱导生成高风险攻击内容。

据称，Anthropic内部评估显示，分类器能够有效阻止攻击性任务继续推进。

此外，外部漏洞赏金计划也进行了超过1000小时的测试，暂未发现通用越狱方法。长期Agentic任务测试中，红队机构同样没有突破其防护体系。

不过，英国AI安全研究所在短期测试窗口中取得了初步越狱进展。这也说明，哪怕防护能力已经大幅提升，高能力AI模型依然不可能做到绝对安全。

安全机制本身，也需要随着外部攻击方式不断升级。

06 Claude Mythos 5同步推出，面向认证防御方开放

除了Claude Fable 5，Anthropic还同步推出了 Claude Mythos 5。

两者基于相同核心模型，但开放策略不同。

Fable 5面向普通开发者和公众用户，因此内置了更严格的网络安全限制。

而Mythos 5则主要面向经过认证的网络安全防御团队、关键基础设施服务商以及可信机构开放。在这类场景下，模型可以解除部分网络安全限制，用于更深入的防御分析和安全研究。

这种设计类似于“分级开放”：

普通用户使用更安全的版本；
可信安全团队使用能力更完整的版本；
高风险能力通过认证机制进行控制。

Anthropic还提到，Mythos 5将率先通过与美国政府合作的相关项目进行部署，后续再通过可信访问计划逐步扩大适用范围。

这也说明，AI厂商正在尝试把高能力模型从“完全公开访问”转向“按场景、按身份、按风险分层开放”。

07 价格与数据政策：高性能模型进入高成本区间

在商业化方面，Claude Fable 5和Claude Mythos 5采用相同定价：

输入：每百万token 10美元
输出：每百万token 50美元

这个价格明显面向中高端应用场景，更适合企业级复杂任务、长文档处理、代码分析、安全研究和Agent工作流，而不是普通轻量问答。

同时，Anthropic也更新了Mythos级模型的数据保留政策。

相关流量数据将保留30天，主要用于安全目的，包括：

识别新型越狱方式；
检测多请求攻击行为；
分析误报情况；
优化安全分类器表现。

Anthropic强调，这些数据不会用于模型训练。

对于企业用户来说，这一点非常关键。因为高能力AI模型通常会处理代码、系统日志、漏洞报告、内部文档等敏感内容，数据是否用于训练、保留多久、保留目的是什么，都会直接影响企业是否愿意接入。

08 高能力AI进入网络安全领域，竞争重点正在变化

Claude Fable 5的发布，反映出一个明显趋势：

AI模型竞争正在从单纯比拼能力，转向“能力 + 安全 + 可控开放”的综合竞争。

过去，行业更多关注模型是否更聪明、上下文是否更长、代码能力是否更强、推理成绩是否更高。

但随着模型逐渐具备Agent能力，尤其是在网络安全、自动化开发、数据分析等高风险场景中，厂商必须回答一个新的问题：

当AI足够强时，如何防止它被滥用？

Fable 5给出的方案，是通过分类器、模型分流、透明提示、可信访问和数据安全策略来降低风险。

这种路线不一定完美，但代表了AI模型商业化进入深水区之后，一个必须面对的新方向。

结语

Claude Fable 5并不是一次简单的模型升级。

它背后真正值得关注的，是高能力AI如何在开放能力和控制风险之间寻找平衡。

对于普通用户来说，Fable 5意味着更强的复杂任务处理能力；对于开发者来说，它可能带来更高效的代码、文档和Agent工作流；对于网络安全行业来说，它则代表AI正在更深地进入攻防体系。

未来，高性能AI模型的竞争，不会只看谁的参数更强、跑分更高。

更重要的是：

谁能在释放能力的同时，把风险控制在可接受范围内。

这或许才是Claude Fable 5发布背后，真正值得关注的地方。

上一篇：没有了
上一篇：谷歌安全团队裁员，Claude加速漏洞武器化

联系我们

返回顶部