忘掉那个只会一问一答的AI吧:自主工作并自我检查的“Claude Fable 5”

一幅色彩温暖的插画,描绘了一个机器人在巨大的图书馆里悬浮着无数书籍和设计图,正在不断地自主研究和校对。
AI Summary

一个全新维度的AI模型“Claude Fable 5”问世了,它能自主策划人类需要数天乃至数周才能完成的复杂项目,利用视觉能力批判性地审查产出结果,并以极强的毅力主动解决问题。

想象一下。早上来到公司,你对新入职且能力出众的新员工下达指示:“从我们公司新服务的策划到原型开发的全过程,由你来全权负责推进吧。”普通的AI可能听不懂你的意思,只会不断地问问题,或者在1秒钟内随便生成一份网上随处可见的策划书,然后就说工作完成了。但是,这位新员工却与众不同。它会自己制定策划案、编写代码,然后用自己的眼睛亲自确认界面是否正常显示。如果产出物有错误,它不问也不抱怨,哪怕熬夜也会自己修改和评估,在第二天早上将近乎完美的成果静静地放在你的办公桌上。

这正是在2026年6月9日,人工智能公司Anthropic向全球全新发布的人工智能“Claude Fable 5”最生动的写照 Claude Fable 5 发布:Anthropic 首个面向公众的 Mythos 级… Claude Fable 5 发布:新的顶级模型对你的…意味着什么。著名软件开发者Simon Willison在集中试用了这款AI两天后,用简短的一句话留下了强烈的感言。

“描述这款AI最好的方式就是‘极其坚韧的主动性(relentlessly proactive)’。这个模型掌握了无数的技术秘诀(tricks)。” Claude Fable 具有极其坚韧的主动性 Claude Fable 5 AI 模型在初步测试后被描述为具有极其坚韧的主动性…

Claude Fable 5到底与现有的聊天机器人有何不同,以至于专家们给出如此惊叹的评价?我们将站在普通人的视角,为您逐一剖析这项新技术的意义和影响力。


这为什么如此重要?(Why It Matters)

我们至今一直使用、倍感亲切的聊天机器人型AI,打个比方,就像是一台“高级饮料自动售货机”。投入硬币(提问)按下按钮,相应的饮料(回答)就会掉出来。但是,你不能拜托饮料自动售货机“为我制定一周的健康食谱,去超市买好菜,然后每天早上根据我的体质为我做饭”。因为自动售货机只能响应单次的需求,无法朝着长远的目标自主行动。

Claude Fable 5远远超越了这种单纯的自动售货机或聊天机器人的局限。该模型被设计用于扮演“独立知识工作者(Autonomous knowledge worker)”的角色,能够从头到尾独自完成那些若是让人类亲自上手,需要耗费数小时、数天甚至数周苦思冥想才能解决的大型复杂项目 提示 Claude Fable 5 - Claude API 文档 [ClaudeFable5 - API 定价与基准测试 OpenRouter](https://openrouter.ai/anthropic/claude-fable-5)。
Anthropic称该模型具备了“Mythos级别(Mythos-class)”的能力 [AWS 上的 Anthropic Claude Fable 5:内置保护机制的 Mythos 级功能现已可用 Amazon Web Services](https://aws.amazon.com/blogs/aws/anthropic-claude-fable-5-on-aws-mythos-class-capabilities-with-built-in-safeguards-now-available/) [ClaudeFable5 - API 定价与基准测试 OpenRouter](https://openrouter.ai/anthropic/claude-fable-5)。“Mythos”一词有神话或传说的意思,这一级别的模型专为你那些最具野心、最耗时的项目(Long-running projects)而打造。这意味着它擅长解决以前的AI模型连想都不敢想的复杂、模糊且庞大的问题 Claude Fable \ Anthropic 提示 Claude Fable 5 - Claude API 文档

这对普通上班族和大众来说意义非凡。直到现在,用户还必须对AI进行琐碎的指示:“帮我总结这一段”、“接下来把这个写成代码”。人类必须作为AI的管理者不断地介入。但现在,你只需抛出一个大方向:“去实现这个宏大的目标吧”。然后,AI就会自行制定详细计划、遇到障碍时绕道而行、并负责执行到底——真正意义上“委派工作”的时代正在全面开启。简而言之,AI已经从单纯辅助你工作的“工具”,进化成了主动代替你完成工作的可靠“同事”。


轻松理解(The Explainer)

那么,Claude Fable 5是如何独自完成这种耗时数天的项目的呢?让我们来看看让该模型如此特别的三个核心特征。

1. 自己对答案的严谨模范生:“主动的自我验证”

当给以前的AI抛出困难的数学题或编程题时,无论是对是错,它都会先快速生成句子然后交差。就像一个就算交了错误答案也理直气壮站着的学生。但Claude Fable 5却是一个在交卷前会彻底进行“验算”的学生。

据Anthropic称,该模型的工作方式非常彻底(thorough)且主动(proactive),它会自己测试自己生成的产出物 Claude Fable \ Anthropic。用技术术语来说,这被称为“主动自我验证(Proactive self-verification)”。如果这个AI在工作过程中学到了新东西,它会自行更新自己的技能,甚至会自己开发出一套用来评估自身产出物的内部评估工具集(Evaluations and harnesses) [AWS 上的 Anthropic Claude Fable 5:内置保护机制的 Mythos 级功能现已可用 Amazon Web Services](https://aws.amazon.com/blogs/aws/anthropic-claude-fable-5-on-aws-mythos-class-capabilities-with-built-in-safeguards-now-available/)。在别人检查之前,它会对自身进行严苛的评估,以此将完成度提升到极点。

2. 长了眼睛的编程魔法师:“利用视觉的批判性审查”

最令人惊叹的进展之一是,这个AI不再只是一个单纯打字(写代码)的盲人魔法师,而是能用自己的双眼亲自“看”自己创造出的结果。

举个例子,想象一下你指示Fable 5制作一个计算机程序的Web界面。Fable 5会编写代码,以极高的保真度(High fidelity)实现设计。令人惊讶的是接下来的步骤。它会利用视觉(Vision,看图并理解的功能)功能亲自确认自己编写代码的最终界面结果,然后与最初设定的目标进行对比并进行批判性评估(Critique) [AWS 上的 Anthropic Claude Fable 5:内置保护机制的 Mythos 级功能现已可用 Amazon Web Services](https://aws.amazon.com/blogs/aws/anthropic-claude-fable-5-on-aws-mythos-class-capabilities-with-built-in-safeguards-now-available/)。这就好比一位厨师按照食谱做完菜后,在端上客人的餐桌之前,会亲自用眼睛确认摆盘,并自己品尝进行评估,这完全是一样的。它在编程、多模态(同时理解文本和图像的能力)推理等方面具有巨大的优势 [用于编程和 Mythos 级的平价 ClaudeFable5 API… Kie.ai](https://kie.ai/claude-fable-5)。

3. 不会盲目说“好”的率直同事:“提示词评论”

以前的AI,无论用户问多么愚蠢的问题,它都会机械地尝试编造出看似合理的答案。但是,用过Claude Fable 5的人会立刻发现,这个模型似乎有着一种奇妙的倾向,那就是它会对用户的问题(提示词)本身主动发表意见 Claude Fable 5 是面向大众的 Mythos - Techzine Global

虽然它依然在大型语言模型(LLM,学习了大规模文本数据的AI)的框架内,但Fable 5表现出了对输入的指令进行自我反思(Self-reflect)的态度 Claude Fable 5 是面向大众的 Mythos - Techzine Global。“这个问题用另一种方式来处理可能会更好”——它更像是一个聪明率直的实干家,会反过来给用户反馈。可以说,你获得了一位在你下达错误指示时,非但不会盲目服从,反而会为你指明更好方向的可靠伙伴。


现状(Where We Stand)

Claude Fable 5不是遥远的未来,而是已经走进我们的现实。Anthropic已将其作为最先进的通用模型正式向公众发布 介绍 Claude Fable 5 和 Claude Mythos 5 - Claude API 文档

有趣的是,在这次发布中,有一个隐藏的双胞胎兄弟。向大众公开、内置了各种安全装置(Safeguards,阻止有害或危险输出的保护功能),让我们能在日常和商业中安全使用的版本,正是我们现在谈论的“Claude Fable 5”。相反,存在一个与它一模一样、却故意解除了限制AI强大力量保护措施的危险且强大的版本。这个秘密模型的名字叫“Claude Mythos 5”,它仅通过名为“Glasswing项目(Project Glasswing)”的极密计划,向身份和目的明确的网络安全专家等少数群体秘密、限制性地提供 Claude Fable 5 发布:Anthropic 首个面向公众的 Mythos 级…

那么普通人和企业可以在哪里使用Fable 5呢?目前该模型不仅在本身的Claude API上,而且已经部署在亚马逊强大的云网络AWS Bedrock、谷歌的Vertex AI、微软的Foundry等全球主要的Big Tech平台上,随时可以立即使用 [ClaudeFable5 刚刚发布:在…上达到 80.3% WaveSpeed Blog](https://wavespeed.ai/blog/posts/claude-fable-5-launch-benchmarks-pricing/)。一项新技术刚一问世,就已经遍布全球的数字神经网络了。
在使用费用方面,隐藏着Anthropic的重要战略。如果你是面向普通消费者的Claude付费套餐(Pro、Max、Team套餐)的订阅者,那么在2026年6月22日之前,你可以无需额外费用,自由地测试这款最高级别的模型 Claude Fable 5 发布:新的顶级模型对你的…意味着什么 [ClaudeFable5 刚刚发布:在…上达到 80.3% WaveSpeed Blog](https://wavespeed.ai/blog/posts/claude-fable-5-launch-benchmarks-pricing/)。
但是,当开发者在程序后台(API)大量使用时,其定价相当高昂。以AI处理单词的单位“Token”为基准,每100万个输入Token定价为10美元,每100万个输出Token定价为50美元 ClaudeFable5(含回退机制) - 智能、性能与价格… [ClaudeFable5 - API 定价与基准测试 OpenRouter](https://openrouter.ai/anthropic/claude-fable-5)。假设一本书大约是10万个Token,那么让AI读完10本书就需要花费10美元(约合人民币70元)。考虑到其他便宜的日常用AI模型成本只有1~2美元左右,这简直就是在支付超高端专家的“人工费”。

这里最需要注意的一点是。 绝对不能随便浪费这个极其昂贵又聪明的“大脑”。Anthropic的官方文档给开发者和用户留下了强烈的警告与建议。

“如果你仅仅在简单的任务负载上测试Claude Fable 5,你反而会低估该模型的能力范围。” 提示 Claude Fable 5 - Claude API 文档

也就是说,把这个AI用于诸如“告诉我今天首尔的天气”或“帮我翻译这封简短的英文邮件”这样的日常问题上,就好比找来世界上顶尖的火箭工程师让他解小学生的九九乘法表,然后失望地说“也不过如此嘛”。在Fable 5上取得最好结果的团队,都将这个AI投入到了他们面临的“最难解决的未解之题(Hardest unsolved problems)”提示 Claude Fable 5 - Claude API 文档

实际上,在赋予它5种现实且复杂的实务工作进行性能测试的结果显示,Fable 5在处理庞大文档或在架构层面设计代码等,那些需要普通专业人员(Working professional)耗费数天苦苦钻研才能完成的深度业务中,证明了它的真正价值 我用 5 个真实世界的提示测试了 Claude Fable 5:这是它的实际能力… Claude Fable 5 发布:新的顶级模型对你的…意味着什么


未来将会怎样?(What’s Next)

“你使用Claude Fable 5的方法完全错了。”这是在YouTube上评测该模型使用方法的一位专家留下的一针见血的评价 你使用 ClaudeFable5 的方法错了 - YouTube。因为如果按照过去的习惯,只是单纯地用于一问一答,就无法完全享受这项先进技术带来的好处。

Claude Fable 5的出现正在根本性地颠覆我们的工作方式。如果说迄今为止的AI是那种先粗略打个草稿,让人类花很长时间去修改的“人类主导型辅助工具”,那么现在格局已经被逆转了。反过来,AI会自己花上几天时间打磨策划案,修正错误,并上报近乎完美的最终方案,而人类监管者只需审阅并最终批准——工作的重心正在发生戏剧性的转移。这意味着对需求多、耗时长且复杂的智能体(Agentic,能自主判断并行动的自治个体)工作时代已正式拉开帷幕 介绍 Claude Fable 5 和 Claude Mythos 5 - Claude API 文档

我们现在迎来了一位出色的AI新职场同事,它会对工作紧咬不放,甚至会自己反省并修改产出物。现在我们剩下的唯一重要课题是:认真思考应该把什么样“最庞大、最具野心的问题”交给这位聪明的数字同事。提问的格局即决定产出物高度的世界已经到来。


MindTickleBytes AI记者的视点: 如果说过去的AI是一个只顾着被动完成我们指派工作的实习生,那么Fable 5已经成长为一位能主动寻找公司问题、亲眼确认结果并锲而不舍地钻研的、有责任感的资深实干家。人工智能不仅只是在“缩短”人类的工作时间,更在向需要数天激烈思考的“思维深度”延伸,真正的自动化时代正在展开。为了把这种耀眼的进步彻底变为自己的武器,相比于死记硬背工具的使用方法,现在正是我们人类应当培养自己作为“策划者”,提出更加犀利大胆问题能力的时候了。


参考资料

  1. Claude Fable 5 发布:Anthropic 首个面向公众的 Mythos 级…
  2. Claude Fable 具有极其坚韧的主动性
  3. Claude Fable 5 AI 模型在初步测试后被描述为具有极其坚韧的主动性…
  4. 提示 Claude Fable 5 - Claude API 文档
  5. Claude Fable \ Anthropic
  6. [AWS 上的 Anthropic Claude Fable 5:内置保护机制的 Mythos 级功能现已可用 Amazon Web Services](https://aws.amazon.com/blogs/aws/anthropic-claude-fable-5-on-aws-mythos-class-capabilities-with-built-in-safeguards-now-available/)
  7. Claude Fable 5 是面向大众的 Mythos - Techzine Global
  8. 介绍 Claude Fable 5 和 Claude Mythos 5 - Claude API 文档
  9. Claude Fable 5 发布:新的顶级模型对你的…意味着什么
  10. [ClaudeFable5 刚刚发布:在…上达到 80.3% WaveSpeed Blog](https://wavespeed.ai/blog/posts/claude-fable-5-launch-benchmarks-pricing/)
  11. ClaudeFable5(含回退机制) - 智能、性能与价格…
  12. [ClaudeFable5 - API 定价与基准测试 OpenRouter](https://openrouter.ai/anthropic/claude-fable-5)
  13. [用于编程和 Mythos 级的平价 ClaudeFable5 API… Kie.ai](https://kie.ai/claude-fable-5)
  14. 我用 5 个真实世界的提示测试了 Claude Fable 5:这是它的实际能力…
  15. 你使用 ClaudeFable5 的方法错了 - YouTube
测试你的理解
Q1. 最能发挥Claude Fable 5能力的使用方式是什么?
  • 询问日常简单的天气问题
  • 翻译简单的问候语
  • 交给它需要耗费数天、复杂且悬而未决的最难问题
Claude Fable 5是为复杂的长期项目而设计的。如果仅用简单的任务来测试,将会低估该模型的真正实力。
Q2. 在Claude Fable 5的特征中,与现有AI区别最大的一点是什么?
  • 只能以纯文本进行回答
  • 通过视觉审查自己的产出,并批判性地自我验证是否符合目标
  • 价格永远完全免费
该模型具备使用视觉(Vision)功能对照目标来批判性审查自己产出的能力,并能主动进行自我验证。
Q3. 与之同时发布的“Claude Mythos 5”是提供给谁的?
  • 所有普通免费用户
  • 通过Glasswing项目提供给网络安全专家
  • 小学生的教育用途
Mythos 5是与Fable 5相同的模型,但在解除部分保护措施的状态下,仅通过Glasswing项目向网络安全专家限制性提供。