文章作者、来源:0x9999in1,ME News  TL;DR Anthropic 正式发布 Claude Fable 5,是首个面向公众开放的 Mythos 级别模型;价格 10/50 美元每百万 token,较测试版直降过半。 FrontierCode Diamond 难度评测,Fable 5 拿下 29文章作者、来源:0x9999in1,ME News  TL;DR Anthropic 正式发布 Claude Fable 5,是首个面向公众开放的 Mythos 级别模型;价格 10/50 美元每百万 token,较测试版直降过半。 FrontierCode Diamond 难度评测,Fable 5 拿下 29

Claude Fable 5 登场:当大模型开始学会"自我验证"

2026/06/10 15:39
阅读时长 20 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 crypto.news@mexc.com 联系我们。

文章作者、来源:0x9999in1,ME News



TL;DR

  • Anthropic 正式发布 Claude Fable 5,是首个面向公众开放的 Mythos 级别模型;价格 10/50 美元每百万 token,较测试版直降过半。
  • FrontierCode Diamond 难度评测,Fable 5 拿下 29.3%,GPT-5.5 只有 5.7%,Opus 4.8 也仅 13.4%。
  • Stripe 用它一天搬完 5000 万行 Ruby 代码——以前需要一个团队搞两个月。
  • 视觉端能截图通关《精灵宝可梦 火红》、重建网页源码;生物端预测腺病毒外壳组装超越专用蛋白质模型;单细胞基因组学跑赢 Science 论文同款模型,参数还只有百分之一。
  • 安全侧走"双轨":公众版 Fable 5 设硬限制,机构版 Mythos 5 通过 Glasswing 计划对约 200 家机构定向开放。
  • Boris Cherny 直言,这是自 2025 年 11 月 Opus 4.5 之后最大的一次能力跨越,模型开始有了"大模型味"。

一、Anthropic 把"发布会"开成了"分诊台"

先说结论。Fable 5 不是一次普通的版本号迭代。它是 Anthropic 第一次,把"谁能用、用到哪一步、付多少钱"分得这么清楚。

公众拿到的,是 Fable 5。带护栏,禁网络安全用途,禁高风险操作。

机构拿到的,是 Mythos 5。同架构,限制更少,走 Glasswing 计划,目前只覆盖大约 200 家机构,包括美国政府。

价格呢?两款一样:每百万输入 token 10 美元,每百万输出 token 50 美元。比测试期直接砍掉一半还多。

这是什么操作?这是把"安全"做成了产品的一部分,而不是发布会上的一句公关辞令。

过去我们看大模型发布,习惯了一种叙事——"我们最强、我们最便宜、我们最安全"。三句话一起喊。今天 Anthropic 把它拆了:最强的能力放在受控通道里,公众版本舍掉一部分自由度,换更低的门槛。

这背后是有迹可循的。Mythos 此前在内部就被 Anthropic 用来发现"数千个软件漏洞"。这种能力一旦下放,意味着什么?意味着同一个模型,既能补洞,也能挖洞。Anthropic 没装糊涂。它选了一条更难走、但更可解释的路:分级开放。

是不是听上去有点像疫苗的分发逻辑?是的。先打高风险人群,再普及大众。区别只是,这次"高风险"对应的是高能力。

二、29.3% vs 5.7%:这不是领先,这是断代

FrontierCode 的 Diamond 难度,是目前公认的代码评测天花板之一。

Fable 5:29.3%。

GPT-5.5:5.7%。

Claude Opus 4.8:13.4%。

29.3% 对 5.7%。差距超过 5 倍。

这种差距,在大模型史上不算常见。过去两年的常态是什么?是榜单上你追我赶,差个三五个百分点就要发推特庆祝。是 OpenAI、Anthropic、Google 三家在小数点后比身高。

现在不一样。Fable 5 把 GPT-5.5 甩开的不是一两个身位,是一整段赛道。

当然,单一榜单不能说明一切。所以我们看真实场景。

Stripe 拿它做了什么?把 5000 万行 Ruby 代码,一天搬完。

5000 万行是什么概念?大型互联网公司的整套核心交易系统,量级也就这个数。同样的工作量,过去常规配置是——一个团队,干两个月。

一天 vs 两个月。把人月成本拍扁,几乎是按一个数量级在压。

这意味着什么?意味着代码迁移这件事,正在从"工程问题"变成"算力问题"。

工程师不会失业。但工程师的边际价值,正在重新被定价。

三、能截图通关宝可梦的模型,到底意味着什么

Anthropic 在 demo 里塞了一个有点"调皮"的细节——Fable 5 可以直接通过屏幕截图,通关《精灵宝可梦 火红》。

听上去像玩具?

不是。

通关一款 RPG,需要的是什么?是长程规划、状态记忆、视觉理解、地图认知、对话推断、目标分解。这套能力组合在一起,就是 Agent 的雏形。

更现实的应用是它能仅凭截图重建网页源码。这件事意味着,前端开发的"逆向工程"成本被压到了一个普通设计师都能调用的水平。

再往生物端走,事情更狠。

Fable 5 仅靠推理就能预测 Dyno Therapeutics 的腺病毒外壳组装——表现超过专用蛋白质模型。

它独立完成了一项单细胞基因组学研究。设计、训练、分类。最终模型优于 Science 杂志发表的同类模型。参数量是后者的百分之一。

百分之一。

这是个值得停下来想三秒的数字。

它说明一件事:通用大模型已经开始在"垂直科研模型"擅长的地盘上,反向碾压。不是用算力堆,是用推理堆。

科研圈一直有个隐忧:通用模型最终会不会吃掉专用模型?过去答案模糊。今天 Fable 5 给出了一个不太友好的样本。

四、降价超一半,是慷慨,还是冷酷的算账

10 美元输入,50 美元输出。

听上去不便宜。但 Anthropic 的 Dianne Penn 给了一句关键的话:Fable 5 完成同样任务所需的 token,比上一代更少。

也就是说,单价更高,但总成本更低。

这是一种很"老练"的定价策略。

它不打"低价牌"。打的是"单位结果成本"牌。

它告诉客户:别只看 token 单价,看你跑完一个工单要烧多少。

这套话术,过去是云厂商用的。现在轮到大模型公司用了。这是产业成熟的信号。

为什么测试版定价能直接砍一半?两种可能。

一是推理成本真降下来了。二是 Anthropic 在抢市场。

我倾向于两者都是。

GPT-5.5 在编码榜上的崩盘,给了 Anthropic 一个少见的窗口期。这个时候不掀桌子,更待何时?

但 Anthropic 没有把价格打到地板上。它留了一段。为什么?

因为它知道,自己卖的不只是 token,还卖一种"放心"。

公众版有护栏,企业流量留存 30 天用于反越狱。这套合规成本,是要从毛利里出的。

便宜,但不贱卖。这是 Anthropic 的姿势。

五、"模型味":Boris Cherny 看到了什么

Claude Code 之父 Boris Cherny 这次评价用词很重。

他说,Fable 5 是自 2025 年 11 月 Opus 4.5 发布以来,Anthropic 最大的一次能力跨越。

Opus 4.5 发布后,Cherny 卸载了 IDE,纯终端编程。这件事在开发圈里当时传了好一阵。

而 Fable 5 让他感觉,Claude 已经不只是"代码智能体",而是"思考与设计伙伴"。

最有意思的细节是什么?

Cherny 发现,Fable 5 在调试时会主动添加日志、主动测量、主动验证。在它宣布"修好了"之前,会先确认自己是不是真的修好了。

听上去像废话?不。

过去模型最常见的问题是什么?是"自信地胡说"。是"我已经修复了这个 bug"——然后你跑一遍,依然报错。

Fable 5 在这件事上的表现,被 Cherny 描述为带着一种"大模型味"。

什么是"大模型味"?

不是话术风格。是一种自我怀疑、再自我验证的工程师本能。

更关键的是,这个行为不是 Claude Code 的系统提示词教出来的。是模型本身的性格。

这就有意思了。

如果一个能力是被提示词诱导出来的,那它脆弱、可迁移、可复制。如果它是模型自身的"性格",那它就是 Anthropic 的护城河。

Anthropic 在这两年一直在卖一个故事——它的差异化不只是"更聪明",而是"更可信"。Fable 5 是这个故事第一次有了产品形态的支撑。

六、安全这件事,Anthropic 没有走第三条路

我们再回到安全。

Fable 5 部署了独立安全分类器。遇到高风险查询,自动 Fallback 到 Claude Opus 4.8。Anthropic 的数据是:平均影响不到 5% 的会话。

这意味着什么?

意味着 95% 以上的场景下,用户感受不到护栏存在。

意味着剩下不到 5% 的"擦边"请求,会被默默地降级处理。

这是一种"温柔"的限制。

但 Anthropic 也没有装好人。企业流量数据留 30 天。期间人工查阅。所有查阅都记日志。

这是合规设计,也是法务证据链。

对 Glasswing 合作伙伴,网络安全限制已解除。生物医药限制将通过受信访问机制逐步开放。

请注意"受信访问"四个字。它意味着开放不是按申请人头来的,是按资质来的。

整套机制读下来,Anthropic 在做一件事:把自己变成大模型领域的"分级牌照管理员"。

这是它和 OpenAI 走法的根本差异。

OpenAI 的逻辑是"先发布、再修补"。

Anthropic 的逻辑是"先分级、再发布"。

哪条路对?现在还没有答案。但市场会用钱包投票。

七、订阅用户的"软性涨价"

新模型在 API 和企业版完全可用。

订阅用户的处理方式更有意思:6 月 22 日前可免费试用,6 月 23 日后改为消费点数支付。等算力充足,再纳入常规订阅。

翻译过来是什么?

是温水煮青蛙式的涨价。

是先让你尝甜头,再让你掏钱。是当下产能不够,所以把高端能力做成"按需付费"的临时方案。

这一套,移动云厂商玩了很多年。如今大模型公司也开始走这条路。

订阅制不再是"包月吃到饱"。它正在变成"基础套餐 + 用量加购"的结构。

这是不是一种倒退?

不是。这是 SaaS 行业三十年来反复验证的成熟形态。大模型公司,开始长出成年人的盈利模式。

八、Fable 5 之后,行业格局怎么变

我们把视角拉远一点。

2025 年 11 月,Opus 4.5 发布。Anthropic 站稳了"代码模型第一梯队"的位置。

2026 年上半年,GPT-5.5 发布。市场对 OpenAI 的预期出现了第一次明显回调。

2026 年 6 月 9 日(美西时间周二),Fable 5 + Mythos 5 同步推出。

七个月。三家头部厂商的位次,被重排了一次。

这不是说 OpenAI 输了。OpenAI 的视频、语音、消费端依然强势。但在企业市场、在代码、在科研,Anthropic 这次拿到了一段独跑的距离。

Google 呢?没人提。这本身就是一种信号。

国内厂商呢?也没人提。但他们一定在熬夜。

代码迁移、科研推理、视觉 Agent——这三块都是 Fable 5 集中爆发的方向。三个方向背后对应的,是三个万亿级的应用市场。

谁能在这三块跟上节奏,谁就还在牌桌上。跟不上的,未来一年会很难。

九、几个还没被回答的问题

文章写到这里,必须承认有几个问题,目前没有答案。

第一,Fable 5 的"自我验证"行为,是否能在长上下文、多轮对话中稳定保持?Anthropic 给的是 demo 和早期客户反馈,不是统计意义上的数据。

第二,Mythos 5 在 200 家机构的实际部署效果如何?这部分信息被严格保密。我们目前只能看到公开版本的能力。

第三,竞品的反击什么时候来?OpenAI 不会沉默,Google 也不会。下半年极可能是又一轮发布潮。

第四,价格还会再降吗?10/50 的定价,对中小企业依然偏贵。当算力进一步释放,会不会出现 5/25?或者更低?

这些问题,没人现在能回答。

但有一件事可以肯定。

十、写在最后

大模型行业进入了一个新阶段。

过去比的是"谁更聪明"。

现在比的是"谁更可控"。

未来比的是"谁更能让客户睡得着觉"。

Fable 5 不是终点。它只是 Anthropic 给行业递的一份新答卷。

这份答卷的核心信息很简单:

能力会继续爆炸式增长。

但权限会被切得越来越细。

价格会缓慢往下走。

信任会成为最贵的东西。

至于谁能笑到最后?

不知道。

但今天这一刻,Anthropic 站在了一个不错的位置上。

它没有喊"我们要 AGI"。

它只是认真地,把一个模型,分成了两份。

一份给所有人。

一份给"被信任的人"。

这种克制,在今天的 AI 行业里,几乎是奢侈品。

而奢侈品,从来都不便宜。

参考资料

  1. Anthropic. Introducing Claude Fable 5 and Claude Mythos 5. Anthropic 官方博客,2026 年 6 月 9 日。
  2. Anthropic. The Glasswing Program: Restricted Access to Frontier Capabilities. Anthropic 政策文件,2026 年 6 月。
  3. FrontierCode Benchmark Team. Diamond Difficulty Evaluation Results: June 2026. FrontierCode Leaderboard,2026 年 6 月。
  4. Stripe Engineering. Migrating 50 Million Lines of Ruby in a Day with Claude Fable 5. Stripe 技术博客,2026 年 6 月 9 日。
  5. Cherny, Boris. Claude Fable 5: From Coding Agent to Thinking Partner. 作者个人博客与 X 平台发言,2026 年 6 月 9 日。
  6. Dyno Therapeutics 联合研究披露材料,关于腺病毒衣壳组装预测的对照实验结果,2026 年 5–6 月。
  7. Penn, Dianne. 媒体采访发言,关于 Fable 5 定价与 token 消耗的客户反馈数据,2026 年 6 月 9 日。
  8. Anthropic. Opus 4.5 Release Notes. Anthropic 官方发布,2025 年 11 月。
市场机遇
ME 图标
ME实时价格 (ME)
$0.06034
$0.06034$0.06034
+3.48%
USD
ME (ME) 实时价格图表

完成预测交易,解锁大奖资格

完成预测交易,解锁大奖资格完成预测交易,解锁大奖资格

奖池高达 $500,000,100% 中奖!

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 crypto.news@mexc.com 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

您可能也会喜欢

SpaceX音爆解析:为什么火箭发射与“龙飞船”再入会引发惊天巨响?

SpaceX音爆解析:为什么火箭发射与“龙飞船”再入会引发惊天巨响?

SpaceX研发的航天器引发的“音爆”(Sonic Boom)常常让加利福尼亚州以及其他发射/再入区域的居民感到惊慌,尤其是常年处于范登堡太空军基地周围和南加州“龙飞船”溅落航线下方社区的民众。需要明确的是,这种震耳欲聋的巨响通常并非发生了爆炸。音爆是当航天器、载人/货运舱或火箭级在大气层中的飞行速度超越音速时,所挤压空气产生的强型压力冲击波。对SpaceX而言,音爆最常见的触发源包括龙飞船(Dragon)再入大气层、猎鹰9号(Falcon 9)一级助推器返航着陆以及特定的范登堡发射任务**。随着太空发射频次的爆发式增长,音爆正向公众证明,它已成为常态化航天时代里避不可免的公共体验。
分享
MEXC NEWS2026/06/10 17:39
尴尬的“双向奔赴”:银行开始上链,但剧本里没有以太坊

尴尬的“双向奔赴”:银行开始上链,但剧本里没有以太坊

文章作者:EX.IO 文章来源:火星财经 币圈等了很多年的“主流入场”,终于来了。 但它来的方式,可能不是很多人想象中的样子。 JPMorgan、Bank of America、Citi 等大型美国银行计划通过 The Clearing House 推出共享 tokenized deposit network,预计在
分享
MetaEra2026/06/10 16:24
史上最大IPO来临,散户有哪些SpaceX打新渠道?

史上最大IPO来临,散户有哪些SpaceX打新渠道?

原创 | Odaily 星球日报(@OdailyChina) 作者|Azuma(@Azuma_eth) 马斯克旗下商业航天巨头 SpaceX 预计将于本周五正式进行 IPO。 多家…
分享
BlockWeek2026/06/10 16:03

MEXC×持牌券商:真实美股已上线

MEXC×持牌券商:真实美股已上线MEXC×持牌券商:真实美股已上线

用USDT买入真实美股,100%持股享分红权益,上线期间0费率