文章作者、来源:机器之心
今天,除了全球(非美)被禁的 Claude Fable 5,AI 社区还被一个开源模型刷屏了。
有推特博主发现,一个由巴西里约热内卢市政府旗下 IT 公司开源的模型 Rio 3.5 397B,在多项基准测试中超越了 Qwen 3.7 Plus 等开源模型,而这个模型的基础模型还是 Qwen3.5-397B-A17B。
另一位推特博主「Chubby」对此表示不可思议,「一个以前从来没听过的模型现在成了开源 SOTA,甚至超过了 Qwen 3.7。」
这已经是本周第二个基于 Qwen3.5 做后训练、并跻身前沿水平的模型了。另一个是 Nex-N2-Pro 397B,同样基于 Qwen3.5-397B-A17B 构建,性能可比肩 GPT-5.5 和 Opus 4.7 等顶级模型。
Rio 3.5 的崛起让 Huggingface 联合创始人兼 CEO Clem Delangue 发出了感叹,「AI 的未来没有什么是注定的。接下来会发生,我们每个人都有选择和行动的空间:路径一:闭源 API,权力集中,未来由硅谷和华盛顿少数人决定。路径二:开源 AI,让每个人都能参与、拥有并共同构建,包括里约市这样的机构。选你的路吧,朋友。」
接下来,我们来了解一下 Rio 3.5 397B 模型的技术细节。
Rio 3.5 Open 397B 是一款前沿级通用 AI 模型,由里约热内卢市政府旗下的市政 IT 公司 IplanRIO 开发。
该模型基于 Qwen 3.5 397B 进行后训练,在智能体编程、数学、STEM、多语言和多模态等基准测试中达到了开源模型的领先水平,相比基座模型有显著提升,并且能够与全球最强的开源和闭源模型竞争。
模型核心特性包括如下:
其中,SwiReasoning 是一种免训练推理框架,基于 Shi 等人 2025 年的研究,可根据基于熵的置信度信号,在显式思维链推理和潜空间推理之间动态切换。这样既能提升准确率,也能大幅提高 token 效率。该模型在训练时,也明确针对潜空间推理带来的效率增益进行了优化。
智能体编程与软件工程基准测试:
知识与推理基准测试:
数学基准测试:
多语言基准测试:
智能体与指令遵循基准测试:
参考链接:
https://x.com/kimmonismus/status/2065911865390063791
https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B
https://x.com/ZenMagnets/status/2065796012820848699
https://x.com/SemiAnalysis_/status/2065894494935933191

