OpenClaw适配模型推荐:国产模型占据榜单前三中的两席
OpenClaw(龙虾)热度持续攀升,不少用户在实际使用时都会遇到一个关键问题——
究竟哪款大模型最适合搭配OpenClaw使用呢?
别着急,OpenClaw的开发者(被网友称为“龙虾之父”)给出了建议:可以关注一个名为PinchBench的榜单。

PinchBench是专门针对OpenClaw设计的评测榜单,从成功率、速度、价格等维度评估全球大模型与OpenClaw的适配程度,并且会实时更新数据。
该榜单早在今年2月底就已推出,近期热度飙升,除了“龙虾之父”的推荐外,更重要的原因是国产模型在榜单中的表现十分亮眼。
国产模型在榜单前排占比显著
对于OpenClaw用户来说,选择合适的模型至关重要。毕竟使用模型会消耗token产生成本,同时速度过慢也会影响使用体验,用户往往需要在价格和速度之间寻找平衡。
PinchBench通过成功率、速度、价格三个核心维度对全球模型进行排名,让用户能清晰了解各模型的优势。截至本文发布时,榜单呈现出以下特点:
国产模型在成功率和速度方面表现突出,但价格优势相对较弱。
在成功率排名中,谷歌Gemini 3 Flash以95.1%的成功率位居第一,而第二、第三名均为国产模型:MiniMax M2.1(93.6%)和Kimi K2.5(93.4%)。值得注意的是,MiniMax此次参评的还不是其最新的M2.5模型(该模型于春节期间上线,主打“让复杂Agent运行更具经济性”)。
速度方面,国产模型MiniMax M2.5表现更为出色,超越了Gemini、Llama等国际模型,位列榜首。

据了解,MiniMax M2.5在SWE-Bench Verified测试中,任务完成速度较上一代M2.1提升37%,端到端运行时间缩短至22.8分钟,与Claude Opus 4.6持平。而Claude Opus 4.6在最新排名中仅列第30位(M2.1为第22位)。

不过在价格方面,国产模型与OpenAI、谷歌的模型相比稍显逊色。以GPT-5-nano为例,其输入价格低至0.05美元/百万tokens,输出价格为0.40美元/百万tokens;而国产模型中价格较低的MiniMax M2.1,输入价格为2.1元/百万tokens(约0.3美元),输出价格为8.4元/百万tokens(约1.2美元),价格约为GPT-5-nano的3倍。

若要在成功率和价格之间找到平衡,可参考下图。图中左上角方框圈出的8个模型表现较为均衡,其中4个为国产模型。

总体而言,在PinchBench这个专为OpenClaw设计的评测榜单中,国产模型不仅占比高,在部分单项上也展现出强劲实力。
PinchBench是什么?
PinchBench并非由大厂推出的标准评测工具,而是来自创业团队Kilo AI。该团队由GitLab前联合创始人兼CEO Sid Sijbrandij投资并参与创立,曾开发过热门“氛围编程”工具Kilo Code。
今年初OpenClaw爆火后,Kilo AI推出了基于OpenClaw的全托管智能体平台KiloClaw,PinchBench便是随平台一同发布的智能体框架评测工具。

PinchBench主要用于测试不同大模型在真实工作流中的执行能力,与传统大模型评测(如知识问答、数学推理)不同,它更侧重于“Agent能力测试”——不仅考察模型的问答能力,更关注其完成完整任务的能力。
目前,PinchBench包含约23个真实任务测试,例如查询整理资料、撰写邮件或报告、调用API完成操作等。

在评分机制上,PinchBench采用“自动化检查+LLM评审”相结合的方式:部分任务通过自动检查脚本(如是否生成正确文件、完成指定操作)评分,另一部分则由LLM Judge评估结果质量。最终统计的核心指标为任务完成率(Success Rate)、完成速度(Speed)和推理成本(Cost)。
由于评测贴近真实任务流程,PinchBench榜单呈现出一个有趣的现象:模型规模并非决定排名的唯一因素,那些针对Agent优化或推理效率更高的模型,排名反而可能超过传统主流大模型。这也是PinchBench近期受到广泛关注的原因之一。

此外,PinchBench目前完全开源,用户可在平台上自行运行测试或添加新任务。如果对模型选择有疑问,不妨亲自尝试。
PinchBench开源地址:https://github.com/pinchbench/skill
参考链接:[1]https://x.com/steipete/status/2030312187915309311[2]https://pinchbench.com/about?utm_source=chatgpt.com
本文来自微信公众号“量子位”,作者:关注前沿科技,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




