LeCun点赞!国产开源模型风靡硅谷,性价比超10倍

1天前
开源模型已进入中国主导时代

哇,硅谷竟然被中国开源模型“占领”了!


Yann LeCun都点赞认可:说得没错!



初代AI编程热门工具Cursor和Devin,都被曝出号称自研的模型,实际是套壳中国开源模型。



上个月,Cursor承认旗下Composer 2套壳Kimi K2.5


首个推出“AI自动工程师”Devin的Cognition公司,其自研模型SWE-1.6疑似基于GLM模型进行后训练。


类似案例越来越多,中国开源模型在硅谷的受欢迎度持续上升——


Shopify切换至Qwen后,每年节省500万美元;爱彼迎联合创始人Brian Chesky也表示:Qwen好用、快速又便宜,比GPT还实用!


智谱最新发布的GLM-5.1,作为部分指标超Opus 4.6的开源模型,性价比在硅谷也极具竞争力。


国产开源模型席卷硅谷


国外模型选择蒸馏中国开源模型或在此基础上后训练,这类情况已屡见不鲜


上个月,Cursor的自研模型Composer 2在基准测试中反超Opus 4.6,价格却大幅降低。



结果没过几天就被曝出实际套壳Kimi K2.5。


虽然事件以双方和解告终,但仍令人感慨。


Cursor作为初代AI编程的热门工具,这种做法确实不太妥当!



此外,另一个热门工具Cognition的自研模型SWE-1.6也被曝疑似基于GLM模型后训练。


而且这家公司早有类似行为,前代SWE-1.5就开始“偷梁换柱”。



去年,SWE-1.5就被曝出是在GLM-4.6基础上后训练得到的。


当时相关梗图广泛传播:



Cursor和Cognition最初都集成Claude和GPT的能力,如今却纷纷转向中国开源模型。


Cognition开发者Shawn Wang曾坦言:


只要基础模型足够优秀,其具体特性就不再重要,因为强化学习和后训练才是关键,也是区分模型的核心。



不过,初创企业不成体系,出现套壳还不承认,大家权当笑话看看。


但连巨头也这么做,背后或许有更深层原因。


去年12月,Meta的“牛油果”项目被曝出使用Qwen开源模型进行蒸馏训练。



此前,Meta旗下Llama模型长期主导开源领域,衍生模型数量和下载量均领先。


扎克伯格还曾公开呼吁构建以美国模型为核心的开源生态。


但如今,面对Llama系列增长乏力和东方模型的崛起,Meta做出了选择。


经过9个月研发,Meta最新模型Muse Spark已发布,不过是闭源的。


另外,爱彼迎联合创始人兼CEO Brian Chesky早就被Qwen的实力圈粉。


他曾公开表示:


我们很大程度依赖阿里巴巴的Qwen模型。它非常出色,速度快且价格低。我们也会用OpenAI的最新模型,但实际生产中不会大量使用,因为有更快、更经济的模型可选。




小八卦:Brian Chesky和奥特曼是挚友,但涉及自家产品整合时,必须“亲兄弟明算账”…


Brian直言,OpenAI的连接工具“尚未完全准备好”。


爱彼迎的选择,只是中国大模型技术实力的一个缩影。


学术界方面,斯坦福大学李飞飞团队、艾伦人工智能研究所等顶尖机构在研究中也采用基于Qwen的技术方案。


去年年初,李飞飞团队基于Qwen2.5-32B构建了顶级推理模型s1-32B,成本不到50美元。


该模型的数学和编码能力,与OpenAI的o1、DeepSeek的R1等尖端推理模型不相上下。


艾伦人工智能研究所也基于Qwen2-72B构建了多模态系统。


Mira Murati创办的独角兽Thinking Machines Lab,也将Qwen作为默认微调选项。


中国开源模型在硅谷的走红,由此可见一斑。



性价比成关键优势


硅谷为何如此青睐中国开源模型?


当然是因为性价比高


Peter Yang算了一笔账:在众多基准测试中,中美同等质量模型的价格相差10-20倍


以最新发布的几款国产模型为例:


Kimi K2.5:每百万token输入4元/输出21元;


MiniMax M2.7:每百万token输入2.1元/输出8.4元;


GLM-5.1:每百万token输入6元/输出24元;


Qwen3.6-Plus:每百万token输入2元/输出12元。




这些模型在基准测试中的表现,接近甚至部分超过Opus 4.6、GPT-5.4等顶尖闭源模型。


而Opus 4.6的价格是每百万token输入5美元/输出25美元,GPT-5.4则是输入2.5美元/输出15美元。


性价比一目了然。


节省超10倍成本,还能获得不错的模型表现,这难道不香吗?



而且开源模型并非完全不如闭源模型。


早在Kimi推出K2时,Vercel CEO Guillermo Rauch就提到:


在内部智能体真实场景基准测试中,Kimi K2的运行速度和准确率优于GPT-5和Claude Sonnet 4.5,准确率更是高出50%。


硅谷投资人Chamath也表示,Kimi K2性能强劲,且比OpenAI和Anthropic便宜得多。


自从艾伦人工智能研究所宣布削减开源模型研发资金、转向AI应用后,美国开源AI的旗帜真的倒了



开源模型,已进入中国主导的时代。


参考链接:


[1]https://x.com/petergyang/status/2042248752157839793?s=20


[2]The All-You-Can-Use AI Subscription Won’t Last Forever


本文来自微信公众号“量子位”,作者:关注前沿科技,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com