开源模型是智商税?这个说法真的对吗?
关于大模型开源还是闭源的争论似乎持续了很长时间。Createate 百度创始人李彦宏在2024百度AI开发者大会上声称“开源模式会越来越落后”。随后,另一位经常在互联网圈讨论AI的周鸿祎说:“我一直相信开源的力量。至于网上的一些名人胡说八道,不要上当。”
2024年世界人工智能大会将于不久前举行。(WAIC 2024年),李彦宏再次向开源模型“开火”,并直言开源模型是智商税。“当你理性思考大模型能带来什么价值,能带来什么成本的价值时,你会发现你应该永远选择闭源模型。今天不管是ChatGPT。、或者文心一言等闭源模式,一定要比开源模式更强,推理成本更低。”
然而,这一次,不再是自称是开源教徒的周鸿祎,而是阿里云CTO周靖人。后者在同一个活动中表达了对开源模型的支持。周靖人认为,国产大模型的主动开源可以大大缩短开源模型和闭源模型的差距,使普通开发者也可以使用顶级AI模型,这将显著加快大模型的应用和落地过程。
大型模型到底应该开源还是闭源,在国内既是技术之争,也是路线之争。
我们先来看看技术层面。目前业内对开源模型的质疑主要是安全性存疑和推理不足。(reasoning)能力。其实质疑开源模型的安全性是有一定道理的,因为开源软件的运行规则是,代码一旦开源,商品的命运就不会完全掌握在作者手中,而是属于所有开源参与者或社区。
只要遵循相应的开源协议,其他开发者可以用开源软件做任何事情。例如,在著名的AOSP的基础上,大量第三方Android诞生了MIUI等。 ROM。然而,AI模型不同于传统的开源软件。由于大模型的“主观能动性”太强,其可能的毁灭性是前所未有的。因此,出现了AI对齐概念,需要大模型的价值观与人类对齐。
问题是AI对齐已经被证明会降低大模型的性能,所以业内人士担心会有“疯狂科学家”不会将模型与人类的共同利益对齐,开源模型会成为后者的伙伴。另外,长期以来,开源模型不仅在基准测试中表现不佳,而且缺乏出现功能。假如忽略了文心一言,那么ChatGPT就会被李彦宏挂在嘴边。、GPT-4、Claude-确实证明了闭源模型的强大性。
事实上,李彦宏在这里使用了演讲技巧,GPT-4并非因为闭源而强大,而是因为强大而选择闭源。就像OpenAI的闭源逻辑一样,是因为产品的竞争力足够强,但是它的GPT-2在2019年发布的时候是开源的,到了ChatGPT。(GPT-3.5)、GPT-4o时变成了闭源。当时OpenAI发现自己的大模型处于“一览众山小”的状态,闭源显然是利益最大化的一种方式,否则ChatGPT Plus不会卖爆炸。Anthropic也是如此Claude-3也是如此,正是因为产品强大到不可替代。
至于开源大模型,推理成本更高,其实也不是站得住脚,因为决定大模型推理成本的重要因素不是大模型本身,而是云服务提供商。以往国产大模型的价格战背后,实际上是腾讯、阿里、JD.COM、华为等云服务厂商新一轮价格战的表象。更何况Provider在Martian。 Leaderboard(推理成本排行榜)开源模型与闭源模型的表现为伯仲之间,在统计方面无法拉开距离。
另外,闭源模型与开源模型路线的争夺也体现在对开发者的争夺上。国内大模式“拒绝接受分数”的时代已经过去,现在是追求AI应用场景的阶段。这时,第三方开发者需要共同努力,就像安卓和iOS的故事一样。当时苹果iOS率先起步,谷歌的Android是追赶者。如今,中国的百度和海外的OpenAI也是AI领域的先锋,他们都选择了闭源,而拥抱开源的阿里和Meta则在后面追赶。
大家都知道,移动操作系统中iOS和Android的市场份额是2。:但是苹果App 与谷歌Google相比,Store每年贡献的收入更大。 Play更高。因此,有了苹果的珠玉,只要AIGC能够成功复制移动互联网,坚持闭源路线的厂商就有资格复制苹果的成功。同样,选择开源路线的厂商也在模仿安卓。
最后,我们放了一个小彩蛋。我们咨询了文心的建议,关于开源模型是否有智商税。它的说法是,“它(智商税)过于简化了开源模型和闭源模型之间的复杂关系。”
本文来自微信微信官方账号“三易生活”(ID:IT-作者:三易菌,36氪经授权发布,3eLife)。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com