开源或闭源,大厂为什么站位?

07-14 07:54

在 2024 2008年世界人工智能大会期间,李彦宏再次解读了关于大模型“开源还是闭源”的争论,称目前中国大模型应用领域的场景处于激烈的竞争环境中,“只有业务效率高于同行,成本低”才能让大模型脱颖而出。“在这种情况下,商业闭源模型是行业的未来”。


与此同时,他还强调:目前即使是较小的闭源模型,实现效果同样优于同等体积的开源模型。


李彦宏今年也不是第一次发表类似的观点, 2024 2008年,李彦宏开始在任何场合发表演讲,公开宣传百度对“闭源最终将打败开源”的看法。


虽然这样的论点几乎每次出现都会引起很多争议,但也直观地反映了行业在过去一年左右的大模型产业发展探索中逐渐形成的两种主流论调:除了周鸿祎一直对行业争议话题发表意见外,行业内几乎所有主要的明星大模型创业团队都明确支持开源大模型,并通过开源不断创新行业知名度。


而且在大厂领域,目前中美两地都有各自支持开源和闭源的巨头:闭源阵营 OpenAI、Google 以及百度,开源是以百度为主, Meta、主要是腾讯,阿里。


然而,这种表面的“位置”更多的是在不同的发展现状下面临不同问题的另一个答案:大模型的烧钱对每个大模型公司来说都是一个问题。因此,从不同的角度来看,面对客户、投资者和开发者的不同需求,出现了“巨人站在源头上,中国工厂很难开源,创业公司必须开源”的现象。


01 创业团队:出海和融资都需要开源


与巨头不同的需求相比,创业公司支持开源的原因相对统一:从“开源”的方式可以找到当前阶段面临的主要问题的答案。


根据零一万物开源业务负责人林吕强介绍:创业团队选择开源,甚至有大量的团队选择。 All in 本质上,开源是因为它是打破行业现状的最有效的方法。


在行业内大量优秀项目已经开源的前提下,“适者生存”是吸引更多用户实际感受的最重要特征,尤其是对话模型领域的一些开拓性技术。大型中厂喜欢刷各种榜单来吸引眼球,金融市场更喜欢那些真正能通过模型产品给目前的感受带来明显变化的团队。


一位参与独角兽大模型团队海外出海项目的应用产品经理告诉电厂记者:“开源也是最重要的试金石。如果你(模型)性能不够好,即使开源最终也不会有人问。


这些都不是独角兽或者创业团队的专利, Meta 与 OpenAI 类似的身影也可以在竞争中看到:对于积累了大量资源的巨头来说,通过开源建立事实标准是巨头在竞争中快速攻城掠地的重要手段。


有了开源社区作为强大的后盾,即使是作为 OpenAI 投资者的微软,也不得不选择放低姿态,主动变成 LLama 最大合作伙伴:因为微软是世界上最重要的云服务提供商,自然不能背叛开源社区的主流选择。


开源是大模型开发团队寻找进一步发展的重要途径,这一特点在中国大模型团队中也非常明显,尤其是目前表现出“出海浪潮”的独角兽企业: The Information 报道,国内 AI 一家独角兽代表公司的月亮暗面已准备好进入美国市场,并已在美国招募相关员工组建团队,并且计划在加州建立当地办公室。


国内 AI 创业团队将同时在许多国家重建办公布局。开源作为出海前最关键的前哨战,是实现出海最关键的目标之一。 —— 储备人才有很大的好处。随着开源项目的不断撤出,中国创业团队在全球开源社区中发挥了重要作用,进一步增加了中国大型团队出海时选择开源的意愿。


基于以上因素,现在拥抱开源是唯一的选择。剩下的问题只是“如何通过开源获得更多的关注,在这个过程中快速积累实力。


02 行业落地


正因为开源本质上是一种双赢的举动,所以公开宣称“开源没有未来”几乎等于站在大多数开发者的对立面。


百度作为一个平台巨头,也依靠开发者社区扩大现有业务,勇于频繁犯下这个禁忌。原因无非是自己大模型前期培训投入的计算资源和成本,迫切需要通过推广闭源大模型产业商业化来收回。


虽然开源有各种不可替代的优势,但在探索国内行业大模型时,已经形成的共识是,至少在当前和未来,开源大模型和闭源大模型仍然存在技术差异。这是闭源大模型商业价值远高于开源模型的主要原因。


从过去一年多的大模型产业应用案例来看,闭源大模型确实更受用户欢迎。主要原因是客户的实际需求不同,在处理行业相对复杂的垂直领域问题时,开源模型往往会出现推理能力不足的问题。


据一位长期观察大模型落地案例的分析师介绍,目前处理这类问题最理想的方法就是通过封闭源模型进行私有部署。在这个过程中,封闭源代码可以更快更高效地满足合作伙伴提出的各种需求,在迭代速度更快的同时,更好地根据用户需求更新迭代。


除了对应用效果负责,闭源也是保证用户数据更安全、更可控的宣传方式:即使目前开源模型普遍强调自身的治理机制,如代码审查系统、数据隐私培训等措施,这些都无法从根本上解决隐私泄露的风险。


这不仅是潜在的风险,也是客户在实际推广中对大模型效果的信心的巨大影响:闭源模型在中国的发展往往有大厂的品牌作为背诵,这是开源闭源大模型竞争的特殊优势,也是大模型控制领域问责链的最后一个环节。


这一点在市企和工程医疗领域的模型产品中最为明显:2023 2008年8月,北京市卫生健康委牵头组织指定的《北京市互联网诊疗监管实施办法(实施)》公布,明确提到不允许使用人工智能一键生成处方,取代医生本人提供诊疗服务。相应的就是之前业界最担心的问题“如果病人是因为 AI 错误的决定受害,如何明确责任归属”这个问题。


目前,大型模型应用领域仍处于行业早期探索试错阶段,因此大多数用户对监管和问责机制趋于极其保守,但不同的是,国内各行各业的大型模型应用几乎都面临着数据质量不足的问题。


为了加快模型的训练和开发,无论是开源模型还是闭源模型,都需要大量的垂直领域生成数据来提高模型反馈的质量。在这种需求下,责任归属更明确、反馈响应机制更快的闭源模型产品往往能发挥出独特的优势。


根据目前公开的信息,在提供模型本地化部署服务的同时,主要的闭源大模型巨头往往通过各种方式规避直接训练带来的潜在风险,通过去标识、数据脱敏、泛化等技术对用户信息进行脱敏处理,最大限度地减少安全隐患:这些已经属于百度、腾讯等传统互联网巨头最具优势的行业,让自己的闭源大模型满足这些需求。已有相当熟悉的操作经验。


“大模型的代码开源没有意义,因为核心概念已经从代码转向了数据和训练方法”。事实上,大模型目前遵循的“开源”概念并不是传统代码领域所理解的。


始终以“最大开源模型平台”自称。 Llama2 实际上,它并不遵循传统的代码开源协议,而是一种 Meta 自定义自己的协议,其中夹杂着大量的协议 Meta 排他性条款:例如,明确规定,当某个项目每月活跃用户超过7亿时,Meta 有权决定是否继续开源授权。 它是当前大型开源领域存在的模糊之处。



RWKV “开源不是商业化的反义词,开源代表着打破垄断”,创始人罗璇说。Llama 2 开源系列模型之所以成为引起行业震动的重要事件,是因为开源在应用领域仍然有天花板,但确实大大降低了公司的应用门槛。


类似 Llama 2 这种复杂的开源模式允许其他公司在此基础上免费商业使用,开发者也可以通过微调进行。 Llama 2 为了满足一些特定的使用需求,与商业化的价值相比,大模型在使用中的价值逐渐清晰,进而进一步推动大模型更多应用的可能性,这可能是开源在一线企业家眼中最有价值的领域。


在这一点上,大大小小的公司都能从开源中受益,真正受开源影响最严重的是各种夹在中间的大模型“中厂”。:中型企业的投资力量远不如巨头,但也很难像创业公司那样完全走开源头。


只要有大量的开源推动者不断融入社区,给行业带来新的活力和思想,它们就会不断出现,就像 Llama 2 这样的新变数,也将是未来开源大模型最大的未知重要性。


在行业应用领域,只有最先落地的厂商才能获得最大的话语权,但开源模型永远不会像闭源模型厂商声称的那样“开源没有未来”。虽然开源“丛林法则”的竞争模式不如闭源可控,但“突变”规则改变者的概率更大。


只要开源给行业带来的活力和鲶鱼效应会持续下去,开源模型就永远是行业的重要组成部分,不会随着行业巨头的主观意愿而改变。


本文来源于微信微信官方账号“电厂”(ID:wonder-capsule),作者:张勇毅,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com