李彦宏不寒酸：不赚钱，为什么要做大模型？

2024-04-24

在商业谈判中，只要不被利益蒙蔽双眼，就无可非议，因为利益对自己的产品和技术路线有很强的站台。对于李彦宏和他的百度来说，显然是一样的。它既没有发布会上宣传的“让每个人都成为开发者”的崇高，也没有周鸿祎反驳中的“胡说八道、忽悠”。

一个行业领袖对技术路线的肯定甚至“拉踩”，其影响，也许会远远超出公众的预测。

"开源模型将越来越落后."Create 在2024百度AI开发者大会上，一位身穿白色衣服的百度创始人、董事长兼首席执行官李彦宏肯定说:“以前大家都觉得开源便宜。事实上，在模型场景中，开源是最贵的。”

这是Robin在几天内向大型开源模型泼下的第二瓶冷水——在4月11日之前，李彦宏在内部信中也表示，大型开源模型意义不大。

作为中国早期的大模型，百度去年3月发布了文心的大模型，选择走闭源路线。在过去的一年里，文心的大模型已经迭代到现在的4.0。

李彦宏的观点在业内引起了很大的争议，他认为作为其他国家的AI通道者，他不应该如此武断。毕竟开源创新几乎是每个开发者都认可的，整个互联网都是建立在开源的基础上的，这样信息世界才能畅通无阻。

因此也有不少现场新闻人猜测，李彦宏是否属于暗喻或diss行业的其它闭源模式。

“百模对决”如火如荼，行业领袖的最终对决成为常态。比如百川智能创始人兼首席执行官王小川，今年3月因为李彦宏的“文心4.0”在中文处理上已经超越了ChatGPT。 “4.0”的声明，多次与百度高管互呛。

360创始人周鸿祎自称是“开源教徒”，到目前为止已经连续两次在公共场合炮轰李彦宏(4月13日和4月18日)。他指出，没有开源，就没有Linux。、没有因特网，“开源不如闭源好是胡说八道，是个傻瓜，连说这话支持闭源的企业都是靠开源发展起来的。”

值得一提的是，百川智能和360都是大型开源模型。大模型开合源之争早已成为业内两派争论的话题。自去年7月以来，Llama 在马斯克最近起诉OpenAI，要求OpenAI恢复开源并给予赔偿后，宣布开源可以直接商业化已经开始，引起了广泛的争论。

所有技术路线争议的终点，都是需要商业化赚钱。大型模型加速商业化后半段，对“all in“对于人工智能百度来说，不言而喻，作为中国最早使用通用大模型会员支付模式向C端用户收费的公司，依靠大模型赚钱的迫切想法。——在之前的内部信中，李彦宏说得很直接:闭源才有真正的商业模式。只有这样，我们才能真正赚钱，我们才能赚钱，我们才能汇聚算率和人才。

从这个角度来说，如果不赚钱，为什么还要做大模型？这并不可怕。但问题是，只选择开闭源的任何一条路面，是否处于极端？开源真的落后于闭源吗？闭源真的能代表大模型“商业化”的方式吗？

01 开源一直领先于闭源？

对李彦宏来说，无论是技术还是商业模式，闭源模式都将继续领先，而非一时领先。

TechTarget在一篇文章中解释了开源和闭源的区别。开源代表公开的AI模型、训练数据和底层代码，而闭源则隐藏或保护其中一个或多个。

可以简单理解为开源模型注重开放性、共享性和合作性，促进大模型创新；闭源代表着源代码只用于企业的修改和开发，但可以更好地保护利益和技术优势。

就阵营而言，开源阵营远远大于闭源。当前国内外大型行业，闭源主要采用OpenAI GPT、以百度文心一言为代表，开源是Meta旗下的Llama(羊驼)、马斯克旗下 xAI 企业的 Grok-1、国内阿里通义千问、百川智能、360、昆仑万维，智谱AI等。在这些企业中，有不少企业选择“两条腿走路”，既做开源又做闭源。

从普通用户应用/实用化的知名度来看，闭源目前无疑领先于开源。李彦宏的核心观点之一是，无论是中国还是美国，目前最强的基础模式都是闭源。

目前，OpenAI让很多大模型感到绝望。2019年GPT-2发布时，它仍然是开源。从GPT-3到闭源，推出“核爆”聊天机器人ChatGPT后，震惊了世界。

起初，OpenAI也发表了论文，但是到了GPT-3.5、GPT-4.连算法、路线、论文都“避而不谈”。今年年初推出Sora时，明确表示不分享技术实现细节，只提供模型设计理念及其“酷”效果展示。

毫无疑问，这两年大型跑道的繁荣很大程度上归功于OpenAI的推动——如果没有ChatGPT，就不会有那么多科技企业加入大型跑道，也不会有百花齐放、百家争鸣的行业形态。

在中国，文心的话是闭源的代表。根据李彦宏最新发布的数据，文心的用户数量和API的日均调用量已经超过2亿。百度最初在模型跑道上建立了自己的AI生态。

这一年特别火爆，造成大模型巨头“围剿”的初创公司月之暗面旗下产品Kimi，也是闭源大模型。

在大模型炒作的背景下，以上简单易用，面向To。 C的闭源大模型可谓众所周知，目前已成功占据市场主导地位——但未来能否保持当前的优势尚未确定。

Llamama大受好评。二是开源逐渐成为大模型的主流趋势，其进化速度越来越快，迅速成为大模型竞争的重要一极。

三月底，在Grok-1公开后几天，基于混合专家的基础上，创业公司Databricks公布了其开源大型DBRX。（MoE）在语言逻辑、编程、数学和逻辑等标准产业中，架构打败了Llama2-7B、Mixtral 还有Grok-1。在编程方面，综合性能超过GPT-3.5，更容易击败GPT-3.5。

根据最新消息，Meta将于下个月发布Llama 支持多模态处理。到时候，Llama 或者将超越DBRX的能力直接与GPT-4进行比较，再现后者的大部分能力。

许多业内人士认为，如果没有意外，Meta将遵循Llama。 2路线，Llama 3大量细节，如培训数据、培训方法、数据标注等。，已经公布，成为“每个人都可以获得模型权重的最强大的语言模型”。同样，DBRX为开放社区和企业提供了仅限的封闭模型API功能。

过去，闭源大模型具有“遥遥领先”的参数值。现在开源模型参数越来越大，DBRX参数达到1320亿，Grok达到3140亿，Llama 3估计其大规模版本的参数可能超过1400亿。4月17日，国内昆仑万维还宣布开源4000亿参数的大型天工3.0，成为全球最大的开源模型，号称超越GPT-4V。尽管与闭源大模型万亿参数相比还有一段距离，但是追求速度越来越快。所以谷歌工程师说，谷歌没有环城河，OpenAI也没有。

对于许多大型开源模型，特别是中国大型跑道创业者来说，拉平理解的Llama，其实比GPT更重要。许多行业和垂直模型都是通过微调或修改Llama等大型开源模型来实现的。“如果没有Llama，国内大型模型的整体水平会被海外甩在后面。”

周鸿祎和金沙江风险投资主管合伙人朱啸虎认为，开源社区聚集的工程师和科学家数量是闭源的数百倍，借助全球技术水平，实现迭代、感受改善和生态扩张。“开源很快就会超过闭源。”

但是李彦宏并不认同这一说法，他指出大型开源和Linux、Android不一样，其实最重要的开发者就是Meta，“并非真正的大家一起开发的产品。”

02 开源费用真的比闭源贵吗？

马斯克和OpenAI之间发生了最激烈的对抗。2016年，马斯克仍然是OpenAI的创始人、投资者和联合首席执行官，现在已经完全走向了决裂。

自从ChatGPT发布以来，马斯克多次嘲讽OpenAI，切断了OpenAI对推特的数据访问限制，并于今年2月起诉OpenAI和山姆·奥特曼，理由是OpenAI违反了造福人类非营利的宗旨。

总的来说，随着两派对抗态度的日益强烈，没有人能说服任何人。开源阵营认为，开源更容易创新，更容易被大众理解和监督。闭源是保守主义，容易集中权力，垄断市场和数据，AI技术发展会落后。

闭源阵营认为，开源模型是一个外壳，存在滥用风险，不能基于此进化，影响了一些公司的商业策略，尤其是注重安全隐私的公司。

但从李彦宏的角度来看，开源模式会越来越落后，核心论点是成本更高——这是行业最新的争议点。毕竟开源成本低甚至免费，开源成本不等于逻辑上的技术路线。

李彦宏的依据是，基于文心大模型4.0的“小模型”将比直接用开源模型调整模型更好，在同等尺寸下效果明显更好。同等效果下，成本明显更低。

这个说法有些道理，之前有业内人士在X平台上表示，Grok-1没有微调特定任务，普通用户使用它的基本门槛也不低。如何开源，什么可以开源，开源到什么程度，还有待实际回应。

但也有中小开发者表示，虽然Llama2的R&D和使用还没有完全向所有公众开放，但对中小开发者也非常友好。只需要一个PC就可以用零代码微调大模型，不会花很多钱，性能也不差。

事实上，业界公认的是，目前大模型技术路线还不成熟，包括ChatGPT在内的三星机密信息也发生了严重泄露。开源闭源各有利弊，“两条腿走路”是目前大多数企业的选择，即构建一系列AI模型，既有闭源又有开源。

比如130亿元的微软投资了OpenAI，但是开源ONNX也有所扩大。 Runtime的投资，以及开源Phi大模型的结局；谷歌也坚持从过去开始下注关闭源头。今年2月，“开源”模型突然推出。 Gemma，对OpenAI和Llama进行双线作战。

在中国，有更多的大型模型可以考虑开源和闭源。比如阿里通义千问，虽然主要是开源，但也有闭源模式，去年12月推广到2.1版。包括百度在内的也是如此。去年发布的文心千帆大模型平台2.0接入了包括Llama2在内的30多个主流大模型和众多开源大模型。

可以说，没有大的开源模型，百度的智能云生态就没有今天的完善。根据最新数据，文心千帆大模型生态合作伙伴数量在过去半年有所增加。 5 倍，API 调用指数级增长，超过85,000客户，超过300款进入千帆应用市场。对于这些用户和开发者来说，表面上是文心一言，实际使用的也很可能是Llama2等开源模式。

在这种情况下，为什么李彦宏还要多次肯定，大型开源模型将永远落后？

有业内人士认为，这可能与百度目前大模型的战略定位，以及需要对产品工具进行宣传和背诵密切相关。

在那之后，每个人都是开发者。Create 会上，李彦宏在给出AI时代答案的同时，还发布了三大AI“开发神器”，被广泛宣传。——AgentBuilder、AppBuilder、ModelBuilder，在百度系统中包括所有个人、公司和开发者，加快占领应用门户，甚至通过基本模型获取AI，构建中国最强大的模型生态“欲望”。

“如果开源大模型开放且逐渐强大，有多少人愿意把钱送到闭源大模型，甚至加入被控制的生态模型？”一位网友评论说，长期以来，全球开发者对苹果iOS封闭生态系统的“霸道”行为感到不满，但又无可奈何。

03 用大模型赚钱，百度跑在前面

实际上，在模型的后半部分，探索商业化路径已经成为每个玩家迫切需要选择的问题。

在这方面，李彦宏相当诚实，说百度之所以坚持关闭源头，是因为市场上有足够的开源。百度要想开源，必须自己维护一套开源版，从成本上来说非常不划算。更重要的是，闭源有真正的商业模式，可以赚钱。

目前大型模型如何商业化，或赚钱？尽管各大模型仍在探索ToB或ToC的不同路径，但重点布局方向是“脱虚向实”，倾向于“应用为王”。

从李彦宏、周鸿祎或其他行业领袖、专家的观点来看，这一点已经成为共识。

如何实现大模型商业化的答案，“all in"态度百度可以称之为行业样本，在国内跑在前面。

B端，构建“文心千帆”一系列商业矩阵，通过调用API调整，为客户的商品嫁接文心大模型能力，实现收益。

这一收费方式可简单理解为，模型租赁。360、通用大模型，如阿里通义千问、腾讯混合元、科大讯飞星火等。，以及更多行业大模型也有类似的尝试。但目前大模型工具推动千行百业生产力进步还需要一个过程，门槛更高(比如针对各行各业的定制服务)。基于tokens(“字”或“字”)的ROI(投入产出率)并不高，更多的是通过API绑定。向顾客出售云、广告等其它服务。

李彦宏曾在2023年财务报告会上披露，去年Q4百度智能云总收入84亿元，其中大模型为云业务带来了约6.6亿元的增量收入。同时，文心大模型重构后的广告系统为百度带来了数亿元的增量收入。根据李彦宏的估计，以上两项增量收入将在2024年增加到数十亿。或许，这将成为百度智能云加速对阿里巴巴云和华为云的希望。

更加值得注意的是C端。ChatGPT在国外率先推出收费Plus服务；在国内，百度紧随其后，率先在C端推出“文心一言”会员订阅模式。

目前文心3.5基础版还是可以免费使用的，但是感觉并不完美。能力强的4.0需要升级为会员，有两种会员权益，即独立会员权益和联合会员服务。

在独立会员权益价格方面，连续每月优惠价格为49.9元，每月购买价格为59.9元，连续每年588.8元，每月购买价格为658.8元。在选择使用会员权益时，用户将能够感受到文心大模型4.0的高级服务，如更强的模型能力和图片生成能力。

此外，百度还推出了文心一言4.0和文心一格白金的联合会员服务，限时特价为99元/月。除了文心大模型4.0服务外，用户还可以获得文心一格白金会员的好处，包括快速生成多尺寸高清图像、创作海报和艺术文字、AI编辑修改图片等功能。

然而，这也引起了一些用户的争议。虽然会员付费是互联网行业常见的盈利模式，但像大模型会员这样昂贵的价格相对较少，比如热闹的爱奇艺。经过几次涨价，会员包的月价目前是每月25元。

这么贵的会费，业内人士认为大部分都是AI。从普通用户的角度来看，知识工作者、开发者等买单，如果一年用不到几次，就不适合购买。

但客观来说，生成式AI商品收费是大势所趋，大型会员价格昂贵，与服务器、芯片、培训、电费等高成本有关。如果不收费，恐怕很难用百度的弹药储备支撑烧钱需要多长时间。

从财务报告来看，百度最新的财务报告中并没有体现大模型C端会员的收费，很难知道有多少用户付费。但无论是B端还是C端AI故事，要真正体现更大的提升效应还有很长的路要走。2023年百度总收入1345.98亿元，网络营销贡献收入751亿元。

这不仅仅是百度的问题。目前能从AI赚钱的企业并不多，百度应该算是其中的佼佼者。一是快速推动其大部分产品与大模型的结合；第二，文心、百度广告、智能云、自动驾驶等领域开始从AI获得落地收入，AI商业化布局趋于多元化。

OpenAI的成功，首先是商业模式的成功。到2022年，OpenAI的收入只有2800万美元。今年2月，一些外国媒体表示，OpenAI的年化收入已经超过20亿美元，其估值已经达到了惊人的1000亿美元。一些OpenAI领导认为，到2024年底，该公司的年化收入将达到50亿美元。

商言商，只要不被利益蒙蔽双眼，因利益而为自己的产品、技术路线强势站台，无可非议。

对于李彦宏和他的百度来说，显然也是如此。它既不像发布会上宣传的“让每个人都成为开发者”那样崇高，也不像周鸿祎反驳中的“废话和欺骗”。区别在于公司路线和未来战略。包括马斯克和OpenAI 决裂，本质也是如此。

周鸿祎当然有一点没说错，那就是OpenAI。、文心的话也是从开源开始成长起来的——现在所有主流大模型的关键机制(包括开源和闭源)都是以Transformer结构为主，2017年谷歌发布了热潮的起点。《Attention is all you need》经典论文，在Transformer模型的历史意义上，有了Transformer框架下的“不可能三角形”(并行训练能力、性能和低成本推理)，才有了后来的GPT。

从这个角度来看，当AI和大模型注定要推动一场新的工业革命时，某一技术路线肯定会一直落后，这也是一个极端。

本文来自微信微信官方账号“极点商业”（ID：作者：jdsy2020)：Cindy，编辑：刘珊珊，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

不好，畅销榜上的大哥们都被“一条鱼”整顿了。

海陵试验区市政部门做好市政道路美化绿化迎接旺季

悬赏公告裕华区人民法院悬赏公告

对“百千万工程”项目建设进行陈永禄调查

县法院召开劳动人事争议裁审联席会议

项目推荐

康小虎百岁计划・健康大使招募计划

毛加健康

康老板 · 氧疗堂