李彦宏不寒酸:不赚钱,为什么要做大模型?

04-24 18:56

商业谈判中,只要不被利益蒙蔽双眼,就无可非议,因为利益对自己的产品和技术路线有很强的站台。对于李彦宏和他的百度来说,显然是一样的。它既没有发布会上宣传的“让每个人都成为开发者”的崇高,也没有周鸿祎反驳中的“胡说八道、忽悠”。



一个行业领袖对技术路线的肯定甚至“拉踩”,其影响,也许会远远超出公众的预测。


"开源模型将越来越落后."Create 在2024百度AI开发者大会上,一位身穿白色衣服的百度创始人、董事长兼首席执行官李彦宏肯定说:“以前大家都觉得开源便宜。事实上,在模型场景中,开源是最贵的。”


这是Robin在几天内向大型开源模型泼下的第二瓶冷水——在4月11日之前,李彦宏在内部信中也表示,大型开源模型意义不大。


作为中国早期的大模型,百度去年3月发布了文心的大模型,选择走闭源路线。在过去的一年里,文心的大模型已经迭代到现在的4.0。


李彦宏的观点在业内引起了很大的争议,他认为作为其他国家的AI通道者,他不应该如此武断。毕竟开源创新几乎是每个开发者都认可的,整个互联网都是建立在开源的基础上的,这样信息世界才能畅通无阻。


因此也有不少现场新闻人猜测,李彦宏是否属于暗喻或diss行业的其它闭源模式。


“百模对决”如火如荼,行业领袖的最终对决成为常态。比如百川智能创始人兼首席执行官王小川,今年3月因为李彦宏的“文心4.0”在中文处理上已经超越了ChatGPT。 “4.0”的声明,多次与百度高管互呛。


360创始人周鸿祎自称是“开源教徒”,到目前为止已经连续两次在公共场合炮轰李彦宏(4月13日和4月18日)。他指出,没有开源,就没有Linux。、没有因特网,“开源不如闭源好是胡说八道,是个傻瓜,连说这话支持闭源的企业都是靠开源发展起来的。”


值得一提的是,百川智能和360都是大型开源模型。大模型开合源之争早已成为业内两派争论的话题。自去年7月以来,Llama 在马斯克最近起诉OpenAI,要求OpenAI恢复开源并给予赔偿后,宣布开源可以直接商业化已经开始,引起了广泛的争论。


所有技术路线争议的终点,都是需要商业化赚钱。大型模型加速商业化后半段,对“all in“对于人工智能百度来说,不言而喻,作为中国最早使用通用大模型会员支付模式向C端用户收费的公司,依靠大模型赚钱的迫切想法。——在之前的内部信中,李彦宏说得很直接:闭源才有真正的商业模式。只有这样,我们才能真正赚钱,我们才能赚钱,我们才能汇聚算率和人才。


从这个角度来说,如果不赚钱,为什么还要做大模型?这并不可怕。但问题是,只选择开闭源的任何一条路面,是否处于极端?开源真的落后于闭源吗?闭源真的能代表大模型“商业化”的方式吗?


01 开源一直领先于闭源?


对李彦宏来说,无论是技术还是商业模式,闭源模式都将继续领先,而非一时领先。


TechTarget在一篇文章中解释了开源和闭源的区别。开源代表公开的AI模型、训练数据和底层代码,而闭源则隐藏或保护其中一个或多个。


可以简单理解为开源模型注重开放性、共享性和合作性,促进大模型创新;闭源代表着源代码只用于企业的修改和开发,但可以更好地保护利益和技术优势。


就阵营而言,开源阵营远远大于闭源。当前国内外大型行业,闭源主要采用OpenAI GPT、以百度文心一言为代表,开源是Meta旗下的Llama(羊驼)、马斯克旗下 xAI 企业的 Grok-1、国内阿里通义千问、百川智能、360、昆仑万维,智谱AI等。在这些企业中,有不少企业选择“两条腿走路”,既做开源又做闭源。


从普通用户应用/实用化的知名度来看,闭源目前无疑领先于开源。李彦宏的核心观点之一是,无论是中国还是美国,目前最强的基础模式都是闭源。


目前,OpenAI让很多大模型感到绝望。2019年GPT-2发布时,它仍然是开源。从GPT-3到闭源,推出“核爆”聊天机器人ChatGPT后,震惊了世界。


起初,OpenAI也发表了论文,但是到了GPT-3.5、GPT-4.连算法、路线、论文都“避而不谈”。今年年初推出Sora时,明确表示不分享技术实现细节,只提供模型设计理念及其“酷”效果展示。


毫无疑问,这两年大型跑道的繁荣很大程度上归功于OpenAI的推动——如果没有ChatGPT,就不会有那么多科技企业加入大型跑道,也不会有百花齐放、百家争鸣的行业形态。


在中国,文心的话是闭源的代表。根据李彦宏最新发布的数据,文心的用户数量和API的日均调用量已经超过2亿。百度最初在模型跑道上建立了自己的AI生态。


这一年特别火爆,造成大模型巨头“围剿”的初创公司月之暗面旗下产品Kimi,也是闭源大模型。



在大模型炒作的背景下,以上简单易用,面向To。 C的闭源大模型可谓众所周知,目前已成功占据市场主导地位——但未来能否保持当前的优势尚未确定。


Llamama大受好评。 二是开源逐渐成为大模型的主流趋势,其进化速度越来越快,迅速成为大模型竞争的重要一极。


三月底,在Grok-1公开后几天,基于混合专家的基础上,创业公司Databricks公布了其开源大型DBRX。(MoE)在语言逻辑、编程、数学和逻辑等标准产业中,架构打败了Llama2-7B、Mixtral 还有Grok-1。在编程方面,综合性能超过GPT-3.5,更容易击败GPT-3.5。


根据最新消息,Meta将于下个月发布Llama 支持多模态处理。到时候,Llama 或者将超越DBRX的能力直接与GPT-4进行比较,再现后者的大部分能力。


许多业内人士认为,如果没有意外,Meta将遵循Llama。 2路线,Llama 3大量细节,如培训数据、培训方法、数据标注等。,已经公布,成为“每个人都可以获得模型权重的最强大的语言模型”。同样,DBRX为开放社区和企业提供了仅限的封闭模型API功能。


过去,闭源大模型具有“遥遥领先”的参数值。现在开源模型参数越来越大,DBRX参数达到1320亿,Grok达到3140亿,Llama 3估计其大规模版本的参数可能超过1400亿。4月17日,国内昆仑万维还宣布开源4000亿参数的大型天工3.0,成为全球最大的开源模型,号称超越GPT-4V。尽管与闭源大模型万亿参数相比还有一段距离,但是追求速度越来越快。所以谷歌工程师说,谷歌没有环城河,OpenAI也没有。


对于许多大型开源模型,特别是中国大型跑道创业者来说,拉平理解的Llama,其实比GPT更重要。许多行业和垂直模型都是通过微调或修改Llama等大型开源模型来实现的。“如果没有Llama,国内大型模型的整体水平会被海外甩在后面。”


周鸿祎和金沙江风险投资主管合伙人朱啸虎认为,开源社区聚集的工程师和科学家数量是闭源的数百倍,借助全球技术水平,实现迭代、感受改善和生态扩张。“开源很快就会超过闭源。”


但是李彦宏并不认同这一说法,他指出大型开源和Linux、Android不一样,其实最重要的开发者就是Meta,“并非真正的大家一起开发的产品。”


02 开源费用真的比闭源贵吗?


马斯克和OpenAI之间发生了最激烈的对抗。2016年,马斯克仍然是OpenAI的创始人、投资者和联合首席执行官,现在已经完全走向了决裂。


自从ChatGPT发布以来,马斯克多次嘲讽OpenAI,切断了OpenAI对推特的数据访问限制,并于今年2月起诉OpenAI和山姆·奥特曼,理由是OpenAI违反了造福人类非营利的宗旨。


总的来说,随着两派对抗态度的日益强烈,没有人能说服任何人。开源阵营认为,开源更容易创新,更容易被大众理解和监督。闭源是保守主义,容易集中权力,垄断市场和数据,AI技术发展会落后。


闭源阵营认为,开源模型是一个外壳,存在滥用风险,不能基于此进化,影响了一些公司的商业策略,尤其是注重安全隐私的公司。


但从李彦宏的角度来看,开源模式会越来越落后,核心论点是成本更高——这是行业最新的争议点。毕竟开源成本低甚至免费,开源成本不等于逻辑上的技术路线。


李彦宏的依据是,基于文心大模型4.0的“小模型”将比直接用开源模型调整模型更好,在同等尺寸下效果明显更好。同等效果下,成本明显更低。


这个说法有些道理,之前有业内人士在X平台上表示,Grok-1没有微调特定任务,普通用户使用它的基本门槛也不低。如何开源,什么可以开源,开源到什么程度,还有待实际回应。


但也有中小开发者表示,虽然Llama2的R&D和使用还没有完全向所有公众开放,但对中小开发者也非常友好。只需要一个PC就可以用零代码微调大模型,不会花很多钱,性能也不差。


事实上,业界公认的是,目前大模型技术路线还不成熟,包括ChatGPT在内的三星机密信息也发生了严重泄露。开源闭源各有利弊,“两条腿走路”是目前大多数企业的选择,即构建一系列AI模型,既有闭源又有开源。


比如130亿元的微软投资了OpenAI,但是开源ONNX也有所扩大。 Runtime的投资,以及开源Phi大模型的结局;谷歌也坚持从过去开始下注关闭源头。今年2月,“开源”模型突然推出。 Gemma,对OpenAI和Llama进行双线作战。


在中国,有更多的大型模型可以考虑开源和闭源。比如阿里通义千问,虽然主要是开源,但也有闭源模式,去年12月推广到2.1版。包括百度在内的也是如此。去年发布的文心千帆大模型平台2.0接入了包括Llama2在内的30多个主流大模型和众多开源大模型。


可以说,没有大的开源模型,百度的智能云生态就没有今天的完善。根据最新数据,文心千帆大模型生态合作伙伴数量在过去半年有所增加。 5 倍,API 调用指数级增长,超过85,000客户,超过300款进入千帆应用市场。对于这些用户和开发者来说,表面上是文心一言,实际使用的也很可能是Llama2等开源模式。


在这种情况下,为什么李彦宏还要多次肯定,大型开源模型将永远落后?


有业内人士认为,这可能与百度目前大模型的战略定位,以及需要对产品工具进行宣传和背诵密切相关。


在那之后,每个人都是开发者。Create 会上,李彦宏在给出AI时代答案的同时,还发布了三大AI“开发神器”,被广泛宣传。——AgentBuilder、AppBuilder、ModelBuilder,在百度系统中包括所有个人、公司和开发者,加快占领应用门户,甚至通过基本模型获取AI,构建中国最强大的模型生态“欲望”。


“如果开源大模型开放且逐渐强大,有多少人愿意把钱送到闭源大模型,甚至加入被控制的生态模型?”一位网友评论说,长期以来,全球开发者对苹果iOS封闭生态系统的“霸道”行为感到不满,但又无可奈何。


03 用大模型赚钱,百度跑在前面


实际上,在模型的后半部分,探索商业化路径已经成为每个玩家迫切需要选择的问题。


在这方面,李彦宏相当诚实,说百度之所以坚持关闭源头,是因为市场上有足够的开源。百度要想开源,必须自己维护一套开源版,从成本上来说非常不划算。更重要的是,闭源有真正的商业模式,可以赚钱。


目前大型模型如何商业化,或赚钱?尽管各大模型仍在探索ToB或ToC的不同路径,但重点布局方向是“脱虚向实”,倾向于“应用为王”。


从李彦宏、周鸿祎或其他行业领袖、专家的观点来看,这一点已经成为共识。


如何实现大模型商业化的答案,“all in"态度百度可以称之为行业样本,在国内跑在前面。


B端,构建“文心千帆”一系列商业矩阵,通过调用API调整,为客户的商品嫁接文心大模型能力,实现收益。


这一收费方式可简单理解为,模型租赁。360、通用大模型,如阿里通义千问、腾讯混合元、科大讯飞星火等。,以及更多行业大模型也有类似的尝试。但目前大模型工具推动千行百业生产力进步还需要一个过程,门槛更高(比如针对各行各业的定制服务)。基于tokens(“字”或“字”)的ROI(投入产出率)并不高,更多的是通过API绑定。向顾客出售云、广告等其它服务。


李彦宏曾在2023年财务报告会上披露,去年Q4百度智能云总收入84亿元,其中大模型为云业务带来了约6.6亿元的增量收入。同时,文心大模型重构后的广告系统为百度带来了数亿元的增量收入。根据李彦宏的估计,以上两项增量收入将在2024年增加到数十亿。或许,这将成为百度智能云加速对阿里巴巴云和华为云的希望。


更加值得注意的是C端。ChatGPT在国外率先推出收费Plus服务;在国内,百度紧随其后,率先在C端推出“文心一言”会员订阅模式。


目前文心3.5基础版还是可以免费使用的,但是感觉并不完美。能力强的4.0需要升级为会员,有两种会员权益,即独立会员权益和联合会员服务。


在独立会员权益价格方面,连续每月优惠价格为49.9元,每月购买价格为59.9元,连续每年588.8元,每月购买价格为658.8元。在选择使用会员权益时,用户将能够感受到文心大模型4.0的高级服务,如更强的模型能力和图片生成能力。


此外,百度还推出了文心一言4.0和文心一格白金的联合会员服务,限时特价为99元/月。除了文心大模型4.0服务外,用户还可以获得文心一格白金会员的好处,包括快速生成多尺寸高清图像、创作海报和艺术文字、AI编辑修改图片等功能。


然而,这也引起了一些用户的争议。虽然会员付费是互联网行业常见的盈利模式,但像大模型会员这样昂贵的价格相对较少,比如热闹的爱奇艺。经过几次涨价,会员包的月价目前是每月25元。


这么贵的会费,业内人士认为大部分都是AI。 从普通用户的角度来看,知识工作者、开发者等买单,如果一年用不到几次,就不适合购买。


但客观来说,生成式AI商品收费是大势所趋,大型会员价格昂贵,与服务器、芯片、培训、电费等高成本有关。如果不收费,恐怕很难用百度的弹药储备支撑烧钱需要多长时间。


从财务报告来看,百度最新的财务报告中并没有体现大模型C端会员的收费,很难知道有多少用户付费。但无论是B端还是C端AI故事,要真正体现更大的提升效应还有很长的路要走。2023年百度总收入1345.98亿元,网络营销贡献收入751亿元。


这不仅仅是百度的问题。目前能从AI赚钱的企业并不多,百度应该算是其中的佼佼者。一是快速推动其大部分产品与大模型的结合;第二,文心、百度广告、智能云、自动驾驶等领域开始从AI获得落地收入,AI商业化布局趋于多元化。


OpenAI的成功,首先是商业模式的成功。到2022年,OpenAI的收入只有2800万美元。今年2月,一些外国媒体表示,OpenAI的年化收入已经超过20亿美元,其估值已经达到了惊人的1000亿美元。一些OpenAI领导认为,到2024年底,该公司的年化收入将达到50亿美元。


商言商,只要不被利益蒙蔽双眼,因利益而为自己的产品、技术路线强势站台,无可非议。


对于李彦宏和他的百度来说,显然也是如此。它既不像发布会上宣传的“让每个人都成为开发者”那样崇高,也不像周鸿祎反驳中的“废话和欺骗”。区别在于公司路线和未来战略。包括马斯克和OpenAI 决裂,本质也是如此。


周鸿祎当然有一点没说错,那就是OpenAI。、文心的话也是从开源开始成长起来的——现在所有主流大模型的关键机制(包括开源和闭源)都是以Transformer结构为主,2017年谷歌发布了热潮的起点。《Attention is all you need》经典论文,在Transformer模型的历史意义上,有了Transformer框架下的“不可能三角形”(并行训练能力、性能和低成本推理),才有了后来的GPT。


从这个角度来看,当AI和大模型注定要推动一场新的工业革命时,某一技术路线肯定会一直落后,这也是一个极端。


本文来自微信微信官方账号“极点商业”(ID:作者:jdsy2020):Cindy,编辑:刘珊珊,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com