如何打造百度?「非常有用」?

11-19 12:37

今年百度世界大会的主题是“应用”。会上,李彦宏表示,这个主题代表了百度对当前大模型产业发展的判断——2024年,国内大模型开始进入不同于海外同行的发展路线,即从投资底层模型到探索网络层——这基本上是当前行业的共识。


经过近两年的底层模型卷,国内大型模型厂商大多开始对商业化的进展感到焦虑,“killer “app在哪里”成了焦点。


尽管许多C端AI软件应用已经出现,但是在这个阶段,用户渗透率和制造现金流的能力仍然比较早。


以曾经风靡一时的妙鸭相机为例。百度指数显示,妙鸭相机自去年7月17日上线以来,热度从7月23日开始上升,8月初达到峰值,随后开始缓慢下降。根据数据分析公司Sensor 根据Tower的统计,大多数头部“AI 图像应用程序的生命周期只有两个月。


这背后所揭示的问题是,这些应用程序是否真的“有用”,是否符合用户的实际需求。


基于类似的分析,李彦宏在百度世界大会上提出,百度“不做超级应用,但做起来很有用”。


01


怎样“很有用”?


通过新发布的两种赋能AI技术——iRAG和秒达,百度主要展示了自己对“非常有用”的认识。


从需求方的角度来看,iRAG和秒达都有自己的“有用”价值。在李彦宏的描述中,文生图技术iRAG的商业价值在于无幻觉、超真实、无成本、立竿见影,可以进一步降低大模型的应用门槛,释放社会生产力。


RAG(搜索增强)是过去一段时间大模型行业的共识,为了追求模型落地的准确性,必须清除“幻觉”。


在12日下午的一次AI圆桌采访中,李彦宏表示:“在过去的几年里,RAG使大语言模型具有实用价值,可以有效控制幻觉的产生,所以它在各种场景,尤其是to。 应用B场景。但是,多模态要想进入真正的实用阶段,还必须具有准确性、可控性,应用空间才能打开。”



李彦宏指出,在过去的24个月里,大模型最大的变化基本上消除了“幻觉”,但图像与RAG技术的结合远远不够。在他看来,多模式模型之所以没有得到大规模应用,是因为幻觉问题没有得到充分解决。这是由需求痛点决定的。


所以针对这种用户需求的困扰,百度决定先进行iRAG这种技术来解决实际的幻觉问题,再谈多模态应用。


与提高程序员效率相比,百度看到了更有意义的隐性需求。


“当数亿人和数十亿人都有程序员的能力时,它对于创造性的爆发是辅助代码生成工具无法比拟的。那些工具让金字塔顶端的人更受欢迎,我们希望金字塔中间层和底层的人有金字塔顶端的人的能力,这更有意义。”李彦宏说。


从供给方面来看,秒达的构建模式也与百度对大模型发展的分析有关,即通过程序员智能体、写作智能体、搜索智能体、质检智能体等多种“智能体”合作开发。


李彦宏认为,Chat GPT-o1的方向和百度去年第四季度开始提到的“智能体”完全一样。“智能体可以反思、进化和使用工具。这个方向和传统意义上的大语言模型真的不一样。”


而且在多家模型公司追逐Sora的那一年,百度最终选择推出iRAG技术,李彦宏认为,Sora并不意味着多模式。


“Sora本质上是随机场景下的视频生成能力。它的本质是能够基本预测未来,预测下一张图片的10秒会是什么样子。”李彦宏说,但是根据Sora目前的技术进展,很难解决更实际的问题。比如数字人用语音表达文字,配合形象动作。这取决于“在随机场景中生成视频的产品”,可能做不好。


根据李彦宏的说法,Sora是一个理想化的最终目标。在实现这个目标的路上,还有很多细节需要解决。例如,iRAG正在解决这个问题。


"百度不做Sora,不代表百度不做多模式。首先运行iRAG是百度的想法。"


02


脚踏实地和应用驱动


值得注意的是,在这次世界大会上,李彦宏的演讲很少出现底层模型迭代和进化等大问题,而是更多地关注“有多少人可以用模型能力做多少事情”。


这样更实际的变化反映了行业整体思维的变化,即不放弃手中的底层研究,而是看着务实的落地目标。李彦宏说“应用驱动是第一原则”。


但是,这并不意味着对“超级应用”感到焦虑。


“大模型这一代超级应用出现的时间点,不应该和互联网刚出现的时候相比,而应该和电力革命的时候相比。换句话说,这一代超级应用可能不仅限于一个设备上的应用,而是一个类似基础设施的应用。”李彦宏指出。


与互联网相比,大模型是一个全新的基础,在这个基础上会相应地重建生产力和生产关系。然而,在大模型真正成为基础设施之前,追求“超级应用”还为时过早。


基于此,李彦宏提出了“不断赋能数百万‘非常有用’的应用”的概念。百度更倾向于为开发者提供生态,而不是自己做“超级应用”。


“我们内部同时做十个应用程序或者最多100个应用程序,外部可能有一万家创业公司在尝试各种不同的赛道,所以一万到一百个,哪一个更有可能做出来?外面做的概率一定是最大的。我们所有的主要精力都是做工具和基础平台,这样我们就可以更容易地开发和应用它们。”李彦宏说。


对新一代基础设施展示在用户面前的可能形式来说,现阶段,李彦宏认为是“智能体”。



比尔·盖茨曾经定义过智能系统:它可以响应自然语言,并根据用户的理解完成许多不同的任务,这被称为智能系统。智能系统不仅会改变每个人与计算机互动的方式,还会成为下一个平台。


由大语言模型到智能体,不可否认的是,搜索公司在这种技术方面有着天然的优势。


李彦宏说:“如果有很多智能身体,我们还是要处理如何高效匹配人的需求。人有需求后,哪里可以接触到这些智能身体?最有效的连接是搜索。”


换言之,例如,未来用户在百度搜索框中搜索时,响应结果不仅包括传统信息搜索结果,还包括匹配的智能体结果。


然而,李彦宏也指出,如果长时间线来看,智能体必须是一种过渡形式。“但我判断这种过渡形式会持续很长时间,即使是AI。 worker出现后,它仍然与智能体共存很长时间。有些东西可以完全自动化,有些东西需要通过人工智能的合作来完成,可以分为不同的场景。"


短期来看,对于明年AI行业可能发生的变化,李彦宏的关键词是“清晰”,“哪个方向更有前途,哪个方向需要再等几年,明年会更清晰。”


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com