李彦宏WAIC演讲实录:AI跑分刷乱象不但不适合所有应用领域,开源也不适合所有应用领域

2024-07-05

腾讯科技讯 7月4日,百度创始人、董事长兼CEO李彦宏在2024年世界人工智能大会上对AI行业的问题进行了评价,并给出了他认为AI落地的后续方向。


自去年ChatGPT发布以来,国内许多科技巨头开始发布新一代大语言模型。在这场被媒体称为“百模对决”的激烈竞争中,模型参数值规模、培训信息量和推理能力成为热门话题。各种模型都宣布评价结果超过GPT-4,但AI落地仍然缺乏完善的解决方案。


李彦宏认为,只有闭源模型才能在商业应用中获得优势。目前行业过于关注模型本身,而忽略了AI的真正价值——应用。他强调,无论是开源模型还是闭源模型,如果不落地到实际应用中,都是“一文不值”的。他认为,未来AI应用的主要形式将是智能体,它将逐步渗透到各行各业的必需品中。


对于AI可能对就业产生的影响,李彦宏认为在这场AI浪潮中,人工智能仍然是一名副驾驶,而不是一名替代人类的驾驶员。虽然有些工作会消失,但会有新的工作。



下面是李彦宏在2024年人工智能大会上的全篇演讲:


我很高兴来上海参加世界人工智能大会。我是这次会议的常客,经常来参加。去年,我在2022年参加了最后一次世界人工智能大会,因为我没能出国。我记得大会的主题是元宇宙,组织者也想让我谈谈元宇宙。但是我说,我最好谈谈人工智能。


当时我讲的主题是人工智能生成的内容。(AI Generated Content)。我认为人工智能的技术发展路线发生了方向性的变化,从过去的识别人工智能转变为未来的生成人工智能。这种观点是在2022年夏天提出的,五个月后,大家都知道ChatGPT已经发布了。


每个人都更清楚未来会发生什么。短短两年,整个世界似乎都变了。人工智能可以说颠覆了大多数人的认知。2023年,中国出现了“百模对决”,造成了社会资源的极大浪费,尤其是计算能力的浪费。然而,这导致我们建立了追求世界上最先进基础模型的能力。


去年10月,当我宣布文心4.0发布时,我说文心4.0的能力与GPT-4相比并不多。当时很多同行都不这么认为。但是今天我们可以看到,中国已经有很多闭源模型声称已经达到或者超过了GPT-4的水平。注意,我说的是闭源的大模型,不是开源的大模型。


今年以来,这也是一个有争议的话题。一些外行人甚至把模型开源和代码开源这两个概念混为一谈。模型开源,你得到了很多参数。您仍然需要进行微调监管。(Supervised Fine-Tuning,SFT),还是要做安全对齐。您不知道这些参数是如何产生的,也不能做到“人心齐泰山移”。即使你得到了相应的原始代码,你也不知道它使用了多少数据,使用了什么比例的数据来训练这些参数。所以得到这些东西并不能让你站在巨人的肩膀上迭代和发展。


所以,在相同的参数规模下,闭源模型比开源模型具有更好的能力。若要在能力上追平开源模型,则需要具备较大的参数规模。这样就意味着推理的成本会更高,反应速度也会更慢。许多人用开源模型来代替,认为这样可以更好地为自己的个性化应用服务。然而,这样你就创造了一个“孤本”模型,既不能从基本模型的不断升级中受益,也不能与他人共享算率。


当然,我也承认开源模型在一些场景中是有价值的,比如一些学术研究或教学领域。如果你想研究大模型的工作机制,形成理论,那么开源模型在这个时候可能是有价值的。因为你可能经常听到,我们认为大模型很有能力,但我们不知道为什么它很有能力,因为背后没有理论来支撑它。所以我觉得用开源模型研究这个问题没问题。


然而,在大多数应用场景中,开源模型并不适合。当你处于一个竞争激烈的市场环境中时,你需要让你的业务比同龄人更有效率,成本更低。这个时候,商业闭源模型是可以打得很好的。


当然,这些都不是最重要的。没有应用,只有一个基本模型,无论是开源还是闭源,都一文不值。所以从去年下半年开始,我就在说,不要再纠结于模型了,要注意应用。但是我看到我们的媒体还是把重点放在基本模型上,整天跑来跑去刷榜。


今天的震撼发布,明天的史诗级更新,但我想问:应用在哪里?谁从中受益了?事实上,应用离我们并不遥远。基于基本模型的应用已经逐渐渗透到各行各业和领域。


两个多月前,我们宣布文心大模型的日调用量超过2亿。最近我们说文心大模型的日调用量已经超过5亿。仅仅两个多月,调用量就发生了如此大的变化。它的背后代表着真正的需求,有些人在使用它,有些人真的从大模型中受益,获得了价值。


比如在快递领域,让大模型帮忙处理订单,做到“一张图一句话就是快递”,不再需要其他繁琐的流程。处理时间从三分钟缩短到19秒,90%以上的售后服务也是大模型解决的,效率明显提高。


例如,在小说创作领域,最初使用开源模型产生了一些效果。随后改为文心的轻量级模型,经过10轮、1万组数据的监管微调和后训练,结果显著提高。最近又转到了文心4.0版本,只使用了数百条数据,4.0在剧情和逻辑上都表现出了非凡的优势。产生的内容无论是可用性还是高质量,都大大超过了文心的轻量级模型,网文作者如虎添翼。


在更通用的行业,比如代码生成、文心快码等软件,逐渐渗透到各行各业。百度内部30%的代码已经由人工智能生成,代码的使用率已经超过44%。


然而,为了防止我们陷入超级应用陷阱,我们认为我们必须生产一个10亿元的应用程序才能成功。我认为这是移动互联网时代的思维。在人工智能时代,规律可能不是这样。非常有能力的应用比只看下载量的超级应用更重要。只要能在行业和应用领域产生巨大的收益,整体价值就比移动互联网大很多。


随着基础模型的日益强大,开发和应用变得越来越简单。最简单的就是智能体,这也是我们最看好的人工智能技术发展趋势。一般不需要编码就能做出好的智能体。只要用人类的话把智能体的工作流讲清楚,再加上专有的知识库,一般都是很有价值的智能体。这比网络时代做网页简单。


未来,在医疗、金融、教育、制造、交通、农业等领域,我们将根据自己的情况、独特的经验、规则和数据制作各种智能体。未来将会出现数百万个智能体,形成巨大的智能体生态。搜索是智能体分发的最大入口。


在过去的高考季,许多大型企业都热衷于写高考作文,看看用人工智能写一篇作文能得多少分。事实上,这种使用价值并不大,别人也不会允许你带一个大模型进入高考。但是真正的需要是大量的考生在考试结束后要报志愿,要选择学校,要选择专业。对于一所大学,一个专业,他们会有各种各样的问题,而且每个考生的情况都不一样。在这个时候,要有一个智能体来回答每个考生独特的问题。高峰期,百度高考智能体每天回答超过2000万个问题,而我们只有1000万考生。


人工智能正以前所未有的速度渗透到各行各业。很多人担心,如果让人工智能做好我们的日常工作,人会没有工作机会吗?这种担心不是没有道理的,但是在过去的一段时间里,我听到了很多担心和抱怨,也听到了很少的建设性意见。很少有人致力于挖掘生成人工智能带来的新工作机会。


在我看来,一方面,人工智能在这波浪潮中扮演着“副驾驶”的角色。人工智能只是帮助人们工作,而不是替代人们的工作,这使得人们的工作更加高效和优质。另一方面,我们也看到一些新的工作机会开始出现。比如数据标记师,近年来,我们帮助全国20多个城市登陆数据标记中心,提供了大量的新就业机会。


再比如提示词工程师,之后就不需要编程了,但是要做好智能体,就要把工作流讲清楚。这里要有很强的逻辑性,模型要用提示词调试。随着大量智能理论的出现,这种工作需求也会飙升。这些工作机会的门槛一般都不高。如果你做得好,你也可以养家糊口。如果你做得好,你的上限可以是年薪百万。


自从人类文明诞生以来,我们DNA就刻下了永无止境的创新。人类不断创造各种工具来改变现状,提高生产力,从石器时代的手斧到移动时代的手机,再到人工智能时代的大模型。但是它们永远只是工具,只有在被人类使用时才有价值。人工智能并非人类的竞争者,我们坚信人工智能。为满足人们的需要,提高人们的能力,使人类的生活更加美好,我们构建和应用人工智能技术。


谢谢大家。


本文来源于“腾讯科技”,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com