为何大模型不能取代AI? Agent ?

2024-11-19

OpenAI CEO Sam Altman最近在一次互动采访中提到,Agent可能会打破人类带宽的限制,Agent可以和用户一起完成项目,就像一个聪明的同事一样。Agent的商业价值是毋庸置疑的,但另一方面,越来越多的人担心Agent涉及的关键技术会因为大模型迭代优化而直接在模型层替代Agent的相关功能。


就技术图谱而言,大型模型是否可以取代AI? Agent?我的回答是否定的。


下面是最著名的AI图片。 Agent的技术架构图,描述了Agent需要具备的四个核心能力,我们将逐一讨论:



1.Plan(规划)能力。从技术上讲,规划能力似乎是大模型和Agent最重要的部分,尤其是o1系列模型发布后,因为推理有scaling。 law,而且数学能力有了很大的提高,看起来我们应该用大模型来规划自己的能力,但是事实上,AI有两个主要因素可以使用。 Agent规划能力的发展将不同于大型规划能力,其中,其核心是成本和响应速度


具体来说,最好的大模型一般都是最贵的,o1模型进一步增加了模型推理所需的时间。因此,在实际的商业场景中,实现大模型应用的ROI是一个非常重要的因素,通过工程模式减少对大模型参数和模型推理时间的需求。本质上是建立缓存系统可以使不同复杂性和价值的业务问题在适当的成本下得到解决,这就是AI。 Agent的规划能力与大模型规划能力最大的不同。


另一个因素是个性化部分,AI Agent的推理可以低成本地利用短期和长期的记忆来辅助决策,这使得Agent能够更有效地利用“系统1/快思维”机制来获得高质量的答复和响应,这也是Agent不同于大模型规划能力的地方。


2. 短时记忆/长时记忆(Short/Long term memory)。记忆是大模型本身不涉及的技术。记忆在应用中需要修改和解释。大模型将所有数据压缩到模型参数中,无法修改和解释。而短时记忆、情景记忆和过程记忆也是AI。 Agent可以用来实现低成本和个性化的一个非常重要的抓手。


3.工具使用(Tool Use)。大型模型有一个叫做function的功能-call,与AI 使用Agent工具的能力是相应的。AI 另外,通过“分而治之”的方式,Agent可以借助大型function-call的能力来扩大可调用的工具数量,AI 通过建立分层意图识别,Agent可以利用大模型的规划能力进行意图识别和分类,然后在第二层目标处理中,进一步利用大模型的function-call能力,从而实现工具选择能力的倍增。


比如在电商的智能客服场景中,我们可以分为三类场景:售前/售中/售后。每个场景都配备了不同的工具。然后,在多轮对话中,我们可以区分客户的需求是什么,然后进一步规划和使用工具,从而满足更多样化的场景需求。


4. 行动(Action)。目前大模型直接执行行动的能力仍然较弱,本质上是与环境互动的能力较弱。所谓的Computer-use、Phone-在use场景中,在关键的OSWorld测试集下,目前最好的大模型只有15%的准确率,与人类平均水平的70%的准确率相差甚远。因此,Agent将有一个特殊的验证和调试模块,以确保行动执行的准确性和安全性。这里的核心是环境模拟能力,这也是Agent和大模型不同的技术路线之一。


大型模型和AI Agent完全属于两个不同的类别,一个是思维系统,一个是行动系统,所以不会因为大模型的迭代优化而在模型层中取代AI。 另外,Agent的功能。AI Agent拥有自己的品牌价值和技术体系,可以沉淀相关的比较优势。



图片来源:澜码科技


请参考下面的架构图,这些是AI。 Agent和大模型最大的区别。



图片来源:澜码科技


AI Agent是由领域驱动的,其中一个核心概念叫做“信仰”,即判断什么是真实的,什么是有价值的。比如图书馆里有很多书。如果两本书在知识上有矛盾,中国作者写的是正确答案,还是美国作者写的是正确答案,会对读者的后续规划行动产生完全不同的影响。


在AI Agent进入具体的公司需求场景。面对具体的业务决策,在获得业务反馈后,如何总结出适合这家公司或专家的信念体系,即AI? 核心功能Agent。在我看来,AI最能体现出来。 Agent制造商的核心能力是如何有效地将大模型能力和企业内部的私域知识/数据结合起来,以最高的ROI方式服务企业的项目需求。



本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com