下一代入口对决:为什么大厂纷纷下注智能体?
智能体进一步改变了人机合作的范式:用户可以简单地发出指令,让智能体完成一系列复杂的任务,而不是主动操作工具。
随着Deepseek、Manus风靡全网,科技界的热点超过一半与大模型、智能体有关。
由视听、健康、生活、设备、创造、教育六大智能体组成的超级智能体,于4月22日在酷开春季发布会上正式亮相;
三天后的百度AI开发者大会,李彦宏连发通用超智能体心响APP、多种AI应用,如内容操作系统沧舟OS;
红杉AI峰会在5月中旬举行,预计将“智能体”列为核心话题,直言AI具有“云计算10倍”的市场潜力;
以及随之而来的谷歌I/O 2025、微软 Build 2025等开发者大会都提到了智能体,包括编程、医疗、金融等多个行业...无论是微软、谷歌、OpenAI等海外巨头,还是阿里、腾讯、百度、酷开等国内公司,还是以红杉为代表的资本机构,都开始大力推广智能体。
相应的问题是:到底什么是智能体,为什么“大厂”都在争夺智能体,又会带来什么变化?
01 智能体的“魔力”:下一个交互入口
在开始讨论之前,不妨花点时间了解一下“智能体”的概念。
英语AI是智能体 Agent,其中,Agent的含义包含了“代理人”的含义,使得智能体和对话AI有了质的区别:它不再局限于问答,而是一个能够深入思考、独立规划、做出决策、深入实施的智能应用。
情景并非不诱人。可以想要解决智能体爆红的原因,还要找到另一个角度——为什么企业和消费者需要智能体?
任何技术的普及,最重要的可能不是能力上限有多高,而是应用门槛有多低。如果只有工程师可以调用,专家可以配备,少数人可以理解,即使是最强大的能力,也只能停留在“实验室的奇迹”里。
对比大模型和云计算的进化过程:
大型模型的实践和推理需要巨大的计算能力和底层结构的提高,类似于云计算中的IaaS,提升了智能体的“发动机”,但远离业务和用户;
包括MCP工具、插件系统、开发接口等在内的大型平台能力和API封装,对应PaaS,为AI开发和调用提供统一的“工具箱”;
通过能力的整合、意图的理解和任务的执行,最接近用户和需求场景的智能体可以看作是SaaS的形式,提供了“即买即用”的智能。
以To 以B场景为例。传统的企业系统功能模块很多,界面逻辑也很复杂。通常,一个过程只有在接受系统培训并掌握业务规则后才能成功完成。公司投入了大量的时间和成本,只是为了“适应系统”。
当智能体具有理解、推理和执行的能力时,用户可以自动识别意图,调用系统资源,实现目标链接,并通过图表、文本或通知输出结果,而无需面对复杂的界面和理解系统的内部逻辑。从人适应系统到AI适应人的需求,生产力会大大提高。

再比如To C场景中的例子是,过去,如果用户想看一部电影,他们需要用控制器蹩脚地输入标题进行搜索。有时候想不起标题,就要先在手机上搜索关键词,看几十个链接找标题,几乎耗尽了看电影的心情。
如果是配备酷开超智能理论的电视,只需要用语音说“我想看什么电影”。即使不记得片名,也可以简单描述电影中的情节和人物,超智能身体可以了解用户的需求,拆解任务后,分配到视听智能身体搜索各大视频网站的内容,一步一步直接播放界面。即使在AIOT家居场景中,智能体在收到看电影的要求后,也可以自动进行灯光调节、窗帘关闭等操作。
还有许多例子可以找到。
智能体除了颠覆生产力外,还进一步改变了人机合作的范式:用户不需要主动操作工具,而是简单地发出指令,让智能体完成一系列复杂的任务。谁能成为用户需求的第一个接受者,谁就能掌握系统的调度权,控制资源配置。
对AI企业而言,智能体承载着下一个入口级机会,智能体的布局就是占据下一代互动的“控制权”。
02 三个“派系”在智能体爆发前夕涌现。
不可否认的是,目前的智能体还处于起步阶段。
然而,随着技术迭代和市场需求的融合,越来越多的企业参与其中。由于切入路径不同,基于自身的核心优势和资源优势,对智能体价值差异的理解逐渐分化出三个鲜明的阵营。
首先是标准意义上的AI制造商,如百度、字节跳动、谷歌、OpenAI等,试图主导技术生态的构建。
他们的玩法可以概括为:以大模型为基础,开放智能体的开发工具链和解决方案,吸引开发者在平台上构建各种智能体应用。目标是构建一个面向智能体时代的AppStore,让智能体像App一样被创造、调用和分发。
在这种理念下,智能机构不再是商品,而是一个新的“操作系统”,希望在“模型-开发-分发”的链接中扮演基础设施建设者和生态领导者的角色。毕竟,谁拥有最强大的开发平台和最活跃的开发者生态,谁就掌握了AI时代的“分配权”和“分配权”,可以说是最有吸引力、最困难的业务。
二是以垂直场景为主的企业服务商,如微软、IBM、阿里云等,正在开始构建企业级的智能体解决方案。
这个阵营大多来自云计算和公司业务领域,对行业的Know-How和企业结构有着深刻的理解。他们不急于打造“面向大众的入口”,而是选择从最现实的垂直场景入手,专注于智能体的交付能力和质量验证。
因此,在游戏性方面,我们专注于将智能机构的能力集成到企业原有的系统流程中,处理财务、销售、人力资源、仓储等商业模块的自动化和智能化问题。微软对此有一个大胆的判断:随着越来越多的智能机构加入,每个员工都将成为“智能机构主管”,负责建立、分配和管理智能机构,最大限度地发挥其能力。

三是深知客户体验痛点的软硬件制造商,如华为、联想、酷开、三星等,将智能体直接植入客户的“触点”。
成千上万的用户数量使得软硬件制造商长期处于用户体验的第一线,在满足客户需求、打磨软硬件、积累数据方面具有天然优势。智能体一般开始与终端设备紧密结合,用智能体处理用户体验的瓶颈。
一个直接的例子就是酷开,早在2014年就推出了具有AI功能的智能屏幕。2025年,“长记忆、快思维、秒行动”的标准首次为“超级智能体”提出:在客户使用过程中可以形成“体验库”,让模型更好地了解用户习惯,降低重复互动成本。同时,采用原子组件和多智能体的协同框架,将响应速度提高到1.5秒以内,满足终端用户对“更快、更准确、更直接”的感受要求。
上述分类可能不严谨,就像阿里在To一样。 C方向也有布局,酷开也在向B端市场发展。
之所以选择三大流派,是因为他们形成了智能体生态的三角形结构——平台、服务和体验,从技术生态、行业适应和终端场景出发,既有竞争,又有合作,共同推动了智能体从概念到落地再到大规模应用。
03 疯狂与理性并存,智能体的可能潮流
多种力量的共鸣,使智能体成为当前最具想象力的风口。但是历史经验告诉我们,风口和泡沫通常是齐头并进的。
Manus意外走红后,一线厂商迅速跟进,不到一个月就“加工”出同样的产品。热度下也隐藏着隐患:很多“智能体”只是对大型API的简单包装,缺乏任务安排、长期记忆等核心能力,看似智能,实则“看似无效”。
但是不能否认智能体。
每个新技术周期的起点或多或少都存在“泡沫先行”的情况。市场对概念的追求比技术本身的成熟更快,导致短期价值被高估,长期价值被严重低估。最后,在疯狂和理性的较量中,螺旋式进步。
在“概念清晰,路径不统一”的前一天晚上,我们试图从理性思考的角度,“猜测”智能体接下来的可能趋势。
垂直智能体将比通用体更早落地
一般智能体的问题一般在于“强而不专”。相比之下,在医疗、教育、酒店、制造等场景下,贴近业务、熟悉流程、目标边界明确、行业知识图谱的垂直智能体已经初步满足了“能上岗”的需求。
其中一个挑战就是:单个智能体能够胜任简单的任务,一旦任务链稍微复杂一些,就必须依靠多个智能体来协调。
比如在日常生活中,会涉及到旅游规划、美食推荐、酒店预订等任务。客户给出指令后,需要准确理解客户的意图,拆解需求,分配给不同的智能体完成。目前只有酷炫的超级智能体展示了家政服务的智能整合,其他大部分智能体还处于手动调用单个智能体对话的阶段。
当顾客提出“帮我规划一下,深圳五个家庭在深圳 3 智能体能与天气、交通、美食、酒店、景点、地图等服务一站式相关。,并制定详细的旅行计划,并直接选择合适的机票和酒店。可以直接扫码买票。
整合客户个性化意图识别、动态任务安排、多智能体协同等能力,或者将成为智能体马拉松的第一个赛点。
与软件相比,属于硬件的机会可能更大
目前关于智能机构的讨论主要是关于软件形式的重构:从工具到助手,从应用到代理。一个更值得关注的现象是,智能机构对硬件的影响可能远远大于软件。但当智能机构开始主导交互逻辑时,硬件本身就成了“服务入口”。
甚至可以预见:基于自然语言的交互,将重塑硬件的话语权,每个屏幕都可能成为“服务中心”。
智能音频也有类似的趋势,客户只关注结果,不关心智能音频播放哪个平台的内容。有了智能体的赋能,服务的交付权将进一步从APP转移到具有感知和理解能力的硬件:
电视、闺蜜机等。不再只是播放工具,而是一个家庭的AI监控中心;学习机器的能力不再局限于批准作业和在线课程。教育智能体的“长记忆”准确记录孩子的学习轨迹,“快思考”即时分析弱点,“秒行动”生成个性化方案,真正实现“定向推广”的AI教育范式...
值得注意的是,以上只是我们在研究了微软、联想、酷开、IBM等企业的智能体战略之后所得到的一些看法。
但可以肯定的是,智能体不会是单一的产品,而是技术、互动、服务模式的全面重构。AI行业的结构升级已经悄然开始,从通用大模型的“全能引擎”,到垂直智能体的“行业大脑”,再到硬件终端的“智能入口”。
04 写在最后
还有许多困难留给智能体。
通用智能体能否打破荒岛,形成可持续的开放生态;垂直智能体能否找到合适的应用领域,从样板房走向大规模布局;如何设置人机协同的界限,如何平衡数据安全和个性隐私,多智能体之间的协同机制是否能像现实组织一样高效有序...这些都是智能体必须跨越到产业主舞台的“能力障碍”。
如果这些问题一一回答,AGI将不再遥远。
借用红杉AI峰会的共识:AI时代的胜利属于那些既能深耕竖直场景,又能保持敏捷迭代,拥抱技术浪潮的行动群体。
本文来自微信微信官方账号“Alter聊天技术”(ID:spnews),作者:36氪经授权发布的张贺飞。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




