“养虾”热潮后,AI Agent如何实现进阶跃迁?
本文来自微信公众号:秦朔朋友圈,作者:汪潇
近几个月,中国AI领域最具戏剧性的事件,并非发生在实验室或资本市场,而是聚焦于一个原本带有极客属性的开源项目。
一只“龙虾”(OpenClaw)突然走红!它点燃的不只是流量,更催生了新的预期:AI或许已不再局限于“会说”,正逐步迈入“会做”的新阶段。
但值得深入探讨的,并非OpenClaw的热度,而是它所代表的意义——是否意味着人们口中的Agent时代已然来临?
若用一句话概括当前AI Agent的演进阶段,大致可分为三类:
第一类是Copilot,核心在于“懂你”;
第二类是API Orchestration(接口编排),核心在于“替你”;
第三类是AI-native Agent,核心则在于“先于你”。
关键在于,“先于你”并非单一功能点,而是一个结构性问题。
OpenClaw为何突然爆火
首先,它精准击中了中国市场对“单人能力放大器”的强烈需求。企业追求降本增效,个人探索超级个体路径,地方政府寻找“AI+”新抓手,平台挖掘新分发入口,OpenClaw恰好处于这些需求的交汇点。它让人们首次直观感受到:AI不仅能陪聊、写文案、作图,还能代整理邮件、调度日程、串联工作流,不再只是“会说话的模型”,而是“开始会办事的代理人”。

其次,它的传播方式具有鲜明的中国市场特征。并非通过宏大发布会出圈,而是以“是否可用、是否有价值、能否帮忙干活”为核心扩散。安装服务、教程、云端接入、企业试用同步出现,说明这类产品的普及并非始于概念认同,而是源于实际动作的价值。
第三,它让人们首次意识到:AI的价值不在于提供答案,而在于执行动作。过去两年,大模型的典型模式是“你问我答”;OpenClaw则向前迈进一步:“你说我办”。前者是经验输出,后者才真正接近生产率工具。
然而,近期出现的流量资金消耗、动作失误、敏感目录访问、数据泄露、越权访问及被攻击风险等警示报道,反映出三个核心问题:
第一,安全问题已从模型答错升级为真实动作失控;
第二,AI越具备办事能力,越需要明确边界;
第三,开源繁荣与社会治理之间的张力已提前显现。
因此,OpenClaw的爆火不仅是工具走红,更是一次认知转变——AI下一轮竞争的核心,不再是模型“会不会说”,而是能否真正替人调动系统与现实世界。
为何说OpenClaw属于第二类
许多人看到OpenClaw能调用邮箱、日历、浏览器、系统,便将其归为“真正自主智能”。
但更准确地说,它属于第二类,即API Orchestration/接口式编排范式。
第二类AI的本质并非创造新能力,而是重组既有能力。用户觉得它“全能”,并非因为它自身无所不能,而是它将分散在日历、邮件、支付、浏览器、数据库及工具链中的能力,重新整合成更顺畅的动作链。
因此,第二类AI给用户的核心体验是:更省心、更全能。
OpenClaw、Manus、CoPaw同属第二类,但分工各异:
OpenClaw更像“开放编排层”,擅长连接聊天入口、工具、模型与系统,本质如同底盘或接线板;
Manus更像“第二类产品的完成态展示”,将任务拆解、工具调用、执行过程可视化,让用户直观感受到“AI真的在替我工作”;
CoPaw则更像“平台型工作台”,强调多渠道接入、模块化、可控性及本地/云部署,如同工程化的个人agent控制台。
三者结合,指向第二类AI的下一步关键方向:不仅要更擅长替用户做事,还要让用户能透明、可视地了解“它如何替你做事”。
为何这一点至关重要?
一旦agent真正连接系统、执行流程、发起动作,用户自然会追问:它调用了哪些系统?哪一步经过授权?哪一步是自主判断?出错后如何回退?
Manus更容易被理解,正是因为它将“替你”的过程做得更可见。
因此,第二类AI成熟的标志,不仅是“替你做事”,更是让做事过程可视、透明、可追溯。
第三类AI在哪里
若说OpenClaw让我们看到第二类AI的具象化爆发,MiniMax则代表了中国企业中最具野心的尝试:从模型公司转向平台公司,逐步逼近第三类AI-native Agent。
MiniMax最值得关注的,并非产品线,而是对自身定位的清晰认知。
闫俊杰的几句话颇具关键意义:海螺AI这类智能助手“其实没有明确定义”“我们的产品都是试出来的”;他提出MiniMax要从模型公司迈向“AI时代的平台型公司”,并将平台价值概括为“智能密度×Token吞吐量”。
这些表述清晰传达:MiniMax深知行业形态尚未稳定,单靠用户数无法定义未来,其核心目标是打造可持续输出智能的平台。
为何说它在逼近第三类?
第一,主动性萌芽已现。Talkie/星野等产品不再被动等待指令,而是主动发起问候、调用长期记忆,并根据用户情绪与上下文调整互动;
第二,走全模态路线。同步发展语言、视频、语音、音乐能力,表明它不满足于文本对话层,而是要构建更完整的智能底座。闫俊杰明确指出,多模态融合是持续提升智能的基本前提;
第三,将自身作为AI-native组织试验场。内部agent覆盖近90%员工日常工作场景,员工正从“教Agent工作”转向“观察Agent工作”,说明AI在MiniMax不仅是产品,更是一种组织方式。
但为何说它尚未达到第三类?
因为第三类AI的真正成立,不仅需要“更主动”,还需跨越三道坎:
第一,主动性深度不足。当前MiniMax的主动性多局限于场景内,如主动问候、延续对话,而非目标驱动的主动发现;真正的第三类AI应能基于用户状态、日程、行为变化,发现未显式表达的需求;
第二,缺乏现实行动闭环。MiniMax的亮点仍集中在虚拟空间的认知增强与内容生产,而第三类AI的关键在于能否跨平台、跨系统、跨现实动作形成闭环;
第三,未完成2C底座构建。真正的第三类AI不能“裸奔”,在消费场景中需建立在法律规则、伦理边界、平台制度、个体授权与风险治理之上。MiniMax已意识到这一点,明确提出“构建完善的2C底座,是向更高阶AI Agent演进的必经之路”。
因此,对MiniMax最准确的评价是:已具备第三类AI的技术前兆、产品倾向与组织意图,但尚未完成主动性深度、现实行动闭环及社会化底座整合的要求。
MiniMax与Kensho:一个在逼近第三类,一个更接近第三类的局部现实
若为MiniMax寻找更具启发性的对照对象,Kensho是合适选择。
因为Kensho更贴近第三类AI的定义——其价值不在于更会聊天,而在于在高价值垂直场景中整合多源信息、发现人类未显式提出的问题,并在边界内执行动作。
这也是两者的核心差异:
MiniMax更像通用能力平台向第三类AI逼近的冲刺者,优势在于覆盖更广泛的用户群体与通用agent场景;
Kensho则像垂直高价值场景中的“第三类局部完成态”,虽未必有更强的大众产品认知,但在特定行业中更接近“主动发现问题+边界内行动”的核心。
换言之:MiniMax是“面向第三类的通用冲刺者”,Kensho是“垂直场景中更接近第三类的先行样本”,但两者面临共同的核心问题——不能仅靠模型和agent本身立足。
当AI从“替你做”走向“先于你发现并行动”,都会遇到同一个根本问题:谁来托底?
对MiniMax而言,托底是2C底座——需明确能做与不能做的边界、二次确认的场景,以及隐私、财务、伦理、未成年人保护等规则;
对Kensho而言,托底是行业底座——在金融复杂决策场景中,需建立在规则引擎、数据治理、知识图谱、权限控制、风控与审计之上。
因此,尽管MiniMax与Kensho分属通用与垂直赛道,但最终指向同一结论:第三类AI不是模型问题,而是底座问题。
结语:真正抵达第三类,还缺什么
OpenClaw让我们看到第二类AI的爆发,MiniMax让我们看到第三类AI的轮廓,但从第二类到第三类,缺失的不仅是更强的模型,更是更完整的结构。
这个结构至少包含四个要素:
第一,更强的行动能力。并非更长的上下文,而是更稳定的工具调用、搜索、记忆、计划与多agent协同能力;
第二,更深的系统接入能力。第二类AI不会被第三类取代,反而会成为其前提——没有API Orchestration,第三类AI只能空转;
第三,更成熟的2C底座或行业底座。消费场景需法律、伦理、授权与风险治理;高价值垂直场景需规则引擎、知识图谱、风控与审计;工业场景则需整合工业物理、工艺规则、设备状态、管理逻辑与权限控制的“泛工软平台”。没有底座,第三类AI只能“聪明”,无法“可靠”;
第四,从“规则触发”走向“认知驱动”。不仅是更积极主动,而是能在持续互动中发现问题、提出用户未说出口的需求,并在边界内采取行动。
这就像选择伙伴:是需要一个能说会道、调动情绪的陪伴者,还是一个踏实做事、始终可靠,能及时发现并解决问题、形成价值互补的伙伴?
也就是说,真正的第三类AI,不是更自动化的工作流,也不是更会聊天的助手,而是一种新的行动基础设施。
因此,看待OpenClaw不应只关注热度,看待MiniMax不应只关注估值与产品线,更应看到这条清晰的进化链:从懂你,到替你,再到先于你。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




