Agent大厂混战:复制Manus的野心和困境

05-09 09:07

当Manus的创始人肖弘直言“商品没有秘密”时,大公司陷入了技术复制和流量竞争的多重焦虑。据光锥智能报道,目前很多大公司都在内部设立了一个产品团队来比较Manus。据悉,至少有五个不同的团队正在开发智能产品,因为他们擅长内部赛马的字节。


Manus发布一个月后,大厂商先后交出了智能体的答卷:字节跳动的“纽扣空间”以裂变推荐码席卷职场,阿里的“心流”用更长耗时的任务塑造研究深度,百度的“心声”用医疗法律的垂直情景突袭手机。


但是在这个看似繁荣的通用Agent发布潮的背后,却隐藏着一个尴尬的现实。—— 所有产品仍然没有突破现有Agent的能力边界。


从去年Agent平台的无人问题开始,到今年60分的答卷。可以肯定的是,Agent已经跨越了通用Agent的1.0阶段,通过规划和工具能力进入了自主Agent的2.0阶段。


目前,聚集发布的Agent已经能够初步担任“见习生”的任务,处理人类日常生活中耗时且难度较低的任务:比如根据用户的需求收集一些信息,通过大量的信息分析,给出一些用户可以筛选的观点。例如,帮助用户完成基本操作,选择职位发送简历,并给目标发送电子邮件等。


这场围绕Agent的流量入口竞争只是2025年Agent爆发之年的一个注脚。除了大型公司和应用企业,更多的玩家正在参与:


今天,联想还发布了面向个人用户的“天禧”智能体和面向企业的“享受”智能体。其中,个人智能体“天禧”以自主操作和记忆互动为卖点,并配备其四款产品。除了独立完成订单、策略等操作外,还可以根据用户的喜好和习惯给出匹配的预算和喜好推荐。


智能体对抗在大厂倾尽资源的攻击下,现在已经到了什么阶段?


Manus批量复制,谁能占用流量入口?


四月份,通用Agent成为大厂发布会和产品更新的关键角色。


首先,字节在4月18日发布了通用Agent产品的“纽扣空间”,并推出了免费测试,以每人5个推荐码的裂变方式,率先占领市场;4月22日,阿里的AI助手“心流”推出了先进的研究功能,主要推出了类似OpenAI的智能体DeepResearch报告研究;然后,在4月25日的开发者大会上,百度正式宣布了智能体的“心声”,专注于医疗、法律、绘本等多种适应生活场景的任务感受。


经过DeepSeek之前的冲击,如何借助完善产品引流,也成为智能体接下来上线时需要考虑的问题。


目前,大型工厂大多处于字节和百度等内部团队自主研发的方式。然而,早在Manus点燃市场热情的时候,阿里就已经讨论了与Manus的合作。目前,除了发布自主研发的产品流量外,阿里的大模型团队通义千问早在3月份就决定成为Manus中文版的专属模型支持者,首先在模型合作中获得份额。



但是,对于强调AI自主研发,从大模型研发到应用产品的百度、字节、阿里这三大厂商来说,也有必要借自己的能力去开发智能体。


聚集在一起发布的Agent,各自的产品思路不同。


“纽扣空间”字节定位"精通各种技能的见习生",给出的各种案例更像是工作助理,比如生成行业报告,用户调查分析等等。


光锥智能测试结束后,我觉得纽扣空间是一个比较全面的合格产品。它不仅接入了高德等MCP,还借助工具提高了使用能力。它还在报告导出中图文并茂,具有突出的多模态能力。然而,在导出报告的内容深度上,还有进一步优化的空间。



相比之下,阿里AI助手“心流”推出的先进研究功能更接近深度研究的使用场景。在多次测试过程中,心流的显著特点是消耗更多的托克资源和更长的时间。比如在“智能体研究”任务中,心流处理时间超过一小时,浏览网页的总数明显超过其他两款产品。


大量的资源和牺牲效率的方法,换来了更深层次的内容,这就是为什么心流只能依靠审计制度来申请测试。大规模开放是目前计算率消耗和成本难以平衡的问题。然而,在目标选择的准确性方面,心流的表现一般。比如在智能体报告中,它选择的产品大多是大型AI助手,将7500万Manus融资的信息误放到了按钮空间的分析中。



与字节和阿里的通用Agent相比,它选择在PC端上线,而百度的心声则选择在手机App端上线,然后在PC端上线。


不同的智能产品终端决定了两者面临的受众差异:计算机终端大多面向需要工作和学习的用户,专注于报告研究和内容分析的行业;移动客户希望感受到AI在现实生活场景中的各种功能。


结合百度在医疗、法律等领域的优势,以及百度过去在AI虚拟社交方向的探索成果,最终的上线方式成为了以垂直场景为主的场景。


目前,心跳App的主页推荐了包括AI相亲、旅游规划、医疗/法律咨询在内的感受推荐。经过实际测试,心跳在医疗、法律等问题上的准确性更高。比如在回答酒驾撞人逃逸的问题时,心跳调用了几个Agent,最终给出了量刑7年的结果,这也符合现实中律师的意见。



然而,在其他没有垂直知识储备的业务中,声音的准确性需要继续提高。比如在要求旅游目的地推荐的任务执行中,声音明显推断地点不在朝阳区,但仍推荐不符合用户设置要求的景点。


结合三个通用Agent的评价结果,目前大部分大厂梯队的AI智能体只能用来完成一些基本水平的工作,能力还没有达到Manus那样的亮眼效果。


但是,在短期内,大厂商交出的答卷,已经让市场客户慢慢对智能体的概念产生了兴奋和好奇。


无论是字节还是360的Agent,服务器最近都在大规模开放测试中崩溃。可以说,即使是计算能力充足的大厂商,其消耗也远远超出了发布的预期。


在智能体赛道上,不仅有互联网厂商和初创公司参与,而且有智能手机和电脑的企业凭借硬件优势也盯上了智能体的前景。


今天,联想在新闻发布会上发布了面向个人的智能体“天禧”和“乐享”公司的超级智能体。对于个人来说,其智能体已经能够完成各种独立操作,如提供旅游建议、制定行程和下单。


面临着“智能体”这块肥肉,各家虎视眈眈。


Manus还没有被超越,但是技术红利还能吃多久?


2025,被称为“Agent时代”的大厂和创业公司,都在自己的能力范围内拿出答卷。


然而,目前三大厂商推出的产品反映了一个残酷的现实:即使大厂商有生态和计算率,复制Manus也不是短期内能完成的事情。



他的创始人肖弘在Manus发布之初就给出了自己的看法:Manus没有秘密。


“从产品经理的角度来看,如果你想使用它,你必须使用最好的大模型和最好的东西能产生多少商业价值。产品经理关心这个。”肖弘说。


Manus的核心能力是基于模型能力的溢出,但是在最早建立市场理解的时候,Manus在模型能力调用和产品思维方面做到了极致:


首先,Agent需要同时处理多模态理解、复杂推理、代码生成等多样化任务,这对底层模型的综合调用能力提出了极高的要求。目前市面上能看到的大部分通用Agent都采用了不止一个大模型,而是根据不同的需求调用多个模型。例如,如果您需要了解图片内容,您将调用具有强大多模态能力的大模型。


以字节为例。根据LatePost的晚点报道,当纽扣团队开发纽扣空间时,他们考虑优先使用它们。 DeepSeek-R1,经过测试,发现调用工具的能力不够。最后,考虑到能力和成本。我用了豆包。 1.5 Pro 多种模型是主要模型。


但是基于更好的模型能力,怎样将技术转化为客户体验也是一个挑战。


然而,每个公司提交的Agent都有不同的想法。比如在搜索体验上,百度的Agent产品使用了“多个关键词” “搜索引擎”策略,试图用多个关键词搜索,而智谱则让自己的AutoGLM在小红书、知乎等不同平台上思考搜索,打破了不需要应用数据成型的界限。


目前的技术格局在短时间内呈现出一种有趣的现象:Manus、以GensPark为代表的创业公司,在关键指标上仍然保持着领先地位。举例来说,GensPark在GAIA基准测试方面的表现已经超过了Manus。


相比之下,现阶段大厂推出的Agent产品更多的是“60分解决方案”,但与Manus目标相同,在通用Agent相对空白的阶段,大厂需要率先争夺部分市场。


技术性路线的差异直接影响到商业策略的选择,两类玩家正在走向完全不同的道路:


现在主流大厂仍然以免费战略为主导目标,试图撬开部分客户,字节、阿里、百度的商品都是免费提供的。


而且成本压力迫使初创企业更早开始商业化。现在,GensPark已经积累了10,000付费用户,其ARR(年度常规收入)已经达到2200万美元。而且Manus更是在海外市场给出了一个月39美元的基本版本和一个月199美元的高级版本,价格与OpenAI相当。



然而,从基础大模型到应用产品,目前技术优势的窗口期正在缩短,初创企业的时间并不多。


现在的大厂商不到一个月就交出了60分答卷。当新的通用Agent提高到70分和80分时,再加上免费策略,必然会对创业公司产生进一步的影响。


这场比赛的最后阶段还处于起步阶段,但是在通用Agent能力再次跃升之前,所有的对抗都只是2025Agent爆发之年的序幕。


本文来自微信微信官方账号“光锥智能”(ID:guangzhui-tech),作家:魏琳华,编辑:王一粟,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com