世界上第一个AI智能体「自进化」开源框架来了,一次安排,终身可用。

05-31 10:14

【简介】多AI智能系统的复杂构建和优化,长期以来一直是智能体处理科研问题和场景落地的瓶颈。英国格拉斯哥大学的研究团队发布了世界上第一个AI智能体自进化开源框架EvoAgentX,通过引入自我进化机制,打破了传统多智能系统在建立和优化中的局限性!


如今,随着语言模型技术的快速发展,各种AI智能体在科研和工业场景中得到了广泛的应用。然而,在实际应用中,构建一个高效稳定的多智能系统仍然面临许多挑战:从智能体选择、提示词调整到工作流设计,流程复杂,成本高。


更为重要的是,目前多智能系统一般都是「布署即固化」,缺少自我演变机制。


在调整目标时,开发人员通常需要手动修改提示词,重构系统结构,陷入困境「建筑-调整-重构」低效率循环,严重制约了智能系统的大规模落地。



项目地址:https://github.com/EvoAgentX/EvoAgentX

文档链接: https://evoagentx.github.io/EvoAgentX

EvoAgentX推出了世界上第一个AI智能体自进化开源框架,针对目前多智能系统应用建设和升级过程中存在的问题!


支持一键建设工作流程,用户只需提供任务目标或场景描述,系统就可以自动完成智能体配置和工作流程建设。


与此同时,EvoAgentX引入「自进化」机制,促使多智能系统根据环境和目标的变化,在实际运行中不断优化系统结构和综合性能。


开源平台旨在为研究者和工程师提供统一的实验和土壤部署,促进多智能系统从静态设计向动态演变,促进AI多智能系统从「人工调节」迈向「自主进化」的新范式。


框架介绍


EvoAgentX是一个以自我进化为主导的开源AI智能体研究框架,旨在构建一个开放、可进化的智能体生态,旨在探索具有自我优化能力的多智能系统。


项目亮点

EvoAgentX旨在打破当前多智能系统建设和优化的堡垒,从三个方面切入关键问题:自动化建设 自进化机制 系统评价。


EvoAgentX通过整合建模、执行和反馈链接,不仅使智能系统的构建更轻、更快,而且为其进化能力奠定了基础。无论是科研探索还是原型开发,都可以作为核心工具链,帮助用户高效验证战略设计和协同机制,加快多智能体能力「可用」迈向「可靠」。



智能体自动构建一句话:告别繁琐的手工设计


困扰:建立一个高效的多智能体工作流通常需要专业知识、复杂的设备和大量的人工控制,建造过程费时费力。


EvoAgentX方案:提供任务驱动的一键工作流生成能力,自动拆解任务,智能体配置和交互建模,显著降低系统建设门槛,加快实验验证和原型开发。


智能合作体不断自我进化:让系统「越用越强」


困扰:一旦建立了传统的多智能系统,就很难不断优化,不能灵活适应新的任务或变化的运行环境,严重依赖人工调节。


EvoAgentX方案:多维进化算法集成智能体提示词、工作流结构和记忆机制,实现AI智能体的不断自我提升,提高长期适应性和协同效率。


环境自动评估及反馈:灵活对接任务情景提供量化反馈


困扰:由于缺乏统一的评估机制,系统性能难以量化,升级方向不明确,实验结论难以复制和比较。


EvoAgentX方案:内置标准任务环境和评估指标,支持量化分析多智能系统性能,支持MCP对接情景工具实现垂直环境交互和快速反馈,为系统优化和科研实验提供一致可重现的检测标准。


自动化建设工作流展示


通过两个具有代表性的应用领域,研究人员系统地展示了EvoAgentX在构建多智能体工作流自动化方面的优势和适用性:


情景1:根据应聘者的PDF简历内容,从网上搜索并推荐匹配的职位信息



情景2:可视化分析a股股票



自我进化性能验证

EvoAgentX选择了三个有代表性的AI任务数据,包括多跳问答,以验证不同任务场景下的自我进化能力。(HotPotQA),代码生成(MBPP)和数学推理(MATH)。


在这些任务中,EvoAgentX从提示词生成策略和工作流结构设备两个方面继续迭代优化系统性能,基于预设的初始智能系统,结合其自进化机制。


在推广过程中,智能体可以基于大语言模型。(LLM)反馈及任务执行结果,动态管理提示内容及工作流拓扑结构,实现闭环自我完善。


提升前后系统在各项任务中的表现如图所示,清晰地展示了自进化机制在提高智能系统整体效率方面的作用。



测试数据显示,EvoAgentX 在多跳问答(HotPotQA)、代码生成(MBPP)和数学推理(MATH)三类有代表性的任务都实现了稳定而显著的性能提升,平均提升幅度高达 8%~13%


这个结果不仅证实了它在跨任务场景中进化机制的普遍适应性,而且进一步证实了它 EvoAgentX 建立一个可持续优化的多智能系统,显示出强大的泛化能力和工程实用价值。


值得一提的是,目前的优化还没有充分利用框架的所有潜力。随着未来战略优化、模块拓展和生态协作能力的不断增强,EvoAgentX仍然有着广阔的性能提升和应用拓展空间。


实践应用


为进一步验证 EvoAgentX 该框架还提升了GAIA基准测试中现有的多智能系统,具有优化当前AI智能体工作流的优势,涵盖了GAIA排行榜中开源和可再现的代表性多智能系统框架:Open Deep Research


这个框架是由Huggingface团队开发的一个多智能系统,可以实时在线搜索和回答问题。EvoAgentX基于这些智能体的原始结构,自动优化其提示。


GAIA基准测试验证集优化后的性能如图所示:



根据优化后的实验数据,EvoAgentX可以在不同的基础系统中带来稳定显著的性能提升,进一步验证了该框架在提高当前智能体通用性和任务适应性方面的实际效用。



完整的报告和实验细节:https://github.com/eax6/smolagents


框架架构

EvoAgentX构建了一个由多个功能层组成的模块化结构,包括从AI智能体的底层部件到进化系统的完整链接,以支持AI智能体的不断优化和自我演变。该系统的整体结构如下:



总共包括EvoAgentX的结构:


基本组件层:提供基础模块、日志管理等框架运行的通用能力支持,确保系统具有良好的适用性和可扩展性。


智能体层:用于定义AI智能体的核心功能和外部交互能力,包括构建AI智能体的关键模块,包括大语言模型、记忆模块、动作执行部件等。


工作流层:构建和管理一个面向复杂任务的多智能系统,包括工作流图、智能体管理等部件,适用于多阶段、多任务、多角色的智能体任务。


进化层:专注于AI智能系统的优化功能,为智能体提示、工作流结构和记忆机制提供多维优化器,帮助AI智能体的不断进化。


评定层:为AI智能系统提供灵活的性能评估机制,支持可定量评估AI智能系统的有效性和泛化性。


期望和愿景


EvoAgentX团队认为,AI不应该依赖于复杂的人工控制,而应该是可能的。自我感知需求、动态规划目标、持续迭代策略智能伙伴。


该团队致力于构建一个真正具有自主进化的AI智能体生态系统。


在这个生态中,每个智能身体都有能力根据任务自动构建和改进工作流程和策略,并通过开放协议实现经验和知识的全局共享。


EvoAgentX将通过开源社区的协同进化机制,重新定义AI系统的开发模式:开发者可以自主生成实施并持续优化方案,无需从零开始构建复杂的工作流程,只需给出目标;科研客户可以实时获得生态学中最新进化的智能体能,而不受静态AI模型的限制。


这种「需求是指令,使用是进化。」通过这种方式,每个参与者的实践反馈将加速智能体的智能增长,突破当前AI系统的能力边界,使智能体能够独立拆解复杂问题,动态重组技能模块,并继续反馈学习。


它是通往可持续智能未来的唯一途径:自进化AI智能体的使用越聪明,共享越强大,最终将成为赋能各行业创新的进化引擎。


将来里程碑

EvoAgentX将逐步推进以下关键里程碑,以实现上述愿景:


阶段一: 工作流自动构建和模块化部件集成


构建和持续优化一键生成多智能体工作流功能;


AI智能体模块集成典型任务模板;


提供可视化的工作流图结构展示和编辑界面;


为了支持快速器重和复合任务的构建,不断扩展开源组件库。


第二阶段:多维自进化能力和反馈学习机制


AI智能体自进化算法集成提示词、工作流结构、记忆模块等维度。


引入性能反馈驱动的战略优化机制


在多项任务执行中,支持系统进行自适应提升。


提供任务间迁移能力和进化路径记录机制


第三阶段:开放智能体生态与协同进化机制


为开发者和研究者构建智能体和工作流。「市场」,支持高质量的智能体模块上传、共享和复用,提升工作流程。


支持用户将当地推广结果(如优化提示、结构设备、策略方案)上传到生态系统,实现系统级协同进化。


建立跨任务、跨客户的进化轨迹跟踪和知识融合机制,让每一次实践反馈都能反馈整个生态系统。


设计开放协议和标准界面,促进智能体能共享和经验迁移的生态循环。


参考资料:


https://github.com/EvoAgentX/EvoAgentX


本文来自微信微信官方账号“新智元”,编辑:LRST 好困,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com