智元宣布真机强化学习技术落地工业产线
11月3日,智元创新(上海)科技有限公司(简称:智元机器人)对外宣称,该公司研发的真机强化学习技术,首次从学术论文阶段迈向工业应用,目前已在与龙旗科技合作的验证产线中成功落地。相关第三方可验证的实验数据将在后续部署时公布。

智元展示了此次落地的真机强化学习方案。
真机强化学习(Real - World Reinforcement Learning)技术,是指让AI算法直接在真实物理设备上开展强化学习(RL)训练的技术。简单来讲,它能使机器人不只是在虚拟仿真环境中掌握策略,而是直接在真机上通过试错来学习最优行为。
国外多项学术研究表明,强化学习在工业机器人中的应用潜力巨大,但从仿真环境到真机,再到工业规模的稳定部署,仍面临诸多挑战。在机器人研究领域,目前大多还停留在研究阶段,尚未大规模应用于工业产线。
据悉,这项真机强化学习技术能让机器人在真实产线中自主学习、持续优化作业策略。新技能训练与稳定部署仅需数十分钟,且性能全程不会下降。在换线、换型或流线调整时,该系统只需进行最小的硬件改动和遵循标准化部署流程,就能显著提升柔性、压缩部署时间与成本。
智元机器人合伙人、首席科学家罗剑岚向澎湃科技(www.thepaper.cn)透露,目前这套方案已进入常态化作业状态,最大的突破在于其性能真正将AI模型部署到工厂中,实现了100%的准确率。在联调机制下,落地工业产线的故障率已被控制在产线验收范围内。
罗剑岚表示,工业产线较为保守,传统自动化设备在具有不确定性的场景下,很难同时兼顾高精度、高成功率和通用性,而真机强化学习技术能更好地解决这一问题。该技术约80%将应用于集中上下料与柔性换线环节。
长期以来,精密制造产线存在刚性瓶颈。传统机械臂依赖复杂夹具设计与场地改造,调试周期长、换型成本高;“视觉+力控”等柔性方案虽有改进,但存在参数敏感、部署复杂等问题,难以适应消费电子行业高频产品迭代的需求。
与传统方案相比,真机强化学习技术具备三大核心优势:极速部署、超高适配和柔性换型,可在不同工位和产品线上快速迁移与复用。其训练周期从“数周”缩短至“数十分钟”,效率呈指数级提升;能自主克服来料位置偏差、尺寸公差等扰动,在长周期运行中持续保持工业级稳定性与100%任务完成率。
不过,和仿真学习相比,真机强化学习技术可能面临成本高昂等问题。在成本控制方面,罗剑岚指出,真机强化学习技术的优势体现在两方面:显性成本上直接与产能挂钩,提高了生产效率;隐性成本上,具有高模块化、高柔性率的特征,在不同工序间切换十分便捷,只需进行极小程度的硬件调整。
罗剑岚强调,“随着经验的积累,这一系统在新产线上部署会更快,成本也会越来越低。”他还表示,这是一套可管理、可复制、可拓展的工具,未来会将其打造成通用模板进行推广,像搭乐高积木一样,从3C逐步拓展到汽车、家电、医疗等领域。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



