「若愚科技」机器人“超级大脑”的引入已经完成多智能体验证明 | 最前线

05-30 21:04

作者丨王沁


邱晓芬的编辑


近年来,AI大模型技术的快速发展在一些细分领域取得了与人类相当的成就,同时也促进了具体智能技术的发展。但通用AI大模型与具体智能行业大脑之间存在一定的行业gap,其核心是通用AI大模型对具体智能场景的区域适应性差。


因此,国内机器人公司通常需要在机器人领域开发自己的专用大脑。国内机器人大脑创业公司方兴未艾,位于深圳,依托哈尔滨工业大学(深圳)设立的“若愚科技”是目前国内为数不多的专注于多模式大型机器人大脑研发的公司之一。


36Kr最近了解到,若愚科技推出的若愚九天机器人大脑,完成了多模态大模型驱动下的群体智能,并通过无人厨房环境进行技术规范验证,驱动多智能体烹饪无人厨房。


通过人类自然语言与多个机器人的互动,完成从点餐到吃饭的全过程,独立规划“烹饪”的长序列任务。与目前市场上常见的智能技术不同,如果愚蠢的九天机器人大脑能够实现人类意图理解、高频人机交互、复杂任务规划等功能。


自然语言交互展示


比如,当人类提出“做一道炒生菜”的需求时,机器人可以独立理解人类的意图,规划任务,转化为“在食品区捡菜”、“在准备区称重”、“在制作区做饭”、“在消费区吃饭”等多个步骤。


另外,如果愚蠢的九天机器人大脑有一定的举一反三的泛化能力。比如训练模型的时候,我只是告诉它加大蒜,但是没有训练过加辣椒。但是,如果人们要求机器人加辣椒,他们可以自动理解大蒜和辣椒属于调味料,并知道它们应该在加大蒜的阶段被辣椒取代。


长序列任务计划(快速生成复杂任务计划)


据悉,若愚·九天机器大脑的另一大突破是,多模态大模型驱动的群体智能,赋予多智能体自主分工合作的能力。


简而言之,就是“一个大脑,多个身体”,多个机器人(包括机械臂和AGV)由若愚·九天大脑集中控制。


若愚科技首席产品官邓煜平告诉《智能出现》,在多个机器人高效协同执行复杂任务后,这些不同任务之间存在着复杂的依赖关系。例如,当两个机器人在烹饪时,另一个机器人去取餐具。如果烹饪时间因为菜肴生产过程的暂时变化而变长,另一个机器人可以在取餐具后决定继续选择下一种成分,而不是等待,从而提高效率。


这意味着机器人大脑会独立规划任务逻辑,同时保证合作的安全性。“但很难实现基于传统规则的教学方法”。


群体智能由大模型驱动(赋予多智能体自主分工合作能力)


此外,若愚九天机器大脑在控制机器人执行水平的小脑方面进行了技术优化。例如,针对环境感知的各种挑战,若愚技术开发了大型3D可供性感知技术,可供性地区感知物体的功能,可以在不注册的情况下抓取各种物体,抗复杂的光线和堆叠。


3D自动识别和抓取(无注册、堆叠、抗复杂光)


针对“机器人从调料盒里倒蒜末”、“用铲子从锅里倒成品菜”等复杂动作执行难度较大的挑战,若愚科技提出了模仿学习技术的扩散模型驱动,实现了复杂的技能和动作的精准执行。同时,结合多模式大模型驱动的机器人多臂协同技术,大大提高了目标任务的协同能力和执行效率。


传播模式驱动的复杂动作执行(无需现场示教,精确执行)


当前,全球具体智能大脑成果包括:谷歌人工智能团队PaLMM-E、RT-1/谷歌DeepMind团队RT-2/RT-X、Open Physicalal Intelligence等。


深圳若愚科技有限公司成立于2023年,孵化自哈尔滨工业大学(深圳)计算和智能研究团队。根据36Kr的报道,若愚科技今年3月完成了5000多万天使轮融资。



双臂合作大模型驱动(大大提高协作能力和效率)


若愚科技联合创始人兼首席执行官孙腾博士表示,若愚科技的九天机器人大脑和机器人小脑技术突破,可进一步应用于焊接、抛光、涂胶、物流领域的分拣、混合堆垛、商业领域的无人零售、无人药房、立体清洁等工业领域的复杂工序,未来可进一步延伸到消费领域。


附上完整的视频链接:https://v.qq.com/x/page2qji/a3551ly.html


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com