人形机器人“论斤卖”

2024-07-09

「桌面有点乱,请帮忙清理。」


"好的,桌面正在为你清理。"


听到指令后,“青龙”一边回答,一边慢慢抬起双臂,慢慢轻轻地用双手抓起桌面上混合的面包和水果,分类放在左右两个篮子里,即使是柔软的面包也不会变形。这款“青龙”人型服务机器人在人形机器人与具体智能发展论坛上展示,不仅具有识别思维能力,而且身高185cm,体重80KG,在机器人行业也是一个妥妥的“型男”。


从国内外众多机器人企业展出的“十八金钢”,到这些论坛,我们可以想象机器人的发展前景。人形机器人和智能将成为2024年世界人工智能大会。(WAIC 2024年是名副其实的“顶流”。根据主办方的数据,本次会议共展出了25多个人形机器人。热门的人形机器人跑道正处于商业化转型的关键时期。


但是冷静下来思考,人类机器人的发展仍然面临着许多挑战,上海人形机器人制造创新中心首席科学家江磊表示,目前人形机器人面临的问题可以概括为“一高五难”,硬件门槛高,软件算法难,软硬解耦难,知识储备难,人才聚集难,安全应用难。


人形机器人和身体智能目前的发展现状如何?什么时候可以商业化?如何让人形机器人遵循“机器人三大定律”?带着这些问题,进入WAIC 2024年人形机器人“世界”。



1 人形机器人应该“论斤卖”


由控制器、传感器、精密减速器、交流伺服电机等核心部件组成的人形机器人,每个部件都需要丰富的成本。


基于Macquarie Research在2023年发布的报告显示,目前人形机器人硬件总成本约为50,000美元。其中,端到端AI软件的大脑、传感器和芯片、伺服电机和电机驱动器都需要10,000美元,惯性测量单元和扭矩传感器需要5000美元,精密减速器需要8000美元,电池和电池控制系统需要2000美元,其它部件需要5000美元左右。


Yosi以色列智能机器人中心主席 在人形机器人前沿论坛上,Lahad表示,为了大规模选择人形机器人,其成本需要降低到2万美元以下,低于目前成本的一半,甚至可能需要改变机器人的外观,比如仔细考虑模仿人类腿部底座的设计。而且特斯拉预计明年将大量生产Optimus,预计成本将控制在10,000美元左右,预计售价2,000美元。


相比之下,国内人形机器人的售价已降至10万元以下,宇树科技于今年5月发布的最新人形机器人产品Unitreee G1,市场价格仅为9.9万元。”人形机器人将来应该像猪肉一样出售,我们一直认为。宇树科技创始人陈立在“国际人形机器人技术与应用发展论坛”上表示,除了R&D成本之外,人形机器人实际上是堆放铁、钢、铜等材料,随着零部件的量产,成本自然会降低。


根据《2024年中国人形机器人行业分析报告》,根据量产规模的不同,人形机器人的成本降低大致可以分为三个阶段:小批量生产1000台,成本降低20%~30%到10万美元左右;万台降低成本50%到5万美元;大规模量产数十万到百万台,降低成本70%~80%到2万~3万美元。有一段时间,大家都觉得人形机器人的商业落地就在眼前。


但是需要注意的是,Unitree G1和Optimus的区别在于没有搭载大型模型,如果按照智能标准来看,特斯拉的Optimus仍然可以作为行业的方向标之一。


2 费用不仅仅来自硬件


硬件是人形机器人最直观的成本,但是在降低成本方面不能仅仅依赖于硬件的量产。


我认为降低硬件成本不是一个主要问题,而是一个时间问题。设计和R&D的成本是人形机器人目前需要突破的成本问题。“聚焦国讯芯微董事长方婷婷在论坛上表示,国内人形机器人领域的许多核心技术都是从国外进口的,比如人形机器人模拟工具平台。


从人形机器人软件的形式来看,大量的跨学科内容需要软件结合,更多的相关行业企业需要抱团。人形机器人本身的制造商应该从设计之初就考虑软件和硬件的成本。


新精诚传感器董事长吴浩认为,一体化也是降低人形机器人成本的途径之一。比如在灵巧的手上,人类的手指可以感受到温度和力量,人形机器人的传感器也可以参考,将多模式的体验融入到同一个零件上,既可以降低成本,又可以减少体积。


什么应用领域会爆发人形机器人?在B端场景中,开普勒CEO胡德波认为,第一类是工业场景,尤其是工业场景,很难保证工人的安全,用工成本高,适合用人形机器人代替;第二类是仓储物流场景,可能是最快的落地场景之一;第三类是制造业,如3C制造、汽车制造等。业界对C端场景的应用已达成共识,人形机器人将走进千家万户,赋能养老育儿场景。


根据高盛最新预测,到2035年,人形机器人将呈爆炸式增长,出货量将达到140万台,全球市场总量(TAM)达到380亿美元。2030年,全球从事物流和制造业的人形机器人数将达到100万台,人形机器人有望在十年内进入服务、家庭护理、健康和教育行业。


3 5~10年迎来重大突破


现在的人工智能就像一个封在瓶子里的“大脑”,虽然会计算、思考,却不能付诸实践。身体智能是智能系统或机器通过感知交互与环境实时交互的能力。通俗的理解是,它为人工智能创造了一种可控的身体形式,包括四足机器狗、工业机器人、动物仿生机器人、无人驾驶汽车等。然而,人形机器人的类人形式无疑是具有智能的最佳媒介,可以更好地满足每个人的互动需求。


中国工程院外籍院士张建伟在人形机器人与身体智能发展论坛上表示,在开放、复杂、动态的空间环境下,实现身体智能需要完成三个维度的突破,即空间维度,实现二维、三维动态语义建模;时间维度不仅要简单移动,还要有操作和使用工具的能力;交互能力使机器人能够在知识、人和环境的基础上做出正确的交互行为。这个模型依赖于AI大模型。


仅仅依靠大模型来感知、策划还不能使具体实现真正的智能,加入“小脑”才能进行动作执行。


以“青龙”为例。名为“朱雀”的具体大脑以多模态大模型为核心,通过文本信息和图像信息输入,导出语音交互和任务决策信息。“玄武”小脑模型是一个具体的任务执行模型。轨迹规划模块由端到端模仿学习驱动,机载视觉输入以人类作业为模仿目标,输出大家期待的行动轨迹。运动控制器通过环境信息和机器人状态完成任务,基于强化学习的智能运动控制措施和全身动力学模型预测控制方法两种技术路径。


虽然AI模型开始“移植”到智能化,但效果并不理想。“青龙”机器人平台项目负责人梁振杰直言,目前模型还处于发展初期,功能还不完善,能力还需要提升。


宇树科技CEO王兴兴在论坛上表示,目前对整个世界的理解其实是非常糟糕的,包括时间、空间、物理定律等方面的理解。世界模型 身体智能是通向AGI的最佳途径。


上海人工智能实验室主任、首席科学家周伯文也认为,具体智能不仅仅是大模型加机器人的应用,更是根据物理世界反馈及时进化的大模型。


然而,对于人形机器人和具身智能未来的发展,业界仍然保持着积极开放的态度。“今后五年一定会有很大的技术突破,绝对不会超过10年。“王兴兴预测道。全国人形机器人创新中心总经理许彬也表示,将开放包括大脑、小脑和肢体在内的所有相关人形机器人的全栈技术。在人类家政清洁、交流护理等领域,经过5年至10年的应用。


4 最大的困扰是大规模信息。


无论是人工智能还是身体智能,数据都是灵魂般的存在。目前,人形机器人的主要信息来源是国外的开源数据,R&D机构通过动作捕捉和视觉捕捉自行收集。


然而,自我收集通常需要大量的人工成本来模拟演示。北京大学助理教授、银河健身智能联合实验室主任王鹤在人形机器人与健身智能发展论坛上举了一个例子。对于人类来说,把电池放在盒子里是一个非常简单的动作。特斯拉依靠40人采集团队进行远程操作,收集所有失效的案例,如倾斜、横倒、移位等。


目前,人形机器人的大规模信息是整个行业最大的痛点。"国家地方共建人形机器人创新中心R&D系统总监邢伯阳也表示。


面对这个行业的痛点,王鹤认为目前能够真正实现大规模量产的数据就是生成数据。所谓数据生成,就是算法生成的数据。虽然类似于真实数据,但并不直接来自现实世界。


通过生成数据的智能实现了从0到1的突破。在银河通用机器人训练中,发现二维传感器存在泛化问题,跳出训练数据后无法处理;三维传感器无法识别玻璃等透明物体。最后,银河通用机器人可以通过生成信息进行1000万场景的大规模训练,随意抓取各种物体。


邢伯阳代表的国家和地方共建人形机器人创新中心提倡通过数据开源共享海量数据。因此,通过社区和训练场的创新机制,打造Openloong开源社区,加快人形机器人、智能训练和数据建设。


5 不发展是最大的不安全性。


人形机器人不再是科幻小说中的想象,而是融入日常生活的现实。想象一下,未来,人形机器人会在繁华的城市街道上穿梭,在建筑工地、医院等地遵循系统指令,这将改变人们的生活方式和社会结构。伴随着这项技术创新,是对人形机器人治理的探索和挑战。


"高速铁路刚刚进入中国时,许多人担心电磁波辐射;早期的飞机、电话等发明也受到公众的担忧。人类进步的历史可以说是对科技发展的担忧。与规范人工智能行为的法律相比,我们应该制定促进人工智能发展的法律。“中国政法大学副校时建中在人形机器人法治与伦理论坛上表示,面对担忧,我们不应该过于焦虑,而应该对人工智能采取包容和谨慎的态度,这体现在培训数据容易获取、计算率与算法激励合作、内容错误生成、立即纠正错误等方面。


中国政法大学数据法治研究所教授张凌寒也表示,联合国人工智能高级别咨询机构成员,不发展是最大的不安全性,要全力推动人工智能的发展。


他说:“它就像一岁半大的孩子,需要我们的正确引导。华东师范大学人工智能金融学院院长、教授邵怡蕾表示,目前,在人工智能的加持下,人形机器人已经具备了感知智能和认知智能,最终需要克服的“堡垒”是行为智能。当人形机器人行为出现在人类社会时,它是对人类身份和法律的考验,不仅需要定义人形机器人的身份,还需要人类对其行为的引导和约束。


如何协调机器人与人类的互动?阿西莫夫的“机器人三定律”一度被视为基本规范。然而,随着智能时代的到来,这样的“约法三章”已经难以解决人机共生的复杂问题,需要一个新的法律治理结构。


在《东方法学》人形机器人法治专刊中,中国海洋大学法学院教授李晟表示,治理架构需要着眼于人形机器人与人类的差距,考虑当前发展阶段的应用问题,而不是人形机器人取代人类时的未来问题。


本文来自微信微信官方账号“IT时报”(ID:vittimes),作家:沈毅斌,编辑:孙妍,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com