参观世界机器人大会后,投资者表示再也不想投资人形机器人了。

08-30 15:24

在过去的一周里,我们似乎可以在世界机器人大会上看到世界各地的机器人,600多个相关展品几乎覆盖了机器人的所有产业链。


机器人的种类也令人眼花缭乱,如“上蹿下跳”的机器狗、整齐划一的“摇曳”机械臂、不散酒的“送餐专家”等。


无论是机器人数量还是热度,人形机器人都可以称之为“C位”。据官方介绍,这是人形机器人数量最多的会议,现场几乎有一半的观众集中在人形机器人企业的摊位上。


这类人形机器人又高又胖又瘦,从加速进化的“小”型Booster,只有110cm T1,有185厘米的“壮汉”青龙机器人。每个机器人都有不同的机械臂形状、电池位置、面部形状甚至移动方式,但他们都在努力表演“绝招”。


在武术方面,他们可以咏春、搏击、跳“海草舞”,甚至可以在有钢管的地面上优雅地跑步。论文可以写毛笔字,还可以做饭、洗衣服、叠衣服。在多个摊位上,每个人似乎都学会了所有的机器技能,所以他们等待在工厂工作或去客户家服务。


(星尘智能Astribotribot S1跳海草舞)


(CL-1逐际动力上坡)


但是,一位长期关注人形机器人赛道的投资者在参观完展览后,对腾讯科技表示:“我一个都不想投票。”


理由很简单:他们现在既“无用”又“相似”。


比如工业场景中的人形机器人,主要任务是挑选和小规模运输和移动,但是现有的传统自动机器人已经有了非常成熟的解决方案,所以做人形机器人意义不大。关注家庭场景的人形机器人的主要任务是烹饪、折叠衣服和烹饪。虽然每个机器人在这种场景中的完成率都不一样,但投资者说:“你能做的对手也能做到,没有不可逾越的差距,只是时间问题。”。


据腾讯科技不完全统计,共有28家人形机器人企业参加了会议。除了科研,每个公司产品的服务场景大多集中在工业或家庭场景上。


腾讯科技不完全统计:世界机器人大会人形机器人公司名单|按首字母排序


从腾讯科技的统计可以看出,这些机器人的机械性能差异很大,比如自由度、峰值扭矩等数据,最多可以有5倍的差距;单看移动速度,最快的一级可以达到7公里/小时以上,而慢的只能达到2.5。km/h。但是从软件基础-大模型的角度来看,每个家庭都很难拉大差距。


而且这应该是今年人形机器人最大的亮点。


与特定使用的工业机器人相比,“人类”机器人的设计实际上并不高效。它最大的优点是可以在人类社会中实现更多的“通用性”,即人类不需要为了方便机器人的运行而专门改造环境,人类的手和腿可以到达的地方也可以使用人形机器人。


而且实现“通用”的关键在于拥有足够强大的通用模型。


对于这个投资者来说,展会软件突破有限的人形机器人已经让他感到审美疲劳。“现在能让我眼前一亮的大概就是真正具备泛化能力的机器人。”比如一个会拖地的家庭服务机器人,可以主动去房间铺床,做工作,不用主人的发号指令。腾讯科技与很多关注机器人轨道的投资者进行了交流。他们普遍认为,作为一个人形机器人,硬件本身并没有真正的堡垒,软件是一个难题,因为它决定了人形机器人的泛化能力。只有具备强大的泛化能力,人形机器人才能在各种任务场景中工作,更接近“实用性”。


但是通向AGI是一个很好的理想,除了奔向远方,还要结合当前的技术标准由浅入深。


尽管今年的人形机器人跑道让VC们略有失望,但是与往年相比,我们发现这条赛道实际上有一些新的变化值得关注。


1 人形机器人的“表情图”执著?


假如未来的人形机器人想要实现真正的情感陪伴,它的“面部”和“表情”将变得极其重要。


日本机器人学者、ATR石黑浩特别研究室室长石黑浩认为,“随着我们接触到越来越多的机器人,我们可能会逐渐接受生动的机器人,依靠它们来满足我们未来的护理和其他需求。”


海银资本创始人王煜全也有类似的看法。他曾经告诉腾讯科技,机器人不需要像人类一样拥有双脚,但他们可以像人类一样拥有一张可以作为表情的“脸”。有了这种能力,机器人可以更好地做迎宾接待和陪伴,这是一项需要与人类交流的工作。


关于人形机器人是否做“表情”,有两个派别:“抽象派”和“仿生派”。前者提倡用抽象符号传达表情,表达情感交流。后者提倡让自己的脸无限接近真人,希望通过激发“肌肉”的力量,能够像人类一样驱动自己的面部情绪。


在WRC 在2024年,我们观察到,除了主流的“抽象派”之外,更多的“仿生派”开始进入市场,这类机器人可以制作各种“表情图”。


EX集团是国内仿生机器人企业的典型代表,去年EX集团将“李白”、今年,“杜甫”带到了世界机器人大会上,再次成为“苏轼”。


(图片:“苏轼”EX集团仿生机器人)


此外,与去年相比,今年还有另一家机器人公司“数字华夏”作为表情,其人形机器人“夏澜”在现场与观众互动:


(图片:数字华夏机器人“夏澜”


此外,还有很多商品不注重“表情”有多细致,有的甚至没有“脸”,有的做“脸”的企业选择了一般的“头盔”风格。


如果你仔细注意,你会发现无论是海外波士顿动力电动Atlas、Optimus马斯克 Gen2、Figure 01,或者是国内智元新上的“远征A2”、G1是宇树发布的新产品、“优必选会进厂打工”Walker S等等,他们都有一张相似的“钢”脸。


(图片:第一排从左到右 波士顿动力电动Atlass、Optimus马斯克 Gen2、Figure 01;从左到右的第二排:智元“远征A2”、宇树G1、Wlaker优必选 S)


这类人形机器人的面部材料基本上都是用黑色玻璃面罩,用LED嵌边,宇数创始人王兴兴在WRC 在2024年之前的交流会上,“我对G1的头部设计非常满意,短时间内不会改变”。


或许其中一个原因是,这张脸本身就是一个屏幕,上面可以有任何抽象的符号,方便形成表情,将情绪传递给人类。


比如Figure01或者Figure02说话的时候,OpenAI的标志性符号就会出现在脸上。虽然不是真实的表情,但也让与之交流的人类意识到“你在认真听我说话”。



(图:Figure02)


事实上,回顾人形机器人“鼻祖”——波士顿动力机器人“液压”Atlas第一版的外观,你会发现它甚至不存在基本的“脸”,更不用说表情了。它的脸看起来有点“糊弄”,只用了几根略粗的钢管和两个孔的设备,简单地搭建了一张Atlas的脸。


或许来自波士顿动力创始人Marc 在一次采访中,Raiber表示,“能力、灵巧、感知和智商是机器人的关键功能,其他的都不重要。”



(图片:波士顿动力液压Atlas)


直到2021年,一段液压Atlas舞蹈视频“Do You Love Me”爆红,Marc Raiber开始认同“仿生”对人形机器人和人类情感交流的重要性。也许正是因为这个原因,2024年的电动Atlas才有了一张“头盔式”的脸。


这种头盔脸在审美和功能上都有一定的作用。比如它们的主色调是“高级黑”,代表着十足的现代感。此外,头盔式设计可以减少外部环境对传感器和摄像头的损害,如灰尘、冲击或其他物理损害。更重要的是,它们可以避免“恐怖谷效应”带来的不适。


“头盔式”抽象学校很受欢迎,但仿生学校一直在研究如何让机器人的表情更像人。这个领域主要有两条技术路线:独立和远程控制。自主机器人通过机器学习和算法驱动产生面部情绪,而远程控制机器人通过操作员的指示模仿面部情绪。


例如,哥伦比亚大学工程学院的创新机器实验室开发了一个名为Emo的机器人。该机器人可以通过选择自我监督学习框架来预测人类的面部情绪,甚至可以在一个人微笑前的840毫秒内预测,并与人类同步微笑。



(论文地址:https://www.science.org/doi/10.1126/scirobotics.adi4724)


早些时候,一些学者开发了开源机器人Eva,以方便机器人模仿人类表情的训练,并发表了一篇解释机器人表情驱动原理的文章。



(论文地址:https://www.sciencedirect.com/science/article/pii/S2468067220300262)


Eva头由四个部分组成:口罩传动机构、下颌、眼睛和颈部。文章描述说:“口罩传动机构使用12个MG90S伺服电机,2个3D打印伺服组用于容纳伺服电机,一个定制的硅胶口罩,一个3D打印颅骨用于支撑口罩,并穿过特氟龙鲍登管钢丝。”


(Eva伺服装组)


这些钢丝穿过管道,连接到颅骨中的各种伺服电机。“为了产生面部情绪,需要启动12个伺服电机中的特定子集,然后带动钢丝,使面膜变形,模拟面部肌肉在做表情时如何变形皮肤。”简单来说,钢丝可以组合驱动多个伺服电机,通过工作人员的指令将力量传递到面罩上,最终形成机器人的“表情”。


在WRC 在2024年,EX机器人首席执行官李博阳告诉腾讯科技,“EX机器人的面部集成了几十组自由度,通过EX自主研发的系统来驱动表情。同时,开发一套情感模型,方便机器人进行情感分析,并将其映射到表情上。”


使人形机器人无限接近人类,似乎是一种执著,WRC 2024年活跃的“仿生派”,正是这种执著的体现。


2 量产、入厂的机器人,不是为了数据而工作。


在今年的机器人大会上,人形机器人的数量不仅大幅增加,甚至第一代商品也直接宣布大规模生产,可以在工厂工作。他们一路小跑,跟上了前辈特斯拉的步伐。


稚晖君创建的智元机器人,预计2024年出货量将达到300 台湾,其双足人形机器人从10月份开始量产,年出货量估计为200台。UniX Wanda也计划在9个小规模生产AI轮试人形机器人,预计年内生产100台左右。在现场,优必选甚至直接搭建了一个工厂场景,展示他们最新的人形机器人进厂操作的全过程,包括对车辆状况的筛选、对产品的分类和运输。根据他们的工作人员介绍,优必选已与汽车公司合作,并真正开始在工厂运作。


(汽车生产线上优必选人形机器人)


但说到机器人的性能,相关人员承认目前只能达到人类效率的20%-30%,电池寿命只有两个小时。电池寿命短也是业内人形机器人的普遍问题。


这种水平的机器人量产、入厂,真的是为了工业化吗?没有。


这个问题需要再谈一次,上面投资者提到的机器人的“泛化”能力,需要大量的数据。


那么需要多少数据呢?


比如在UniX-AI的平台上,他们装载了一个大型Wanda机器人,一口气展示了很多任务,包括洗衣服、叠衣服、做汉堡、3D清洁等等。在这个过程中,最令人印象深刻的是Wanda洗衣服的场景。它首先接受人类的指示,然后自动寻找肮脏的衣服,并将其放入洗衣机中。这似乎有能力独立完成整个过程任务。


(UniX-WandaAI机器人在展厅展示洗衣任务)


但是这种泛化非常有限。


UniX-AI创始人杨丰瑜告诉腾讯科技,目前的数据和培训可以实现洗衣服等任务级的泛化。然而,需要一段时间来积极识别和处理一个模型中的各种任务泛化功能。


在整个机器人大会上,我们可以看到各种可以拆分任务的机器人。比如WalkerS,可以在优必选中分拣物体,星尘智能可以写出漂亮的书法S1。然而,基本上没有机器人能够真正实现多任务之间的泛化展示。


(星尘智能S1机器人正在写作)


他们在固定的摊位上做着各种不同的、非常有限的工作,甚至过程看起来都很程式化。这一次让人恍惚,仿佛回到了大模型到来之前的编程机器人时代。


在机器人大会期间的采访中,Wolframam是RT-X项目的参与者。 Burgard教授认为,目前的基本模型训练方法存在巨大的能效问题——这需要太多的计算能力和数据来实现泛化的门槛。


举个例子——在RT-X数据项目中,虽然他们收集了超过100万个片段,涵盖了500多项机器人技能和16万个具体任务,但当桌子的高度略有不同时,RT-2也许完全不能正确地完成任务。


(RT-X数据集中的数据示例)


也就是说,我们离真正泛化的具身智能ChatGPT时刻还有至少一半的互联网数据量。


因此,在这场“泛化”的比赛中,能够先批量获取数据的企业可以率先发挥作用。因此,获取有效数据是许多机器人公司在观众中最热门的战场。


在智元机器人发布会上,稚辉君宣布了智元的数据采集计划。据估计,9月底将建成约100家机器人取样厂,对应150名工人,然后进入信息量产阶段,目标是每天1000条数据,目前每天600条数据。它已占据他们所期望的“大规模生产”机器人数的三分之一。当然,投入自己的收益,根据他们给出的数据,这个数据工厂可以在10天内获得和RT-X数据一样大的数量级。



(机器人大会上智元显示的数据工厂状况)


而且UniX-AI和星尘智能这些剑指具身智能实现的后起之秀,也强调自己在数据收集方面的投入。UniX-AI创始人杨丰瑜提到,他们在机器人训练中使用了虚拟环境的模拟和视频采集分析等“新采集方法”获得的数据。


但是根据智元的说法,目前这些真实的机器收集数据非常昂贵。即使选择大规模生产,成本也需要0.4元/条。即使是在模拟环境中获得的模拟数据,也需要60%-70%的真实数据。


那么如何才能更好更便宜地收集数据呢?在工厂工作可能是对双方都有好处的选择。机器人可以获得收集实际工作相关数据的真实场景,相关人工成本可能可以节省;相关企业可以获得智能探索的经验,可以获得更多的公告规格。


消化了相当一部分“量产”人形机器人的现实公司,只不过是现阶段人形机器人的另一个数据工厂。


3 人形机器人也走“亲民”路线,哪里不对“拆迁”?


“量产”一直是人形机器人行业的难题。主要原因是关键零部件规格不统一,参数要求参差不齐,难以规范。WRC创始人王兴兴 2024年之前,我还告诉腾讯科技,“每个家庭都有不同的做具智能的想法,比如如何收集机器人传感数据,是否需要触觉传感器,终端执行器应该有几个手指,这是不统一的”。


虽然行业路线还在探索中,但实际上很多企业都在用“模块化”思维做人形机器人,即人形机器人就像一个“大玩具”,手臂、机械手、底盘都可以拆卸安装,而今年的WRC 在2024年,直接呈现了模块化机器人路径。“人形机器人跑道软硬件标准化程度低,部件模块化。事实上,一些公司正试图初步规范它们。”一个人参加了WRC 业内人士2024告诉腾讯科技。


机器人公司试图将模块化的主要部件集中在手臂、灵巧的手和脚上。比如星动时代Star1机器人可以拆卸更换底盘,Star1底部可以换成双脚或者轮试。星动时代的工作人员说:“如果有必要,你可以保留你的上半身,而不是底盘。


(Star1星动纪元)


而且智元机器人“灵犀X1”机器人主要推开源,可以拆卸电机、夹爪等核心部件。


(智元“灵犀”系列)


然而,端执行器的更换涉及到控制不同类型爪子的能力。比如指爪和三指夹具的本体可以轻松操作,五指的灵巧手可能控制不好。“他们涉及的控制能力不是一个级别的”。


结语


尽管WRC 2024年后,很多人对人类机器人的应用表示怀疑和失望。在实际场景中,他们甚至认为“人不如狗”,但技术的发展是循序渐进的,机器人的泛化和智能不是一蹴而就的。中间可能会出现很多“中间状态”的产品类型。


在这些“中间态”产品的发展过程中,可能会出现一些脱离正常生长轨迹的情况,比如让不成熟的人形机器人进入工厂“工作”,就像要求一个蹒跚学步的孩子去100米冲刺一样,看起来有点“鼓励幼苗”,甚至可能充满丑陋。


但是人形机器人需要被“拉出来溜溜”,它只有走进人类,感知世界,才能真正为人类服务。


本文来自“腾讯科技”,作者:周小燕 编辑:郑可君,36氪经授权发布,郝博阳。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com