三问“具身数据元年”:堆规模是拐点还是“暴力美学”?

7分钟前

2026年被业内公认为具身智能的“数据元年”,这一共识并非凭空而来,而是物理世界应用中“算法难落地、场景不通用”的现实倒逼出的必然选择。


值得关注的是,若说2025年的“量产元年”更像是本体厂商的宣传口号与阶段性成果展示,2026年的“数据元年”则是本体、模型厂商必须直面的产业结构性矛盾。更深层的差异在于,2025年本体企业即便未实现量产,仍有技术迭代与产能爬坡的容错空间;但2026年若厂商无法打磨出差异化数据解决方案,始终停留在Scaling Law的门槛外,外界对其的耐心或将逐渐耗尽。


由此,一场数据采集设备的竞赛已悄然展开。从规模化应用VR+手柄遥操作采集本体真机数据,到无本体数据采集设备UMI、Ego的出现,再到基于外骨骼遥操作的真机数据采集方案,在真机与仿真的二元对立间开辟了新路径。这从侧面反映出,业界对于“什么样的数据能获认可、真正需要何种数据”的问题,尚未形成清晰答案。


从产业发展视角看,数据采集设备竞赛导致本体厂商忙着自建数据采集团队,模型公司扎堆布局混合数据生成引擎,各方都试图以差异化打法破解“数据饥渴”困境,夯实自身数据壁垒。


但这场狂欢真能解决问题吗?ALL IN数据的厂商们,究竟是被行业焦虑裹挟的跟风者,还是真正找准底层痛点的破局者?


暂且抛开老生常谈的数据问题,单看近期动态:2025年末Generalist的27万小时数据在具身智能领域引发轰动,看似Scaling law时刻已至,却有业内声音认为其本质是一场“暴力美学”。


毕竟,规模与丰富度只是数据饥渴的原因之一,精细化与高质量才是解决问题的关键。数据饥渴的核心从来不是“缺数据”,而是“缺有用的数据”。这正是具身数据元年的关键——不是“堆规模”,而是“找对路径”。


当我们剥离焦虑情绪,具身智能数据的核心拷问才真正浮现。


都在说缺数据,到底缺哪种类型的数据?


坦白讲,不少人尚未意识到“数据是为场景服务的”。


很多人对数据金字塔存在误解,总认为最难得且最好用的是真机数据。但实际上,数据金字塔是动态变化的,并非一成不变,取决于在什么场景下解决什么问题。


正如即将完成IPO的王兴兴在西门子首届科技峰会上所言:“我们公司和业内,能用仿真环境、仿真训练解决的,尽可能用仿真解决,因为速度快、成本低,还能调整参数”,这在人形机器人走、跑、打拳等动作中较为常见。而他也坦言:“机器人做‘操作’相关动作时,靠仿真做得还不够好,全球范围内仍需靠真人采集数据训练”,当然真人采集也面临环境搭建有限、成本高等痛点。


从王兴兴的话中能看出他对数据的取舍逻辑:始终从数据本身的“可供性”出发,并通过场景验证获取实践反馈。企业要知道缺什么类型的数据,不是在实验室里猜测,而是在真实场景中发掘。


从场景角度看,无论是互联网数据,还是少量真机+仿真形成的海量数据,都能让具身智能机器人完成“大开大合式”动作。这些数据支撑机器人从实验室走进物理世界,但距离实现生产力目标仍有差距。


互联网视频数据缺少力觉、触觉反馈,仿真数据难以还原不同材质的物理特性(如布料的柔软度、金属的光滑度),即便少量真机数据,也多聚焦于本体运动,而非末端操作细节。但在家庭服务、物流分拣、工业制造等多数生产力场景中,都需要“本体运动+大量末端操作”。换句话说,当前数据的核心诉求可聚焦于末端执行器,尤其是具备复杂“指间功夫”的灵巧手。



目前国外关注度较高的特斯拉、Figure机器人已证实,其在实际落地时,灵巧手的参与度并不高,很多时候虽有“手”,却干着“夹爪”的活。


遗憾的是,这类数据无法通过“暴力采集”获得。与通用场景数据不同,灵巧手数据具有极强的场景特异性:同样是“抓取”动作,抓取玻璃制品与橡胶零件的力控曲线完全不同;同样是“拧动”动作,手动螺丝刀与电动螺丝刀的操作逻辑存在本质差异。这意味着厂商必须深入具体场景,通过数采设备采集“针对性数据”,这也是其稀缺性的核心原因。


这场数据补位战,本质是从“泛化数据堆砌”向“场景化精细数据深耕”的转型,而灵巧手数据的储备厚度,将直接决定机器人的生产力边界。


数据采集竞赛会产生唯一解吗?


当下业内已意识到灵巧手数据采集的重要性,下一步关键在于如何采集更准确的数据。


目前数据采集设备竞赛已进入白热化阶段。除了持续扩张的真机数采厂,UMI、Ego、外骨骼等设备也异军突起,都在以低成本、高效率的方式寻求突破。


当前UMI主要聚焦机械臂末端的操作数据采集,因此难以覆盖机器人全身协调动作,且多以两指夹爪为末端专注于夹爪类任务,这使其在需要全身交互的场景中应用受限。


但对于聚焦单一操作任务的中小企业而言,UMI仍是当前阶段“成本与精度平衡”的最优解之一;由此衍生出解决机器人全身协调动作的Ego方案,但Ego存在依赖强大算法后端完成多维重建和数据对齐的难题,且二者在数据采集中更偏向提供海量数据用于预训练,数据质量问题会堆积到后期,处理成本极高。



目前UMI和Ego这两类数采设备逐渐开始强绑定,比如鹿明机器人、简智机器人都在推出UMI后相继发布Ego数采设备,并支持相互配合使用。业内将二者采集的数据视为互补的信息来源。


但仅靠这两者仍难以解决灵巧操作难题。一方面UMI局限于夹爪形态,另一方面Ego这类以自我为中心的人类数据虽扩展性强,但亚毫米级的手指位姿和触觉数据仍存在缺失,这使得UMI、Ego及其组合都难以让机器掌握精细操作技能。


因此,我们看到了更多针对“灵巧末端”的新型数据采集硬件。例如近期智在无界(BeingBeyond)推出的全球首款Real DexUMI——U1,受UMI范式影响,将灵巧手硬件、本体交互接口、动态追踪与触觉感知整合在同一系统中,可通过自然操控实现动作复刻;还有灵巧智能的DexCap外骨骼数据采集系统,实现了人体上肢及腰部的全维度动态捕捉,在常规视觉遥操基础上增加了手部震动力觉反馈,为灵巧手产品开发提供了可靠的数据来源。


值得注意的是,灵巧智能并非概念先行。早在2025年上半年,业内尚未意识到末端操作数据重要性时,其已通过外骨骼路径进行规模化采集。经过近一年技术迭代,在UMI、Ego引发广泛热议之际,该设备仍以必要性存在于前沿数据采集中,切实推动产业发展。


此外,当前末端操作的数据采集技术路线多样,除UMI、Ego、外骨骼外,光学动捕、惯性动捕、IMU/量子传感/光纤/弹性传感的数据手套等也可采集末端数据,但经市场验证,这些手套更适用于中低精度和弱磁场环境,且后期数据处理成本极高,在现有技术条件下规模化潜力有限。


总之,这场设备竞赛的终局并非“谁取代谁”,而是“谁能更好地融入协同生态”。外骨骼设备凭借力觉触觉复刻、长期稳定输出、数据标准化三大核心优势,成为灵巧手精细化数据采集的“刚需配置”;UMI与Ego则以高效、低成本的特点承担规模化数据积累的角色;各类数据手套也在技术蛰伏期等待突破。


必须强调的是,设备和数据更多时候并非“排他性”的,反而应尝试有效结合。


数据采集的话语权该归谁?


一个有趣的现象是,具身智能产业链正逐步完善:从前大致分为本体、大脑两个阵营,如今已涌现出深耕数据的独角兽企业。一时间,市面上“人人都有数据,人人都想占山为王”。


但数据话语权究竟该归谁?


答案是拥有硬件的主体——无论是本体、模型还是数据厂商,谁更懂数据采集硬件,谁就拥有话语权。


数据采集绝非简单的“记录动作”,而是要将物理世界的操作精准转化为数字世界的可用资产,这背后离不开硬件的三大核心支撑:数据维度、数据质量、数据处理成本。


数据维度要求采集的信息足够丰富,若维度不足,模型训练时会大量“猜测”,最终难以收敛;数据质量在某种程度上决定了模型“吃的是粗粮还是细糠”,“粗粮”会导致模型“粗糙”,无法完成精细任务;最后是数据处理成本,即“全链路处理成本”,包括数据采前、采后的管线建设、人员培训、数据清洗、算法映射等一整套“工业产线”式的成本。这三者共同决定了数据采集的成败。


目前不少数采企业在这些环节普遍未掌握全要素,但也有部分厂商和设备的理念考虑到了数据的“维度、质量与处理成本”。


以灵巧智能的DexCap系统为例,其具备这三大核心支撑:“全维度动态捕捉”涵盖手、双臂及腰部多维度数据,相比仅聚焦末端数据,信息丰富度大幅提升;“千赫兹响应和触觉感知增强”确保虚拟操控与真实动作1:1映射,流畅且真实;外骨骼设备硬件还具备高耐用性,长期采集过程中精度无衰减,数据质量持续稳定。此外,设备输出数据格式统一、维度完整,为后续标注、清洗与复用提供便利,助力构建可持续迭代的高质量数据集。


更重要的是,灵巧智能是知名灵巧手本体厂商,尤其在高自由度灵巧手领域成果显著。它离“手”最近,最懂灵巧操作的数据该是什么样。


由此可见,数据话语权的争夺核心是对“物理世界数字化入口”的掌控。本体厂商通过硬件的轻量、高效与协同创新,构建了数据采集的底层基础设施,让高质量数据的规模化生产成为可能;而灵巧智能则依托这一基础设施,将数据价值转化为真实可用的操作能力,形成“硬件赋能数据,数据驱动智能”的正向循环。


这也正是具身智能产业的核心逻辑:谁掌握了硬件这一数据采集的“第一触点”,谁就掌握了整个产业的发展主动权。


结语:数据元年的真正含义


回到数据元年的背景来看,“数据元年”并非指数据突然激增,而是意味着行业开始意识到:数据生产本身就是核心能力。


互联网时代的数据往往被动产生,而具身智能时代的数据必须主动制造。这使得数据不再唾手可得,我们必须面对的现实是:它更像一种与硬件深度绑定的工业产出。谁拥有设备、控制部署、理解场景,谁才能稳定生产高价值数据。


在具身智能的世界里,真正稀缺的从来不是数据本身,而是稳定产出高价值数据的能力。从灵巧智能的案例来看,谁离真实数据更近,建立起稳定、高质量、可扩展的数据生产体系,谁就更有可能在未来竞争中占据优势。


本文来自微信公众号“具身研习社”,作者:彭堃方、吕鑫燚,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com