00后极客与机器人公司的72小时:具身智能的平权实践

3分钟前
2026年3月29日下午5点,当我们走进深圳科创学院四楼时,参加“全球首届具身智能开发者大会”的20组选手已在此连续开发60小时。现场弥漫着咖啡与冷气混合的气息,散落着未吃完的奶茶和果切,楼道与墙角支起的帐篷里,不时有选手补觉——“前一天熬到凌晨4点”是不少人的常态。



图片由智能涌现拍摄


与开发软件的黑客松不同,这场具身智能大赛不仅有近百台高性能六轴机械臂,背后更有超100PFLOPs的算力支持,以及自变量WALL-OSS、Pi0.5、英伟达DreamZero等开源基模供选手选择。



图片由官方提供


拥有33万B站粉丝的“同济子豪兄”看到赛事支持后不禁感慨:“就没打过这么富裕的仗!”参赛选手几乎都是00后,暂列第一的“MVP”队队长是连续创业者,自备5090GPU和多款机械臂,队员则来自深圳大学与香港科技大学。


选手需在三天内通过数据采集与算法适配,让机械臂完成特定任务:或是将草莓、苹果分类装篮,或是识别物体后用字母积木拼出英文名称,更难的则是把Type-C线插进端口。


主办方自变量机器人创始人兼CEO王潜在决赛日坦言:“最初担心‘全球首届’的名头太大,后来发现国内外确实没有如此规模的比赛。”72小时内教会机械臂识别环境、决策与操作难度极高,王潜也承认“上手挺难”,但压缩时间能“推大家一把”。



自变量创始人王潜


回归真实

具身智能当下的症结在于“假”:许多机器人拧螺丝、取货收款的场景,都是在预设程序与环境下的摆拍,换个场地或光线便手足无措。


自变量CTO王昊告诉《智能涌现》,行业现有赛事要么提供纯仿真环境,虽易上手却脱离现实;要么仅给选手数据,评测全由主办方完成。而本次大赛允许选手采集数据、修改硬件与环境配置,“让大家充分理解模型泛化性”。


比赛设A/B榜,选手需从套环(抓取)、按指令分类水果(语言理解)、插电源线(精细操作)、拼写单词(长时序决策)中选一项攻关。A榜可按自设环境完成任务,B榜则需在随机环境(如木环位置、灯光、桌面颜色随机变化)中执行,前者考验复刻稳定性,后者检验模型泛化能力。


设立A/B榜旨在让选手“回归真实”,避免为“刷榜”仅用少量数据优化特定场景,忽略模型整体泛化性。自变量算法合伙人甘如怡说:“不想让大家停留在仿真画面里,而是上手动起来,体验物理世界的复杂性。”


回到现实

大赛中,选手摸到真实机器、采集真实数据、获得真实反馈,让具身智能回归真实;下一步,则是让机器人智能“回到现实”——技术需落地才有价值。


大赛的四个任务对应现实场景必备能力:套环考验抓取,分类水果涉及语言理解,插电源线是柔性物体精细操作,拼单词则是长序决策。这些能力正是机器人进入工厂、家庭的关键。



图片由官方提供


赛事前夕,自变量与58到家合作推出智能保洁服务,全球首个机器人保洁员在深圳上岗。王昊称“家庭是具身智能的圣杯”,因其环境与任务最开放,解决家庭任务意味着模型实现完全泛化。


目前机器人完全替代人类保洁尚不现实,演示视频中它仅能完成整理物品、清洁桌面等基础动作,收纳大件床单仍需与人协作。但王昊认为不必等模型成熟再落地:“直面最复杂场景,才能提升模型解决丰富场景的能力,越早开始越好。”


无论是大赛还是落地,自变量的思路一致:具身智能是复杂系统工程,行业在数据、算法等方面尚无共识,唯有鼓舞更多人参与,在尝试中推动模型与智能迭代。


王潜用“小龙虾”举例解释办赛初衷:“小龙虾火不是因为专业人士,而是无数个人开发者和小团队推成庞大生态。”他希望实现“具身智能的平权”——让更多人有机会参与这一领域的探索与创新。

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com