具身智能赛道竞速,瑞为技术晓蚁机器人已落地机场行李转运场景

2分钟前

瑞为技术正在告别单一视觉智能厂商的身份,在火热的具身智能赛道走出了一条差异化的落地路径——从深耕多年的视觉AI,一步步向完整的具身智能能力闭环拓展。


当一众企业在具身智能与人形机器人赛道竞相奔跑时,这家扎根AI领域14年的公司,已经把自研的具身智能机器人送到了机场场景实测。在今年4月29日举办的第三届中国具身智能与人形机器人产业大会上,瑞为技术就具身智能如何突破场景落地难题发表了主题演讲,正式对外传递出清晰的战略方向:已经能看懂世界的视觉AI,现在要延伸出决策与执行能力,在所有人都追逐通用、放大规模的赛道里,做扎根本地场景干实事的玩家。


从视觉AI龙头到具身智能新玩家,踩准每一个技术周期


2012年瑞为技术成立,到今天它完整亲历了两段特征完全不同的AI发展周期。


AI1.0时代,整个行业的核心目标是实现感知突破:让AI学会“看懂”图像内容、识别各类物体、理解真实场景,这十年是深度学习大规模商业化落地的黄金期,也是视觉AI厂商疯狂扩张的阶段。


但狂热之后很快迎来行业洗牌,巅峰时期国内号称做AI视觉的公司不下千家,资本扎堆涌入吹起估值泡沫,随后融资环境收紧、商业化落地难、同质化竞争挤压利润,从2019年开始,大量玩家陆续陷入经营困境,曾经的AI独角兽折价卖身、甚至直接停摆都早已不是新闻。


在当时的视觉AI赛道,大部分头部厂商都扎堆挤入安防、金融这两个热门赛场,瑞为技术却选择了另一条更聚焦的路径:深耕以民航机场为核心的旅客出行场景、以购物中心为核心的商业地产场景,以及商用车货运辅助安全驾驶场景。


在外人看来这是一种相当克制的选择,但恰恰是这份克制,让瑞成为在淘汰率极高的AI行业,成为少数从小模型时代活到大模型时代,还依然稳居头部的视觉AI厂商。


长期聚焦带来的结果是护城河越挖越深,根据弗若斯特沙利文的统计数据,以2024年的收入计算,瑞为技术在中国民航企业视觉智能产品市场排名第一,市场份额达到8.9%;产品已经覆盖了国内三分之一的民用机场,在年旅客吞吐量千万级以上的大型枢纽机场,覆盖比例更是高达三分之二。这份成绩背后,是十几年来累计的数以亿计的场景专属训练数据、对民航全业务流程的深度理解,还有和机场运营方打磨出来的长期稳定合作关系。


进入AI2.0时代,整个行业的核心命题彻底改变,大模型带来的不只是感知能力的升级,更推动AI从“理解”向“行动”延伸。这个技术拐点对瑞为来说,正好是向前拓展一步的最佳时机。


瑞为技术创始人兼董事长詹东晖这样形容这次转型:“过去12年我们一直在做‘眼睛’——靠视觉感知、理解物理世界。现在我们要往前走,往‘大脑’和‘手’的方向延伸,在理解世界的基础上做决策、做执行,帮人把实际的事情做完。”



这次转型也意味着,瑞为不再只是一家单纯的视觉智能公司:它正把技术重心从感知与认知,向决策与执行延伸,搭建出从“眼睛”到“大脑”再到“四肢”的完整能力闭环,在产品定位上也正式转向面向商业场景、可执行复杂操作的具身智能产品提供商,这是瑞为的新标签,也是它在火热的具身智能赛道选出来的专属落地方向。


避开通用叙事热潮,扎牢垂直场景的真正壁垒


当前具身智能领域最主流的行业叙事就是“通用性”:哪家的机器人能适配更多不同场景,故事就更有吸引力,对应的估值空间也更大。按照这套逻辑,专注垂直场景的公司好像天生就站在叙事的下风。


但詹东晖不这么认为,他觉得通用能力是平台型大企业的赛场,它需要拼规模、拼生态、拼先发的数据网络效应。可垂直场景的壁垒,从来不是靠堆参数就能堆出来的,它扎根在特定的业务需求里,来自对客户业务流程的深度理解,来自一次次和客户一起解决问题沉淀下来的行业know-how,这些都不是单纯砸算力就能得到的。


在技术层面,瑞为已经搭建出了三层架构组成的竞争力体系:


第一层是感知底座,这是14年视觉算法积累直接转化来的能力:物体识别、空间理解、姿态估计、非结构化环境下的实时感知,都是瑞为的传统优势项目。


第二层是决策层,瑞为把面向垂直场景的VLA(视觉-语言-动作)大模型作为核心自研方向,正在搭建适配垂直业务场景的VLA模型,把视觉感知、自然语言理解和机器人动作规划统一整合到一个端到端框架里,让机器人可以读懂场景语义,结合上下文自主判断,生成对应的动作序列。和通用VLA模型不同,瑞为还额外加入了力感与触觉信息,让机器人的决策逻辑更接近人类多源信息统一决策的模式,瑞为把这套创新架构命名为VTFLA。


第三层是执行层,靠自研执行组件补足“手”和“身体”的运动能力。不管感知和决策能力多强,最终都要落到物理动作的完成质量上。瑞为在执行侧的自研投入,解决的就是机器人在非结构化环境下的可靠操作问题:包括抓取策略、力度控制、末端执行器对不同物体形态的适配,这是非常高的工程门槛,也是从实验室演示到量产落地之间,最难跨过的一道鸿沟。


在具身智能的商业化路径判断上,詹东晖认为,复杂非结构化的专用场景,会比通用场景更早实现商业化跑通。


当前通用机器人同时面临技术和成本两道约束:既要做到足够强的泛化能力,又要把单机成本降到企业客户能接受的范围,两个条件同时满足还需要时间沉淀。相比之下,深度适配单一场景的专用机器人,可以针对场景里已知的约束条件做充分技术优化,成本结构也更符合商业化的要求。


啃下机场行李转运硬骨头,跑出可量化的落地价值


民航是瑞为切入具身智能的第一个落点,也是积累最深的业务地基,瑞为找到的首个落地场景,就是机场行李转运。


行李转运一直是民航业人力成本最集中的环节之一,招工难、人员流失快、人工效率受天气、航班班次影响波动大,这些问题已经困扰机场行业很多年。


但要把这个场景做好,难度远远超过表面看起来的样子。詹东晖介绍,机场行李转运区本身就是高度非结构化的作业环境,几乎集齐了机器人部署最不利的所有条件:


首先是行李形态完全不标准化:旅客托运的行李没有统一规格,拉杆箱、帆布软包、纸箱、超尺寸异形件往往混在同一批次里,机器人面对每一件行李都是全新的抓取挑战——选哪个位置下抓、用多大力度才能保证行李稳固不破损,最后还要找到堆垛的最佳位置,每一步都对能力有极高要求。


其次是空间环境不规则:航站楼地下的行李转运区域原本就不是为机器人设计的,走道宽窄不一,设备之间的空隙狭窄,机器人需要随时根据环境重新规划运动路径。


最后也是最关键的,就是这个场景有高密度的人机协作需求:在民航的运营体系里,行李转运的准确率和时效性直接影响航班准点率和旅客满意度。为了在短时间内完成不同规格行李的全量转运,人机混合作业是当前最高效的模式,但并行作业就意味着人机会在近距离内频繁发生空间交错,任何一点感知或者决策的延迟,都可能带来安全风险。


这些痛点恰恰是当前通用机器人没办法在这个场景用起来的原因:通用机器人泛化能力强,确实在很多场景都“能用”,但“能用”和在严苛的生产环境里稳定可用,完全是两个标准。再加上当前通用机器人的成本结构,决定了它在这类劳动替代场景里,暂时跑不出让客户满意的投资回报率。


瑞为给出的解法,就是专门研发一款适配机场行李转运场景的智能机器人。在2025年的国际机场博览会上,瑞为的晓蚁行李转运机器人就在模拟航站楼转运区完成了演示:它把一件件形态各异的行李,从分拣系统末端平稳转运到下游行李拖车上,还高效完成了码垛,正式打通了民航体系里智能化程度最低的环节之一。



这款机器人的核心创新之一,就是行业首创的人机协同作业模式。在和机场运营方充分沟通后,瑞为通过工程化设计实现了机器人和人工的无缝配合,让工作人员可以安全、自然地和机器人并肩作业:机器人负责高频率、重体力的搬运和码垛,人工只需要在机器人的能力边界外介入补位,双方各司其职,整体效率远远超过纯人工作业。


詹东晖透露,在机场的实测项目里,晓蚁行李转运机器人已经可以明显降低机场对人力数量的依赖,也减轻了一线工作人员的劳动强度,同时还能提升30%的系统吞吐量,把行李破损率降到0.12%,这些可量化的提升,就是吸引机场运营方采购的核心动力。


目前瑞为已经在国内多个机场启动实测,计划在今年下半年正式商业化落地。在拓展国内市场的同时,瑞为也把同样有行李处理痛点的东南亚、中东民航市场纳入了出海规划。


在当前疯狂竞速的具身智能赛道,瑞为选择了一条更务实的路径:把一件难做的事做透,让客户在实际业务里拿到可量化的价值。


如果给瑞为在当前的具身智能产业版图里找一个定位,它既不是通用机器人公司,也不是传统意义上的视觉AI公司,而是一家专注解决复杂场景复杂操作需求的具身智能产品提供商。


机器人赛道的热度终究会慢慢回落,但经过严苛场景验证的产品不会褪色。在行业的喧嚣里坚持做窄、做深,是一件需要定力的选择,但也正是这份选择,让瑞为在具身智能的热潮里,拿到了一个真正稀缺的产业位置,成为一家值得期待的具身智能厂商。

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com