具身智能赛道竞速，瑞为技术晓蚁机器人已落地机场行李转运场景

04-30 06:45

瑞为技术正在告别单一视觉智能厂商的身份，在火热的具身智能赛道走出了一条差异化的落地路径——从深耕多年的视觉AI，一步步向完整的具身智能能力闭环拓展。

当一众企业在具身智能与人形机器人赛道竞相奔跑时，这家扎根AI领域14年的公司，已经把自研的具身智能机器人送到了机场场景实测。在今年4月29日举办的第三届中国具身智能与人形机器人产业大会上，瑞为技术就具身智能如何突破场景落地难题发表了主题演讲，正式对外传递出清晰的战略方向：已经能看懂世界的视觉AI，现在要延伸出决策与执行能力，在所有人都追逐通用、放大规模的赛道里，做扎根本地场景干实事的玩家。

从视觉AI龙头到具身智能新玩家，踩准每一个技术周期

2012年瑞为技术成立，到今天它完整亲历了两段特征完全不同的AI发展周期。

AI1.0时代，整个行业的核心目标是实现感知突破：让AI学会“看懂”图像内容、识别各类物体、理解真实场景，这十年是深度学习大规模商业化落地的黄金期，也是视觉AI厂商疯狂扩张的阶段。

但狂热之后很快迎来行业洗牌，巅峰时期国内号称做AI视觉的公司不下千家，资本扎堆涌入吹起估值泡沫，随后融资环境收紧、商业化落地难、同质化竞争挤压利润，从2019年开始，大量玩家陆续陷入经营困境，曾经的AI独角兽折价卖身、甚至直接停摆都早已不是新闻。

在当时的视觉AI赛道，大部分头部厂商都扎堆挤入安防、金融这两个热门赛场，瑞为技术却选择了另一条更聚焦的路径：深耕以民航机场为核心的旅客出行场景、以购物中心为核心的商业地产场景，以及商用车货运辅助安全驾驶场景。

在外人看来这是一种相当克制的选择，但恰恰是这份克制，让瑞成为在淘汰率极高的AI行业，成为少数从小模型时代活到大模型时代，还依然稳居头部的视觉AI厂商。

长期聚焦带来的结果是护城河越挖越深，根据弗若斯特沙利文的统计数据，以2024年的收入计算，瑞为技术在中国民航企业视觉智能产品市场排名第一，市场份额达到8.9%；产品已经覆盖了国内三分之一的民用机场，在年旅客吞吐量千万级以上的大型枢纽机场，覆盖比例更是高达三分之二。这份成绩背后，是十几年来累计的数以亿计的场景专属训练数据、对民航全业务流程的深度理解，还有和机场运营方打磨出来的长期稳定合作关系。

进入AI2.0时代，整个行业的核心命题彻底改变，大模型带来的不只是感知能力的升级，更推动AI从“理解”向“行动”延伸。这个技术拐点对瑞为来说，正好是向前拓展一步的最佳时机。

瑞为技术创始人兼董事长詹东晖这样形容这次转型：“过去12年我们一直在做‘眼睛’——靠视觉感知、理解物理世界。现在我们要往前走，往‘大脑’和‘手’的方向延伸，在理解世界的基础上做决策、做执行，帮人把实际的事情做完。”

这次转型也意味着，瑞为不再只是一家单纯的视觉智能公司：它正把技术重心从感知与认知，向决策与执行延伸，搭建出从“眼睛”到“大脑”再到“四肢”的完整能力闭环，在产品定位上也正式转向面向商业场景、可执行复杂操作的具身智能产品提供商，这是瑞为的新标签，也是它在火热的具身智能赛道选出来的专属落地方向。

避开通用叙事热潮，扎牢垂直场景的真正壁垒

当前具身智能领域最主流的行业叙事就是“通用性”：哪家的机器人能适配更多不同场景，故事就更有吸引力，对应的估值空间也更大。按照这套逻辑，专注垂直场景的公司好像天生就站在叙事的下风。

但詹东晖不这么认为，他觉得通用能力是平台型大企业的赛场，它需要拼规模、拼生态、拼先发的数据网络效应。可垂直场景的壁垒，从来不是靠堆参数就能堆出来的，它扎根在特定的业务需求里，来自对客户业务流程的深度理解，来自一次次和客户一起解决问题沉淀下来的行业know-how，这些都不是单纯砸算力就能得到的。

在技术层面，瑞为已经搭建出了三层架构组成的竞争力体系：

第一层是感知底座，这是14年视觉算法积累直接转化来的能力：物体识别、空间理解、姿态估计、非结构化环境下的实时感知，都是瑞为的传统优势项目。

第二层是决策层，瑞为把面向垂直场景的VLA（视觉-语言-动作）大模型作为核心自研方向，正在搭建适配垂直业务场景的VLA模型，把视觉感知、自然语言理解和机器人动作规划统一整合到一个端到端框架里，让机器人可以读懂场景语义，结合上下文自主判断，生成对应的动作序列。和通用VLA模型不同，瑞为还额外加入了力感与触觉信息，让机器人的决策逻辑更接近人类多源信息统一决策的模式，瑞为把这套创新架构命名为VTFLA。

第三层是执行层，靠自研执行组件补足“手”和“身体”的运动能力。不管感知和决策能力多强，最终都要落到物理动作的完成质量上。瑞为在执行侧的自研投入，解决的就是机器人在非结构化环境下的可靠操作问题：包括抓取策略、力度控制、末端执行器对不同物体形态的适配，这是非常高的工程门槛，也是从实验室演示到量产落地之间，最难跨过的一道鸿沟。

在具身智能的商业化路径判断上，詹东晖认为，复杂非结构化的专用场景，会比通用场景更早实现商业化跑通。

当前通用机器人同时面临技术和成本两道约束：既要做到足够强的泛化能力，又要把单机成本降到企业客户能接受的范围，两个条件同时满足还需要时间沉淀。相比之下，深度适配单一场景的专用机器人，可以针对场景里已知的约束条件做充分技术优化，成本结构也更符合商业化的要求。

啃下机场行李转运硬骨头，跑出可量化的落地价值

民航是瑞为切入具身智能的第一个落点，也是积累最深的业务地基，瑞为找到的首个落地场景，就是机场行李转运。

行李转运一直是民航业人力成本最集中的环节之一，招工难、人员流失快、人工效率受天气、航班班次影响波动大，这些问题已经困扰机场行业很多年。

但要把这个场景做好，难度远远超过表面看起来的样子。詹东晖介绍，机场行李转运区本身就是高度非结构化的作业环境，几乎集齐了机器人部署最不利的所有条件：

首先是行李形态完全不标准化：旅客托运的行李没有统一规格，拉杆箱、帆布软包、纸箱、超尺寸异形件往往混在同一批次里，机器人面对每一件行李都是全新的抓取挑战——选哪个位置下抓、用多大力度才能保证行李稳固不破损，最后还要找到堆垛的最佳位置，每一步都对能力有极高要求。

其次是空间环境不规则：航站楼地下的行李转运区域原本就不是为机器人设计的，走道宽窄不一，设备之间的空隙狭窄，机器人需要随时根据环境重新规划运动路径。

最后也是最关键的，就是这个场景有高密度的人机协作需求：在民航的运营体系里，行李转运的准确率和时效性直接影响航班准点率和旅客满意度。为了在短时间内完成不同规格行李的全量转运，人机混合作业是当前最高效的模式，但并行作业就意味着人机会在近距离内频繁发生空间交错，任何一点感知或者决策的延迟，都可能带来安全风险。

这些痛点恰恰是当前通用机器人没办法在这个场景用起来的原因：通用机器人泛化能力强，确实在很多场景都“能用”，但“能用”和在严苛的生产环境里稳定可用，完全是两个标准。再加上当前通用机器人的成本结构，决定了它在这类劳动替代场景里，暂时跑不出让客户满意的投资回报率。

瑞为给出的解法，就是专门研发一款适配机场行李转运场景的智能机器人。在2025年的国际机场博览会上，瑞为的晓蚁行李转运机器人就在模拟航站楼转运区完成了演示：它把一件件形态各异的行李，从分拣系统末端平稳转运到下游行李拖车上，还高效完成了码垛，正式打通了民航体系里智能化程度最低的环节之一。

这款机器人的核心创新之一，就是行业首创的人机协同作业模式。在和机场运营方充分沟通后，瑞为通过工程化设计实现了机器人和人工的无缝配合，让工作人员可以安全、自然地和机器人并肩作业：机器人负责高频率、重体力的搬运和码垛，人工只需要在机器人的能力边界外介入补位，双方各司其职，整体效率远远超过纯人工作业。

詹东晖透露，在机场的实测项目里，晓蚁行李转运机器人已经可以明显降低机场对人力数量的依赖，也减轻了一线工作人员的劳动强度，同时还能提升30%的系统吞吐量，把行李破损率降到0.12%，这些可量化的提升，就是吸引机场运营方采购的核心动力。

目前瑞为已经在国内多个机场启动实测，计划在今年下半年正式商业化落地。在拓展国内市场的同时，瑞为也把同样有行李处理痛点的东南亚、中东民航市场纳入了出海规划。

在当前疯狂竞速的具身智能赛道，瑞为选择了一条更务实的路径：把一件难做的事做透，让客户在实际业务里拿到可量化的价值。

如果给瑞为在当前的具身智能产业版图里找一个定位，它既不是通用机器人公司，也不是传统意义上的视觉AI公司，而是一家专注解决复杂场景复杂操作需求的具身智能产品提供商。

机器人赛道的热度终究会慢慢回落，但经过严苛场景验证的产品不会褪色。在行业的喧嚣里坚持做窄、做深，是一件需要定力的选择，但也正是这份选择，让瑞为在具身智能的热潮里，拿到了一个真正稀缺的产业位置，成为一家值得期待的具身智能厂商。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

两大烈酒巨头官宣终止合并谈判，全球酒业整合仍在推进

五一假期机票价格出现降价？实际情况是这样的

香港百亿地产豪门衰败记：800亿资产快被继承人卖空，接班人被追债申请破产

威马低价拍卖上亿资产 2026年十万台量产目标再添变数

横店传统影视生态洗牌，AI短剧抢占赛道：2026年AI抽卡师接管内容片场

项目推荐

康小虎百岁计划・健康大使招募计划

康老板 · 氧疗堂