作为时隔 20 年又来到内地举办的机器人顶会,IROS2025 在秋天给具身智能行业继续添了一把火。
虽然是学术论坛,但照样吸引了 160+国内外企业参展,甚至会场内也整起了机器人游行的花活,只为了让机器人证明「没毛病就走两步」。
除了人形机器人一如往常的备受关注,这回会场里也是很罕见地集结了 15 家以上国内外的灵巧手头部选手和新锐选手们。
老牌选手有国外的 Shadow,国内的因时机器人、傲意科技;新锐选手也有像新加坡的 Sharpa,国内的灵巧智能、源升智能。
在现场,这些灵巧手厂商们展示了遥操动捕、打牌、拍拍立得、长序列互动等功能,但在这些有趣的互动操作背后,其实有一个更现实的问题横亘在前。
打造出一台在展台上用作「精美展示」的灵巧手并不难,让这双手在真实世界中稳定、智能地执行任务却是一直以来的难题。
1、现实挑战:从「精巧硬件」到「智能操作」
灵巧手,作为决定机器人作业能力上限的重要一环,一直被称为人形机器人的「最后一厘米」。就像人类能做什么大多取决于双手一样,机器人能否真正融入人类环境,同样要看这双手的灵巧程度。
马斯克和 Figure AI 的 CEO 布雷特·阿德科克都曾坦言,打造一只真正好用的灵巧手,其技术挑战不亚于制造一个完整的机器人本体。
然而,与这种高技术门槛形成鲜明对比的是产业发展的现实困境。
根据机器人产业研究机构 ROBO Global 发布的年度报告,2024 年全球机器人领域投资中,仅有约 15% 流向了专用执行器与末端工具领域,而灵巧手作为其中的细分赛道,获得的关注度更为有限。
这种现象反映的是资本市场更倾向于投资具有平台潜力的大脑或整机方案,而不是被视为零部件的灵巧手。
当然,这种价值被低估的现状,背后缠绕着两道现实的枷锁。
第一道枷锁,是硬件出身的路径依赖。细数当前市场上的灵巧手厂商,无论是做空心杯电机这种核心零部件起家,还是工业场景多用的夹爪,或者是医疗领域的仿生手,基本上都带着强硬件属性。
这种硬件背景使得,当这些公司搭上具身智能的快车时,很自然地被贴上了硬件厂商的前置标签。
更重要的是,这些公司在发展过程中依托的是核心零部件的自研和制造技术,在空心杯电机、传感器、微型伺服电缸等领域积累了深厚功底。
这种技术基因自然地引导企业将重心放在硬件迭代上——如何让灵巧手体积更小、结构更稳定、成本更低,如何突破「成本-性能-可靠性」这个不可能三角。
久而久之,无论是内部的研发惯性,还是外部的认知印象,都将这些企业固化在了硬件供应商的角色里。
第二道枷锁在于,大多数灵巧手仍然停留在实验室的研究用具或者展台展品阶段,真正在工业或商业服务场景中承担作业任务的灵巧手寥寥无几。
在现实产业应用中,结构简单、成本低廉、控制稳定的夹爪依然是市场的主流选择。这种商业化进程中的曲高和寡,进一步强化了灵巧手作为精美玩具或研究用具的刻板印象。
这两道枷锁相互缠绕,形成了难以突破的闭环:硬件出身的玩家难以快速跳出参数思维的局限,团队人才结构也容易出现失衡;而场景落地的不足又让行业难以认可其系统价值。
这种「重硬件、轻场景」的闭环困境,在学术界也引发了一定的关注。
MIT 的一位学者曾在一篇综述文章表示,当前灵巧手领域的技术竞赛过分聚焦于硬件参数的比拼,而忽视了操作智能的同步发展。
显然,硬件是躯体,而数据与算法才是赋予灵巧手生命的灵魂。行业目前的挑战不是如何造好一只灵巧手,而是如何让这只手学会智能操作。
2、破局关键:稀缺的灵巧操作数据
要让灵巧手学会智能操作,关键就在于数据。
在具身智能的浪潮中,数据驱动机器人训练已成为共识。然而,并非所有数据都能同等有效地教会机器人掌握灵巧技能。
目前,业内获取机器人训练数据的方式主要有互联网视频学习、仿真平台生成数据和真人遥操采集三条路径,但各自都有显著的局限性。目前行业内主流的方案是采用「真机+仿真数据」的融合路径。
当整个行业都在为优质数据发愁,一个被忽略的事实也渐渐浮出水面:灵巧手厂商们,其实是离高质量操作数据最近的玩家。
作为灵巧手的设计与生产者,它们在研发、测试、调试过程中,会接触到大量真实的操作场景。
无论是从实验室里测试捏薯片、拧瓶盖,到与客户合作时在工厂里测试零件装配,还是在服务场景中测试递取物品。
在这些过程中,灵巧手的传感器会实时记录下手指的位置、力度、速度,以及与物体交互的细节。这些数据,都是具身智能行业急需的优质教材。
更重要的是,优质的灵巧手数据拥有对力的控制。这种细节,是本体厂商们生成数据时难以点对点捕捉的,但灵巧手厂商们对这种力控数据无疑有着主场优势。
可以说,每一只灵巧手都是一个移动的数据采集器,而灵巧手厂商们手里握着一座未被开采的「数据金矿」。
而在众多灵巧手玩家里,灵巧智能率先亮出来了第一桶金,在 9 月底,其正式发布并开源了大规模人手操作动作数据集 DexCanvas。
这一动作,跳出了硬件供应商的单一叙事,使其升维成了行业数据基础设施的构建者。
在规模与精度上,DexCanvas 融合了超过 1000 小时的真实人手操作多模态数据,覆盖动作、视觉、力觉以及由此衍生出的超过 10 万小时的高保物理仿真数据,数据精度覆盖亚毫米级轨迹。
在物理真实性方面,它通过一套独创的数据采集与处理流程,保障了手与物体交互过程中的几何与力学特性符合真实物理规律,有效缩小了仿真与现实的差距。
在技术路径上,DexCanvas 的核心作用在于夯实了「Real2Sim2Real」的闭环。
DexCanvas 通过将真实世界采集的高质量数据注入并优化仿真环境,训练出更强大的控制模型,再将这些模型高效地部署到真实的灵巧手上,形成了一个不断自我增强的、数据驱动的技术闭环。
最后,也是最具行业推动力的一点,是 DexCanvas 的全面开源。
通过 Hugging Face 等主流 AI 社区平台,灵巧智能与全球学术界、产业界共享这一数据集。这不仅降低了灵巧操作研究的门槛,更旨在构建一个围绕高质量数据的技术生态,将自身定位为行业基础设施的贡献者,而不仅仅是硬件方案的竞争者。
3、开源数据集带来行业生态效益
今年以来,一股开源浪潮正在席卷整个具身智能领域,这也标志着行业发展从各家的单打独斗来到了生态共建的新阶段。
开源是一种集众智、采众长的模式,通过一家开放共享创新成果,推动资源的自由、多向流动和高效配置,减少的是全行业的研发成本和时间。
工信部有关负责人也表示,开源正成为培育新兴产业的重要手段、发展新质生产力的重要路径。
而 DexCanvas 的开源正逢其时,为行业带来了多重影响。
首先,数据集的开源将大幅降低灵巧操作研究的门槛。在过去,高质量灵巧操作数据的采集需要昂贵的设备和复杂的流程,这构成了极高的入门门槛。
现在,任何研究团队,无论规模大小,都可以直接基于 DexCanvas 数据资源启动研究,这有效地压缩了从算法构思到现实验证的周期。
其次,DexCanvas 为行业提供了急需的基准和标准。灵巧操作领域长期存在数据标注规范不一的问题,没有统一标准就会影响算法的通用性与可迁移性。
DexCanvas 采用 22 类人手操作模式分类框架,同时对力闭合、形闭合等物理属性进行统一标注,为行业提供了一个可参考、可复现的数据基准。
这种标准化尝试,让不同团队的研究成果具备了可比性,利于推动整个领域在统一标准下更有序地发展。
更重要的是,开源数据生态有望打破灵巧手硬件与特定数据的强绑定,催生更多样化的解决方案。
在各家单打独斗的竞争局面下,产品的算法与硬件往往是高度耦合的,这就会导致 A 家开发的算法可能很难迁移到 B 家产品上。
DexCanvas 的数据源于纯人类演示,不依赖特定机器人形态,这也是跨平台技能迁移所需要的重要通用基础。
研究者可以基于 DexCanvas 提供的高质量数据,在各种开源模型上进行算法创新,再将这些算法应用于不同的硬件平台。这种分工协作的生态,远比任何单一企业的闭门造车更高效、更有活力。
当然,开源并非万能钥匙。它解决了「数据有无」的问题,但如何持续更新、维护数据集的长期价值,以及如何确保其在多样化的真实工业场景中依然有效,是留给整个行业的新课题。
这需要更多企业、研究机构加入开源生态,共同贡献数据、完善标准,形成良性循环。
如今,灵巧手厂商们正站在一个新的十字路口。
是继续安于「高级零部件供应商」的舒适区,还是勇敢地撬动自身独有的数据优势,向上构建算法与系统的能力,成为具身智能生态建设的不可或缺的推动者。
撕掉「零部件厂商」的标签,不仅仅是公司定位的转变,更是一次价值重构。在 AI 深度融合的当下,单一的硬件模块已经不再是价值高地,驱动硬件变得智能的数据流与算法才是更珍贵的灵丹妙药。
灵巧手厂商们坐拥着通往金矿的入口,能不能真的挖到金矿,关键在于是否具备开采、提炼并运用这些数据资产的能力与魄力。
未来,谁能在这场大混战里争夺一席之地,要看谁既能造出灵巧的手,又能赋予手智慧的灵魂。
下载格隆汇APP
下载诊股宝App
下载汇路演APP

社区
会员



