库萨科技的技术选择:在城市街头打磨机器人的「物理直觉」

相比不少企业选择从工厂、仓储等规则清晰的结构化场景切入,库萨把目标放在了更复杂的城市街头,希望让机器人真正理解物理世界,并在开放环境中完成自主决策与协同作业。 不过,为什么偏偏是城市服务?为什么库萨要选择一条更难的路?

如果一台无人清扫机器人,在园区步道上看到一张纸、一支铅笔,它应该扫,还是不扫?

答案并没有想象中那么简单。傍晚放学时,它们旁边可能还有一个敞开的书包,以及几个正在奔跑的学生。

这时候,纸和铅笔不是垃圾,而是学生暂时放在地上的学习用品。

可到了第二天清晨,书包消失了,人也离开了。同样一张纸、一支铅笔,却变成了应该被清理的遗留垃圾。

对于人来说,这是几乎不用思考的判断。但对于机器人来说,这意味着它不仅要看见物体,更要理解物体之间的关系,理解场景正在发生什么。

遗憾的是,这也是今天许多城市服务机器人很难做到的一件事。

长期以来,不少无人清扫机器人仍停留在「识别物体、执行规则」的阶段

它们知道哪里有路沿、哪里有绿植,却很难判断什么时候应该避让、什么时候又需要主动贴边作业;它们能够识别一张纸,却未必知道这张纸究竟是垃圾,还是有人暂时放下的物品。

城市服务场景,从来都不是一个有标准答案的世界。也正因为如此,机器人真正缺少的,从来不是识别能力,而是理解能力

7 月 2 日,库萨科技发布全模态具身模型 Kusa Omni-CTS 与具身智能操作系统 Kusa OS。

相比不少企业选择从工厂、仓储等规则清晰的结构化场景切入,库萨把目标放在了更复杂的城市街头,希望让机器人真正理解物理世界,并在开放环境中完成自主决策与协同作业。

不过,为什么偏偏是城市服务?为什么库萨要选择一条更难的路?

答案,或许就藏在城市服务那些看似普通、却处处充满「反直觉」的细节里

1、城市服务,一个很难但很有价值的战场

如果观察近两年具身智能的发展,你会发现,大多数企业都不约而同地选择了一条相对容易的路线。

无论是工厂搬运、仓储物流,还是室内服务机器人,这些场景都有一个共同特点:环境相对固定、规则相对明确。

机器人每天面对的是几乎一致的道路、货架和作业流程,只要不断重复训练,就能持续提升完成任务的成功率。

这样的路线没有问题,也是具身智能迈向产业化的重要一步。

但与此同时,它也回避了一个更大的挑战:机器人真正要进入现实世界,面对的并不是工厂,而是一个没有标准答案的开放环境。

相比室内和工厂,城市服务几乎可以说是目前最复杂的具身智能应用场景之一。

这里没有固定的作业边界。一条道路今天可能停着车辆,明天可能堆放着施工材料;

路沿、绿化带、人行道之间也没有始终清晰的分界线,机器人无法依赖预设规则完成定位,只能不断根据环境变化重新理解自己应该在哪里作业。

这里的操作逻辑也与自动驾驶截然不同。自动驾驶的核心目标是安全到达,因此遇到障碍物的第一反应往往是避让。

但对于无人清扫机器人来说,很多所谓的「障碍物」,恰恰就是它需要主动靠近甚至接触的对象。

路沿边缘积累的灰尘需要贴边清扫,低矮绿植下隐藏的落叶需要深入处理,在一些狭窄区域,机器人甚至需要以接近自身运动极限的方式完成作业。

如果一味遵循「避障」逻辑,最终得到的只会是一条扫得并不干净的道路。

更难的,是机器人面对的对象本身。

城市里的每一天都在发生变化。树叶、塑料袋、矿泉水瓶、共享单车、快递纸箱、儿童玩具,甚至一张纸、一支铅笔,都可能出现在机器人面前。

它不仅需要识别这些物体是什么,更需要结合周围环境、时间变化以及人与物之间的关系,判断什么应该清扫,什么应该保留,以及怎样才能完成最合理的作业。

这意味着,城市服务机器人面对的,不只是感知问题,更是理解问题。也正因为如此,城市服务一直被认为是具身智能最难落地的方向之一。

但换个角度来看,它同样也是最具价值的方向。

因为只有能够适应开放环境的机器人,才真正具备跨场景泛化能力;只有能够在真实城市中稳定工作的系统,才能支撑具身智能走向大规模商业化。

这也是库萨科技选择城市服务作为核心赛道的原因。

相比先在规则明确的环境里不断优化模型,库萨更希望让机器人直接进入真实世界,在开放、动态、充满不确定性的城市街头完成训练和成长。

这些场景虽然极为复杂,但并不是需要绕开的障碍,而是模型持续进化最好的「训练场」。

2、从看见到理解,机器人需要跨越的门槛

如果说城市服务最大的挑战,在于没有标准答案,那么机器人真正需要解决的,就不只是看见,而是「理解」。

过去很长一段时间,机器人主要依赖规则工作。开发者提前写好各种判断条件:遇到什么情况执行什么动作,识别到什么物体采取什么策略。比如说看到路沿石,机器人就会自行绕开。

这种方式在固定场景里能够运行得不错,但到了开放的城市环境,很快就会遇到瓶颈,现实世界远比规则复杂。

不同高度的路沿、不同材质的绿化带、不同角度的台阶,每一种组合都会产生新的情况,几乎不可能全部提前写进程序。

Kusa Omni-CTS 全模态具身模型选择了另一种思路。

突破了传统「视觉+语言」二元框架,将视觉空间感知、语义理解以及本体感知与动力学统一融合,让机器人不仅能够看到路沿石的位置,还能够实时感知自身与路沿接触时产生的姿态、受力和运动变化。

在这种情况下,路沿石不再是一个需要绕开的障碍,而是完成清扫任务的重要参考对象。机器人也因此开始从「避障」走向「作业」。

截屏2026-07-03 14.12.47.png不过,避障问题解决了,但机器人还面临一个容易被忽略的问题:每一种传感器,都有自己的「时间」。

一台清扫机器人身上有摄像头、激光雷达、力矩传感器,它们各按各的节奏采集数据,比如摄像头一秒拍 30 张照片,激光雷达一秒扫 10 次,力矩传感器一秒感受上千次。

传统方案往往需要依赖专门的硬件同步机制,把所有数据强行拉到同一个时间点,否则模型很难准确理解环境。

这不仅增加了硬件复杂度,也让不同品牌传感器之间的替换和升级变得十分困难。

对于这一点,Kusa Omni-CTS 采用了连续时空流形的跨模态特征对齐方式。

简单来说,不同来源的数据不再需要提前「统一节拍」,而是在进入模型之后,根据时间和空间关系自动完成对齐。

视觉、语言、本体状态以及物理反馈,可以按照各自原本的节奏采集,再在模型内部自然融合。

对于城市服务机器人而言,这意味着更高的硬件兼容能力,后续升级不同品牌、不同型号传感器时,不需要重新构建整套同步系统,大幅降低了工程部署成本。

所以,回到文章开头那个问题。为什么同样一张纸、同样一支铅笔,机器人会做出两种完全不同的判断?

这背后也是由于 Kusa Omni-CTS 模型不仅能够理解当前发生了什么,还能够基于物理规律和环境变化,提前在大脑中推测接下来可能发生的种种状况,再选择最合理的执行方式。

对于机器人而言,它不再只是忠实执行预先写好的规则,而是在理解环境之后,自主判断下一步应该怎样行动。

3、机器人不止要会理解,还要来得及行动

如果说 Kusa Omni-CTS 解决的是怎么看、怎么想的问题,那么还有一个问题同样重要:机器人来得及行动吗?

毕竟,城市服务机器人面对的是一个持续变化的真实环境。行人可能突然经过,车辆可能随时停靠,前一秒还是空旷的道路,下一秒就可能出现新的障碍物。

很多时候,真正决定作业质量的,并不是机器人能不能理解,而是它能不能足够快地把理解转化为行动。这也是库萨推出 Kusa OS 具身智能操作系统的原因。

相比模型负责「理解思考」,Kusa OS 更像是整个机器人的「神经系统」。为了满足城市服务场景对于实时性的要求,Kusa OS 面向边缘侧进行了专门优化,实现了小于 1 毫秒的系统时延,以及仅 50 微秒的抖动控制。

截屏2026-07-03 14.12.58.png但对于城市服务机器人来说,快只是基础,真正决定能否规模化落地的,还是工程能力。

一台机器人从实验室走向城市,往往需要面对不同客户、不同地区、不同配置的硬件组合。如果每更换一套传感器,都需要重新开发底层接口,部署成本和维护成本都会快速增加。

Kusa OS 提供了统一的硬件抽象能力,让不同品牌、不同型号的摄像头、激光雷达、雷达、IMU 等传感器能够采用统一接口接入。

对于开发者而言,更换传感器不再意味着重写大量底层代码,而更像更换一个 USB 设备——插上即可使用,团队可以把更多研发精力放在算法和应用本身,而不是重复适配底层硬件。

与此同时,Kusa OS 并不是针对某一款机器人设计,而是希望成为不同机器人共享的一套底层平台。

目前,库萨已经形成覆盖 0.5 吨级到 3 吨级的城市服务机器人产品矩阵,包括小型场景作业的库萨星洁、公共空间作业的库萨智巨人,以及面向城市道路的库萨星筠、库萨星晖。

虽然不同产品在尺寸、载荷和应用场景上存在差异,但都可以运行在同一套 Kusa OS 之上,实现「一脑管理多形」

更重要的是,这套系统并不是停留在实验室里的技术验证。

库萨虽然于 2023 年正式成立,但核心团队早在 2018 年便开始相关技术研发,Kusa OS 也正是在这一过程中不断迭代完善。

它不仅融合了自动驾驶、车规芯片和机器人三大技术体系的研发经验,更经历了真实城市环境的长期验证。

截至目前,Kusa Omni-CTS 与 Kusa OS 已协同支撑库萨无人清扫机器人部署至国内外超过 40 座城市,在不同道路环境、不同天气条件以及不同作业场景下持续运行。

从城市道路到园区空间,从清扫到巡检,这套系统面对的始终是真实世界,而不是实验室里的标准测试场景。

与此同时,所有机器人均可购买商业化保险,并配备国内首份开放道路无人机器人产品质量责任保险。

这不仅意味着产品具备商业运营能力,也意味着其可靠性和安全性已经获得产业体系的进一步认可。对于城市服务机器人而言,这比任何实验室指标都更具说服力。

回过头来看,Kusa Omni-CTS 与 Kusa OS 看似分别对应模型和系统,但两者真正解决的,其实是同一个问题——如何让机器人既能够理解真实世界,又能够在真实世界长期、稳定地工作。

过去,机器人更多依赖的是「规则驱动」,遇到 A 执行 B,遇到 C 执行 D。但城市服务没有写得完的规则,也没有固定不变的环境。

真正决定机器人能力上限的,是它能否理解物理世界的运行规律,并把这种理解持续转化为可靠行动。

当越来越多具身智能企业仍在工厂、仓库等结构化环境中不断优化模型时,库萨选择直接走上城市街头,在真实的车流、人流和烟火气中打磨机器人的「物理直觉」。

对于库萨而言,城市服务或许不是验证技术的终点,而是推动具身智能走向规模化应用的起点。


格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论