在机器人技术领域,让机器人在从未见过的环境中执行任务一直是一个棘手的问题。
一般来说,研究人员需要针对每个新环境对机器人进行额外的训练,这个过程既耗时又昂贵。然而,最近的一项新研究为解决这一难题带来了新的希望。
美国纽约大学、Meta 和机器人公司 Hello Robot 的研究团队开发了一系列 AI 模型,称为机器人实用模型(Robot Utility Models,RUMs)。
这些模型能够教导机器人在全新的环境中完成基本任务,而无需进一步的训练或微调。
研究团队训练了五个 RUMs,分别用于执行开门、开抽屉、拾取纸巾、拾取纸袋以及重新摆正圆柱形物体等任务。令人惊喜的是,这些模型在未知环境中的平均成功率高达 90%。
RUMs 的核心优势在于其零样本学习能力。这意味着机器人可以直接推广到新环境中,而无需任何额外的调整。
纽约大学博士生马希沙菲乌拉(Mahi Shafiullah)表示,这项研究聚焦于“如何教会机器人在任何地方打开任何门”。
图 | 正在打开抽屉的机器人(来源:RUM 网站)
创建高效的 RUMs 涉及几个关键步骤:
首先是数据收集。为了加快收集机器人学习新技能所需的数据,研究团队使用了一种创新方法:将 iPhone 固定在便宜的拾取器上。依靠着这个简易设备,他们在 40 个不同环境中(包括纽约市和泽西市的家庭里)为每个任务录下了约 1000 次演示。
随后,研究人员使用了五个数据集训练机器学习算法,创建了五个 RUM 模型。这些模型被部署在名为 Stretch 的机器人上进行测试。Stretch 由一个轮子、一根高杆和一个可伸缩的手臂组成,手臂上安装了一部 iPhone。
在测试中,机器人最开始的任务完成率仅为 74.4%,研究人员通过使用 OpenAI 的 GPT-4o 大语言模型进行自我检查和重试,将成功率提高到了 90%。
这项研究所展示的 RUMs 模型展示了其在不同环境和任务中的广泛适用性。同时,通过使用廉价的商用机器人和普通智能手机,它证明了表现优秀的自动化系统不一定需要昂贵的硬件。
研究人员表示,在现实世界中,这样的零样本学习能力可以大大减少在新环境中部署机器人所需的时间和资源。此外,利用大模型进行自我检查和错误纠正,也展示了 AI 技术之间的协同效应。
图 | RUMs 模型是如何构建的(来源:RUMs 网站)
莫希特什里达尔(Mohit Shridhar),是英国帝国理工学院一位专门研究机器人操作的科学家。
他评论道:“能看到它在这些多样化的家庭和厨房中进行评估是非常好的一件事,因为如果你能让机器人在任何一间房子里工作,这是机器人技术想要实现的真正目标。”
尽管 RUMs 取得了一些进步,但研究人员也指出了一些挑战和改进空间。
例如,数据收集效率仍然有较大限制。虽然已经开发了新工具来加速数据收集,但进一步提高效率仍然是一个重要目标。
此外,如何在更极端的环境变化下保持高表现仍需探索,任务的复杂性也有待进一步提升。随着机器人能力的提升,我们还需要更多关注安全性和道德问题。
沙菲乌拉展望了 RUMs 的未来应用:“我们的梦想是,我可以训练一个模型,将其放到互联网上,而你应该能够下载并在你家里的机器人上运行它。”
这个愿景不仅可以作为构建其他实用机器人模型的通用方法,还能以最少的成本教会机器人新技能,使未经过专业训练的普通人也能在家中部署机器人。
为了推动 RUMs 在更广泛的任务中的应用,研究团队已经开源了他们的代码、数据、模型、硬件设计以及实验和部署视频。这一举措将有助于全球研究人员进一步探索和改进这一技术。
总的来说,这些新模型(RUMs)代表了机器人学习和适应能力的一个重要突破。通过实现零样本环境适应,RUMs 为机器人在复杂多变的现实世界中的应用开辟了新的可能性。
这项技术不仅可能改变我们与机器人互动的方式,还可能加速机器人技术在日常生活中的普及。
随着技术的不断进步和更多研究的投入,我们可以期待看到更多智能、灵活且易于部署的机器人系统在各个领域发挥作用,从而推动自动化技术向前发展。
参考资料:
https://robotutilitymodels.com/
https://www.technologyreview.com/2024/09/20/1104233/ai-models-let-robots-carry-out-tasks-in-unfamiliar-environments/
排版:溪树