展会信息港展会大全

加州大学研究:通过模仿及无监督经验,机器人学会使用即兴工具
来源:互联网   发布日期:2019-04-14 17:58:28   浏览:19554次  

导读:人类善于通过观察和实践,养成了操作不同工具的技能,加州大学伯克利分校(UC Berkeley)人工智能研究院(BAIR)最新公布一项研究成果,把上述学习方式应用在机器人身上,研究人员利用演示数据集和无监督经验,让机器人通过模仿及互动模式来学会如何使用工具...

人类善于通过观察和实践,养成了操作不同工具的技能,加州大学伯克利分校(UC Berkeley)人工智能研究院(BAIR)最新公布一项研究成果,把上述学习方式应用在机器人身上,研究人员利用演示数据集和无监督经验,让机器人通过模仿及互动模式来学会如何使用工具,在训练之后,机器人尽管遇到先前从没见过的工具,一样会知道如何使用。

BAIR 博客文章指出,去年底 BAIR 完成一项研究工作,是让机器人在无监督学习的情况下与环境交互,进而建立一个可预测因果关系的视觉模型,基于这个学习模型,机器人可以完成一些简单的任务,包括叠衣服、摆放物体、或是用毛巾把物体遮盖起来等。但是,如果要加入使用工具,以实现更复杂的互动时,如拿扫帚把垃圾扫入簸箕里,就显得不足。

BAIR 研究人员进一步指出,许多动物利用观察和实验可以学会如何使用工具,比如通过观察彼此,黑猩猩知道如何使用树枝来捕抓白蚁,卷尾猴也懂得拿棍棒把食物“扫”过来,靠近自己,方便拿取,诸如此类使用工具的能力其实代表更高水平的智力。

因此,他们从动物的学习方式取得灵感,展开了进一步的研究:让机器人像人类一样,通过观察和实验来使用工具。通过设计出允许机器人通过类似模仿和互动模式的算法,来掌握使用工具的技能,机器人不仅学会了把从没见过的物体拿来当作工具,加以使用,甚至在没有传统工具可用的情况下,以“即兴物品”来替代,例如,没有扫帚时,推断出瓶子等普通物品,也可作为工具使用,会更有效率地完成任务。

加州大学研究:通过模仿及无监督经验,机器人学会使用即兴工具

图|机器人学会把不同的物体当作工具使用,以达到指定的任务,比如利用小扫帚将圆型物体推向黄色箭头方向(来源:BAIR)

首先,他们先示范如何使用各个不同工具,每一次演示,都会把机器人摄像头、抓手夹具位置等连续动作的图像记录下来,并利用这些数据建立一个动作提议模型,使机器人能够把当前场景中的物体当作工具来使用。

但光是这样还不够,目前外界对于机器人的期待是可以做出超越演示的表现,例如遇到没见过的东西,也要懂得判断如何处理或应对,才能让机器人技术进一步泛化到新的物体和新的场景下,如此就需要有大量不同的数据,因此,BAIR 研究人员通过让机器人能自行收集数据来扩展其经验。机器人以两种不同的方式自主收集数据,一是采取随机的动作序列,二是从上述的动作提议模型中抽样,机器人可抓取工具,并随机移动。

而整个数据集包括专家演示、机器人对各种工具的无监督经验,以及 BAIR 机器人交互数据集(BAIR Robot Interaction Dataset)的数据,研究人员使用整个数据集来训练动力学模型。

加州大学研究:通过模仿及无监督经验,机器人学会使用即兴工具

图|机器人在无监督情况下自行与不同的物体进行交互 (来源:BAIR)

在测试时,机器人可以使用模仿训练的模型来规划过程,预测模型则会用来决定机器人可做出哪些动作来执行任务。当用户指定任务时,并不会告诉机器人如何使用工具、或是有哪些备选工具可以使用,机器人必须在规划过程中自己弄清楚。

加州大学研究:通过模仿及无监督经验,机器人学会使用即兴工具

图|机器人之前从未见过海绵,也能够知道如何使用它来清除盘子上的东西(来源:BAIR)

加州大学研究:通过模仿及无监督经验,机器人学会使用即兴工具

图|因为机器人只允许在绿色区域内移动,它懂得利用L形钩来移动蓝色圆柱,而不会跨越绿色区域范围(来源:BAIR)

加州大学研究:通过模仿及无监督经验,机器人学会使用即兴工具

图|遇到瓶子时,机器人也推断出可以利用它来完成任务(来源:BAIR)

BAIR 指出,处理过去不曾见过的物体,一直是机器人执行任务时很大的挑战,为了研究这个问题,他们结合了模仿和自我监督的交互,并通过上述的演示,让机器人能够使用多个物体来完成复杂的多对象任务,甚至可以在新场景下使用即兴工具,这项研究工作有助于让机器人更加通用,在日常环境中执行实际的任务。


赞助本站

相关热词: 机器人 加州大学

AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港