麻省理工学院的研究人员开发了一种系统,可以提高腿部机器人在穿越地形间隙时的速度和灵活性。图片来源:麻省理工学院
一只猎豹飞奔着穿过一片起伏的田野,跳跃着越过崎岖地形中突然出现的缺口。这种运动看起来毫不费力,但让机器人以这种方式移动是完全不同的前景。
近年来,受猎豹和其他动物运动的启发,四足机器人取得了巨大进步,但在海拔高度快速变化的地形上,它们仍然落后于它们的哺乳动物同行。
“在这些情况下,你需要运用视觉来避免失败。例如,如果你看不见,就很难避免踩到缝隙。尽管已有一些将视觉融入腿部运动的方法,但大多数方法并不真正适合用于新兴的敏捷机器人系统,”麻省理工学院计算机科学和人工智能实验室(CSAIL)教授普尔基特阿格拉瓦尔(Pulkit Agrawal)实验室的博士生加布里埃尔马戈利斯(Gapiel Margolis)说。
现在,马戈利斯和他的合作者已经开发了一种系统,可以提高有腿机器人的速度和灵活性,当它们跳过地形间隙时。这种新型控制系统分为两部分,一部分处理安装在机器人前方的摄像机的实时输入信息,另一部分将信息转换为机器人应该如何移动身体的指令。研究人员在麻省理工学院的迷你猎豹上测试了他们的系统,这是机械工程教授金尚培(Sangbae Kim)的实验室制造的一个强大、灵活的机器人。
与其他控制四足机器人的方法不同,这个由两部分组成的系统不需要预先绘制地形,所以机器人可以去任何地方。在未来,这将使机器人能够冲进树林执行紧急响应任务,或爬上楼梯为闭门不出的老人送药。
马戈利斯与资深作者Pulkit Agrawal共同撰写了这篇论文。Pulkit Agrawal是麻省理工学院不可思议人工智能实验室的负责人,也是电气工程与计算机科学系Steven G.和Renee Finn职业发展助理教授;麻省理工学院(MIT)机械工程系教授金尚培(音);以及麻省理工学院的陈涛和付翔研究生。其他合著者包括亚利桑那州立大学的研究生Kartik Paigwar;以及马萨诸塞大学阿默斯特分校(University of Massachusetts at Amherst)助理教授金东贤(Donghyun Kim)。这项工作将在下个月的机器人学习会议上展示。
一切都在控制之中
使用两个独立的控制器一起工作使这个系统特别创新。
控制器是一种算法,它将把机器人的状态转换成一系列让它遵循的动作。许多盲人控制器那些不包含视觉的控制器健壮而有效,但只能使机器人在连续的地形上行走。
视觉是一种需要处理的复杂感官输入,这些算法无法有效地处理它。整合视觉的系统通常依赖于地形的“高度图”,这必须是预先构建的或在飞行中生成的,如果高度图不正确,这个过程通常很慢,很容易失败。
为了开发他们的系统,研究人员从这些健壮的、盲目的控制器中提取了最好的元素,并将它们与一个独立的模块结合起来,处理实时视觉。
机器人的摄像头捕捉到即将到来的地形的深度图像,这些图像连同机器人身体的状态信息(关节角度、身体方向等)一起提供给高级控制器。高级控制器是一个从经验中“学习”的神经网络。
神经网络输出一个目标轨迹,第二个控制器利用这个轨迹为机器人的12个关节每个关节计算扭矩。这种低级控制器不是神经网络,而是依赖于一组描述机器人运动的简洁物理方程。
“这种层次结构,包括这种低级控制器的使用,使我们能够约束机器人的行为,使它更有行为规范。在这种低层次的控制下,我们可以使用特定的模型来施加约束,而这在基于学习的网络中通常是不可能的,”Margolis说。
网络教学
研究人员使用被称为强化学习的试错法来训练高级控制员。他们模拟了机器人在数百个不同的不连续地形上奔跑,并奖励它成功穿越。
随着时间的推移,算法学会了哪些行为能使奖励最大化。
然后,他们用一套木板建造了一个物理的、有缝隙的地形,并用迷你猎豹来测试他们的控制方案。
“和我们的一些合作者在麻省理工学院内部设计的机器人一起工作绝对是有趣的。迷你猎豹是一个很好的平台,因为它是模块化的,主要来自部分,你可以在线订购,所以如果我们想要一个新电池或相机,这只是一个简单的命令从一个常规供应商,从Sangbae一点帮助的实验室,安装它,”马戈利斯说。
在某些情况下,估计机器人的状态是一项挑战。与仿真不同的是,真实世界中的传感器会遇到噪声,这些噪声会累积并影响结果。因此,在一些涉及高精度足部放置的实验中,研究人员使用了一个动作捕捉系统来测量机器人的真实位置。
他们的系统比其他只使用一个控制器的系统表现更好,迷你猎豹成功穿越了90%的地形。
“我们的系统的一个新颖之处在于,它可以调整机器人的步态。如果一个人试图跳过一个非常宽的间隙,他们可能会先跑得非常快,以提高速度,然后他们可能会把两只脚放在一起,以非常有力的跳过间隙。以同样的方式,我们的机器人可以调整其足部接触的时间和持续时间,以更好地穿越地形,”马戈利斯说。
从实验室里跳出来
马戈利斯说,虽然研究人员能够在实验室证明他们的控制方案是有效的,但在将该系统部署到现实世界之前,他们还有很长的路要走。
在未来,他们希望给机器人安装一个更强大的计算机,这样它就可以在飞船上完成所有的计算。他们还想改进机器人的状态估计器,以消除对动作捕捉系统的需要。此外,他们希望改进低级控制器,使其能够充分利用机器人的运动范围,并提高高级控制器,使其在不同的光照条件下工作良好。
Kim说:“值得注意的是,见证了机器学习技术的灵活性,它能够绕过几个世纪以来基于模型的技术所依赖的精心设计的中间过程(例如状态估计和轨迹规划)。”“我对未来的移动机器人感到很兴奋,它们将拥有更强大的视觉处理能力,专门为移动而训练。”