一只猎豹飞奔着穿过一片起伏的田野,跳跃着越过崎岖地形中突然出现的缺口。这种运动看起来毫不费力,但让机器人以这种方式移动是非常有难度的。
近年来,受猎豹和其他动物运动的启发,四足机器人取得了巨大进步,但在海拔高度快速变化的地形上,仍然落后于其他的机器人。
“在这些情况下,你需要运用视觉来避免失败。例如,如果你看不见,就很难避免踩到缝隙。尽管已有一些将视觉融入腿部运动的方法,但大多数方法并不真正适合用于敏捷的机器人系统,”麻省理工学院计算机科学和人工智能实验室(CSAIL)教授Pulkit Agrawal和博士生Gapiel Margolis说。
现在,他们已经开发了一种系统,可以提高有腿机器人跳跃地形间隙时的速度和灵活性。这种新型控制系统分为两部分,一部分处理安装在机器人前方的摄像机实时输入信息,另一部分将信息转换为机器人应该如何移动身体的指令。研究人员在麻省理工学院的迷你猎豹上测试了他们的系统。
与其他控制四足机器人的方法不同,这个由两部分组成的系统不需要预先绘制地形,所以机器人可以去任何地方。在未来,这将使机器人能够冲进树林执行紧急响应任务,或爬上楼梯为闭门不出的老人送药。
使用两个独立的控制器共同工作是这个系统的创新点。控制器是一种算法,它把机器人的状态转换成一系列标准的动作。许多盲控制器(不包含视觉的控制器)非常有效,但只能使机器人在连续的地形上行走。
视觉是一种需要处理的复杂感官输入,这些算法无法有效地处理它。整合视觉的系统通常依赖于地形的“高度图”,这必须是预先构建的或在飞行中生成的,如果高度图不正确,这个过程通常很慢,且很容易失败。
为了开发他们的系统,研究人员从良好的盲控制器中提取了最佳元素,并将它们与一个独立的模块结合起来,处理实时视觉。
机器人的摄像头捕捉到即将经过的地形的深度图像,这些图像连同机器人身体的状态信息(关节角度、身体方向等)一起提供给高级控制器一个从经验中“学习”的神经网络。
神经网络输出一个目标轨迹,第二个控制器利用这个轨迹为机器人的12个关节分别计算扭矩。这种低级控制器不是神经网络,而是依赖于一组描述机器人运动的简洁的物理方程。
“这种层次结构,包括这种低级控制器的使用,使我们能够约束机器人的行为,使它更有行为规范。在这种低层次的控制下,我们可以使用特定的模型来施加约束,而这在基于学习的网络中通常是不可能的。”Margolis说。
研究人员使用被称为强化学习的试错法来训练高级控制器。他们模拟了机器人在数百个不同的不连续地形上奔跑,并对每一次的成功穿越予以奖励。随着时间的推移,算法学会了哪些行为能使奖励最大化。
然后,他们用一套木板建造了一个物理的、有缝隙的地形,并用迷你猎豹来测试他们的控制方案。
在某些情况下,评估机器人的状态是一项挑战。与仿真不同的是,真实世界中的传感器会遇到噪声,这些噪声会累积并影响结果。因此,在一些涉及高精度的足部放置实验中,研究人员使用了一个动作捕捉系统来测量机器人的真实位置。
他们的系统比其他只使用一个控制器的系统表现更好,迷你猎豹成功穿越了90%的地形。
“我们的系统一个新颖之处在于,它可以调整机器人的步态。如果一个人试图跳过一个非常宽的间隙,他们可能会先跑得非常快,以提高速度,然后他们可能会把两只脚放在一起,非常有力地跳过间隙。以同样的方式,我们的机器人可以调整其足部接触的时间和持续时间,更好地穿越地形。”Margolis说。
Margolis说,虽然研究人员能够在实验室证明他们的控制方案是有效的,但在将该系统部署到现实世界之前,他们还有很长的路要走。
在未来,他们希望给机器人安装一个更强大的计算机,这样它就可以在飞船上完成所有的计算。他们还想改进机器人的状态评估器,以消除对动作捕捉系统的需要。此外,他们希望改进低级控制器,使其能够使机器人运动范围更广。提高高级控制器,使其在不同的光照条件下都能较好地工作。
本文由升哲科技编译,转载请注明。