1小时学会走路，10分钟学会翻身！世界模型让新生机器狗掌握多项技能-机器人-人工智能实验室AiLab-中国人工智能网-Powered by AiLab.cn

1小时学会走路，10分钟学会翻身！世界模型让新生机器狗掌握多项技能

来源：互联网发布日期：2022-07-08 17:51:43 浏览：7694次

导读：人类宝宝在出生后的第1年里，就会逐渐掌握协调能力，学习坐、立、翻滚和爬行。那么机器人呢？机器人能完成多复杂的任务，取决于它的学习能力。在最近的一项研究中，来自UC伯克利大学的的研发人员利用 Dreamer 世界模型的最新成果训练了各种机器人：无需模...

人类宝宝在出生后的第1年里，就会逐渐掌握协调能力，学习坐、立、翻滚和爬行。

那么机器人呢？

机器人能完成多复杂的任务，取决于它的学习能力。在最近的一项研究中，来自UC伯克利大学的的研发人员利用“ Dreamer” 世界模型的最新成果训练了各种机器人：无需模拟器或示范学习，就能实现现实世界中的在线强化学习。

1小时学会走路，10分钟学会翻身！世界模型让新生机器狗掌握多项技能

正在学习走路的机械狗

1小时学会走路，10分钟学会翻身！世界模型让新生机器狗掌握多项技能

开始走的像模像样了！

1小时学会走路，10分钟学会翻身！世界模型让新生机器狗掌握多项技能

起身也贼6！

1小时学会走路，10分钟学会翻身！世界模型让新生机器狗掌握多项技能

运用了“想象力”的Dreamer

早在2019年，谷歌DeepMind和多伦多大学的研究人员就在NeurIPS 2019会议上介绍了AI “Dreamer”，它可以通过已知世界模型在新环境中对视觉图像的运动方式进行预测。Dreamer在观察到图像运动方式时，会先构想出一些可能的动作，然后判断这些构想动作可能得到的奖励，根据奖励来最终预测动作。

基于谷歌提出的这种可扩展的强化学习方法。在此次研究中，团队的目标是在现实世界中推动机器人学习的极限，并提供一个强大的平台来支持未来的工作。

1小时学会走路，10分钟学会翻身！世界模型让新生机器狗掌握多项技能

除了教四足机器人翻身、站立并在 1 小时内学会行走，团队还把 Dreamer 应用于其他3个机器人。

1小时学会走路，10分钟学会翻身！世界模型让新生机器狗掌握多项技能

比如这个机械臂，在经过8-10小时抓取学习后，表现接近于人类水平；

1小时学会走路，10分钟学会翻身！世界模型让新生机器狗掌握多项技能

这个有计算机视觉的小机器人，通过学习摸索2小时后，可以“顺滑”的滚动到指定地点。

1小时学会走路，10分钟学会翻身！世界模型让新生机器狗掌握多项技能

研发团队还公开发布了所有实验的软件基础架构，感兴趣的小伙伴们可以移步开源地址

https://blog.otoro.net/2018/06/09/world-models-experiments/

总的来说，World Model就是一个智能体模型。它包括一个视觉感知组件，能将看到的图像压缩成一个低维的表征向量作为模型输入，同时还有一个记忆组件，可以基于历史信息，对未来的表征向量做出预测。最后还包括一个决策组件，它能基于视觉感知组件、决策组件的表征向量，决定采取怎样的动作。

1小时学会走路，10分钟学会翻身！世界模型让新生机器狗掌握多项技能