由Craig Quite的DeepDrive项目搭建和维护的、加入了Grand Theft Auto V的Universe(OpenAI的人工智能训练平台)现在开源了。
要使用这一平台,你将只需要购买一个复制版的GTA V,然后你的Universe代理将能够在一个高保真度的虚拟环境中开始加速汽车上路。
在Universe中,GTA V能让AI代理进入一个丰富的3D世界。下面这段视频展示了,喂给代理的帧(人工减速到8FP,左上),对代理的诊断以及环境(左下),以及人性化的自由摄像头视角(右)。在GTA V中,用于纠偏的人类行为都是非暴力(non-violent)的。
本次开源发布的内容包括:
GTA V环境的源代码和AMI;
一个预训练的驱动代理,具有Caffe和TensorFlow实现。
集成以上两者能够支持选择摄像机和视场偏移,还包括通过强化学习训练实现奖赏功能,能够让代理学会避免碰撞,计算目的地距离和停留在路上。
现在,游戏能够在云中的Windows虚拟机上运行,并通过websockets和VNC与Universe通信。因此,Universe代理可以在Linux或Mac上运行,并且可以在任何ML框架中编写。
GTA V给研究人员提供了一个用于测试和开发AI丰 富多样的世界。GTA V的岛屿设置几乎相当于五分之一个洛杉矶,还可以访问各种场景来测试系统。除此之外,系统提供257种不同的汽车、7种类型的自行车和14种天气,在单个模拟器里使用这些数据进行排列组合,可以实现大量不同的虚拟场景。
至于这次发布版本中包括的基础代理,是通过模仿学习21小时(约60万图像)游戏画面进行驾驶训练的AI (内置的游戏AI是很好的初始目标:它的性能优于一个典型的人,因为它可以访问内部游戏状态,虽然AI仍然会犯错误,如在高速公路上进行U转弯)。基准代理可以驱动各种不同的天气条件,对交通作出反应并保持其车道。
OpenAI研究员表示,这个预训练代理只是一个开始,他们邀请全球开发人员一起改进这个代理。
GTA V与Universe的集成自动继承了Universe为了可比性和共享性而提供的所有工具和语义,能够很简单地对GTA V上的代理进行性能基准测试。Universe+GAT V可以单独使用,也可以作为使用Universe代理访问的一个环境。