今年上半年,AlphaGo成功挑战职业围棋九段选手李世乭,让人工智能大放光彩。但相比起十分需要运算和推测的棋类游戏,人工智能一直在电子游戏中多次吃亏。之前AlphaGo也提出要在《星际争霸2》中战胜职业选手,但暴雪CEO表示不太可能。这是因为电子游戏的自由度非常高,取得胜利的方式也有很多种,人工智能往往摸不着头脑,甚至有时直接发呆。
(图片来源于:Google)
为了扭转这个劣势,DeepMind其实早在前年已经开始着手研究,并且在顶级科研杂志Nature(自然)上发布了有关AI Deep Q-Network(人工智能深度网络,简称DQN)的论文。这个名为DQN的人工智能,可以自主学习游戏规则,在事先没有给予任何有关游戏的情报下,能够通过不断玩游戏来提高自己的成绩。
DeepMind在YouTube上发布了相关的视频介绍,其中也有我们小时候经常玩的接球游戏。在刚开始接触这款游戏的时候,DQN的成绩十分糟糕,接几次就继续不下去了。
(图片来源于:Google)
但是经过600多次的“训练”后,奇迹发生了,DQN不仅可以流畅操作,而且还充分利用游戏的小技巧,进行更加高级的游戏玩法,可谓进步十分明显。而这些进步,都是DQN自己总结并加以运用,期间没有人类干涉过。
(图片来源于:Google)
据DeepMind的官方说法,能让DQN学会玩电子游戏的关键算法名为“异步评价器算法”(Asynchronous Advantage Actor-Critic)简称A3C。简单点来说,这个算法可以让DQN自行判断游戏界面的情况,并通过“大型分布式深度强化学习系统”学习游戏的玩法和规则。最后就是通过不断训练和学习来提高运算水平,从而达到“玩好游戏”的地步。
(图片来源于:Google)
尽管现在看来DQN可以游玩&学习的游戏对于人类来说可能有点过时,也玩不了像RPG、ADV或者MMORPG那样大型的游戏。但是正如游戏必须经过不断发展那样,人工智能也会不断进步。可能在将来某个时候,人工智能会跟人类共同享受游戏的乐趣,甚至我们可能会单方面被NPC虐呢。