最近被微软收购的一家深度学习初创公司Maluuba的研究人员开发了一套人工智能系统,不管是人类还是电脑,该系统都已成为第一个在吃豆人游戏中获得999990分完美成绩的玩家。利用深度学习开发的程序击败电子游戏系统并不是什么新成就,但仍然值得注意,原因有以下几点。
首先,它之所以引人注目,是因为它所选的游戏类型。上世纪80年代的街机游戏并不是为了被打败而设计的,它们的设计初衷是为了让人们能够宅在家里玩。而当吃豆人游戏Ms. Pac-Man版本发布的时候,它实际上比原来的吃豆人Pac-Man更难预测,所以玩家要想打败它就更难了。
第二点,或许也是最值得关注的一点,是研究人员用来解决吃豆人游戏的方法。与其他研究人员所做的不同,这支团队并没有开发一个单独的智能代理来学习整款游戏,而是使用了许多较为简易的智能代理来学习这款游戏的某一个方面。例如,对于游戏中的鬼魂行为、水果行为、颗粒行为等,都由智能代理去学习。
有超过100个智能代理参与其中,每个单独的代理都会根据自己关注的那个部分,来判断吃豆人应该会遵循的一套行动设定。然后,这些设定就会被汇总起来成为程序,这个程序会根据所有成果的加权平均偏好来决定吃豆人的行动。
“通过以这种方式分解问题,学习变得更容易了。”其中一名研究人员在视频中解释道,“现在的情况是,很多智能代理学会了简单的任务,而不是只有一名代理学会了单项复杂的任务。”研究人员认为,把复杂的问题分解成更简单、更小的问题,可以让深度学习系统更容易处理复杂的行为。反过来,对于人工智能在未来可能会应用到的现实任务来说,这种方法也是可取的。研究人员称,即使一个问题只能被分解成两、三个部分,也可能会令复杂问题“简单化”。