【作者】 ;
【导师】 ;
【作者基本信息】 北京邮电大学, 计算机应用技术, 2010, 博士
【摘要】 研究人工智能在视频游戏(Video Game)上的应用和在经典游戏(Classic Game)上的应用目的是不同的。比如说研究经典游戏围棋(GO)的人工智能是为了产生挑战性最大的对手智能;而研究视频游戏的人工智能是为了产生既有挑战性又令人满意的游戏智能。本文中游戏的是指视频游戏。目前大多数现有的游戏智能是用有限状态机(FSM)实现的。由FSM实现的游戏智能有三个方面的弊端:高度依赖开发者的领域知识,不存在元编程的,没有规划和前瞻。在本文中,作者提出用CI(计算智能)的方法来生成既有挑战性又令人满意的游戏对手智能,该方法的最终实现是基于作者提出的“玩家的策略建模及对手的智能适配”的理论框架。本文使用的CI方法是指MCTS蒙特卡洛树搜索(Monte Carlo Tree Search)和UCT上界置信的树搜索(Upper Confidence Bound for Trees)2种算法。本文中两种prey/predator(猎物和捕食者)类型游戏Dead-End和Pac-Man被用作测试平台来验证所提出的理论。该论文的主要贡献包括:游戏智能的整体架构、玩家策略建模、对手挑战性智能适配、及对手满意度智能适配等方面。在游戏智能的整体架构的研究方面,提出了“玩家的策略建模及对手的智能适配”的理论框架,该框架被证明适用于“猎物和捕食者”类型游戏Dead-End和Pac-Man,并有可能应用于未来游戏的人工智能开发。在游戏玩家策略建模的研究方面,首先提出了在监督学习情况下对玩家策略进行建模(分类或识别)的方法,其核心步骤包括:属性选择、样例数据收集、数据噪音处理、属性子集选择、算法选择和训练评估算法。其次,提出了无监督学习情况下玩家策略的聚类、分类识别和评价的方法,其核心步骤包括:属性选择、样例数据收集、聚类算法选择、数据分组,以及用交叉实验进行聚类算法的选定。在对手挑战性智能适配的研究方面,首先提出了用普通的计算智能(straight-CI)来控制NPC(非玩家角色)生成对手智能的方法。其突出的优点是可以减少人的参与度并降低对领域知识的要求;缺点是智能的产生需要在线进行,占用大量的资源,故此方法仅适用于单机游戏。其次,提出了基于知识的CI (Knowledge-based-CI)来控制NPC生成对手智能的方法。该方法用普通的CI控制NPC所生成的数据来训练人工神经网络ANN (Artificial Neural Network),从而形成知识,使用经过训练的ANN(人工神经网络)来控制NPC。其突出的优点是离线完成训练、基于知识、计算效率高、及占用资源少,因此适用于大型多人网络在线游戏。