导读:导读: 伦敦人工智能公司DeepMind开发的一种算法能够在最开始并不知道游戏规则的情况下学会玩游戏,并且能达到超越人类的水平。该公司公布了有关这种算法的最新细节,并表示该成就向创建人工智能系统解决复杂的、不确定的现实状况迈出了一大步。 DeepMind将...
导读:
伦敦人工智能公司DeepMind开发的一种算法能够在最开始并不知道游戏规则的情况下学会玩游戏,并且能达到超越人类的水平。该公司公布了有关这种算法的最新细节,并表示该成就向创建人工智能系统解决复杂的、不确定的现实状况迈出了一大步。
DeepMind将这种算法命名为MuZero。它已经学会了下围棋和日本策略游戏将棋,还有一系列雅达利(Atari)经典视频游戏,均达到了超常水平。之前,DeepMind创造的许多算法能够掌握某一种游戏,但一直没有一种算法能够同时学会棋类游戏和视频游戏。而且DeepMind之前开发的掌握棋类游戏的算法阿尔法元(AlphaZero),首先要知道游戏的规则,但MuZero并不需要知道规则。