文/出门问问CTO雷欣 出门问问NLP工程师李理
3月13日消息,人机大战第四局出现大逆转,AlphaGo对形势作出错误判断后,接连出现业余选手也不会犯的低级错误,导致落败。
DeepMind创始人Demis在推特发微博表示,AlphaGo在第79子时犯了错误,但是一直到87子才发现。短短几个子的时间,AlphaGo的胜率从70%陡降至40%以下,发现时为时已晚。
出门问问CTO雷欣称,这其中的原因很可能是由于AlphaGo在复杂情况下的判断还是不够客观,碰到没见过的下法(如今天的白78挖)时会犯错误,而且在犯错误的时候不能够及时发现,会接连出低级错误。对人类来说,如果犯了大错误,应该很快就会发现并且纠正,但是机器的反应都是连续的,不能做出及时调整,这也许是AlphaGo的一个致命弱点。
出门问问NLP工程师李理称,我怀疑是mcts的问题,这个问题导致AlphaGo只区分胜利和失败,但是剩多少和负多少它不区分。李理称,这可能是AlphaGo之前获胜也不多,失败就乱下的原因。
从专业技术的角度看,李理认为,如果一定要猜测,我觉得可能是开局主要靠value network,因为搜索空间太大,有可能在某些特殊的局面下出现非常差的结果。就像之前神经网络识别图片时也出现过很诡异的错误,还有人研究怎么构造让它识别出错的例子。
雷欣称认为,从谷歌的角度来说,这盘棋帮助他们找到了AlphaGo的一个弱点,以后可以更有针对性的去解决这个问题。如果不是李世石这种顶尖棋手,也许很久也发现不了这个弱点,因为水平悬殊太大根本没有机会逼得AlphaGo犯错误。从李世石的角度来看,这也是一个巨大的胜利,证明至少目前人类选手对战人工智能还是有机会的。人工智能虽然计算能力强大,但是还是会犯错误,并且是很低级的错误。这样,人类棋手不会把人工智能神话,以后对战的时候心态会更好。
(本文由科技小羿整理,转载需注明出处)