近期人机大战又在不断上演,这次比较巧的是,谷歌的AlphaGo在网络上化身Master,碾压各路9段高手,最后以60胜的成绩战胜了所有人类对手,也创造了有史以来第一次,人类在棋艺领域被人工智能全面碾压的情况。
而另一方,近期江苏卫视播出的《最强大脑》节目,也开启了人机决战的比赛,而在第一期以人脸跨年龄识别挑战的节目中,百度大脑以3:2的优势战胜了人类,人工智能也再次战胜了人类。
而这两场战役也引发了网友们对于AlphaGo与百度大脑谁更厉害的讨论,更多的人倾向于下围棋的AlphaGo应该更胜一筹,因为下围棋似乎难度更大,但实际上并非如此,这里我们来做一些科普。
深度学习到底是什么
AlphaGo与百度大脑的技术,其实师出同门,都是采取了最前沿的基于神经网络的深度学习技术。
传统的计算机技术都是线性模型,即输入一个值之后,就会获得一个唯一的答案。但是深度学习则通过模拟人脑的方式,将数据网络进行“分层”,通过监督学习的方式,给机器各种数据,不断反复训练,最终让机器给出一个最大概率的答案,如果答案不够准确,那么机器就会通过监督反复学习。
而阿尔法狗下围棋与百度大脑的人脸识别,背后都采用了深度学习的方法。
阿尔法狗下围棋的原理
我们这里不讨论具体的技术细节,而是讨论技术本质原理。
下棋这件事一直都是机器的难题,因为把每颗棋子可能的落子考虑进去,以输赢为结束,那么所有落子的可能性总数加起来比宇宙原子数还要多。早期的机器受制于、存储根本无法胜任如此巨大的挑战,因此能够挑战国际象棋大师卡斯特罗已经是非常不错,而挑战围棋则是天方夜谭。
而随着这几年硬件设备的发展,计算机的存储、CPU、集群运算等能力急剧提升,当年打败卡斯特罗的只是一台小计算机,现在则变成了集群计算机,计算能力从只能单打独斗阶段上升到了,可以用成百上千台计算机群殴的阶段。
而另一个关键点则是深度学习技术,深度学习技术,可以反反复复的训练与模拟对决,而以胜负为终结标志,有了学习反馈,因此可以模拟出成千上万个棋局,再日以继夜的学习后,最终达成大师水平。
也就是说集群计算+深度学习,让计算机大幅度减少了暴力穷举的次数,调试人员只需要不断修改算法模型,就可以获得最佳结果。
百度大脑跨年龄识别的原理
此次百度大脑所挑战的跨年龄识别,同样运用的也是深度学习原理,但是也有区别。
即使下棋用了深度识别,但是本质依然是暴力计算,只不过深度学习模型让其大大减少了无用的暴力计算程度。而图像识别并简单的非暴力计算就可以达成,因为面对太多的不确定性,每一张图片中都充满了太多意外的问题,例如光照因素、侧脸、脸部眼镜口罩等遮挡物,等等都会影响到机器的结果。
因此,长期以来,机器在各种棋艺上对人类有着颇多挑战,但是从没有看过机器挑战人脸识别的案例,正是因为难度极高,即使有深度学习的助力,依然不能立即取的立竿见影的成果。
此外,此次比赛是跨年龄识别,这更又是一个世界顶级难题,对于下棋的深度训练来说,最终可以通过胜负给机器一个反馈结果,机器可以有效的进行反复训练,直到胜出为止。但是人脸的跨年龄识别就没有这么幸运了,这其中的数据实在太少,训练数据难以收集。没有足够多的数据,基于深度学习的神经网络很难学习到跨年龄的类内和类间变化。
正所谓巧妇难为无米之炊。
而此次百度大脑挑战跨年龄识别,则是在数据稀缺的情况下做出的挑战,其通过更改各种算法策略,以及深度训练模型,最终实现了一个非常好的结果。
人脸识别难于下围棋,但引起的感受效果不同
机器善于做的就是做重复性的逻辑性工作,而对于围棋这种黑白分明,完全依赖经验的事情,对于机器来说其实更为容易,因为并不需要面对不确定的环境。
而像人脸识别这种工作就不是如此了,机器不仅能够依赖的经验有限,更需要面对随时出现的不确定性,因此整个攻克难度依然巨大。
当然,归根到底上述所说的都只是方向上的问题,人工智能再人脸识别的这个研究方向整体上,难于下棋。因此,人脸识别要想取得一点点的进步,所需要花费的代价比下棋的代价大多了。
下棋是机器所擅长的领域恰恰又是代表着人类的智力巅峰,因此给我们所有人造成的震撼也就更大一些,而人脸识别则是机器的弱项,但又是我们每个人与生俱来的能力,并不能让人产生很大的震撼,因此甚至会有人认为下棋的难度大于人脸识别,这不过是站在人的立场上去考虑问题而已。
结语:
最后,我们需要公平的看待这两场比赛,AlphaGo与百度大脑,由于各自从属领域不同,因此不存在谁优谁劣的说法,只不过是从人的立场上去看,产生的主观感受不同而已。
事实上是这二者的表现,均体现了人工智能在不同领域的顶尖水平,都值得尊敬。