五年前,研究人员在能够解读图像的软件的准确性上有了一次突如其来但大幅度的飞跃,其背后的人工神经网络支撑了我们现在在人工智能行业所看到的繁荣景象。然而,我们仍远未达到《终结者》或《黑客帝国》中所描述的那种现实。
目前,研究人员正试图把重点放在怎样教机器把一件事做到极致。与人脑同时处理多个事物的大脑不同,机器人必须以线性的方式“思考”。无论如何,在某些领域,人工智能已经打败了人类。深度神经网络已经学会了交谈、驾驶汽车、玩电子游戏、下围棋、画画,以及帮助探索科学发现。
在以下六个领域中,人工神经网络已经证明,它们可以超越人类智能。
1.图像和物体识别
记录表明,机器在图像和物体识别方面的能力远远超过了人类。在一次测试软件识别玩具的能力的实验中,Geoff Hinton发明的Capsule网络的错误率几乎只有之前最低错误率的一半。在不同的扫描过程中,增加这些胶囊的数量可以让系统更好地识别一个物体,即使这个视图与之前分析的不同。
另一个例子来自于一个最先进的网络,它是在一个有标签的图片数据库上训练的,并且能够比一个博士生更好地对物体进行分类,而这些博士生在相同的任务上接受了超过100个小时的训练。
2.电子游戏
谷歌的DeepMind使用一种被称为“深度强化学习”的深度学习技术,研究人员用这种方法教电脑玩雅达利的打砖块游戏Breakout。他们没有以任何特定的方式对这台电脑进行教学或编程。相反,它在看分数的同时还控制了键盘,它的目标是得到尽可能高的分数。玩了两个小时后,电脑就成为了这个游戏的专家。
深度学习社区正在进行一场竞赛,训练计算机在几乎所有你能想到的游戏中击败人类,包括太空入侵者、末日、Pong和魔兽世界。在大多数游戏中,深度学习网络已经胜过有经验的玩家。电脑并不是通过编程来玩游戏的,他们只是通过玩游戏来学习。
3.语音生成和识别
去年,谷歌发布了WaveNet,百度发布了Deep Speech。两者都是深度学习网络,能自动生成语音。这些系统学会了模仿人类的声音,并且它们的水平随着时间的推移不断提高。将他们的演讲与真实的人区别开来,要比人们想象的要难得多。
牛津大学和谷歌公司DeepMind的科学家们创造了一个深度网络,LipNet,在阅读人们的唇语上达到了93%的正确率,而普通的人类唇语阅读者只能达到52%的正确率。来自华盛顿大学的一个小组利用唇形同步创建了一个系统,将合成音频与现有视频实现同步。
4.艺术品和风格的模仿
神经网络可以研究某一特定艺术作品的笔触、颜色和阴影的图案。在此基础上,它可以根据分析将原始的艺术作品转化为新的图像。
DeepArt.io就是一个例子,这家公司开发的应用可以使用深度学习来学习数百种不同的风格,你可以将它们应用到你的照片中。艺术家和程序员Gene Kogan也运用了风格转换,基于算法从埃及象形文字中学习的风格来修改蒙娜丽莎画像。
5.预测
斯坦福大学的研究人员Timnit Gebru选取了5000万张谷歌街景图片,探索一个深度学习网络可以做些什么。结果是,计算机学会了定位和识别汽车。它检测到超过2200万辆汽车,包括它们的制造、型号、体型和年份。这一系统获得的洞见之一就是,选民队伍的起点和终点在哪里。根据这一分析,“如果在15分钟车程中遇到的轿车数量高于皮卡车的数量,那么这座城市可能会在下次总统选举中投票给民主党人(88%的几率),”Timnit Gebru和他的合著者写道。
另一个机器提供比人类更准确的预测的例子来自谷歌的Sunproof项目,这项技术使用了来自谷歌地球的航拍照片来创建一个你的屋顶的3D模型,将它与周围的树木和阴影区分开。然后,它利用太阳的轨迹,根据位置参数来预测你屋顶的太阳能电池板能产生多少能量。
6.网站设计修改
在网站生成器中集成的人工智能可以帮助网站更新,并对网站进行有用的修改,比人类更快速、更准确。这种系统的基本技术提供了关于网站外观的普通用户的意见,这可以告诉设计师网站设计的好坏。如今,网站建设者们要么利用深层网络来修改设计,要么计划在不久的将来使用它们。该技术可以分析不同的模式,并根据以前的转化率和其他重要指标,创造更好的结果。
虽然我们距离实现矩阵级别的人工智能还差得很远,但企业正在努力快速提高神经网络的智能化水平。上面提到的项目只是这项技术的浅层次应用,新的想法和改进不断涌现,证明机器在完成任务方面正在不断超越人类的表现。