在纽约约克敦海茨的IBM实验室,可以一瞥正快速到来且人们期待已久的人工智能。这里是Watson的家,它在2011年称霸智能竞赛节目Jeopardy!。初版Watson还在这,大概有一个卧室大,10台冰箱状的机器组成了四面墙。这些机器内部的小细孔可以让技术人员们连到机器后面的线缆上。而且这里面很温暖,就像这个集群活过来了一样。
现在的Watson发生了天翻地覆的变化。它不再只存在于由十几台机器组成的集群中,而是在由开源标准服务器组成的云中,一次运行数百个人工智能“实例”。和所有云端化的东西一样,Watson要同时服务世界各地的客户,这些客户通过手机、桌面机或数据服务器连接。这种人工智能可以按需扩大或缩小规模。
随着人们的使用,人工智能会得到改善,Watson正变得越来越聪明;它从一个实例中学到的东西会立即传输给其他实例。它不是一个程序,而是由多个软件引擎组成的集合体,它的逻辑推导引擎和语言解析引擎可能使用不同的代码,运行在不同的芯片上,位于不同的地理位置。所有这些部分都聪明地集合成了统一的智能流。
消费者们可以直接连线这一永久在线的智能,也可以使用驾驭了这一人工智能云力量的第三方应用。就像许多睿智的父母一样,IBM希望Watson能从医,因此有一款医疗诊断工具正在开发中也就不稀奇了。此前,大部分试图制造诊断AI的企图都以失败告终,但Watson真的可行。比如,你告诉Watson自己曾染上的一种病的症状,它给出了一张可能性由高到低的疾病清单。目前这一技能还没有直接提供给病人;IBM的合作伙伴们可以利用Watson的智能,从而开发对用户友好的界面,提供给订阅服务的医生和医院。“我觉得Watson很快就能成为全世界最好的诊断医生。按照现在AI技术的提高速度,这个时代出生的孩子长大成人时,就很少需要看医生了”,Scanadu首席医学官Alan Greene表示道。Scanadu是一家创业公司,正在开发一款借鉴了《星际迷航》中医用三录仪( tricorder),由云AI驱动的诊断设备。
医疗只是开始。所有大云服务公司以及众多创业公司都争先恐后地推出了类似于Watson的认知服务。根据定量分析公司Quid的数据,在2009年以来,AI吸引了超过170亿美元的投资。去年一年就有超过20亿美元投资给了拥有类AI技术的322家公司。Facebook和Google已经招募研究人员加入它们的内部AI研究团队。自去年以来,雅虎、英特尔、Dropbox、LinkedIn、Pinterest和Twitter都收购了AI公司。过去四年间,AI领域的私人投资以年增长率62%的速度增加,预计这一速度将延续。
在所有这些活动中,未来的AI正逐渐显现,它不是像《2001:太空漫游》中的HAL 9000一样拥有与人类相似的意识,也不是奇点论者宣称的超智能。未来的AI更像是廉价、可靠、工业化的亚马逊网络服务,让数字智能运行在所有事物之后,平时几乎不可见。这一通用设施将提供你所需要的智能,不多不少,恰如其分。和所有设施一样,AI会超级无聊,即便它转变了互联网、全球经济和文明。它会让无生命的物体活跃起来,就像一个世纪之前的电一样。如今,我们接受了所有电器。而新的实用性AI也将增强个人生活(加深我们的记忆,加速我们的认知)和整个人类的生活。通过加入额外的智能,所有东西都能变得有趣而不同。事实上,接下来一万家创业公司的商业计划书很容易预测:在某件事情中加入AI。这是了不起的事情,现在它出现了。
大约在2002年时,Google举办了一个小聚会,这时Google还没有IPO,重心完全放在搜索上。联合创始人拉里·佩奇被问到,“拉里,我还是不明白,市面上有这么多搜索公司。免费的网络搜索?你是怎么想到这个主意的?”当时Google还没有改善其广告拍卖机制来产生真实收入,也没有进行诸多大收购。一边用着Google一边想着它撑不了多久的人很多。但佩奇的回答道:“噢,我们其实在做一个AI。”
过去几年间,Google收购了14家AI和机器人公司,他的话也让人思考了很久。乍一看,你可能觉得Google正通过扩大AI投资组合来改善搜索能力,因为搜索贡献了Google 80%的收入。但也许正相反,Google并没有用AI来让搜索变得更好,而是用搜索让AI变得更好。每次用户输入查询词,点击搜索引擎生成的链接,或者在互联网上创造一个链接,用户都是在训练Google AI。当用户在图片搜索栏输入“复活节兔子”,并点击最像复活节兔子的图片时,他们都是在告诉AI,复活节兔子长什么样。Google 12亿搜索用户每天进行的121亿次搜索都是在不断训练Google AI。再对其AI算法进行10年的稳定改进,加上1000多倍的数据和100多倍的计算资源,Google将拥有一个无可匹敌的AI。到2024年,Google的主要产品将不是搜索,而是AI。
当然,这一观点很值得怀疑。近60年来,AI研究者们都预测AI即将到来,然而几年前,AI好像还是遥不可及。甚至有一个词被发明出来,描述这个结果糟糕研究发现更暗淡的时代:AI寒冬。是不是有什么事情真的改变了?
AI领域的三大突破
是的。近年来的三大突破推动了人们期待已久的人工智能的到来。
1、廉价的并行计算
思考天然就是一个并行过程,数十亿神经元同时运作来创造同步的皮层计算波。为了打造作为AI软件主要架构的神经网络,需要多个不同的进程同时进行。神经网络的每一个节点都大致代表大脑的一个神经元,与周边节点互动,理解接收到的信号。为了理解一个说出来的词,程序必须能听到所有相关的音素;为了识别一张图片,它需要看到每一个像素以及周边像素;这些都是需要深度并行计算的任务。但直到最近,通常的计算机芯片都只能一次处理一项任务。
这一切从十多年前就开始改变了,图形处理单元(GPU)芯片的出现,可以用来满足视频游戏中繁重的视觉和并行计算需求,即每秒需要多次重新计算数百万像素。这一任务需要一块专门的并行计算芯片,作为PC主板的补充。这种并行图形处理芯片奏效了,游戏性大幅飙升。到2005年,GPU价格大降。2009年,斯坦福大学的吴恩达(Andrew Ng,现已加入百度)及其团队意识到,GPU芯片可以并行运行神经网络。
这一发现释放了神经网络新的可能性,使得神经网络节点的连接数可达数亿。传统处理器计算一个一亿节点神经网的所有级联可能性需耗时数周。而吴恩达发现,一个GPU集群完成同一任务只需一周。如今,诸多使用云的公司使用运行在GPU之上的神经网络,比如识别照片中用户好友的Facebook,为其5000万订户提供可靠推荐的Netflix。
2、大数据
每一种智能都需要教育。就算是天生能进行分类的人脑,也需要看到十几个例子,才能分辨猫和狗。这一点对于人工智能而言更是如此。即便是编得最好的程序也需要玩至少一千局国际象棋才能表现良好。AI突破的部分原因是我们收集到的海量数据,为训练AI提供了所需的材料。巨型数据库、自追踪、网络cookie、在线足迹、TB级存储、十几年的搜索结果、维基百科以及整个互联网都成了让AI变得更聪明的老师。
3、更好的算法
数字化神经网络发明于20世纪50年代,但计算机科学家们花了数十年时间来驾驭100万到1亿个神经元之间庞大的组合关系。解决问题的关键是按层来组织神经网络。就比如识别人脸这个相对简单的任务。当一个神经网络中有一组比特被发现符合某个模式(比如眼睛)时,这一结果就会传输给神经网络的另一层来进一步解析。下一层可能会将两只眼睛组合到一起,然后将这一有意义的结果传输给下下一层,而下下一层又可以将这一结果与鼻子的模式联系在一起。识别一个人脸可能需要几百万个节点(每个节点都会生成供周围节点使用的结果),层数可达15层。2006年,当时供职于多伦多大学的Geoff Hinton对这一方法进行了一次关键改良,并将它命名为“深度学习”。他能从数学上优化每一层的结果,从而使学习速度加快。几年后,深度学习算法被移植到GPU上,速度提升巨大。深度学习算法并不足以保证复杂的逻辑思考,但它是目前所有AI必不可少的组成部分,包括IBM的Watson、Google的搜索引擎以及Facebook的算法。
这一由并行计算、大数据和深度学习算法组成的完美风暴使得进行了60年的AI一夜成真。而这一交叉也表明,只要这些技术趋势延续下去(也没有理由不延续),AI将继续得到改进。
随着改进的继续,这一基于云的AI将日益成为我们日常生活不可或缺的一部分。但这一切都有代价。云计算遵循收益递增的法则(有时候也被称为网络效应),即网络越大,增长越快。网络越大,对新用户的吸引力就越大,从而使得网络变得更大,这又进一步增大了吸引力,如此往复。提供AI的云也遵循同样的法则。越多人使用AI,AI就会变得越聪明。一旦一家公司进入这一良性循环,它就会变得更大,增长得更快,没有任何新兴竞争对手能与之匹敌。因此,未来的AI将由两到三家大的通用云AI公司统治。
半人半AI
1997年,Watson的前任深蓝击败了当时的国际象棋大师Garry Kasparov。在机器又胜了几场类似的比赛后,人类基本上失去了对此类比赛的兴趣。你可能以为这就是故事的结局了,但Kasparov意识到,如果自己也能像深蓝一样立刻访问此前国际象棋棋局的海量数据库,他能表现得更好。如果这一数据库工具对于AI来说是公平的,为什么人类不能用呢?为了探索这一想法,Kasparov率先倡导人加机器比赛的概念,即用AI增强人类国际象棋选手,而不是人类对抗机器。
如今这类比赛被称为自由风格国际象棋比赛,选手们可以使用任意对抗技术,可以单人上,也可以完全按照国际象棋计算机的要求移动棋子,或者如Kasparov 所倡导的成为“半人半AI”选手。“半人半AI”选手将听取AI提供的下棋建议,但通常会不顾这一建议,就像我们在汽车上使用GPS导航一样。在2014年的自由风格国际象棋冠军赛中,纯粹的国际象棋AI引擎赢了42场比赛,而“半人半AI”选手赢了53场比赛。现在最优秀的国际象棋选手就是“半人半AI”的Intagrand,这是一个由人类和多个国际象棋程序组成的团队。
但最令人惊讶的是:AI的出现并没有降低纯人类国际象棋选手的表现。相反,便宜、超级聪明的国际象棋程序激发了更多人来玩国际象棋,联赛场数增多,选手们也变得更好了。现在的国际象棋大师人数是深蓝击败Kasparov时的两倍多。如今排名第一的人类国际象棋选手Magnus Carlsen接受了AI的训练,他被视为最像计算机的人类国际象棋选手,同时也是有史以来排名最高的人类国际象棋大师。
AI定义了人类
如果AI能帮助人类成为更好的国际象棋选手,它也能帮助我们成为更好的飞行员、医生、裁判和老师。大多数由AI完成的商业工作都将使用专门的软件AI,比如某个AI能将任意语言翻译成另一语言,但在其他方面就无能为力了;能开车,但不能对话;或者能回忆起YouTube上所有视频的每一个像素,却不能预测用户的日常工作。在未来10年中,人们直接或间接打交道的AI中有99%会是高度专一的专家AI。
事实上,这并非真正的智能,起码不是我们所认为的智能。实际上,智能可能是一种倾向,尤其是如果我们认为“智能”是自我意识的话。我们希望自动驾驶汽车只专注于道路,而不是和车库争论。医院里的Watson应该专心于自己的工作,而不是想是否应该先主修英语。随着AI的发展,我们可能要预防AI产生意识,最高级的AI服务可能会以无意识来标榜自己。
相反,我们想要是人工智慧而非智能。与通常的智能不同,智慧专注、可度量,具有专门性。智慧也能以完全不同于人类认知的方式思考。这种非人类思考方式的有趣例子是,IBM研究人员在今年3月的西南偏南大会上演示了用Watson生成菜谱。其中一个菜谱是使用了酸橘汁腌鱼和油炸车前草的炸鱼和薯条。有人试吃了后,感觉味道还不赖!人类可能根本就想不到这种菜谱。
非人类智能不是问题,而是功能。AI的主要优点就是它们的异类智能。AI思考食物的方式与大厨不同,从而也能让我们以不同的方式思考食物,思考制造材料、衣服,思考金融衍生物,或是任一门类的科学和艺术。人工智能的异类性对我们的价值将比其速度或力量更大。
AI将帮助我们更好地理解智能。过去,我们会说超智能AI将驾驶汽车,或是在国际象棋大赛上击败人类。而一旦AI做到这些事情,我们就觉得这些成就并不足以称之为真正的智能。AI取得的每一次成功都重新定义了自己。
但我们不只是在重新定义AI的含义,我们也在一直重新定义人类的含义。在过去60年中,随着机械加工复制了我们曾以为只有人类具有的行为和能力,我们不得不改变之前将人类与机器区分开的看法。随着更多种类AI的发明,我们将被迫放弃更多被视为只有人类具有的东西。我们将在接下来的十年或一个世纪中面对一场永久的身份危机,不断追问人类存在的意义。最讽刺的是,日常使用的实用性AI带给人类最大的好处不是增加了效率,带来了丰饶经济,或是进行科学研究的新方式,而是帮助定义人类。我们需要AI来告诉我们是谁。