文 / 李志飞 出门问问创始人兼CEO
《奇点临近》这本书的作者叫雷·库兹韦尔(Ray Kurzweil),他自称是一名未来学家,他说2020年机器的智能会跟人类的智能一样,到2045年,机器智能会超过人的智能。我以前是抓住所有的场合去批驳这个东西,说他是骗子,在美国学术界,没有人会关心一个未来学家说的东西。
而且我跟作者本人聊过,因为他当时在谷歌呆了2年半了,我没看他做出来任何东西,我问他怎么样能达到你说的2045年这种程度,结果我发现他的认知还停留在上世纪70年代,他不是一个科学家,他是一个未来学家,他是没有执行路径的。
所以我天天跟人家说奇点是骗子理论,但似乎没人认真听我说,尤其是媒体。但凡稍微靠谱一点或者真正做过一点AI的人都会看出问题。我想从工程师和科学家的角度去阐述一下人工智能到底离我们有多远,或者说我们究竟可以实现怎样程度的人工智能?核心是想讨论哪些可能是科幻的,哪些可能是现实的。
哪些靠谱,哪些不靠谱?
未来的人类智能跟机器智能互相融合,这点是靠谱的,我认为未来的人类智能是上帝给你的智能加上机器外延给你的智能。以智能手表作为一个例子,以前的手表只是看时间,现在智能手表可以记录你的心跳、走了多少步,真的开始跟你的身体接触了,它慢慢成了人体的一部分。
另外一个例子,比较极端,就是手机,我之前开了一个玩笑说如果要现在的你做一个残酷的选择——要么放弃你的手机,要么放弃你的右手,你会选择放弃哪一个?我们会突然发现手机已经成为了你身体的一个外延,回到这个残酷选择,这辈子要么保持手机,要么保持右手,我相信很多人真的会放弃右手。
李志飞 出门问问创始人兼CEO
至于有很多论调谈的机器智能会超越人类智能,我个人认为是不靠谱的,为什么?我们得先回过头看看原理是什么样的。
现在所有机器探索世界的方式首先得基于模型;其次要有数据,比如说做语音识别的话,第一步要去建模,这件事情科学家首先会大概理解一下人类去识别语言的时候是怎么回事,人类发音是怎么回事,哪些声音需要我们在意,哪些不需要,了解这些原理后我们才能去给机器建模。
模型建出来后,另外一个很重要的部分是我得要有数据,这就是为什么做语音识别,我们必须要有传感器和麦克风,只有这样声音信号才会被收集到,然后你还要有采样和过滤的能力。
所以整个过程是这样:先要有模型,有数据,最后才是计算执行。当然这里边用到了深度学习和机器学习,视觉、语音、翻译、包括AlphaGo都是类似的思路,但不可能直接说机器会自主学习,那都是扯淡。
为什么机器智能无法超越人类?
那人类是如何探索世界的?我觉得有三个层次。
首先问自己一个问题,你觉得自己是不是比5年前更聪明了,或者说比你还是小孩子的时候更聪明了?我相信很多人会有这种感受,所以智商不是一个固定的数值,人类所谓的智商是通过不停地跟物理世界进行交互得出来的,这是人类探索世界的第一个层次——感知和经验。
第二个层次,你接收到这么多的信息,你会去思考、去理解。而感知跟理解是不一样的,比如说我的演讲,如果我普通话好一点、话说得慢一点,六七岁的小孩也会知道我说的每个字是什么,这就是语音识别,但是他不会理解我在说什么,因为他还没跟物理世界有过太多的交流,他可能能感知,但他没法理解。
第三个层次在于表达、情感、创造和协作。人类跟动物很大的区别就是人类创造了语言,这点真的很重要,动物到底有没有语言,我们没法证明。人之所以为人,一方面是人类能够思考,其次是人类可以由此输出想法,而想法是虚拟的。
我觉得有一个观点讲得特别好,就是人类厉害的地方是我们相信想法。比如说货币,钱其实是虚拟的东西,还有法律,它也是一个摸不着的东西,是一个虚拟的想法,但是人类很伟大的地方是我们居然能在这点达成共识,我们真的相信可以通过货币去交换东西,大家也都愿意遵守法律。更不要说我们还有情感,我们可以体会忧伤、苦恼和欢乐。
如果说我们想去创造一个机器跟人一样有智能甚至超越人的智能,到底怎么做到呢?太多地方做不到,语音识别能做是因为我们可以把语音信号数字化,但还有很多东西没法数字化,比如我们的心理活动和情感,这些是没法数字化或者说还不知道怎么去数字化,因为它是务虚的,算法没法做出一个传感器插在你的脑子里,然后把你的思维互动记录下来。
即便能够数字化,虽然这听起来很滑稽,但还有一个东西很关键,它能决定很多东西,那就是带宽。比如你每天都会拍照片、发朋友圈、把好玩的东西分享给你的朋友,这都是数字化的过程。
但是你每天还有非常多东西是没有被数字化的,你一天经历了这么多的事情,看到这么多物理世界的内容,但真正数字化的内容可能只有亿分之一,或者千万分之一。另外一个问题是,这些内容也没法进行很好地传输,现有的传感器材料没法把真正复杂的智能数字化。
最后一点是人类有直觉,就是说很多东西第一眼你就能判断好还是不好,而机器的世界一定是基于推理的世界,它没有直觉,所以它很难去感知,跟不用说去理解。理解本身是很难去计算机化的,因为计算机一定是追求量化和数字化的,它没有任何可以模糊的地方,如果你不能告诉它什么叫理解,它就没有一个目标函数。
所以我们最基本的自然语言的沟通能力机器都很难做到,更不要说后面的创意、情感、协作、艺术这些人类非常微妙的东西,机器是不能微妙的,机器必须要非常离散、结构化和数字化。
出门问问是一家人工智能领域国内领先的创业公司,去年10月获得谷歌的C轮投资,创始人李志飞是美国约翰霍普金斯大学的计算机博士,创业之前是谷歌总部的科学家。
近期,李志飞作客中欧创享+,为二期的同学们做了长达两个多小时的创业干货分享,我们节选李志飞谈人工智能的部分内容在微信上跟大家分享。