芮勇博士于2016年11月正式宣布加入联想担任CTO,负责联想的人工智能业务和下一代智能设备,此前其在微软任职18年,领导人工智能团队和微软亚洲研究院的所有工程团队。
在CES 2017现场上,芮勇和科技等媒体详细沟通了他在联想接下来的工作方向以及他对人工智能、VR/AR等的看法,这也是芮勇加入联想之后首次跟媒体沟通。
芮勇认为,联想是全球少有的几家真正从设备到云和人工智能都有投入的企业,所以联想很有机会做出一些有意思的事情。同时他透露,未来他的工作方向将围绕智能设备、智能的云和智能的服务开展。
芮勇认为,一些重复性、纯记忆的工作,机器会全面超越人类。但涉及到人类的想象力、创造力、抽象思维、各种信息和规则不清晰的情况下,机器是无法取代人类的。
以下为科技整理的芮勇沟通内容:
问:大多数人眼中,联想是一个专注在具体产品的公司,您的到来会给联想带来什么?
芮勇:过去这几年其实元庆一直在倡导一个口号和转型,就是把联想从设备device only要转变为设备+云,device+cloud。为了达到这一点,其实有很多的工作要做,并且这中间可能有很多是跟技术有关的,这可能也是我为什么今天会坐在这样一个位置上的原因。
光有设备可能它只是一个很冰凉的设备,它之后一定要有内容和服务,最好还能希望这个内容和服务是因人而异的,是个性化的,是懂得我们用户的。那它一定要有后面的人工智能的一些支撑。
我过去也从事了大概二十多年和AI有关的东西,从最早的图像识别、图片搜索,到今天做自然语言等等,我自己的感觉是我希望今后在联想研究院做这么几个大的方向的事情:
第一个方向是智能设备。
包括柔性设备,比如联想的ThinkPad,可以360度翻转的Yoga,2016年联想研究院推出的一款科研原型Folio,就是我有一个平板电脑,一折叠就成为一个手机,打开就是个平板电脑;包括AR,我们做的一款AR产品是PHAB2 Pro,它是第一款真正意义上的三维手机,可以把你虚拟世界和真实世界无缝地拼接在一起。
第二个方向是智能的云。和云最有关系的就是数据中心。10年以前我们从传统数据中心发展到虚拟数据中心,利用率上升到50%。这几年一个大的趋势叫做软件定义的数据中心,software defined data center,有三个很重要的部分——software defined network、software defined computing、software defined storage。软件定义的数据中心是智能云今后的发展趋势,这也是我想做的第二件大的事情。
这种software defined的好处有两点:第一,利用率可以从传统数据中心的30%和虚拟数据中心的50%提高到今天的80%,利用率大幅提高,成本就低了很多;第二,它的部署变得非常迅速。
第三个方向是智能的服务。智能的服务就更离不开人工智能了。人工智能是它区别于由自然界演化而来的人的智能,人工智能是一个非自然的、人做出来的,它希望计算机能够模拟像人一样的一些智能。
人工智能几个大的分支包括了像计算机视觉、语音识别,语音合成,属于人工智能的感知,叫做perception,但是人更重要的一个智能是认知,叫cognition,这个和另一个分支是有关系的,就是自然语言(NLU)的理解,这是它的第三个分支。第四个分支就是跟一些机器学习的算法是很有关系的,比如今年很热的深度学习,其实就是一些基础的机器学习的算法。在这几个方面联想研究院都会做大力的投入。
有了这些基础算法的支持,我们就有能力把智能的设备、智能的云通过智能的服务都串在一起。为什么联想做这件事情是一个很合适的公司?
首先,联想占据了device这个入口,我们看联想的结构,联想有三个大的business unit,一个是做PC的,全球第一。第二个是做手机的,全球很多市场都是名列前茅的。
其次,联想的第三大BU叫做数据中心集团。这个集团做的是云。
最后,我们的研究院,我们做创投的集团。我们在人工智能上有很多的投入,联想是Device+Cloud Powered by AI,是真正从设备到云和人工智能都有投入的,所以联想是很有机会做出一些有意思的事情的。同时我希望这三个元素可以互动,形成一个正反馈的过程。
问:您对于AR和VR这两种业务的前景怎么看?联想在这块有什么比较具体的布局?准备怎么去做?
芮勇:我刚才提到人工智能有很多分支,其中一个很大的分支叫计算机视觉,计算机视觉里有一个很重要的分支叫三维视觉,三维视觉包括了三维物体重建,三维环境重建。不管是VR也好,AR也好,最重要的技术基础就是三维视觉,所以AR和VR一定是人工智能的一个部分。
我对VR和AR怎么看?它们的应用场景不是完全一样的。VR可能对一些非交互性的、单边内容的传输会很有效果,比如说我们想看一个3D电影,你戴上一个VR眼镜可以享受一款非常好的3D电影,或者一款3D游戏,但是你可能不能站起来,就是VR和AR一个很不一样的地方是戴VR头盔的朋友,我建议你们坐在椅子上玩比较好,因为当你沉浸在VR世界里,一根线把你头拽住了,可能会摔倒。
AR是完全另外一个不同的场景,AR最重要的是增强现实,其实是把物理世界和虚拟世界无缝地给拼在一起,最简单的一个AR,比如我看到某人,突然忘了,这人好面熟,就想不起来上次在哪见的,有这个AR眼镜之后,它最简单的功能就是做出人脸识别,告诉我这是谁,上次我们是在哪在哪见的面,会免去很多社交上的尴尬。
但这个AR只是一个最初级的,它只是在物理实体的边上加上一些虚拟的信息,更有意思的AR是物理和实体能够相互交互。比如说我们现在打一款游戏。VR可能跟你现在这个房间是一点关系都没有的,但是AR游戏,我如果戴上AR眼镜,它其实是可以根据我现在这个会议室的物理场景给我设计一个打游戏的过程,我待会儿去另外一个会议室,回到我酒店的房间,物理场景不一样,它给设计的game也都不一样,所以我觉得这是一个非常不一样的地方。
所以,在我个人看来,从平台角度看,可能AR会是今后一个更大的平台,如果我们把几个垂直行业能落地得很好,这个可能是一个很大的平台,前景会非常非常好。我们在联想公司也好,联想研究院也好,我们在这方面都会有大的投入。
问:深度学习需要时间和大量的样本去记录,联想这些样本是如何获取的,是我们内部的测试人员还是我们会找大量的用户做调研?
芮勇:不仅仅是深度学习,如果把机器学习或者是人工智能要做好,有四个大的因素才能做得好。第一,算法要好;第二,运算能力要非常强大;第三,数据要非常好。
人工智能真要做得好,光前面三个也不够,要考虑和垂直行业怎么结合,怎么落地。无论是下棋、智能聊天、还是向某一个用户推荐一款电影,人工智能要落地,一定要和domaine knowledge发生关系。
那为什么在联想我觉得可以做这个事?
第一,我们有算法。我希望在我加入之后在算法上还会有大的突破。
第二,我们的运算能力很强。全球前500个超级计算机中间的99个是联想做的。
第三,有没有大数据?联想这么大的公司,内部的数据,外部的数据,各种数据都是非常非常多的。这些数据就可以使得我们能够训练我们的模型。
第四,因为我们是在全球有60多个分支机构,我们的产品遍布全球160多个国家,所以我们跟各个行业、各个国家有很多的接触。所以,我们对行业的知识也很了解。
问:这两天人工智能Master连续击败了60个人类的顶级棋手,您怎么看待人工智能为什么在围棋领域表现出这么快的进步?联想有没有可能计划在人工智能领域也开发一些这样的能够被大众快速感知、能够参与讨论的好产品?
芮勇:其实我希望大众对人工智能有一个比较冷静的看法,别把它捧得太高。人工智能是人的智能,有它强的地方,有它弱的地方。它强的地方就在于它的计算能力和记忆能力远超人类,这个东西我们没办法跟机器比的。任何一个领域如果有相应的清晰的规则,机器会全面打败人类,人类是不可能战胜机器的。如果今天还能侥幸说人类再赢机器一盘棋,可能再过几个月一盘棋也赢不了,因为这是一个必然结果,有规则的事情一定是机器比人强。
但现实当中,很多事情是没有规则或者规则不明确的,这个时候机器是很难打败人类的。比如机器会计算“鸡兔同笼”的问题,但它不会解“鸭狗同笼”的题,更不会解“鸡兔同屋”,因为它没有common sense,人类强大的地方在于我们有common sense,我们能去处理很多没有规则的事情。
人类的抽象思维力和想象力也比机器要强很多,这两个能力让人在很多条件没有完全存在的情况下去做推理,所以这是人强的地方。
问:现在有很多公司都在做人工智能,怎么样去评价这家公司做人工智能做得好不好?人工智能做得好与不好的评价标准,您觉得应该怎么衡量?
芮勇:这个问题可能从两个角度来看。人工智能公司中有一些是在做基础算法的,这些公司容易评价,因为有很多全球标准的数据机器,可以跑一跑看看谁的错误率低。
还有一类人工智能公司,是把基础算法应用在不同应用上,这些你去评价就是偏主观的了,因为没有一个很客观的标准。基础算法的用标准数据去做评价。真正做应用的,可能它的广度和深度都要看,当然最重要的是看用户买不买单。