上周五,微软为它的人工智能机器人“小冰”举行了一场成人礼。
从2014年5月29日发布以来,“小冰”已经更新到了第四代,年纪也从16岁长到了18岁。过去两年多时间里,小冰在微信、微博、美图等平台上积累了上千万的用户,对话量超过了200亿条。
在相互的对话过程中,她也表现得越来越像一个正常人。比如她可以识别你发给她的图片,能在文字和语音之间进行切换,能够采用某种“策略”把你带出消极情绪,甚至,可以跟你打电话。
“小冰”已经成为了微软在人工智能领域的一个战略级产品,而作为这个项目的领导者之一,微软全球执行副总裁陆奇也从美国飞到了北京。在发布会结束之后,他跟我们聊起了小冰、微软的人工智能战略,还有如何在过去几年进行产品和业务转型升级。
陆奇认为,人工智能最终将表现在“对话”这个核心的诉求点上。当人工智能可以向电影《她》中那样与人类自然对话,与人类产生情感联系,那么将给整个社会带来巨在的变化。而微软小冰已经在这条路上走了两年多。
陆奇在进入微软之前,很长一段时间就职于雅虎。当被问到微软这个巨人应该如何转身,而避免雅虎的悲剧时,他觉得两个公司面临的情况并不太相同。雅虎的门户已经被搜索引擎和社交网络取代,而微软在借助云计算技术之后,把原有的产品重新推向了一个更为广阔的市常
以下是采访实录。
关于微软小冰
问:小冰一个很大的特色是它的情感计算框架。但是人类的情感是很复杂的,包括积极的情感、消极的情感。从目前现看,小冰基本上表现的都是积极的情感,与人平等的对话可能会涉及消极的表达,小冰在这方面会有学习吗?
陆奇:按照我们人工智能、大数据和机器学习技术,人的情感只要有数字化的介入,行为的规范基本上是可以学出来的。微软想要建立人工智能是代表正能量的,是为人类服务,帮助人类的。所以在这种情况下,我们想要建立的对话,采用的策略,基本上引导人类从他的消极或者负面环境(中走出来)。
问:小冰已经可以做到和人类打电话了。但人和机器之间文字的交流,实时的讲话,实时的了解人的语境,进行语音的反馈,这方面是挺难的吧?
陆奇:从某种意义上来讲,我们为人工智能所产生的对话能力,提出了一个新的标准,如何在实时性方向,非常智能的,就像人与人之间交流,确实技术上有很大的问题。
我们首先要听得懂,语音识别要非常清楚,速度得非常非常快;第二,交互的能力非常广,但是如何把这些技术,有难度的核心技术提高到一定的层次,把它集合起来,使整个的用户体验,真的像人与人之间智能交互,这是非常重要的。
刚才有一位女士上去试了一下,小冰可能今天没法测试说今天给我打电话的是个男的还是女的,有很多事情要解决。
问:为什么要赋予小冰这样一种实时对话的能力?
陆奇:人类跟任何种类不一样的地方,我们发明了语言,人与人之间近距离的交换,后来有了电话以后,可以远距离的交换,就是实时的交换,不光把人类进化,而且产生人类知识,人生整个演进过程中起了非常大的作用,人工智能会成为新的人与人之间交流的基准桥梁。
其实是蛮振奋人心的,虽然我们没有完全把技术问题解决,但是我们至少定义了这是一个新的里程碑,将来不管是机器人也好,它是一个自然的交流形式,完全可以连续实时的、可以不断的,毫无保留的讲。
问:我们离这个理想的自然交流状态有多远?
陆奇:根据我们现在的深度学习技术,只是一个时间问题。把数据输进去,不断地去训练,在2009年之前,错误率接近30%,这么几年已经从30%降到8%,可以预测再过一两年,就差不多1.5%左右,这也是我们技术上可以解决的。
我们的语音团队是全球性的团队,小冰在开拓性领域,我在美国的语音团队他们讲,他们必须把中文的优先级继续提高,小冰从技术上来讲,用户体验上是全球领先的。今天演示的时候,我们还是比较紧张的,错误率在8%左右,一旦听不准以后,接下来的交互完全不准确了。
问:在开发小冰日语版的时候,是基于中文翻译平台,还是从零开始,本地语言开发出来?
陆奇:从零开始,文化语言环境完全不一样。一开始我们跟项目负责人有过讨论,是不是这个产品只有中国玩的转?我们说至少试试,看哪个国家哪个语言跟我们接近,就是日本。试下来以后我们就知道了,这个产品肯定是全球化的。但是每个国家必须要从零开始,因为每个国家的语言和文化不一样,你没法搬过去。
问:现在做人工智能其实是用深度学习的方式,利用现有的很多样本。那微软是怎么样产生这样的样本的?人工给一个图片,或者一段话分析他的情感,给小冰来训练吗?
陆奇:从算法上来说,机器学习从整个历史上来讲有几种大的方式,一种是你有样本,真正做到人工智能的有非常大的限制。AlphaGo最大的创新,是使用了增强学习,可以自我学习,但是这也有它的限制,它的限制就是你探索的环境多大,如果探索环境不大的话,你学来学去,就是学一个封闭的系统。
我们公司的团队研发迁移,我自己个人也做了不少,人与人之间知识可以传输的,迁移也必须要做。最后还要解决一部分问题,人一部分的知识,我没有做增强,也没有人来教我,我自己琢磨。所以人的知识就是三部分把它总结起来,增强学习,这是三部分学习的方式,我们微软这方面做的研发做的比较多。
问:小冰各方面的能力,对情感的把握和去年相比有很大的提升,微软有没有想过把商业化给提上议程?
陆奇:小冰的盈利空间是非常大的,我们完全有机会创建新一代盈利形式,跟搜索广告一样,我觉得搜索广告可能是盈利最好的代表。
为什么搜索广告业务有效性非常强,同时用户体验可以维持在很高的水平,有几个层面,第一个,信息结构。搜索广告和自然搜索的结果是完全一样,都是针对关键词。第二,用户体验也是百分之百吻合;第三,搜索广告效益完全可以百分之百用精准的方法来测试;第四,搜索广告盈利体系是建立市场机制,每个广告商要不断地提高广告的质量。
像小冰这样的产品,它的战略意义,对整个生态系统的广泛度,在这个阶段我对团队的要求,基本上是完全注重用户体验和生态系统的健康。如果过早的做盈利,用户体验会受到损伤,整个生态系统会受到一些约束,我们觉得这个是不值得,在这方面,一定要把基础打扎实才行。
问:您刚刚提到了用户体验,要做用户体验可做的事情非常多,而且是一个很庞杂的系统工程,微软在内部有没有一套自己制定的标准或者是方法,把它变成有规划性的事情?
陆奇:我们整个工业创新的核心是在三个圆圈的结合,第一个圆圈是人类的需求;第二个圆圈是技术上是否可行;第三个圆圈是商业上能不能建立有效的商业,这三个必须都成立才行。其中人的需求是最难预测的,最难预测的是将来。
目前美国科技公司成绩做的最好,发展潜力最强,第一是Facebook,第二是苹果,这两个共同有共同点,他们都是产品研发,技术对他们来讲是一个工具,他们公司着重点如何把用户体验做的越简单、越精准。在中国,我个人觉得现在实力最强的是腾讯,腾讯完全是一个产品导向。张小龙以前有一个PPT讲微信哲学,我们把它翻译成英文,给我的团队去讲。
在新一代,在移动和云这块,手机也好,手表也好,这些数字化的用户体验已经不再是一个工具,是个体的延伸,我们对它要求是非常非常高。我个人觉得用户体验的简单、精准,对整个公司起着战略性的作用越来越大,技术当然永远是最重要,但是用户体验是下一代企业核心竞争力。
微软的传统文化是比较注重技术,这是好事情,我们还是继续重视技术,但是我们必须要改进我们的文化,不断地执着的追求用户体验的简单,世界上可能最复杂的事情把用户体验做的简单,做到简单的用户体验是绝对不容易的。
问:小冰后面有很多的技术支持,包括云计算平台,云平台在印度,包括像医疗、农业合作非常好,微软会在这方面和中国政府有合作吗?
陆奇:微软把云计算的技术投入是作为核心。如果没有云的技术,大规模的数据处理,包括语音处理也好,机器学习也好,都没法完全往前推。刚才你讲到在印度做医疗、农业,我们在中国是非常非常有信心,跟中国政府也好,跟中国国企也好,建立双赢的关系。
我个人并没有了解具体的案例,但是我是完全相信,我们公司是非常愿意。我个人自己也是参与很多在美国跟医疗有关、农业有关的项目,在美国找到合作伙伴,云计算、人工智能、大数据的技术真正推进社会往前发展,不光是商业,对整个社会都可以用这个方向推进。
问:目前在小冰上的研发投入大概有怎样的金额数量级?
陆奇:第一,打仗不是看人多,关键是要看团队的质量。第二,你必须运用当地的特殊的创新环境。第三,在微软基本上强调全球共享。
从小冰开发上来讲,我们现在的团队也是非常强,人数未必多,但是创新的质量、创新的速度是非常快的。团队也充分利用了中国独特的微信、微博这些平台。同时我们充分利用了全球的技术,语音是全球共享的,大数据的东西很多都是全球共享的,我们美国很多团队做了很多基础研究来支持这里的团队。我不能说有多少资金花进去,但可以说我们领兵打仗的能力多强,我们创新的环境是多么有效,我们全球的品牌是如何利用起来。
关于人工智能
问:从计算机科学家角度来讲,现阶段的解决方式是深度学习,生物学家对人类思考的过程并不是非常清楚,他们并不代表真正的智能,不知道从计算机科学家角度来讲,人工智能的方向是怎么样的?
陆奇:我们整个工业一直在往前走,但是也未必大家是100%有同样的定义。虽然人是目前为止智能行为最好的代表,但是我们工业要有一个比较更远大的想法。
我们为什么能发明飞机?我们不是想去重复一只鸟,鸟是怎么飞,我们把鸟飞的核心能力找到以后,我们建立一个比鸟更强大的实体,智能也是一样,人是怎么产生智能系统,把这个规则拿过来,同时用这个规则建立更强大的系统,为整个社会带来正的影响。
问:那微软认为如何去定义真正的智能呢?
陆奇:智能的定义是说我们有这样一个系统,可以自动的获取知识,来代表知识,可以自动的来完成他需要达到的目的,这就是智能。
如果按照这个定义,我们的工业在这个方向,我个人觉得已经走的很健康了,有几个大的环节要往前走,我们怎么建立一个系统,它有一个所谓广义的智能。
问:狭义的智能和广义的智能区别是什么?
陆奇:现在所有的智能大部分提的都是狭义的智能系统,比方说以前有象棋机,打败世界冠军了,这个象棋机虽然可以打败世界冠军,但是换一个别的游戏,再怎么简单的,它也不会下。我们现在要建立的是一个智能系统,可以完成很多很多任务,小冰是一个例子,但是有很多其他地方可以做。在微软我们也是投入了很多机器学习、人工智能方面的研发,我们的宗旨是通过微软的产品建立NGI(Next Generation Internet,下一代互联网),造福人类。
问:您觉得这个广义的智能系统什么时候会出现?
陆奇:我自己做人工智能也是花了不少精力,做了很多系统、算法、产品,我觉得我是比较乐观派,如果我们整个工业能够顺利往前走的话,25年,甚至于25年不到,我们就有一个系统是广义的,可以自动的不断获取知识,自动来解决很多世界上的问题,我觉得将来的世界是一个非常非常美好的世界,我个人觉得,中国在这个世界舞台上,能够扮演的地位和重要性会越来越大,因为中国人才、数据、创新的速度、创新的空间,我个人觉得有得天独厚的优势。
问:能跟我们介绍一下微软在机器学习、计算能力扩容方面的最新进展吗?
陆奇:微软在人工智能投入上其实是非常重视的,我们不光是我的团队,不光是做应用的团队,我们跟微软研究院有很大的合作,包括几方面,第一,人工智能的计算必须要推进;第二,我们必须对软件工具,你刚才讲了有CNTK,跟谷歌的Tensor Flow基本上是一样的,我们用CNTK具体实现微软的核心产品,包括像Bing的搜索引擎、Office365里面很多的智能软件都是用CNTK。
我们大规模投入FPGA,现在在微软,所有的Bing和Office365和Azure服务器,我们都插了FPGA的插件。FPGA可以帮助我们做加速处理,我们现在主攻的就是加速处理,深度学习,我们可以大规模的模型训练。
问:为什么这个插件如此重要?
陆奇:比方说一个车子在开,或者一架飞机在飞,必须在很短时间做决定,所以模型的速度必须非常快,同时模型又是很大,数量很多,FPGA给我们公司战略上带来很大的研究创新的效益,我们现在在Azure上,用GPU、FPGA加速的,在将来会在Azure上提供。
关于微软转型和新业务发展
问:您曾经在雅虎工作了很长时间,见证了这家公司从崛起到衰落。目前微软也在经历这样的转型,您觉得它可以从雅虎的身上吸取什么样的教训。
陆奇:回过头来看一下IT工业的历史,每隔20年左右,会有一个新时代出来,从PC到互联网到云,我们战略已经定位了。
微软跟雅虎有一个本质的区别,雅虎的产品,他的门户网站用户已经觉得不是很有用,社交网站、搜索引擎取代他了。而微软的核心产品是生产效益的软件和服务,生产效益软件和服务由于云,这个业务不光不会往夕阳走,而且会增长。
问:能够具体跟我们解释一下“云”带来这种新的变化吗?
陆奇:生产效益的软件在PC的时代,能够达到的已经在办公室里面,坐在办公室桌上可以有一台PC,所以微软历史上的顾客有12亿客户,都是坐在办公室里面,处理信息的那些人。
由于有了手机,有了云以后,实际上用手机、用云的人至少有三十亿到四十亿,这些人需要新一代的工具,帮助他们更有生产效益,一旦把微软的核心业务变到云之后,我们的业务不光是不会往下缩,或者变成没有效益,而且我们的空间变得更大。
微软确实在历史上是不同的地位,我们也看到这样的机会,云虽然对我们有一个的颠覆性,但是给我们带来更大的空间,看到这种情况,毫无疑问,把所有的公司统统往云里面转移。
问:这种转移对于内容产品开发和公司文化带来了什么样的变化?
陆奇:举个例子,我接管我现在Office团队三年不到,我接手的时候,Office每一年歇服一次,整个团队6个月没有人写任何程序,有6个月做计划。我们现在从今年1月份开始,整个Office每个月都写,而且已经变成一个服务,这对整个团队运营文化、开发文化,怎么做计划,真的是一个很大的改造过程。
我们的商业模式也和以前不一样了。Office原来的商业模式卖授权,现在是卖给人家服务,就是你每个月去买,或者每年去买,卖的方式怎么做到有效性也是不一样。
问:微软的云业务从三年前的500万美元变成了现在的95亿美元,其中大部分是由Office365代替了原来的Office产品。做为这个团队的负责人,怎么来保证在新老交替过程中保证KPI的公正合理,维持团队的稳定和士气?
陆奇:Office变成Office365,其实是两个层面同时并行,第一是现有的客户,从原来的产品转化成新的产品,也就是说你没有多赚钱,只是把原来赚钱的方式改成新的赚钱方式,这些钱还是微软赚的钱,同时客户的体验更好。
我们的KPI有两大类成绩和权益,业务的成绩有多少,这不代表将来,这代表你过去。权益是另外一对KPI,也就是说用户的数量有多少,我们比较重视的是数量,我们每个都看我们数量有多少,我个人推的最厉害的,一定要重视权益,光有成绩没有权益的话,你公司将来的前景是不会很长的,所以这两方面一起推,就是成绩和权益,衡量整体的KPI,这是现在Office团队转型过程当中最重要的一点。
问:怎么来保证客户会长期使用微软的产品,而不会转向竞争对手呢?
陆奇:现在云服务是一个实时性的,同样是一个Office,同样是一个电子邮箱,一旦在云端之后,你是怎么用你的邮箱,你平时邮箱里面送什么样的信息,这都是你的数据,但是我们完全可以做实时的分析,我们可以建一张知识图谱。
比方说你是销售团队,你跟你的客户是怎么合作的,你跟你的团队是怎么合作的。一旦建立这样的模式之后,我们可以做很多预测、很多自动化。
所以进了云端以后,我们以前在商业上也做了一个测试,一旦Office365,同样一个客户,我们觉得将来十年、二十年,可能是要百分之六百增长,我们可以把服务的层次提供的非常高,主要是靠人工智能,靠大数据来提高。