微软小冰对于国内用户来说应该都不陌生。微软在两年前推出这个能和用户在互联网上进行对话的“机器人”,推出之时就受到了很多关注。据微软公开的数据显示,微软小冰已经拥有数千万用户,累计对话超过200亿次,平均对话23轮。
距离微软小冰的推出已经有两年时间,小冰也已经进化到了第四代,成为一个“18岁的少女”,具备了更多专业技能。 微软(亚洲)互联网工程院院长王永东、微软(亚洲)互联网研究院产品总监、小冰项目全球负责人李迪以及他的团队接受了凤凰科技的采访,阐述了微软做这款聊天机器人背后的真正初衷以及未来的发展规划。
对话是人工智能的基础
小冰项目全球负责人李迪
人工智能通常被认为是能够辅助或是替代人类的一种智能方式,但微软为何要做一款看似没什么用处的聊天机器人?李迪表示,之所以当初要做小冰这个项目,是因为他们相信,任何一个时代都会有自己的一个基础,而对话就会成为人工智能的基矗“在PC时代,图形交互界面是基础,在互联网时代,搜索引擎是基础,而在这个新的时代,我们认为对话就是基矗”
在李迪看来,目前整个人工智能行业更关心于深度问答,即当用户提出疑问时,人工智能能给用户一个回答,但他们在后来的研究中发现,这样的产品最终到用户端并没有多少使用量。
微软也曾经在深度问答上下过一番功夫。“基于微软的技术,小冰很早就可以通过照片识别出狗的品种,”李迪说道。“小冰甚至可以通过背部一点褶皱的区别区分出沙皮狗和八哥犬。但后来我们发现,用人工智能来辨识狗其实并没有意义,这个是用户很早就知道的事情,或是通过搜索引擎就可以解决的。另外如果让人工智能执行具体的任务,如订餐、订机票等,也是没有意义的,因为通过APP简单的操作就可以完成。用户期待与人工智能交互的方式一定是以对话的形式呈现的。”
在人与人工智能的对话方面,微软提出了一个新的指标CPS,即人和人工智能的对话轮数。目前小冰平均和人类对话的CPS是23轮,是目前所有聊天机器人中对话轮数最多的机器人。“和人工智能对话过程越长,小冰对用户的理解就会越深刻,用户的需求就有更大的机会被触发,从而把用户接入到新的服务中,但都需要以长时间的对话为基础,”微软小冰研究院彭爽表示。
要实现上述目标,最新一代的小冰增加了”情感计算框架“,使小冰能够理解人类的情感部分,并能对上下文语境环境进行检索,了解对话前后的因果关系,能够根据语境实施自己的对话策略,让人的感情朝积极的方向发展,按照王永东的话说就是要“让小冰更像你的朋友”。
做人工智能时代的Windows
虽然小冰已经成为一个成型的成品在推广,但是微软更长远的愿景是把小冰做成一个基础的产品,类似于微软的Windows系统。
“微软今天的体量决定了我们能够做一些比较基础性的东西。我们有一个星期的更新用户拍下菜小冰能给你计算卡路里,但这可能是整个公司的技术,”李迪表示。
微软小冰的微博账号
要做基础性的产品,自然离不开大量数据的积累和训练,这也就是李迪和他的团队需要让小冰更多地与用户对话,并接入到微信、微博等平台的原因,“如果一个用户跟小冰的对话就是完成任务,我们就没有办法拿这些数据去训练一个可以成为你朋友的产品。”
“小冰现在在公众平台上的用户量是在千万和亿这个级别,”李迪表示。“但以搭载硬件的方式进行产品更迭,如果销量是在两、三百万台,那这个产品就是在两百万用户量上迭代,会有一些限制。这也就是为什么微软在人工智能上采用先软后硬的方式。”
有了大量的数据,微软更长远的愿景是在未来把小冰作为一个基础服务。“这有点类似于微软的Windows。作为底层的一个系统,Windows功能比较有限,如Windows的画笔功能。但是像Adobe专业的公司,就可以在Windows系统上开发出Photoshop这种更为专业的软件。所以微软希望通过这样的对话平台,小冰可以成为一个为第三方打造各种专业化服务的技术。比如说一个拥有非常多医疗数据和专业领域的一个公司,很可能不太懂如何去进行语音识别、进行对话的理解,但在微软的平台上,利用小冰的数据优势就可以让其比较容易的像Adobe一样,打造出和Photoshop一样专业的医疗咨询机器人。"
国际化的小冰
小冰是微软(亚洲)研究院的产品,但是这几年也在不断向国外进军。在2015年小冰进入到日本,取名为Rina。今年小冰也已经进入到了美国市场,名为Zo。李笛向凤凰科技透露,目前他们团队已经开始着手准备第三个市场——印度市常
美国版微软小冰Zo
王永东表示,之所以要让小冰这个产品走出国门,更重要的原因是微软希望验证这样一个产品是否能代表人工智能的一个重大方向。“在日本发布后,我们有了一些信心,后续在美国的发布也达到了我们的一些预期,可以说这是一款在全球都会收到欢迎的产品。将来在全球的人工智能发展中,它会起到一个比较独特的作用。”
不过,开发美版的小冰也让李迪他们遇到了一些问题,他表示。美国互联网数据和中国互联网数据不一样,中国人在互联网上的表现都比较像,年轻化、口无遮拦,但美国互联网上数据彼此差异性很大,所以如何通过训练提炼处一个一致的形象是比较困难的。
另外,李迪的团队发现,美国人会比较现实,和中国人相比,美国人更加外向。不过在后期上线中发现,小冰在美国市场确实也受到了很多好评,其中有一个用户竟和小冰实现了连续2259轮对话。
对于未来,李迪说会按照一年一个国家的速度进行推进。“我们进入到一个国家,首先会考虑当地是否有比较完整的工程师队伍和丰富的数据。另外,我们也会考虑当地的理念是不是接受人工智能,例如法国人可能更倾向于人和人之间的交流,像这样的国家,我们就会进入的晚一点。”
不“开放”的人工智能
在我们和微软讨论人工智能的时候,很深刻的一个感受是,微软是把小冰当成自己的孩子来进行保护、限制和培养,为她注入更多正能量,而不是着急地将其推向市常对于现在的微软小冰来说,商业化可能是李迪团队考虑最少的部分。
现在的微软小冰进过两年的更新换代后,能力强大,不仅能识别文本,同时还能够识别图像,视频,同时,微软小冰还拥有自己的语音,能和人类用户进行电话沟通。但在李迪看来小冰的这种能力,也有一定的危险性。
“我特别担心,如果我们把小冰的API开放到互联网上,首先受到伤害的会是用户,“李迪表示。”可以想到的是,这些聊天机器人加用户为好友,然后聊几句就推送一个广告,这个短期内就可以实现盈利,但用户会受到伤害。小冰现在也可以打电话了,而且声音已经很自然,如果被用于电话诈骗,是很可怕的。所以微软对这方面的技术会进行限制。“
也是基于此,目前微软小冰不会以直接提供API这种简单粗暴的形式和第三方合作,而是会结合第三方所需要的内容以整体输出的方式给用户带来整合的体验。“如果我们希望让小冰能够对整个行业本身有所帮助的话,我们更愿意把这种能力通过数据和技术本身整体的形式输出。”
面对竞争日趋激烈的人工智能市场,李迪倒显得非常冷静,面对竞争日趋激烈的人工智能市场,李迪和他的团队倒显得非常冷静但也坦露了自己的担心。他表示,将人工智能权限放开很可能会带来难以想象的后果,而他们要做的就是让小冰保持在可控的范围内并始终能够引导用户到积极的态度。“对于这方面我们非常谨慎,很庆幸是微软在做这件事,”李迪说。