3月28日消息,据国外媒体报道,(编者按:Norman Winarsky是Ventures的副总裁,Bill Mark是科学研究发展组织SRI国际的信息计算科学部门副总裁。Norman和Bill合作支持了Siri的投资,同时Norman也是投资委员会的成员。这篇文章也是他们二位合作完成。)自从iPhone4S发布以来,Siri已经成为一种潮流。Siri是基于突破性的语音和人工智能技术的革命性消费软件产品。Siri作为一种消费习惯也广泛应用在其他消费媒体,甚至去年11月谷歌CEO施密特曾向美国参议院司法委员会作证表示Siri具有成为谷歌主要威胁的潜力,Siri也一度成为热播美剧《生活大爆炸》的剧情。
毫无疑问,Siri是苹果和史蒂夫乔布斯的杰作,将虚拟个人助理(VPA)带给亿万消费者,改变了人们看待智能电话的态度。研发团队的天才设计使得Siri超越了简单工具本身,并赋予其人类的个性和交互特征。正像某些与Siri的有趣对话:“Siri你喜欢我么?你知道哪能埋人么?”
我们都坚信苹果将持续改进Siri,未来的新技术也会不断创造出不同种类的VPA。举例来说苹果很可能面向开发者开放Siri的API,继而孕育出成千上万的与个人助理相关的应用。或许不久之后所有的应用都可以进行有实用价值的语音交互,用户也会渐渐习惯并将之视为顺理成章的功能。
暂且抛开赞美之词和理性思考,鉴于Siri的核心价值,那么接下来的发展方向是什么?
我们通常会这样认为:人们已经认识到VPA发展的广阔前景,Siri正好处于这个过程的第一步。下文描绘了我们对Siri未来的畅想。
首先,Siri的巨大影响力改变了整个产业,在SRI,我们将VPA技术看作是未来产品的核心特性,无论是智能电视、健康护理助手、虚拟教育助理等等,都将具备语音交互能力。VPA不会是一时风靡,而是计算领域长期致力的方向和终极目标。正如我们所言,SRI正在着手三项与VPA相关的研发,这三个项目已经有风险投资跟进,具体的新产品正准备发布,前景不可估量。
从技术角度来说,Siri真正的影响力是正如广泛宣传的“具有实用性的自然语言输入”,这一用语音代替键盘与计算机交流的方式是一个古老的梦想,历经三十多年才达到现在这种能与用户进行简单流畅沟通的程度。
开发一套具备“有限词汇和口语识别”能力的软件是第一步,公众熟悉的呼叫中心的自动应答系统就是这样首先登上历史舞台的。但一套能够让计算机对很宽泛的口语输入做出可信回应的软件,开发过程的确相当具有挑战性。Siri不仅需要语音识别技术,还需理解自然语言、文本的含义,并最终理解句意(这一点也是现今大多数人工智能研究的核心)。
继Siri之后,新的增强语音的人工智能将成为SRI投资重点,尤其是被美国国防部看中的项目,将着重增强处理复杂用户情况的性能表现。
那么对于那些即将面世的技术,VPA最需要具备的素质是什么?
下一代VPA将会与用户建立更加深入的关系。今天的Siri有一个使用语音对话的界面,但对话通常只能持续一到两个问答语句。将来的用户与VPA的对话会是复杂的带有多层次和更多细节的过程,主题涉及健康保健、旅游计划、购买衣服或者阐述计划书等复杂背景。
下一代VPA将有可能长时间保留对话内容,清晰记录人机讨论的细节、提供的答案、具体执行的任务,因为只有越多的进行学习,VPA才能显著改善性能。同样可以看到用户与Siri进行沟通时,提供的细节越多,Siri可以提供的服务也越具个性化。这样的结果是VPA变得更具前瞻性,可以持续关注用户潜在的可能需求,甚至在对话开始前就已经预测到用户的需求。
为展示新一代VPA的能力,现在让我们假设一段对话,真实使用者名为Lisa,VPA购物助理名为Nina,背景时某一天Lisa想买一个皮包:
L:Nina,我想买一个新皮包。
N:好啊!那你是想买上次那个Michael Kors牌子的么?
L:行,我喜欢Michael Kors牌,但是这次预算的上限是400元。
N:上次你是从Nordstrom购买的,Nordstrom现在仍然销售Michael Kors牌皮包,并且同时还有其他品牌款式,或许你会喜欢。
L:嗯,我觉得Michael Kors的一款巧克力色的包不错,标价329元,你发现其他商家有优惠价格么?
N:我发现确实有其他零售商销售的这款皮包标价只有310元,但退换货政策不如Nordstrom的好。
L:那好,我们就去Nordstrom买吧。
Lisa希望Nina具备所有关于购物方面的知识与能力,并且能够利用这些知识协助她进行正确的选择。而VPA也将从这段对话中进行学习,同时会保留这段对话作为历史纪录,为将来的购买活动 做准备。
正因为VPA的学习行为,它将变得越来越有效率。这种自行学习的能力经常被提及,却很少被实现。“在自然界中学习”(Learning in the wild)这一古老的梦想也刚刚开始成真,因为实现真正具备极强适应性的VPA非常困难。
当然,随着Nina的能力不断完善,Lisa越来越信任VPA。VPA这种应用不仅高度个性化,还将具备保护个人信息的能力。对于一个VPA,信任较安全和隐私而言更加属于核心需求,下一代VPA将会在这方面显著增强。
这一切是否听起来十分完美?幸运的是,一个能够与用户真正进行深层次和细节沟通的VPA不再只是科学幻想。SRI正在进行这些方面的研究,我们和研究伙伴正全力以赴努力让这些早日实现。
至于VPA是否会增进人类的智力水平这个古老的争议,可以追述到发明鼠标的年代,鼠标的发明者Doug Engelbart在1962年撰文阐述如下:
增进人类智力的意思是提高人类理解复杂问题的能力、为自己独有的需求提供解决方案、并最终解决问题。
我们相信VPA正是这方面的代表,VPA是目前我们能够看到的协助人类和机器交流的最佳的方式,并将最终改变人类看待机器的态度,正如Doug Engelbart50年前发明鼠标之后对世界产生的深远影响一样。(若姜)