5月10日消息,据VentureBeat报道,自从电脑问世以来,科幻小说家们始终有这样的梦想:免提界面可对我们的任何问题作出回应,无需按下任何单键。现在,这样的未来正越来越接近现实,数十个行业的工程师们正努力设计能通过简单对话与人类互动的电脑和移动设备。这种技术被称为自然语言界面(NLI),苹果Siri、亚马逊Alexa、微软Cortana以及三星Bixby等就是典型代表,它们在接下来几个月将被应用到更多应用和程序中去。
然而众所周知,这些聊天机器人和自然语言界面也都存在“成长的烦恼”。以微软的Twitter聊天机器人Tay为例,它能通过模仿互联网学习交流,而在1天内就向Twitter用户发出种族歧视评论。免提人机接口必须能够理解人类语言,包括言辞中的错误、停顿以及口音等。由于语言有很大不同,聊天机器人必须学习适应自然语言的波动音调和应力。即使打造最简单的自然语言界面也很不容易,比如Skype实时翻译软件所犯下的错误就可以证明,我们还有很长的路要走!
要想开发更好的聊天机器人,机器人设计师们需要做些什么?
1.理解数字助理崛起
第一波兴起的聊天机器人要求用户适应它们的习性,而非它们反过来适应用户的习性。这是聊天机器人早期学习的重要阻碍,也是导致许多“首次用户”疏远它们的重要原因。可是如今,Alexa、Siri以及Cortana等数字助理正寻求利用现有数据补充语音功能,以增强语音识别技术,并改善我们对复杂语言模式的理解。这些聊天机器人使用数据挖掘和神经网络(通过识别大量数据中的模式学习执行任务的数学系统)来分析和模仿人类语言。
举例来说,Cortana会深入挖掘用户的电子邮件和日历表。很快,有了微软Office 365云服务,Cortana应该获得搜寻文件和查找相关文件的能力。银行巨头Wells Fargo和Visa也都在努力开发自己的语音和生物识别系统,它们可用语音下达指令,执行包括转移资金、查看账户余额等任务。
从这里开始,工程师们希望能将人工智能(AI)集成到不同的系统上,以便帮助聊天机器人响应不同的用户。这种技术的早期例证就是谷歌试图自动填写搜索查询:只要你开始打字,它就可基于你的位置、此前搜索、对你搜索历史的了解以及兴趣进行组合,自动生成搜索内容。可是,距离聊天机器人真正了解用户偏好、行为,并能预见到用户潜在需求,还有很远的路要走。没有这种“学习”,聊天机器人就无法真正参与到有意义的双向交流中。随着聊天机器人革命继续,用户将会寻找直观和积极主动的聊天机器人,它们能够了解与它们交流的人。
2.寻找聊天机器人通讯“圣杯”
对于改善聊天机器人来说,设备或项目支持多线程非常重要,也就是能够记住多种不同情况。如今,用户通常需要完成某个用例,然后再启动其他用例。可是这与正常对话不同,因为大多数人不会先结束某个对话,然后再开始其他话题。为了真正地模仿自然语言,用户应该能够与AI同时就多个主题进行多个对话。
当前实现真正自然语言界面的策略就是强化学习。不需要教授聊天机器人模仿对话,这种策略可能帮助它们真正理解语言。强化学习最著名的用例或许就是Alphabet子公司DeepMind开发的AI程序AlphaGo,它可以掌握复杂的围棋规则,甚至击败了人类围棋冠军。由于围棋中存在太多可能性,需要应用创造性才能获胜,这项活动被视为对AI最难的挑战。虽然强化学习依然处于起步阶段,但其可以大幅改善聊天机器人之间的互动以便解决问题,也能改善我们教授机器人对话的方法,甚至让它们参与到真人发起的对话中。
3.打造统筹聊天机器人
聊天机器人革命正接近“奇点”。近来,似乎每个小时都有聊天机器人涌现,仅在Facebook上,聊天机器人的数量已经超过3万个,而且每天都有新的聊天机器人诞生。可是,大多数聊天机器人都只有一技之长。它们要么能告诉你天气状况,要么可以访问你的日历,要么能够下棋,但无法同时执行多个任务。我们渴望开发这样的多功能聊天机器人,但依照这样的模式可能永远无法成功。
为了简化我们与设备沟通的方式,将来很可能只需要与设备顶部的某个聊天机器人沟通即可,它将会成为我们与激活程序之间的媒介。举例来说,我们不再需要银行聊天机器人检查你的账户余额,也不必使用旅行聊天机器人预定航班,而是从始至终都使用同样的聊天机器人完成所有任务。这意味着,这些聊天机器人不仅需要成为与人类聊天的专家,还要成为与聊天机器人进行交流的专家。
最后,我们很可能需要不同的策略相结合,才能让聊天机器人在不同的程序、设备以及人类用户之间无缝交流。可是,有一件事需要注意:聊天机器人正在到来,它们很可能改变我们如何与世界互动的方式。(小小)