苹果和谷歌最近暂停在各自的数字助理服务中对部分音频内容进行人工分析,此前媒体对这两家公司的做法进行了报道,引发了强烈反响。
8月8日消息,据国外媒体报道,媒体获得的内部文件、截图和音频记录的缓存显示,为微软工作的外包商正在监听Skype用户通过该应用翻译服务进行的私人对话。虽然Skype方面曾表示,公司可能会分析用户想要翻译的通话音频,以改善聊天平台的服务质量,但它没有说其中一些分析将由人工完成。
媒体获得的Skype音频包括用户与爱人比较私密的对话,还有所谈论的诸如体重减奇怪以及彼此关系等个人问题。媒体获得的其他文件显示,微软的外包商也在监听用户对微软语音助手Cortana发出的语音指令。
苹果和谷歌最近暂停在各自的数字助理服务中对部分音频内容进行人工分析,此前媒体对这两家公司的做法进行了报道,引发了强烈反响。
“事实上,我甚至可以与你们分享其中的一些内容,这表明公司在保护用户数据方面是多么松懈,”一位向媒体提供文件内容的微软外包商表示。
媒体获取的音频片段通常很短,持续时间通常在5到10秒之间。但消息人士称,其他音频片段可能更长。
2015年,Skype推出了翻译服务,让用户能够在电话和视频通话中获得近乎实时的音频翻译。在该功能发布之前,《连线》杂志曾发表了一篇名为《Skype如何使用人工智能构建令人惊叹的新语言翻译器》的文章。
该产品也确实使用了人工智能,在媒体自己进行的测试中,翻译结果令人印象深刻。但就像许多其他人工智能或机器学习项目一样,事实证明,为了改进算法本身,有些本该由人工智能完成的工作是由人人工完成的。
根据附带的外包商屏幕截图,媒体获得的部分音频聂荣来自Skype的Android应用翻译功能。Skype翻译服务的常见问题中解答说,当用户使用这项服务时,“Skype会收集并使用你的对话来帮助改进微软的产品和服务。为了帮助翻译和语音识别技术的改进和发展,我们会分析句子和录音,并将更正内容输入我们的系统,以构建更高效的服务。”另一个部分补充说,“为了帮助技术学习和发展,我们会验证自动翻译并将任何更正反馈回系统,以构建更高性能的服务。”
这其中并没有说有人可以监听Skype各种应用程序的翻译功能所捕捉到的音频。微软的隐私政策也没有明确说明这一点。
“人们用Skype给爱人打电话,面试工作,或者和国外的家人联系。隐私国际组织(Privacy International)数据开发项目负责人弗雷德里克 卡尔特乌纳(Frederike Kaltheuner)在一次在线聊天中表示:“公司应该100%公开对人们谈话的记录方式以及使用方式。”
她补充说:“如果你的声音样本(无论出于什么原因)要经过人工审核,系统应该询问你是否同意,或者至少让你有拒绝的选择。”
隐私事务活动人士帕特 沃尔什(Pat Walshe)在一次在线聊天中表示:“(Skype翻译)的营销宣传语明确指的是使用人工智能,而不是人工监听。整个领域都需要监管审查。”
在看过Skype翻译对常见问题解答后,他补充说,“我已经看过了,我不认为它等同于透明公平的处理。”
微软发言人在一份电子邮件声明中表示,“微软收集语音数据是为了提供和改进语音服务,比如搜索、语音命令、听写或翻译服务。我们努力在收集和使用语音数据方面做到透明,以确保客户能够明智地选择微软何时以及如何使用他们的语音数据。在收集和使用客户的语音数据之前,微软会获取客户的许可。”
“我们还制定了一些程序,旨在与我们的供应商共享这些数据之前优先考虑用户的隐私,包括个人数据去除、要求与供应商及其员工达成保密协议,并要求供应商满足欧洲法律规定的最高隐私标准。我们将继续审查处理语音数据的方式,以确保我们向客户提供尽可能清楚的选择和强有力的隐私保护。”
微软表示,其Skype翻译中的常见问题和Cortana文档都很清楚,该公司使用语音数据来改善服务。不过,他们也没有说有人可能会听到这些语音数据。
根据截屏和其他文件,当微软向外包商提供一段音频进行转录时,他们还会得到一系列由Skype翻译系统生成的近似翻译。截图显示,随后,外包商需要选择最准确的翻译内容,或者提供自己的翻译,音频将被视为微软的机密信息。
“我听到的一些事情可以很清楚地描述为电话**。我听到有人用Cortana命令输入完整的地址,或者要求Cortana提供色情查询的搜索结果。虽然我不知道人们究竟可以用这些信息做什么,但我觉得奇怪的是,这些信息并没有在一个受控环境中处理。”
微软说,其只是通过安全的在线门户网站向外包商提供音频数据,公司会采取相应措施删除用户或设备识别号码等个人识别信息。
尽管这些信息很敏感,但有部分在家工作的外包商正在收听和处理Skype和Cortana的音频。
有外包商说,“一般来说,我觉得虽然我们没有用户的个人身份信息,如果微软用户意识到有人穿着睡衣坐在家里和网上的朋友就听到的内容大开玩笑,他们是不会喜欢这一点的。”