据TNW报道,Google今天发布了一篇名为“LargeScaleLanguageModelinginAutomaticSpeechRecognition(PDF).”的通知,承认Google利用其用户带来的大量网络数据——也就是Google.com上面的数据——来更新自动语音识别软件。
Google语音搜索通过机器识别和智能分析,可以识别用户快速说出的搜索词,用户还可以点击下拉框,矫正、修改关键词。利用大量数据背后的语言模式来统计不同文字的使用率,以网络上已有的的对话样本为基础。
庞大的语言模型对语音识别功能服务的开发和更新而言非常有用处,比如语音搜索功能和少数YouTube的语音转录服务,可以使用元语法(n-gram)来探寻语言模式的内涵。然后强调使用更多数据对以上两种功能进行“训练“的益处。具体使用情况取决于服务本身的可用性和数据量的使用情况。
上图为利用语言模型数据更新之后,Google上语言错误率和搜索错误率出现的情况,很明显呈下降趋势。
以上的意义在于,当你说“天气真好,我要出……”的时候,优秀的语音识别软件会判断后面极有可能是“门”或者“去”,而不是“老千”。