语音识别技术面临的问题-语音识别-人工智能实验室AiLab-中国人工智能网-Powered by AiLab.cn

语音识别技术面临的问题

来源：互联网发布日期：2011-08-17 23:29:08 浏览：20260次

导读： 凭心而论，语音识别是一项复杂的技术，特别对于汉语语音识别尤其如此。因此，尽管多年前就有众多公司和研究机构开始了语音技术，包括语音识别和语音合成技术的研究，但直到最近一两年，在国内应该说是今年，才开始有规模的商用。国外已经有了不少较大规模的...

凭心而论，语音识别是一项复杂的技术，特别对于汉语语音识别尤其如此。因此，尽管多年前就有众多公司和研究机构开始了语音技术，包括语音识别和语音合成技术的研究，但直到最近一两年，在国内应该说是今年，才开始有规模的商用。

　　国外已经有了不少较大规模的语音识别IVR系统或者呼叫中心的应用，然而在国内，虽然有将语音识别和呼叫中心结合起来的趋势，但仍没有多少应用。这其中虽然有诸多影响因素，但重要的一点就是汉语语音识别技术还不够完善。那么，语音识别技术要进入大规模商用，还要跨越哪些障碍呢？

　　■用户的独立性
　　所谓用户的独立性，就是语音识别软件能够识别有不同嗓音和口音的用户，而无需通过训练软件来使其识别一个特殊用户的声音。目前的许多语音识别软件，是基于标准的发音来进行识别的。而实际上，人们说话千差万别，发音也各不相同，特别对于有口音的语音来说，更是对语音识别软件提出了严峻的挑战。目前的语音识别软件大部分是通过自学习功能，不断的训练来达到软件对于特定用户语音的识别。

　　将来，语音识别软件的一个发展趋势就是加强处理性，可以识别在一定范围内的各种发音。而实际上，现在有许多语音软件公司在从事这方面的工作，尽量将所有可能的方言发音收入语音库。这样，无需经过专门的特殊训练，软件就能识别用户的发音。

　　■自然的语言能力
　　许多语音识别系统还具有自然的语言能力，这就是软件理解讲话者的能力。这种能力不仅表现在特定的单词上，甚至还表现在短语和完整的句子上。自然的语言意味着两点：第一，它可让用户用句子来表达意思。例如，为表达checking account，用户可使用有更多单词的自然句子，如I'd like my checking account balance。第二指用户可使用包含多义词的句子。例如，我们可说I want to transfer $500 dollars from my savings account to my checking account。这是自然语言的一个主要准则，用户可在一个单句中使用多个多义词。

　　有少数复杂的语音识别系统使用提示性对话。在这里，语音识别系统提示用户用一个单词或记号来回答。根据专门机构的调查，多数人更喜欢用约定俗成的自然语言，而不喜欢使用提示性对话。人们讨厌的是不完善的自然语言，当能使用完善的自然语言时，人们当然不可抗拒地选择了它。

　　■处理插入的能力
　　新增的插入的能力是语音识别软件的另一个主要进步。插入的能力允许用户在系统提示时中断系统，但系统依然能知道用户的请求。

　　这点对于实际的应用来说是有相当意义的。因为人们在说话时，总是在自觉不自觉地思考，经常会在打断语言的连续性，而插入一些补充性的语言。这样的语言，在语法上来说经常不正确的，常规的语音识别系统会很难处理这些语音。

　　■软件身份验证的能力
　　语音识别销售商最近还介绍了软件身份验证的能力，即根据用户的嗓音和语言特点，来达到识别用户的能力。这在实际中是一个非常有价值的特点，如可用于人事管理上。（高皓）

相关热词： 音识别技术面问题

语音识别技术面临的问题
来源：互联网发布日期：2011-08-17 23:29:08 浏览：20260次

相关内容

AiLab云推荐

最新资讯

本月热点

热门排行

推荐内容

在线客服

热门栏目HotCates

关于我们

版权声明

语音识别技术面临的问题 来源：互联网 发布日期：2011-08-17 23:29:08 浏览：20260次