凭心而论,语音识别是一项复杂的技术,特别对于汉语语音识别尤其如此。因此,尽管多年前就有众多公司和研究机构开始了语音技术,包括语音识别和语音合成技术的研究,但直到最近一两年,在国内应该说是今年,才开始有规模的商用。
国外已经有了不少较大规模的语音识别IVR系统或者呼叫中心的应用,然而在国内,虽然有将语音识别和呼叫中心结合起来的趋势,但仍没有多少应用。这其中虽然有诸多影响因素,但重要的一点就是汉语语音识别技术还不够完善。那么,语音识别技术要进入大规模商用,还要跨越哪些障碍呢?
■用户的独立性
所谓用户的独立性,就是语音识别软件能够识别有不同嗓音和口音的用户,而无需通过训练软件来使其识别一个特殊用户的声音。目前的许多语音识别软件,是基于标准的发音来进行识别的。而实际上,人们说话千差万别,发音也各不相同,特别对于有口音的语音来说,更是对语音识别软件提出了严峻的挑战。目前的语音识别软件大部分是通过自学习功能,不断的训练来达到软件对于特定用户语音的识别。
将来,语音识别软件的一个发展趋势就是加强处理性,可以识别在一定范围内的各种发音。而实际上,现在有许多语音软件公司在从事这方面的工作,尽量将所有可能的方言发音收入语音库。这样,无需经过专门的特殊训练,软件就能识别用户的发音。
■自然的语言能力
许多语音识别系统还具有自然的语言能力,这就是软件理解讲话者的能力。这种能力不仅表现在特定的单词上,甚至还表现在短语和完整的句子上。自然的语言意味着两点:第一,它可让用户用句子来表达意思。例如,为表达checking account,用户可使用有更多单词的自然句子,如I'd like my checking account balance。 第二指用户可使用包含多义词的句子。例如,我们可说I want to transfer $500 dollars from my savings account to my checking account。这是自然语言的一个主要准则,用户可在一个单句中使用多个多义词。
有少数复杂的语音识别系统使用提示性对话。在这里,语音识别系统提示用户用一个单词或记号来回答。根据专门机构的调查,多数人更喜欢用约定俗成的自然语言,而不喜欢使用提示性对话。人们讨厌的是不完善的自然语言,当能使用完善的自然语言时,人们当然不可抗拒地选择了它。
■处理插入的能力
新增的插入的能力是语音识别软件的另一个主要进步。插入的能力允许用户在系统提示时中断系统,但系统依然能知道用户的请求。
这点对于实际的应用来说是有相当意义的。因为人们在说话时,总是在自觉不自觉地思考,经常会在打断语言的连续性,而插入一些补充性的语言。这样的语言,在语法上来说经常不正确的,常规的语音识别系统会很难处理这些语音。
■软件身份验证的能力
语音识别销售商最近还介绍了软件身份验证的能力,即根据用户的嗓音和语言特点,来达到识别用户的能力。这在实际中是一个非常有价值的特点,如可用于人事管理上。(高皓)
语音识别技术面临的问题
来源:互联网 发布日期:2011-08-17 23:29:08 浏览:20260次
导读: 凭心而论,语音识别是一项复杂的技术,特别对于汉语语音识别尤其如此。因此,尽管多年前就有众多公司和研究机构开始了语音技术,包括语音识别和语音合成技术的研究,但直到最近一两年,在国内应该说是今年,才开始有规模的商用。 国外已经有了不少较大规模的...
上一篇:语音识别技术
下一篇:“语音识别”服务人类
相关内容
- 混乱、分裂、吞并:2024年AI的信仰之战
- 不只 5090,英伟达还发布了最小的「AI 超算」与最大的世界模型
- 面壁智能发布多模态大模型MiniCPM-o 2.6,让AI一直“睁着眼”
- 开启全新嵌入式AI领域,意法半导体让STM32惠益更多应用
- AI领先者共话2025:大模型迎来下半场 Agent、机器人成应用爆发点
- 马修·杰克逊:面对AI,没有什么工作是永远安全的
- 微软开源140亿参数小语言AI模型Phi-4,性能比肩 GPT-4o Mini
- AI风险治理亟需产业实践方案
- 三问“AI 2025”,五款大模型这样说
- AI唱主角的CES 2025:黄仁勋打头阵,落地应用成关键年
- 智源研究院发布2025十大AI技术趋势
- 英伟达批拜登政府:AI芯片出口限制计划只会损害美经济
- 人工智能革命推动电力需求激增,美国兴起天然气发电厂建设热潮
- 美媒纳闷:芯片限制下,中国怎么还能在AI领域取得这么大进展?
- 北京智源发布2025年AI十大趋势:世界模型有望成多模态大模型下一步
- 院士专家呼吁加强人工智能科普 培养学生算法意识
- 每年 CES 都在产生共识,今年的共识是「端侧 AI」
- 刘亮:数据已成为人工智能发展基础设施,加快高质量数据共享开放
- 在生成式AI时代“抱团取暖”:全球两大视觉内容巨头宣布合并,37亿美元图库巨头或将诞生
- GPT-4o最自私,Claude更慷慨!DeepMind发布全新“AI道德测试”
AiLab云推荐
最新资讯
- 2025, AI进入“飞天”时刻
- 人工智能热度再起,AI技术全面渗透是大势所趋
- 中国人工智能产业规模5年后或超万亿,这两个行业渗透力居首|言叶知新
- 院士专家呼吁加强人工智能科普 培养学生算法意识
- 业界热议AI时代企业合规新趋势 专家:管控借助生成式AI完成的合规质量尤为重要
- AI领先者共话2025:大模型迎来下半场 Agent、机器人成应用爆发点
- 面壁智能发布多模态大模型MiniCPM-o 2.6,让AI一直“睁着眼”
- 美媒:中美人工智能研究合作很活跃
- 一个大胆的猜测:GPT-5早已存在,只是被OpenAI藏起来了?
- AI有泡沫吗?上海交大高金教授蒋展:泡沫是相对的,中国头部AI公司比美国便宜很多
本月热点
热门排行
-
机构看衰、专家批评项目艰难,大语言模型会不会成为即将破碎的AI泡沫?
阅读量:6969
-
大模型落地路线图研究报告:大模型推动“人工智能+”高质量发展
阅读量:6367
-
人工智能对材料科学研究有哪些深远影响?谢建新院士分享
阅读量:6291
-
这个会议一天提及AI 500次,最后的结论是什么?
阅读量:6151
-
OpenAI 罕见开源!低调发布的新研究,一出来就被碰瓷
阅读量:5819
-
机构看衰、专家批评项目艰难,大语言模型会不会成为即将破碎的AI泡沫?
阅读量:5108