有专家说,语音识别用途广泛,潜力巨大,但要真正实现人与计算机的自然交流却很难,它不仅需要高深的基础理论的突破,更需要大量的实际工作的积累。
语音交互就要实现?
1996年,IBM公司发布了VoiceType中文语音识别软件,首次将其语音识别产品介绍给中国用户;1997年9月,IBM推出了ViaVoice中文连续语音识别系统,标志着中文语音识别技术商业化进程开始启动。
然而,语音识别技术并不是一夜之间冒出来的神话,自从有了计算机,人们就开始了语音识别技术的研究,因此可以说语音识别的历史和计算机一样长。特别是在70年代前后,研究的脉络日渐清晰,贝尔实验室和IBM等都先后建立了专门的研究机构。今天这两家公司在这一领域都已取得了显著的成果,并且在商业上应用成功,贝尔实验室主要偏重于电信方面应用的语音识别系统,如电话查询等;而IBM则偏重于商务应用,因而在连续语音识别上取得了不小的成功。
不谈商业方面的应用,事实上,很多公司都提供语音识别的引擎(Engine),并且都表示能支持微软的SAPI。看一看SAPI 4.0SUITE就不难发现,微软在这方面的研究并不逊色,只是很奇怪它居然没有将成果商业化。微软同时提供了一系列引擎,如SpeechRecognition(语音识别)、Command&Control(发布指令并控制)、PhoneQuery(电话语音识别)、Texttospeech(文本语音转换)等。
今天,许多用户已能享受到语音技术的优势了,可以对计算机发送命令,或者要求计算机记录用户所说的话,以及将文本转换成声音朗读出来。尽管如此,距离真正的人机自由交流的境界似乎还很遥远。现在已有商用系统存在的主要问题是:系统鲁棒性还有待改进,如对于噪声环境下或方言的语言识别率和稳健性等都不尽如人意。
不可否认,语音识别技术还有一段路需要走,要做到真正成功的商业化,它还需要在很多方面取得突破性进展,这实际上也是其技术的未来走向。
语音识别难在哪儿?
计算机自动语音识别就是让计算机能听懂人说话。这一问题曾经被一位知名的美国教授称之为是“比登月还难”的科学难题。其实,人们很早就认识到语音识别对于人类生活的重要性。世界上第一台计算机问世之后,马上就有人想到要让计算机听懂人说话。所以说,语音识别的研究历史与计算机的发展历史一样长。计算机的发展已经经历了好几代,今天已经进入到了普通家庭。但是,语音识别方面的产品却迟迟未能进入市场。那么,它难在哪儿呢?
计算机语音识别是一个模式识别匹配的过程。在这个过程中,计算机首先要根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。而计算机在识别过程中要根据语音识别的整体模型,将计算机中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入的语音匹配的模板。然后,据此模板的定义,通过查表就可以给出计算机的识别结果。显然,这种最优的结果与特征的选择、语音模型和语言模型的好坏、模板是否准确等都有直接的关系。
一个语音识别系统性能好坏的关键首先是它所采用的语音模型能否真实地反映话音的物理变化规律,所用的语言模型能否表达自然语言所包含的丰富语言学知识。然而无论是语音信号还是人类的自然语言都是随机、多变和不稳定的,很难把握。这就是目前语音识别过程中的最大难点。
其次,模板训练的好坏也直接关系到语音识别系统识别率的高低。为了得到一个好的模板,往往需要有大量的原始语音数据来训练语音模型。因此,在开始进行语音识别研究之前,首先要建立起一个庞大的语音数据库和语料数据库。一个好的语音数据库包括足够数量、具有不同性别、年龄、口音说话人的声音,并且必须要有代表性,能均衡地反映实际使用情况。
有了语音数据库及语音特征,就可以建立语音模型,并用语音数据库中的语音来训练这个语音模型。训练过程是指选择系统的某种最佳状态(如对语音库中的所有语音有最好的识别率),不断地调整系统模型(或模板)的参数,使系统模型的性能不断向这种最佳状态逼近的过程。这是一个复杂的过程,要求计算机有强大的计算能力,并有很强的理论指导,才能保证得到良好的训练结果。
当语音识别系统对语音进行识别时,相对来说,其识别过程要比训练过程简单,对计算机的运算能力要求也很低,并且速度较快。这有利于实时地实现语音识别系统和进行商品化开发应用。
那么,制约语音识别技术发展的根本是什么呢?接受记者采访的清华大学王作英教授认为,语音识别的关键是其依据的模型和算法,模型算法是计算机描述语音的能力能否抓住人的语音的本质的关键。在语音识别领域,
认准语音识别的“内核”
来源:互联网 发布日期:2011-08-17 23:28:41 浏览:15658次
导读: 有专家说,语音识别用途广泛,潜力巨大,但要真正实现人与计算机的自然交流却很难,它不仅需要高深的基础理论的突破,更需要大量的实际工作的积累。 语音交互就要实现? 1996年,IBM公司发布了VoiceType中文语音识别软件,首次将其语音识别产品介绍给中国用...
上一篇:机器人知识传播活动知识问答
下一篇:语音识别技术
相关内容
- 爱立信中国区总裁方迎:构建新质网络 推动5G下半场实现卓越价值
- 华为本月底将有重磅发布,5.5G建设共识度提升,产业链迎来新机遇
- 华为携手联通完成5G-A技术落地 机构建议积极关注射频等投资机会
- 2024年年底中国5G连接率将超50% AI或催生新一轮终端换机潮
- AI重塑全球5G网络 通信业积极拥抱新趋势
- 美版苹果 iPhone 16 Pro 实测:5G下载超400 Mbps、平均增幅23.7%
- 东南亚多国邀中企合作开发5G网络,泰总理:愿同中方在多领域加强合作
- 5G 基带安全堡垒被突破,黑客可利用漏洞静默监视手机用户
- 华为发声、运营商力推!5G-A与人工智能融合 “移动AI时代”有望开启
- 消息称国内“通信大厂开始搞 5G SOC”
AiLab云推荐
最新资讯
- 苹果自研 5G 基带首秀,消息称 iPhone SE 4 明年 3 月亮相
- 当5G-A与AI融合,联接网络底座需不断创新与演进
- 2.2 Gbps:T-Mobile 刷新 5G 上传速度世界纪录
- 高通孟樸:以5G和AI正在加速推动多个行业的数字化转型和创新发展
- 马来西亚第二张5G网络花落U Mobile,华为有望拔得头筹!
- 高通孟樸:5G和AI的融合为新型工业制造带来智能化飞跃
- 爱立信中国区总裁方迎:构建新质网络 推动5G下半场实现卓越价值
- 华为杨超斌:5G-A 释放移动 AI 无限潜能
- 爱立信中国区总裁方迎:5G发展仍面临两大挑战,“新质网络”将创造“新质价值”
- 东南亚多国邀中企合作开发5G网络,泰总理:愿同中方在多领域加强合作
本月热点
- 如何买到便宜大碗的 5G 套餐?聊聊你也许不知道的 CPE、MiFi 和物联卡
- 5G-A商用加速:北京运营商齐发力,创新应用场景欣欣向荣
- 美版苹果 iPhone 16 Pro 实测:5G下载超400 Mbps、平均增幅23.7%
- 消息称国内“通信大厂开始搞 5G SOC”
- 精彩回顾 | 5G-A与AI融合产业论坛行业大咖观点
- 全球5G标准必要专利排名出炉:中国企业占据半壁江山,华为、中兴、小米成“国产三强”
- 爱立信中国区总裁方迎:5G发展仍面临两大挑战,“新质网络”将创造“新质价值”
- 东南亚多国邀中企合作开发5G网络,泰总理:愿同中方在多领域加强合作
- 消息称苹果首款自研 5G 芯片将有“短板”:不支持毫米波
- 高通孟樸:5G Advanced与AI 开启智联“芯”时代
热门排行
-
5G助力仓储配送:实现立体智能仓储、AGV智能配送 | 创新场景
阅读量:17393
-
华为发声、运营商力推!5G-A与人工智能融合 “移动AI时代”有望开启
阅读量:10685
-
当海外华文媒体遇见中国首座5G煤矿:数智转型就在眼前
阅读量:8061
-
爱立信:高性能可编程网络是创造5G新价值的关键
阅读量:7172
-
如何买到便宜大碗的 5G 套餐?聊聊你也许不知道的 CPE、MiFi 和物联卡
阅读量:4106
-
5G-A商用加速:北京运营商齐发力,创新应用场景欣欣向荣
阅读量:4023
推荐内容
- 2024山东国际玻璃工业技术展览会
- 2024第二十二届中国广州国际汽车展览会
- 2024年阿尔及利亚国际暖通空调制冷展览会ALGERIA
- 2024第12届中国(青岛)国际茶产业博览会(华巨臣茶博会)
- 2024阿尔及利亚国际建材展
- 2024 第二十三届新加坡国际石油及天然气展览会暨研讨会
- 2024年荷兰阿姆斯特丹船舶游艇设备展览会METS TRADE
- 2024第12届巴基斯坦(卡拉奇)国际防务与军警展
- 2024年俄罗斯莫斯科电力、电网技术展览会
- 2024(京津冀)水果产销对接会
- 2024第二十一届北方(烟台)国际果业博览会(北方果博会 NIFIE)
- 2024第十六届中国(上海)振威国际化工装备博览会(CTEF)
- 2024第七届欧洲(德国不来梅)国际空间技术展
- 2024第十七届上海国际电池工业展览会(振威电池展 CNIBF)
- 2024第二十届上海国际充电设施产业展览会(振威充电设施展 evse)
- 2024第十一届浙江义乌国际智能装备博览会
- 2024第89届全国药品交易会(药交会 PHARMCHINA)
- 2024年中国北京国际高端食品饮料博览会
- 2024年中国(北京)国际有机绿色食品展览会
- IADE2024第三届突尼斯(杰尔巴)国际航空航天与防务展
- 2024年土耳其温室农业展土耳其畜牧机械展GrowTech Eurasia
- 2024中国北京名酒节暨世界葡萄酒博览会
- 2024第十三届杭州国际跨境电商交易博览会(跨交会 ICBE)
- 2024中国健康营养博览会(秋季)(NHNE)
- 2024乌兹别克斯坦食品及包装展 UZ PROD &INTER PACK
- 日本第45届国际建筑建材与家居材料展
- 2024中国国际制造业数智化博览会
- 2024第29届深圳国际服装供应链博览会(秋季)(FS展 Fashion Source)暨AW深圳原创设计时装周
- 2024越南(胡志明)轴承展览会
- 2024越南(胡志明)橡胶机械及塑料展览会
- 2024越南(胡志明)五金机械展览会
- 2024秋季中国(广州)国际茶业博览会
- 2024越南(胡志明)电机及线圈展览会
- 2024越南(胡志明)电线电缆展览会
- 2024越南(胡志明)润滑油及应用技术展览会
- 2024越南(胡志明)焊接与切割展览会
- 2024越南(胡志明)电池产品展览会
- 2024中国国际天然提取物和健康食品配料展览会(FIC-健康展2024)暨第23届全国秋季食品添加剂和配料展览会
- 2024厦门国际眼镜业展览会(厦门眼镜展)
- 2024第十八届中国宁波中小工厂展览会
- 2024越南(胡志明市)国际工业技术装备及产品展览会
- 2024深圳国际照明展览会
- 2024越南(胡志明)煤矿技术设备展览会
- 2024第20届越南胡志明国际工业展览会
- 2024第二十二届中国(北京)国际医疗旅游展览会(正和医疗旅游展 CMTF)
- 2024越南(胡志明)金属及冶金展览会
- 2024年越南国际制药装备及医疗器械展览会
- 2024越南国际表面处理及涂料涂装展览会
- 2024越南(胡志明)国际复合材料展览会
- 2024越南(胡志明)工程机械设备展览会
- 2024越南(胡志明)锅炉及压力容器展览会
- 2024越南(胡志明)化工展览会
- 2024越南(胡志明)工业自动化及仪器仪表展览会
- 2024越南(胡志明)机床工具展览会
- 2024越南(胡志明)金属加工及焊接技术展览会
- 2024越南(胡志明)铝工业展览会