计算机自动语音识别就是让计算机能听懂人说话。这一问题曾经被一位知名的美国教授称之为是“比登月还难”的科学难题。其实,人们很早就认识到语音识别对于人类生活的重要性。世界上第一台计算机问世之后,马上就有人想到要让计算机听懂人说话。所以说,语音识别的研究历史与计算机的发展历史一样长。计算机的发展已经经历了好几代,今天已经进入到了普通家庭。但是,语音识别方面的产品却迟迟未能进入市场。那么,它难在哪儿呢?
计算机语音识别是一个模式识别匹配的过程。在这个过程中,计算机首先要根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。而计算机在识别过程中要根据语音识别的整体模型,将计算机中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入的语音匹配的模板。然后,据此模板的定义,通过查表就可以给出计算机的识别结果。显然,这种最优的结果与特征的选择、语音模型和语言模型的好坏、模板是否准确等都有直接的关系.
一个语音识别系统性能好坏的关键首先是它所采用的语音模型能否真实地反映话音的物理变化规律,所用的语言模型能否表达自然语言所包含的丰富语言学知识。然而无论是语音信号还是人类的自然语言都是随机、多变和不稳定的,很难把握。这就是目前语音识别过程中的最大难点.
其次,模板训练的好坏也直接关系到语音识别系统识别率的高低。为了得到一个好的模板,往往需要有大量的原始语音数据来训练语音模型。因此,在开始进行语音识别研究之前,首先要建立起一个庞大的语音数据库和语料数据库。一个好的语音数据库包括足够数量、具有不同性别、年龄、口音说话人的声音,并且必须要有代表性,能均衡地反映实际使用情况。
有了语音数据库及语音特征,就可以建立语音模型,并用语音数据库中的语音来训练这个语音模型。训练过程是指选择系统的某种最佳状态(如对语音库中的所有语音有最好的识别率),不断地调整系统模型(或模板)的参数,使系统模型的性能不断向这种最佳状态逼近的过程。这是一个复杂的过程,要求计算机有强大的计算能力,并有很强的理论指导,才能保证得到良好的训练结果.
当语音识别系统对语音进行识别时,相对来说,其识别过程要比训练过程简单,对计算机的运算能力要求也很低,并且速度较快。这有利于实时地实现语音识别系统和进行商品化开发应用。
那么,制约语音识别技术发展的根本是什么呢?接受记者采访的清华大学王作英教授认为,语音识别的关键是其依据的模型和算法,模型算法是计算机描述语音的能力能否抓住人的语音的本质的关键。在语音识别领域,固然有资金实力、人力资源等的竞争,但最根本是其关键核心技术——模型和算法的竞争。
制约语音识别技术发展的关键
来源:互联网 发布日期:2011-09-27 12:12:39 浏览:14374次
导读:制约语音识别技术发展的关键...
相关内容
- 脑机接口和 AI,一个硬币的两面
- 韩国研究团队开发出类脑芯片,能够自主学习并纠正错误
- 一切皆为虚假,一切都有可能 | 2024人工智能盘点
- 2025年手机芯片,可能不会采用2nm技术
- 我国脑机接口技术实现汉语实时编解码重大突破
- “脑控”智能设备、“意念对话” 脑机接口接入现实?|科技有狠活
- 全球首次语言运动“双解码”脑机接口临床试验在上海完成
- 2025十大AI技术趋势:具身智能、世界模型都有望迎来ChatGPT时刻|钛媒体AGI
- 普华永道发布2025年AI预测:AI Agents将劳动力提升1倍
- 盘点2024年的“AI 事故”:内容垃圾、幻觉与滥用
- 联想意外曝光英伟达N1芯片!AI PC要迎来“质变”时刻了?
- 拜登政府发布AI芯片新一轮限制措施,英伟达甲骨文强烈批评
- 回顾2024:AI和新硬件,开始改变我们的生活方式
- 2025年互联网八大预测:这些将会改变你的生活
- 上海脑机接口临床试验迎来重大突破,可用意念实时合成汉语
- 黄仁勋:我们的目标是创建一个巨型芯片,将使用72个Blackwell GPU
- 2025全球电商消费趋势有哪些?AI等创新科技应用场景加速拓展、情绪经济成亮点
- 端侧AI火爆,中国芯片企业如何在高通、苹果竞争中食得一杯羹
- 脑机接口取得又一突破性进展:实时汉语解码实现”意念对话“
- 微软发布2025年AI预测:AI Agents将彻底改变工作方式
AiLab云推荐
最新资讯
本月热点
热门排行
-
科学家成功研发可弯曲的非硅柔性芯片,成本不到 1 美元
阅读量:5959
-
FuriosaAI推出高能效AI芯片:性能与英伟达L40S接近,功耗低40%!
阅读量:5488
-
瑞士团队打造超小脑机接口,意识转文本准确率高达 91%
阅读量:4817
-
马斯克的新愿景对准盲人,Neuralink下一代脑机接口已获批
阅读量:4542
-
清华洪波教授:脑机接口实现语音解码输出应该在三年左右
阅读量:4330
-
为了获诺奖,AI不仅要懂物理学,还要懂哲学?
阅读量:3749