展会信息港展会大全

基于RBF神经网络的四声自动识别及应用(1)
来源:互联网   发布日期:2011-09-28 18:12:28   浏览:5301次  

导读: 基于RBF神经网络的四声自动识别及应用(1) 发布时间:2010-11-23 来源:应届毕业生求职网 摘 要 本文利用一种快速声调识别方法,用一电平消波,降低采样率和线性插值形成快速基音提取,并应用RBF神经网络对四声进行自动分类。方法具有简单可靠和容差性等特征。 ...

基于RBF神经网络的四声自动识别及应用(1)

发布时间:2010-11-23 来源:应届毕业生求职网

摘 要 本文利用一种快速声调识别方法,用一电平消波,降低采样率和线性插值形成快速基音提取,并应用RBF神经网络对四声进行自动分类。方法具有简单可靠和容差性等特征。 关键词 声调识别, 自动声韵切分, 基音提取, RBF神经网络1 引言 汉语是一个声调语言,正确的识别声调具有重要的意义。声调是汉语主要属性之一,正确的识别声调具有重要的辩义作用。声调识别对语音合成、识别和理解也有重要意义。近年国内外已报导许多声调识别方法[7][8][9],都有很高的识别率,孤立字声调识别开始进入实用[10]。需要指出,某些方法缺乏模型描述,不能达到最佳效果。有的需先进行特征训练来建立训练模板,否则性能会下降,有些方法因计算复杂和计算量大使之难于实时处理。2 声韵切分的算法的实现 声母的音长比较稳定,不太因人而异[1][2]。因此,如果声韵切分准确,就可以对可靠的声母信息进行分析,从而得到良好的判别结果。 从语言学的角度来看,声母韵母之间有一定的界线,但在声学信号上这一界线并不很清楚。往往要采用专家系统的方法才能获得较为准确的分割,文献[3] [4]给出了人工方法切分的声母长度的分布情况。但是,一方面:有手工进行大量数据语音库的标注是一件费事而又枯燥的工作,长时间的连续的工作又会造成标注人员生理,心理的疲劳,从而在切分过程中引入不可预测的随意性误差;同时标注人员对语言学的理解和把握的不一致,经常是标注人员对自己的判断更为认同,自己的标注结果“更准确”。这样就引入了主题判断造成的倾向性误差,因而使得切分结果的可重复性无法得到保证,不同人所得的切分结果的可重复性就更差。另一方面,在自动语音判别系统中(普通话标准测试中),这一切分过程要求自动实现。目前尚没有一种供人满意的声韵切分的算法,大致的有用小波变换进行切分的[5],有用声母音长分布[2],有用基于多尺度分形维数的汉语语音声韵切分[6],有用基于听觉模型的耳语的声韵切分。 汉语的22种声母中,除了零声母,l,m,n,r外,其余都是清辅音,根据这一特点,我们做出的声韵切分规则为:令音节的总长度为 ,声母类单元长度为 ,韵母类长度为 ,音阶中的清音段长度(或浊音起始位滞

赞助本站

相关内容
AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港