随着信息技术的飞速发展,人们寻求一种更为直接的人机对话方式,声控电脑就是再此基础上发展起来的。声控电脑使用语音识别技术,而语音识别是目前一种热门技术。电脑语音识别系统,可以用声音直接控制电脑工作,是人机接口中最具有人性化的方式。
1 声控电脑原理
声控电脑是由人的声音发出指令来控制电脑工作的,可是电脑本身不能识别人的声音,因此必须让电脑先了解熟悉人讲话的声音及腔调来建立参考样本,将原先训练好的声音特色保存为语音参考样本存入电脑。原理流程如图1所示。
(1)语音训练将输入的语音经过分析保存为特征参数参考样本,即告诉电脑将来要识别哪些声音。
(2)语音识别将输入的语音经过分析与原先电脑内的参考样本做对比,找出最相近的声音作为识别效果。
2 语音识别DSP组成及控制
(1)组成
DSP语音识别芯片;数字/模拟转换电路;语音提示语ROM;参数存储SRAM。
数字/模拟转换电路是将语音模拟信号转换成数字信号,交DSP芯片做分析处理,然后将其存储在SRAM中。如果要说出所讲的声音,同样是经过数字/模拟转换电路将其转换为模拟信号,经驱动电路,可以将声音还原。
(2)控制
SETUSER选取某一使用者(最多支持8人)。
GETSTATVS取回主控CPU状态值。
TRAIN语音参考样本输入。
RECOG语音识别对比。
SAVESTATVS存储主控CPU状态值。
COMPARE识别对比找出最相近的一组样本。
3 声控系统硬件电路
将20PIN排针插座,连接至8051单片机控制板上,DSP和8051的信号传输都由此总线来完成。8051用于主控系统,主要做声控系统的人机接口处理,所用到的接口包括键盘及LCD信息显示,并以8051单片机来控制DSP芯片用于语音识别。如果将RS232与PC机连接,便可以将信息传回PC而显示在屏幕上。除可以显示信息外,还可以做程序设计时修改错误,在系统开发时相当有用。系统组成原理如图2所示。
4 软件设计
系统软件由主控程序、通信模块、DSP处理模块等组成。其中主控程序完成系统初始化、通信命令处理、显示信息等功能。
通信模块由通信子程序、通信接收中断、通信发送中断组成,主要实现与PC机的通信。DSP模块由DSP模块子程序、语音识别对比程序、取,存主控CPU状态值程序、选取使用者程序组成,是语音识别最主要的环节。程序结构如图3所示。
5 结语
本系统采用DSP控制芯片,使硬件成本降低,可以独立操作,不必靠个人电脑来做语音识别的控制,最主要的是其语音识别效果佳且稳定。
参考文献
[1]张辉.Motorola单片机应用技术[M].北京:北京航空航天大学出版社,1999
[2]陈龙三.8051单片机C语言控制与应用[M].北京:清华大学出版社,1999