未来的语音识别技术
1999年1月8日 17:30 科技日报
想像一下在不久的将来,计算机将不再需要键盘和鼠 标;汽车不再需要方向盘;与老外打越洋电话不再需要翻 译......这一切只需要一套语音识别系统便能轻轻松松地 完成。这话说来并不遥远,不出5年定能梦想成真。 90年代初,美国电报电话公司想用计算机技术促进通 讯业的发展,于是组织人马研究出一种语音识别软件。1992 年3月,世界上第一套语音识别系统在美国诞生。 当时这 套系统的主要任务是代表公司向用户询问采用何种付款方 式:诸如用信用卡还是现金等。由于该软件处于试验阶段, 存在不少问题,也闹出不少笑话。西方人“请”、“谢谢” 总不离口,当计算机询问时,用户总免不了要说声“请” 和“谢谢”。但是计算机可不知道这只是客套话,并无实 际意义。正是这些客套话妨碍了计算机对有用指令的正确 执行,为此计算机时常出错。经过几个月的试用后,美国 电报电话公司对用户提出以下要求:第一,用户和计算机 对话时要口齿清楚,发音准确。第二,不得说“请”、“ 谢谢”之类的客套话,以免干扰计算机的正确判断。 1992年下半年, 世界计算机业的巨子IBM公司对这套 系统进行了改进, 研制出能识别2.2万个单词的语音识别 合成系统。只要将一个麦克风连到计算机上,然后让计算 机做“听写”,计算机显示屏上便立即显示出口述者的口 述内容。 不知为什么,IBM公司研制的这套系统的单词仅 限于放射学,当时的价格贵得吓人,一套系统价值75万法 郎。 不过,这套系统前几个月已降到900法郎以下,却能 识别5万个单词,用户还可以教计算机学习1.5万个单词。 IBM公司又将该系统融入连续听写新技术, 计算机不仅能 识别人的语音而且能掌握人的语速。不过要想让计算机准 确无误地录入你口述的内容,还得下一番功夫。头一个星 期你一天得花2个小时的时间让计算机做听写, 使计算机 熟悉你的声音和词汇。渐渐地计算机便成为你的忠实朋友, 你无论讲什么,显示屏立即就会显示出来,再了不需要键 盘和鼠标。那么什么时候能用上这样的计算机呢?比利时 一家出版社已和微软公司合作研制出一套最新的 '98视窗, 该软件具有语音识别合成功能。 目前,语音识别系统主要用于通讯、交通等领域。美 国电报电话公司由于应用了这套系统,节省了大量劳动力, 每年赢利约20万法郎。西方不少铁路部门利用该系统进行 电话订票,既方便又快捷。法国国营铁路利用该系统研制 了具有语音识别功能的售票机样机,顾客反映这种机器工 作起来既准确又有亲切感。芝加哥一些餐饮部门利用该系 统专门给家庭订购比萨饼,听说卖得特火。一些国际著名 公司如摩托罗拉、西门子、阿尔卡特、诺基亚、马特拉等 公司都在着力改进和提高网上语音识别系统的质量,以提 高自家产品的竞争力。 据专家分析, 今后5年内,语音识别系统将有很大的 发展。主要集中在以下几个方面:一是用于计算机。语音 识别系统将成为计算机重要的组成部分。计算机再也不需 要键盘和鼠标,计算机的操作过程即各种功能键的使用将 完全采用声控,无须什么菜单,你只要对着计算机说话中, 一切将会变得那样的轻松愉快。 二是用于电话。未来5年内, 计算机微处理器的运算 能力将大大提高,假若再加入一套语音识别系统,电话机 将具有同声翻译的功能。假若你给远大加利福尼亚的美国 朋友打越洋电话,你讲中文,对方听的却是英文,因为电 话机给你做了同声翻译。 三是用于汽车。未来2至3年内,汽车驾驶将无须方向 盘。在汽车上安装一套语音识别系统,你只要对着系统发 布指令,汽车就能按中就班地启动、加速、减速、刹车、 转弯等。诸如开启窗门、调了车内空调这些小事,对系统 来说更是小菜一碟。 四是用于自动售化机。 在未来的5年内,航空、铁路、 公路的售票处将普遍采用装有语音识别系统的售票机。只 要说出你要到站的地名,机器就能自动售票。在未来的超 市里,也可用它来售货。 未来的语音识别系统的用途不限于此,它将有十分广 阔的应用前景。在即将到来的21世纪,语音识别系统半给 人们带来更多的方便和快捷,使我们的生活和工作变得更 加轻松和愉快,当然它也会给商家带来滚滚财源。