展会信息港展会大全

██████ 收集语音识别相关资料 ██████
来源:互联网   发布日期:2011-10-01 11:56:50   浏览:13737次  

导读:请大哥们介绍一下语音识别技术或者相关资料...

你啥时候生星得,没见你散分呢


光学字符识别与语音识别

光学字符识别

        光学字府识别技术(OCR)自从五十年代起就开始在商业应用中使用。它最初是设计来识读被称作“特殊字体”的。这些字体,如OCR-A,包括全部字母与数字符号和特殊的字母,是为机器扫描或识读,这样提供了一种高速、非键盘的信息输入方法。不像条码,这些字体仍能够为人类所识读。

        在过去的几年中,主要是由于相对低成本、高速度的个人电脑的出现,OCR技术有了可观的改进。很高能量的识别软件发展出来。例如,目前大多数OCR仪器能够识读普通的办公字体,如Courier,以及特殊字体和在报纸杂志上用的比例字体。事实上,许多工厂使用“智能字体识别”(ICR)一词,因为他们相信这个词更适合今天的OCR硬件与软件。

        OCR与条码相似,会受到低质量的印刷效果的影响。但是,在媒体准备和应用设计上花一点点工夫,识别效果就会有很大改善。目前,进行字母速度比较时,OCR的速度与条码相同,而且它的准确性也与条码扫描相同。

        在某些应用中,例如在需要人类识读的应用中,或者空间有限的情况下,或者在使用和保持条码标签的成本过高和实际上行不通的情况下,OCR/ICR比使用条码更适合。在识读打字的文件或计算机印刷的材料,而不要有附加的步骤的应用中,ICR/ICR更理想。OCR/ICR在图书馆、出版业、付款处理、支票平衡、发出帐单和其它普通信息输入应用中最常见。

        OCR有两个主要的方式:模型对照和特点提取。模型对照是看到印刷的字体,并将这个图象与在数据库中的可能的选择对照配对。特点提取是寻找结构特点和它们的综合以识别字体

        字体是由一个图像设备来扫描识读的,这种识别字体的系统是基于上述一个或两个100个千吉(trillion)之一。尘土、油漆和其它不透明的物质不会影响持挂签的识读性。射频识别还允许“在飞行中识别”的物品,附有标签的物品不需要处于静止状态。非金属性的物品能够穿过识读器和电子标签之间而不造成干扰。但是金属影响所有的射频识别系统。一些射频技术在高金属环境下的功能要比另一些射频技术更成功。

        射频识别挂签能够在人员、地点、物品和动物上使用。目前,最流行的应用是在交通运输(汽车和货箱身份证)、路桥收费、保安(进出控制)、自动生产和动物挂签等方面。自动导向的汽车使用挂签在场地上指导运行。其它应用包括自动存储和补充、工具识别、人员监控、包裹和行李分类、车辆监控和货架识别。

        挂签的设计很多,价格适合于应用。为动物设计的可植入的挂签只有一颗米大小,而包含较大的电池,为远距离通讯(甚至全球定位系统)而用的大型挂签如同一部手持式电话。挂签有主动型(带电池)和被动型(电力来自探询/识读传送器)两种。

        你还可以在高、中、低频率的挂签中进行选择。高频率的挂签能够更快地传递信息,而且识读距离比低频率的大。低频率系统受环境干扰小,而且可以多方位识读。还有一种新的射频识别技术,它的发明人称它为“实时定位系统”。它可以靠找无线电讯来确定某个物品的位置,还能提供物品的身份   。

只读式和/写式系统

        在只读式挂签中的信息是已纺好程序的,不能在应用场地修改。如同许多条码系统,在挂签中的身份号码与数据库相联时才有重要意义。当物品被识别后,计算机能够指挥一部机器来对其进行应作的工作。在另一方面,读/写系统在通过挂签时能够识读、更改或增加新的信息。

        在一个读/写式系统中,零件的挂签能够给机器以指导。在工作完成后,机器可以向挂签报告工作结果,这将成为该零件的历史的一部分。因此,它减少了中央控制器或计算机主机的记忆国条求和信息处理工作量。

        不管是只读式还是读/写式系统,射频识别系统为自动识别领域开创了一个新的领域,它为那些由于环境问题而不能使用其它自动识别系统技术的领域提供了新的解决办法。

语音识别

    语音识别技术(在自动识别领域中通常被称作“声音识别”)将人类语音转换为电子信号,然后将这些信号输入进具有规定含义的编码模式中。它并不是将说出的词汇转变为字典式的拼法,而是转换为一种计算机可识别的形式,这种形式通常开启某种行为。如,组织某种文件、发出某种讯号或开始对某种活动录音。

        语音识别以两种不同形式的作业进行信息收集工作:分批式和实时式。分批式是指使用者的信息从主机系统中下载到手持式终端中,它自动更新,然后在工作日结束时将全部信息上载到计算机主机处。实时式信息收集中,语音识别与射击频技术相结合提供活动式和快捷的与主机的联系。

        工作人员头一部包括话筒和扬声器在内的对讲机。这种对讲机与一个具有词汇程序的器材相连,这种仪器能够识别词汇,并将它转换为模拟电子记号。这种模拟讯号通常转换成数字形式,然后由模式对比或特点分析来解码。这种仪器可与计算机相连或与一部独立的语音识别器相连。

        在某些应用中,特别是多步骤检验这样的应用中,使用模拟语音提示帮助完成整个检验过程。语音识别,与模拟语音提示   相结合,帮助操作人员完成一系列的工作,它用操作人员对模拟语音提示的回答来确认工作的正确性。

      在速度和准确性要求较高的应用中,或者在操作人员的手和眼睛要用来进行其它工作,而不能写字或打字的情况下,语音识别是理想的技术。通常的语音识别应用包括收货/送货、批发、订单取货、零件追踪、试验室工作、库存控制、计算机板检验、车操作、分类、材料处理、质量控制和仓库管理。

        语音识别正在流行起来,因为它只要很有限的训练,允许操作人员在进行他们的日常工作时收集和输入信息,而且它的成本效益好。功效强的语音识别系统一直是依赖讲话人式的。就是说,每个使用者将一组词汇读给这套系统,这样使用者“训练‘系统来识别他们特殊的声音。以训练来构成特殊的为使用者服务的系统,训练允许讲话人带有口音或使用特别的词汇或术语。现在也有不依赖讲话人式的系统懂得事先存入的、代表平均人们讲话习惯的词汇,不需要特别训练,但是它只有限的特殊词汇。

        语音识别系统还分为这样两种类型:连续性讲话和间断发音。连续性讲话型允许使用者以一个正常的讲话速度讲话。间断发音要求在每个词和词组之间留出一个短暂的间歇。
 

赞助本站

AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港