1.系统概述
1) OCR专业版,我公司自主开发的印刷体文字识别系统识别准确率超过99.5%。
2) OCR SDK二次开发版,为其它程序使用汉字识别提供了编程的接口。它提供了Windows标准的Dll方式调用,用户可以通过Dll中的函数调用SDK中的汉字识别功能,实现系统集成。
2.系统特色
1) 本识别技术的特色是"不采用行扫描,历遍位图中的所有点"。采用汉字结构分拆假设法、抽取线条整形法等算法,计算原始点阵的笔画穿透数目,从而确定方向线素特征,从汉字笔画描述库中检索出汉字。为提高识别准确性,还采用了周边四角特征、任意连续三点特征抽取、轮廓描述等辅助算法来进行检验。
2) 使用流线式扫描并识别,扫描识别一键OK。
3.运行环境
运行环境 Windows 9x/Me/NT/2000/XP
最低配置 CPU 300 MHZ以上,64M内存以上(建议128M以上)
4.技术、质量参数
识别速度:在PIII 1.2G处理器256M内存的PC机上,2至8秒/A4页。
识别字体:全自动识别宋、仿宋、楷、黑、圆、隶书等百余种中文简体,英文、数字、图片混排的稿件。
识别语言:简体中文
单字识别准确率:印刷体汉字≥99%
联想识别准确率:印刷体汉字≥99.5%
支持文件格式:BMP、TIF、TIFF、JPG、JPEG、PCX、TGA、DIB、EMF、WMF。
输出格式:TXT、RTF。
识别要求:对普通书本的印刷质量,5号字体以上的印刷材料,可选择扫描分辨率为300dpi以上,字体越小要求分辨率越高。
其它功能:自动倾斜更正、去除指定颜色、保留指定颜色、灰度处理等。
支持硬件:普通扫描仪、名片扫描仪、逐行扫描笔、数码相机、带数码相机功能的手机等。
5.技术应用:
1) 办公自动化中汉字文件资料自动输入,汉字图像文本的压缩存储、传输。
2) 书刊自动阅读器,盲人阅读器。
3) 数字图书馆的建设,档案资料数字化,建立汉字文献档案库。报刊﹑杂志﹑书籍等黑白彩色印刷品的数字化及电子出版,书刊、资料的再版输入。
4) 车牌辨识系统。分别应用于:交警对超速和闯红灯的车牌识别、高速公路收费。
5) 身份证识别,这是一种采用高效识别算法将身份证各部分进行识别且将识别结果按特定应用进行管理的系统,可用于行政单位、工厂企业、银行等,如:考勤管理(代替考勤卡)、身份快速确认(门禁系统)、银行等单位的身份证号码快速录入。
6) 邮政编码识别与分拣。在这之前,由于手写文字识别率不高,因此邮政编码识别与分拣还没有得到广泛的应用。
7) 智能全文信息管理系统、多媒体应用系统、自动翻译系统。