一、智能字符识别(ICR)技术的源由
纸和笔是人类迄今为止使用最广泛、表达最方便的信息描述方式,手写是一种自然的、大家都熟悉的记录方式。计算机信息系统的出现,使人们可以存储和处理大量的计算机文本数据,但这也不能替代人们使用笔在纸上的自然书写习惯。人们用纸和笔书写的信息,计算机系统不能识别,不能在计算机系统内应用,智能字符识别(ICR)技术就是解决将手写体字符转换成计算机可以识别的计算机字符的技术。
二、智能字符识别(ICR)技术的分类
从识别的手写体字符的来源来分,智能字符识别(ICR)技术又分为两类:静态ICR识别和动态ICR识别。
静态ICR技术,识别的手写体原始文稿通过光电扫描仪等输入设备转换成原始的二维图象信号,可以是灰度图象(grayscaleimage)或二值图象(binaryimage),他处理的数据被称为静态数据。
动态ICR技术,接受的手写信息是一些列以时序排列的二维笔迹坐标信息,包括运笔时间、笔画顺序、笔画坐标等,他处理的数所被称为动态数据。
动态ICR技术比静态ICR技术的识别率要高。动态信息比之静态信息的优点在于:动态数据保存了静态数据丢失的关于笔迹的动态信息(如运笔顺序),而动态信息是提高识别率的重要因素;同时识别静态信息时不能有效地区分出纸上的字符信息和其它信息(如书写方格和辅助线等),而动态数据直接就是手写字符信息,所以不会产生混淆。
三、影响识别率的因素
识别率是ICR技术研究的重要环节,影响识别率的因素也是ICR技术研究中的难点,目前影响识别率的因素主要有以下几个方面:
??1.笔顺问题
??由于不同人具有不同的书写习惯,笔划的书写顺序经常发生变化,因此,单纯通过串匹配进行识别难以达到理想效果。对汉字进行描述时,仅仅采用一维串也就显得不够,必须利用一些二维方法来描述,从而又极大地增加了匹配的难度。
2.连笔问题
??一般人写字时都不会一笔一划地书写,为了节省时间,连笔字是自然而然的事情,一些行书连笔甚至完全脱离了楷书的框架。从实用角度讲,连笔问题比笔顺问题具有更重要的意义。对于结构识别而言,连笔一方面使笔划种类大大增加,甚至达到难以归纳的程度;另一方面,连笔又使得笔段抽取难度大增,因为连笔会增加一些冗余笔段,连笔造成的畸变又会使笔段方向严重离散。
3.相似字区分
??汉字种类繁多,很多汉字彼此之间非常相似,例如“己、已、巳”三个字相差只在细微之间。手写汉字的变形十分严重,怎样能使识别系统抓住微小的差别,目前还是一个非常值得研究的问题。
??4.对抗干扰能力的要求
??抗干扰能力,也称为鲁棒性,对于手写识别系统的性能是非常重要的。书写时候,笔划的畸变、丢失,多余笔段(如笔锋)的插入,字的倾斜,部件间相对位置、大小的变化,这些都是经常发生的现象。对于结构识别来说,会造成基元提取和识别的错误。要想取得好的性能,必须对传统识别方法进行改进,增强其鲁棒性,从而增加实用性。
四、ICR的发展历史
ICR的发展历史可以追溯到本世纪50年代,伴随着手写板硬件(一种捕捉笔尖轨迹的数字化仪)的出现,人们开始研究手写字符识别技术。到80年代后期,手写字符识别技术的研究已经朝着实用的方向努力,特别是英文,已经开始研究完全无限制的整句识别技术。
ICR汉字识别技术相对起步较晚。1981年,IBM公司E.F.Yhap等推出了第一套较为成熟的ICR汉字识别系统。当时对920个汉字的实验结果时正确率91.1%,对2260个测试,识别率为79.9%(第一次使用)。书写者要求使用工整楷书。
??国内蒙恬科技公司是最早从事汉字识别技术研究、开发、生产的公司之一,在1991年,就正式推出手写汉字识别系统。
中科院在1988年提出利用笔段为基元的联机手写汉字识别技术。由于对整个字形进行采样后分析,在识别速度上不如按笔顺采样计算识别快。