一种基于模糊模板匹配的车牌汉字识别方法
2011-07-07 18:32:27 来源:
关键字:
字符识别属于模式识别的范畴,通常的字符识别方法可分为2类:基于字符结构(笔画特征)的结构识别和基于字符统计特征的统计识别。结构模式识别方法的优点是可以识别复杂的模式,缺点是需要进行笔画特征的提取,在输入图像质量不佳的情况下,这一点往往难以做到。在统计模式识别方法中,特征提取方便,识别速度与识别对象无关,但需要得到字符集的稳定特征,且在字符笔画较多时要求的特征量非常大。二种识别方法各有优缺点。人类的视觉感知系统是一个鲁棒性很强的、能抵御实际中可能遇到的各种变形和噪声干扰的文字识别系统。人们的认字过程实际上是对汉字整体形象的把握,是对汉字图像全局的处理过程[1]。因而,汉字的整体信息在无笔顺识别中起着无法替代的重要作用。统计模式识别借助概率论的知识,判断或决策对象的特征类别,使得决策的错误率达到最小。基于统计特征的识别方法先抽取识别对象的稳定特征,组成特征矢量,然后在字符集的特征空间中进行特征匹配。基于以上认识,在分析汽车牌照中汉字字符的特点后,采用了有别于结构分析的一种基于字符图像特征统计的模式识别方法进行汉字识别。同时针对统计方法无法区分的相似汉字,提取其微结构信息进行特殊的校正识别。1 特征统计匹配统计决策论其要点是提取待识别模式的一组统计特征,然后按照一定准则所确定的决策函数进行分类判决[2]。汉字的统计模式识别是将字符点阵看作一个整体,从该整体上经过大量统计得到所用特征,用尽可能少的特征模式来描述尽可能多的信息。所采用的方法有:特征统计的方法、整体变换分析法[3]、几何矩特征、笔划密度特征、字符投影特征、外围特征、微结构特征和特征点特征等。这些方法都具有各自的优缺点,应根据具体应用进行选取。主要方法有外围面积特征匹配法和网格特征匹配法。外围面积特征反映了字符的轮廓信息。外围面积特征提取法,主要是从周围形状的心理学知识来获得汉字信息的特征,即对文字周围上下左右的形状进行量化,从而构造特征向量。网格特征实际是结构模式识别和统计模式识别相结合的产物。字符图像被均匀或非均匀地划分为若干区域,称之为“网格”。在每个网格内寻找各种特征,如目标面积比例、交叉点、笔划端点的个数、细化后的笔划长度和笔划密度等。特征统计以网格为单位,即使个别点统计有误差也不会造成大的影响,从而增强了特征的抗干扰性。因此这种方法得到日益广泛的应用。在实际的车牌汉字识别中,当相同汉字的二值图形变动较小时该方法较有效。具体应用:将尺寸为34×66象素的汉字二值图均匀分成32个正方形的小区域(不考虑外边框的1个象素),统计每个8×8的小区域内目标象素(白色)所占的面积比例,就得到了归一化的32维特征矢量。统计多幅相同汉字的32维特征矢量,取均值作为该汉字的标准网格特征模板。识别时,计算待识别汉字的32维网格特征矢量与模板矢量之间的Euclid距离,求得最小距离值,其对应的汉字即为识别结果。在具体应用中,由于外部原因常常会出现字符模糊、字符倾斜的情况,而网格特征匹配方法对字符模糊和倾斜较敏感,因此鲁棒性不是很强,不适合实际应用。2 模板匹配考虑到以上2种主要识别方法存在的弊端,决定选用模板匹配的算法进行字符的识别。实际研究中发现,二值化的图形模板虽然直观,但其匹配计算过程过于简单直接,对倾斜、形变、残损、模糊的待识别字符匹配误差较大,因此鲁棒性较差。而灰度模板由于色彩、光照等因素影响,难以找到普遍适用的模板形式实现直接的匹配计算。综合以上二方面的问题,在引入统计模式识别思想的基础上,提出了基于二值图形变动分析的模糊模板匹配方案。2.1 基于二值图形变动分析的模糊模板匹配在含有汽车牌照的图像中,将汉字定位并提取出来以后,还要完成规格化、二值化等操作。即使是相同的汉字,由于车牌倾斜、模糊,特别是由于每次定位不可能完全精确一致等诸多因素的影响,导致在二值图中字体的形状、大小都会不同,字体位置也会发生不同程度的偏移。将这种二值图形的不规则现象称为图形的变动。在汉字识别的分析过程中,希望对图形变动的大小进行量化处理。因此,提出了求图形整体变动量的统计方法,其优点是不需要参照标准图形,可以进行客观评价,并构造出用于匹配识别的模糊模板。对每一个车牌的汉字字符,选取n幅质量较好的参考图。将这n幅参考图规格化为17×33的标准大小后进行二值化处理,得到标准参考图fi(x,y)。因此每个车牌汉字字符都有n幅由0、1所组成的二值图像。将这n幅二值图像对齐后叠加,再进行归一化。得到的模糊图形F(x,y)。四个汉字的模糊图形模板(不同方向的视觉效果)如图1所示。
4 实验流程及结果对识别300幅切分后的质量较好的汉字灰度图进行识别,实验流程如图3所示。实验结果表明,外围面积特征匹配法正确率达88%,网格特征匹配法86%,简单模板匹配法91%,改进算法的正确率达到了93%。如果对识别结果进一步校正,正确率将提高到95%。若再进一步增加训练集,完善模板,相信正确率还可以继续提高。