简析印刷中文字的识别方法研究-字符识别-人工智能实验室AiLab-中国人工智能网-Powered by AiLab.cn

简析印刷中文字的识别方法研究

来源：互联网发布日期：2012-11-01 21:13:54 浏览：121043次

导读：简析常见的统计模式识别方法结构模式识别是早期汉字识别研究的主要方法。其主要出发点是汉字的组成结构。从汉字的构成上讲，汉字是由笔划(点横竖撇捺等)、偏旁部首构成的；还可以认为汉字是由更小的结构基元构成的。由这些结构基元及其相互关系完全可以精确...

简析常见的统计模式识别方法

结构模式识别是早期汉字识别研究的主要方法。其主要出发点是汉字的组成结构。从汉字的构成上讲，汉字是由笔划(点横竖撇捺等)、偏旁部首构成的；还可以认为汉字是由更小的结构基元构成的。由这些结构基元及其相互关系完全可以精确地对汉字加以描述，就像一篇文章由单字、词、短语和句子按语法规律所组成一样。所以这种方法也叫句法模式识别。识别时，利用上述结构信息及句法分析的方法进行识别，类似一个逻辑推理器。

汉字的统计模式识别是将字符点阵看作一个整体，其所用的特征是从这个整体上经过大量的统计而得到的。统计特征的特点是抗干扰性强，匹配与分类的算法简单，易于实现。不足之处在于细分能力较弱，区分相似字的能力差一些。常见的统计模式识别方法有：

(1)用变换特征的方法。对字符图象进行二进制变换(如Walsh,Hardama变换)或更复杂的变换(如Karhunen-Loeve,Fourier,Cosine，Slant变换等)，变换后的特征的维数大大降低。但是这些变换不是旋转不变的，因此对于倾斜变形的字符的识别会有较大的偏差。二进制变换的计算虽然简单，但变换后的特征没有明显的物理意义。K-L变换虽然从最小均方误差角度来说是最佳的，但是运算量太大，难以实用。总之，变换特征的运算复杂度较高，且有一定弱点。

(2)模板匹配。模板匹配并不需要特征提取过程。字符的图象直接作为特征，与字典中的模板相比，相似度最高的模板类即为识别结果。这种方法简单易行，可以并行处理；但是一个模板只能识别同样大小、同种字体的字符，对于倾斜、笔划变粗变细均无良好的适应能力。

相关热词： 字符识别中文识别模式识别

简析印刷中文字的识别方法研究
来源：互联网发布日期：2012-11-01 21:13:54 浏览：121043次

相关内容

AiLab云推荐

最新资讯

本月热点

热门排行

推荐内容

在线客服

热门栏目HotCates

关于我们

版权声明

简析印刷中文字的识别方法研究 来源：互联网 发布日期：2012-11-01 21:13:54 浏览：121043次