导读:一种快速有效的印刷体汉字识别方法摘要:笔划代表着汉字的内部特征,笔划穿越次数是对笔划进行全穿越,反映了汉字的整体特征,全穿越在粗分时区分汉字的能力不是...
一种快速有效的印刷体汉字识别方法 摘要:笔划代表着汉字的内部特征,笔划穿越次数是对笔划进行全穿越,反映了汉字的整体特征,全穿越在 粗分时区分汉字的能力不是太强,增加了二级识别的工作量。除了提取笔划全穿越外还提取笔划半穿越,并 把半穿越的次数进行重新组合形成新的特征值。把全穿越和半穿越结合起来作为汉字的特征值,对汉字进行 粗分,粗分不能区分的汉字,采用四个角的能量值密度特征对汉字进行细分。实验结果表明了该方法的有效 性。与单独使用全穿透方法相比,提出的方法在粗分时区分汉字的能力增强,减少了二级识别的工作量。 关键词:笔划;穿越次数;能量值;汉字识别