光照输入手写印刷体汉字识别系统
一种由扫描器、微机、显示器、打印机、磁盘组成的光照输入手写印刷体汉字识别系统,其特征在于该系统中采用光照输入手写印刷体汉字识别方法: a.采用以抽取汉字四边形状特征进行集合操作的粗分类方法,该方法在获得汉字图象的近似多角形之后,利用扫描线算法得到多角形向顶部的投形线,由此得到构成顶部形状的线段,对这些线段从左至右分析它们的性质,以及它与邻近线段所构成的几何形状,从中得到顶部形状的特征序串。具体步骤是第一步将顶部线从左至右排序,第二步取出一段线段判断它们的属性是属横、竖、撇、捺,那么第三步根据属性,取出邻近边分析两端点与邻近所构成的形状之后取得特征码。第四步若线段取完则结束,否则转到第二步。 b.采用细分特征抽取--笔划段快速合并方法,该方法利用汉字多角形的特点,对包围汉字图象的轮廓线进行合并处理,很快得到