展会信息港展会大全

OCR(联机手写汉字识别)
来源:互联网   发布日期:2011-09-02 14:06:51   浏览:10403次  

导读:(转载www.chinaocr.net)...

2 联机手写汉字识别——笔输入——笔输入

2.1 什么是笔输入——从键盘输入说起

笔(式)输入也叫做手写输入。它的用途是在一块跟计算机连接的书写板上写字,即时把字符输入计算机。必须指出的是,笔输入的作用不只是输入字符的图形,还要据此对该字符加以识别,并用机内代码来表示,以便于对输入的文字作进一步处理。

电子计算机是西方发明的,用键盘来打印拼音文字在西方已有很长的历史,因此采用键盘向计算机输入拼音文字和标点符号是很自然的事,把字母等符号变换为便于计算机处理的编码也不困难。1838年美国人莫尔斯就已发明用点和划两种符号来表示英文字母,用来传送电报信号,使电报机进入实用阶段。1844年美国建成从华盛顿到巴尔的摩全程64公里的电报线路,揭开了人类通信新的一页。这种莫尔斯电码现在还在通信领域(如无线电报)广泛应用。计算机用的内码虽然和莫尔斯电码有所不同,但原理上是一样的,只不过采用位数固定的(0,1)码来表示各个字母而已。因此,采用通常的QWERTY键盘、配以适当软件,就可以把拼音字母以编码的形式直接输入计算机,不需对输入信息再加以识别。当然,如果输入的是写在(或印在)纸上的拼音字母或符号,那就和输入其他手写文字一样,也需要用识别软件进行识别,否则计算机也不可能“懂得”这种手写字母、符号所代表的信息。

方块汉字和拼音字母完全不同,如何把汉字输入计算机呢?

20世纪70年代以前,我国曾仿照西文打字机的式样,研制几种用于打印汉字的大键盘打字机。这种汉字打字机采用一字一“敲”的汉字键盘。键盘的盘面安放着1000多个铅字,盘面上还有两根可分别在水平与垂直两个方向移动的杠杆。移动杠杆使打字用的卡具对准某个汉字,然后敲击按键,就可以把该字打印在纸上。由于汉字字量很大,使得键盘体积不可能太小,机械结构也不简单,操作相当不便。更突出的问题是:打字员还必须熟记每个汉字的位置,否则不但不能提高打印速度,甚至无法工作。此外,大键盘的盘面</PGN0023.TXT/PGN>虽然很大,但一般也只能容纳1000多个铅字,仅占常用汉字的一半左右(国标GB 2312-80汉字基本集第一级的字数为3755个)。打字员打字时往往由于字盘上没有所需的铅字而不得不开个“天窗”,留个空格。这样的汉字字盘,很难满足实际应用的需要。

几十年来我国科技人员为了改善汉字打印工具做了大量极其艰苦但富有成果的研究工作。主要成果之一就是改造原用于西文打字的标准QWERTY打字机,使其能用于打印方块汉字。最早投入市场并广泛在我国应用的是王永民发明的五笔编码(即所谓王码)。这种键入方法所采用的是标准键盘,体积大大缩小,打字时不像大键盘那样一字一键,一般需击键数次才能打入一个汉字。但是打字人员如果熟练记住各个汉字的“编码”,就可以“盲打”,使打字速度大大提高。80年代以后,我国经常举行全国性的汉字打字竞赛,速度最快的专业打字人员每分钟可以打入250个汉字左右,相当于、甚至略高于西文打字的速度;一般非专业人员的打字速度也可以达每分钟几十个汉字,基本上满足实际应用的需要。五笔画王码键入方法的成功,不但初步解决了把汉字输入计算机的“瓶颈”问题,对文字工作者也是极大的鼓舞。近二三十年来,不少科技工作者为了改进汉字键入方法,提出了各式各样的编码,如王码、郑码、钱码、肖码、自然码、码根码等等。据估计,80年代的10年间,几乎每个月都有两三种汉字输入码问世,汉字编码输入法总计已有数百种之多,形成一派万“码”奔腾的壮观景象。

但是,近一两年来,这种万“码”奔腾的火爆局面悄然退</PGN0024.TXT/PGN>潮。1999年2月1日《北京科技报》在“热门话题”栏目中,以“万码为何齐喑”的头条标题,报导了“曾经辉煌一时,突破我国汉字输入瓶颈的码型输入法在新技术浪潮下被淘汰出局”的消息。该文作者用“淘汰出局”来描述汉字键入方法在汉字输入领域的处境,并不恰当。键入方法在实际上还很有用武之地,例如一般的办公室今后仍会采用打字机,因为在办公桌上用打字机打字毕竟也很方便,而且也已适合许多人、特别是西方人的习惯。不过在有些场合,例如在室外工作,用打字机输入字符就很不方便,也不符合计算机小型化的潮流。小型计算机,如已有的个人数字助理PDA (personal digital assistant)或正在发展中的掌上电脑,其尺寸比常用的键盘小得多。目前的键盘不可能和掌上电脑等小型化计算工具配合使用;把键盘缩小也不是办法,因为人的手指不可能为适应键盘小型化而变小。寻找新的输入方法是科学技术发展的必然趋势和要求。笔输入和语音输入等更先进的方法就是在这种情况下随着科学技术的迅速发展应运而生的。

那么,人们能否像平时用笔写字那样,把手写字输入计算机?计算机又是怎样识别手写的文字呢?下面我们就来详细讨论这些问题。

2.2 计算机是怎样识别手写汉字的

联机手写汉字识别有时叫做“笔(式)输入”。顾名思义,这是用笔把汉字“写”入计算机,而不是用键盘“敲”入计算机。改敲为写,既不需要死记每个字的编码,而是像通常写字那样,用笔把字直接写入计算机,更符合中国人书写的习惯,也实现了汉字实时输入的要求;此外,这种输入方法既可以用于办公室内,也可以用于室外或其他特殊场合,是一种易学易用的较好的汉字输入方法。

2.1是笔输入装置的照片。它的硬件主要是书写板和书写笔两部分。书写板跟计算机相连,书写笔在书写板上写字时,笔画信号按书写顺序输入。书写板分为有压感和无压感两种类型。有压感书写笔在书写时能给出着力的轻重、笔画的粗细、着“色”的浓淡,以及书写时间的长短等信息,既可用于输入汉字与各种字符,又具有书法、绘画、签名等功能,是一种用途比较广泛的输入工具。无压感的书写笔则只用于输入字符,价格较为便宜。此外,书写笔还分为有线和无线两种。无线书写笔中有一个发信装置,用来靠电磁波把信号传给计算机,用户使用比较方便。

赞助本站

人工智能实验室

相关热词: 联机 手写 汉字 识别

AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港