【赛迪网讯】在信息时代的今天,以OCR、手写、语音等技术为核心的汉字智能识别技术,以解决汉语世界的信息输入问题为目标,已经衍生出了众多的技术、产品、市场、应用和服务,并有望形成一个庞大、完整而且不断发展的“汉字智能识别产业”。
缓慢的启动期
我国早在20世纪70年代末就已经开始进行汉字识别的研究,然而与国外相比,我国智能识别输入的普及和应用,在很长一段时间里都不尽如人意。例如OCR技术,国外在金融、保险、税务等领域的应用至少有15年的历史,而与此对应的是,国内相关行业对OCR产品和技术的应用最近几年才刚刚起步。
为什么我国的汉字智能识别的应用会经过这样一个缓慢的启动时期?主要有两个困难:一是汉字智能识别技术本身所固有的技术困难,在很长一段时间里还不够成熟,难当应用重任;二是汉字智能识别技术的应用面过于狭窄,应用不够丰富,仅仅局限于扫描仪OCR软件、手写笔等几个有限的“圈子”里。正是这两个因素导致了国内汉字智能识别技术应用的“慢启动”。
坚定的推动者
谈汉字识别,有一个公司名字我们不能不提,那就是汉王公司。在国内,汉字识别的历史几乎可以说也是汉王的历史。从1992年起,汉王把手写技术嵌入PDA,给整个PDA产业带来不小的飞跃,成就了一大批像商务通、名人、快译通这样的厂商。
源于中国科学院自动化所文字识别工程中心的汉王科技,经过前赴后继十多年的持续攻关,已经在智能识别的OCR、手写识别、语音识别三项核心技术上积累了足够的优势,为相应产品和应用的开拓奠定了坚实的基础,而且这也正是汉王科技开拓非键盘输入产业的核心能力所在。
目前,汉王对业务做了整合,把业务分成四个大块:智能业务群、数码业务群、生物特征业务群、应用集成业务群。
谈到汉字识别的应用,汉王公司总裁刘迎建举了一个例子:去年金税工程,用的就是汉王的高速扫描仪和税票号码识别技术。以前靠人力输入会出现大量错误,而汉王识别技术将错误控制在万分之一,数据非常准确。所以,识别技术对行业客户是非常重要的。
产业前景诱人
一个产业的形成,首先要有一个非常好的核心技术,汉字识别产业也是一样。随着汉王十几年来的不断努力,智能识别技术已日臻成熟。目前,汉王OCR技术对于印刷体汉字的识别率最高达到99%以上,在此技术基础上的一系列票据识别系统、表格识别系统等等都已经获得了应用。汉王的手写识别在硬件上已经实现了无线无源技术,达到了国际一流水平;在软件上,手写识别摆脱了对笔顺的依赖,并且实现了从汉字工整字识别、连笔字识别到行草字识别的跨越,并且可以识别GBK字符集中的所有汉字。
技术的成熟奠定了产业形成的基础,而广阔的应用才是产业成型的催化剂。刘迎建认为,要想把市场做大,就必须将技术创新和应用创新结合起来,并由此打开整个市场的发展大门。在行业信息化如火如荼的今天,电子政务的手写签名系统、公安、教育、金融等各行各业的各种票据和证件的识别输入系统等等,无不拥有着及其广阔的应用前景和市场前景。越来越多的人开始用上了PDA、手机、名片通、手写板、语音录入产品……整个汉字智能识别的产业前景十分广阔。王龙
【发表评论】【IT业界论坛】【短信和E-Mail推荐】【】