汉字识别软件的任务是研究如何使计算机能够“识字”,该系统通常是采用光电转换装置将汉字或字符转换成电信号,并送入计算机,由计算机自动辨认、阅读,因此称其为光学字符识别(OpticalCharacterRecognition),简称为OCR)。 OCR的发展简况 OCR的概念是在1929年由德国科学家Tausheck最先提出来的,后来美国科学家Handel也提出了利用技术对文字进行识别的想法。而最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy,1966年他们发表了第一篇关于汉字识别的文章,采用了模板匹配法识别了1000个印刷体汉字。20世纪70年代初,日本的学者开始研究汉字识别,并做了大量的工作。我国研究汉字识别的起步比较晚,20世纪70年代末才开始进行OCR的研究工作。早期的OCR软件,由于识别率及产品化等多方面的因素,未能达到实际要求。同时,由于硬件设备成本高、运行速度慢,也没有达到实用的程度。只有个别部门,如信息部门、新闻出版单位等使用OCR软件。1986年以后我国的OCR研究有了很大进展,在汉字建模和识别方法上都有所创新,在系统研制和开发应用中都取得了丰硕的成果,不少单位相继推出了中文OCR产品。进入20世纪90年代以后,随着平台式扫描仪的广泛应用,以及我国信息自动化和办公自动化的普及,大大推动了OCR技术的进一步发展,使OCR的识别正确率、识别速度满足了广大用户的要求。
目前,比较流行的OCR软件很多,英文OCR主要有OmniPage,中文OCR主要有清华紫光OCR、清华文通OCR、汉王OCR、中晶尚书OCR、丹青OCR、蒙恬OCR等。尽管汉字字量大、字形复杂,但OCR技术已经走向成熟。许多OCR软件不仅能识别黑白印刷体汉字,还能识别灰度和彩色印刷体汉字,识别速度很快,识别正确率达到了99%以上;可识别宋体、黑体、楷体等多种字体的简、繁体;可对多种字体、不同字号的混排进行识别;有些OCR软件还能识别图像、表格。与此同时,对于手写体汉字识别的研究也取得了很大进展,正确识别率已达到了70%以上。 在扫描仪市场上,许多类型的办公和家用扫描仪均配有OCR软件,如紫光的扫描仪配备了紫光OCR,中晶的扫描仪配备了尚书OCR,Mustek的扫描仪配备了丹青OCR等。扫描仪与OCR软件共同承担着从文稿的输入到文字识别的全过程。
文稿扫描在办公领域中经常用到,即将报纸、杂志等媒体上刊载的有关文稿通过扫描仪进行扫描,随后进行OCR识别,或存储成图像文件,留待以后进行OCR识别,将图像文件转换成文本文件或Word文件进行存储。
此外,数字化信息的存储、传输,不仅成本低、效率高,而且能够适应排版、网络传输等不断发展的需要。目前我国有很多历史遗留下来的大量图书、报刊、杂志等纸质珍品,急需将其转换成电子信息。如电子图书馆的建立,就需要将图书逐页扫描,加上OCR软件的识别,更替代了人工键入文字的工作,大大缩短了录入时间,减轻了劳动强度,节省了人力且降低了费用,提高了录入正确率、工作效率和现代办公自动化程度。
&n
印前制作:浅谈文字识别软件OCR
来源:互联网 发布日期:2011-09-07 11:53:42 浏览:7931次
导读:印前制作:浅谈文字识别软件OCR-印前,制作,OCR...
下一篇:联机手写体汉字识别系统
相关内容
- 《麻省理工科技评论》预测2025年AI五大趋势
- 台积电设立2nm试产线,或将在今年量产
- 脑机接口临床案例获“出乎意料”成果:瘫痪患者训练2个月,不需脑机接口也可拿起木球
- 2024年最失败的八大技术,23andMe、波音Starliner、垂直农场上榜
- 回顾2024:AI和新硬件,开始改变我们的生活方式
- 我国脑机接口技术实现汉语实时编解码重大突破
- 拜登政府发布AI芯片新一轮限制措施,英伟达甲骨文强烈批评
- 技术分析|英伟达的Thor芯片有多先进?
- 美国正式公布AI芯片限制新规:英伟达与甲骨文公开反对!
- 2025十大AI技术趋势:具身智能、世界模型都有望迎来ChatGPT时刻|钛媒体AGI
- 黄仁勋:我们的目标是创建一个巨型芯片,将使用72个Blackwell GPU
- 端侧AI火爆,中国芯片企业如何在高通、苹果竞争中食得一杯羹
- 上海团队实现脑机接口临床试验重大突破,用汉语“意念对话”走进现实
- “脑控”智能设备、“意念对话” 脑机接口接入现实?|科技有狠活
- 韩国研究团队开发出类脑芯片,能够自主学习并纠正错误
- 一切皆为虚假,一切都有可能 | 2024人工智能盘点
- 2025年你将看到什么?微软罗列出六大AI趋势!
- 2025年手机芯片,可能不会采用2nm技术
- 意图打击中国产业,效果可能适得其反,美科技组织担忧AI芯片出口被管制
- 美科技巨头未来“完全收购”AI开发者?拜登警告:警惕科技工业综合体
AiLab云推荐
最新资讯
本月热点
热门排行
-
科学家成功研发可弯曲的非硅柔性芯片,成本不到 1 美元
阅读量:5959
-
FuriosaAI推出高能效AI芯片:性能与英伟达L40S接近,功耗低40%!
阅读量:5488
-
瑞士团队打造超小脑机接口,意识转文本准确率高达 91%
阅读量:4817
-
马斯克的新愿景对准盲人,Neuralink下一代脑机接口已获批
阅读量:4542
-
清华洪波教授:脑机接口实现语音解码输出应该在三年左右
阅读量:4330
-
为了获诺奖,AI不仅要懂物理学,还要懂哲学?
阅读量:3749