本软件是飞涛软件工作室开发的一款免费Ocr软件,主要用于识别图像文件之中,出现的汉字显示字体。Ocr的中文含意是光学字符识别。
为什么叫Mini呢?因为现有的识别汉字的商业Ocr软件,动辄二三十兆,而本软件解压后,也不过三兆多,身材比较纤小,再加上本软件主要用于识别字体比较小的汉字,所以叫Mini,中文的发音是“迷你”,中文含义是超小型。
Mini Ocr进行汉字识别的策略:
1) 采用复合特征的分类方法。
2) 字符集选择3755个一级汉字。
3) 字体选择最常用的宋体。
4) 字号选择从小五号到一号汉字,主要针对20个点之内的小字体。
5) 英汉混排时,汉语优先。
6) 汉字粘连时,进行动态优化切分。
7) 识别前,先进行页面切分,把页面分割成一个一个的文字段落,擦除图形块,保留文字块。按照文字块先后顺序进行识别,以期处理图文混排的页面时,能达到更好的识别效果,并排除图形的干扰,加快文字的识别速度。
Mini Ocr 汉字显示字体识别软件 1.0 下载
来源:互联网 发布日期:2011-08-17 19:38:27 浏览:7072次
导读:本软件是飞涛软件工作室开发的一款免费Ocr软件,主要用于识别图像文件之中,出现的汉字显示字体。Ocr的中文含意是光学字符识别。为什么叫Mini呢?因为现有的识别...
上一篇:知识机器人
相关内容
AiLab云推荐
最新资讯
本月热点
热门排行
-
周鸿祎预测2024大模型10大趋势,“建议让AI在公司里无孔不入”
阅读量:186874
-
AI大变局,时代新希望|异想大会
阅读量:167156
-
产品经理必须懂得AI:ChatGPT-人工智能对话的新篇章
阅读量:107635
-
印媒:防AI造假,尼康、索尼等相机巨头拟推“数字签名”新技术
阅读量:104914
-
AI 的未来比你想象的更不稳定
阅读量:94547
-
比OpenAI官方提示词指南更全,这26条黄金准则让LLM性能飙升50%以上
阅读量:60890