今天我们来聊的主题是OCR产品。
OCR(Optical Character Recognition光学字符识别),就是指一些纸质或电子文档通过检测用字符识别方法将其翻译成计算机文字的过程。
但是现在最新的机器视觉不止于OCR字符识别,他还是识别动物、植物、工业制品等等,而且通过机器视觉技术去做原本用OCR技术做的事情,会提升识别速度,识别准确率等等。
但是通俗点讲,OCR就是图文识别,是机器视觉中的一个分支,这个大家都比较好理解。那么OCR识别产品都有什么呢?
接下来的介绍,大家会发现OCR识别产品和我们的生活息息相关。也可以理解什么是OCR做不了,但是机器视觉可以解决的。
产品功能特点
1、)高度集成:对取图设备无要求,手机、高拍仪、扫描仪均可实现一图多票裁切,票据类型自动分类,识别结果结构化输出;
2、一图多票预处理,只要取图设备支持,一张图上可以贴数十张不同种类的发票,通过图像预处理和AI的加成,实现迅速裁切,精准识别;
3、发票OCR 识别发票类型:支持增值税专用发票、普票、电子发票、出租车票,船票等一十八种票据,覆盖目前所有报销发票类型;
产品功能特点
1、万物皆可识别,识别能力不再限制文档、表格、公文等等,开放式通用接口,识别所有文档文字类图像,方便用户。
2、识别之后的比对功能,增加风控功能,按照内置标准进行比对,查询异常,防控风险。
3、表格兼容识别,并且进行表格还原,解决老式OCR不能解决的事情。
4、证照识别,自定义取数,用户可选提取全版面信息或者只提取关键字段,当然这个功能在其他类型的图像上也可以实现。
使用机器视觉技术和OCR技术去识别图像,目前虽然都做不到100%识别。但是两种技术之间的差距也是天差地别。
1、老旧的OCR是用字段识别率来计算识别率的,如图所示,99%的OCR识别率:
100张图共计10000字,其中100字识别错误,得识别率99%。但是极端情况下这100个错误字段,可能分布在100张图中,也就是说100张图没有1张识别正确。
2、机器视觉则不同,现在我们的机器视觉识别系统通过人工智能、机器学习、深度学习方式则完美的解决了这一问题。
机器视觉识别系统是以单张是否完全识别正确来计算识别率的,如:
100张,完全识别正确的有96张,则识别率为96%。
那么基于以上的数据对比。您会选择哪种技术手段,来解决图像数据结构化的需求呢?
1、动植物识别
2,工业智能制造及智能质检
1、saas服务
通过网络提供软件服务;
2、私有化服务
私有化部署可以实现让企业将该识别服务部署在自有服务器上(云服务器或本地服务器),部署完成后,APP端、PC客户端、web端、微信H5端等均可发送识别请求,通过Web Service接口调用该识别服务,上传图像在服务器端完成识别后,返回标准XML识别结果,整个识别过程均在企业内网完成,保证数据的安全性。
应用场景:金融行业、网上支付平台、社交软件、大型国企、涉密单位等等等等
致力用毕生精力专注OCR及机器视觉解决方案。
如果你有需要OCR及机器视觉解决方案,那么我们之间的故事就开始了。
现在的技术日新月异,但是我依然不能停止科普的道路,毕竟我的心愿,就是用我的机器视觉技术给天下所有的计算机一双眼睛。
笔芯!