首页
核心技术
产品体系
解决方案
动态资讯
关于我们
搜索
首页 动态资讯 公司新闻

更快、更高、更强!易道博识推出移动端深度学习OCR应用“DOM”

来源:易道博识 发布时间:2021-09-27

“更快,更高,更强。”一直是金融行业智能开户不断追求的目标。更快的识别速度,更高的识别精度,更强的抗干扰能力,这对开户中的卡证识别来说尤为重要。


通过基于深度学习的OCR识别技术,易道博识提供的智能开户解决方案一直以识别速度快,精度高而著称,在证券、银行、保险等行业客户中广受认可,覆盖了国内七成以上的券商。


深度学习确实能为智能识别带来成倍效能的提升,但是,完全基于深度学习的卡证识别从来未在移动端上实现过。


与人脸识别等其它识别任务不同,OCR不仅需要卷积神经网络(CNN),还需要更复杂、计算量更大的递归神经网络(RNN、LSTM),这需要强大算力为支撑,而手机并不像服务器端一样拥有GPU。所以,充分利用有限的算力实现快速准确的数据处理,是移动端需要解决的关键问题。


但是突破从未停止。凭借多年的技术积累和自主开发,推出了完全基于深度学习的识别产品——移动端深度学习OCR(以下简称DOM,DeepOCR for Mobile)。


全方位突破,更快,更高,更强!


DOM SDK以完全的深度学习作为核心算法,所以能够更好地学习高级别对象语义和低级别细节特征,并更好地识别和分割多尺度的对象。以大量样本为驱动,反复迭代训练得到的最优的、具备强大泛化能力的OCR模组,使得DOM SDK真正拥有了“更快的识别速度,更高的识别精度,更强的抗干扰能力”,在已经足够成熟的解决方案之上,做到了“更快,更高,更强!”



值得一提的是,DOM SDK将CNN+RNN深度神经网络强大的自动特征编码能力,压缩到了移动端能接受的程度(SDK体积约10M),这是DOM SDK能够应用在移动端的另一重要原因。


具体而言,在识别能力上,相比于传统的 OCR 方法,基于深度学习技术的 DOM SDK识别核心具有大幅度领先的识别精度,具体表现在如生僻字、少数民族证件等场景下更好的识别效果。

而在证件分割中,相比传统 SDK 中基于四边定位的的方法,深度学习的方法能够更好地排除 背景噪声的干扰,如存在背景线条或背景特征与证件接近的情况,从而可以得到更精确的证件轮廓信息。

在手机上实现服务器端的证件质检

在DOM SDK中,实现了原来只有在服务器端才能完全实现的证件质检功能。DOM质检模块采用深度学习模型和规则相结合的方式,提供更高可靠性的证件异常检测。

证件质检主要完成对拍摄的证件图片中异常情况的检测,如模糊、缺角、形变、切边、光斑以及遮挡等,并做出相应地提示,如异常类型、区域等。

其中光斑、遮挡等基于深度检测模型完成,模糊、缺角、形变、切边等则基于对证件几何特征的分析完成。相比现有SDK完全基于图像分析的方法,DOM质检具有更高的精度和更好的可靠性。


视频流模式下的高速识别


DOM SDK支持用户在动态视频流条件下完成证件的自动识别,可以支持在任意方向或角度以及不同背景条件下拍摄或扫描证件图像。证件SDK会动态追踪证件位置,获取清晰的视频流图像完成识别。

DOM SDK首先对证件图像进行分割,得到证件区域位置。然后进行证件图像矫正,再做质检。对于存在异常的图像,如缺角、变形大、距离远等问题,SDK会给出相应的提示信息,并终止本次识别。对于质检通过的图片,SDK则会输入到OCR模型,完成后续识别工作。

北京易道博识科技有限公司(简称易道博识)致力于人工智能领域的技术研究与应用开发,基于自主研发的深度学习平台,实现文字识别、人脸识别、图像识别三大核心技术功能,为证券、银行、保险、互联网汽车金融、地产、多个行业量身打造AI+智能OCR识别解决方案,现已与600多家知名企业和机构建立合作。


作为国家级高新技术企业,易道博识由来自中科院、清华大学、北京大学等的多名顶尖人工智能专家共同组建,拥有发明专利、实用新型专利55项,计算机软件著作权35项,商标知识产权32个。

在线留言