图像校正方法、装置和服务器与流程

文档序号：27007497发布日期：2021-10-19 22:56阅读：130来源：国知局

1.本说明书属于人工智能技术领域，尤其涉及图像校正方法、装置和服务器。

背景技术：

2.在一些业务办理场景中，客户往往需要向业务办理人员提供并展示诸如身份证等所包含的文本字符相对较少的证件。
3.通常业务办理人员会先拍摄得到包含有上述证件的图像，再对该图像进行ocr识别(光学字符识别)，以提取并使用证件中相关的文本信息。
4.但是，业务办理人员所直接拍摄得到的包含有证件的图像的质量相对较差。例如，受拍摄方式、拍摄设备、拍摄环境等因素的影响，拍摄得到的用于后续ocr识别的图像往往会存在线性畸变，影响后续ocr识别的精度。
5.基于现有的图像校正方法，通常需要先确定出图像中证件轮廓的边缘角点，再依赖证件轮廓的边缘角点进行线性畸变的校正。但是，上述方法在具体实施时要求图像中证件轮廓必须是完整的。而在许多线性畸变场景中，证件轮廓的边缘也可能存在遗失，导致基于现有的图像校正方法难以精准、有效地实现针对线性畸变的校正处理。
6.此外，对于诸如身份证等所包含的文本字符相对较少的证件，所能提取并利用的特征相对较少，这也进一步增加了针对该类图像的校正处理难度。
7.针对上述问题，目前尚未提出有效的解决方案。

技术实现要素：

8.本说明书提供了一种图像校正方法、装置和服务器，能够有效地针对包含有较少的文本字符但版式规整的目标证件，且存在线性畸变的目标图像，较好地适用于多种不同类型的线性畸变场景，精准地消除目标图像中的线性畸变，得到效果较好、精度较高的校正后的目标图像。
9.本说明书实施例提供的一种图像校正方法，包括：
10.获取包含有目标证件的目标图像；其中，所述目标证件为所包含的文本字符的字符数小于等于预设的字符数阈值的证件；
11.根据预设的线性畸变校正规则，对所述目标图像进行第一图像校正处理，得到中间图像；
12.确定目标图像中的文本字符的平均偏转角；
13.根据所述文本字符的平均偏转角，对所述中间图像进行第二图像校正处理，以得到校正后的目标图像。
14.在一些实施例中，所述目标证件包括以下至少之一：身份证、社保卡、医保卡。
15.在一些实施例中，确定目标图像中的文本字符的平均偏转角，包括：
16.对所述目标图像进行形态学膨胀和腐蚀处理，得到处理后的目标图像；
17.对所述处理后的目标图像中的字符进行霍夫直线检测，以确定出目标图像中的文
本字符的平均偏转角。
18.在一些实施例中，根据所述文本字符的平均偏转角，对所述中间图像进行第二图像校正处理，包括：
19.通过根据所述文本字符的平均偏转角，将所述中间图像进行相应的逆旋转。
20.在一些实施例中，在获取包含有目标证件的目标图像之后，所述方法还包括：
21.从多个预设的版式规则中确定出与目标证件匹配的目标版式规则；
22.根据所述目标版式规则，识别并过滤所述目标图像中的无效字符。
23.在一些实施例中，根据预设的线性畸变校正规则，对所述目标图像进行第一图像校正处理，包括：
24.对所述目标图像进行预设的特征处理，以得到第一目标特征集；其中，所述第一目标特征集包含有多个稳定特征；
25.根据所述第一目标特征集、参照特征集，对所述目标图像进行第一图像校正处理；其中，所述参照特征集为预先基于包含有参照证件的参照图像，通过进行预设的特征处理所得到的特征集。
26.在一些实施例中，在所述目标证件包括身份证的情况下，所述稳定特征包括以下至少之一：姓名、性别、出生、住址、年、月、日。
27.在一些实施例中，在得到所述第一目标特征集之后，所述方法还包括：
28.利用预设的线性变换矩阵，处理所述第一目标特征集，以消除随机噪声，得到符合要求的第二目标特征集；
29.相应的，根据所述第二目标特征集、参照特征集，对所述目标图像进行第一图像校正处理。
30.在一些实施例中，根据所述第二目标特征集、参照特征集，对所述目标图像进行第一图像校正处理，包括：
31.根据所述第二目标特征集、参照特征集，通过特征匹配，确定出对应的匹配特征集；其中，所述匹配特征集包含有多个匹配特征对；
32.根据所述匹配特征集，通过数据拟合得到由目标图像映射到参照图像的单应性矩阵；
33.利用所述单应性矩阵，对所述目标图像进行线性变换处理。
34.在一些实施例中，根据所述文本字符的平均偏转角，对所述中间图像进行第二图像校正处理，以得到校正后的目标图像之后，所述方法还包括：
35.根据与目标证件相匹配的目标版式规则，对所述校正后的目标图像进行切片处理，得到多个切片图像；其中，所述切片图像携带有所对应的切片标识；
36.根据切片标识，从所述多个切片图像中筛选出目标切片图像；
37.调用与所述目标切片图像的切片标识匹配的ocr识别模型处理所述目标切片图像，以获取目标文本信息。
38.本说明书实施例还提供了一种图像校正装置，包括：
39.获取模块，用于获取包含有目标证件的目标图像；其中，所述目标证件为所包含的文本字符的字符数小于等于预设的字符数阈值的证件；
40.第一校正模块，用于根据预设的线性畸变校正规则，对所述目标图像进行第一图
像校正处理，得到中间图像；
41.确定模块，用于确定目标图像中的文本字符的平均偏转角；
42.第二校正模块，用于根据所述文本字符的平均偏转角，对所述中间图像进行第二图像校正处理，以得到校正后的目标图像。
43.本说明书实施例还提供了一种服务器，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现以下内容：获取包含有目标证件的目标图像；其中，所述目标证件为所包含的文本字符的字符数小于等于预设的字符数阈值的证件；根据预设的线性畸变校正规则，对所述目标图像进行第一图像校正处理，得到中间图像；确定目标图像中的文本字符的平均偏转角；根据所述文本字符的平均偏转角，对所述中间图像进行第二图像校正处理，以得到校正后的目标图像。
44.本说明书实施例还提供了一种计算机存储介质，其上存储有计算机指令，所述指令被执行时实现：获取包含有目标证件的目标图像；其中，所述目标证件为所包含的文本字符的字符数小于等于预设的字符数阈值的证件；根据预设的线性畸变校正规则，对所述目标图像进行第一图像校正处理，得到中间图像；确定目标图像中的文本字符的平均偏转角；根据所述文本字符的平均偏转角，对所述中间图像进行第二图像校正处理，以得到校正后的目标图像。
45.本说明书提供的一种图像校正方法、装置和服务器，可以先根据预设的线性畸变校正规则，通过对所述目标图像进行第一图像校正处理，实现针对目标图像中的线性畸变的粗粒度校正，得到第一次校正后的中间图像；再确定出目标图像中的文本字符的平均偏转角，并利用目标图像中目标证件的版式规整的特性，根据上述文本字符的平均偏转角，通过对该中间图像进行第二图像校正处理，实现针对目标图像中的线性畸变的细粒度校正，得到最终的校正后的目标图像。从而可以有效地针对包含有较少的文本字符但版式规整的目标证件，且存在线性畸变的目标图像，较好地适用于包括证件的轮廓边缘不完整在内的多种不同类型的线性畸变场景，通过两次图像校正处理，精准地消除目标图像中的线性畸变，得到效果较好、精度较高的校正后的目标图像。进而后续可以基于上述校正后的目标图像更加准确地进行ocr识别，提高ocr识别精度，得到精度较高、误差较小的目标文本信息。
附图说明
46.为了更清楚地说明本说明书实施例，下面将对实施例中所需要使用的附图作简单地介绍，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
47.图1是本说明书的一个实施例提供的图像校正方法的流程示意图；
48.图2是在一个场景示例中，应用本说明书实施例提供的图像校正方法的一种实施例的示意图；
49.图3是在一个场景示例中，应用本说明书实施例提供的图像校正方法的一种实施例的示意图；
50.图4是在一个场景示例中，应用本说明书实施例提供的图像校正方法的一种实施例的示意图；
51.图5是本说明书的一个实施例提供的服务器的结构组成示意图；
52.图6是本说明书的一个实施例提供的图像校正装置的结构组成示意图；
53.图7是在一个场景示例中，应用本说明书实施例提供的图像校正方法的一种实施例的示意图。
具体实施方式
54.为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。
55.参阅图1所示，本说明书实施例提供了一种图像校正方法。其中，该方法具体应用于服务器一侧。具体实施时，该方法可以包括以下内容：
56.s101：获取包含有目标证件的目标图像；其中，所述目标证件为所包含的文本字符的字符数小于等于预设的字符数阈值的证件；
57.s102：根据预设的线性畸变校正规则，对所述目标图像进行第一图像校正处理，得到中间图像；
58.s103：确定目标图像中的文本字符的平均偏转角；
59.s104：根据所述文本字符的平均偏转角，对所述中间图像进行第二图像校正处理，以得到校正后的目标图像。
60.通过上述实施例，可以充分利用目标证件中文本字符少但版式规整的特性，通过对目标图像分别进行第一图像校正处理和第二图像校正处理两次不同的图像校正处理，以分别基于粗粒度和细粒度两种粒度针对目标图像中的线性畸变进行两次校正，从而可以有效地针对包含有较少的文本字符但版式规整的目标证件，且存在线性畸变的目标图像，精准地消除目标图像中的线性畸变，得到效果较好、精度较高的校正后的目标图像。
61.在一些实施例中，上述目标证件具体可以是指所包含的文本字符较少、版式相对规整的证件。具体的，上述目标证件可以是一种区别于套打模式、半套打模式的，非套打模式的证件。通常这类证件是一次性铸型得到的，证件上的文本字符的大小、偏转角，以及不同文本字符之间的间距都是严格满足相应规则的。
62.对于上述目标证件，由于本身所包含的文本字符较少(例如，文本字符的字符数小于或等于预设的字符数阈值)，导致后续能够提取并使用的特征相对较少；同时，又由于版式(或者排版)相对规整，使得证件上的文本字符的空间特性(例如，文本字符的间距、偏转角等)变得较为固定、可靠。
63.在一些实施例中，所述目标证件具体可以包括以下至少之一：身份证、社保卡、医保卡等。当然，需要说明的是，上述所列举的目标证件只是一种示意性说明。具体实施时，根据具体的应用场景和处理需求，上述目标证件还可以包括其他类型的证件。对此，本书明书不作限定。
64.通过上述实施例，可以应用本说明书所提供的图像校正方法处理多种包含有不同目标证件的目标图像，以便能够对多种不同目标图像中的线性畸变进行统一的校正处理。
65.在一些实施例中，上述目标图像具体可以理解为一种包含有上述目标证件，且存
在线性畸变的，待进行校正处理的图像。具体可以参阅图2所示。目标图像中的目标证件存在透视偏转畸变(一种线性畸变)，并已经丢失了部分轮廓边缘。
66.在一些实施例中，上述线性畸变具体可以理解为一种经由图像采集方式所引入的图像误差。上述线性畸变会对后续目标图像的图像识别、文本信息的提取造成干扰，影响文本信息的提取的精度。
67.在一些实施例中，不同的图像采集方式所引入的线性畸变往往会存在较大的差异。具体的，上述线性畸变可以包括：在使用扫描仪、高拍仪等固定采集设备采集目标图像时，由于目标文本的摆放位置差异，所引入的表现为2d位移、2d旋转等的线性畸变；上述线性畸变还可以包括：在使用诸如手机、相机等手持采集设备采集目标图像时，由于手持采集设备的拍摄面相对于正视面的角度差异，所引入的表现为3d透视偏转的线性畸变等。
68.在一些线性畸变场景中，有时还会出现图像中证件轮廓不完整，或者证件轮廓的边缘角点存在缺失等情况。例如，在图2中，身份证左侧的边缘角点就是存在缺失的。而现有方法往往需要提取并依赖图像中证件轮廓的边缘角点，来构建相应的畸变模型，对图像进行校正。针对上述线性畸变场景，现有方法显然是无法适用的。此外，基于现有方法，针对不同的线性畸变，往往还需要分别构建不同的畸变模型来进行具体校正。即，基于现有方法，也无法构建并使用一个统一的畸变模型来对多种不同的线性畸变进行校正。而本说明书实施例所提供的图像校正方法可以通过有效地利用相对较为多样、丰富的稳定特征，而不是单一地依赖证件轮廓的边缘角点，来较好地解决上述问题，实现对多种不同类型线性畸变的校正处理。具体校正处理方式，后续将另作说明。
69.在一些实施例中，上述获取目标图像，具体实施时，可以包括：通过内置或外联有摄像头的设备拍摄目标证件的照片，作为目标图像。也可以包括：通过从视频数据中截取包含有目标证件的截图，作为目标图像等等。当然，上述所列举的关于目标图像的获取方式只是一种示意性说明。具体实施时，根据具体的应用场景，还可以采用其他合适的获取方式来获取目标图像。对此，本说明书不作限定。
70.在一些实施例中，在获取包含有目标证件的目标图像之后，所述方法具体实施时，还可以包括以下内容：从多个预设的版式规则中确定出与目标证件匹配的目标版式规则；根据所述目标版式规则，识别并过滤所述目标图像中的无效字符。
71.通过上述实施例，在对目标图像进行具体的图像校正处理之前，可以获取并利用相匹配的目标版式规则，识别并滤除目标图像中的无效字符，避免上述无效字符在后续图像校正处理过程中引入的误差。
72.在一些实施例中，上述无效字符具体可以理解为目标图像中目标证件上的不具有实际意义，或者基于业务需求不需要关注的字符。
73.在一些实施例中，具体实施前，可以根据多种不同类型证件的字符排版、格式等，配置好多个与多种不同类型证件对应的预设的版式规则。具体实施时，在获取目标图像之后，可以先检测并确定目标图像中所包含的目标证件的证件类型，记为目标证件类型；再根据目标证件类型检索多个预设的版式规则，找出与目标证件类型匹配的预设的版式规则，作为目标版式规则。
74.在一些实施例中，具体实施时，可以根据目标版式规则，结合具体的业务需求，识别并确定出目标图像中的无效字符；再对目标图像中的上述无效字符进行相应的屏蔽和过
滤。
75.在一些实施例中，上述根据预设的线性畸变校正规则，对所述目标图像进行第一图像校正处理，具体实施时，可以包括以下内容：
76.s1：对所述目标图像进行预设的特征处理，以得到第一目标特征集；其中，所述第一目标特征集包含有多个稳定特征；
77.s2：根据所述第一目标特征集、参照特征集，对所述目标图像进行第一图像校正处理；其中，所述参照特征集为预先基于包含有参照证件的参照图像，通过进行预设的特征处理所得到的特征集。
78.通过上述实施例，可以根据预设的线性畸变校正规则，获取并利用包含有多个稳定特征的第一目标特征集，对目标图像进行针对线性畸变的基于粗粒度的第一次图像校正处理。
79.在一些实施例中，上述第一目标特征集具体可以理解为包含有基于目标图像所得到的多个稳定特征的特征集合。
80.在一些实施例中，上述稳定特征(或者称锚定特征)可以是指目标图像中目标证件上对于线性变换具有较好的稳定性的特征。具体的，对于诸如身份证等非套打模式的目标证件，上述稳定特征可以是目标图像中目标证件上的较为固定的字符或图案。
81.在一些实施例中，在所述目标证件包括身份证的情况下，参阅图2所示，所述稳定特征包括以下至少之一：姓名、性别、出生、住址、年、月、日等。当然，上述所列举的稳定特征只是一种示意性说明。具体实施时，根据具体的应用场景和处理需求，还可以引入其他类型的特征作为上述稳定特征。
82.通过上述实施例，针对包含有身份证的目标图像，可以获取并利用相对较为多样且丰富的稳定特征来代替现有方法所依赖的单一的证件轮廓的边缘角点，从而可以更好地对目标图像进行图像校正处理。
83.在一些实施例中，上述参照特征集具体可以理解为包含有基于参照图像所得到的多个稳定特征的特征集合。其中，上述参照图像具体可以是指包含有参照证件，且不存在线性畸变，用于作为标准参照的图像。
84.具体实施前，预先可以获取包含有不同类型证件的多个参照图像；再对所述多个参照图像分别进行预设的特征处理，以得到与多个证件类型分别对应的多个预设的参照特征集。
85.具体实施时，可以根据目标图像中目标证件的证件类型，检索多个预设的参照特征集，以获取与目标证件的证件类型相匹配的预设的参照特征集作为上述用于进行第一图像校正处理的参照特征集。
86.在一些实施例中，上述对目标图像进行预设的特征处理，具体实施时，可以包括以下内容：根据所述目标图像，建立关于目标图像的高斯金字塔；确定并根据所述高斯金字塔中相邻层图像之间的像素值的变化数据，生成相应的差分图像，以构建对应的高斯差分金字塔；根据所述高斯差分金字塔，筛选出不同差分图像之间的相同特征，作为稳定特征，以建立所述第一目标特征集。
87.在一些实施例中，上述根据所述目标图像，建立关于目标图像的高斯金字塔，具体实施时，可以包括以下内容：利用基于高斯金字塔尺度空间模型的sifi算法对目标图像进
行特征提取，并通过进行降阶采样，以得到多个不同尺度的图像；调用预设的高斯核函数，对所述多个不同尺度的图像进行滤波处理，以得到关于目标图像的高斯金字塔。其中，上述预设的高斯核函数具体可以是指一种平滑系数(方差)逐渐变大的，具有尺度不变特性的高斯核函数。
88.在一些实施例中，上述根据所述高斯差分金字塔，筛选出不同差分图像之间的相同特征，作为稳定特征，以建立所述第一目标特征集，具体实施时，可以包括：根据所述高斯差分金字塔，筛选出至少预设个数个(例如，2个或3个等)不同差分图像所共有的相同特征作为稳定特征；再组合上述稳定特征，以及得到第一目标特征集。
89.在一些实施例中，又考虑到所获取的目标图像中往往还会存在许多随机噪声，这类随机噪声所引入的误差也会对后续的ocr识别造成影响。因此，为了能够有效地消除上述随机噪声所引入的误差，在得到第一目标特征集之后，还可以先利用预设的线性变换矩阵处理所述第一目标特征集，以去除随机噪声，得到相对精度更高、误差更小的第二目标特征集。后续，可以利用第二目标特征集代替上述第一目标特征集来对目标图像进行第一图像校正处理，得到误差相对更小的中间图像。
90.在一些实施例中，在得到所述第一目标特征集之后，所述方法具体实施时，还可以包括以下内容：利用预设的线性变换矩阵，处理所述第一目标特征集，以消除随机噪声，得到符合要求的第二目标特征集；相应的，根据所述第二目标特征集、参照特征集，对所述目标图像进行第一图像校正处理。
91.通过上述实施例，可以有效地消除第一目标特征集中的随机噪声，得到精度更高、误差更小的特征集，作为符合要求的第二目标特征集；进而可以利用上述第二目标特征集代替第一目标特征集进行第一图像校正处理，获得相对更好的校正效果。
92.在一些实施例中，上述预设的线性变换矩阵具体可以理解为一种基于pca的用于消除随机噪声的处理矩阵。
93.其中，上述pca(principle component analysis，主成分分析)具体可以是指一种应用于综合评价、语音识别、故障诊断等等领域的特征提取方法。
94.在一些实施例中，上述预设的线性变换矩阵具体可以是基于参照图像得到的。
95.在一些实施例中，所述预设的线性变换矩阵具体可以按照以下方式构建得到：获取包含有参照证件的参照图像；对所述参照图像进行预设的特征处理，以得到第一参照特征集；根据所述第一参照特征集，构建预设的线性变换矩阵。
96.在一些实施例中，上述根据所述第一参照特征集，构建预设的线性变换矩阵，具体实施时，可以包括：对所述第一参照特征集进行svd分解，得到对应的特征向量集；从所述特征向量集中，筛选出所对应的特征值大于预设的特征阈值的特征向量作为主成分向量，以构建得到所述预设的线性变换矩阵。
97.在一些实施例中，具体的，例如，对于第一参照特征集(其中元素均为128维向量)，可以先进行svd分解，再从中选取特征值较大的前几个(例如，特征值排序靠前的48个)特征向量作为主成份，以构建对应的预设的线性变换矩阵，可以记为projector。其中，上述svd分解具体可以是指奇异值分解(singular value decomposition)。
98.在一些实施例中，在根据所述第一参照特征集，构建预设的线性变换矩阵之后，具体实施时，还可以利用所述线性变换矩阵对所述第一参照特征集进行线性变换处理，以消
除第一参照特征集中的随机噪声，得到精度相对更高、误差相对更小的第二参照特征集。进而可以利用第二参照特征集代替之前的第一参照特征集，作为后续用于进行第一图像校正处理的参照特征集。
99.在一些实施例中，上述根据所述第二目标特征集、参照特征集，对所述目标图像进行第一图像校正处理，具体实施时，可以包括以下内容：
100.s1：根据所述第二目标特征集、参照特征集，通过特征匹配，确定出对应的匹配特征集；其中，所述匹配特征集包含有多个匹配特征对；
101.s2：根据所述匹配特征集，通过数据拟合得到由目标图像映射到参照图像的单应性矩阵；
102.s3：利用所述单应性矩阵，对所述目标图像进行线性变换处理。
103.通过上述实施例，可以综合利用第二目标特征集、参照特征集构建对应的单应性矩阵；再利用上述单应性矩阵通过对目标图像进行线性变换处理，以对线性畸变进行基于粗粒度的校正处理，得到第一次校正后的精度较高的中间图像。
104.在一些实施例中，上述根据所述第二目标特征集、参照特征集，通过特征匹配，确定出对应的匹配特征集，具体实施时，可以包括以下内容：调用预设的搜索算法(例如，快速最近邻搜索算法)处理所述第二目标特征集和参照特征集，从所述参照特征集中搜索出与第二目标特征集中的目标特征相似度最高的两个参照特征进行组合，得到多个初始匹配特征对；其中，所述初始匹配特征对包括一个目标特征和两个参照特征；计算初始匹配特征对中的两个参照特征与目标特征之间的相似度距离；根据所述初始匹配特征对中的两个参照特征与目标特征之间的相似度距离，建立相应的有效匹配特征对，以得到所述匹配特征集。
105.在一些实施例中，上述根据所述初始匹配特征对中的两个参照特征与目标特征之间的相似度距离，建立相应的有效匹配特征对，具体实施时，可以包括：按照以下方式根据当前初始匹配特征对中的两个参照特征与目标特征之间的相似度距离，建立当前有效匹配特征对：根据当前初始匹配特征对中的两个参照特征与目标特征之间的相似度距离，计算相似度距离的比值；检测所述相似度距离的比值是否大于预设的第一阈值，或小于预设的第二阈值；其中，预设的第一阈值大于预设的第二阈值；在确定所述相似度距离的比值大于预设的第一阈值，或小于预设的第二阈值的情况下，从两个参照特征中筛选出与目标特征之间的相似度距离小的参照特征，与目标特征组合，作为对应的有效匹配特征对。相反，在确定所述相似度距离的比值小于等于预设的第一阈值，且大于等于预设的第二阈值的情况下，剔除当前初始匹配特征对。
106.在一些实施例中，考虑到由于目标证件所包含的文本字符的字符数量相对较少，使得在进行上述第一图像校正处理时所基于的稳定特征的数量相对偏少、校正处理过程粒度较粗，影响第一图像校正处理的校正效果，导致经上述第一图像校正处理后所得到的中间图像仍然存在一定的误差，需要进行进一步更细粒度的图像校正处理。
107.又考虑到对于诸如身份证等非套打模式的目标证件，排版格式通常比较规整、固定。例如，身份证上不同字符的角度都是严格统一、一致的。因此，可以利用上述非套打模式的目标证件版式规整、固定的特性，通过对中间图像进行第二图像校正处理，实现细粒度的校正，从而可以得到校正效果较好的、误差相对较少、图像质量相对较高的校正后的目标图像。
108.在一些实施例中，上述确定目标图像中的文本字符的平均偏转角，具体实施时，可以包括以下内容：对所述目标图像进行形态学膨胀和腐蚀处理，得到处理后的目标图像；对所述处理后的目标图像中的字符进行霍夫直线检测，以确定出目标图像中的文本字符的平均偏转角。
109.通过上述实施例，可以较为准确、高效地确定出目标图像中目标证件上的文本字符的平均偏转角。
110.在一些实施例中，上述霍夫直线检测(即，hough直线检测算法)可以基于霍夫变换(例如，hough变换)，利用点线的对偶性(一方面，图像空间中共线的点对应在参数空间里相交的线；另一方面，在参数空间中相交于同一个点的所有直线在图像空间里都有共线的点与之对应)，把在图像空间中的直线检测问题转换到参数空间中对点的检测问题，进而可以通过在参数空间里进行简单的累加统计完成相应检测任务，确定出目标图像中目标证件上各个字符的偏转角度。接着，可以根据上述各个字符的偏转角度，统计出对应的字符的平均偏转角度，记为angle_avg。
111.在一些实施例中，上述霍夫变换具体可以是指一种特征检测(feature extraction)。霍夫变换可以用于来辨别找出物件中的特征，例如：线条。相应的算法流程包括：给定一个物件、要辨别的形状的种类，算法会在参数空间(parameter space)中执行投票来决定物体的形状，而这是由累加空间(accumulator space)里的局部最大值(local maximum)来决定的。
112.在一些实施例中，具体实施时，还可以利用改进的霍夫直线检测(例如，随机霍夫直线检测算法，rht)来确定出目标图像中的文本字符的平均偏转角。
113.其中，rht的基本思想是随机选取两个边缘点，由这两点唯一确定参数空间的一个点，这是多到一的映射，避免了传统霍夫变换需要涉及到的一到多映射的庞大计算量。进而后续在进行累加统计时，可以采用动态链表结构，只对多到一映射所得到的参数分配单元进行累加统计，从而可以有效地降低内存需求，提高运算速度，更加快速地确定出。
114.在一些实施例中，上述根据所述文本字符的平均偏转角，对所述中间图像进行第二图像校正处理，具体实施时，可以包括以下内容：通过根据所述文本字符的平均偏转角，将所述中间图像进行相应的逆旋转。
115.通过上述实施例，可以基于目标证件版式规整、固定的特性，利用目标证件上文本字符的平均偏转角，在经第一图像校正处理得到的中间图像的基础上，通过进行第二图像校正处理，实现基于细粒度的校正处理，从而可以得到最终的消除了线性畸变的，且精度相对较高、误差相对较小的校正后的目标图像。
116.具体可以参阅图3所示。校正后的目标图像，相对于原来的目标图像不但已经消除了透视偏转畸变，同时也减少了随机噪声所代入的误差。此外，在校正后的目标图像中目标证件相对于原来的目标图像，偏转角得到了调整，相对更适于进行后续的图像识别处理。
117.在一些实施例中，所述方法具体实施时，还可以包括以下内容：根据与目标文本匹配的目标版式规则，对所述校正后的目标图像进行切片，得到多个切片图像(例如，ocr识别)；对所述多个切片图像分别进行图像识别，以获取目标文本信息。
118.在一些实施例中，在根据所述文本字符的平均偏转角，对所述中间图像进行第二图像校正处理，以得到校正后的目标图像之后，所述方法具体实施时，还可以包括以下内
容：
119.s1：根据与目标证件相匹配的目标版式规则，对所述校正后的目标图像进行切片处理，得到多个切片图像；其中，所述切片图像携带有所对应的切片标识；
120.s2：根据切片标识，从所述多个切片图像中筛选出目标切片图像；
121.s3：调用与所述目标切片图像的切片标识匹配的ocr识别模型处理所述目标切片图像，以获取目标文本信息。
122.通过上述实施例，基于校正后的消除了线性畸变，且精度较高、误差较小的目标图像，可以通过切片处理得到精度更高的切片图像；进而可以通过对上述切片图像进行针对性的ocr识别，获取得到相对较为精准的目标文本信息。
123.在一些实施例中，具体实施前，可以训练得到多个针对不同切片图像的多个预设的ocr识别模型。其中，每一个预设的ocr识别模型可以对所对应的切片图像进行有针对性的较为精准的ocr识别处理，以提取出该切片图像中所包含的文本字符，作为处理结果。每一个预设的ocr识别模型具体可以携带有所对应的切片图像的切片标识。
124.在一些实施例中，具体实施前，可以获取大量包含有样本证件的样本图像。并根据目标版式规则，对样本图像分别进行切片处理，得到多个样本切片。根据样本切片的切片标识，将多个样切片划分为多个训练组；其中，每一个训练组包含有携带有相同切片标识的样本切片，每一个训练组对应一个切片标识。构建多个初始的ocr识别模型；并利用每一个训练组分别对一个初始的ocr识别模型进行训练、学习，从而可以得到多个分别对应不同的切片标识的预设的ocr识别模型。
125.在一些实施例中，具体的，例如，参阅图4所示，在目标证件包括身份证的情况下，根据与目标证件相匹配的目标版式规则，可以通过切片处理，将校正后的目标图像切分成3个切片图像。其中，上述切片图像分别携带有对应的切片标识。
126.其中，上述切片标识具体可以根据所对应的切片图像中的文本字符所表征的语义内容确定。具体的，可以参阅图4所示，目标图像中位于左侧上方的第一切片图像的切片标识为：基本信息，位于左侧下方的第二切片图像的切片标识为：身份证号，位于右侧的第三切片图像的切片标识为：头像照片。
127.根据目标版式规则，可以先确定出第三切片图像中不包含有文本字符。因此，可以先从三个切片图像中剔除第三切片图像。
128.接着，根据当前的业务需求：需要获取并对客户的住址信息进行电子存档。因此，可以根据切片图像所携带的切片标识，将包含有客户的住址信息的文本字符的第二切片图像，确定为目标切片图像。
129.进一步，可以根据第二切片图像所携带的切片标识，检索多个预设的ocr识别模型，找到与第二切片图像的切片标识匹配的预设的ocr识别模型作为目标模型；再调用该目标模型有针对性系处理第二切片图像，得到对应的处理结果；根据所述处理结果，获取该客户的住址信息，作为目标文本信息；并保存在于该客户对应的数据库中，完成电子存档。
130.在一些实施例中，在提取出所关注的目标文本信息之后，进一步，还可以根据目标文本信息进行目标数据处理。具体的，例如，可以根据目标文本信息对客户进行权限验证；也可以根据目标文本信息为客户建立或更新客户数据库；还可以根据目标文本信息进行联合统计分析等等。
131.由上可见，基于本说明书实施例提供的图像校正方法，可以先根据预设的线性畸变校正规则，通过对所述目标图像进行第一图像校正处理，实现针对线性畸变的粗粒度校正，得到第一次校正后的中间图像；再确定出目标图像中的文本字符的平均偏转角，并利用目标图像中目标证件的版式规整的特性，根据上述文本字符的平均偏转角，通过对所述中间图像进行第二图像校正处理，实现针对线性畸变的细粒度校正，得到最终校正后的目标图像。从而可以有效地针对包含有较少的文本字符但版式规整的目标证件，且存在线性畸变的目标图像，较好地适用于多种不同类型的线性畸变场景，精准地消除目标图像中的线性畸变，得到效果较好、精度较高的校正后的目标图像。进而后续可以基于上述校正后的目标图像更加准确地进行ocr识别，提高ocr识别精度，得到精度较高、误差较小的目标文本信息。
132.本说明书实施例还提供一种服务器，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器具体实施时可以根据指令执行以下步骤：获取包含有目标证件的目标图像；其中，所述目标证件为所包含的文本字符的字符数小于等于预设的字符数阈值的证件；根据预设的线性畸变校正规则，对所述目标图像进行第一图像校正处理，得到中间图像；确定目标图像中的文本字符的平均偏转角；根据所述文本字符的平均偏转角，对所述中间图像进行第二图像校正处理，以得到校正后的目标图像。
133.为了能够更加准确地完成上述指令，参阅图5所示，本说明书实施例还提供了另一种具体的服务器，其中，所述服务器包括网络通信端口501、处理器502以及存储器503，上述结构通过内部线缆相连，以便各个结构可以进行具体的数据交互。
134.其中，所述网络通信端口501，具体可以用于获取包含有目标证件的目标图像；其中，所述目标证件为所包含的文本字符的字符数小于等于预设的字符数阈值的证件。
135.所述处理器502，具体可以用于根据预设的线性畸变校正规则，对所述目标图像进行第一图像校正处理，得到中间图像；确定目标图像中的文本字符的平均偏转角；根据所述文本字符的平均偏转角，对所述中间图像进行第二图像校正处理，以得到校正后的目标图像。
136.所述存储器503，具体可以用于存储相应的指令程序。
137.在本实施例中，所述网络通信端口501可以是与不同的通信协议进行绑定，从而可以发送或接收不同数据的虚拟端口。例如，所述网络通信端口可以是负责进行web数据通信的端口，也可以是负责进行ftp数据通信的端口，还可以是负责进行邮件数据通信的端口。此外，所述网络通信端口还可以是实体的通信接口或者通信芯片。例如，其可以为无线移动网络通信芯片，如gsm、cdma等；其还可以为wifi芯片；其还可以为蓝牙芯片。
138.在本实施例中，所述处理器502可以按任何适当的方式实现。例如，处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(application specific integrated circuit，asic)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
139.在本实施例中，所述存储器503可以包括多个层次，在数字系统中，只要能保存二进制数据的都可以是存储器；在集成电路中，一个没有实物形式的具有存储功能的电路也叫存储器，如ram、fifo等；在系统中，具有实物形式的存储设备也叫存储器，如内存条、tf卡
等。
140.本说明书实施例还提供了一种基于上述图像校正方法的计算机存储介质，所述计算机存储介质存储有计算机程序指令，在所述计算机程序指令被执行时实现：获取包含有目标证件的目标图像；其中，所述目标证件为所包含的文本字符的字符数小于等于预设的字符数阈值的证件；根据预设的线性畸变校正规则，对所述目标图像进行第一图像校正处理，得到中间图像；确定目标图像中的文本字符的平均偏转角；根据所述文本字符的平均偏转角，对所述中间图像进行第二图像校正处理，以得到校正后的目标图像。
141.在本实施例中，上述存储介质包括但不限于随机存取存储器(random access memory,ram)、只读存储器(read
‑
only memory,rom)、缓存(cache)、硬盘(hard disk drive,hdd)或者存储卡(memory card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的，用于进行网络连接通信的接口。
142.在本实施例中，该计算机存储介质存储的程序指令具体实现的功能和效果，可以与其它实施方式对照解释，在此不再赘述。
143.参阅图6所示，在软件层面上，本说明书实施例还提供了一种图像校正装置，该装置具体可以包括以下的结构模块：
144.获取模块601，具体可以用于获取包含有目标证件的目标图像；其中，所述目标证件为所包含的文本字符的字符数小于等于预设的字符数阈值的证件；
145.第一校正模块602，具体可以用于根据预设的线性畸变校正规则，对所述目标图像进行第一图像校正处理，得到中间图像；
146.确定模块603，具体可以用于确定目标图像中的文本字符的平均偏转角；
147.第二校正模块604，具体可以用于根据所述文本字符的平均偏转角，对所述中间图像进行第二图像校正处理，以得到校正后的目标图像。
148.需要说明的是，上述实施例阐明的单元、装置或模块等，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现，也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
149.由上可见，基于本说明书实施例提供的图像校正装置，通过第一校正模块可以先根据预设的线性畸变校正规则，通过对所述目标图像进行第一图像校正处理，实现针对线性畸变的粗粒度校正，得到第一次校正后的中间图像；再通过确定模块和第二校正模块，先确定出目标图像中的文本字符的平均偏转角；再充分利用目标图像中目标证件的版式规整的特性，根据上述文本字符的平均偏转角，通过对所述中间图像进行第二图像校正处理，实现针对线性畸变的细粒度校正，得到最终校正后的目标图像。从而可以有效地针对包含有较少的文本字符但版式规整的目标证件，且存在线性畸变的目标图像，较好地适用于多种不同类型的线性畸变场景，精准地消除目标图像中的线性畸变，得到效果较好、精度较高的
校正后的目标图像。
150.在一个具体的场景示例中，所述图像校正方法具体可以应用于包含有服务器和终端设备的系统中。其中，服务器和终端设备可以通过有线或无线的方式相连，以进行具体的数据交互。
151.在本实施例中，所述服务器具体可以包括一种应用于网络平台一侧，能够实现数据传输、数据处理等功能的后台服务器。具体的，所述服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者，所述服务器也可以为运行于该电子设备中，为数据处理、存储和网络交互提供支持的软件程序。在本实施例中，并不具体限定所述服务器所包含的服务器数量。所述服务器具体可以为一个服务器，也可以为几个服务器，或者，由若干服务器形成的服务器集群。
152.在本实施例中，所述终端设备具体可以包括一种应用于用户一侧，内置或外连接有摄像头，能够实现数据采集、数据传输等功能的前端电子设备。具体的，所述终端设备例如可以为智能手机、监控器、连接有摄像头的电脑等。或者，所述终端设备也可以为能够运行于上述电子设备中的软件应用。例如，可以是在智能手机上运行的某监控app等。
153.具体实施时，终端设备可以采集包含有目标证件的目标图像；并通过有线或无线的方式将该目标图像发送至服务器。
154.相应的，服务器接收并获取该目标图像。服务器在接收到目标图像之后，可以先检测目标图像中是否存在线性畸变。
155.服务器在确定目标图像中不存在线性畸变的情况下，可以触发执行以下处理流程：从多个预设的版式规则中确定出与目标证件匹配的目标版式规则；根据目标版式规则，对目标图像进行切片，得到多个切片图像；对所述多个切片图像分别进行针对性的ocr识别，以获取所需要的目标文本信息。
156.服务器在确定目标图像中存在线性畸变的情况下，可以触发执行以下处理流程：对所述目标图像进行预设的特征处理，以得到第一目标特征集；其中，所述第一目标特征集包含有多个稳定特征；利用预设的线性变换矩阵处理所述第一目标特征集，得到对应的第二目标特征集；根据第二目标特征集、参照特征集，通过特征匹配，建立匹配特征集；根据匹配特征集，构建单应性矩阵；利用单应性矩阵对目标图像进项线性变换，以得到校正后的目标图像；根据与目标证件匹配的目标版式规则，对校正后的目标图像进行切片，得到多个切片图像；对所述多个切片图像分别进行针对性的ocr识别，以获取所需要的目标文本信息。
157.服务器可以根据所获取的目标文本信息进行具体的目标数据处理。
158.在另一个具体的场景示例中，可以应用本说明书实施例所提供的图像校正方法构建用于针对校正身份证图像(例如，包含有的目标证件的目标图像)的算法程序。
159.其中，上述算法程序具体可以包括以下几部分：
160.1)初始化部分：用于输入并处理参考身份证图像r_img(例如，包含有参照证件的参照图像)。
161.2)输入部分：用于输入并处理待处理的原始身份证图像i_img(例如，包含有目标证件的目标图像)。
162.3)输出部分：用于输出处理后的校正图像o_img(例如，校正后的目标图像)。
163.具体利用上述算法程序，在对身份证图像进行具体的校正处理时，参阅图7所示，
具体可以包括：初始化阶段和处理阶段共2个阶段。其中，初始化阶段包括步骤0.1
‑
0.5，算法程序只需要在启动时执行一次即可；处理阶段包括步骤1
‑
9，针对每次校正处理算法程序都需要执行。
164.(1)初始化阶段
165.步骤0.1：基于身份证固定版式(例如，版式规则)的位置信息，将模板文字(姓名、性别、民族、出生、住址、公民身份号码)以外文字进行屏蔽，得到仅保留模板文字的参考图片r_img’(例如，包含有参照证件的参照图像)；
166.步骤0.2：通过图像库api接口(通过进行预设的特征处理)，提取r_img’的sift关键点特征集f_t(例如，第一参照特征集)；
167.步骤0.3：通过数学库api接口对f_t作svd分解，分解生成的所有特征向量组成集合v；
168.步骤0.4：在特征向量集v中，选取特征值较大的pca_size个(验证发现对于身份证，主成分数pca_size设置为32左右能取得不错效果)所对应特征向量构成线性变换矩阵projector(例如，预设的线性变换矩阵)；
169.步骤0.5：对f_t中的sift关键点向量，通过线性变换矩阵projector进行特征变换，得到变换后的参考图关键点集，可以记为f_t_pca(例如，第二参照特征集)。
170.(2)处理阶段
171.步骤1：通过图像库api接口(通过进行预设的特征处理)，提取待处理图片i_img(例如，包含有目标证件的目标图像)的sift关键点特征集f_i(例如，第一目标特征集)；
172.步骤2：对f_i中的sift关键点向量，通过线性变换矩阵projector进行特征变换，得到变换后的关键点集，可以记为f_i_pca(例如，第二目标特征集)；
173.步骤3：对参考图中的关键点集f_t_pca中每个向量ft_i_pca(例如，任意一个目标特征)，通过knn在待处理图关键点集f_i_pca中找出2个最近邻f_i_pca_t1与f_i_pca_t2(以组成初始匹配特征对)；
174.步骤4：计算关键点向量ft_i_pca与f_i_pca_t1相似度距离di_1，及ft_i_pca与f_i_pca_t2欧式距离di_2；
175.步骤5：根据公式di_1/di_2<ratio_threshold，判定匹配对有效性(其中，ratio_threshold的取值可以设置在0.5～0.6范围内能取得不错效果)，将有效的匹配对(例如，有效匹配特征对)添加进匹配对集f_m(例如，匹配特征集)。
176.步骤6：通过图像库单应性矩阵拟合接口，根据f_m拟合出待处理影像映射到参考影像的单应性矩阵h。
177.步骤7：对待处理身份证图像i_img施加线性变换h，得到粗粒度校正图片o_img’(例如，中间图像)；
178.步骤8：通过图像库的形态学膨胀/腐蚀处理和霍夫直线检测api接口，获得o_img’中的文字的平均偏转角度angle_avg(例如，目标图像中的文本字符的平均偏转角)；
179.步骤9：根据文字平均偏转角度angle_avg，对o_img’进行逆旋转，实现细粒度的角度修正，输出图片o_img，即为校正结果(例如，校正后的目标图像)。
180.通过上述场景示例，利用基于本说明书所提供的图像校正方法构建的算法程序，可以实现对身份证图像中诸如旋转、位移、缩放、三维角度偏转在内的多种线性畸变干扰情
况进行自动校正处理。并且，能够自动兼容各种平面畸变和三维透视畸变，提供统一且通用校正处理。此外，不同于以往根据轮廓边缘角点进行校正的方法，利用本算法程序即使在面对身份证图像因严重畸变而丢失轮廓边缘信息的情况下，依然有效。另外，本算法程序还能够有效处理包括手机拍摄、扫描件等多种采集方式获取的身份证图像。且算法程序的设计思路简单，使用方便，具有较好的泛用性、鲁棒性。
181.在本场景示例中，该算法程序具体可以采用opencv作为底层图像库，提供了封装良好的调用方式。在具体实施及使用过程中：可以通过算法程序的初始化构建接口，传入参考身份证图像文件存放路径。并设置超参ratio_threshold。经验证发现，对于身份证场景，ratio_threshold可以设置为0.6～0.7，均能取得不错效果。还可以通过调用校正处理接口，传入待处理身份证图像文件存放路径即可，进而可以返回输出图像即为校正结果。
182.虽然本说明书提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或客户端产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境，甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下，并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。
183.本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
184.本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
185.通过以上的实施例的描述可知，本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本说明书的技术方案本质上可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，移动终端，服务器，或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
186.本说明书中的各个实施例采用递进的方式描述，各个实施例之间相同或相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备
或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
187.虽然通过实施例描绘了本说明书，本领域普通技术人员知道，本说明书有许多变形和变化而不脱离本说明书的精神，希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李兆佳;许政伟;姜璐;周宇哲
技术所有人：中国工商银行股份有限公司
我是此专利的发明人

上一篇：静配专用收集瓶盖的医用垃圾桶的制作方法
上一篇：一种建筑施工模板夹具的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。