代理商代签名的识别方法及装置与流程

文档序号:26589804发布日期:2021-09-10 20:32阅读:307来源:国知局
代理商代签名的识别方法及装置与流程

1.本发明涉及数据处理技术领域,具体涉及一种代理商代签名的识别方法及装置。


背景技术:

2.随着各类业务的发展,在带来业务量和用户增长的同时,也增加了业务风险,目前已经出现了通过不知情订购的方式完成业务指标的现象。对于线上业务或自营厅办理业务,目前已通过认证比对、人像比对、订购二次确定等手段进行防控;在代理商层面,除了常规的身份证验证之外,同样需要对客户签名进行稽核确认。
3.目前常用的稽核方式包括以下两种:
4.第一种方式,针对签名文字的识别,包括:1、判断是否有签名;2、签名是否是汉字;3、签的内容否与受理客户姓名一致;4、现场签名是否与客户原始留存的签名一致。其中主要的技术是对签名的识别,随着手写识别技术的演进,对手写体的识别率在提升,可以识别签名内容,从而做出签名是否合规的判断。
5.第二种方式,针对非本人代签的识别,基于真实签名与待验证签名的比对实现,这种方式的实现依赖于以下两个前置条件:具备用于比照的真实客户签名特征库,具有足够的真实客户笔迹作为训练数据。
6.但是,发明人在实现本发明的过程中发现:上述第一种方式可以解决签的是否是本人姓名的问题,保证和受理人的姓名一致,但是对于识别代理商是否使用代签的问题,通过对签名文字的识别是无法解决的。上述第二种方式中,首先,对于新客户来说,之前并未存在业务办理记录,也没有可用于比照的签名;其次,在客户办理业务次数的不多的情况下,没有足够的真实客户笔迹作为训练数据,并且也存在客户的历史签名也是代签的问题,导致上述两个前置条件通常难以满足。


技术实现要素:

7.鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的代理商代签名的识别方法及装置。
8.根据本发明的一个方面,提供了一种代理商代签名的识别方法,包括:
9.获取代理商手写笔迹图像,识别出代理商手写笔迹图像包含的手写内容信息;
10.根据手写内容信息以及代理商的渠道信息对代理商手写笔迹图像进行归类,根据归类结果形成代理商笔迹库;
11.当接收到待验证签名笔迹图像时,识别出待验证签名笔迹图像包含的待验证签名内容信息;
12.根据待验证签名内容信息以及待验证签名笔迹图像对应的代理商渠道信息,从代理商笔迹库中提取匹配的代理商手写笔迹图像;
13.基于匹配的代理商手写笔迹图像训练第一笔迹识别模型;
14.将待验证签名笔迹图像输入至第一笔迹识别模型中进行计算,得到第一相似度结
果,根据第一相似度结果确定待验证签名是否为代理商代签。
15.可选地,获取代理商手写笔迹图像之后,方法进一步包括:
16.将代理商手写笔迹图像进行预处理;其中,预处理包括以下中的一种或多种处理:二值化处理、平滑处理、文字切分处理。
17.可选地,根据手写内容信息以及代理商的渠道信息对代理商手写笔迹图像进行归类,根据归类结果形成代理商笔迹库进一步包括:
18.若存在多个代理商手写笔迹图像的手写内容信息的字义相同,针对于该字义建立索引,并将该多个代理商手写笔迹图像保存在该字义的索引下,以形成代理商笔迹库。
19.可选地,方法进一步包括:
20.根据待验证签名内容信息获取客户信息;
21.根据客户信息,检索是否存在客户在其他代理商处的签名留存数据;
22.若是,则根据签名留存数据训练第二笔迹识别模型;
23.将待验证签名笔迹图像输入至第二笔迹识别模型进行计算,得到第二相似度结果;
24.根据第二相似度结果确定待验证签名笔迹是否为客户真实签名笔迹。
25.可选地,第一笔迹识别模型和第二笔迹识别模型基于卷积神经网络算法训练得到。
26.可选地,方法进一步包括:
27.在根据第一相似度结果确定待验证签名为代理商代签的情况下,则将待验证签名笔迹图像标记为代理商手写笔迹图像样本,并纳入代理商笔迹库中。
28.根据本发明的另一方面,提供了一种代理商代签名的识别装置,包括:
29.获取模块,适于获取代理商手写笔迹图像;
30.第一识别模块,适于识别出代理商手写笔迹图像包含的手写内容信息;
31.归类入库模块,适于根据手写内容信息以及代理商的渠道信息对代理商手写笔迹图像进行归类,根据归类结果形成代理商笔迹库;
32.第二识别模块,适于当接收到待验证签名笔迹图像时,识别出待验证签名笔迹图像包含的待验证签名内容信息;
33.匹配模块,适于根据待验证签名内容信息以及待验证签名笔迹图像对应的代理商渠道信息,从代理商笔迹库中提取匹配的代理商手写笔迹图像;
34.模型训练模块,适于基于匹配的代理商手写笔迹图像训练第一笔迹识别模型;
35.计算模块,适于将待验证签名笔迹图像输入至第一笔迹识别模型中进行计算,得到第一相似度结果;
36.判断模块,适于根据第一相似度结果确定待验证签名是否为代理商代签。
37.可选地,装置进一步包括:
38.预处理模块,适于获取代理商手写笔迹图像之后,将代理商手写笔迹图像进行预处理;其中,预处理包括以下中的一种或多种处理:二值化处理、平滑处理、文字切分处理。
39.可选地,归类入库模块进一步适于:若存在多个代理商手写笔迹图像的手写内容信息的字义相同,针对于该字义建立索引,并将该多个代理商手写笔迹图像保存在该字义的索引下,以形成代理商笔迹库。
40.可选地,装置进一步包括:
41.客户信息模块,适于根据待验证签名内容信息获取客户信息;
42.数据检索模块,适于根据客户信息,检索是否存在客户在其他代理商处的签名留存数据;
43.模型训练模块进一步适于:根据签名留存数据训练第二笔迹识别模型;
44.计算模块进一步适于:将待验证签名笔迹图像输入至第二笔迹识别模型进行计算,得到第二相似度结果;
45.判断模块进一步适于:根据第二相似度结果确定待验证签名笔迹是否为客户真实签名笔迹。
46.可选地,第一笔迹识别模型和第二笔迹识别模型基于卷积神经网络算法训练得到。
47.可选地,装置进一步包括:标记和入库模块:适于在根据第一相似度结果确定待验证签名为代理商代签的情况下,则将待验证签名笔迹图像标记为代理商手写笔迹图像样本,并纳入代理商笔迹库中。。
48.根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
49.所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述代理商代签名的识别方法对应的操作。
50.根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述代理商代签名的识别方法对应的操作。
51.根据本发明的代理商代签名的识别方法及装置,方法包括:获取代理商手写笔迹图像,识别出代理商手写笔迹图像包含的手写内容信息;根据手写内容信息以及代理商的渠道信息对代理商手写笔迹图像进行归类,根据归类结果形成代理商笔迹库;当接收到待验证签名笔迹图像时,识别出待验证签名笔迹图像包含的待验证签名内容信息;根据待验证签名内容信息以及待验证签名笔迹图像对应的代理商渠道信息,从代理商笔迹库中提取匹配的代理商手写笔迹图像;基于匹配的代理商手写笔迹图像训练第一笔迹识别模型;将待验证签名笔迹图像输入至第一笔迹识别模型中进行计算,得到第一相似度结果,根据第一相似度结果确定待验证签名是否为代理商代签。本发明所提供的代理商代签名识别方法与传统方法相反,传统方法依赖客户的历史签名作为样本,识别待验证签名笔迹与客户历史签名笔迹之间的相似关系,而本实施例方法是依赖代理商的签名笔迹作为样本构建识别模型,利用识别模型计算待验证签名笔迹与代理商手写笔迹之间的相似关系,从而识别待验证签名笔迹是否为代理商代签。相比起传统的方式,这种方式降低了数据收集难度,提高了技术使用范围,有助于防范客户不知情定制业务的风险。
52.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
53.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
54.图1示出了本发明代理商代签名的识别方法实施例的流程图;
55.图2示出了本发明代理商代签名的识别方法另一个实施例的流程图;
56.图3示出了本发明实施例中卷积网络的示意图;
57.图4示出了本发明实施例提供的代理商代签名的识别装置的结构示意图;
58.图5示出了本发明实施例提供的计算设备的结构示意图。
具体实施方式
59.下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
60.首选介绍笔迹识别的理论基础,笔迹习惯是一种动力定型的表现,一个笔迹习惯业已固定的人,在进行手写时虽然整体上要受到个人意识的控制,但具体的手写动作则是靠书写习惯自动实现的。这种自动化的重复再现,使个人的签名或手写笔迹保持相对稳定。笔迹签名即使是同一人在不同时间段、不同书写环境中都会呈现出一定的不一致,因此,不能单纯凭借某几个固定特征做出判断,即不能单纯依赖人工事先预设的笔迹特征点来识别,而需要从整体性的角度,通过关键特征点与整体图像特征相结合的方式来实现。
61.在实际业务场景中,代理商通常具有地域性,同一个代理商的业务办理人员是相对固定的,这就导致了某一个代理商存在代签名行为的人员,可能与做业务受理的人员是同一个,那么如果要识别某个签名是否是由代理商业务人员代签,可以通过检测该份签名与该代理商的其他签名是否由同一人所签,从而将代签的识别从与真实客户验证转换为与代理商历史手写数据的验证,在验证数据和训练数据两方面都能得到保证。
62.本发明实施例中,主要利用卷积神经网络实现自动化识别,人工神经网络,是为了模拟人脑神经系统的结构与功能,运用大量处理单元经过广泛互连,由人工方式建立起来的网络系统,这些大量的处理单元称作人工神经元。人工神经网络实际上是以人工神经元作为节点,用有向加权连接起来的有向网络结构。权值的正负对应突触连接的兴奋性或抑制性。全连接网络的特点就是所有的输入信息都会对之后的训练都影响,但是对于图像数据,这样是没有意义的。
63.卷积网络有两个很重要的概念:1、局部感受野;2、权值共享。局部感受野的特点是一张图片内距离很远的点关联度不高,所以相当于从全连接方式省下了一部分参数,只进行局部运算,减少了运算参数数量。对于“权值共享”,实际上就是对于一张图像,计算的方式一样,也就是特征提取的方式一样;体现为不断在输入图像上滑动卷积的时候,所有filter内部的数据计算方式一样,这就是“参数共享”,这样同样可以减少参数值。
64.卷积神经网络(cnn,convolutional neural network)就是深度神经网络的一类模型,并且受到深度学习架构思想的指导。它尤为适合建立来处理和识别图像。卷积神经网
络的结构包括:输入层、卷积层、降采样层(池化层)、全连接层。
65.输入层:整个网络的输入,一般是一张图象的像素矩阵,在上面的图中,可以看到输入是一个立体的结构,这是因为一般的图像都会有一个深度的概念,就像我们一般见到的rgb的彩色图像,就是a*b*c的形式,其中前两维指定的是图像的长和宽,第三维则是深度,彩色rgb的深度是3,而之前我们见到的mnist中的黑白图像的深度是1。
66.卷积层(convolutional layer):利用卷积运算从图像中提取底层到高层的特征,并保证图片局部关联性、空间不变性。滤波器filter:可以理解为实现定义的卷积核的神经元。步长stride:对于一个区域,在进行计算完成之后要进行滑动,滑动的时候的的移动距离就是这个stride。填充padding:考虑卷积的计算过程,对于图像靠近中间部分的像素,我们可以看出,会被“重叠”地计算很多次,相比之下,边缘地像素只被计算了一次,为了保证计算次数相对均衡,在边缘填充一些值从而保证其也被多次计算。
67.深度depth:这里的深度不是指图像,而是指某一层中神经元(滤波器)的个数,此时输出的不是一张特征图,而是几张特征图组成的一个立体,一个filter可以将输入图像处理成一张feature map,不同的filter重点处理的特征是不同的,我们想要得到不同的特征图,就需要设置多个filter,这样每个filter处理得到一张feature map,那么多个filter就会得到多个feature map,将这些feature map叠在一起就是输出的立体了,所以可以看到,filter与feature map的数量是一样的,这个数量,就是深度。
68.降采样层(池化层)(sub-sampling layer):进行降采样操作。通过卷积输出特征图中局部最大值(max-pooling)、均值(avg-pooling)滤掉不重要的高频信息。池化层有以下几个功能:1、对feature map又进行一次特征提取,这也是减小数据量的操作;2、获取更抽象的特征,防止过拟合,提高泛化性;3、经过这个处理,对输入的微小变化有更大的容忍,也就是说如果数据有一些噪音,那么经过这个特征提取的过程,就一定程度上减小了噪音的影响。
69.全连接层(fully connected layer):网络中各层的神经元是全部连接的。卷积层、全连接层后面通常都会紧接一个非线性变化处理层来增强网络对特征的表达能力。
70.应用卷积神经网络的图像识别模型,主要在于图像的两个重要特性:局部相关性和空间不变性。通过反复运用卷积和运算,能很好地反映图像的特点。卷积层在提取特征时,输入输出的数据都具有关联性,保留特征之间的相对关系,不会以线性关系孤立地提取特征,以局部相关性体现图像内部信息的非线性组合。同时,在特征映射时,由于卷积网络的神经元之间共享权值,参数数量就将大大减少,复杂度随之降低,而信息有效度则大幅提升。
71.图1示出了本发明代理商代签名的识别方法实施例的流程图,如图1所示,该方法包括以下步骤:
72.步骤s101,获取代理商手写笔迹图像,识别出代理商手写笔迹图像包含的手写内容信息。
73.本发明实施例的方法需要对代理商的手写笔迹进行归档录入,对凡是涉及代理商渠道办理的业务单据手写字体进行统一收集,以便形成一个代理商笔迹库。
74.首先,获取各个代理商的手写笔迹图像,手写笔迹包含但不限于签名笔迹,利用识别技术识别出代理商手写笔迹图像中包含的汉字或者英文等字符内容。本发明对获取代理
商手写笔迹图像的方式不作限定,例如可以通过扫描或者拍照的方式获取代理商手写笔迹图像。
75.步骤s102,根据手写内容信息以及代理商的渠道信息对代理商手写笔迹图像进行归类,根据归类结果形成代理商笔迹库。
76.其中,代理商的渠道信息可以指的是代理商编号。根据代理商手写笔迹图像中包含的手写内容信息以及对应的代理商渠道信息,将同一个代理商的且手写内容信息一致的代理商手写笔迹图像归为一类,并入库保存。具体实施时,可根据代理商编号建立第一类目,在第一类目下,根据手写内容信息建立从属于第一类目的第二类目,当然,本发明并不以此为限。
77.步骤s103,当接收到待验证签名笔迹图像时,识别出待验证签名笔迹图像包含的待验证签名内容信息。
78.步骤s101-步骤s102为建立代理商笔迹库的处理过程,步骤s103-步骤s106则是待验证签名是否为代理商代签的识别过程。首先,接收待验证签名笔迹图像,利用识别技术识别出待验证签名笔迹图像中包含的中文或英文等字符内容,得到待验证签名内容信息。待验证签名笔迹图像也就是电子化签名单据,可以通过对纸质签名单据进行扫描或者拍摄得到,当然也有一些单据本身就是电子单据。
79.步骤s104,根据待验证签名内容信息以及待验证签名笔迹图像对应的代理商渠道信息,从代理商笔迹库中提取匹配的代理商手写笔迹图像。
80.然后,根据待验证签名内容信息以及代验证签名笔迹图像所对应的代理商编号,在代理商笔迹库中进行检索,得到匹配的代理商手写笔迹图像。
81.步骤s105,基于匹配的代理商手写笔迹图像训练第一笔迹识别模型。
82.将提取出来的代理商手写笔迹图像作为训练样本,训练第一笔迹识别模型,例如,可以通过卷积神经网络算法训练第一笔迹识别模型。
83.步骤s106,将待验证签名笔迹图像输入至第一笔迹识别模型中进行计算,得到第一相似度结果,根据第一相似度结果确定待验证签名是否为代理商代签。
84.最终,将待验证签名笔迹图像输入到第一笔迹识别模型中进行计算,输出第一相似度结果,如果第一相似度超过预设阈值,表明待验证签名笔迹与代理商手写笔迹相似度较高,则可以判断待验证签名为代理商代签。反之,如果第一相似度未超过预设阈值,表明待验证签名笔迹与代理商手写笔迹不相似,则确定待验证签名不是代理商代签的。
85.本发明实施例在具体的代理商笔迹识别场景中,结合了对汉字的识别比对和对具体特征的验证。首先从代理商手写内容中识别出与待验证签名一致的文字,然后利用神经网络验证文字是否存在整体性和局部特征上的相似,从而确定签名是否由代理商业务人员代签。
86.由此可见,本发明实施例所提供的代理商代签名识别方法与传统方法相反,传统方法依赖客户的历史签名作为样本,识别待验证签名笔迹与客户历史签名笔迹之间的相似关系,而本实施例方法是依赖代理商的签名笔迹作为样本构建识别模型,利用识别模型计算待验证签名笔迹与代理商手写笔迹之间的相似关系,从而识别待验证签名笔迹是否为代理商代签。相比起传统的方式,这种方式降低了数据收集难度,提高了技术使用范围,有助于防范客户不知情定制业务的风险。
87.图2示出了本发明代理商代签名的识别方法另一个实施例的流程图,如图2所示,该方法包括以下步骤:
88.步骤s201,获取代理商手写笔迹图像,识别出代理商手写笔迹图像包含的手写内容信息。
89.首先,获取各个代理商的手写笔迹图像,利用识别技术识别出代理商手写笔迹图像中包含的汉字。
90.可选地,在获取到代理商手写笔迹图像之后,首先进行预处理,以形成便于比对、保持的清晰、独立的单个汉字图像。在此情况下,通过对预处理之后的手写笔迹图像进行识别,得到手写笔迹图像所包含的手写内容信息。
91.其中,预处理主要包括以下三方面的处理:
92.笔迹图像的二值化处理:把签名汉字图像处理成为(0,1)的数字信息,即将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果的过程。得到二值化图像,这样子有利于在对图像做进一步处理时,图像的集合性质只与像素值为0或255的点的位置有关,不再涉及像素的多级值,使处理变得简单,而且数据的处理和压缩量小。
93.笔迹图像的平滑处理:为了减少笔迹的边缘噪声,需要对二值化后的签名图像进行平滑降噪处理。空间域的平滑滤波一般采用简单平均法进行,就是求邻近像元点的平均亮度值。邻域的大小与平滑的效果直接相关,邻域越大平滑的效果越好,但邻域过大,平滑会使边缘信息损失的越大,从而使输出的图像变得模糊,因此需合理选择邻域的大小。在本发明实施例中,为了保证笔迹在平滑后的清晰度,需要保护笔迹边缘不被模糊化,因此选用中值滤波法进行图像平滑降噪处理,即将图像的每个像素用邻域(以当前像素为中心的正方形区域)像素的中值代替中值滤波对脉冲噪声有良好的滤除作用,特别是在滤除噪声的同时,能够保护信号的边缘,使之不被模糊,但它会洗去均匀介质区域中的纹理。
94.汉字切分处理:为了提升校验的准确性,本发明实施例中按照单个汉字进行匹配校验。经过上述两个步骤处理后,笔迹内容仍然是以句子或词组的形式,不符合后续将按照单个汉字进行匹配校验的要求,因此需要对笔迹内容进行切分,使得最终是以独立汉字的形式进行保存的。对汉字切分主要通过对汉字间隔留白的宽度和连接笔迹的判断完成。对间隔留白的宽度判断主要以横向宽度的识别为主,因为汉字结构上来说,左右间距是识别单个汉字的主要方式。具体的宽度判断通过对历史笔迹的自学习获得,亦可通过人工特征设置的方式实现。
95.步骤s202,根据手写内容信息以及代理商的渠道信息对代理商手写笔迹图像进行归类,根据归类结果形成代理商笔迹库。
96.具体实施时,可根据代理商编号建立第一类目,在第一类目下,根据手写内容信息建立从属于第一类目的第二类目。举例来说,获取到了代理商a的若干代理商手写笔迹图像,识别出代理商手写笔迹图像的手写内容信息包含“张三”、“李四”等等,代理商编号为“代理商a”,则建立第一类目“代理商a”,以及第二类目“张三”、“李四”等等,所有的代理商a的且文字内容为张三的代理商手写笔迹图像都保存在类目“代理商a-张三”下,所有的代理商a的且文字内容为李四的代理商手写笔迹图像都保存在类目“代理商-李四”下。当然,这里仅仅是举例,本发明归类的方式并不以此为限,只要能够实现将同一个代理商的且手写
内容信息一致的代理商手写笔迹图像归为一类即可。
97.在一种可选的实施方式中,还可以结合时间信息和/或业务信息对代理商手写笔迹图像进行归类,形成代理行笔迹库。
98.在一种可选的实施方式中,还可以结合字义对代理商手写笔迹图像进行归类,形成代理商笔迹库。具体地,若存在多个代理商手写笔迹图像的手写内容信息的字义相同,针对于该字义建立索引,并将该多个代理商手写笔迹图像保存在该字义的索引下,以形成代理商笔迹库。例如,在多张电子化业务单据中,出现了不同笔迹但字义相同的情况,则根据字义建立索引,将所有此字义的多个笔保存在此索引下。在后续过程中,可根据字义来快速查找需要比对的笔迹。
99.步骤s203,当接收到待验证签名笔迹图像时,识别出待验证签名笔迹图像包含的待验证签名内容信息。
100.接收待验证签名笔迹图像,利用文字识别技术识别出待验证签名笔迹图像中包含的中文,得到待验证签名内容信息。待验证签名笔迹图像也就是电子化签名单据,可以通过对纸质签名单据进行扫描或者拍摄得到,当然也有一些单据本身就是电子单据。该步骤也即对待验证签名笔迹图像中的笔迹进行识别,判断签名是哪几个汉字。
101.步骤s204,根据待验证签名内容信息以及待验证签名笔迹图像对应的代理商渠道信息,从代理商笔迹库中提取匹配的代理商手写笔迹图像。
102.然后,根据待验证签名内容信息,以及待验证签名笔迹图像所对应的代理商编号,在代理商笔迹库中进行检索,得到匹配的代理商手写笔迹图像。沿用上述示例,如果接收到代理商a的待验证签名笔迹图像,识别出待验证签名内容信息为“李四”,且该代理商为代理商编码为“代理商a”,则在代理商笔迹库中,提取出类目“代理商a-李四”下的代理商手写笔迹图像。
103.步骤s205,基于匹配的代理商手写笔迹图像训练第一笔迹识别模型。
104.基于提取出来的代理商手写笔迹图像,训练第一笔迹识别模型。将匹配的代理商手写笔迹图像分为训练数据和验证数据,训练数据进入卷积网络进行迭代训练,训练分批次提取并识别图像特征,获得完整的迭代后对验证数据进行大量检测,不断降低识别错误率。
105.图3示出了本发明实施例中卷积网络的示意图,本发明实施例中将形成一个含有两层卷积的神经网络,卷积神经网络算法对输入的笔迹图像进行提取,在a1卷积层得到一定数量的特征图(如角度、纹理、灰度等),然后对a1特征图进行采样操作计算(如加权值、加偏置等),通过函数得到a1的特征映射信息,得到采样层b1,然后再重复一次卷积,即a2、b2,对得到的数据以全连阶层构建输入到分类器,经过识别得出结论,从而结束了一次迭代训练。根据输出的结果持续调整过程参数进行不断迭代。设置了4个隐含层,依次逐层减半的对图像进行学习和特征提取。
106.步骤s206,将待验证签名笔迹图像输入至第一笔迹识别模型中进行计算,得到第一相似度结果,根据第一相似度结果确定待验证签名是否为代理商代签。
107.将待验证签名笔迹图像输入到第一笔迹识别模型中进行计算,输出第一相似度结果,如果第一相似度超过预设阈值,表明待验证签名笔迹与代理商手写笔迹相似度较高,则可以确定待验证签名为代理商代签,将待验证签名笔迹图像标记为代理商手写笔迹图像样
本,并将其纳入代理商笔迹库中。反之,如果第一相似度未超过预设阈值,表明待验证签名笔迹与代理商手写笔迹不相似,则确定待验证签名不是代理商代签的。
108.步骤s207,根据待验证签名内容信息获取客户信息,根据客户信息,检索是否存在客户在其他代理商处的签名留存数据。
109.然后,根据待验证签名内容信息获取客户信息,在实际应用中,客户在单据上签的通常是自己的姓名,那么,识别出来的待验证签名内容信息也就是客户姓名,则可以根据客户姓名去获取客户身份信息等。然后,再根据客户信息去检索该客户以往的业务受理记录和无纸化认证记录,是否有在其他代理商办理业务的记录和签名留存,不考虑其他代理商代签的情况,这里的签名留存也就是客户的历史真实笔迹图像。例如,待验证签名笔迹图像是属于代理商a的,则就在除了代理商a之外的其他代理商的业务记录中是否有与该客户信息关联的客户签名留存数据。
110.步骤s208,若存在,则根据签名留存数据训练第二笔迹识别模型。
111.如果存在该客户在其他代理商处的签名留存数据,则提取出这部分签名留存数据,根据签名留存数据训练第二笔迹识别模型。
112.步骤s209,将待验证签名笔迹图像输入至第二笔迹识别模型进行计算,得到第二相似度结果,根据第二相似度结果确定待验证签名笔迹是否为客户真实签名笔迹。
113.将待验证签名笔迹图像输入到第二笔迹识别模型中进行计算,输出第二相似度结果,如果第二似度超过预设阈值,表明待验证签名笔迹与客户历史签名笔迹的相似度较高,则可以确定待验证签名为客户真实笔迹,不是代理商代签笔迹。反之,如果第二相似度未超过预设阈值,表明待验证签名笔迹与客户历史签名笔迹不相似,则确定存在代理商代签风险。
114.具体实施时,可根据具体检索到的信息,来选择识别的方式,如果检索到匹配的代理商手写笔迹图像,就基于匹配的代理商手写笔迹图像构建模型,用来识别待验证签名笔迹与代理商手写笔迹是否相似;如果检索到客户在其他代理商的留存数据,就基于留存数据构建模型,用来识别待验证签名笔迹是否是客户的真实笔迹;如果两者都检索到,则同时采取两种识别方式,综合两种识别方式的结果,判断待验证签名笔迹是否为代理商代签。
115.综上所述,本发明实施例中,一方面提供了一种基于代理商的签名笔迹的代理商待签名的识别方法,在能够检索到匹配的代理商手写笔迹的情况下,基于代理商手写笔迹作为样本构建识别模型,利用该识别模型计算待验证签名笔迹与代理商手写笔迹之间的相似关系,从而识别待验证签名笔迹是否为代理商代签,这种方式降低了数据收集难度,提高了技术使用范围。另一方面,提供了一种基于客户留存笔迹数据的待验证签名笔迹识别方法,在能够检索到客户笔迹留存的情况下,基于客户留存笔迹作为样本构建识别模型,利用该模型识别待验证签名笔迹与客户的历史真实笔迹之间的相似关系,从而识别待验证签名笔迹是否为客户真实笔迹。上述两种方式相结合,能够提升代理商代签名的识别准确率,并且针对不同的数据检索结果,可选择对应的识别方式,灵活性更高,可以有效识别出具备代客户签名行为的代理商,也有助于防范客户不知情定制业务的风险。
116.图4示出了本发明代理商代签名的识别装置实施例的结构示意图。如图4所示,该装置包括:
117.获取模块41,适于获取代理商手写笔迹图像;
118.第一识别模块42,适于识别出代理商手写笔迹图像包含的手写内容信息;
119.归类入库模块43,适于根据手写内容信息以及代理商的渠道信息对代理商手写笔迹图像进行归类,根据归类结果形成代理商笔迹库;
120.第二识别模块44,适于当接收到待验证签名笔迹图像时,识别出待验证签名笔迹图像包含的待验证签名内容信息;
121.匹配模块45,适于根据待验证签名内容信息以及待验证签名笔迹图像对应的代理商渠道信息,从代理商笔迹库中提取匹配的代理商手写笔迹图像;
122.模型训练模块46,适于基于匹配的代理商手写笔迹图像训练第一笔迹识别模型;
123.计算模块47,适于将待验证签名笔迹图像输入至第一笔迹识别模型中进行计算,得到第一相似度结果;
124.判断模块48,适于根据第一相似度结果确定待验证签名是否为代理商代签。
125.可选地,装置进一步包括:
126.预处理模块,适于获取代理商手写笔迹图像之后,将代理商手写笔迹图像进行预处理;其中,预处理包括以下中的一种或多种处理:二值化处理、平滑处理、文字切分处理。
127.可选地,归类入库模块43进一步适于:若存在多个代理商手写笔迹图像的手写内容信息的字义相同,针对于该字义建立索引,并将该多个代理商手写笔迹图像保存在该字义的索引下,以形成代理商笔迹库。
128.可选地,装置进一步包括:
129.客户信息模块,适于根据待验证签名内容信息获取客户信息;
130.数据检索模块,适于根据客户信息,检索是否存在客户在其他代理商处的签名留存数据;
131.模型训练模块46进一步适于:根据签名留存数据训练第二笔迹识别模型;
132.计算模块47进一步适于:将待验证签名笔迹图像输入至第二笔迹识别模型进行计算,得到第二相似度结果;
133.判断模块48进一步适于:根据第二相似度结果确定待验证签名笔迹是否为客户真实签名笔迹。
134.可选地,第一笔迹识别模型和第二笔迹识别模型基于卷积神经网络算法训练得到。
135.可选地,装置进一步包括:
136.标记和入库模块:适于在根据第一相似度结果确定待验证签名为代理商代签的情况下,则将待验证签名笔迹图像标记为代理商手写笔迹图像样本,并纳入代理商笔迹库中。
137.本发明实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的代理商代签名的识别方法。
138.可执行指令具体可以用于使得处理器执行以下操作:
139.获取代理商手写笔迹图像,识别出代理商手写笔迹图像包含的手写内容信息;
140.根据手写内容信息以及代理商的渠道信息对代理商手写笔迹图像进行归类,根据归类结果形成代理商笔迹库;
141.当接收到待验证签名笔迹图像时,识别出待验证签名笔迹图像包含的待验证签名
内容信息;
142.根据待验证签名内容信息以及待验证签名笔迹图像对应的代理商渠道信息,从代理商笔迹库中提取匹配的代理商手写笔迹图像;
143.基于匹配的代理商手写笔迹图像训练第一笔迹识别模型;
144.将待验证签名笔迹图像输入至第一笔迹识别模型中进行计算,得到第一相似度结果,根据第一相似度结果确定待验证签名是否为代理商代签。
145.在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
146.获取代理商手写笔迹图像之后,将代理商手写笔迹图像进行预处理;其中,预处理包括以下中的一种或多种处理:二值化处理、平滑处理、文字切分处理。
147.在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
148.若存在多个代理商手写笔迹图像的手写内容信息的字义相同,针对于该字义建立索引,并将该多个代理商手写笔迹图像保存在该字义的索引下,以形成代理商笔迹库。
149.在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
150.根据待验证签名内容信息获取客户信息;
151.根据客户信息,检索是否存在客户在其他代理商处的签名留存数据;
152.若是,则根据签名留存数据训练第二笔迹识别模型;
153.将待验证签名笔迹图像输入至第二笔迹识别模型进行计算,得到第二相似度结果;
154.根据第二相似度结果确定待验证签名笔迹是否为客户真实签名笔迹。
155.在一种可选的方式中,第一笔迹识别模型和第二笔迹识别模型基于卷积神经网络算法训练得到。
156.在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
157.在根据第一相似度结果确定待验证签名为代理商代签的情况下,则将待验证签名笔迹图像标记为代理商手写笔迹图像样本,并纳入代理商笔迹库中。
158.图5示出了本发明计算设备实施例的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
159.如图5所示,该计算设备可以包括:处理器(processor)502、通信接口(communications interface)504、存储器(memory)506、以及通信总线508。
160.其中:处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。通信接口504,用于与其它设备比如客户端或其它服务器等的网元通信。处理器502,用于执行程序510,具体可以执行上述用于计算设备的代理商代签名的识别方法实施例中的相关步骤。
161.具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。
162.处理器502可能是中央处理器cpu,或者是特定集成电路asic(application specific integrated circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。
163.存储器506,用于存放程序510。存储器506可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
164.程序510具体可以用于使得处理器502执行以下操作:
165.获取代理商手写笔迹图像,识别出代理商手写笔迹图像包含的手写内容信息;
166.根据手写内容信息以及代理商的渠道信息对代理商手写笔迹图像进行归类,根据归类结果形成代理商笔迹库;
167.当接收到待验证签名笔迹图像时,识别出待验证签名笔迹图像包含的待验证签名内容信息;
168.根据待验证签名内容信息以及待验证签名笔迹图像对应的代理商渠道信息,从代理商笔迹库中提取匹配的代理商手写笔迹图像;
169.基于匹配的代理商手写笔迹图像训练第一笔迹识别模型;
170.将待验证签名笔迹图像输入至第一笔迹识别模型中进行计算,得到第一相似度结果,根据第一相似度结果确定待验证签名是否为代理商代签。
171.在一种可选的方式中,所述程序510使所述处理器502执行以下操作:
172.将代理商手写笔迹图像进行预处理;其中,预处理包括以下中的一种或多种处理:二值化处理、平滑处理、文字切分处理。
173.在一种可选的方式中,所述程序510使所述处理器502执行以下操作:
174.若存在多个代理商手写笔迹图像的手写内容信息的字义相同,针对于该字义建立索引,并将该多个代理商手写笔迹图像保存在该字义的索引下,以形成代理商笔迹库。
175.在一种可选的方式中,所述程序510使所述处理器502执行以下操作:
176.根据待验证签名内容信息获取客户信息;
177.根据客户信息,检索是否存在客户在其他代理商处的签名留存数据;
178.若是,则根据签名留存数据训练第二笔迹识别模型;
179.将待验证签名笔迹图像输入至第二笔迹识别模型进行计算,得到第二相似度结果;
180.根据第二相似度结果确定待验证签名笔迹是否为客户真实签名笔迹。
181.在一种可选的方式中,第一笔迹识别模型和第二笔迹识别模型基于卷积神经网络算法训练得到。
182.在一种可选的方式中,所述程序510使所述处理器502执行以下操作:
183.在根据第一相似度结果确定待验证签名为代理商代签的情况下,则将待验证签名笔迹图像标记为代理商手写笔迹图像样本,并纳入代理商笔迹库中。
184.在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
185.在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
186.类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个
实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
187.本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
188.此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
189.本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
190.应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1