一种英文审批文件和实际用印文件的替换检测方法及系统与流程

文档序号:32113213发布日期:2022-11-09 05:42阅读:101来源:国知局
一种英文审批文件和实际用印文件的替换检测方法及系统与流程

1.本发明涉及文件检测技术领域,具体而言,涉及一种英文审批文件和实际用印文件的替换检测方法及系统。


背景技术:

2.印控仪作为重要的用印设备,在政府、公司、金融系统、医院、学校发挥了重要的作用。用印人员可以通过远程上传用印文件,待负责人审批之后直接用机器完成盖章,在节省人力的同时完成了远程操作,多维度地提升了印章的应用效率。同时,随着经济全球化的深入发展,用印文件越来越多的采用了英文形式。
3.然而,很多不法分子在审批结束之后,替换用印文件中的重要信息,造成较为严重的后果。传统的检测方法虽然能够一定程度上检查出部分错误,但无法保证理想的替换检测精准度,从而有效地防止替换问题的发生。


技术实现要素:

4.本发明的目的在于提供一种英文审批文件和实际用印文件的替换检测方法及系统,用以改善现有技术中无法保证理想的替换检测精准度,从而有效地防止出现替换的问题。
5.第一方面,本技术实施例提供一种英文审批文件和实际用印文件的替换检测方法,包括以下步骤:获取并对英文审批文件图像和实际用印文件图像分别进行稀疏编码,得到英文审批文件图像编码和实际用印文件图像编码;根据英文审批文件图像编码和实际用印文件图像编码利用欧式距离计算英文审批文件图像和实际用印文件图像的相似性,得到图像相似结果;根据图像相似结果对英文审批文件图像和实际用印文件图像分别进行m等分,得到m个区域英文审批文件图像和m个区域实际用印文件图像;对m个区域英文审批文件图像和m个区域实际用印文件图像中的各个区域图像分别进行稀疏编码,得到m个区域英文审批文件图像编码和m个区域实际用印文件图像编码;根据各个区域英文审批文件图像编码和各个区域实际用印文件图像编码计算相同位置的区域英文审批文件图像和区域实际用印文件图像的相似性,生成m个区域相似性结果;根据各个区域相似性结果将对应的区域英文审批文件图像和区域实际用印文件图像进行多尺度加强处理,得到加强区域英文审批文件图像和加强区域实际用印文件图像;计算并根据加强区域英文审批文件图像和加强区域实际用印文件图像的相似性采用ctpn字母识别方法对区域英文审批文件图像和区域实际用印文件图像中的各个英文字母分别进行识别,得到第一字母识别结果和第二字母识别结果;
将第一字母识别结果与第二字母识别结果进行对比,得到英文字母对比结果;根据英文字母对比结果将区域英文审批文件图像中的英文字母在预置的字母模板库中进行匹配,得到匹配的多个字母模板;分别计算并根据匹配的各个字母模板与区域实际用印文件图像中对应的英文字母的相似性得到字母匹配结果;根据各个字母匹配结果得到替换检测结果。
6.上述实现过程中,通过获取并对英文审批文件图像和实际用印文件图像分别进行稀疏编码,得到英文审批文件图像编码和实际用印文件图像编码;然后根据英文审批文件图像编码和实际用印文件图像编码利用欧式距离计算英文审批文件图像和实际用印文件图像的相似性,得到图像相似结果;然后根据图像相似结果对英文审批文件图像和实际用印文件图像分别进行m等分,得到m个区域英文审批文件图像和m个区域实际用印文件图像;然后对m个区域英文审批文件图像和m个区域实际用印文件图像中的各个区域图像分别进行稀疏编码,得到m个区域英文审批文件图像编码和m个区域实际用印文件图像编码;然后根据各个区域英文审批文件图像编码和各个区域实际用印文件图像编码计算相同位置的区域英文审批文件图像和区域实际用印文件图像的相似性,生成m个区域相似性结果;然后根据各个区域相似性结果将对应的区域英文审批文件图像和区域实际用印文件图像进行多尺度加强处理,得到加强区域英文审批文件图像和加强区域实际用印文件图像;然后计算并根据加强区域英文审批文件图像和加强区域实际用印文件图像的相似性采用ctpn字母识别方法对区域英文审批文件图像和区域实际用印文件图像中的各个英文字母分别进行识别,得到第一字母识别结果和第二字母识别结果;然后将第一字母识别结果与第二字母识别结果进行对比,得到英文字母对比结果;然后根据英文字母对比结果将区域英文审批文件图像中的英文字母在预置的字母模板库中进行匹配,得到匹配的多个字母模板;然后分别计算并根据匹配的各个字母模板与区域实际用印文件图像中对应的英文字母的相似性得到字母匹配结果;最后根据各个字母匹配结果得到替换检测结果。利用多区域相似性度量的方法,对英文审批文件和实际用印文件是否有替换情况进行检验,避免了直接利用复杂方法,降低了计算资源的消耗;利用ctpn字母识别和字母模板匹配相结合的思路对是否有替换情况进行检验,提升了检验的精度,保证了替换检测精准度,从而有效地防止替换问题的发生。
7.基于第一方面,在本发明的一些实施例中,根据图像相似结果对英文审批文件图像和实际用印文件图像分别进行m等分,得到m个区域英文审批文件图像和m个区域实际用印文件图像的步骤包括以下步骤:a1:判断图像相似结果是否大于预置的第一阈值,若是,则结束;若否,则执行a2;a2:判断图像相似结果是否小于预置的第二阈值,若是,则结束;若否,则对英文审批文件图像和实际用印文件图像分别进行m等分,得到m个区域英文审批文件图像和m个区域实际用印文件图像。
8.基于第一方面,在本发明的一些实施例中,根据各个区域相似性结果将对应的区域英文审批文件图像和区域实际用印文件图像进行多尺度加强处理,得到加强区域英文审批文件图像和加强区域实际用印文件图像的步骤包括以下步骤:判断各个区域相似性结果是否大于预置的相似性阈值,若是,则结束;若否,则对
该区域英文审批文件图像和对应区域实际用印文件图像进行多尺度加强处理,得到加强区域英文审批文件图像和加强区域实际用印文件图像。
9.基于第一方面,在本发明的一些实施例中,还包括以下步骤:将区域英文审批文件图像进行多个不同尺度的高斯模糊处理,得到多个模糊图像;将各个模糊图像和区域英文审批文件图像做减法,得到多个不同程度的细节信息;将多个不同程度的细节信息加权到区域英文审批文件图像中,得到加强区域英文审批文件图像。
10.基于第一方面,在本发明的一些实施例中,还包括以下步骤:从预置的字母数据库中挑选出各个字母的多个字母图像块;对各个字母图像块进行深度自编码,得到多个字母图像块编码;根据多个字母图像块编码计算不同字母图像块编码之间的欧式距离;根据欧式距离对各个字母的多个字母图像块进行筛选,得到各个字母的字母模板,以形成字母模板库。
11.基于第一方面,在本发明的一些实施例中,根据英文字母对比结果将区域英文审批文件图像中的英文字母在预置的字母模板库中进行匹配,得到匹配的多个字母模板的步骤包括以下步骤:判断英文字母对比结果是否为一致,若是,则结束;若否,则将区域英文审批文件图像中的英文字母在预置的字母模板库中进行匹配,得到匹配的多个字母模板。
12.基于第一方面,在本发明的一些实施例中,分别计算并根据匹配的各个字母模板与区域实际用印文件图像中对应的英文字母的相似性得到字母匹配结果的步骤包括以下步骤:分别计算匹配的各个字母模板与区域实际用印文件图像中对应的英文字母的相似性,得到多个模板字母相似结果;判断多个模板字母相似结果是否均为一致,若是,则生成字母匹配结果为匹配;若否,则生成字母匹配结果为不匹配。
13.第二方面,本技术实施例提供一种英文审批文件和实际用印文件的替换检测系统,包括:第一稀疏编码模块,用于获取并对英文审批文件图像和实际用印文件图像分别进行稀疏编码,得到英文审批文件图像编码和实际用印文件图像编码;第一相似性计算模块,用于根据英文审批文件图像编码和实际用印文件图像编码利用欧式距离计算英文审批文件图像和实际用印文件图像的相似性,得到图像相似结果;图像等分模块,用于根据图像相似结果对英文审批文件图像和实际用印文件图像分别进行m等分,得到m个区域英文审批文件图像和m个区域实际用印文件图像;第二稀疏编码模块,用于对m个区域英文审批文件图像和m个区域实际用印文件图像中的各个区域图像分别进行稀疏编码,得到m个区域英文审批文件图像编码和m个区域实际用印文件图像编码;第二相似性计算模块,用于根据各个区域英文审批文件图像编码和各个区域实际
用印文件图像编码计算相同位置的区域英文审批文件图像和区域实际用印文件图像的相似性,生成m个区域相似性结果;图像加强模块,用于根据各个区域相似性结果将对应的区域英文审批文件图像和区域实际用印文件图像进行多尺度加强处理,得到加强区域英文审批文件图像和加强区域实际用印文件图像;英文字母识别模块,用于计算并根据加强区域英文审批文件图像和加强区域实际用印文件图像的相似性采用ctpn字母识别方法对区域英文审批文件图像和区域实际用印文件图像中的各个英文字母分别进行识别,得到第一字母识别结果和第二字母识别结果;识别对比模块,用于将第一字母识别结果与第二字母识别结果进行对比,得到英文字母对比结果;字母模板匹配模块,用于根据英文字母对比结果将区域英文审批文件图像中的英文字母在预置的字母模板库中进行匹配,得到匹配的多个字母模板;字母匹配模块,用于分别计算并根据匹配的各个字母模板与区域实际用印文件图像中对应的英文字母的相似性得到字母匹配结果;替换检测模块,用于根据各个字母匹配结果得到替换检测结果。
14.上述实现过程中,通过第一稀疏编码模块获取并对英文审批文件图像和实际用印文件图像分别进行稀疏编码,得到英文审批文件图像编码和实际用印文件图像编码;第一相似性计算模块根据英文审批文件图像编码和实际用印文件图像编码利用欧式距离计算英文审批文件图像和实际用印文件图像的相似性,得到图像相似结果;图像等分模块根据图像相似结果对英文审批文件图像和实际用印文件图像分别进行m等分,得到m个区域英文审批文件图像和m个区域实际用印文件图像;第二稀疏编码模块对m个区域英文审批文件图像和m个区域实际用印文件图像中的各个区域图像分别进行稀疏编码,得到m个区域英文审批文件图像编码和m个区域实际用印文件图像编码;第二相似性计算模块根据各个区域英文审批文件图像编码和各个区域实际用印文件图像编码计算相同位置的区域英文审批文件图像和区域实际用印文件图像的相似性,生成m个区域相似性结果;图像加强模块根据各个区域相似性结果将对应的区域英文审批文件图像和区域实际用印文件图像进行多尺度加强处理,得到加强区域英文审批文件图像和加强区域实际用印文件图像;英文字母识别模块计算并根据加强区域英文审批文件图像和加强区域实际用印文件图像的相似性采用ctpn字母识别方法对区域英文审批文件图像和区域实际用印文件图像中的各个英文字母分别进行识别,得到第一字母识别结果和第二字母识别结果;识别对比模块将第一字母识别结果与第二字母识别结果进行对比,得到英文字母对比结果;字母模板匹配模块根据英文字母对比结果将区域英文审批文件图像中的英文字母在预置的字母模板库中进行匹配,得到匹配的多个字母模板;字母匹配模块分别计算并根据匹配的各个字母模板与区域实际用印文件图像中对应的英文字母的相似性得到字母匹配结果;替换检测模块根据各个字母匹配结果得到替换检测结果。利用多区域相似性度量的方法,对英文审批文件和实际用印文件是否有替换情况进行检验,避免了直接利用复杂方法,降低了计算资源的消耗;利用ctpn字母识别和字母模板匹配相结合的思路对是否有替换情况进行检验,提升了检验的精度,保证了替换检测精准度,从而有效地防止替换问题的发生。
15.第三方面,本技术实施例提供一种电子设备,其包括存储器,用于存储一个或多个
程序;处理器。当一个或多个程序被处理器执行时,实现如上述第一方面中任一项的方法。
16.第四方面,本技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。
17.本发明实施例至少具有如下优点或有益效果:本发明实施例提供一种英文审批文件和实际用印文件的替换检测方法及系统,通过获取并对英文审批文件图像和实际用印文件图像分别进行稀疏编码,得到英文审批文件图像编码和实际用印文件图像编码;然后根据英文审批文件图像编码和实际用印文件图像编码利用欧式距离计算英文审批文件图像和实际用印文件图像的相似性,得到图像相似结果;然后根据图像相似结果对英文审批文件图像和实际用印文件图像分别进行m等分,得到m个区域英文审批文件图像和m个区域实际用印文件图像;然后对m个区域英文审批文件图像和m个区域实际用印文件图像中的各个区域图像分别进行稀疏编码,得到m个区域英文审批文件图像编码和m个区域实际用印文件图像编码;然后根据各个区域英文审批文件图像编码和各个区域实际用印文件图像编码计算相同位置的区域英文审批文件图像和区域实际用印文件图像的相似性,生成m个区域相似性结果;然后根据各个区域相似性结果将对应的区域英文审批文件图像和区域实际用印文件图像进行多尺度加强处理,得到加强区域英文审批文件图像和加强区域实际用印文件图像;然后计算并根据加强区域英文审批文件图像和加强区域实际用印文件图像的相似性采用ctpn字母识别方法对区域英文审批文件图像和区域实际用印文件图像中的各个英文字母分别进行识别,得到第一字母识别结果和第二字母识别结果;然后将第一字母识别结果与第二字母识别结果进行对比,得到英文字母对比结果;然后根据英文字母对比结果将区域英文审批文件图像中的英文字母在预置的字母模板库中进行匹配,得到匹配的多个字母模板;然后分别计算并根据匹配的各个字母模板与区域实际用印文件图像中对应的英文字母的相似性得到字母匹配结果;最后根据各个字母匹配结果得到替换检测结果。利用多区域相似性度量的方法,对英文审批文件和实际用印文件是否有替换情况进行检验,避免了直接利用复杂方法,降低了计算资源的消耗;利用ctpn字母识别和字母模板匹配相结合的思路对是否有替换情况进行检验,提升了检验的精度,保证了替换检测精准度,从而有效地防止替换问题的发生。
附图说明
18.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
19.图1为本发明实施例提供的一种英文审批文件和实际用印文件的替换检测方法流程图;图2为本发明实施例提供的步骤s130的详细流程图;图3为本发明实施例提供的步骤s160的详细流程图;图4为本发明实施例提供的一种英文审批文件和实际用印文件的替换检测系统结构框图;图5为本发明实施例提供的一种电子设备的结构框图。
20.图标:110-第一稀疏编码模块;120-第一相似性计算模块;130-图像等分模块;140-第二稀疏编码模块;150-第二相似性计算模块;160-图像加强模块;170-英文字母识别模块;180-识别对比模块;190-字母模板匹配模块;200-字母匹配模块;210-替换检测模块;101-存储器;102-处理器;103-通信接口。
具体实施方式
21.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。
22.因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
23.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
24.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
25.在本技术的描述中,需要说明的是,术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该申请产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本技术的限制。
26.在本技术的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本技术中的具体含义。
实施例
27.下面结合附图,对本技术的一些实施方式作详细说明。在不冲突的情况下,下述的各个实施例及实施例中的各个特征可以相互组合。
28.请参看图1,图1为本发明实施例提供的一种英文审批文件和实际用印文件的替换检测方法流程图。该英文审批文件和实际用印文件的替换检测方法,包括以下步骤:
步骤s110:获取并对英文审批文件图像和实际用印文件图像分别进行稀疏编码,得到英文审批文件图像编码和实际用印文件图像编码;稀疏编码是一种无监督学习方法,它用来寻找一组“超完备”基向量来更高效地表示样本数据。稀疏编码算法的目的就是找到一组基向量,使得我们能将输入向量表示为这些基向量的线性组合。上述稀疏编码属于现有技术,在此就不再赘述。
29.步骤s120:根据英文审批文件图像编码和实际用印文件图像编码利用欧式距离计算英文审批文件图像和实际用印文件图像的相似性,得到图像相似结果;欧氏距离是最常见的距离度量,衡量的是多维空间中各个点之间的绝对距离,通过计算英文审批文件图像编码和实际用印文件图像编码之间的欧式距离可以衡量两个图像在空间上存在的距离,距离越远说明两个图像间的差异越大,相似性越低,反之相似性越高。上述图像相似性结果可以根据欧式距离转化为相似比例,比如:欧式距离很小,为0.1,则可以按照预置的规则进行转化得到相似性结果为99.98%。
30.步骤s130:根据图像相似结果对英文审批文件图像和实际用印文件图像分别进行m等分,得到m个区域英文审批文件图像和m个区域实际用印文件图像;若相似性非常高,比如接近于百分之百,直接认定英文审批文件和实际用印文件是精准匹配的,直接发出允许用印的指令;若相似性非常低,直接认定英文审批文件和实际用印文件不是精准匹配的,发出拒绝用印的指令。若二者存在一定的相似性但无法达到相似性极高的水平(介于非常低和非常高之间),则进行下一步,即对图像进行等分。请参看图2,图2为本发明实施例提供的步骤s130的详细流程图。具体可以通过以下步骤进行判断:第一步:判断图像相似结果是否大于预置的第一阈值,若是,则结束;若否,则执行第二步;上述预置的第一阀值可以是根据经验进行设置的值,当大于该第一阈值,则说明相似性非常高,比如:第一阈值为99%,上述例子中,图像相似性结果为99.98%,则说明英文审批文件和实际用印文件的图像相似性非常高,直接认定英文审批文件和实际用印文件是精准匹配的,直接发出允许用印的指令。
31.第二步:判断图像相似结果是否小于预置的第二阈值,若是,则结束;若否,则对英文审批文件图像和实际用印文件图像分别进行m等分,得到m个区域英文审批文件图像和m个区域实际用印文件图像。上述预置的第二阀值可以是根据经验进行设置的值,上述第二阈值低于第一阈值,当小于该第二阈值,则说明相似性非常低,直接认定英文审批文件和实际用印文件不是精准匹配的,发出拒绝用印的指令。当图像相似结果小于第一阈值且大于第二阀值,则认为英文审批文件图像和实际用印文件图像存在一定的相似性但无法达到相似性极高的水平,则进行等分操作。上述m的取值为正整数,可以是根据经验进行设置,通常情况下16个即可,也可以设定为64个或更多。
32.步骤s140:对m个区域英文审批文件图像和m个区域实际用印文件图像中的各个区域图像分别进行稀疏编码,得到m个区域英文审批文件图像编码和m个区域实际用印文件图像编码;上述进行稀疏编码是指将英文审批文件图像中的各个等分区域分别进行稀疏编码,同时将实际用印文件图像中的各个等分区域分别进行稀疏编码。
33.步骤s150:根据各个区域英文审批文件图像编码和各个区域实际用印文件图像编码计算相同位置的区域英文审批文件图像和区域实际用印文件图像的相似性,生成m个区域相似性结果;在m个等分区域中,在相同位置分别计算,例如英文审批文件的左上区域对
应实际用印文件的左上区域,计算英文审批文件和实际用印文件的相似性。上述相似性计算与上述步骤s120中采用的方式相同,在此就不再赘述。
34.步骤s160:根据各个区域相似性结果将对应的区域英文审批文件图像和区域实际用印文件图像进行多尺度加强处理,得到加强区域英文审批文件图像和加强区域实际用印文件图像;对于相似性非常高的区域,直接认定对应区域是精准匹配的,不再对其进行检测;对于相似性无法达到非常高的区域,则进行进一步检测,即进行多尺度加强处理;其中相似性无法达到非常高的区域可能为1处也可能为多处,若有多个,则依次进行下面的对比步骤,多次计算即可,请参看图3,图3为本发明实施例提供的步骤s160的详细流程图。具体包括以下判断过程:判断各个区域相似性结果是否大于预置的相似性阈值,若是,则结束;若否,则对该区域英文审批文件图像和对应区域实际用印文件图像进行多尺度加强处理,得到加强区域英文审批文件图像和加强区域实际用印文件图像。上述预置的相似性阈值可以根据经验进行设置,通过预置的相似性阀值可以是判断出各个区域相似性是非常高还是无法达到相似性非常高,大于预置的相似性阈值说明是相似性非常高,反之,则认为无法到达相似性非常高。例如左上区域的相似性结果小于预置的相似性阈值,则分别对英文审批文件和实际用印文件的左上区域进行多尺度加强处理。下面以区域英文审批文件图像进行多尺度加强处理的过程为例,具体说明多尺度加强处理的过程,对于实际用印文件图像进行多尺度加强处理的过程,与该过程相同,就不再赘述。多尺度加强处理包括以下过程:首先,将区域英文审批文件图像进行多个不同尺度的高斯模糊处理,得到多个模糊图像;上述多个不同尺度可以根据实际需要进行设置,例如3个尺度。上述高斯模糊处理属于现有技术,在此就再赘述。
35.然后,将各个模糊图像和区域英文审批文件图像做减法,得到多个不同程度的细节信息;上述各个模糊图像是指各个尺度下的模糊图像。
36.最后,将多个不同程度的细节信息加权到区域英文审批文件图像中,得到加强区域英文审批文件图像。通过将细节信息加权到原有的图像中,使得到的图像包含的信息更多,得到含有丰富细节信息的加强图像,从而起到图像加强的作用。通过对图像进行多尺度加强处理,从而可以提升图像细节,进而便于后期图像对比。
37.步骤s170:计算并根据加强区域英文审批文件图像和加强区域实际用印文件图像的相似性采用ctpn字母识别方法对区域英文审批文件图像和区域实际用印文件图像中的各个英文字母分别进行识别,得到第一字母识别结果和第二字母识别结果;计算加强区域英文审批文件图像和加强区域实际用印文件图像的相似性与步骤s120中采用的方式相同,在此就不再赘述。对于加强处理后的相似性无法达到非常高的区域,利用ctpn字母识别方法对每个英文字母进行识别。上述ctpn字母识别方法属于现有技术,在此就不再赘述。
38.步骤s180:将第一字母识别结果与第二字母识别结果进行对比,得到英文字母对比结果;上述第一字母识别结果和第二字母识别结果分别包括有多个字母识别结果,上述对比是将多个字母识别结果逐一进行对比。
39.步骤s190:根据英文字母对比结果将区域英文审批文件图像中的英文字母在预置的字母模板库中进行匹配,得到匹配的多个字母模板;若识别出来的英文字母是完全一致的,认定文审批文件和实际用印文件是匹配的;若识别出来的英文字母有不一致的地方,则
继续进行下一步,即将区域英文审批文件图像中的英文字母在预置的字母模板库中进行匹配,得到匹配的多个字母模板。具体可以通过以下判断完成:判断英文字母对比结果是否为一致,若是,则结束;若否,则将区域英文审批文件图像中的英文字母在预置的字母模板库中进行匹配,得到匹配的多个字母模板。
40.上述预置的字母模板库是对于26个英文字母中的每个字母,挑选出部分代表性的字母模板形成的字母模板库,具体可以是通过以下步骤得到:首先,从预置的字母数据库中挑选出各个字母的多个字母图像块;从海量的字母数据库中挑选出足量的字母图像块,例如字母a有多种图像块,不同字号和字体的。
41.然后,对各个字母图像块进行深度自编码,得到多个字母图像块编码;然后,根据多个字母图像块编码计算不同字母图像块编码之间的欧式距离;最后,根据欧式距离对各个字母的多个字母图像块进行筛选,得到各个字母的字母模板,以形成字母模板库。当若干个字母图像块的欧式距离较近,我们认为它们高度相似,仅保留其中一个即可,经过多次欧式距离的计算,筛选出一批差异性较大的字母图像块,作为代表性的字母模板,最后形成字母模板库。
42.步骤s200:分别计算并根据匹配的各个字母模板与区域实际用印文件图像中对应的英文字母的相似性得到字母匹配结果;具体包括以下步骤:首先,分别计算匹配的各个字母模板与区域实际用印文件图像中对应的英文字母的相似性,得到多个模板字母相似结果;对于每个识别不一致的英文字母,以英文审批文件的识别字母为准(例如英文审批文件对应区域识别出来是a,但实际用印文件对应区域识别出来是o,则以a为准),找到该字母的多种模板,例如字母a有多种模板,不同字号,不同字体的。若对于该字母的多个模板,有任意一个模板和区域实际用印文件中对应字母(用印文件对应区域识别出o那个字母)有非常高的相似度,仍然认定该字母是匹配的(很大可能是o本来就是a,但是前面识别错误了,此步骤用多模板进行纠正)。
43.然后,判断多个模板字母相似结果是否均为一致,若是,则生成字母匹配结果为匹配;若否,则生成字母匹配结果为不匹配。若对于所有识别不一致的英文字母,利用上一步判定该字母都是匹配的,则认定英文审批文件和实际用印文件是匹配的。若有任意一个识别不一致的英文字母,则认定英文审批文件和实际用印文件是不匹配的,则认定英文审批文件和实际用印文件出现了替换。
44.步骤s210:根据各个字母匹配结果得到替换检测结果。当字母匹配结果均为匹配时,则得到替换检测结果为没有替换;反之,当任意一个字母匹配结果为不匹配时,则得到替换检测结果为出现了替换。
45.上述实现过程中,通过获取并对英文审批文件图像和实际用印文件图像分别进行稀疏编码,得到英文审批文件图像编码和实际用印文件图像编码;然后根据英文审批文件图像编码和实际用印文件图像编码利用欧式距离计算英文审批文件图像和实际用印文件图像的相似性,得到图像相似结果;然后根据图像相似结果对英文审批文件图像和实际用印文件图像分别进行m等分,得到m个区域英文审批文件图像和m个区域实际用印文件图像;然后对m个区域英文审批文件图像和m个区域实际用印文件图像中的各个区域图像分别进行稀疏编码,得到m个区域英文审批文件图像编码和m个区域实际用印文件图像编码;然后根据各个区域英文审批文件图像编码和各个区域实际用印文件图像编码计算相同位置的
区域英文审批文件图像和区域实际用印文件图像的相似性,生成m个区域相似性结果;然后根据各个区域相似性结果将对应的区域英文审批文件图像和区域实际用印文件图像进行多尺度加强处理,得到加强区域英文审批文件图像和加强区域实际用印文件图像;然后计算并根据加强区域英文审批文件图像和加强区域实际用印文件图像的相似性采用ctpn字母识别方法对区域英文审批文件图像和区域实际用印文件图像中的各个英文字母分别进行识别,得到第一字母识别结果和第二字母识别结果;然后将第一字母识别结果与第二字母识别结果进行对比,得到英文字母对比结果;然后根据英文字母对比结果将区域英文审批文件图像中的英文字母在预置的字母模板库中进行匹配,得到匹配的多个字母模板;然后分别计算并根据匹配的各个字母模板与区域实际用印文件图像中对应的英文字母的相似性得到字母匹配结果;最后根据各个字母匹配结果得到替换检测结果。利用多区域相似性度量的方法,对英文审批文件和实际用印文件是否有替换情况进行检验,避免了直接利用复杂方法,降低了计算资源的消耗;利用ctpn字母识别和字母模板匹配相结合的思路对是否有替换情况进行检验,提升了检验的精度,保证了替换检测精准度,从而有效地防止替换问题的发生。
46.基于同样的发明构思,本发明还提出一种英文审批文件和实际用印文件的替换检测系统,请参看图4,图4为本发明实施例提供的一种英文审批文件和实际用印文件的替换检测系统结构框图。该英文审批文件和实际用印文件的替换检测系统包括:第一稀疏编码模块110,用于获取并对英文审批文件图像和实际用印文件图像分别进行稀疏编码,得到英文审批文件图像编码和实际用印文件图像编码;第一相似性计算模块120,用于根据英文审批文件图像编码和实际用印文件图像编码利用欧式距离计算英文审批文件图像和实际用印文件图像的相似性,得到图像相似结果;图像等分模块130,用于根据图像相似结果对英文审批文件图像和实际用印文件图像分别进行m等分,得到m个区域英文审批文件图像和m个区域实际用印文件图像;第二稀疏编码模块140,用于对m个区域英文审批文件图像和m个区域实际用印文件图像中的各个区域图像分别进行稀疏编码,得到m个区域英文审批文件图像编码和m个区域实际用印文件图像编码;第二相似性计算模块150,用于根据各个区域英文审批文件图像编码和各个区域实际用印文件图像编码计算相同位置的区域英文审批文件图像和区域实际用印文件图像的相似性,生成m个区域相似性结果;图像加强模块160,用于根据各个区域相似性结果将对应的区域英文审批文件图像和区域实际用印文件图像进行多尺度加强处理,得到加强区域英文审批文件图像和加强区域实际用印文件图像;英文字母识别模块170,用于计算并根据加强区域英文审批文件图像和加强区域实际用印文件图像的相似性采用ctpn字母识别方法对区域英文审批文件图像和区域实际用印文件图像中的各个英文字母分别进行识别,得到第一字母识别结果和第二字母识别结果;识别对比模块180,用于将第一字母识别结果与第二字母识别结果进行对比,得到英文字母对比结果;
字母模板匹配模块190,用于根据英文字母对比结果将区域英文审批文件图像中的英文字母在预置的字母模板库中进行匹配,得到匹配的多个字母模板;字母匹配模块200,用于分别计算并根据匹配的各个字母模板与区域实际用印文件图像中对应的英文字母的相似性得到字母匹配结果;替换检测模块210,用于根据各个字母匹配结果得到替换检测结果。
47.上述实现过程中,通过第一稀疏编码模块110获取并对英文审批文件图像和实际用印文件图像分别进行稀疏编码,得到英文审批文件图像编码和实际用印文件图像编码;第一相似性计算模块120根据英文审批文件图像编码和实际用印文件图像编码利用欧式距离计算英文审批文件图像和实际用印文件图像的相似性,得到图像相似结果;图像等分模块130根据图像相似结果对英文审批文件图像和实际用印文件图像分别进行m等分,得到m个区域英文审批文件图像和m个区域实际用印文件图像;第二稀疏编码模块140对m个区域英文审批文件图像和m个区域实际用印文件图像中的各个区域图像分别进行稀疏编码,得到m个区域英文审批文件图像编码和m个区域实际用印文件图像编码;第二相似性计算模块150根据各个区域英文审批文件图像编码和各个区域实际用印文件图像编码计算相同位置的区域英文审批文件图像和区域实际用印文件图像的相似性,生成m个区域相似性结果;图像加强模块160根据各个区域相似性结果将对应的区域英文审批文件图像和区域实际用印文件图像进行多尺度加强处理,得到加强区域英文审批文件图像和加强区域实际用印文件图像;英文字母识别模块170计算并根据加强区域英文审批文件图像和加强区域实际用印文件图像的相似性采用ctpn字母识别方法对区域英文审批文件图像和区域实际用印文件图像中的各个英文字母分别进行识别,得到第一字母识别结果和第二字母识别结果;识别对比模块180将第一字母识别结果与第二字母识别结果进行对比,得到英文字母对比结果;字母模板匹配模块190根据英文字母对比结果将区域英文审批文件图像中的英文字母在预置的字母模板库中进行匹配,得到匹配的多个字母模板;字母匹配模块200分别计算并根据匹配的各个字母模板与区域实际用印文件图像中对应的英文字母的相似性得到字母匹配结果;替换检测模块210根据各个字母匹配结果得到替换检测结果。利用多区域相似性度量的方法,对英文审批文件和实际用印文件是否有替换情况进行检验,避免了直接利用复杂方法,降低了计算资源的消耗;利用ctpn字母识别和字母模板匹配相结合的思路对是否有替换情况进行检验,提升了检验的精度,保证了替换检测精准度,从而有效地防止替换问题的发生。
48.请参阅图5,图5为本技术实施例提供的电子设备的一种示意性结构框图。电子设备包括存储器101、处理器102和通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,如本技术实施例所提供的一种英文审批文件和实际用印文件的替换检测系统对应的程序指令/模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
49.其中,存储器101可以是但不限于,随机存取存储器(random access memory,ram),只读存储器(read only memory,rom),可编程只读存储器(programmable read-only memory,prom),可擦除只读存储器(erasable programmable read-only memory,eprom),
电可擦除只读存储器(electric erasable programmable read-only memory,eeprom)等。
50.处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(digital signal processing,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
51.可以理解,图5所示的结构仅为示意,电子设备还可包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。图5中所示的各组件可以采用硬件、软件或其组合实现。
52.在本技术所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本技术的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
53.另外,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
54.所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
55.以上仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
56.对于本领域技术人员而言,显然本技术不限于上述示范性实施例的细节,而且在不背离本技术的精神或基本特征的情况下,能够以其它的具体形式实现本技术。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本技术的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本技术内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1