证件分类模型训练方法、装置、电子设备及存储介质与流程

文档序号:28705611发布日期:2022-01-29 13:34阅读:92来源:国知局
证件分类模型训练方法、装置、电子设备及存储介质与流程

1.本发明涉及人工智能技术领域,尤其涉及一种证件分类模型训练方法、 装置、电子设备及计算机可读存储介质。


背景技术:

2.用户通过手机app或小程序在线上办理金融、政务、医疗等业务时,需 要根据指定要求上传相应的证件图像。出于对业务办理的监管或合规风险管 控的要求,需要对用户上传的证件图像进行检测,识别用户证件图像的类型 是否符合要求,例如,为保证用户上传证件图像的清晰度、完整度,业务系 统要求用户不能上传证件翻拍照或证件截屏图片。
3.常见的证件图像类型包括证件翻拍、电子证件、复印件或截屏,如何识 别用户上传的证件图像的类型,当前普遍方式是利用基于深度学习的神经网 络模型,提取不同证件图像类型下每张证件图像的特征,根据对提取到的特 征进行分类分析,从而实现对证件图像类型的判断。
4.利用神经网络模型对证件图像进行分类,需要依赖大量的证件图像样本, 通过神经网络模型对大量的证件图像样本的特征提取的训练,才能保证神经 网络模型的分类准确性,然而证件图像涉及到用户的个人隐私数据,出于对 用户的个人隐私的安全保护,通常无法直接获取到大批量的证件样本图像, 从而导致当前基于神经网络模型的证件分类模型训练的准确率有待提升。


技术实现要素:

5.本发明提供一种证件分类模型训练方法、装置及计算机可读存储介质, 其主要目的在于提升证件分类模型训练的准确率。
6.为实现上述目的,本发明提供的一种证件分类模型训练方法,包括:
7.获取原始证件图像集,对所述原始证件图像集执行数据增强操作,得到 增强证件图像集;
8.提取所述增强证件图像集中每张增强证件图像的像素分布信息,根据所 述像素分布信息生成对应的增强证件图像的相似证件图像;
9.计算每张所述相似证件图像的有效信息量,选择有效信息量满足第一预 设条件的相似证件图像组成有效相似证件图像集;
10.利用所述原始证件图像集、所述增强证件图像集及所述有效相似证件图 像集对预构建的证件分类模型进行图像分类的预测训练,直到所述预测训练 满足第二预设条件时,退出所述预测训练,得到训练完成的证件分类模型。
11.可选地,所述对所述原始证件图像集执行数据增强操作,包括:
12.根据预设的旋转角度对所述原始证件图像集执行旋转操作,得到旋转后 的图像集;
13.根据预设的缩放比例对所述原始证件图像集执行缩放操作,得到缩放后 的图像
集;
14.对所述原始证件图像集执行至少一种噪声添加的噪声增强操作,得到增 强噪声图像集;
15.汇集所述旋转后的图像集、缩放后的图像集及增强噪声图像集为增强证 件图像集。
16.可选地,所述对所述原始证件图像集执行至少一种噪声添加的噪声增强 操作,得到增强噪声图像集,包括:
17.对所述原始证件图像集中每张原始证件图像进行噪声染色,得到第一增 噪图像集;
18.对所述第一增噪图像集中每张第一增噪图像进行局部遮掩,得到增强噪 声图像集。
19.可选地,所述根据所述像素分布信息生成对应的增强证件图像的相似证 件图像,包括:
20.利用预构建的图像生成模型,根据每张增强证件图像的像素分布信息, 生成每张增强证件图像相应的初始相似证件图像;
21.计算每张所述初始相似证件图像与对应的增强证件图像之间的差异度, 并统计小于预设的差异阈值的差异度对应的初始相似证件图像数量与所有初 始相似证件图像的数量之间的生成比例;
22.当所述生成比例小于预设的生成比例阈值时,则调整所述图像生成模型 的参数,返回上述的利用预构建的图像生成模型,根据每张增强证件图像的 像素分布信息,生成每张增强证件图像相应的初始相似证件图像的步骤,直 到所述生成比例大于或等于所述预设的生成比例阈值;
23.从所述差异度中选择小于预设的差异阈值的差异度对应的初始相似证件 图像作为相似证件图像。
24.可选的,所述计算每张所述相似证件图像的有效信息量,包括:
25.统计所述相似证件图像中含有的有效信息的像素点个数及所述相似证件 图像中的像素点总数;
26.计算所述相似证件图像中含有有效信息的像素点个数与所述相似证件图 像中的像素点总数之间的比值,将所述比值作为每张所述相似证件图像的有 效信息量;
27.可选地,所述统计所述相似证件图像中含有的有效信息的像素点个数之 前,所述方法还包括:
28.对每张所述相似证件图像中的像素点进行二值化处理,得到每个像素点 的灰度值;
29.将灰度值大于预设像素阈值的像素点作为有效信息的像素点。
30.可选地,所述利用所述原始证件图像集、所述增强证件图像集及所述有 效相似证件图像集对预构建的证件分类模型进行图像分类的预测训练,直到 所述预测训练满足第二预设条件时,退出所述预测训练,得到训练完成的证 件分类模型,包括:
31.在所述原始证件图像集、所述增强证件图像集及所述有效相似证件图像 集中,为每张原始证件图像及其对应的增强证件图像、对应的有效相似证件 图像分配一个相同的
编号;
32.利用所述原始证件图像集、所述增强证件图像集及所述有效相似证件图 像集对预构建的证件分类模型进行图像分类的预测训练,得到分类预测结果;
33.统计所述分类预测结果中,同一编号的相同分类结果的图像数量与具有 所述编号的图像的总量之间的占比,并对所有编号的占比求平均,得到平均 占比值;
34.判断所述平均占比值是否满足第二预设条件;
35.若所述平均占比值不所述第二预设条件,则调整所述预构建的证件分类 模型的参数,并返回上述的利用所述原始证件图像集、所述增强证件图像集 及所述有效相似证件图像集对预构建的证件分类模型进行图像分类的预测训 练的步骤;
36.若所述平均占比值满足所述第二预设条件,则退出所述预测训练,得到 训练完成的证件分类模型。
37.为了解决上述问题,本发明还提供一种证件分类模型训练装置,所述装 置包括:
38.增强样本生成模块,用于获取原始证件图像集,对所述原始证件图像集 执行数据增强操作,得到增强证件图像集;
39.有效相似样本生成模块,用于提取所述增强证件图像集中每张增强证件 图像的像素分布信息,根据所述像素分布信息生成对应的增强证件图像的相 似证件图像;计算每张所述相似证件图像的有效信息量,选择有效信息量满 足第一预设条件的相似证件图像组成有效相似证件图像集;
40.分类模型训练模块,用于利用所述原始证件图像集、所述增强证件图像 集及所述有效相似证件图像集对预构建的证件分类模型进行图像分类的预测 训练,直到所述预测训练满足第二预设条件时,退出所述预测训练,得到训 练完成的证件分类模型。
41.为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
42.存储器,存储至少一个指令;及
43.处理器,执行所述存储器中存储的指令以实现上述所述的证件分类模型 训练方法。
44.为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算 机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的 处理器执行以实现上述所述的证件分类模型训练方法。
45.本发明申请通过对原始证件图像集进行数据增强操作得到增强证件图像 集,进一步地,生成所述增强证件图像集的相似证件图像集,通过对相似证 件图像集进行有效信息量的筛选得到有效相似证件图像集,利用所述原始证 件图像集、所述增强证件图像集及所述有效相似证件图像集对预构建的证件 分类模型进行图像分类的预测训练,扩充了证件图像的样本数量,保证分类 模型得到充分的训练,从而提升了证件分类模型训练的准确性。
附图说明
46.图1为本发明一实施例提供的证件分类模型训练方法的流程示意图;
47.图2为图1所示证件分类模型训练方法中其中一个步骤的详细实施流程示 意图;
48.图3为图1所示证件分类模型训练方法中其中一个步骤的详细实施流程示 意图;
49.图4为图1所示证件分类模型训练方法中其中一个步骤的详细实施流程示 意图;
50.图5为本发明一实施例提供的证件分类模型训练装置的功能模块图;
51.图6为本发明一实施例提供的实现所述证件分类模型训练方法的电子设 备的结构示意图。图7为本发明一实施例提供的实现所述证件分类模型训练方法的电子设 备的结构示意图。
52.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步 说明。
具体实施方式
53.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限 定本发明。
54.本技术实施例提供一种证件分类模型训练方法。所述证件分类模型训练 方法的执行主体包括但不限于服务端、终端等能够被配置为执行本技术实施 例提供的该方法的电子设备中的至少一种。换言之,所述证件分类模型训练 方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可 以是区块链平台。所述服务端可以是独立的服务器,也可以是提供云服务、 云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域 名服务、安全服务、内容分发网络(contentdelivery network,cdn)、以及大 数据和人工智能平台等基础云计算服务的云服务器。
55.参照图1所示,为本发明一实施例提供的证件分类模型训练方法的流程 示意图。在本实施例中,所述证件分类模型训练方法包括:
56.s1、获取原始证件图像集,对所述原始证件图像集执行数据增强操作, 得到增强证件图像集;
57.本发明实施例中,所述原始证件图像集包括但不限于用户的身份证、驾 驶证、学位证、工作证等证件图像,其中所述原始证件图像集的类型包括但 不限于截屏图像、翻拍图像、黑白复印件图像、电子证件图像等类型。
58.本发明实施例中,可以根据授权从指定系统或数据库中获取用户上传的 原始证件图像。
59.本发明实施例中,所述数据增强操作是指在保持所述原始证件图像的类 型标签的不变的基础上,通过旋转、缩放、随机遮挡等操作,使得经过数据 增强操作后的图像的数据分布符合所述原始证件图像的真实数据分布情况。
60.详细地,参阅图2所示,所述s1,包括:
61.s11、根据预设的旋转角度对所述原始证件图像集执行旋转操作,得到旋 转后的图像集;
62.s12、根据预设的缩放比例对所述原始证件图像集执行缩放操作,得到缩 放后的图像集;
63.s13、对所述原始证件图像集执行至少一种噪声添加的噪声增强操作,得 到增强噪声图像集;
64.s14、汇集所述旋转后的图像集、缩放后的图像集及增强噪声图像集为增 强证件图像集。
65.本发明实施例中,可以利用开源的tensorflow深度学习库中提供的常用 图像处理函数实现图像的旋转、缩放操作,例如,通过tf.image.resize函数可 以实现图片的缩放功能,例如,将所述原始证件图像a缩放到224
×
224大小, 对应的缩放函数为tf.image.resize=(a,[224,224])。
[0066]
进一步地,所述对所述原始证件图像集进行至少一种噪声添加的噪声增 强操作,得到增强噪声图像集,包括:对所述原始证件图像集中每张原始证 件图像进行噪声染色,得到第一增噪图像集;对所述第一增噪图像集中每张 第一增噪图像进行局部遮掩,得到增强噪声图像集。
[0067]
本发明实施例中,可以利用具有数据抓取功能的python语句从预先构建 的数据库中获取一种或者多种颜色参数,例如,红色的颜色参数为r,红色的 颜色范围为(q,p),存在目标像素的像素值为k,且k不在(q,p)范围内, 则利用颜色参数r对目标像素的像素值进行数值调整,使得所述目标像素的像 素值落入(q,p)范围内。分别利用多种颜色参数对原始图像中各像素点的像 素值进行数值调整,达到对所述原始证件图像进行噪声染色的效果。
[0068]
本发明实施例通过对所述原始证件图像进行至少一种噪声添加,可以得 到多种不同类型的噪声图像,有利于后续利用多种不同类型的噪声图像训练 出泛用性更高的图像分类模型。
[0069]
本发明实施例中,在实际应用中还可以采用对所述原始证件图像进行平 移、剪裁、改变视角等数据增强操作。
[0070]
s2、提取所述增强证件图像集中每张增强证件图像的像素分布信息,根 据所述像素分布信息生成对应的增强证件图像的相似证件图像;
[0071]
本发明实施例中,可以利用munpy(numerical python,数字蟒蛇)等方 法来获取所述增强证件图像中每个像素点的像素分布信息。
[0072]
本发明实施例中,可以通过预构建的图像生成模型生成所述相似证件图 像,所述预构建的图像生成模型是基于条件生成对抗算法(conditional gan, cgan)构建的卷积神经网络模型。
[0073]
详细地,参阅图3所示,所述s2,包括:
[0074]
s21、利用预构建的图像生成模型,根据每张增强证件图像的像素分布信 息,生成每张增强证件图像相应的初始相似证件图像;
[0075]
s22、计算每张所述初始相似证件图像与对应的增强证件图像之间的差异 度,并统计小于预设的差异阈值的差异度对应的初始相似证件图像数量与所 有初始相似证件图像的数量之间的生成比例;
[0076]
s23、当所述生成比例小于预设的生成比例阈值时,则调整所述图像生成 模型的参数,返回上述的利用预构建的图像生成模型,根据每张增强证件图 像的像素分布信息,生成每张增强证件图像相应的初始相似证件图像的步骤, 直到所述生成比例大于或等于所述预设的生成比例阈值;
[0077]
s24、从所述差异度中选择小于预设的差异阈值的差异度对应的初始相似 证件图像作为相似证件图像。
[0078]
本发明实施例中,可以通过下述的差异度函数,计算所述初始相似证件 图像与对
应的增强证件图像之间的差异度,所述差异度函数包括:
[0079]
d=lc+ls
[0080]
lc=e[logp(c|xreal)]+e[logp(c|xfake)]
[0081]
ls=e[logp(s|xreal)]+e[logp(s|xfake)
[0082]
其中,e[]为求期望值运算,lc为所述初始相似证件图像与所述增强证件 图像的相似度的期望值,ls为所述增强证件图像中的有效信息量的期望值, xreal为所述增强证件图像,xfake为所述初始相似证件图像;c为所述初始 相似证件图像中的有效信息量,s为所述增强证件图像的有效信息量。
[0083]
本发明实施例中,所述预设的生成比例阈值可以根据实际情况确定,例 如,可以设置为80%或90%。
[0084]
本发明另一实施例也可以基于开源的tensorflow深度学习库中提供生成 对抗样本的方法,生成所述增强证件图像集中每张增强证件图像的相似证件 图像。
[0085]
s3、计算每张所述相似证件图像的有效信息量,选择有效信息量满足第 一预设条件的相似证件图像组成有效相似证件图像集;
[0086]
本发明实施例中,所述有效信息是指能够用于辅助图像分类的信息,可 以理解的是,每张所述增强证件图像仅包含部分有助于图像分类的有效信息, 相应地,每张所述相似证件图像也仅包含部分所述有效信息,因此,还需要 对所述相似证件图像进一步地执行筛选操作,得到可以用于进行图像分类的 有效样本集。
[0087]
本发明实施例中,所述统计所述相似证件图像中含有有效信息的像素点 个数之前,所述方法还包括:对每张所述相似证件图像中的像素点进行二值 化处理,得到每个像素点的灰度值;将灰度值大于预设像素阈值的像素点作 为有效信息的像素点。
[0088]
详细地,参阅图4所示,所述s3,包括:
[0089]
s31、统计所述相似证件图像中含有的有效信息的像素点个数及所述相似 证件图像中的像素点总数;
[0090]
s32、计算所述相似证件图像中含有有效信息的像素点个数与所述相似证 件图像中的像素点总数之间的比值,将所述比值作为每张所述相似证件图像 的有效信息量;
[0091]
s33、从所有所述相似证件图像中,选择所述有效信息量满足第一预设条 件的相似证件图像组成有效相似证件图像集。
[0092]
本发明实施例中,所述第一预设条件可以是最大有效样本数量,例如, 按照所述有效信息量从大到小的顺序对所述相似证件图像进行排序,并从所 述排序中选择有效信息量最多的n张所述相似证件图像,得到所述有效相似 证件图像集,其中n为所述第一预设条件指定的最大有效样本数量。
[0093]
本发明另一实施例中,所述第一预设条件可以是有效信息量阈值,例如, 从所述相似证件图像集中,选择有效信息量大于或等于所述第一预设条件指 定的有效信息量阈值的相似证件图像,组成所述有效相似证件图像集。
[0094]
s4、利用所述原始证件图像集、所述增强证件图像集及所述有效相似证 件图像集对预构建的证件分类模型进行图像分类的预测训练,直到所述预测 训练满足第二预设条件时,退出所述预测训练,得到训练完成的证件分类模 型。
[0095]
本发明实施例中,所述原始证件图像集、所述增强证件图像集及所述有 效相似证
件图像集构成了所述预构建的证件分类模型的训练样本集,其中所 述预构建的证件分类模型可以是基于深度学习的神经网络模型。
[0096]
详细地,参阅图5所示,所述s4,包括:
[0097]
s41、在所述原始证件图像集、所述增强证件图像集及所述有效相似证件 图像集中,为每张原始证件图像及其对应的增强证件图像、对应的有效相似 证件图像分配一个相同的编号;
[0098]
s42、利用所述原始证件图像集、所述增强证件图像集及所述有效相似证 件图像集对预构建的证件分类模型进行图像分类的预测训练,得到分类预测 结果;
[0099]
s43、统计所述分类预测结果中,同一编号的相同分类结果的图像数量与 具有所述编号的图像的总量之间的占比,并对所有编号的占比求平均,得到 平均占比值;
[0100]
s44、判断所述平均占比值是否满足第二预设条件;
[0101]
若所述平均占比值不满足所述第二预设条件,则执行s45、调整所述预构 建的分类模型的参数,并返回s42;
[0102]
若所述平均占比值满足所述第二预设条件,则执行s46、退出所述预测训 练,得到训练完成的证件分类模型。
[0103]
本发明实施例中,可以理解的是,从同一张所述原始证件图像得到增强 证件图像以及有效相似证件图像对应的真实分类结果是相同的,当所述预测 训练输出的分类预测结果中,相同编号的图像中分类结果相同的图像数量越 多,相应的所述预构建的分类模型的分类准确率也就越高。
[0104]
示例性地,例如,同一编号下有4张图像,其中3张图像的分类结果相 似,则同一所述编号下相同分类结果的图像数量与所述编号下图像的总量之 间的占比为3/4。
[0105]
本发明实施例中,所述第二预设条件可以是指定的平均占比阈值,所述 平均占比阈值可以根据实际情况设置,例如,80%,即所有编号下的所述占比 的平均值大于或等于80%,表示所述预构建的分类模型达到了预先的最佳效 果。
[0106]
本发明实施例中,利用所述训练完成的分类模型提取所述待检测证件图 像的特征,根据所述特征计算所述待检测证件图像对应的每种分类类型的概 率,选择概率最高的分类类型为所述待检测证件图像的分类结果。
[0107]
本发明申请通过对原始证件图像集进行数据增强操作得到增强证件图像 集,进一步地,生成所述增强证件图像集的相似证件图像集,通过对相似证 件图像集进行有效信息量的筛选得到有效相似证件图像集,利用所述原始证 件图像集、所述增强证件图像集及所述有效相似证件图像集对预构建的证件 分类模型进行图像分类的预测训练,扩充了证件图像的样本数量,保证分类 模型得到充分的训练,从而提升了证件分类模型训练的准确性。
[0108]
如图6所示,是本发明一实施例提供的证件分类模型训练装置的功能模 块图。
[0109]
本发明所述证件分类模型训练装置100可以安装于电子设备中。根据实 现的功能,所述证件分类模型训练装置100可以包括增强样本生成模块101、 有效相似样本生成模块102、及分类模型训练模块103。本发明所述模块也可 以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定 功能的一系列计算机程序段,其存储在电子设备的存储器中。
[0110]
在本实施例中,关于各模块/单元的功能如下:
[0111]
所述增强样本生成模块101,用于获取原始证件图像集,对所述原始证件 图像集执行数据增强操作,得到增强证件图像集;
[0112]
所述有效相似样本生成模块102,用于提取所述增强证件图像集中每张增 强证件图像的像素分布信息,根据所述像素分布信息生成对应的增强证件图 像的相似证件图像;计算每张所述相似证件图像的有效信息量,选择有效信 息量满足第一预设条件的相似证件图像组成有效相似证件图像集;
[0113]
所述分类模型训练模块103,用于利用所述原始证件图像集、所述增强证 件图像集及所述有效相似证件图像集对预构建的证件分类模型进行图像分类 的预测训练,直到所述预测训练满足第二预设条件时,退出所述预测训练, 得到训练完成的证件分类模型。
[0114]
详细地,本发明实施例中所述证件分类模型训练装置100中的各个模块 在使用时采用与上述的图1至图5中所述的证件分类模型训练方法一样的技 术手段,并能够产生相同的技术效果,这里不再赘述。
[0115]
如图7所示,是本发明一实施例提供的实现证件分类模型训练方法的电 子设备的结构示意图。
[0116]
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储 在所述存储器11中并可在所述处理器10上运行的计算机程序,如证件分类 模型训练程序。
[0117]
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储 介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器 等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电 子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在 另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配 备的插接式移动硬盘、智能存储卡(smart media card,smc)、安全数字 (secure digital,sd)卡、闪存卡(flash card)等。进一步地,所述存储器 11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储 器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如证件 分类模型训练程序的代码等,还可以用于暂时地存储已经输出或者将要输出 的数据。
[0118]
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封 装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路 所组成,包括一个或者多个中央处理器(central processing unit,cpu)、微处 理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10 是所述电子设备的控制核心(control unit),利用各种接口和线路连接整个电 子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如证件分类模型训练程序等),以及调用存储在所述存储器11内的数据, 以执行电子设备1的各种功能和处理数据。
[0119]
所述总线可以是外设部件互连标准(peripheral component interconnect, 简称pci)总线或扩展工业标准结构(extended industry standard architecture, 简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。所 述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通 信。
[0120]
图7仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图7 示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更 多的部件,或者组合某
些部件,或者不同的部件布置。
[0121]
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源 (比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10 逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理 等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、 电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。 所述电子设备1还可以包括多种传感器、蓝牙模块、wi-fi模块等,在此不再 赘述。
[0122]
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接 口可以包括有线接口和/或无线接口(如wi-fi接口、蓝牙接口等),通常用于 在该电子设备1与其他电子设备之间建立通信连接。
[0123]
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器 (display)、输入单元(比如键盘(keyboard)),可选地,用户接口还可以是 标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led 显示器、液晶显示器、触控式液晶显示器以及oled(organic light-emittingdiode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏 或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用 户界面。
[0124]
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构 的限制。
[0125]
所述电子设备1中的所述存储器11存储的证件分类模型训练程序是多个 指令的组合,在所述处理器10中运行时,可以实现:
[0126]
获取原始证件图像集,对所述原始证件图像集执行数据增强操作,得到 增强证件图像集;
[0127]
提取所述增强证件图像集中每张增强证件图像的像素分布信息,根据所 述像素分布信息生成对应的增强证件图像的相似证件图像;
[0128]
计算每张所述相似证件图像的有效信息量,选择有效信息量满足第一预 设条件的相似证件图像组成有效相似证件图像集;
[0129]
利用所述原始证件图像集、所述增强证件图像集及所述有效相似证件图 像集对预构建的证件分类模型进行图像分类的预测训练,直到所述预测训练 满足第二预设条件时,退出所述预测训练,得到训练完成的证件分类模型。
[0130]
具体地,所述处理器10对上述指令的具体实现方法可参考图1对应实施 例中相关步骤的描述,在此不赘述。
[0131]
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式 实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质 中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如, 所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或 装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储 器(rom,read-only memory)。
[0132]
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算 机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
[0133]
获取原始证件图像集,对所述原始证件图像集执行数据增强操作,得到 增强证件图像集;
[0134]
提取所述增强证件图像集中每张增强证件图像的像素分布信息,根据所 述像素分布信息生成对应的增强证件图像的相似证件图像;
[0135]
计算每张所述相似证件图像的有效信息量,选择有效信息量满足第一预 设条件的相似证件图像组成有效相似证件图像集;
[0136]
利用所述原始证件图像集、所述增强证件图像集及所述有效相似证件图 像集对预构建的证件分类模型进行图像分类的预测训练,直到所述预测训练 满足第二预设条件时,退出所述预测训练,得到训练完成的证件分类模型。
[0137]
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和 方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示 意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可 以有另外的划分方式。
[0138]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作 为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方, 或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或 者全部模块来实现本实施例方案的目的。
[0139]
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中, 也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单 元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件 功能模块的形式实现。
[0140]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节, 而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实 现本发明。
[0141]
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限 制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落 在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将 权利要求中的任何附关联图标记视为限制所涉及的权利要求。
[0142]
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算 法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心 化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中 包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个 区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0143]
本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其 中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机 控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获 得最佳结果的理论、方法、技术及应用系统。
[0144]
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权 利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件 来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
[0145]
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制, 尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当 理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术 方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1