本申请涉及机器学习,尤其涉及凭证信息识别模型生成及凭证信息识别方法、装置及设备。
背景技术:
1、随着计算机和互联网的普及应用,以及通信技术的飞速发展,社会逐渐进入了信息化时代。用户在利用各个应用程序去便捷地获取服务的过程中,往往需要向服务提供商提供各种凭证信息,以便于服务提供商通过核验用户提供的凭证信息,而决策是否向用户提供服务。目前,通常需要根据用户持有量大且样式固定的凭证的内容结构,去生成专门用于识别单一种类的凭证的凭证信息识别模型。但现有的凭证不仅种类繁多,且有大量凭证并不具有固定的内容结构,基于此,如何生成通用性好且准确性好的凭证信息识别模型,以降低对于各种类型的凭证信息进行识别的成本,成为了亟待解决的技术问题。
技术实现思路
1、本说明书实施例提供的凭证信息识别模型生成及凭证信息识别方法、装置及设备,可以生成通用性好且准确性好的凭证信息识别模型,以降低对于各种类型的凭证信息进行识别的成本。
2、为解决上述技术问题,本说明书实施例是这样实现的:
3、本说明书实施例提供的一种凭证信息识别模型生成方法,包括:
4、获取携带有用户凭证信息样本以及所述用户凭证信息样本中包含的基准凭证关键文本的第一训练样本;
5、利用所述第一训练样本对第一初始模型进行训练,得到用于从用户所提交的用户凭证信息中提取凭证关键文本的第一目标模型;
6、获取携带有凭证关键文本样本以及基准凭证内容描述文本的第二训练样本;其中,所述基准凭证内容描述文本用于介绍所述凭证关键文本样本所属的用户凭证信息;
7、利用所述第二训练样本对第二初始模型进行训练,得到用于基于所述凭证关键文本生成凭证内容描述文本的第二目标模型;
8、根据所述第一目标模型及所述第二目标模型,生成凭证信息识别模型。
9、本说明书实施例提供的一种凭证信息识别方法,包括:
10、获取用户提交的用户凭证信息;
11、将所述用户凭证信息输入至凭证信息识别模型,得到所述凭证信息识别模型输出的针对所述用户凭证信息的凭证内容描述文本;其中,所述凭证信息识别模型是使用本说明书实施例提供的凭证信息识别模型生成方法生成的。
12、本说明书实施例提供的一种凭证信息识别模型生成装置,包括:
13、第一获取模块,用于获取携带有用户凭证信息样本以及所述用户凭证信息样本中包含的基准凭证关键文本的第一训练样本;
14、第一训练模块,用于利用所述第一训练样本对第一初始模型进行训练,得到用于从用户所提交的用户凭证信息中提取凭证关键文本的第一目标模型;
15、第二获取模块,用于获取携带有凭证关键文本样本以及基准凭证内容描述文本的第二训练样本;其中,所述基准凭证内容描述文本用于介绍所述凭证关键文本样本所属的用户凭证信息;
16、第二训练模块,用于利用所述第二训练样本对第二初始模型进行训练,得到用于基于所述凭证关键文本生成凭证内容描述文本的第二目标模型;
17、模型生成模块,用于根据所述第一目标模型及所述第二目标模型,生成凭证信息识别模型。
18、本说明书实施例提供的一种凭证信息识别装置,包括:
19、获取模块,用于获取用户提交的用户凭证信息;
20、凭证识别模块,用于将所述用户凭证信息输入至凭证信息识别模型,得到所述凭证信息识别模型输出的针对所述用户凭证信息的凭证内容描述文本;其中,所述凭证信息识别模型是使用本说明书实施例提供的凭证信息识别模型生成方法生成的。
21、本说明书实施例提供的一种凭证信息识别模型生成设备,包括:
22、至少一个处理器;以及,
23、与所述至少一个处理器通信连接的存储器;其中,
24、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
25、获取携带有用户凭证信息样本以及所述用户凭证信息样本中包含的基准凭证关键文本的第一训练样本;
26、利用所述第一训练样本对第一初始模型进行训练,得到用于从用户所提交的用户凭证信息中提取凭证关键文本的第一目标模型;
27、获取携带有凭证关键文本样本以及基准凭证内容描述文本的第二训练样本;其中,所述基准凭证内容描述文本用于介绍所述凭证关键文本样本所属的用户凭证信息;
28、利用所述第二训练样本对第二初始模型进行训练,得到用于基于所述凭证关键文本生成凭证内容描述文本的第二目标模型;
29、根据所述第一目标模型及所述第二目标模型,生成凭证信息识别模型。
30、本说明书实施例提供的一种凭证信息识别设备,包括:
31、至少一个处理器;以及,
32、与所述至少一个处理器通信连接的存储器;其中,
33、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
34、获取用户提交的用户凭证信息;
35、将所述用户凭证信息输入至凭证信息识别模型,得到所述凭证信息识别模型输出的针对所述用户凭证信息的凭证内容描述文本;其中,所述凭证信息识别模型是使用本说明书实施例提供的凭证信息识别模型生成方法生成的。
36、本说明书中提供的至少一个实施例能够实现以下有益效果:
37、通过利用携带有用户凭证信息样本及其包含的基准凭证关键文本的第一训练样本,训练得到具有从用户凭证信息中提取出凭证关键文本的能力的第一目标模型;并利用携带有凭证关键文本样本以及基准凭证内容描述文本的第二训练样本,训练得到具有基于凭证关键文本生成凭证内容描述文本的第二目标模型,使得结合第一目标模型及第二目标模型生成的凭证信息识别模型能够先从各类用户凭证信息中提取到凭证关键文本,进而基于该凭证关键文本生成便于人员理解的针对该用户凭证信息的介绍信息。由于无需结合凭证的内容结构,去针对每类凭证均训练生成一个凭证信息识别模型,因此,生成的凭证信息识别模型的通用性好、准确性好且实用性好,有利于降低对于各种类型的凭证信息进行识别的成本。
1.一种凭证信息识别模型生成方法,包括:
2.如权利要求1所述的方法,所述获取携带有用户凭证信息样本以及所述用户凭证信息样本中包含的基准凭证关键文本的第一训练样本,具体包括:
3.如权利要求1所述的方法,所述获取携带有用户凭证信息样本以及所述用户凭证信息样本中包含的基准凭证关键文本的第一训练样本,具体包括:
4.如权利要求1所述的方法,所述获取携带有用户凭证信息样本以及所述用户凭证信息样本中包含的基准凭证关键文本的第一训练样本,具体包括:
5.如权利要求2或4所述的方法,还包括:
6.如权利要求2或4所述的方法,所述第一目标模型在接收到用户所提交的用户凭证图像后,还用于输出从所述用户凭证图像中提取到的凭证关键文本的位置信息。
7.如权利要求2或4所述的方法,所述用户凭证图像样本包括:用户证件图像、可信证明图像、根据所述用户证件图像中包含的文本数据生成的虚拟证件图像,根据所述可信证明图像中包含的文本数据生成的虚拟证明图像中的至少一种。
8.如权利要求1所述的方法,所述获取携带有凭证关键文本样本以及基准凭证内容描述文本的第二训练样本,具体包括:
9.如权利要求1所述的方法,所述获取携带有凭证关键文本样本以及基准凭证内容描述文本的第二训练样本,具体包括:
10.一种凭证信息识别方法,包括:
11.如权利要求10所述的方法,所述用户凭证信息包括:用户证件图像、由指定机构开具的证明的图像以及用户凭证文本中的至少一种。
12.一种凭证信息识别模型生成装置,包括:
13.如权利要求12所述的装置,所述第一获取模块,具体用于:
14.如权利要求12所述的装置,所述第一获取模块,具体用于:
15.如权利要求12所述的装置,所述第一获取模块,具体用于:
16.如权利要求13或15所述的装置,还包括:
17.如权利要求13或15所述的装置,所述第一目标模型在接收到用户所提交的用户凭证图像后,还用于输出从所述用户凭证图像中提取到的凭证关键文本的位置信息。
18.如权利要求13或15所述的装置,所述用户凭证图像样本包括:用户证件图像、可信证明图像、根据所述用户证件图像中包含的文本数据生成的虚拟证件图像,根据所述可信证明图像中包含的文本数据生成的虚拟证明图像中的至少一种。
19.如权利要求12所述的装置,所述第二获取模块,具体用于:
20.如权利要求12所述的装置,所述第二获取模块,具体用于:
21.一种凭证信息识别装置,包括:
22.如权利要求21所述的装置,所述用户凭证信息包括:用户证件图像、由指定机构开具的证明的图像以及用户凭证文本中的至少一种。
23.一种凭证信息识别模型生成设备,包括:
24.一种凭证信息识别设备,包括: