基于多模型的信用数据处理方法及装置与流程

文档序号:30091407发布日期:2022-05-18 09:07阅读:86来源:国知局
基于多模型的信用数据处理方法及装置与流程

1.本发明涉及财务数据算法技术领域,尤其涉及一种基于多模型的信用数据处理方法及装置。


背景技术:

2.随着中小型企业或个人的借贷或租赁等商务租借的需求增加,越来越多的信用评价服务公司在对用户进行信用评价时采用电子化系统进行自动的评价,但现有的电子化信用评价系统在处理信用数据时,一般仅采用人工或简单的标签处理方式进行分类和验证计算,这种处理方式需要前期进行复杂繁重的数据清洗工作,且仍然无法应对现实中复杂多变的应用场景,可见现有技术存在缺陷,亟待解决。


技术实现要素:

3.本发明所要解决的技术问题在于,提供一种基于多模型的信用数据处理方法及装置,能够提高信用数据处理的自动化程度,并提高数据验证的精度,使得最终得到的信用评价结果更加准确和可信。
4.为了解决上述技术问题,本发明第一方面公开了一种基于多模型的信用数据处理方法,所述方法包括:
5.获取目标用户的至少两种类型的信用数据;
6.对于任一所述信用数据,根据分类神经网络模型,从多个候选的数据验证模型中确定出该信用数据对应的数据验证算法模型;
7.将所有所述信用数据分别输入至对应的所述数据验证算法模型中,以验证每一所述信用数据的真实性;
8.根据所有所述信用数据以及所述真实性,确定所述目标用户的信用评价参数;所述信用评级参数用于指示所述目标用户的信用情况。
9.作为一种可选的实施方式,在本发明第一方面中,所述信用数据的类型包括工商信息数据、税务申报数据、税务征收数据、投资方数据、分支机构数据、工商变更数据、欠税数据、违法违章数据、法律案件数据和资产数据中的至少两种;和/或,所述数据验证模型包括工商信息验证模型、税务申报验证模型、税务征收验证模型、投资方验证模型、分支机构验证模型、工商变更验证模型、欠税验证模型、违法违章验证模型、法律案件验证模型和资产验证模型中的至少两种。
10.作为一种可选的实施方式,在本发明第一方面中,所述对于任一所述信用数据,根据分类神经网络模型,从多个候选的数据验证模型中确定出该信用数据对应的数据验证算法模型,包括:
11.对于任一所述信用数据,将该信用数据输入至分类神经网络模型,以确定所述信用数据对应的数据类型;所述分类神经网络模型通过包括有多个信用数据和对应的数据类型的训练数据集训练得到;所述分类神经网络模型包括有编码器模块、解码器模块和分类
层模块;所述编码器模块可以提取多种模态类型的所述信用数据的向量特征;
12.根据所述信用数据对应的数据类型,以及预设的类型-模型映射关系表,从多个候选的数据验证模型中确定出该信用数据对应的数据验证算法模型。
13.作为一种可选的实施方式,在本发明第一方面中,所述编码器模块通过以下步骤训练得到:
14.确定训练信用数据集合;所述训练信用数据集合中包括有至少两个相互对应的不同模态类型的训练信用数据;所述模态类型为图像类型、数值类型、文本类型、符号类型、视频类型或音频类型;
15.将所述训练信用数据集合中的所有所述训练信用数据输入至所述编码器模块中进行特征提取,以得到每一所述训练信用数据对应的数据向量特征;
16.将所有所述数据向量特征分别输入至多个对应的所述模态类型的训练解码器模块中进行解码得到解码数据,计算每一所述训练解码器模块输出的所述解码数据的损失函数;所述损失函数可以为所述解码数据与所述训练信用数据之间的第一损失函数,或多个所述模态类型的所述解码数据被映射到同一纬度后的相互之间的第二损失函数;所述第一损失函数包括交叉熵损失函数、l1损失函数和l2损失函数中至少一种;所述第二损失函数为相似度函数;
17.重复上述步骤,基于梯度下降方法优化所述编码器模块和所述训练解码器模块的参数直至所述损失函数收敛,得到训练好的所述编码器模块。
18.作为一种可选的实施方式,在本发明第一方面中,每一所述数据验证算法模型中包括有所述信用数据的数据类型对应的多个数据验证规则和其他来源数据库;所述数据验证规则用于指示对应数据类型的所述信用数据中多个参数数据中任意至少两个参数数据应当遵循的数据映射关系;所述将所有所述信用数据分别输入至对应的所述数据验证算法模型中,以验证每一所述信用数据的真实性,包括:
19.对于每一所述信用数据,根据所述多个数据验证规则,对该信用数据中的多个参数数据的数据验证计算,得到多个数据验证计算结果;
20.将该信用数据中的多个参数数据和所述其他来源数据库中的对应标识的其他来源参数数据进行相似度计算,得到多个参数相似度计算结果;
21.根据所述多个数据验证计算结果和所述多个参数相似度计算结果,确定该信用数据的真实性。
22.作为一种可选的实施方式,在本发明第一方面中,所述根据所述多个数据验证计算结果和所述多个参数相似度计算结果,确定该信用数据的真实性,包括:
23.计算所述多个数据验证计算结果中正确结果占所有结果的第一结果占比;
24.计算所述多个参数相似度计算结果中相似度高于预设的相似度阈值的计算结果占所有结果的第二结果占比;
25.计算所述第一结果占比和所述第二结果占比的加权求和,得到该信用数据的真实性参数;所述第一结果占比和所述第二结果占比的权重之和为1;所述第一结果占比的权重大于所述第二结果占比的权重。
26.作为一种可选的实施方式,在本发明第一方面中,所述根据所有所述信用数据以及所述真实性,确定所述目标用户的信用评价参数,包括:
27.确定信用分级神经网络模型;所述信用分级神经网络模型中包括有至少两个与所述信用数据的类型一一对应的子分级神经网络模型;所述子分级神经网络模型的类型包括
28.根据所述信用数据的所述真实性参数,确定所述信用数据的类型对应的所述子分级神经网络模型的输出权重;
29.将所有所述信用数据分别输入至对应的所述子分级神经网络模型以得到输出评分,并根据所述输出权重,对所有所述子分级神经网络模型的所述输出评分进行加权求和,以得到所述目标用户的信用评价参数。
30.作为一种可选的实施方式,在本发明第一方面中,所述根据所述信用数据的所述真实性参数,确定所述信用数据的类型对应的所述子分级神经网络模型的输出权重,包括:
31.计算所有所述信用数据的所述真实性参数的平均值;
32.计算任一所述信用数据的所述真实性参数和所述平均值之间的差值;
33.基于权重确定算法,以及所述输出权重与所述差值成正比的预设条件,确定任一所述信用数据的类型对应的所述子分级神经网络模型的输出权重。
34.本发明第二方面公开了一种基于多模型的信用数据处理装置,其包括:
35.获取模块,用于获取目标用户的至少两种类型的信用数据;
36.分类模块,用于对于任一所述信用数据,根据分类神经网络模型,从多个候选的数据验证模型中确定出该信用数据对应的数据验证算法模型;
37.验证模块,用于将所有所述信用数据分别输入至对应的所述数据验证算法模型中,以验证每一所述信用数据的真实性;
38.评价模块,用于根据所有所述信用数据以及所述真实性,确定所述目标用户的信用评价参数;所述信用评级参数用于指示所述目标用户的信用情况。
39.作为一种可选的实施方式,在本发明第二方面中,所述信用数据的类型包括工商信息数据、税务申报数据、税务征收数据、投资方数据、分支机构数据、工商变更数据、欠税数据、违法违章数据、法律案件数据和资产数据中的至少两种;和/或,所述数据验证模型包括工商信息验证模型、税务申报验证模型、税务征收验证模型、投资方验证模型、分支机构验证模型、工商变更验证模型、欠税验证模型、违法违章验证模型、法律案件验证模型和资产验证模型中的至少两种。
40.作为一种可选的实施方式,在本发明第二方面中,所述分类模块对于任一所述信用数据,根据分类神经网络模型,从多个候选的数据验证模型中确定出该信用数据对应的数据验证算法模型的具体方式,包括:
41.对于任一所述信用数据,将该信用数据输入至分类神经网络模型,以确定所述信用数据对应的数据类型;所述分类神经网络模型通过包括有多个信用数据和对应的数据类型的训练数据集训练得到;所述分类神经网络模型包括有编码器模块、解码器模块和分类层模块;所述编码器模块可以提取多种模态类型的所述信用数据的向量特征;
42.根据所述信用数据对应的数据类型,以及预设的类型-模型映射关系表,从多个候选的数据验证模型中确定出该信用数据对应的数据验证算法模型。
43.作为一种可选的实施方式,在本发明第二方面中,所述编码器模块通过以下步骤训练得到:
44.确定训练信用数据集合;所述训练信用数据集合中包括有至少两个相互对应的不
同模态类型的训练信用数据;所述模态类型为图像类型、数值类型、文本类型、符号类型、视频类型或音频类型;
45.将所述训练信用数据集合中的所有所述训练信用数据输入至所述编码器模块中进行特征提取,以得到每一所述训练信用数据对应的数据向量特征;
46.将所有所述数据向量特征分别输入至多个对应的所述模态类型的训练解码器模块中进行解码得到解码数据,计算每一所述训练解码器模块输出的所述解码数据的损失函数;所述损失函数可以为所述解码数据与所述训练信用数据之间的第一损失函数,或多个所述模态类型的所述解码数据被映射到同一纬度后的相互之间的第二损失函数;所述第一损失函数包括交叉熵损失函数、l1损失函数和l2损失函数中至少一种;所述第二损失函数为相似度函数;
47.重复上述步骤,基于梯度下降方法优化所述编码器模块和所述训练解码器模块的参数直至所述损失函数收敛,得到训练好的所述编码器模块。
48.作为一种可选的实施方式,在本发明第二方面中,每一所述数据验证算法模型中包括有所述信用数据的数据类型对应的多个数据验证规则和其他来源数据库;所述数据验证规则用于指示对应数据类型的所述信用数据中多个参数数据中任意至少两个参数数据应当遵循的数据映射关系;所述验证模块将所有所述信用数据分别输入至对应的所述数据验证算法模型中,以验证每一所述信用数据的真实性的具体方式,包括:
49.对于每一所述信用数据,根据所述多个数据验证规则,对该信用数据中的多个参数数据的数据验证计算,得到多个数据验证计算结果;
50.将该信用数据中的多个参数数据和所述其他来源数据库中的对应标识的其他来源参数数据进行相似度计算,得到多个参数相似度计算结果;
51.根据所述多个数据验证计算结果和所述多个参数相似度计算结果,确定该信用数据的真实性。
52.作为一种可选的实施方式,在本发明第二方面中,所述验证模块根据所述多个数据验证计算结果和所述多个参数相似度计算结果,确定该信用数据的真实性的具体方式,包括:
53.计算所述多个数据验证计算结果中正确结果占所有结果的第一结果占比;
54.计算所述多个参数相似度计算结果中相似度高于预设的相似度阈值的计算结果占所有结果的第二结果占比;
55.计算所述第一结果占比和所述第二结果占比的加权求和,得到该信用数据的真实性参数;所述第一结果占比和所述第二结果占比的权重之和为1;所述第一结果占比的权重大于所述第二结果占比的权重。
56.作为一种可选的实施方式,在本发明第二方面中,所述评价模块根据所有所述信用数据以及所述真实性,确定所述目标用户的信用评价参数的具体方式,包括:
57.确定信用分级神经网络模型;所述信用分级神经网络模型中包括有至少两个与所述信用数据的类型一一对应的子分级神经网络模型;所述子分级神经网络模型的类型包括
58.根据所述信用数据的所述真实性参数,确定所述信用数据的类型对应的所述子分级神经网络模型的输出权重;
59.将所有所述信用数据分别输入至对应的所述子分级神经网络模型以得到输出评
分,并根据所述输出权重,对所有所述子分级神经网络模型的所述输出评分进行加权求和,以得到所述目标用户的信用评价参数。
60.作为一种可选的实施方式,在本发明第二方面中,所述评价模块根据所述信用数据的所述真实性参数,确定所述信用数据的类型对应的所述子分级神经网络模型的输出权重的具体方式,包括:
61.计算所有所述信用数据的所述真实性参数的平均值;
62.计算任一所述信用数据的所述真实性参数和所述平均值之间的差值;
63.基于权重确定算法,以及所述输出权重与所述差值成正比的预设条件,确定任一所述信用数据的类型对应的所述子分级神经网络模型的输出权重。
64.本发明第三方面公开了另一种基于多模型的信用数据处理装置,所述装置包括:
65.存储有可执行程序代码的存储器;
66.与所述存储器耦合的处理器;
67.所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的基于多模型的信用数据处理方法中的部分或全部步骤。
68.与现有技术相比,本发明实施例具有以下有益效果:
69.本发明实施例中,获取目标用户的至少两种类型的信用数据;对于任一所述信用数据,根据分类神经网络模型,从多个候选的数据验证模型中确定出该信用数据对应的数据验证算法模型;将所有所述信用数据分别输入至对应的所述数据验证算法模型中,以验证每一所述信用数据的真实性;根据所有所述信用数据以及所述真实性,确定所述目标用户的信用评价参数;所述信用评级参数用于指示所述目标用户的信用情况。可见,本发明能够提高信用数据处理的自动化程度,并提高数据验证的精度,使得最终得到的信用评价结果更加准确和可信。
附图说明
70.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
71.图1是本发明实施例公开的一种基于多模型的信用数据处理方法的流程示意图;
72.图2是本发明实施例公开的一种基于多模型的信用数据处理装置的结构示意图;
73.图3是本发明实施例公开的另一种基于多模型的信用数据处理装置的结构示意图。
具体实施方式
74.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
75.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别
不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或端没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或端固有的其他步骤或单元。
76.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
77.本发明公开了一种基于多模型的信用数据处理方法及装置,能够提高信用数据处理的自动化程度,并提高数据验证的精度,使得最终得到的信用评价结果更加准确和可信。以下分别进行详细说明。
78.实施例一
79.请参阅图1,图1是本发明实施例公开的一种基于多模型的信用数据处理方法的流程示意图。其中,图1所描述的方法可以应用于相应的信用数据处理终端、信用数据处理设备或信用数据处理服务器中,且该服务器可以是本地服务器,也可以是云服务器。具体地,如图1所示,该基于多模型的信用数据处理方法可以包括以下操作:
80.101、获取目标用户的至少两种类型的信用数据。
81.可选的,目标用户可以为企业法人、企业分支机构或个人,例如可以为准备进行信用评价以实现借贷目的的企业用户,或是准备进行信用评价以实现借贷目的的企业员工。可选的,目标用户的信用数据,可以为通过特定api与官方机构或第三方机构的数据库进行通信以获取,或是由目标用户进行上传以获取。
82.可选的,信用数据的类型包括工商信息数据、税务申报数据、税务征收数据、投资方数据、分支机构数据、工商变更数据、欠税数据、违法违章数据、法律案件数据和资产数据中的至少两种。可选的,信用数据的模态类型可以为多种模态,例如图片或文本或表格或语音,本发明不做限定。
83.102、对于任一信用数据,根据分类神经网络模型,从多个候选的数据验证模型中确定出该信用数据对应的数据验证算法模型。
84.可选的,数据验证模型包括工商信息验证模型、税务申报验证模型、税务征收验证模型、投资方验证模型、分支机构验证模型、工商变更验证模型、欠税验证模型、违法违章验证模型、法律案件验证模型和资产验证模型中的至少两种。
85.103、将所有信用数据分别输入至对应的数据验证算法模型中,以验证每一信用数据的真实性。
86.104、根据所有信用数据以及真实性,确定目标用户的信用评价参数;信用评级参数用于指示目标用户的信用情况。
87.可见,通过本发明的上述方案,能够通过训练好的分类神经网络模型自动确定出信用数据对应的验证模型,提高信用数据处理的自动化程度,同时基于不同类型的信用数据采用不同的验证模型进行验证,能够提高数据验证的精度,使得最终得到的信用评价结果更加准确和可信。
88.作为一种可选的实施方式,上述步骤102中的,对于任一信用数据,根据分类神经
网络模型,从多个候选的数据验证模型中确定出该信用数据对应的数据验证算法模型,包括:
89.对于任一信用数据,将该信用数据输入至分类神经网络模型,以确定信用数据对应的数据类型;
90.根据信用数据对应的数据类型,以及预设的类型-模型映射关系表,从多个候选的数据验证模型中确定出该信用数据对应的数据验证算法模型。
91.可选的,分类神经网络模型通过包括有多个信用数据和对应的数据类型的训练数据集训练得到。可选的,分类神经网络模型包括有编码器模块、解码器模块和分类层模块,其中,编码器模块可以提取多种模态类型的信用数据的向量特征。
92.通过上述方案,可以采用可以提取多种模态类型的向量特征的编码器模块来处理不同模态类型的信用数据,从而提高了分类神经网络模型的自动化程度和智能程度,且可以更加精确高效地确定出信用数据对应的数据验证算法模型,提高后续处理的效率。
93.作为一种可选的实施方式,编码器模块通过以下步骤训练得到:
94.确定训练信用数据集合,其中训练信用数据集合中包括有至少两个相互对应的不同模态类型的训练信用数据,可选的,模态类型为图像类型、数值类型、文本类型、符号类型、视频类型或音频类型;
95.将训练信用数据集合中的所有训练信用数据输入至编码器模块中进行特征提取,以得到每一训练信用数据对应的数据向量特征;
96.将所有数据向量特征分别输入至多个对应的模态类型的训练解码器模块中进行解码得到解码数据,计算每一训练解码器模块输出的解码数据的损失函数;损失函数可以为解码数据与训练信用数据之间的第一损失函数,或多个模态类型的解码数据被映射到同一纬度后的相互之间的第二损失函数;第一损失函数包括交叉熵损失函数、l1损失函数和l2损失函数中至少一种;第二损失函数为相似度函数;
97.重复上述步骤,基于梯度下降方法优化编码器模块和训练解码器模块的参数直至损失函数收敛,得到训练好的编码器模块。
98.通过上述方案,可以根据联合的损失函数和多个分别的训练解码器模块来训练出一个可以提取多种模态类型的向量特征的编码器模块,以用于后续处理不同模态类型的信用数据,从而提高了分类神经网络模型的自动化程度和智能程度。
99.作为一种可选的实施方式,每一数据验证算法模型中包括有信用数据的数据类型对应的多个数据验证规则和其他来源数据库,其中,数据验证规则用于指示对应数据类型的信用数据中多个参数数据中任意至少两个参数数据应当遵循的数据映射关系。相应的,上述步骤103中的,将所有信用数据分别输入至对应的数据验证算法模型中,以验证每一信用数据的真实性,包括:
100.对于每一信用数据,根据多个数据验证规则,对该信用数据中的多个参数数据的数据验证计算,得到多个数据验证计算结果;
101.将该信用数据中的多个参数数据和其他来源数据库中的对应标识的其他来源参数数据进行相似度计算,得到多个参数相似度计算结果;
102.根据多个数据验证计算结果和多个参数相似度计算结果,确定该信用数据的真实性。
103.可选的,其他来源数据库可以为包括至少一个信用数据中的参数数据的来自其他来源的数据库,例如当信用数据是用户自己上传的数据时,其他来源数据库可以是官方机构或第三方机构的数据库,其中储存有与用户自己上传的数据相对应的数据,可以用于数据的对照计算。
104.通过上述方案,可以基于其他来源数据库对信用数据的数据对照验证,且通过数据验证规则来计算信用数据的参数数据的准确性,从而能够更合理地评估出信用数据的真实性。
105.作为一种可选的实施方式,上述步骤中的,根据多个数据验证计算结果和多个参数相似度计算结果,确定该信用数据的真实性,包括:
106.计算多个数据验证计算结果中正确结果占所有结果的第一结果占比;
107.计算多个参数相似度计算结果中相似度高于预设的相似度阈值的计算结果占所有结果的第二结果占比;
108.计算第一结果占比和第二结果占比的加权求和,得到该信用数据的真实性参数。
109.其中,第一结果占比和第二结果占比的权重之和为1,且第一结果占比的权重大于第二结果占比的权重,以使得数据验证计算结果的重要性高于参数相似度计算结果的重要性,这是因为参数相似度计算中,其他来源的数据库的真实性同样也无法得到保证,其受到数据来源的影响,而数据验证规则遵循于信用数据本身的数据规律,其可信度更高。
110.作为一种可选的实施方式,上述步骤104中的,根据所有信用数据以及真实性,确定目标用户的信用评价参数,包括:
111.确定信用分级神经网络模型;信用分级神经网络模型中包括有至少两个与信用数据的类型一一对应的子分级神经网络模型;子分级神经网络模型的类型包括
112.根据信用数据的真实性参数,确定信用数据的类型对应的子分级神经网络模型的输出权重;
113.将所有信用数据分别输入至对应的子分级神经网络模型以得到输出评分,并根据输出权重,对所有子分级神经网络模型的输出评分进行加权求和,以得到目标用户的信用评价参数。
114.作为一种可选的实施方式,上述步骤中的,根据信用数据的真实性参数,确定信用数据的类型对应的子分级神经网络模型的输出权重,包括:
115.计算所有信用数据的真实性参数的平均值;
116.计算任一信用数据的真实性参数和平均值之间的差值;
117.基于权重确定算法,以及输出权重与差值成正比的预设条件,确定任一信用数据的类型对应的子分级神经网络模型的输出权重。
118.通过上述方案,能够基于神经网络算法,以及权重算法,来实现调用多个评分模型对信用数据进行评分,并根据信用数据的真实性对应调整评分的权重比例,以使得最终的评分结果更加真实。
119.实施例二
120.请参阅图2,图2是本发明实施例公开的一种基于多模型的信用数据处理装置的结构示意图。其中,图2所描述的装置可以应用于相应的信用数据处理终端、信用数据处理设备或信用数据处理服务器中,且该服务器可以是本地服务器,也可以是云服务器,本发明实
施例不做限定。具体地,如图2所示,该装置可以包括:
121.获取模块201,用于获取目标用户的至少两种类型的信用数据。
122.可选的,目标用户可以为企业法人、企业分支机构或个人,例如可以为准备进行信用评价以实现借贷目的的企业用户,或是准备进行信用评价以实现借贷目的的企业员工。可选的,目标用户的信用数据,可以为通过特定api与官方机构或第三方机构的数据库进行通信以获取,或是由目标用户进行上传以获取。
123.可选的,信用数据的类型包括工商信息数据、税务申报数据、税务征收数据、投资方数据、分支机构数据、工商变更数据、欠税数据、违法违章数据、法律案件数据和资产数据中的至少两种。可选的,信用数据的模态类型可以为多种模态,例如图片或文本或表格或语音,本发明不做限定。
124.分类模块202,用于对于任一信用数据,根据分类神经网络模型,从多个候选的数据验证模型中确定出该信用数据对应的数据验证算法模型。
125.可选的,数据验证模型包括工商信息验证模型、税务申报验证模型、税务征收验证模型、投资方验证模型、分支机构验证模型、工商变更验证模型、欠税验证模型、违法违章验证模型、法律案件验证模型和资产验证模型中的至少两种。
126.验证模块203,用于将所有信用数据分别输入至对应的数据验证算法模型中,以验证每一信用数据的真实性。
127.评价模块204,用于根据所有信用数据以及真实性,确定目标用户的信用评价参数;信用评级参数用于指示目标用户的信用情况。
128.可见,通过本发明的上述方案,能够通过训练好的分类神经网络模型自动确定出信用数据对应的验证模型,提高信用数据处理的自动化程度,同时基于不同类型的信用数据采用不同的验证模型进行验证,能够提高数据验证的精度,使得最终得到的信用评价结果更加准确和可信。
129.作为一种可选的实施方式,分类模块202对于任一信用数据,根据分类神经网络模型,从多个候选的数据验证模型中确定出该信用数据对应的数据验证算法模型的具体方式,包括:
130.对于任一信用数据,将该信用数据输入至分类神经网络模型,以确定信用数据对应的数据类型;
131.根据信用数据对应的数据类型,以及预设的类型-模型映射关系表,从多个候选的数据验证模型中确定出该信用数据对应的数据验证算法模型。
132.可选的,分类神经网络模型通过包括有多个信用数据和对应的数据类型的训练数据集训练得到。可选的,分类神经网络模型包括有编码器模块、解码器模块和分类层模块,其中,编码器模块可以提取多种模态类型的信用数据的向量特征。
133.通过上述方案,可以采用可以提取多种模态类型的向量特征的编码器模块来处理不同模态类型的信用数据,从而提高了分类神经网络模型的自动化程度和智能程度,且可以更加精确高效地确定出信用数据对应的数据验证算法模型,提高后续处理的效率。
134.作为一种可选的实施方式,编码器模块通过以下步骤训练得到:
135.确定训练信用数据集合;训练信用数据集合中包括有至少两个相互对应的不同模态类型的训练信用数据;模态类型为图像类型、数值类型、文本类型、符号类型、视频类型或
音频类型;
136.将训练信用数据集合中的所有训练信用数据输入至编码器模块中进行特征提取,以得到每一训练信用数据对应的数据向量特征;
137.将所有数据向量特征分别输入至多个对应的模态类型的训练解码器模块中进行解码得到解码数据,计算每一训练解码器模块输出的解码数据的损失函数;损失函数可以为解码数据与训练信用数据之间的第一损失函数,或多个模态类型的解码数据被映射到同一纬度后的相互之间的第二损失函数;第一损失函数包括交叉熵损失函数、l1损失函数和l2损失函数中至少一种;第二损失函数为相似度函数;
138.重复上述步骤,基于梯度下降方法优化编码器模块和训练解码器模块的参数直至损失函数收敛,得到训练好的编码器模块。
139.通过上述方案,可以根据联合的损失函数和多个分别的训练解码器模块来训练出一个可以提取多种模态类型的向量特征的编码器模块,以用于后续处理不同模态类型的信用数据,从而提高了分类神经网络模型的自动化程度和智能程度。
140.作为一种可选的实施方式,每一数据验证算法模型中包括有信用数据的数据类型对应的多个数据验证规则和其他来源数据库;数据验证规则用于指示对应数据类型的信用数据中多个参数数据中任意至少两个参数数据应当遵循的数据映射关系;验证模块203将所有信用数据分别输入至对应的数据验证算法模型中,以验证每一信用数据的真实性的具体方式,包括:
141.对于每一信用数据,根据多个数据验证规则,对该信用数据中的多个参数数据的数据验证计算,得到多个数据验证计算结果;
142.将该信用数据中的多个参数数据和其他来源数据库中的对应标识的其他来源参数数据进行相似度计算,得到多个参数相似度计算结果;
143.根据多个数据验证计算结果和多个参数相似度计算结果,确定该信用数据的真实性。
144.可选的,其他来源数据库可以为包括至少一个信用数据中的参数数据的来自其他来源的数据库,例如当信用数据是用户自己上传的数据时,其他来源数据库可以是官方机构或第三方机构的数据库,其中储存有与用户自己上传的数据相对应的数据,可以用于数据的对照计算。
145.通过上述方案,可以基于其他来源数据库对信用数据的数据对照验证,且通过数据验证规则来计算信用数据的参数数据的准确性,从而能够更合理地评估出信用数据的真实性。
146.作为一种可选的实施方式,验证模块203根据多个数据验证计算结果和多个参数相似度计算结果,确定该信用数据的真实性的具体方式,包括:
147.计算多个数据验证计算结果中正确结果占所有结果的第一结果占比;
148.计算多个参数相似度计算结果中相似度高于预设的相似度阈值的计算结果占所有结果的第二结果占比;
149.计算第一结果占比和第二结果占比的加权求和,得到该信用数据的真实性参数,其中,第一结果占比和第二结果占比的权重之和为1,且第一结果占比的权重大于第二结果占比的权重,以使得数据验证计算结果的重要性高于参数相似度计算结果的重要性,这是
因为参数相似度计算中,其他来源的数据库的真实性同样也无法得到保证,其受到数据来源的影响,而数据验证规则遵循于信用数据本身的数据规律,其可信度更高。
150.作为一种可选的实施方式,评价模块204根据所有信用数据以及真实性,确定目标用户的信用评价参数的具体方式,包括:
151.确定信用分级神经网络模型;信用分级神经网络模型中包括有至少两个与信用数据的类型一一对应的子分级神经网络模型;子分级神经网络模型的类型包括
152.根据信用数据的真实性参数,确定信用数据的类型对应的子分级神经网络模型的输出权重;
153.将所有信用数据分别输入至对应的子分级神经网络模型以得到输出评分,并根据输出权重,对所有子分级神经网络模型的输出评分进行加权求和,以得到目标用户的信用评价参数。
154.作为一种可选的实施方式,评价模块204根据信用数据的真实性参数,确定信用数据的类型对应的子分级神经网络模型的输出权重的具体方式,包括:
155.计算所有信用数据的真实性参数的平均值;
156.计算任一信用数据的真实性参数和平均值之间的差值;
157.基于权重确定算法,以及输出权重与差值成正比的预设条件,确定任一信用数据的类型对应的子分级神经网络模型的输出权重。
158.通过上述方案,能够基于神经网络算法,以及权重算法,来实现调用多个评分模型对信用数据进行评分,并根据信用数据的真实性对应调整评分的权重比例,以使得最终的评分结果更加真实。
159.实施例三
160.请参阅图3,图3是本发明实施例公开的又一种基于多模型的信用数据处理装置的结构示意图。如图3所示,该装置可以包括:
161.存储有可执行程序代码的存储器301;
162.与存储器301耦合的处理器302;
163.处理器302调用存储器301中存储的可执行程序代码,执行本发明实施例一公开的基于多模型的信用数据处理方法中的部分或全部步骤。
164.实施例四
165.本发明实施例公开了一种计算机存储介质,该计算机存储介质存储有计算机指令,该计算机指令被调用时,用于执行本发明实施例一公开的基于多模型的信用数据处理方法中的部分或全部步骤。
166.上述对本说明书特定实施例进行了描述,其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,附图中描绘的过程不一定必须按照示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
167.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述
的比较简单,相关之处参见方法实施例的部分说明即可。
168.本说明书实施例提供的装置、设备、非易失性计算机可读存储介质与方法是对应的,因此,装置、设备、非易失性计算机存储介质也具有与对应方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述对应装置、设备、非易失性计算机存储介质的有益技术效果。
169.在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(programmable logic device,pld)(例如现场可编程门阵列(field programmable gatearray,fpga))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(hardware description language,hdl),而hdl也并非仅有一种,而是有许多种,如abel(advanced boolean expression language)、ahdl(altera hardware descriptionlanguage)、confluence、cupl(cornell university programming language)、hdcal、jhdl(java hardware description language)、lava、lola、myhdl、palasm、rhdl(rubyhardware description language)等,目前最普遍使用的是vhdl(very-high-speedintegrated circuit hardware description language)与verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
170.控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(application specific integrated circuit,asic)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc 625d、atmel at91sam、microchip pic18f26k20以及silicone labs c8051f320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
171.上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何
设备的组合。
172.为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
173.本领域内的技术人员应明白,本说明书实施例可提供为方法、系统、或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
174.本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
175.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
176.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
177.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
178.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
179.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带式磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
180.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要
素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
181.本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
182.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
183.最后应说明的是:本发明实施例公开的一种基于多模型的信用数据处理方法及装置所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1