风险检测方法、装置、设备、存储介质及产品与流程

文档序号:32389714发布日期:2022-11-30 07:44阅读:49来源:国知局
风险检测方法、装置、设备、存储介质及产品与流程

1.本发明实施例涉及人工智能技术领域,尤其涉及一种风险检测方法、装置、设备、存储介质及产品。


背景技术:

2.银行等金融机构在处理信贷等相关业务时,通常涉及到担保公司,为了保证业务安全性,需要对担保公司进行风险评估。
3.目前,针对担保公司的风险评估通常由人工完成,而担保公司通常经营范围广泛,且业务品种繁多,导致存在数据信息量大以及数据关联复杂等情况,人工评估的效率低下,且准确度低,难以保证业务的处理效率以及安全性。


技术实现要素:

4.本发明实施例提供一种风险检测方法、装置、设备、存储介质及产品,可以实现采用人工智能方式自动进行风险检测。
5.第一方面,本发明实施例提供了一种风险检测方法,包括:
6.获取目标检测对象对应的往期特征和当期采集数据,其中,所述采集数据包括针对所述目标检测对象从预设数据系统获取的关联数据,所述往期特征包括基于第一预设决策树模型对所述目标检测对象对应的往期采集数据进行处理后得到的特征;
7.基于第二预设决策树模型对所述当期采集数据进行处理,得到当期特征;
8.对所述往期特征和所述当期特征进行加权处理,并根据加权处理结果确定待输入特征;
9.将所述待输入特征输入至预设风险检测模型,根据所述预设风险检测模型的输出数据确定所述目标检测对象对应的风险检测结果,其中,所述预设风险检测模型包括基于神经网络模型训练得到的用于进行风险检测的模型。
10.第二方面,本发明实施例还提供了一种风险检测装置,该装置包括:
11.数据获取模块,用于获取目标检测对象对应的往期特征和当期采集数据,其中,所述采集数据包括针对所述目标检测对象从预设数据系统获取的关联数据,所述往期特征包括基于第一预设决策树模型对所述目标检测对象对应的往期采集数据进行处理后得到的特征;
12.当期采集数据处理模块,用于基于第二预设决策树模型对所述当期采集数据进行处理,得到当期特征;
13.加权处理模块,用于对所述往期特征和所述当期特征进行加权处理,并根据加权处理结果确定待输入特征;
14.风险检测模块,用于将所述待输入特征输入至预设风险检测模型,根据所述预设风险检测模型的输出数据确定所述目标检测对象对应的风险检测结果,其中,所述预设风险检测模型包括基于神经网络模型训练得到的用于进行风险检测的模型。
15.第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的风险检测方法。
16.第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的风险检测方法。
17.第五方面,本发明实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本发明实施例中任一所述的风险检测方法。
18.本发明实施例中,获取目标检测对象对应的往期特征和当期采集数据,采集数据包括针对目标检测对象从预设数据系统获取的关联数据,往期特征包括基于第一预设决策树模型对目标检测对象对应的往期采集数据进行处理后得到的特征,基于第二预设决策树模型对当期采集数据进行处理,得到当期特征,对往期特征和当期特征进行加权处理,并根据加权处理结果确定待输入特征,将待输入特征输入至预设风险检测模型,根据预设风险检测模型的输出数据确定目标检测对象对应的风险检测结果,其中,预设风险检测模型包括基于神经网络模型训练得到的用于进行风险检测的模型。通过采用上述技术方案,将利用决策树模型分别对往期采集数据和当期采集数据进行处理得到的往期特征和当期特征进行加权处理,并将加权处理结果输入到基于神经网络模型训练得到的用于进行风险检测的模型中,进行自动风险预测,可以充分考虑目标检测对象的历史风险特征,提高风险预测的准确度。
附图说明
19.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
20.图1为本发明实施例提供的一种风险检测方法的流程图;
21.图2为本发明实施例提供的另一种风险检测方法的流程图;
22.图3为本发明实施例提供的另一种风险检测过程示意图;
23.图4为本发明实施例所提供的一种风险检测装置的结构示意图;
24.图5是实现本发明实施例的风险检测方法的电子设备的结构示意图。
具体实施方式
25.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
26.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。本技术技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
27.为了便于理解本发明实施例的技术方案,下面对相关内容进行介绍。本发明实施
例中的检测对象可以包括金融业务中可能存在风险因素的主体,例如可以包括担保公司,还可包括如存在借贷需求的公司或用户等,以下以担保公司为例进行说明。由于担保公司经营范围广泛且业务品种繁多,导致存在相关的数据信息量大,以及数据关联情况复杂的特点。存在风险检测需求的主体(如商业银行)在处理检测对象相关业务时,需要对检测对象是否存在潜在风险进行检测,现有针对担保公司风险监测的相关功能模块较为简单,存在风险检测需求的主体中的工作人员(如客户经理),需要收集担保公司相应材料信息,通过指定的合法的具备访问权限的数据系统(如中国人民银行征信系统)查询担保公司的征信数据,对数据获取不够全面,数据来源和数据指标单一,数据可视化展示效果差,无法给客户经理提供有效的风险提示信息,客户经理需要根据查询到的征信数据根据个人经验人工判断担保公司是否存在风险,以便决定相应业务是否能够开展,效率低下且受主观因素影响较大,难以量化,准确度低。
28.本发明实施例中,提供了基于人工智能的自动风险检测方案,可以高效准确地对检测对象进行风险检测,如对上述举例的担保公司进行自动风险检测。
29.图1为本发明实施例提供的一种风险检测方法的流程图,本公开实施例适用于对检测对象进行风险检测的情形,该方法可以由风险检测装置来执行,该装置可以通过软件和/或硬件的形式实现,可选的,通过电子设备来实现,该电子设备可以是个人计算机(personal computer,pc)端或服务器等设备。
30.如图1所示,所述方法包括:
31.步骤101、获取目标检测对象对应的往期特征和当期采集数据,其中,采集数据包括针对目标检测对象从预设数据系统获取的关联数据,往期特征包括基于第一预设决策树模型对目标检测对象对应的往期采集数据进行处理后得到的特征。
32.示例性的,目标检测对象可理解为当前需要进行风险检测的对象,例如可包括目标担保公司,所需检测的风险可以包括违约风险或信用风险等。采集数据包括针对目标检测对象从预设数据系统获取的关联数据,其中,预设数据系统例如可以包括中国人民银行征信系统。关联数据可包括能够用于对目标检测对象进行风险评估的数据,如目标检测对象的属性数据、经营状况数据、业务往来数据、与其他检测对象或关联对象的关联关系数据或交互数据等等。
33.可选的,以检测对象包括担保公司为例,所述关联数据包括担保公司的征信信息、担保公司与被担保对象的关系信息、被担保对象的征信信息、以及存在风险检测需求的主体的业务处理能力信息。这样设置的好处在于,可以获取到更加全面的数据,提高预设决策树模型提取特征的丰富程度,进而提升预设风险检测模型输出结果的准确度。
34.示例性的,可采用预设周期针对目标检测对象从预设数据系统周期性地获取关联数据,得到采集数据,预设周期例如1个月或1周等。往期采集数据可理解为历史周期内采集的关联数据,当期采集数据可理解为当前周期内采集的关联数据,其中,往期采集数据可包括多个历史周期内采集的关联数据。例如,预设周期例如1个月,当前为9月,往期采集数据可包括3月至8月采集的关联数据,当期采集数据包括9月采集的关联数据。
35.示例性的,本发明实施例中的预设决策树模型可包括轻量梯度提升机(light gradient boosting machine,lightgbm)模型。第一预设决策树模型可以是利用往期样本采集数据对第一决策树模型进行训练得到的模型。下文中的第二预设决策树模型可以是利
用当期样本采集数据对第二决策树模型进行训练得到的模型。其中,第一决策树模型和第二决策树模型可以相同或不同,具体不做限定。
36.其中,lightgbm是基于histogrm的决策树算法,利用直方图寻找最优点分割点,将特征离散化统计形成宽度为箱数的直方图,将每个箱当作索引,在样本遍历时使用带深度限制的按叶子生长算法便于寻找最佳分裂点,同时还可利用直方图做差加速,可控制树的深度为4,避免过拟合。通过采用lightgbm模型,可有效控制时间复杂度和计算量,减少对电子设备的内存消耗,可提升风险检测效率以及进行风险检测的电子设备的性能。
37.示例性的,往期特征的表现形式可以是特征矩阵。在基于第一预设决策树模型对目标检测对象对应的往期采集数据进行处理的过程中,也即,将往期采集数据输入至第一预设决策树模型中进行计算后,第一预设决策树模型的输出结果可以是存在风险的概率值,而第一预设决策树模型还可以输出一些中间特征数据,可将中间特征数据作为往期特征。
38.可选的,本步骤可包括:判断是否存在目标检测对象对应的往期特征,若存在,则获取所述往期特征;若不存在,则获取目标检测对象对应的往期采集数据,基于第一预设决策树模型对往期采集数据进行处理,得到往期特征;获取目标检测对象对应的当期采集数据。这样设置的好处在于,对于已经存在的往期特征,可以直接获取,减少数据处理操作,提升风险检测效率。
39.步骤102、基于第二预设决策树模型对当期采集数据进行处理,得到当期特征。
40.示例性的,当期特征的表现形式可以是特征矩阵。在基于第二预设决策树模型对目标检测对象对应的当期采集数据进行处理的过程中,也即,将当期采集数据输入至第二预设决策树模型中进行计算后,第二预设决策树模型的输出结果可以是存在风险的概率值,而第二预设决策树模型还可以输出一些中间特征数据,可将中间特征数据作为当期期特征。
41.步骤103、对往期特征和当期特征进行加权处理,并根据加权处理结果确定待输入特征。
42.示例性的,随着时间的推移,目标检测对象的相关情况不是一成不变的,可以通过往期特征来体现目标检测对象的风险偏好特征,将往期特征加权到当期特征中,可以提升风险情况的检测准确度。其中,加权处理方式不做限定,可以根据实际需求设定相应的权重系数或权重矩阵等。
43.步骤104、将待输入特征输入至预设风险检测模型,根据预设风险检测模型的输出数据确定目标检测对象对应的风险检测结果,其中,预设风险检测模型包括基于神经网络模型训练得到的用于进行风险检测的模型。
44.示例性的,用于训练得到预设风险检测模型的神经网络模型可以包括卷积神经网络(convolutional neural networks,cnn)模型或深度神经网络(deep neural networks,dnn)模型等等,具体的网络结构不做限定。
45.可选的,神经网络模型包括包含三个隐藏层的dnn,相比浅层建模方式能够更细致高效的表示复杂非线性问题,控制隐藏层为三层,可避免大幅度提升算法运算量。可选的,在该神经网络模型中,可采用relu函数进行非线性变化;还可在模型中引入dropout方法来提高模型的泛化能力。
46.示例性的,预设风险检测模型的输出数据可以是以概率形式表示的风险值,风险结果可以是该风险值,还可以是根据风险值所处的风险值范围确定相应的风险等级等。
47.本发明实施例提供的风险检测方法,获取目标检测对象对应的往期特征和当期采集数据,采集数据包括针对目标检测对象从预设数据系统获取的关联数据,往期特征包括基于第一预设决策树模型对目标检测对象对应的往期采集数据进行处理后得到的特征,基于第二预设决策树模型对当期采集数据进行处理,得到当期特征,对往期特征和当期特征进行加权处理,并根据加权处理结果确定待输入特征,将待输入特征输入至预设风险检测模型,根据预设风险检测模型的输出数据确定目标检测对象对应的风险检测结果,其中,预设风险检测模型包括基于神经网络模型训练得到的用于进行风险检测的模型。通过采用上述技术方案,将利用决策树模型分别对往期采集数据和当期采集数据进行处理得到的往期特征和当期特征进行加权处理,并将加权处理结果输入到基于神经网络模型训练得到的用于进行风险检测的模型中,进行自动风险预测,可以充分考虑目标检测对象的历史风险特征,提高风险预测的准确度。
48.在一些实施例中,所述对所述往期特征和所述当期特征进行加权处理,包括:基于注意力加权方式,对所述往期特征和所述当期特征进行加权处理。这样设置的好处在于,可以提高加权处理速度和效果,节省电子设备算力。
49.在一些实施例中,所述加权处理结果的表现形式为高维稀疏矩阵,所述根据加权处理结果确定待输入特征,包括:对所述加权处理结果进行嵌入处理,得到表现形式为低维稠密矩阵的待输入特征。这样设置的好处在于,将高维稀疏矩阵进行embedding成低维稠密矩阵,可避免数据过拟合和提升分类结果。
50.在一些实施例中,所述检测对象包括担保公司,该方法还包括:利用广度优先搜索算法,对所述当期采集数据中包含的目标检测对象与被担保对象的关系信息进行检索,生成以目标检测对象为核心的关系图谱;对所述风险检测结果和所述关系图谱进行关联展示。这样设置的好处在于,提升数据可视化程度,清晰刻画企业间的担保关系情况,帮助相关人员结合风险检测结果和关系图谱进行更加高效准确的风险评估。
51.图2为本发明实施例提供的另一种风险检测方法的流程图,本发明实施例在上述各可选方案基础上进行优化,图3为本发明实施例提供的另一种风险检测过程示意图,可结合图3进行理解。如图2所示,该方法包括:
52.步骤201、获取目标检测对象对应的往期特征和当期采集数据,其中,采集数据包括针对目标检测对象从预设数据系统获取的关联数据,往期特征包括基于第一预设决策树模型对目标检测对象对应的往期采集数据进行处理后得到的特征。
53.示例性的,以检测对象包括担保公司为例,存在风险检测需求的主体包括银行(以下称当前银行)。采集数据例如可以包括但不限于如下特征数据(需要说明的是,在获取、存储、使用和处理如下数据时,均符合国家法律法规的相关规定):担保公司标识(id)、担保公司名称、担保关系企业数、相关还款责任金额、客户净资产、五级分类是否存在不良、对方企业净资产、客户规模等级、信贷杠杆倍数、对外担保倍数、当前银行信贷客户数、其他银行信贷客户数、当前银行客户被担保金额、其他银行客户被担保金额、不良客户数量、不良或存在欠息垫款逾期的当前银行客户数、人行信贷余额、人行信用余额、人行贷款余额、人行不良余额、人行正常类贷款余额、人行关注类贷款余额、人行次级类贷款余额、人行可疑类贷
款余额、人行损失类贷款余额、人行正常类信用余额、人行关注类信用余额、人行次级类信用余额、人行可疑类信用余额、人行损失类信用余额、人行正常类信贷余额、人行关注类信贷余额、人行次级类信贷余额、人行可疑类信贷余额、人行损失类信贷余额、人行欠息余额、人行逾期余额、人行垫款余额、拨备总额、当前银行信贷余额、当前银行信用余额、当前银行贷款余额、当前银行不良余额、当前银行正常类贷款余额、当前银行关注类贷款余额、当前银行次级类贷款余额、当前银行可疑类贷款余额、当前银行损失类贷款余额、当前银行正常类信用余额、当前银行关注类信用余额、当前银行次级类信用余额、当前银行可疑类信用余额、当前银行损失类信用余额、当前银行正常类信贷余额、当前银行关注类信贷余额、当前银行次级类信贷余额、当前银行可疑类信贷余额、当前银行损失类信贷余额、当前银行保证信贷余额、当前银行保证信用余额、当前银行保证贷款余额以及当前银行不良余额等。
54.可选的,在获取到采集数据后,可对采集数据进行数据清洗和数据预处理等操作,可加快海量数据的处理速度。用于输入至预设决策树模型的往期采集数据和当期采集数据可以是经过上述数据清洗和数据预处理等操作后的采集数据。
55.步骤202、基于第二预设决策树模型对当期采集数据进行处理,得到当期特征。
56.步骤203、基于注意力加权方式,对往期特征和当期特征进行加权处理,得到加权处理结果。
57.可选的,基于注意力加权方式,对所述往期特征和所述当期特征进行加权处理,包括:
58.基于如下表达式,对所述往期特征和所述当期特征进行加权处理:
[0059][0060]
其中,yu表示注意力加权后的特征表达,f()表示注意力加权处理函数,xi表示往期特征,xa为表示当期特征,g表示线性权重矩阵,i表示往期序号,n表示往期期数。
[0061]
这样设置的好处在于,基于注意力加权方式,利用线性权重矩阵将往期特征加权到当期特征中,有效提升风险情况的检测准确度。
[0062]
步骤204、对加权处理结果进行嵌入处理,得到表现形式为低维稠密矩阵的待输入特征。
[0063]
步骤205、将待输入特征输入至预设风险检测模型,根据预设风险检测模型的输出数据确定目标检测对象对应的风险检测结果。
[0064]
可选的,所述预设决策树模型和所述预设风险检测模型通过以下方式中的1)至6)训练得到,可提高模型训练效率和准确度。
[0065]
1)获取样本检测对象对应的往期样本采集数据和当期样本采集数据,其中,所述样本采集数据包括针对所述样本检测对象从所述预设数据系统获取的关联数据,所述往期样本采集数据关联有往期风险标签,所述当期样本采集数据关联有当期风险标签;
[0066]
其中,样本采集数据中包括的特征数据的类别可以与上述采集数据中的类别相同,此处不再赘述。在获取到样本采集数据后,可对样本采集数据进行预处理。示例性的,对初始获取的数据集进行预处理,主要包括对获得的数据进行缺失值和异常值处理。统计数据集中每个数据特征中数据缺失的比例,当该数据特征缺失的占比达到预设比例阈值(如
60%)时,数据预处理时将该数据特征的权重置为0,如果占比在预设比例阈值以内,则将缺失数据填充为0进行特征学习。由于特征大部分为金额类型,主要的异常值为负值,针对这部分负值数据置为0。
[0067]
示例性的,风险标签可以是0-1之间的风险率。从0到1,随着数值的增大,表明该担保公司存在更大的违约概率。
[0068]
可选的,所述往期样本采集数据关联的往期风险标签通过以下方式中确定:获取所述往期样本采集数据对应的初始往期风险标签,其中,所述初始往期风险标签根据由预设数量的目标用户基于所述往期样本采集数据确定的风险值的平均值确定;根据所述往期样本采集数据对应的当期样本采集数据,对所述初始往期风险标签进行调整,得到所述往期样本采集数据关联的往期风险标签。这样设置的好处在于,根据当前实际情况对初始往期风险标签进行校正,可以更加精确地对样本进行标注。
[0069]
示例性的,目标用户可以包括风险经理或客户经理,例如由3位风险经理分别进行标记作为样本检测对象的担保公司的风险率,然后计算平均值,得到初始往期风险标签。随后,可以跟踪作为样本检测对象的担保公司后续实际的风险情况对初始往期风险标签进行校正,如根据对应的当期样本采集数据,对初始往期风险标签进行调整。
[0070]
可选的,所述根据所述往期样本采集数据对应的当期样本采集数据,对所述初始往期风险标签进行调整,得到所述往期样本采集数据关联的往期风险标签,包括:在所述往期样本采集数据对应的当期样本采集数据中,进行预设风险指标数据的查询;根据查询到的目标预设风险指标数据,确定对应的目标调整值;根据所述初始往期风险标签和所述目标调整值的和,确定所述往期样本采集数据关联的往期风险标签。这样设置的好处在于,可以自动对初始往期风险标签进行调整,提高样本标注效率。
[0071]
示例性的,预设风险指标数据可以包括逾期相关数据,可预先针对不同类型的预设风险指标数据设定对应的调整值,形成预设调整映射关系。当前在当期样本采集数据中查询到的预设风险指标数据可记为目标预设风险指标数据,根据目标预设风险指标数据查询预设调整映射关系,得到对应的目标调整值。可选的,若未查询到预设风险指标数据,则将初始往期风险标签确定为所述往期样本采集数据关联的往期风险标签。
[0072]
可选的,当期风险标签可根据由预设数量的目标用户基于所述当前样本采集数据确定的风险值的平均值确定。
[0073]
示例性的,获取样本检测对象的数量为多个,且包含目标检测对象。其中,在进行模型训练时,可构建往期样本集和当期样本集,往期样本集包括多个往期样本采集数据,当期样本集包括多个当期样本采集数据。将往期样本集和当期样本集分别按照比值(如7:3)进行划分为训练集和测试集,以进行模型训练和验证。
[0074]
2)将所述往期样本采集数据输入至第一决策树模型,得到第一样本输出结果,并提取第一中间处理结果作为样本往期特征;
[0075]
3)将所述当期样本采集数据输入至第二决策树模型,得到第二样本输出结果,并提取第二中间处理结果作为样本当期特征;
[0076]
4)对所述样本往期特征和所述当期特征进行加权处理,并根据加权处理结果确定样本待输入特征;
[0077]
示例性的,这里的加权处理方式,可以与对往期特征和当期特征的加权处理方式
一致,如基于注意力加权方式进行加权处理。
[0078]
5)将所述样本待输入特征输入至神经网络模型,得到第三样本输出结果;
[0079]
6)利用所述第一样本输出结果、所述第二样本输出结果、所述往期风险标签、所述当期风险标签、以及所述第三样本输出结果,对所述第一决策树模型、第二决策树模型和所述神经网络模型进行训练,并根据训练结果确定所述第一预设决策树模型、第二预设决策树模型和所述预设风险检测模型。
[0080]
可选的,6)可包括:根据所述第一样本输出结果和所述往期风险标签计算第一损失关系;根据所述第二样本输出结果和所述当期风险标签计算第二损失关系;根据所述第三样本输出结果和所述当期风险标签计算第三损失关系;根据所述第一损失关系、所述第二损失关系和所述第三损失关系确定目标损失关系;利用所述目标损失关系对所述第一决策树模型、第二决策树模型和所述神经网络模型进行调整,并根据调整结果确定所述第一预设决策树模型、第二预设决策树模型和所述预设风险检测模型。这样设置的好处在于,合理确定用于模型训练的损失关系,提高训练效果。
[0081]
其中,各损失关系可以理解为依据损失函数计算得到的损失值。所选用的损失函数具体不做限定,例如可以是交叉熵损失等。可选的,根据第一损失关系、第二损失关系和第三损失关系的加权和,确定目标损失关系。
[0082]
步骤206、利用广度优先搜索算法,对当期采集数据中包含的目标检测对象与被担保对象的关系信息进行检索,生成以目标检测对象为核心的关系图谱。
[0083]
可选的,通过批量处理任务进行金融指标计算、中间结果数据表加工以及企业担保关系搜索等,便于快速输出后续的风险检测结果和关系图谱。
[0084]
步骤207、对风险检测结果和关系图谱进行关联展示。
[0085]
示例性的,在确定风险检测结果中的风险值或风险等级较高时,输出风险提示信息,以对相关人员或系统进行及时有效的提醒。关联图谱可帮助相关人员快速进行风险排查,可采用不同分布方式的图谱展示功能,如排斥分布、阶梯分布以及同心圆分布等。其中,可在用户界面中对风险检测结果和关系图谱进行关联展示。
[0086]
可选的,还可在用户界面中进行用户权限管理,不同用户可查看的内容可以依据所具有的权限而有所不同。可选的,还在用户界面中,对相关金融指标进行展示,以进一步辅助风险评估。
[0087]
本发明实施例提供的风险检测方法,可以充分采集多种维度的数据,依靠往期采集的和当期采集的担保公司相关信息,有效利用数据特征之间的非线性关系,充分挖掘风险预警信息,提升担保公司智能风险检测的分类预测结果,减少人为判断的局限性和行为偏好,并以关系图谱形式展示企业之间的担保关系,使得检测结果更加直观,便于应用。
[0088]
图4为本发明实施例所提供的一种风险检测装置的结构示意图,如图4所示,所述装置包括:
[0089]
数据获取模块401,用于获取目标检测对象对应的往期特征和当期采集数据,其中,所述采集数据包括针对所述目标检测对象从预设数据系统获取的关联数据,所述往期特征包括基于第一预设决策树模型对所述目标检测对象对应的往期采集数据进行处理后得到的特征;
[0090]
当期采集数据处理模块402,用于基于第二预设决策树模型对所述当期采集数据
进行处理,得到当期特征;
[0091]
加权处理模块403,用于对所述往期特征和所述当期特征进行加权处理,并根据加权处理结果确定待输入特征;
[0092]
风险检测模块404,用于将所述待输入特征输入至预设风险检测模型,根据所述预设风险检测模型的输出数据确定所述目标检测对象对应的风险检测结果,其中,所述预设风险检测模型包括基于神经网络模型训练得到的用于进行风险检测的模型。
[0093]
本发明实施例提供的风险检测装置,获取目标检测对象对应的往期特征和当期采集数据,采集数据包括针对目标检测对象从预设数据系统获取的关联数据,往期特征包括基于第一预设决策树模型对目标检测对象对应的往期采集数据进行处理后得到的特征,基于第二预设决策树模型对当期采集数据进行处理,得到当期特征,对往期特征和当期特征进行加权处理,并根据加权处理结果确定待输入特征,将待输入特征输入至预设风险检测模型,根据预设风险检测模型的输出数据确定目标检测对象对应的风险检测结果,其中,预设风险检测模型包括基于神经网络模型训练得到的用于进行风险检测的模型。通过采用上述技术方案,将利用决策树模型分别对往期采集数据和当期采集数据进行处理得到的往期特征和当期特征进行加权处理,并将加权处理结果输入到基于神经网络模型训练得到的用于进行风险检测的模型中,进行自动风险预测,可以充分考虑目标检测对象的历史风险特征,提高风险预测的准确度。
[0094]
可选的,所述加权处理模块具体用于:
[0095]
基于注意力加权方式,对所述往期特征和所述当期特征进行加权处理。
[0096]
可选的,所述加权处理模块具体用于:
[0097]
基于如下表达式,对所述往期特征和所述当期特征进行加权处理:
[0098][0099]
其中,yu表示注意力加权后的特征表达,f()表示注意力加权处理函数,xi表示往期特征,xa为表示当期特征,g表示线性权重矩阵,i表示往期序号,n表示往期期数。
[0100]
可选的,加权处理结果的表现形式为高维稀疏矩阵,所述加权处理模块包括:
[0101]
加权处理单元,用于对所述往期特征和所述当期特征进行加权处理;
[0102]
输入特征确定单元,用于对所述加权处理结果进行嵌入处理,得到表现形式为低维稠密矩阵的待输入特征。
[0103]
可选的,所述预设决策树模型和所述预设风险检测模型通过以下方式训练得到:
[0104]
获取样本检测对象对应的往期样本采集数据和当期样本采集数据,其中,所述样本采集数据包括针对所述样本检测对象从所述预设数据系统获取的关联数据,所述往期样本采集数据关联有往期风险标签,所述当期样本采集数据关联有当期风险标签;
[0105]
将所述往期样本采集数据输入至第一决策树模型,得到第一样本输出结果,并提取第一中间处理结果作为样本往期特征;
[0106]
将所述当期样本采集数据输入至第二决策树模型,得到第二样本输出结果,并提取第二中间处理结果作为样本当期特征;
[0107]
对所述样本往期特征和所述当期特征进行加权处理,并根据加权处理结果确定样
本待输入特征;
[0108]
将所述样本待输入特征输入至神经网络模型,得到第三样本输出结果;
[0109]
利用所述第一样本输出结果、所述第二样本输出结果、所述往期风险标签、所述当期风险标签、以及所述第三样本输出结果,对所述第一决策树模型、第二决策树模型和所述神经网络模型进行训练,并根据训练结果确定所述第一预设决策树模型、第二预设决策树模型和所述预设风险检测模型。
[0110]
可选的,所述利用所述第一样本输出结果、所述第二样本输出结果、所述往期风险标签、所述当期风险标签、以及所述第三样本输出结果,对所述第一决策树模型、第二决策树模型和所述神经网络模型进行训练,并根据训练结果确定所述第一预设决策树模型、第二预设决策树模型和所述预设风险检测模型,包括:
[0111]
根据所述第一样本输出结果和所述往期风险标签计算第一损失关系;
[0112]
根据所述第二样本输出结果和所述当期风险标签计算第二损失关系;
[0113]
根据所述第三样本输出结果和所述当期风险标签计算第三损失关系;
[0114]
根据所述第一损失关系、所述第二损失关系和所述第三损失关系确定目标损失关系;
[0115]
利用所述目标损失关系对所述第一决策树模型、第二决策树模型和所述神经网络模型进行调整,并根据调整结果确定所述第一预设决策树模型、第二预设决策树模型和所述预设风险检测模型。
[0116]
可选的,所述往期样本采集数据关联的往期风险标签通过以下方式确定:
[0117]
获取所述往期样本采集数据对应的初始往期风险标签,其中,所述初始往期风险标签根据由预设数量的目标用户基于所述往期样本采集数据确定的风险值的平均值确定;
[0118]
根据所述往期样本采集数据对应的当期样本采集数据,对所述初始往期风险标签进行调整,得到所述往期样本采集数据关联的往期风险标签。
[0119]
可选的,所述根据所述往期样本采集数据对应的当期样本采集数据,对所述初始往期风险标签进行调整,得到所述往期样本采集数据关联的往期风险标签,包括:
[0120]
在所述往期样本采集数据对应的当期样本采集数据中,进行预设风险指标数据的查询;
[0121]
根据查询到的目标预设风险指标数据,确定对应的目标调整值;
[0122]
根据所述初始往期风险标签和所述目标调整值的和,确定所述往期样本采集数据关联的往期风险标签。
[0123]
可选的,预设决策树模型包括轻量梯度提升机lightgbm模型,所述神经网络模型包括包含三个隐藏层的深度神经网络dnn。
[0124]
可选的,所述检测对象包括担保公司,所述关联数据包括担保公司的征信信息、担保公司与被担保对象的关系信息、被担保对象的征信信息、以及存在风险检测需求的主体的业务处理能力信息。
[0125]
可选的,该装置还包括:
[0126]
关系图谱生成模块,用于利用广度优先搜索算法,对所述当期采集数据中包含的目标检测对象与被担保对象的关系信息进行检索,生成以目标检测对象为核心的关系图谱;
[0127]
展示模块,用于对所述风险检测结果和所述关系图谱进行关联展示。
[0128]
图5示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
[0129]
如图5所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(rom)12、随机访问存储器(ram)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(rom)12中的计算机程序或者从存储单元18加载到随机访问存储器(ram)13中的计算机程序,来执行各种适当的动作和处理。在ram 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、rom 12以及ram 13通过总线14彼此相连。输入/输出(i/o)接口15也连接至总线14。
[0130]
电子设备10中的多个部件连接至i/o接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0131]
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如风险检测方法。
[0132]
在一些实施例中,风险检测方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由rom 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到ram 13并由处理器11执行时,可以执行上文描述的风险检测方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行风险检测方法。
[0133]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0134]
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被
实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0135]
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0136]
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0137]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
[0138]
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。
[0139]
本发明实施例还提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现如本技术任一实施例所提供的风险检测方法。
[0140]
计算机程序产品在实现的过程中,可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言,诸如java、smalltalk、c++,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0141]
上述实施例中提供的风险检测装置、设备、存储介质以及产品可执行本发明相应
实施例所提供的风险检测方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明相应实施例所提供的风险检测方法。
[0142]
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1