本发明涉及风险预测,尤其涉及一种基于图注意力机制的企业风险传导预测方法及系统。
背景技术:
1、随着知识图谱技术的发展,由于其特殊的关联关系结构特点,被大量应用于金融风控领域。但目前大部分方法仅以关联关系分析和查询最为主要的应用方案,无法充分发挥图结构在风险预测场景的能力。
技术实现思路
1、基于此,有必要针对上述问题,提出了一种基于图注意力机制的企业风险传导预测方法及系统。
2、本发明公开了一种基于图注意力机制的企业风险传导预测方法,所述方法包括:
3、获取若干企业与金融机构的交易数据,确定各企业与其他企业之间的交易关系;
4、以企业为实体,以交易关系为关系,构建各企业的交易知识图谱,所述实体的实体属性至少包括:企业基础信息,所述关系的关系属性至少包括:交易金额;
5、对所述实体属性进行属性扩充,扩充的属性至少包括:企业交易网点信息、企业行业及业务信息;
6、根据所述交易知识图谱中各条关系的交易金额,对各条关系终点的实体进行风险传导正、负样本标注,所述风险传导正样本为当关系起点的实体发生风险,具有传导风险的样本,所述风险传导负样本为当关系起点的实体发生风险,不具有传导风险的样本;
7、利用已标注风险传导正、负样本的交易知识图谱,对多头图注意力机制模型进行训练,并将训练完成的多头图注意力机制模型作为企业风险传导预测模型;
8、确定待预测传导风险的风险源企业;
9、获取所述风险源企业的交易知识图谱;
10、将所述风险源企业的交易知识图谱,输入至所述企业风险传导预测模型中,输出预测的具有传导风险的目标企业,并对所述目标企业发起风险预警。
11、进一步的,获取若干企业与金融机构的交易数据,确定各企业与其他企业之间的交易关系,具体包括:
12、获取各企业与金融机构的原始交易数据,并对所述原始交易数据进行清理,筛除无效交易数据,得到各企业与金融机构的处理后的交易数据;
13、根据各企业与金融机构的处理后的交易数据,确定各企业与金融机构的交易关系;
14、对各企业与金融机构的交易关系进行整合处理,确定各企业与其他企业之间的交易关系。
15、进一步的,根据所述交易知识图谱中各条关系的交易金额,对各条关系终点的实体进行风险传导正、负样本标注,具体包括:
16、根据所述交易知识图谱中各条关系的交易金额,计算交易金额均值;
17、将大于或等于所述交易金额均值的关系终点对应的实体作为风险传导正样本,小于所述交易金额均值的关系终点对应的实体作为风险传导负样本。
18、进一步的,利用已标注风险传导正、负样本的交易知识图谱,对多头图注意力机制模型进行训练,具体包括:
19、将已标注风险传导正、负样本的交易知识图谱输入多头图注意力机制模型,对所述交易知识图谱中各实体的实体属性进行编码拼接,构建各实体的实体特征;
20、根据各实体特征,按照以下公式,计算所述交易知识图谱中关系起点实体与各条关系终点实体之间的注意力权重:
21、
22、其中,表示企业i的交易知识图谱中关系起点实体i与第j条关系终点的注意力权重,表示关系起点实体i的实体特征,表示交易知识图谱中第j条关系终点实体的实体特征,w表示为多头图注意力机制模型的参数矩阵,向量a表示注意力核向量,σ表示leakyrelu激活函数;
23、根据所计算的注意力权重,按照以下公式,持续迭代更新所述交易知识图谱中关系起点实体的实体特征,直至预设损失函数收敛,完成对多头图注意力机制模型的训练:
24、
25、其中,表示更新后的关系起点实体的实体特征,k表示多头图注意力机制模型的注意力头数量。
26、进一步的,对所述交易知识图谱中各实体的实体属性进行编码拼接,构建各实体的实体特征,具体包括:
27、对所述交易知识图谱中各实体的实体属性中的企业基础信息进行独热编码以及全局归一化处理,得到各实体的基础信息特征;
28、对所述交易知识图谱中各实体的实体属性中的企业交易网点信息进行独热编码以及向量加和,得到各实体的交易网点特征;
29、对所述交易知识图谱中各实体的实体属性中的企业行业及业务信息进行bert模型向量转化,得到各实体的行业及业务特征;
30、将各实体的基础信息特征、各实体的交易网点特征、各实体的行业及业务特征进行向量拼接,得到各实体的实体特征。
31、进一步的,所述实体属性中的企业基础信息,具体包括:企业类型、企业注册地、企业注册资本、企业成立时间;
32、所述关系属性,还包括:交易时间、交易网点;
33、所述扩充的属性,还包括:交易信息,所述交易信息包括企业总交易次数、企业注册后年均交易次数、平均交易额度。
34、进一步的,在获取若干企业与金融机构的交易数据,确定各企业与其他企业之间的交易关系之前,还包括:
35、预设采样时间范围,获取预设采样时间范围内的若干企业与金融机构的交易数据,确定预设采样时间范围内的各企业与其他企业之间的交易关系。
36、另一方面,本发明公开了一种基于图注意力机制的企业风险传导预测系统,所述系统包括:
37、企业交易关系确定模块,用于获取若干企业与金融机构的交易数据,确定各企业与其他企业之间的交易关系;
38、交易知识图谱构建模块,用于以企业为实体,以交易关系为关系,构建各企业的交易知识图谱,所述实体的实体属性至少包括:企业基础信息,所述关系的关系属性至少包括:交易金额;
39、属性扩充模块,用于对所述实体属性进行属性扩充,扩充的属性至少包括:企业交易网点信息和/或企业行业及业务信息;
40、风险传导样本标注模块,用于根据所述交易知识图谱中各条关系的交易金额,对各条关系终点的实体进行风险传导正、负样本标注,所述风险传导正样本为当关系起点的实体发生风险,具有传导风险的样本,所述风险传导负样本为当关系起点的实体发生风险,不具有传导风险的样本;
41、训练模块,用于利用已标注风险传导正、负样本的交易知识图谱,对多头图注意力机制模型进行训练,并将训练完成的多头图注意力机制模型作为企业风险传导预测模型;
42、风险源企业确定模块,用于确定待预测传导风险的风险源企业;
43、风险源企业图谱获取模块,用于获取所述风险源企业的交易知识图谱;
44、预测模块,用于将所述风险源企业的交易知识图谱,输入至所述企业风险传导预测模型中,输出预测的具有传导风险的目标企业,并对所述目标企业发起风险预警。
45、另一方面,本发明公开了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
46、获取若干企业与金融机构的交易数据,确定各企业与其他企业之间的交易关系;
47、以企业为实体,以交易关系为关系,构建各企业的交易知识图谱,所述实体的实体属性至少包括:企业基础信息,所述关系的关系属性至少包括:交易金额;
48、对所述实体属性进行属性扩充,扩充的属性至少包括:企业交易网点信息、企业行业及业务信息;
49、根据所述交易知识图谱中各条关系的交易金额,对各条关系终点的实体进行风险传导正、负样本标注,所述风险传导正样本为当关系起点的实体发生风险,具有传导风险的样本,所述风险传导负样本为当关系起点的实体发生风险,不具有传导风险的样本;
50、利用已标注风险传导正、负样本的交易知识图谱,对多头图注意力机制模型进行训练,并将训练完成的多头图注意力机制模型作为企业风险传导预测模型;
51、确定待预测传导风险的风险源企业;
52、获取所述风险源企业的交易知识图谱;
53、将所述风险源企业的交易知识图谱,输入至所述企业风险传导预测模型中,输出预测的具有传导风险的目标企业,并对所述目标企业发起风险预警。
54、另一方面,本发明公开了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
55、获取若干企业与金融机构的交易数据,确定各企业与其他企业之间的交易关系;
56、以企业为实体,以交易关系为关系,构建各企业的交易知识图谱,所述实体的实体属性至少包括:企业基础信息,所述关系的关系属性至少包括:交易金额;
57、对所述实体属性进行属性扩充,扩充的属性至少包括:企业交易网点信息、企业行业及业务信息;
58、根据所述交易知识图谱中各条关系的交易金额,对各条关系终点的实体进行风险传导正、负样本标注,所述风险传导正样本为当关系起点的实体发生风险,具有传导风险的样本,所述风险传导负样本为当关系起点的实体发生风险,不具有传导风险的样本;
59、利用已标注风险传导正、负样本的交易知识图谱,对多头图注意力机制模型进行训练,并将训练完成的多头图注意力机制模型作为企业风险传导预测模型;
60、确定待预测传导风险的风险源企业;
61、获取所述风险源企业的交易知识图谱;
62、将所述风险源企业的交易知识图谱,输入至所述企业风险传导预测模型中,输出预测的具有传导风险的目标企业,并对所述目标企业发起风险预警。
63、采用本发明,具有如下有益效果:
64、1、本发明中,通过企业与金融机构的交易数据,确定企业之间的交易关系,并以交易关系构建企业交易知识图谱,基于交易知识图谱进行企业风险传导预测,其中,企业交易关系相比其他类型数据更能反映企业经营状态,更能真实准确地表征企业间的业务往来和经济依赖关系,进而为风险传导带来可靠依据,提升风险传导预测的精准度及可靠性;
65、2、本发明中,采用图注意力机制模型进行训练,能够有效地对图谱中各实体之间的具体结构关系进行系统学习,从而更加全面地考虑到实体结构关系方向差异对于后续风险传导预测的影响,且可以计算实体间的注意力参数,根据注意力参数学习考虑不同实体对同一实体或者同一实体对不同实体的影响力和重要性,进而更精准更有效地指导进行风险传导预测,构建准确度更高的风险传导预测模型;
66、3、本发明中,交易知识图谱中各实体的实体属性不仅包含企业基础信息,还将企业交易网点信息、企业行业及业务信息等多个维度的信息同样扩充进入实体属性考虑范围,其中企业交易网点信息可以进一步关联企业交易网点地域信息,隐含企业交易状况,反映企业经营状态,企业行业及业务信息可以有效反映企业的业务相关性,将这些实体属性转换为实体特征输入模型进行训练学习,并采用与特征考虑维度相同数量的多个注意力头,可以使得模型能够从多个维度不同方面学习实体的特征表示和影响因素,学习到更丰富的特征,从而得到更加完美精准的风险传导预测效果。