本发明涉及人工智能,可用于金融领域,尤其是一种用户群体预测模型的构建方法及用户群体预测方法。
背景技术:
1、针对银行问题账户的监测,现有技术方案多采用规则类或诸如xgboost等传统的机器学习模型进行账户结果标签的输出,抑或是单纯使用社区发现、知识图谱等技术,针对已有的问题账户关联得出与之联系的问题账户。传统的有监督模型难以发觉账户之间存在的关联关系,从而无法深入对问题账户组成的群体做出有效的判断。
技术实现思路
1、针对现有技术的上述问题,本说明书的目的在于,提供一种用户群体预测模型的构建方法及用户群体预测方法,以解决现有技术中无法深入对问题账户组成的群体做出有效的判断的问题。
2、为了解决上述技术问题,本说明书的具体技术方案如下:
3、一方面,本说明书提供一种用户群体预测模型的构建方法,包括:
4、获取黑样本以及白样本,其中所述黑样本以及所述白样本根据核验规则筛选用户账户得到;
5、获取所述黑样本以及所述白样本中所有用户账户的模型源数据;
6、对所述模型源数据进行特征处理,得到所有用户账户的特征数据;
7、使用所述模型源数据,令用户账户作为节点,用户账户与用户账户的交易关系作为边,构建交易网络;
8、将所述交易网络划分为若干社区,根据模块度选择划分完成的社区结构作为所述交易网络的标准社区结构;
9、根据所述标准社区结构内,每个标准社区中包含的节点数量作为社区特征;
10、将交易网络使用邻接矩阵表示,将邻接矩阵、所述交易网络对应的所述社区特征以及交易网络中每个节点的特征数据导入至预测模型中,对预测模型进行训练,得到训练完成的预测模型,其中,所述训练完成的预测模型的输入为用户账户的特征数据,输出为所述用户账户的标签以及所在社区。
11、作为本说明书的一个实施例,所述黑样本以及所述白样本根据核验规则筛选用户账户得到,进一步包括:
12、所述核验规则包括黑样本核验规则以及白样本核验规则,其中所述黑样本核验规则根据用户账户风险行为确定得到,所述白样本核验规则根据银行白名单机制确定得到;
13、在样本集中,使用所述黑样本核验规则以及所述白样本核验规则,分别选出至少一个样本作为黑样本,选出至少一个样本作为白样本。
14、作为本说明书的一个实施例,所述获取所述黑样本以及所述白样本中所有用户账户的模型源数据,进一步包括:
15、获取所述黑样本以及所述白样本中所有用户账户在时间窗口内的交易数据;
16、过滤所述交易数据中无交易对手数据;
17、选取过滤后交易次数超过交易数量阈值的用户账户的交易数据,作为所述模型源数据。
18、作为本说明书的一个实施例,所述对所述模型源数据进行特征处理,得到所有用户账户的特征数据集,进一步包括:
19、根据用户账户的交易统计情况、转入转出情况、每日交易情况、交易附言情况、行为情况和比率情况,得到该用户账户的所述模型源数据对应的特征数据集,其中,所述特征数据集包括统计数据、转入转出数据、平均每日数据、交易附言数据、特殊行为数据和比率数据。
20、作为本说明书的一个实施例,所述使用所述模型源数据,令用户账户作为节点,用户账户与用户账户的交易关系作为边,构建交易网络,进一步包括
21、使用所述模型源数据判断任意两个用户账户之间是否存在交易关系,若任意两个用户账户间存在交易关系,则任意两个用户账户对应的两个节点间存在边,若任意两个用户账户间不存在交易关系,则任意两个用户账户对应的两个节点间不存在边;
22、使用用户账户对应的节点以及节点间的边构建所述交易网络。
23、作为本说明书的一个实施例,所述使用节点以及节点间的边构建所述交易网络,进一步包括:
24、识别所述节点对应的用户账户是否为第三方支付主体,若为第三方支付主体,则将该节点删除;
25、将删除后的节点以及节点的边构建所述交易网络。
26、作为本说明书的一个实施例,所述将所述交易网络划分为若干社区,根据模块度选择划分完成的社区结构作为所述交易网络的标准社区结构,进一步包括:
27、将每个节点作为一个单独的社区,迭代后将所有节点合并得到社区结构;
28、使用模块度计算公式计算该交易网络当前的社区结构的模块度;
29、重复上述步骤,将迭代后模块度最高的社区结构作为所述交易网络的标准社区结构。
30、作为本说明书的一个实施例,所述使用模块度计算公式计算该交易网络当前的社区结构的模块度,进一步包括:
31、将划分社区的交易网络中带入至模块度计算公式中,得到交易网络当前的社区结构的模块度:
32、
33、其中,q为社区结构的模块度,aij表示i,j,连边的权重,ki=∑jaij表示连接到节点i的边的权重之和,δ(u,v)为示性函数,当i,j处在同一社区时返回1,否则返回0,为所有连边的权值之和。
34、作为本说明书的一个实施例,所述将交易网络使用邻接矩阵表示,将邻接矩阵、所述交易网络对应的所述社区特征以及交易网络中每个节点的特征数据导入至预测模型中,对预测模型进行训练,进一步包括:
35、将交易网络中每个节点依次进行标注,将标注后的序号按行列式展开,若任两个节点间存在边,则该行列式元素为1,若任两个节点间不存在边,则该行列式元素为0,依次进行判断后得到所述邻接矩阵,并与所述交易网络对应的所述社区特征以及交易网络中每个节点的特征数据,导入至所述预测模型进行多次迭代训练;
36、通过传播公式将所述邻接矩阵、所述交易网络对应的所述社区特征以及交易网络中每个节点的特征数据,在所述预测模型中依次传播,以调整卷积层中的模型参数,所述传播公式为:
37、
38、其中,i是单位矩阵,d是的度矩阵,h为每一卷积层的模型参数,若卷积层为输入层,h为交易网络中每个节点的特征数据,σ为激活函数;
39、当传播完成预测模型中所有的卷积层后,计算所述预测模型的损失函数,若损失函数满足预设损失阈值,则停止传播,得到所述训练完成的预测模型;若损失函数不满足预设损失阈值,则调整模型参数继续传播,直至得到所述训练完成的预测模型。
40、另一方面,本说明书还提供一种使用上述预测模型的用户群体预测方法,包括:
41、将用户账户的特征数据输入至训练完成的预测模型中,得到所述用户账户的标签以及所在社区,其中所述标签包括可疑或不可疑,所述社区包括风险社区或非风险社区。
42、另一方面,本说明书还提供一种用户群体预测模型的构建装置,包括:
43、样本获取单元,用于获取黑样本以及白样本,其中所述黑样本以及所述白样本根据核验规则筛选用户账户得到;
44、源数据确定单元,用于确定所述黑样本以及所述白样本中所有用户账户的模型源数据;
45、特征数据确定单元,用于对所述模型源数据进行特征处理,得到所有用户账户的特征数据;
46、网络构建单元,用于使用所述模型源数据,令用户账户作为节点,用户账户与用户账户的交易关系作为边,构建交易网络;
47、社区发现单元,用于将所述交易网络划分为若干社区,根据模块度选择划分完成的社区结构作为所述交易网络的标准社区结构;
48、社区标注单元,用于根据所述标准社区结构内,每个标准社区中包含的节点数量作为社区特征;
49、模型训练单元,用于将交易网络使用邻接矩阵表示,将邻接矩阵、所述交易网络对应的所述社区特征以及交易网络中每个节点的特征数据导入至预测模型中,对预测模型进行训练,得到训练完成的预测模型,其中,所述训练完成的预测模型的输入为用户账户的特征数据,输出为所述用户账户的标签以及所在社区。
50、另一方面,本说明书还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
51、另一方面,本说明书还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
52、采用上述技术方案,通过获取黑样本以及白样本,其中所述黑样本以及所述白样本根据核验规则筛选用户账户得到,可以实现获取不同用户类型对应的黑样本以及白样本;通过获取所述黑样本以及所述白样本中所有用户账户的模型源数据,可以实现获取黑样本以及白样本中所有用户账户的所有相关数据,并作为模型源数据参与预测模型训练;通过对所述模型源数据进行特征处理,得到所有用户账户的特征数据,可以实现表征每个用户账户个人行为的特征数据;通过使用所述模型源数据,令用户账户作为节点,用户账户与用户账户的交易关系作为边,构建交易网络,可以实现确定每个用户账户所关联的其他用户账户,进而搭建交易网络;通过将所述交易网络划分为若干社区,根据模块度选择划分完成的社区结构作为所述交易网络的标准社区结构,可以实现在交易网络中划分最具代表性的社区结构,作为当前该交易网络的标准社区结构;通过根据所述标准社区结构内,每个标准社区中包含的节点数量作为社区特征,可以实现确定当前社区结构下,每个社区中包含的黑名单用户数量,并在黑名单用户超过一定的比例时,将该社区作为风险社区;通过将交易网络使用邻接矩阵表示,将邻接矩阵、所述交易网络对应的所述社区特征以及交易网络中每个节点的特征数据导入至预测模型中,对预测模型进行训练,得到训练完成的预测模型,其中,所述训练完成的预测模型的输入为用户账户的特征数据,输出为所述用户账户的标签以及所在社区,可以实现使用邻接矩阵、所述交易网络对应的所述社区特征以及交易网络中每个节点的特征数据构建预测模型,该预测模型可以对用户群体进行预测,得到用户群体的风险程度以及用户群体中每个用户的标签。
53、为让本说明书的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。