本技术涉及计算机,具体而言,本技术涉及一种集合识别方法、装置、设备、可读存储介质及程序产品。
背景技术:
1、现有技术中,针对金融风险控制过程中识别可疑对象,对象例如用户,往往基于专家规则对金融风险控制的相关数据进行分析,由于分析过程中采用人工经验,往往不能准确的识别金融风险控制针对的可疑对象,更不能识别多个可疑对象构建的集合,从而导致识别集合的效率较低和识别集合的准确度较低。
技术实现思路
1、本技术针对现有的方式的缺点,提出一种集合识别方法、装置、设备、计算机可读存储介质及计算机程序产品,用于解决如何提高集合识别的效率和准确度的问题。
2、第一方面,本技术提供了一种集合识别方法,包括:
3、获取针对风险控制的原始数据;
4、基于原始数据和预设的对象识别规则,确定待识别对象集合,并基于原始数据,确定知识图谱,知识图谱包括多个节点、多个节点中任意两个节点之间的边和任意两个节点之间的边的边权重,多个节点中每个节点用于表征一个对象,任意两个节点之间的边用于表征任意两个节点之间的关联关系;
5、基于待识别对象集合和知识图谱,确定多个第一特征向量,多个第一特征向量中每个第一特征向量用于表征待识别对象集合中任意两个待识别对象对应知识图谱中的边和知识图谱中的边的边权重,知识图谱中的边的边权重用于表征知识图谱中的边对应的评分;
6、基于多个第一特征向量和预设的集合规模区间,进行分团处理,确定多个集合,多个集合中每个集合包括待识别对象集合中的多个待识别对象;
7、基于多个集合和预设集合识别阈值,进行筛选处理,从多个集合中确定至少一个目标集合,至少一个目标集合中待识别对象为风险控制针对的目标对象。
8、在一个实施例中,获取针对金融风险控制的原始数据,包括:
9、获取预设时间段内的针对金融风险控制的原始数据,原始数据包括对象交易数据、对象属性数据和对象违规数据中的至少一项。
10、在一个实施例中,基于原始数据和预设的对象识别规则,确定待识别对象集合,包括:
11、针对任一对象,若任一对象的对象交易数据、任一对象的对象属性数据和任一对象的对象违规数据中至少一项满足预设的对象识别规则,则确定任一对象为待识别对象集合中的待识别对象。
12、在一个实施例中,基于原始数据,确定知识图谱,包括:
13、基于原始数据,确定多个节点中每个节点的节点属性和任意两个节点之间的边,每个节点的节点属性包括金融交易信息、对象基础信息、金融风险信息和对象的行为信息,任意两个节点之间的边用于表征任意两个节点之间的金融关系、非金融关系中至少一项;
14、将各边对应的特征向量输入至训练后的评分模型,得到各边对应的评分,并将各边对应的评分确定为各边的边权重。
15、在一个实施例中,在将各边对应的特征向量输入至训练后的评分模型,得到各边对应的评分之前,还包括:
16、基于各节点的节点属性包括的金融风险信息,确定多个正样本,多个正样本中每个正样本为知识图谱中任一边,任一边的两个节点的风险类型相同;
17、基于多个正样本、知识图谱中其他边和预设第一评分阈值,确定多个负样本,知识图谱中其他边不包括任一边;
18、基于各正样本对应的特征向量和各负样本对应的特征向量,对预设的评分模型进行训练,得到训练后的评分模型。
19、在一个实施例中,基于多个第一特征向量和预设的集合规模区间,进行分团处理,确定多个集合,包括:
20、基于多个第一特征向量,通过连通分量算法处理,确定初始集合;
21、基于初始集合和预设的集合规模区间,确定多个集合。
22、在一个实施例中,集合规模区间包括对象数量最大值和对象数量最小值,所述基于初始集合和预设的集合规模区间,确定多个集合,包括:
23、若初始集合中任一初始集合的对象数量大于对象数量最小值,且任一初始集合的对象数量小于对象数量最大值,则将任一初始集合确定为多个集合中的一个集合;
24、若初始集合中任一初始集合的对象数量等于对象数量最小值,或任一初始集合的对象数量等于对象数量最大值,则将任一初始集合确定为多个集合中的一个集合;
25、若初始集合中任一初始集合的对象数量大于对象数量最大值,则基于任一初始集合,进行裁剪处理,得到裁剪后的集合,并将裁剪后的集合确定为多个集合中的一个集合。
26、在一个实施例中,基于任一初始集合,进行裁剪处理,得到裁剪后的集合,包括:
27、基于任一初始集合,通过k核子图算法处理,从任一初始集合对应的无向图中得到核心度大于或等于预设第一阈值的子图;
28、从子图中确定入度大于或等于预设第二阈值或出度大于或等于预设第三阈值的多个节点,并将多个节点构建的无向图对应的集合确定为裁剪后的集合。
29、在一个实施例中,基于多个集合和预设集合识别阈值,进行筛选处理,从多个集合中确定至少一个目标集合,包括:
30、将多个集合中任一集合对应的特征向量输入至训练后的评分模型,得到任一集合的评分;
31、若任一集合的评分大于预设集合识别阈值,则将任一集合确定为目标集合。
32、在一个实施例中,在基于多个集合和预设集合识别阈值,进行筛选处理,从多个集合中确定至少一个目标集合之后,还包括:
33、将目标集合中任一待识别对象对应的特征向量输入至训练后的评分模型,得到任一待识别对象的评分;
34、若任一待识别对象的评分大于预设第二评分阈值,则将任一待识别对象确定为目标集合中核心对象。
35、第二方面,本技术提供了一种集合识别装置,包括:
36、第一处理模块,用于获取针对风险控制的原始数据;
37、第二处理模块,用于基于原始数据和预设的对象识别规则,确定待识别对象集合,并基于原始数据,确定知识图谱,知识图谱包括多个节点、多个节点中任意两个节点之间的边和任意两个节点之间的边的边权重,多个节点中每个节点用于表征一个对象,任意两个节点之间的边用于表征任意两个节点之间的关联关系;
38、第三处理模块,用于基于待识别对象集合和知识图谱,确定多个第一特征向量,多个第一特征向量中每个第一特征向量用于表征待识别对象集合中任意两个待识别对象对应知识图谱中的边和知识图谱中的边的边权重,知识图谱中的边的边权重用于表征知识图谱中的边对应的评分;
39、第四处理模块,用于基于多个第一特征向量和预设的集合规模区间,进行分团处理,确定多个集合,多个集合中每个集合包括待识别对象集合中的多个待识别对象;
40、第五处理模块,用于基于多个集合和预设集合识别阈值,进行筛选处理,从多个集合中确定至少一个目标集合,至少一个目标集合中待识别对象为金融风险控制针对的目标对象。
41、第三方面,本技术提供了一种电子设备,包括:处理器、存储器和总线;
42、总线,用于连接处理器和存储器;
43、存储器,用于存储操作指令;
44、处理器,用于通过调用操作指令,执行本技术第一方面的集合识别方法。
45、第四方面,本技术提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被用于执行本技术第一方面的集合识别方法。
46、第五方面,本技术提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现本技术第一方面中集合识别方法的步骤。
47、本技术实施例提供的技术方案,至少具有如下有益效果:
48、获取针对风险控制的原始数据;基于原始数据和预设的对象识别规则,确定待识别对象集合,并基于原始数据,确定知识图谱,知识图谱包括多个节点、多个节点中任意两个节点之间的边和任意两个节点之间的边的边权重,多个节点中每个节点用于表征一个对象,任意两个节点之间的边用于表征任意两个节点之间的关联关系;基于待识别对象集合和知识图谱,确定多个第一特征向量,多个第一特征向量中每个第一特征向量用于表征待识别对象集合中任意两个待识别对象对应知识图谱中的边和知识图谱中的边的边权重,知识图谱中的边的边权重用于表征知识图谱中的边对应的评分;基于多个第一特征向量和预设的集合规模区间,进行分团处理,确定多个集合,多个集合中每个集合包括待识别对象集合中的多个待识别对象;基于多个集合和预设集合识别阈值,进行筛选处理,从多个集合中确定至少一个目标集合,至少一个目标集合中待识别对象为风险控制针对的目标对象。如此,基于可疑规则集(对象识别规则),命中符合可疑规则集中规则的对象(待识别对象集合),即进行了第一次筛选,将不符合规则的对象筛除掉,提升了待识别对象集合的提取准确度;待识别对象集合结合构建的知识图谱,确定多个第一特征向量,第一特征向量为多维向量,即第一特征向量可以在分团中提供多个维度的参考依据;基于各第一特征向量提供的多个维度的参考依据,可以确定初始集合,提升了识别初始集合的准确度;通过集合规模区间,从初始集合中筛除掉不符集合规模的集合,即进行了第二次筛选,从初始集合中筛选得到多个集合,提高了分团的准确度;基于集合识别阈值,对多个集合进一步进行筛选,即进行了第三次筛选,得到更加准确的目标集合;通过上述多次筛选,提高了目标集合识别的准确度。