本申请属于数据处理,尤其涉及一种数据项的同类项确定方法、装置、电子设备及存储介质。
背景技术:
1、随着综合金融服务系统的逐步发展,数据仓库的粒度模型应用越来越广泛。
2、粒度模型的出发点是对数据进行整合,将各个系统或者应用中的数据以整个企业全局的角度按粒度进行整合,并进行数据项的合并同类项处理。但相关技术中存在数据项的同类项确定的准确性较低的问题。
技术实现思路
1、本申请实施例提供一种数据项的同类项确定方法、装置、电子设备及存储介质,能够提高数据项的同类项确定的准确性。
2、第一方面,本申请实施例提供一种数据项的同类项确定方法,包括:
3、获取同一粒度下至少两个目标数据项;
4、针对至少两个目标数据项中的各个目标数据项,确定目标业务口径说明,得到目标业务口径说明集;
5、根据目标业务口径说明集和至少两个目标数据项分别对应的数据项信息,确定至少两个目标数据项之间的目标相似度;
6、在目标相似度大于相似度阈值的情况下,确定至少两个目标数据项为同类项。
7、在一些可选的实施方式中,针对至少两个目标数据项中的各个目标数据项,确定目标业务口径说明,得到目标业务口径说明集,包括:
8、针对至少两个目标数据项中的各个目标数据项,进行溯源处理,得到加工口径集,溯源处理用于确定至少两个目标数据项中的各个目标数据项的加工口径;
9、根据加工口径集,确定目标业务口径说明集。
10、在一些可选的实施方式中,根据加工口径集,确定目标业务口径说明集,包括:
11、将加工口径集中的各个加工口径,分别输入模型工具,得到目标业务口径说明集;
12、其中,模型工具通过选取加工口径集的目标贴源表,维护加工口径集中的各个加工口径,得到目标业务口径说明集。
13、在一些可选的实施方式中,根据目标业务口径说明集和至少两个目标数据项分别对应的数据项信息,确定至少两个目标数据项之间的目标相似度,包括:
14、根据第一相似度和第二相似度,确定至少两个目标数据项之间的目标相似度;
15、其中,第一相似度为目标业务口径说明集中各个目标业务口径说明之间的相似度,第二相似度为至少两个目标数据项分别对应的数据项信息之间的相似度。
16、在一些可选的实施方式中,根据第一相似度和第二相似度,确定至少两个目标数据项之间的目标相似度,包括:
17、将第一相似度与第一权重值的乘积,与第二相似度与第二权重值之间的乘积之和,确定为至少两个目标数据项之间的目标相似度;
18、其中,第一权重值为目标业务口径说明对应的权重值,第二权重值为数据项信息对应的权重值。
19、在一些可选的实施方式中,根据目标业务口径说明集和至少两个目标数据项分别对应的数据项信息,确定至少两个目标数据项之间的目标相似度之后,方法还包括:
20、在目标相似度大于相似度阈值的情况下,展示至少两个目标数据项。
21、第二方面,本申请实施例提供了一种数据项的同类项确定装置,包括:
22、获取模块,用于获取同一粒度下至少两个目标数据项;
23、第一确定模块,用于针对至少两个目标数据项中的各个目标数据项,确定目标业务口径说明,得到目标业务口径说明集;
24、第二确定模块,用于根据目标业务口径说明集和至少两个目标数据项分别对应的数据项信息,确定至少两个目标数据项之间的目标相似度;
25、第三确定模块,用于在目标相似度大于相似度阈值的情况下,确定至少两个目标数据项为同类项。
26、第三方面,本申请实施例提供了一种电子设备,设备包括:
27、处理器以及存储有计算机程序指令的存储器;
28、所述处理器执行计算机程序指令时实现如第一方面的数据项的同类项确定方法。
29、第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面的数据项的同类项确定方法。
30、第五方面,本申请实施例提供了一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行如第一方面的数据项的同类项确定方法。
31、根据本申请实施例提供的数据项的同类项确定方法、装置、电子设备及存储介质,首先获取同一粒度下至少两个目标数据项;然后可以针对至少两个目标数据项中的各个目标数据项,确定目标业务口径说明,得到目标业务口径说明集;接着可以根据目标业务口径说明集和至少两个目标数据项分别对应的数据项信息,确定至少两个目标数据项之间的目标相似度;最后在目标相似度大于相似度阈值的情况下,可以确定至少两个目标数据项为同类项。也就是说,本申请实施例通过目标业务口径说明集和至少两个目标数据项分别对应的数据项信息,确定至少两个目标数据项之间的目标相似度,进而可以根据目标相似度确定至少两个目标数据项是否为同类项,能够提高数据项的同类项确定的准确性。
1.一种数据项的同类项确定方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述针对所述至少两个目标数据项中的各个目标数据项,确定目标业务口径说明,得到目标业务口径说明集,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述加工口径集,确定目标业务口径说明集,包括:
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标业务口径说明集和所述至少两个目标数据项分别对应的数据项信息,确定所述至少两个目标数据项之间的目标相似度,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据第一相似度和第二相似度,确定所述至少两个目标数据项之间的目标相似度,包括:
6.根据权利要求1所述的方法,其特征在于,所述根据所述目标业务口径说明集和所述至少两个目标数据项分别对应的数据项信息,确定所述至少两个目标数据项之间的目标相似度之后,所述方法还包括:
7.一种数据项的同类项确定装置,其特征在于,包括:
8.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-6任意一项所述的数据项的同类项确定方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,所述电子设备执行如权利要求1-6任意一项所述的数据项的同类项确定方法。