本发明涉及数据检测,特别是指一种异常群体检测方法、装置、电子设备及可读存储介质。
背景技术:
1、目前,异常群体检测的技术方案主要采用聚类算法、社区发现算法以及时间相似度算法,各算法主要存在如下缺点:
2、聚类算法,不能将个体间建立起联系,对个体间的隐藏关系学习不到,不适合用于群体挖掘;
3、社区发现算法,会强行将每个个体都划分到一个群体中,但是疑似异常个体毕竟是少数人,不是所有的个体都要划分到群体中;
4、时间相似度算法,只考虑时间单维度,个体间相关性较弱,容易混入正常个体;
5、由于存在上述缺点,导致异常群体的挖掘结果不准确。
技术实现思路
1、本发明技术方案的目的是提供一种异常群体检测方法、装置、电子设备及可读存储介质,用以解决现有技术中异常群体的挖掘结果不准确的问题。
2、为达到上述目的,本发明的实施例提供一种异常群体检测方法,包括:
3、根据个体的目标数据,从至少一个目标维度上确定个体间的目标相似度;
4、根据所述目标相似度,确定至少一个目标群体,所述目标群体包括至少两个所述个体,且个体间的所述目标相似度大于或等于阈值;
5、根据所述目标群体的至少一个指标数据,确定所述目标群体的异常检测分数。
6、可选地,所述的异常群体检测方法,其中,所述根据个体的目标数据,从至少一个目标维度上确定个体之间的目标相似度,包括:
7、根据个体间的第一目标数据的相似数据数量和不相似数据数量,从第一目标维度上确定个体间的第一目标相似度;
8、采用第一方法,对所述个体的第二目标数据进行处理,从第二目标维度上确定个体间的第二目标相似度;所述第一方法包括:杰卡德系数法、余弦距离法以及编辑距离法中的其中一项;
9、根据所述个体的第三目标数据的均值和标准差,从第三目标维度上确定个体间的第三目标相似度;
10、对所述第一目标相似度、所述第二目标相似度以及所述第三目标相似度进行归一化处理和加权处理,获取所述目标相似度。
11、可选地,所述的异常群体检测方法,其中,所述根据所述目标相似度,确定至少一个目标群体,包括:
12、根据所述目标相似度,构建无向图,所述无向图包括多个顶点,一个顶点表示一个个体;在个体间的所述目标相似度大于或等于阈值时,顶点间存在边;
13、基于所述无向图的完全子图,获取至少一个群体;
14、在所述至少一个群体中获取所述目标群体,所述目标群体不被所述至少一个群体中的除所述目标群体之外的群体所包含。
15、可选地,所述的异常群体检测方法,其中,所述根据所述目标群体的至少一个指标数据,确定所述目标群体的异常检测分数,包括:
16、针对每个所述目标群体,对所述至少一个指标数据分别进行归一化处理,得到每个指标数据的归一化结果;
17、对每个所述指标数据的归一化结果进行标准化处理,得到每个所述指标数据的标准化结果;
18、根据每个所述指标数据的标准化结果,得到每个所述指标数据的权重;
19、采用优劣解距离法,将每个所述指标数据的权重和标准化结果进行处理,确定所述目标群体的异常检测分数。
20、可选地,所述的异常群体检测方法,其中,所述对所述至少一个指标数据分别进行归一化处理,得到每个所述指标数据的归一化结果,包括:
21、确定所述至少一个指标数据中每个指标数据的指标类型;
22、将第一指标类型的所述指标数据进行正向归一化处理得到正向归一化结果,以及将第二指标类型的所述指标数据进行负向归一化处理得到负向归一化结果。
23、可选地,所述的异常群体检测方法,其中,所述采用优劣解距离法,将每个所述指标数据的权重和标准化结果进行处理,确定所述目标群体的异常检测分数,包括:
24、获取所述至少一个目标群体对应的每个所述指标数据的最大标准化结果和最小标准化结果;
25、根据所述至少一个指标数据的标准化结果与所述最大标准化结果得到所述目标群体的第一距离,以及根据所述至少一个指标数据的标准化结果与所述最小标准化结果得到所述目标群体的第二距离;
26、根据所述目标群体的第一距离和第二距离,确定所述目标群体的异常检测分数。
27、可选地,所述的异常群体检测方法,其中,还包括:
28、根据每个所述目标群体的异常检测分数,对所述至少一个目标群体进行排序,生成排序结果。
29、可选地,所述的异常群体检测方法,其中,还包括:
30、根据所述目标群体的异常检测分数、排序结果以及至少一个指标数据,生成异常检测报告。
31、为达到上述目的,本发明的实施例还提供一种电子设备,包括处理器,所述处理器用于:
32、根据个体的目标数据,从至少一个目标维度上确定个体间的目标相似度;
33、根据所述目标相似度,确定至少一个目标群体,所述目标群体包括至少两个所述个体,且个体间的所述目标相似度大于或等于阈值;
34、根据所述目标群体的至少一个指标数据,确定所述目标群体的异常检测分数。
35、为达到上述目的,本发明的实施例还提供一种异常群体检测装置,包括:
36、第一确定模块,用于根据个体的目标数据,从至少一个目标维度上确定个体间的目标相似度;
37、第二确定模块,用于根据所述目标相似度,确定至少一个目标群体,所述目标群体包括至少两个所述个体,且个体间的所述目标相似度大于或等于阈值;
38、第三确定模块,用于根据所述目标群体的至少一个指标数据,确定所述目标群体的异常检测分数。
39、为达到上述目的,本发明的实施例还提供一种电子设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如上任一项所述的异常群体检测方法。
40、为达到上述目的,本发明的实施例提供一种可读存储介质,所述可读存储介质上存储有程序,所述程序被处理器执行时实现如上任一项所述的异常群体检测方法。
41、本发明的上述技术方案的有益效果如下:
42、采用本发明实施例所述异常群体检测方法,根据个体的目标数据,从至少一个目标维度上确定个体间的目标相似度,根据所述目标相似度,确定至少一个目标群体,所述目标群体包括至少两个所述个体,且个体间的所述目标相似度大于或等于阈值,根据所述目标群体的至少一个指标数据,确定所述目标群体的异常检测分数。如此,从至少一个目标维度上确定个体间的目标相似度,提高个体间相关性,并通过目标相似度确定存在异常的目标群体,提升目标群体的挖掘结果的准确性,并从至少一个指标数据上确定异常检测分数,实现异常可能性量化,从而可以提高后续异常调查的工作效率。
1.一种异常群体检测方法,其特征在于,包括:
2.根据权利要求1所述的异常群体检测方法,其特征在于,所述根据个体的目标数据,从至少一个目标维度上确定个体之间的目标相似度,包括:
3.根据权利要求1所述的异常群体检测方法,其特征在于,所述根据所述目标相似度,确定至少一个目标群体,包括:
4.根据权利要求1所述的异常群体检测方法,其特征在于,所述根据所述目标群体的至少一个指标数据,确定所述目标群体的异常检测分数,包括:
5.根据权利要求4所述的异常群体检测方法,其特征在于,所述对所述至少一个指标数据分别进行归一化处理,得到每个所述指标数据的归一化结果,包括:
6.根据权利要求4所述的异常群体检测方法,其特征在于,所述采用优劣解距离法,将每个所述指标数据的权重和标准化结果进行处理,确定所述目标群体的异常检测分数,包括:
7.根据权利要求1所述的异常群体检测方法,其特征在于,还包括:
8.根据权利要求7所述的异常群体检测方法,其特征在于,还包括:
9.一种电子设备,其特征在于,包括处理器,所述处理器用于:
10.一种异常群体检测装置,其特征在于,包括:
11.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如权利要求1至8中任一项所述的异常群体检测方法。
12.一种可读存储介质,其特征在于,所述可读存储介质上存储有程序,所述程序被处理器执行时实现如权利要求1至8中任一项所述的异常群体检测方法。