一种基于邻域序列加权求和的用电数据异常检测方法

文档序号:37038025发布日期:2024-02-20 20:31阅读:16来源:国知局
一种基于邻域序列加权求和的用电数据异常检测方法

本发明属于电力数据异常检测,具体涉及到一种基于邻域序列加权求和的用电数据异常检测方法。


背景技术:

1、对电力公司而言,保障电力的正常供给是首要任务,但在实际生产中,用电数据仍有可能产生异常,而异常用电数据可能引发电网的过载和故障,从而导致供电系统的崩溃;同时异常用电数据表明电力设备可能存在潜在的故障,会导致火灾等危险后果。因此,对异常用电数据进行有效检测具备重要的研究意义和实际的应用价值。

2、目前,基于机器学习的方式在用电数据的异常检测中已得到应用,但其也存在一定的问题。一是面向数值型数据进行处理,而在处理符号型数据时,需要对类别进行转化,该过程存在信息精度丢失的问题;二是无法综合利用混合型数据的特征,也不能将单属性邻域信息与多属性邻域信息中蕴含的知识进行融合处理。上述问题限制了用电数据异常检测算法性能的提升。


技术实现思路

1、本发明要解决的技术问题在于提供一种基于邻域序列加权求和的用电数据异常检测方法,通过构建单属性邻域信息与多属性邻域信息的邻域关系矩阵,计算相应的邻域熵与邻域密度,将单属性邻域信息与多属性邻域信息中蕴含的知识进行融合处理;通过构建加权混合曼哈顿重叠度量,来构建适用于单属性与多属性混合属性用电数据的统一度量标准,解决因符号型数据类别转化而带来的信息精度丢失的问题。

2、为了解决上述技术问题,本发明通过以下方式来实现:

3、一种基于邻域序列加权求和的用电数据异常检测方法,包括以下步骤:

4、s1、获取混合属性用电数据,对其中的数值型数据进行归一化处理;

5、s2、计算单属性曼哈顿重叠度量与单属性邻域半径,构建单属性邻域关系矩阵;

6、s3、计算单属性邻域密度与单属性邻域熵,并依据单属性邻域熵计算各属性权重;

7、s4、根据各属性权重与单属性邻域密度,计算单属性离群因子;

8、s5、根据单属性邻域熵排序各属性获得属性序列,并构建属性集序列;

9、s6、计算多属性加权混合曼哈顿重叠度量与多属性邻域半径,构建多属性邻域关系矩阵;

10、s7、计算多属性邻域密度与多属性邻域熵,并依据多属性邻域熵计算多属性权重;

11、s8、根据多属性权重与多属性邻域密度,计算多属性离群因子;

12、s9、根据单属性离群因子与多属性离群因子,计算总离群因子;

13、s10、逐一判断论域中各对象总离群因子是否大于等于设定的阈值,若是则输出异常点。

14、进一步地,所述步骤s1中对用电数据进行归一化处理的表达式如下:

15、

16、其中,xi表示第i位用户,cj表示第j项属性,f(xi,cj)表示用电数据中第i位用户在第j项属性上的取值,和表示属性cj在用电数据中可获取的最大值和最小值,采用该算法对数值型用电数据进行归一化处理。

17、进一步地,所述步骤s2具体的分步骤如下:

18、s21、单属性曼哈顿重叠度量的表达式如下:

19、

20、其中,x,y分别表示用户x,用户y,cj表示第j项属性,f(x,cj)表示用电数据中用户x在第j项属性上的取值;

21、s22、单属性邻域半径的表达式如下:

22、

23、其中,std(cj)表示属性cj的标准差,λ表示邻域半径调节因子;

24、s23、单属性邻域粒的表达式如下:

25、

26、其中,u表示所有用户的集合;

27、s24、根据单属性邻域粒计算各个用户之间的单属性邻域关系,其表达式如下:

28、

29、其中,表示单属性邻域关系;

30、s25、单属性邻域关系矩阵的表达式如下:

31、

32、其中,xi表示第i位用户,1≤i≤n,n表示用电数据中所有用户的数量。

33、进一步地,所述步骤s3具体的分步骤如下:

34、s31、计算单属性邻域密度,其表达式如下:

35、

36、其中,n表示所有用户的数量,表示第i位用户在第j项属性上的单属性邻域密度;

37、s32、计算单属性邻域熵,其表达式如下:

38、

39、其中,ne(cj)表示属性cj的单属性邻域熵;

40、s33、依据单属性邻域熵计算属性权重,其表达式如下:

41、

42、其中,c表示所有属性的集合,sw(cj)表示单属性权重。

43、进一步地,所述步骤s4中单属性离群因子的表达式如下:

44、

45、其中,sof(xi)表示第i位用户依据单属性邻域信息计算所得的离群因子。

46、进一步地,所述步骤s5具体的分步骤如下:

47、s51、依据单属性邻域熵排序各属性获得属性序列,所述属性序列的表达式如下:

48、s=<c′1,c′2,…,c′m>

49、ne(c′k)≤ne(c′k+1),1≤k<m

50、其中,ne(c′k)表示关于属性c′k的单属性邻域熵,c′k表示单属性邻域熵排在第k位的属性,m表示属性的数量,s表示单属性邻域熵排序后获得的属性序列;

51、s52、构建属性集序列

52、由所有属性集开始,依次去除其中单属性邻域熵最大的属性,将剩下的属性归为一个集合,放入一个属性集序列中,并重复此过程直到所有属性集中仅包含一个属性,由此确定一个属性集序列qs,其表达式如下:

53、qs=<q1,q2,…,qm>

54、具备

55、其中,qk表示第k个属性集序列元素。

56、进一步地,所述步骤s6具体的分步骤如下:

57、s61、多属性加权混合曼哈顿重叠度量的表达式如下:

58、

59、其中,qk中包含m-k个属性,cl表示qk中的第l项属性,表示用户x和用户x在qk上的多属性加权混合曼哈顿重叠度量;

60、s62、多属性邻域半径的表达式如下:

61、

62、其中,表示在属性集序列元素qk上的多属性邻域半径;

63、s63、多属性邻域粒的表达式如下:

64、

65、其中,表示在属性集序列元素qk上的多属性邻域粒;

66、s64、根据多属性邻域粒计算各个用户之间的多属性邻域关系,其表达式如下:

67、

68、其中,表示多属性邻域关系,表示在属性集序列元素qk上的多属性邻域粒;

69、s65、多属性邻域关系矩阵的表达式如下:

70、

71、其中,表示多属性邻域关系矩阵。

72、进一步地,所述步骤s7具体的分步骤如下:

73、s71、计算多属性邻域密度,其表达式如下:

74、

75、其中,表示第i位用户在属性集序列元素qk上的多属性邻域密度;

76、s72、计算多属性邻域熵,其表达式如下:

77、

78、其中,ne(qk)表示属性集序列元素qk的多属性邻域熵;

79、s73、依据多属性邻域熵计算多属性权重,其表达式如下:

80、

81、其中,mw(qk)表示多属性权重。

82、进一步地,所述步骤s8中多属性离群因子的表达式如下:

83、

84、其中,mof(xi)表示第i位用户依据多属性邻域信息计算所得的离群因子。

85、进一步地,所述步骤s9中总离群因子的表达式如下:

86、

87、其中,of(xi)表示单属性邻域信息与多属性序列邻域信息进行融合处理后,第i位用户计算所得的离群因子。

88、与现有技术相比,本发明具有的有益效果:

89、本发明将用电数据中的单属性邻域信息与多属性邻域信息中蕴含的知识进行融合处理,更全面地对用户的用电数据异常程度进行打分,提升了用电数据的异常检测效果;构建的加权混合曼哈顿重叠度量,解决了传统邻域粗糙集无法融合多属性来构建邻域问题,以及因符号型数据类别转化而带来的信息精度丢失问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1