一种基于地区邻域密度因子的多阶段窃电检测方法与流程

文档序号:37431210发布日期:2024-03-25 19:24阅读:13来源:国知局
一种基于地区邻域密度因子的多阶段窃电检测方法与流程

本发明涉及窃电行为检测领域,尤其涉及一种基于地区邻域密度因子的多阶段窃电检测方法。


背景技术:

1、电力作为人类生活中至关重要的因素,对于任何国家的经济和社会发展都具有重要意义。然而,窃电行为的发生会导致输电和配电过程中的非技术损失增加,甚至严重影响电网的稳定性。

2、有资料显示,目前,利用人工手段查处窃电行为存在着取证困难、查找难、核实难和成本高等问题。随着国家电网智能计量装置(ami)的广泛应用,可以利用其中大量的能耗数据来进行对用户行为的分析。目前,对于窃电检测领域的研究主要集中在基于ami数据的svm、聚类、梯度提升和ann算法的分析上,这些算法主要在时间层面上对用户的用电行为模式进行比较分析。上述方法并没有考虑相同区域生活的用户用电模式的特征相似性,导致在复杂情况下窃电行为的检测精确度和鲁棒性不高。因此,亟需找到一种能够考虑时间和空间因素的窃电检测方法。

3、中国专利文献cn113327008a公开了一种“基于时序自动编码器的窃电检测方法、系统及介质”。训练阶段如下:建立高斯混合模型,结合原始数据集,使用em算法和bic得到最优高斯混合模型;基于最优高斯混合模型对原始数据集的聚类结果,将原始数据集分为多个训练集;构建多个自动编码器并进行训练;应用阶段如下:根据最优高斯混合模型对输入数据集进行聚类,使用聚类结果对应的自动编码器进行异常检测。上述技术方案没有考虑相同区域生活的用户用电模式的特征相似性,导致在复杂情况下窃电行为的检测精确度和鲁棒性不高。


技术实现思路

1、本发明主要解决原有的技术方案在复杂情况下窃电行为的检测精确度和鲁棒性不高的技术问题,提供一种基于地区邻域密度因子的多阶段窃电检测方法,通过地区邻域密度因子筛选受测用户的关联点和非关联点,然后通过相似性度量初步判断窃电用户,通过dt-svm方法对具有窃电嫌疑的用户进行再分析,不断优化窃电分类器,与时俱进地提高分类精度。

2、本发明的上述技术问题主要是通过下述技术方案得以解决的:本发明包括以下步骤:

3、s1通过地区邻域密度因子筛选受测用户的关联点和非关联点;

4、s2通过相似性度量初步判断窃电用户;

5、s3通过dt-svm方法对具有窃电嫌疑的用户进行再分析。

6、利用地区邻域密度因子对所处生活环境类似的用户进行初步划分,减少后续进行窃电分析对比的数据数量的同时选取最具代表性的数据;在时间和空间层面对用户用电进行相似度分析,综合考虑多因素初步判断用户的窃电嫌疑;可通过svm分类直接识别出用户的窃电行为,并且还能不断优化窃电分类器,与时俱进地提高分类精度。

7、作为优选,所述的步骤s1具体包括,地区领域密度因子将用户电表的位置信息进行统计并计算,根据样本点的地区邻域密度因子来辅助识别出与用户x具有相似生活环境的用户y。通常在一个地区的电力数据集中,地区邻域密度因子大小能够一定程度上反应用户所处的集群。故第一阶段从两个方面去判断用户是否处于同一生活层面,1.地区领域密度因子;2.空间坐标距离。

8、作为优选,所述的地区邻域密度因子具体包括,设某一地区a的用户x基于空间的坐标为经度a°n,纬度b°w,则x的坐标记为(a,b),k地区邻域nk(x):地区数据集a中空间坐标到x的坐标距离不大于到其第k个近邻点距离的点构成的集合,其中不包含x自身,公式如下所示:

9、nk(x)={y∈a|d(y,x)≤r,y≠x}

10、其中,r为第k个邻近点到x的距离;

11、反k地区邻域nrk(x):其他用户y的k地区邻域数据集中包含x的集合,公式如下所示:

12、nrk(x)={y∈a|x∈nk(y)}

13、地区邻域密度因子fad(k,x):

14、综合考虑以上指标,在对用户x进行行为分析时,将该地区内的所有用户分为关联点和非关联点。关联点就是用户y和用户x的所处环境类似,在对用户x进行用电行为分析时,y的数据会纳入第二阶段。非关联点就是用户y与用户x的所处环境差别较大,无须将其加入第二阶段考虑。

15、作为优选,所述的用户x的关联点和非关联点的具体判断条件如下:

16、关联点:

17、|fad(k,x)-fad(k,y)|≤m或d(x,y)≤n

18、非关联点:

19、|fad(k,x)-fad(k,y)|>m且d(x,y)>n

20、其中,m和n为自定义判断阈值。该值越小,则判断关联点的条件越苛刻,关联点的个数会影响进入第二阶段的数据数量。

21、作为优选,所述的步骤s2具体包括,利用ami对用户x以及其关联点y的用电数据进行收集,x0为分析用户的用电数据,该用户具有n个关联点,y1至y2为其关联点的用电数据,且同一用户在不同时间的数据用小写x和y表示,以需要分析的用户为中心得数据矩阵x如下:

22、

23、接着对用电数据进行归一化,通过原始数据的线性变换产生[0,1]的值,其转换函数如下:

24、

25、

26、然后使用相似性度量初步判断窃电用户,在相似性度量这一过程中,比较用户x和它的关联点的特征曲线,若存在差异大,则初步认为该用户存在窃电的可能性。

27、作为优选,将一个用户长度为n的时间序列x或y简化为n-1的形态序列x″或y″,

28、

29、用户的电力形态序列经过斜率转化之后记为x″=(x″1,x″2,…,x″m-1),它的一个关联点的转换之后的形态序列经转换后记为y″=(y″1,y″2,…,y″m-1),x″和y″为相互独立的序列,构造一个欧几里得距离矩阵来表示,矩阵的表示方法如下:

30、d(i,j)=||x″i-y″j||2i=1,2,…m-1;j=1,2,…,m-1。

31、dtw算法通过计算两个时间序列之间的最小距离或相似度,来评估它们的相似程度。dtw计算两条时间距离的路径不是随机选择的,在满足边界条件、连续性和单调性约束的情况下,寻找一条使得最终获得的总距离最小化的路径。为了寻找上述路径,需要采用动态规划的方法狗仔一个概念:累计距离。

32、作为优选,引入dtw算法,在满足边界条件、连续性和单调性约束的情况下,寻找一条使得最终获得的总距离最小化的路径,累积距离γ(i,j)是当前网格点的距离d(i,j)与能够到达该点的最小相邻元素的累积距离之和:

33、γ(i,j)=d(i,j)+min{y(i-1,j-1),y(i-1,j),y(i,j-1)}

34、累计距离最小的路径就是到达该点的最小路径。

35、作为优选,假设有两个时间序列的曲线x=(x1,x2,…,xm)和y=(y1,y2,…,ym),分别表示受测用户和其某个关联点的电力序列,并分别计算形态序列x″和y″:

36、

37、其中,α和λ是两种曲线的权重比,分别计算受测用户和其余关联点的结果记为:dwhole1(x,y1)、dwhole2(x,y2)、…、dwholen(x,y),当出现下列关系就认为受测用户存在窃电的嫌疑:

38、

39、c为设定的怀疑窃电的临界常数。

40、作为优选,所述的dt-svm在检测时将窃电方式分为欠压窃电、欠流窃电、移相窃电、电磁干扰窃电以及未知窃电六种,依次进行检测以判断是否窃电及窃电方式。

41、svm分为多层,每一层代表一种窃电方式的窃电特征,其构造方式如下:

42、1.采用电网中的欠压窃电用户数据与正常用户构建svm1分类器;

43、2.采用电网中的欠流窃电用户数据与正常用户构建svm2分类器;

44、3.采用电网中的移相窃电用户数据与正常用户构建svm3分类器。

45、4.采用电网中的电磁干扰窃电用户数据与正常用户构建svm4分类器。

46、5.采用电网中的高科技窃电用户数据与正常用户构建svm5分类器。

47、6.采用电网中的未知窃电用户数据与正常用户构建svm6分类器。

48、在检测窃电用户是否发生窃电以及发生何种窃电行为时,每一层的svm只识别一种类型的窃电,将第二阶段用户的数据从svm1至svm6中流通一遍,就可以依据检测过程中的结点类型来判断用户的窃电方式。

49、本发明的有益效果是:

50、(1)利用地区邻域密度因子对所处生活环境类似的用户进行初步划分,减少后续进行窃电分析对比的数据数量的同时选取最具代表性的数据;

51、(2)在时间和空间层面对用户用电进行相似度分析,综合考虑多因素初步判断用户的窃电嫌疑;

52、(3)可通过svm分类直接识别出用户的窃电行为,并且还能不断优化窃电分类器,与时俱进地提高分类精度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1