基于k最近邻分类算法的配电网拓扑结构校验方法与流程

文档序号:11172444阅读:810来源:国知局
基于k最近邻分类算法的配电网拓扑结构校验方法与流程

本发明涉及配电网拓扑结构校验方法领域,具体涉及一种基于k最近邻分类算法的配电网拓扑结构校验方法。



背景技术:

电网公司通常使用电网GIS平台维护配电网设备拓扑结构数据,主要包括电力用户与台区变压器的连接关系,台区变压器与馈线的连接关系。配电网拓扑结构对95598客户报修定位、配电网故障研判、停电计划优化管理等业务都有着重要作用。目前,电网GIS平台的配电网拓扑结构数据存在着大量错误或缺失,与配电网实际拓扑结构不一致,严重影响了电网公司日常业务正常开展。

为了校验和修改这些错误,通常做法是:当配电网实际拓扑结构发生变化时,人工记录这些变更并更新电网GIS平台相关数据,或者组织人力进行实地巡测修正这些错误。这些方法既耗费大量的人力、时间,准确性又不够,同时对于采用地下电缆铺设的台区、偏远台区等不具备良好的可操作性。

公开号CN 104218581的一种利用量测数据校验配电网拓扑结构的方法,所述方法包括(1)计算智能电表的分时电压序列和分时电压分布曲线;(2)分析电压序列的相关系数;(3)评估每一对智能电表的相对电距离;(4)通过比较电压序列的电压值,判断出一组智能电表在同一馈线上的相对上下游位置,验证GIS系统中数据、拓扑结构的正确性。该方法分析的数据来源是一定地理区域内、同一台变下的不同智能电表采集的每小时时序电压,通过计算这些时序电压之间的相关系数和其相对的电压大小,并与同一区域内其他台变下得出的同类数据作对比分析,验证GIS系统中数据、拓扑结构的正确性。该方法的不足之处是:(1)无法快速大批量校验配电网拓扑结构。(2)采用相关系数比较电压曲线相似性对数据质量要求高,同时又很难确定一个相关系数的阀值判断两个用户是否属于同一个台区。



技术实现要素:

有鉴于此,本发明的目的是针对现有技术的不足,提供一种基于k最近邻分类算法的配电网拓扑结构校验方法,用以解决现有校验方法人力成本高、准确性不够、可操作性差的问题。

为解决上述技术问题,本发明所采取的技术方案如下:

一种基于k最近邻分类算法的配电网拓扑结构校验方法,包括以下步骤:

(1)获取校验用户所在台区其它用户和其邻近台区所有用户,组成校验用户训练样本集合;

(2)提取校验用户及其训练样本集合所有用户最近一段时间的电压曲线数据;

(3)计算校验用户与其训练样本集合每个用户之间电压曲线的相似性;

(4)基于相似性大小选取校验用户的k个最近邻,计算校验用户的正确台区类别,进而判断校验用户的配电网拓扑结构是否正确。

优选的,所述邻近台区是基于校验用户台区变压器与该地区其它台区变压器之间的距离搜索,若所述距离在预设范围内,则判断为邻近台区。

优选的,所述距离是根据电网GIS平台中校验用户台区变压器与该地区其它台区变压器的经纬度坐标数据计算,包括:

设(jA,wA)为校验用户台区变压器经纬度坐标,(jB,wB)为该地区其它台区变压器经纬度坐标,R为地球半径,利用公式dAB=R×cos-1[cos wA×cos wB×cos(jA-jB)+sin wA×sin wB]计算二者之间的物理距离。

优选的,所述计算校验用户与其训练样本集合每个用户之间电压曲线的相似性,是计算两条电压曲线之间的离散Fréchet距离,包括:

首先,将从用电信息采集系统提取的用户智能电表电压序列数据表示成{(i,ui)}i=1…n;其中,i是提取的电压值序列号,ui是提取的电压值,n为提取的电压值的数量;

其次,找出用户电压曲线的至高点;如果一个点的电压值比前两个点电压值大同时还比后两个点电压值大,就称它为一个至高点;并将它们表示成A=<(1,u1),…(m,um)>,其中(1,u1),…(m,um)是用户电压曲线的m个至高点;

最后,根据离散Fréchet距离的定义计算校验用户与训练样本集合中每个用户电压曲线之间的离散Fréchet距离。

优选的,对校验用户的k个最近邻赋予不同的权值以体现其贡献程度的高低,每个最近邻权值是其与校验用户电压曲线之间离散Fréchet距离的导数。

优选的,所述步骤(4),基于相似性大小选取校验用户的k个最近邻,计算校验用户的正确台区类别,进而判断校验用户的配电网拓扑结构是否正确,包括:

步骤(41),基于离散Fréchet距离大小选取校验用户的k个最近邻;

步骤(42),假设m个最近邻{ai}i=1…m的台区类别为A,它们与该用户的离散Fréchet距离为{di}i=1…m;n个最近邻{bi}i=1…n的台区类别为B,它们与该用户的离散Fréchet距离为{d′i}i=1…n;而且k=m+n;

步骤(43),若则判定校验用户的台区类别为A;如果校验用户电网GIS平台中台区类别为A,则判定该用户的配电网拓扑结构正确;否则判定该用户的配电网拓扑结构错误,并在电网GIS平台修正该用户的所属台区为A。

本发明的有益效果是:

本发明分析的数据来源是电网公司用电信息采集系统里的电压序列数据,通过计算校验用户与其附近区域内每个用户之间智能电表电压曲线的离散Fréchet距离,获取与校验用户最相似的k个“最近邻”,进而判断校验用户的正确台区类别,可有效验证电网GIS平台中配电网拓扑结构数据的正确性。本发明的校验方法所需的物资和人力成本低、准确性高、可操作性好。

附图说明

图1为本发明提供的一种基于k最近邻分类算法的配电网拓扑结构校验方法的流程图。

图2为本发明两个供电半径交叉的台区变压器示意图。

图3为本发明校验用户m01及其训练样本集合中智能电表电压曲线图。

具体实施方式

下面结合附图对本发明的具体实施方式作进一步的详细说明。

电网GIS平台维护的配电网拓扑结构数据存在问题主要有2种:(1)未记录用户所属的台区或未记录台区变压器所属的馈线;(2)用户所属的台区或台区变压器所属的馈线记录错误,而且通常是错误地把某个台区用户挂接到相邻台区,或者把某个馈线的台区变压器挂接到相邻馈线。

在配电网中,由于各处负荷的不确定性,电压经常波动。电气距离比较近的负荷,其电压波动曲线比较相似;而电气距离比较远的负荷,其电压波动曲线相似度比较低。针对配电网拓扑结构数据第一种问题,可以根据用户与附近区域用户之间智能电表电压曲线的相似性对未记录其台区关系的用户进行正确分类,标记该用户所属的台区;或者是根据台区变压器与附近区域变压器之间电压曲线的相似性对未记录其馈线关系的台区变压器进行正确分类,标记该变压器所属的馈线。针对配电网拓扑结构第二种问题,可以根据用户与附近区域用户之间智能电表电压曲线相似性识别、修正用户所属的台区类别错误,或者根据台区变压器与附近区域变压器之间电压曲线相似性识别、修正台区变压器所属的馈线类别错误。上述两种问题可以归纳为校验对象的分类问题。数据挖掘领域中的基于距离(相似性)度量的分类技术可以很好解决解决配电网用户、台区之间拓扑结构的校验问题(台区变压器与馈线之间拓扑结构校验相类似)。

如图1所示,本发明提供一种基于k最近邻分类算法的配电网拓扑结构校验方法,包括以下步骤:

(1)获取校验用户所在台区其它用户和其邻近台区所有用户,组成校验用户训练样本集合;

(2)提取校验用户及其训练样本集合所有用户最近一段时间的电压曲线数据;

(3)计算校验用户与其训练样本集合每个用户之间电压曲线的相似性;

(4)基于相似性大小选取校验用户的k个最近邻,计算校验用户的正确台区类别,进而判断校验用户的配电网拓扑结构是否正确。

实施例1:

本实施例提供一种基于k最近邻分类算法的配电网拓扑结构校验方法,包括以下步骤:

(1)获取校验用户所在台区其它用户和其邻近台区所有用户,组成校验用户训练样本集合。其中,邻近台区是基于校验用户台区变压器与该地区其它台区变压器之间的距离搜索。

国家电网公司企标《配电网规划设计技术导则》明确,220/380V线路应该有明确的供电范围,A类区域供电半径不宜超过150米,B类不宜超过250米,C类不宜超过400米,D类不宜超过500米。参考图2,两个供电半径交叉的台区变压器,两台配变与它所供电用户之间距离应小于500米,若台区变压器A与台区变压器B之间物理距离小于1000米,则认为这两台变压器是相邻的,否则不相邻。

从电网GIS平台提取校验用户台区变压器以及该地区其它台区变压器的经纬度坐标。设(jA,wA)为校验用户台区变压器经纬度坐标,(jB,wB)为该地区其它台区变压器经纬度坐标,R为地球半径,利用公式dAB=R×cos-1[cos wA×cos wB×cos(jA-jB)+sin wA×sin wB]计算二者之间的物理距离,若距离小于1000米,则判定邻近台区。

(2)从用电信息采集系统提取校验用户及其训练样本集合所有用户最近一段时间的电压曲线数据,最近24小时部分用户电压曲线分布图如图3所示。本实施例中为更方便的表示电压曲线分布,图3中选取最近24小时。最近一段时间的选取根据需求来选取,选取的时间段越长,计算结果越精确,同时计算量也越大,最近一段时间选取一周为最佳,可同时兼顾速度与准确性。

(3)计算校验用户与其训练样本集合每个用户之间电压曲线的离散Fréchet距离。

离散Fréchet距离具体定义如下:

定义1:给定一个有n个至高点的多边形链P=〈p1,p2,p3,…pn〉,一个沿着P的k步(k-walk),分割P的至高点成为k个不相交的非空子集{Pi}i=1…k,使得和0=n0<n1<…<nk=n。

定义2:给定两个多边形链A=<a1,…am>,B=<b1,…bn>,一个沿着A和B的组合步(paired work)是一个沿着A的k步{Ai}i=1…k和一个沿着B的k步{Bi}i=1…k组成,使得对于1≤i≤k,要么|Ai|=1,要么|Bi|=1(就是说Ai,Bi中有一个恰好包含一个至高点)。

一个沿着链A和B的组合步W={(Ai,Bi)}的花费(cost)就是则链A和B间的离散Fréchet距离为

首先,将用户电压曲线表示成{(i,ui)}i=1…n,其中,i按提取电压值的时间顺序排列的序列号,ui是采集的电压值。智能电表采集间隔一般为15分钟,若提取一周的电压数据,则n=672。

接着,找出用户电压曲线的至高点。如果一个点比前两个点电压值大同时还比后两个点大,就称它为一个至高点;并将它们表示成A=<(1,u1),…(m,um)>,其中(1,u1),…(m,um)是用户电压曲线的m个至高点。

然后,根据上述离散Fréchet距离的定义计算校验用户与训练样本集合中每个用户电压曲线之间的离散Fréchet距离。

(4)基于离散Fréchet距离大小选取校验用户的k个最近邻,假设m个最近邻{ai}i=1…m的台区类别为A,它们与该用户的离散Fréchet距离为{di}i=1…m;n个最近邻{bi}i=1…n的台区类别为B,它们与该用户的离散Fréchet距离为

{d′i}i=1…n;而且k=m+n。如果则判定校验用户的台区类别为A。如果校验用户电网GIS平台中台区类别为A,则判定该用户的配电网拓扑结构正确,否则判定该用户的配电网拓扑结构错误,并在电网GIS平台修正该用户的所属台区为A。

上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域的技术开发人员应该明白,在本发明的技术方案的基础上,本领域及相关领域的技术开发人员不需要付出创造性劳动即可做出的各种修改或变形,仍在本发明的保护范围以内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1