一种基于改进的局部异常因子算法的电网拓扑辨识方法与流程

文档序号:11410233阅读:321来源:国知局
一种基于改进的局部异常因子算法的电网拓扑辨识方法与流程
本发明涉及电网拓扑错误辨识
技术领域
,特别是一种基于改进的局部异常因子算法的电网拓扑辨识方法。
背景技术
:电网拓扑图是指由电网节点和与之相连的输电线路组成的物理布局结构示意图。电力系统拓扑分析是电力能量流流动过程中,对用于转换、保护、控制这一过程的元件状态的分析,目的是形成便于电网分析与计算的模型。电力系统分析所需要的良策数据在采集、传递、转换的过程中,会由于设备或网络等原因造成数据信息的损坏或偏差,导致不良数据的产生;当开关遥信量与实际开关状态不符时,则存在拓扑错误。电网拓扑结构的正确与否对于状态估计有重要影响,拓扑错误经常导致状态估计结果不可用或者状态估计不收敛。针对不良数据以及拓扑错误的电网拓扑辨识问题早在20世纪80年代就已经受到关注,当前对于拓扑错误辨识的研究结果主要有以下方法:1)规则法:规则法首先对于电网拓扑结构构建辨识的规则,通过这些规则判定电网是否存在拓扑错误。然而规则法虽然应用较为简单,但是规则之间容易存在冲突现象,导致规则的应用情景复杂化;2)人工神经网络法:人工神经网络法从信息处理角度对人脑神经元网络进行抽象,建立拓扑辨识模型按不同的连接方式构建不同的网络。该方法能够辨识拓扑错误及不良遥测数据,但是该算法对于规模较大且网络拓扑结构经常变化的网络适应能力较差;3)残差法:残差法基于状态估计结果进行拓扑错误辨识,其难以区分由不良数据和拓扑错误引起的残差;4)新息图法:新息图法对于单一的不良数据和拓扑错误具有良好的效果,但是难以辨识不良数据和拓扑错误同时存在的场景;5)最小信息损失法:最小信息损失法将拓扑错误辨识问题转化为一个混合整数规划问题,该方法能够辨识厂站拓扑错误,然而该方法建模过程较为复杂,难以应用于实际的分析;6)转移潮流法:转移潮流法能够辨识支路型拓扑错误和不良数据,但对厂站拓扑错误辨识较为困难;7)状态估计法:该方法通过构建状态估计模型用于厂站拓扑错误辨识,该模型将开关及刀闸的遥信约束用于构建约束条件,通过设置相应的目标函数进而将厂站拓扑辨识问题转化为线性规划问题。然而模型的建立过程较为复杂,尤其对于电网结构复杂的情况。名词解释lof(局部异常因子)是一种基于密度识别异常值的算法。算法原理为:将一个点的局部密度与分布在它周围的点的密度相比较,如果前者明显的比后者小,那么这个点相对于周围的点来说就处于一个相对比较稀疏的区域,这就表明该点是一个异常值。gdlof(grid-basedanddencecellbasedonlocaloutlierfactor),基于网格和稠密单元的快速局部离群点探测算法。在lof基础上,以通过数据集中每一点周围的临近点的状况作为判别依据,通过证明稠密单元和稠密区域中的点不可能成为离群点(异常点),减少lof的计算量。技术实现要素:本发明要解决的技术问题为:将改进的局部异常因子算法应用于电网拓扑辨识过程中,简化建模过程及模型复杂度,提升算法的计算效率。本发明采取的技术方案具体为:一种基于改进的局部异常因子算法的电网拓扑辨识方法,包括步骤:s1,获取待辨识的电网拓扑中的设备对象及其运行数据信息;s2,基于s1获取的信息中,各设备对象在任意一段时间内多个相邻时刻的设备状态转换信息,分别构建对象模型及对象集合;各对象模型中的数据包括待辨识设备在单个相邻时刻设备状态转换时多个属性的变化数据;s3,利用gdlof算法对对象集合中的对象进行约简,以排除处于稠密单元和稠密区域中的对象;s4,对约简后未排除的各对象,基于相对熵理论对各对象中的各属性进行权重设置;s5,基于s4设置的属性权重,利用局部异常因子算法对未排除的对象进行辨识,得到局部异常因子量偏大的对象,进而根据该对象确认发生拓扑错误的设备及时刻。s1中所述设备对象及其运行数据信息包括:线路开关及其电流、负荷和位置信息,母联开关及其电流、负荷和位置信息,分段开关及其电流、负荷和位置信息;主变开关及其某侧电流、负荷和位置信息,母线刀闸及其电流、负荷和位置信息,线路刀闸及其连接的相应线路的电流、负荷和位置信息,以及主变刀闸及其连接的主变相应一侧的电流、负荷和位置信息。本发明构建的对象模型相应的对象为待辨识的电网某特定区域、特定时间段的开关刀闸及其遥测、遥信信息,在信息获取时,根据辨识需要进行选择。根据权利要求1所述的方法,其特征是,s2中,假设t0时刻某设备的状态为[yc1,yc2,yc3,...,yx1,yx2,yx3,...],t1时刻该设备的状态为[yc1',yc2',yc3',...,yx1',yx2',yx3',...],其中yc代表设备对象的遥测数据,yx代表设备对象的遥信数据,下标不同表示遥测数据或遥信数据的类型不同,如对某线路开关来说,有yc1代表电流数据,yc2代表负荷数据,yx1代表该线路开关的位置信息;则基于该设备对象在t0到t1时刻的设备状态转换构建的对象u1的对象模型为:基于该设备对象在一段时间内的设备状态转换所构建的对象集合为:u={u1,u2,u3,...,um},其中m为该设备对象在一段时间内所计的对象集合中对象的数量。由于实际数学建模时,遥测数据为float类型,遥信数据为boolean类型,因此s2在构建对象模型时,对于遥测数据为减运算,对于遥信数据则为异或运算。进一步的,考虑到数据量纲及数据的特性,s2在进行对象模型以及对象集合构建时,包括步骤:s21,对设备对象在一段时间内的遥测数据进行离散化处理;s22,对离散化处理后的遥测数据进行归一化处理。然后即可利用归一化处理后的两相邻时刻对应的遥测数据进行减运算,进而得到对象模型中的遥测数据属性值。离散化处理可采用现有的等宽离散的分割方法进行。优选的,s21对设备对象在一段时间内的遥测数据进行离散化处理包括步骤:s211,根据遥测数据的数值分布情况确认分类个数n;s212,将s1获取的设备对象在一段时间内的各遥测数据的连续变化值进行排序,通过n-1个分割点将数据序列分为n个区间;s213,以各区间中的最小值为该区间的分类类别值,将一个区间中的所有值映射到相同的分类类别上。如有某属性值的分布为[1,9),分类个数为4,则分割的4个区间分别为[1,3),[3,5),[5,7),[7,9),相应的分类类别值为1,3,5,7,如对于属性值2即映射到分类类别值1,由此可得到设备对象在一段时间内的连续遥测数据的离散化数据。优选的,s22对离散化处理后的遥测数据进行归一化处理为:定义y为归一化处理后的数据,x为离散化处理后的遥测变化值数据,maxvalue和minvalue分别对应相应的遥测数据在一段时间内的最大值和最小值在离散化处理中所映射的分类类别值,构建线性函数:y=(x-minvalue)/(maxvalue-minvalue);基于上述线性函数,将各对象中离散化处理后的遥测变化值数据x归一化处理为y。本发明的归一化方法即采用现有的min-max标准化方法,对待归一化处理的原理数据进行线性变换,使结果值映射到[0-1]之间。则本发明中各对象模型中对应遥测数据的属性值皆为[0-1]之间的数据。本发明步骤s3为基于网格对需要进行辨识的对象个数进行约简,其原理为基于gdlof算法中的网格约简功能,证明稠密单元和稠密区域中的点不可能是异常点,进而将所有对象中的各属性值(运行数据变化值)分别进行等宽划分,则对于每种属性,划分后的每个子区域就构成了一个网格;若对象p的所有k最近邻q都在某网格内,并且对象q的所有k最近邻o(对象)也在该网格内,则该网格即为稠密单元,临近的稠密单元则构成稠密区域。通过不断确认稠密单元及稠密区域,从而减少需要进行局部异常因子计算的数据量。基于gdlof算法中的网格约简功能对特定的数据集合进行约简为现有技术。本发明s4包括步骤:s41,基于信息熵理论,计算对象中各属性的信息熵e(b),计算公式为:其中u为对象集合,b为属性子集,bi为该属性根据取值构成的等价类,每个等价类中的对象模型对该属性的取值相同;代表某个对象x∈u在等价类bi中出现的概率,m为各属性基于属性取值生成的等价类的个数,i表示第i个等价类;s42,对于各对象中的各属性分别计算移除对象之后的信息熵ex(b),计算公式为:其中[x]b为x关于ind(b)的等价类,ind(b)是由b确认的在u上的不可分辨关系。现有技术中,对于一个信息系统is=(u,a,v,f),其中u是一个非空有限的对象集合;a是一个非空有限的属性集合;v是属性域的并集,即v=ua∈ava,其中va代表属性a的域;f:u×a→v是一个信息函数,其中对于任意a∈a,x∈u,f(x,a)∈va。在一个给定的信息系统is=(u,a,v,f)中,每个属性子集均确认了一个二元不可分辨关系ind(b),表示为:u/ind(b)={b1,b2,...,bm}代表由关系ind(b)确认的划分,对于任意的x∈u,[x]b代表由关系ind(b)生成的等价类。s43,计算对象属性的相对熵,计算公式为:s44,为各对象的各属性赋予相应的相对熵作为权重ωi。本发明s5包括步骤:s51,根据距离计算公式进行对象距离计算,针对各属性分别计算各对象的第k距离,距离计算公式为:该距离值满足以下条件:a)至少存在k个对象o'满足d(p,o')≤d(p,o),其中o'∈u\{p};b)至多存在k-1个对象o'∈u\{p},满足d(p,o')<d(p,o);其中,p、o、o'均为对象,f(pi)为对象p中第i维(个)属性的值,f(oi)为对象o第i维属性的值,ωi为各属性的权重;u为对象集合;u\{p}为不包含p的对象集合,l为u的维度,即对象中属性的个数;s52,计算对象的第k距离邻域,对于对象p即对象集合中与对象p的距离不超过其第k距离kp的对象的集合,即:nk(p)={q|d(p,q)≤kp},q为满足p的第k距离邻域的对象;s53,计算对象与其第k距离邻域中对象的可达距离,对象p与其邻域对象o的可达距离为p和o之间的距离,与o的第k距离,两者中的较大值,即:rk(p,o)=max{ko,d(p,o),o∈nk(p)};s54,计算对象的局部可达密度,即可达距离的平均值的倒数,对于对象p即:s55,计算对象的局部异常因子量,即可达密度的平均值除以该对象的局部可达密度;对于对象p即:s56,比较各对象的局部异常因子量,对局部异常因子量偏大的对象,根据对象对应的设备和时刻确认发生拓扑错误的设备和时刻。上述局部异常因子量偏大指明显大于其他多数对象的局部异常因子量,比如5倍以上,偏大的倍数可根据实际的设备及其数据对象根据经验进行设定。本发明还公开一种电网拓扑辨识装置,包括:存储器,用于存储多条指令;处理器,用于加载上述指令并执行:s1,获取待辨识的电网拓扑中的设备对象及其运行数据信息;s2,基于s1获取的信息中,各设备对象在任意一段时间内多个相邻时刻的设备状态转换信息,分别构建对象模型及对象集合;各对象模型中的数据包括待辨识设备在单个相邻时刻设备状态转换时多个属性的变化数据;s3,利用gdlof算法对对象集合中的对象进行约简,以排除处于稠密单元和稠密区域中的对象;s4,对约简后未排除的各对象,基于相对熵理论对各对象中的各属性进行权重设置;s5,基于s4设置的属性权重,利用局部异常因子算法对未排除的对象进行辨识,得到局部异常因子量偏大的对象,进而根据该对象确认发生拓扑错误的设备及时刻。有益效果本发明采用的局部异常因子算法是基于密度的异常点检测算法,该方法引用的数据不仅包含遥测数据,还有标识开关及刀闸位置状态的遥信数据,同时基于该对象模型的扩展性,还可以引入其他的一些信息,如pmu数据等,进一步提升算法的准确性及辨识结果的可靠性;同时,该算法在原局部异常因子算法的基础上,进行了算法优化,包括基于网格进行数据约简,以及基于相对熵对对象属性进行权重设置。本发明提出的方法更具拓展性和适应性,简化了模型的复杂度,便于理解,同时通过网格约简提升了局部异常因子算法的计算效率,并通过相对熵为属性权重赋值提升了算法的可靠性,进而为拓扑辨识奠定了理论基础。附图说明图1所示为本发明拓扑辨识方法流程示意图图2所示为lof算法理论示意图。具体实施方式以下结合附图和具体实施例进一步描述。本发明所述改进的局部异常因子算法包括两方面:一是采用gdlof算法进行数据约简,二是运用相对熵进行数据对象权重设置,进而完善lof算法中对象距离计算的方法。参考图2所示的lof算法理论参考图,lof算法为基于密度的异常对象辨识方法,其通过确认某个对象与邻域内的对象的距离、局部可达密度及局部异常因子来确认对象的异常程度。参考图1,本发明基于改进的局部异常因子算法的电网拓扑辨识方法,包括步骤:对象建模:s1,获取待辨识的电网拓扑中的设备对象及其运行数据信息;s2,基于s1获取的信息,针对各设备对象在一段时间内多个相邻时刻的设备状态转换,分别构建对应每个相邻时刻设备状态转换的对象模型,以及对象集合;各对象模型中的数据包括待辨识设备在单个相邻时刻设备状态转换时多个属性的变化数据;数据约简:s3,利用gdlof算法对对象集合中的对象进行约简,以排除处于稠密单元和稠密区域中的对象;权重设置:s4,对约简后未排除的各对象,基于相对熵理论对各对象中的各属性进行权重设置;局部异常因子计算:s5,基于s4设置的属性权重,利用局部异常因子算法对未排除的对象进行辨识,得到局部异常因子量偏大的对象,进而根据该对象确认发生拓扑错误的设备及时刻。实施例1s1中所述设备对象及其运行数据信息包括:线路开关及其电流、负荷和位置信息,母联开关及其电流、负荷和位置信息,分段开关及其电流、负荷和位置信息;主变开关及其某侧电流、负荷和位置信息,母线刀闸及其电流、负荷和位置信息,线路刀闸及其连接的相应线路的电流、负荷和位置信息,以及主变刀闸及其连接的主变相应一侧的电流、负荷和位置信息。本发明构建的对象模型相应的对象为待辨识的电网某特定区域、特定时间段的开关刀闸及其遥测、遥信信息,在信息获取时,根据辨识需要进行选择。s2中,假设t0时刻某设备的状态为[yc1,yc2,yc3,...,yx1,yx2,yx3,...],t1时刻该设备的状态为[yc1',yc2',yc3',...,yx1',yx2',yx3',...],其中yc代表设备对象的遥测数据,yx代表设备对象的遥信数据,下标不同表示遥测数据或遥信数据的类型不同,如对某线路开关来说,有yc1代表电流数据,yc2代表负荷数据,yx1代表该线路开关的位置信息;则基于该设备对象在t0到t1时刻的设备状态转换构建的对象模型为:基于该设备对象在一段时间内的设备状态转换所构建的对象集合为:u={u1,u2,u3,...,um},其中m为该设备对象在一段时间内所计的对象集合中对象的数量。由于实际数学建模时,遥测数据为float类型,遥信数据为boolean类型,因此s2在构建对象模型时,对于遥测数据为减运算,对于遥信数据则为异或运算。进一步的,考虑到数据量纲及数据的特性,s2在进行对象模型以及对象集合构建时,包括步骤:s21,对设备对象在一段时间内的遥测数据进行离散化处理;s22,对离散化处理后的遥测数据进行归一化处理。然后即可利用归一化处理后的两相邻时刻对应的遥测数据进行减运算,进而得到对象模型中的遥测数据属性值。离散化处理可采用现有的等宽离散的分割方法进行。优选的,s21对设备对象在一段时间内的遥测数据进行离散化处理包括步骤:s211,根据遥测数据的数值分布情况确认分类个数n;s212,将s1获取的设备对象在一段时间内的各遥测数据的连续变化值进行排序,通过n-1个分割点将数据序列分为n个区间;s213,以各区间中的最小值为该区间的分类类别值,将一个区间中的所有值映射到相同的分类类别上。如有某属性值的分布为[1,9),分类个数为4,则分割的4个区间分别为[1,3),[3,5),[5,7),[7,9),相应的分类类别值为1,3,5,7,如对于属性值2即映射到分类类别值1,由此可得到设备对象在一段时间内的连续遥测数据的离散化数据。优选的,s22对离散化处理后的遥测数据进行归一化处理为:定义y为归一化处理后的数据,x为离散化处理后的遥测变化值数据,maxvalue和minvalue分别对应相应的遥测数据在一段时间内的最大值和最小值在离散化处理中所映射的分类类别值,构建线性函数:y=(x-minvalue)/(maxvalue-minvalue);基于上述线性函数,将各对象中离散化处理后的遥测变化值数据x归一化处理为y。本发明的归一化方法即采用现有的min-max标准化方法,对待归一化处理的原理数据进行线性变换,使结果值映射到[0-1]之间。则本发明中各对象模型中对应遥测数据的属性值皆为[0-1]之间的数据。本发明步骤s3为基于网格对需要进行辨识的对象个数进行约简,其原理为基于gdlof算法中的网格约简功能,证明稠密单元和稠密区域中的点不可能是异常点,进而将所有对象中的各属性值(运行数据变化值)分别进行等宽划分,则对于每种属性,划分后的每个子区域就构成了一个网格;若对象p的所有k最近邻q都在某网格内,并且对象q的所有k最近邻o(对象)也在该网格内,则该网格即为稠密单元,临近的稠密单元则构成稠密区域。通过不断确认稠密单元及稠密区域,从而减少需要进行局部异常因子计算的数据量。基于gdlof算法中的网格约简功能对特定的数据集合进行约简为现有技术。本发明s4包括步骤:s41,基于信息熵理论,计算对象中各属性的信息熵e(b),计算公式为:其中u为对象集合,b为属性子集,bi为该属性根据取值构成的等价类,每个等价类中的对象模型对该属性的取值相同;代表某个对象x∈u在等价类bi中出现的概率,m为各属性基于属性取值生成的等价类的个数,i表示第i个等价类;s42,对于各对象中的各属性分别计算移除对象之后的信息熵ex(b),计算公式为:其中[x]b为x关于ind(b)的等价类,ind(b)是由b确认的在u上的不可分辨关系。现有技术中,对于一个信息系统is=(u,a,v,f),其中u是一个非空有限的对象集合;a是一个非空有限的属性集合;v是属性域的并集,即v=ua∈ava,其中va代表属性a的域;f:u×a→v是一个信息函数,其中对于任意a∈a,x∈u,f(x,a)∈va。在一个给定的信息系统is=(u,a,v,f)中,每个属性子集均确认了一个二元不可分辨关系ind(b),表示为:u/ind(b)={b1,b2,...,bm}代表由关系ind(b)确认的划分,对于任意的x∈u,[x]b代表由关系ind(b)生成的等价类。s43,计算对象属性的相对熵,计算公式为:s44,为各对象的各属性赋予相应的相对熵作为权重ωi。本发明s5包括步骤:s51,根据距离计算公式进行对象距离计算,针对各属性分别计算各对象的第k距离,距离计算公式为:该距离值满足以下条件:a)至少存在k个对象o'满足d(p,o')≤d(p,o),其中o'∈u\{p};b)至多存在k-1个对象o'∈u\{p},满足d(p,o')<d(p,o);其中,p、o、o'均为对象,f(pi)为对象p中第i维(个)属性的值,f(oi)为对象o第i维属性的值,ωi为各属性的权重;u为对象集合;u\{p}为不包含p的对象集合,l为u的维度,即对象中属性的个数;s52,计算对象的第k距离邻域,对于对象p即对象集合中与对象p的距离不超过其第k距离kp的对象的集合,即:nk(p)={q|d(p,q)≤kp},q为满足p的第k距离邻域的对象;s53,计算对象与其第k距离邻域中对象的可达距离,对象p与其邻域对象o的可达距离为p和o之间的距离,与o的第k距离,两者中的较大值,即:rk(p,o)=max{ko,d(p,o),o∈nk(p)};s54,计算对象的局部可达密度,即可达距离的平均值的倒数,对于对象p即:s55,计算对象的局部异常因子量,即可达密度的平均值除以该对象的局部可达密度;对于对象p即:s56,比较各对象的局部异常因子量,对局部异常因子量偏大的对象,根据对象对应的设备和时刻确认发生拓扑错误的设备和时刻。上述局部异常因子量偏大指明显大于其他多数对象的局部异常因子量,比如5倍以上,偏大的倍数可根据实际的设备及其数据对象根据经验进行设定。实施例2s1,由于在拓扑关系中,刀闸和开关是连接关系的核心,为此,通过定义每个刀闸和开关的状态转换来确认电网拓扑正确性。其中主要涉及的对象及属性如表1所示:表1设备类型及引用属性设备类型遥测遥信线路开关电流、负荷位置母联开关电流、负荷位置分段开关电流、负荷位置主变开关某侧电流、负荷位置母线刀闸电流、负荷位置线路刀闸连接线路的电流、负荷位置主变刀闸连接主变某侧的电流、负荷位置本发明首先获取待辨识设备的运行状态转换数据信息作为原始数据。s2,基于原始数据,通过模型构建方法进行数据处理,形成相应的需要进行拓扑辨识的数据对象。以某个线路开关为例,对其一段时间内的设备状态进行对象化建模构造对象集合。假设t0时刻某设备状态为[i0,p0,s0],t1时刻该设备状态为[i1,p1,s1],则构建的对象模型为:u1=[i1-i0,p1,-p0,s1-s0],构建的对象集合为u={u1,u2,u3,u4,u5,u6}。s21,考虑到数据量纲及数据的特性,对遥测数据进行离散化及归一化处理:对该线路开关一段时间内电流和负荷的变化进行离散化和归一化处理。离散化的过程为:根据遥测属性的数据值及电网运行特征,采用等宽的分割方法分别对遥测属性数据进行离散化处理。归一化过程:根据离散化后的数据值,分别对遥测属性数据进行归一化处理,构建线性函数:y=(x-minvalue)/(maxvalue-minvalue)通过以上线性函数将离散化处理后的x归一化处理为y,maxvalue和minvalue分别对应相应的遥测数据在一段时间内的最大值和最小值在离散化处理中所映射的分类类别值。s3,基于网格的约简理论,对数据对象进行约简,从而排除那些处于稠密单元和稠密区域中的对象。由三维数据对象构成的数据空间,每一维都被量化为等宽间隔,形成一个网格结构。d是该网格内的所有数据对象的集合。稠密单元:若对象p是数据集u中的一个对象,对象p的所有m最近邻q都在某网格内,并且q的所有m最近邻o也在该网格内,则称该网格为稠密单元。稠密区域:若稠密单元ci1,i2,...,id和cj1,j2,...,jd,满足(其中i1,i2,...,id和j1,j2,...,jd分别为稠密单元的标识序列),则这两个单元为邻居单元。若对象p的所有m最近邻q都在某单元集{c1,c2,...,cm}内,并且q的所有m最近邻o也在该单元集内,且该单元集内的任意两个单元均为邻居单元,则这个单元集合为稠密区域。以上关于稠密单元和稠密区域的概念为现有技术。gdlof算法已证明稠密单元和稠密区域中的点不可能是异常点,故而通过构建网格来确认处于稠密单元和稠密区域中的对象,进而通过排除这些对象减少局部异常因子的计算量。s4,基于信息熵理论,计算对象属性的信息熵,其计算公式为:其中u为对象集合,b为属性子集。以该线路开关为例,其属性集合由三个属性构成,i、p、s;其对象集合由采集的时间段内的设备状态量决定;确认各个属性的取值范围,分别构造每个属性等价类u/ind({i}),u/ind({p}),u/ind({s}),可有:u/ind({i})={{u1,u3,u5},{u4},{u2,u6}}u/ind({p})={{u1},{u2,u3,u5,u4},{u6}}u/ind({s})={{u1,u3,u5,u4},{u2,u6}}根据公式计算每个属性的信息熵e({i}),e({p}),e({s})计算移除对象之后的信息熵,其计算公式为:其中[x]b为x关于ind(b)的等价类,ind(b)是由b确认的在u上的不可分辨关系。其中ex(b)代表移除了[x]b的所有对象时ind(b)的信息熵,u/ind(b)-{[x]b}={b'1,...,b'm-1}代表移除了[x]b之后的等价类集合。以线路开关设备构成的辨识对象为例,分别计算各属性子集在移除了相应等价类中的对象时的ex(b),即:eu1({i}),eu2({i}),eu3({i}),eu4({i}),eu5({i}),eu6({i})eu1({p}),eu2({p}),eu3({p}),eu4({p}),eu5({p}),eu6({p})eu1({s}),eu2({s}),eu3({s}),eu4({s}),eu5({s}),eu6({s})计算对象属性的相对熵,从而为各对象的不同属性赋权重,其计算公式为:确定各属性的不同属性的权重即相对熵为:re{i}(u1),re{i}(u2),re{i}(u3),re{i}(u4),re{i}(u5),re{i}(u6)re{p}(u1),re{p}(u2),re{p}(u3),re{p}(u4),re{p}(u5),re{p}(u6)re{s}(u1),re{s}(u2),re{s}(u3),re{s}(u4),re{s}(u5),re{s}(u6)。s5,根据对象距离计算公式,进行对象距离计算,并确认对象的第k距离;第k距离定义为:对于数据集u中的两个对象p和o,对任意的正整数k,对象p的第k距离为p与对象o之间的距离,记为kp,满足以下条件:a)至少存在k个对象o'满足d(p,o')≤d(p,o),其中o'∈u\{p};b)至多存在k-1个对象o'∈u\{p},满足d(p,o')<d(p,o);对象p和对象o的距离d(p,o)计算公式为:p、o、o'均为对象,f(pi)为对象p中第i维(个)属性的值,f(oi)为对象o第i维属性的值,ωi为各属性的权重;u\{p}为不包含p的对象集合,l为u的维度,即对象中属性的个数。本实施例中l为3,ωi为对象p各属性的权重,其根据选取的对象不同则不同,以对象u1为例:ω1=re{i}(u1)ω2=re{p}(u1)ω3=re{s}(u1)根据对象p的第k距离邻域定义,确认对象的第k距离邻域对象,对象p的第k距离邻域为:数据集u中与对象p的距离不超过对象p的第k距离kp的所有数据对象的集合,计算公式为:nk(p)={q|d(p,q)≤kp};以k=3为例,对象u1的第3距离邻域对象可为{u2,u3,u4};计算对象p与其第k距离邻域中对象o的可达距离,其计算公式为:rk(p,o)=max{ko,d(p,o),o∈nk(p)}以k=3,对象u1为例,即分别计算r3(u1,u2),r3(u1,u3),r3(u1,u4)。计算对象p的局部可达密度,计算公式为:以k=3,对象u1为例,u1的局部可达密度为:计算对象p的局部异常因子,其计算公式为:以k=3,对象u1为例,u1的局部异常因子量为:以上仅以某个对象为例进行局部异常因子对象,在进行拓扑辨识时根据所有对象的局部异常因子计算结果进行拓扑错误辨识。然后进行步骤s6比较各对象的局部异常因子量,对局部异常因子量偏大的对象,根据对象对应的设备和时刻确认发生拓扑错误的设备和时刻。实施例3本实施例为一种电网拓扑辨识装置,包括:存储器,用于存储多条指令;处理器,用于加载上述指令并执行:s1,获取待辨识的电网拓扑中的设备对象及其运行数据信息;s2,基于s1获取的信息,针对各设备对象在一段时间内多个相邻时刻的设备状态转换,分别构建对应每个相邻时刻设备状态转换的对象模型,以及对象集合;各对象模型中的数据包括待辨识设备在单个相邻时刻设备状态转换时多个属性的变化数据;s3,利用gdlof算法对对象集合中的对象进行约简,以排除处于稠密单元和稠密区域中的对象;s4,对约简后未排除的各对象,基于相对熵理论对各对象中的各属性进行权重设置;s5,基于s4设置的属性权重,利用局部异常因子算法对未排除的对象进行辨识,得到局部异常因子量偏大的对象,进而根据该对象确认发生拓扑错误的设备及时刻。本发明通过将改进的局部异常因子算法,即在原局部异常因子算法的基础上添加网格约简,并以相对熵为属性权重赋值达到提高了算法准确率和运算效率的目的,同时,实现了对电网拓扑状态是否存在错误的辨识。本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1