一种电压量测数据异常状态自动识别模型及方法与流程

文档序号：16777239发布日期：2019-02-01 18:49阅读：214来源：国知局

本发明涉及电力系统大数据分析领域，具体地，涉及一种电压量测数据异常状态自动识别模型及方法，应用于满足基尔霍夫电压定律的多维电压量测数据场合。

背景技术：

电压量测数据的有效传变是保证电力系统安全稳定运行的前提。保护系统利用电压量测数据实时监测电网运行情况，实现有选择性地隔离电网中的故障；自动化系统以电压为监测对象进行动态无功补偿，保持电网电压在经济可靠要求范围内；计量系统利用电压量测数据实现电能计量。

变电站电压量测数据的传变过程为电网一次电压经电压互感器变换形成二次电压，电压互感器二次输出的电压经二次回路、测控装置/保护装置/电能表、站控层网络传输给监控后台和远动装置；远动装置利用调度数据网将电压量测数据传输给调度主站。传变过程中任意一个环节出现故障都会导致电压量测数据异常。

由基尔霍夫电压定律得到同一根母线上的多支电压互感器的一次电压值(a相或b相或c相)相等。以此为前提，多支电压互感器的一次电压值构成了同一时间刻度不同维度的电压量测数据。

现有的方法均采用基于电压互感器物理参数建模实现判断变电站电压量测传变数据异常。这种方法根据电压互感器的结构，分析电压互感器局部故障与二次输出电压之间关系，确定异常电压量测数据的判断门槛值。该方法中存在两个问题：第一变电站电压会随着电网负荷变化而波动，而国家标准规定的电压波动小于±5％(最苛刻条件)，导致该方法存在电压识别死区；第二电压互感器的相对误差值也会随着温度、湿度、电磁干扰等环境的影响而改变，现有方法也未考虑运行变差对设定门槛值的影响。综上，现有识别方法是基于电压互感器物理模型，以时间为尺度分析某支电压互感器输出的电压量测数据状态，因此电网负荷变化导致电压波动、运行变差增大等因素都会导致现有识别方法不准确、识别死区较大，造成误识别和不识别。

技术实现要素：

本发明提供了一种电压量测数据异常状态自动识别模型及方法，解决了现有识别方法不准确、识别死区较大，造成误识别和不识别的技术问题，实现了快速准确地在线分析电压量测数据的状态，具有识别精度高，速度快、操作性强的技术效果。

本发明建立电网二次量测数据异常状态识别模型，利用电压量测多维数据实现自动匹配出密度聚类算法输入参数的最优解、自动训练电网二次量测值异常的判定边界值，完成模型的离线校核与判定边界值确定；以某一时刻的电网二次量测数据为识别对象，自动识别出异常电压量测数据，实现变电站海量电压数据有效利用，为在变电站监控后台和调度主站上开展电网一二次设备状态评价提供基础方法。

为实现上述发明目的，本申请一方面提供了一种电压量测数据异常状态自动识别模型，所述自动识别模型包括：

数据预处理模块：用于排除噪声数据，保证训练样本中无状态异常的数据样本；

最优参数匹配模块：用于利用输入的训练样本，遍历样本最大集，匹配出密度聚类算法dbscan的最优组合输入参数；

异常状态边界求解模块：用于求解出正常数据样本的相对误差最大值，并作为异常状态边界的判定值；

离群电压量测数据判定模块：用于利用最优参数匹配模块提供的最优组合参数作为密度聚类算法dbscan(density-basedspatialclusteringofapplicationswithnoise，基于密度的噪声应用空间聚类)的输入条件，分离出明显远离中心区域的点，即分离出状态异常点；

电压量测数据异常状态判定模块：利用异常状态边界求解模块提供的异常状态边界完成电压量测数据异常状态判定。

进一步的，所述噪声数据包括：人工停电检修、电网故障停电、二次电压量测数据传变回路故障引入的非正常电压量测数据。

进一步的，自动识别模型首先利用训练样本自动完成训练，得到dbscad密度聚类的两个输入参数扫描半径r和最小包含点数k的最优解，以及异常状态边界值；然后利用训练得到的r、k以及某时刻t1的多维电压量测样本作为dbscan的密度聚类算法的三个输入条件，自动识别出离群点和聚类点；将识别出的离群点作为异常电压量测数据处理；将聚类点作为进一步分析识别的输入条件；比较某时刻t1的电压量测值与异常状态边界值的大小，大于边界值的数据点判为异常数据，小于等于边界值的数据点判为正常数据。

进一步的，自动识别模型利用训练样本完成密度聚类算法最优输入条件的确定和异常状态判定边界值的计算，具体包括：

定义一个训练样本{xm×n}，m为挂在变电站同一根母线上的线路电压互感器或母线电压互感器的支数，n为电压量测数据的采样时刻，其特征为无异常的电压量测值；其中x11lx1n为{xm×n}中第一支电压互感器的t1ltn时刻的电压量测值，x1nlxmn为{xm×n}中tn时刻m支pt的电压量测值；

将电压值小于10％的一次电压额定值un的数据定义为电压量测值的噪声；

训练样本{xm×n}送入数据预处理模块后，遍历{xm×n}中样本点，去除样本点小于0.1un所对应时刻的样本点，形成无异常状态数据的数据集{xi×j}，1≤i≤m,1≤j≤n，i表示经过数据预处理模块后，挂在变电站同一根母线上的线路电压互感器或母线电压互感器的支数，j表示经过数据预处理模块后，电压量测数据的采样时刻；

在最优参数匹配模块中，将{xi×j}中tk时刻电压量测数据、组合参数(rl,ki)作为密度聚类算法dbscan的三个输入变量条件，遍历{xi×j}中的列数据，其中δ为电压互感器校验规程中规定的相对误差值，tk为1至j之间任意一列数据所对应的时刻，k为1至j之间任意一个数，0.1δun＜1＜δun；

以rl为横坐标轴、ki为纵坐标轴画出二维平面坐标，形成rk最优决策树；在决策树中找到符合预设要求的(r,k)作为训练结果；

预设要求是指rl最小，ki最大的组合情况；

在异常状态边界求解模块中，将{xi×j}中tk时刻电压量测数据、聚类簇数l作为k-mean聚类算法的两个输入参数，求取{xi×j}的均值x(j)mean，然后利用下述计算相对误差公式求解{xi×j}中j列的相对误差值{εj(％)}；

遍历{εj(％)}，将其最大值(cupmax,cdownmax)作为电压异常状态判定边界值c。

进一步的，将计算的最优输入参数(r,k)作为电压量测数据离群判定模块的输入条件，将电压量测数据离群判定模块的输出数据、异常状态判定边界值c作为电压量测数据异常状态判定模块的输入条件，识别出t1时刻多维电压量测样本中异常数据，具体包括：

定义一组待识别多维电压量测样本值{um×1}，里面包含了m支pt的t1时刻的电压量测值；

在电压量测数据离群判定模块中，将待识别样本{um×1}、最优参数匹配模块输出的(r,k)作为密度聚类dbscan算法的三个输入条件，自动识别出离群点和聚类点；离群点{ufocus}被判定为t1时刻状态异常电压数据，聚类点被送入电压量测数据异常状态判定模块；

在电压量测数据异常状态判定模块中，比较{ufocus}中样本点与c的大小，大于c的样本点被判定为状态异常，小于c的样本点被判为状态正常。

另一方面，本申请还提供了一种电压量测数据异常状态自动识别方法，所述方法包括：

自动识别模型首先利用训练样本自动完成训练，得到dbscad密度聚类的两个输入参数半径r和样本点数k的最优解，以及异常状态边界值；然后利用训练得到的r、k以及某时刻t1的多维电压量测样本作为dbscan的密度聚类算法的三个输入条件，自动识别出离群点和聚类点；将识别出的离群点作为异常电压量测数据处理；将聚类点作为进一步分析识别的输入条件；比较某时刻t1的电压量测值与异常状态边界值的大小，大于边界值的数据点判为异常数据，小于等于边界值的数据点判为正常数据。

进一步的，所述自动识别模型包括：

数据预处理模块：用于排除噪声数据，保证训练样本中无状态异常的数据样本；

最优参数匹配模块：用于利用输入的训练样本，遍历样本最大集，匹配出密度聚类算法dbscan的最优组合输入参数；

异常状态边界求解模块：用于求解出正常数据样本的相对误差最大值，并作为异常状态边界的判定值；

离群电压量测数据判定模块：用于利用最优参数匹配模块提供的最优组合参数作为密度聚类算法dbscan的输入条件，分离出明显远离中心区域的点，即分离出状态异常点；

电压量测数据异常状态判定模块：利用异常状态边界求解模块提供的异常状态边界完成电压量测数据异常状态判定。

进一步的，所述噪声数据包括：人工停电检修、电网故障停电、二次电压量测数据传变回路故障引入的非正常电压量测数据。

进一步的，自动识别模型利用训练样本完成密度聚类算法最优输入条件的确定和异常状态判定边界值的计算，具体包括：

将电压值小于10％的一次电压额定值un的数据定义为电压量测值的噪声；

在最优参数匹配模块中，将{xi×j}中tk时刻电压量测数据、组合参数(rl,ki)作为密度聚类算法dbscan的三个输入变量条件，遍历{xi×j}中的列数据，其中δ为电压互感器校验规程中规定的相对误差值，tk为1至j之间任意一列数据所对应的时刻，k为1至j之间任意一个数，0.1δun＜l＜δun；

以rl为横坐标轴、ki为纵坐标轴画出二维平面坐标；形成rk最优决策树；在决策树中找到符合预设要求的(r,k)作为训练结果；

预设要求是指rl最小，ki最大的组合情况；

遍历{εj(％)}，将其最大值(cupmax,cdownmax)作为电压异常状态判定边界值c。

定义一组待识别多维电压量测样本值{um×1}，里面包含了m支pt的t1时刻的电压量测值；

在电压量测数据异常状态判定模块中，比较{ufocus}中样本点与c的大小，大于c的样本点被判定为状态异常，小于c的样本点被判为状态正常。

本申请提供的一个或多个技术方案，至少具有如下技术效果或优点：

由于本方法仅利用变电站现有电压量测数据就可达到异常电压识别精度小于0.5％的效果，而无需新增测量设备。所以，实现了快速准确地在线分析电压量测数据的状态，具有识别精度高，速度快、操作性强的技术效果。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本申请的一部分，并不构成对本发明实施例的限定；

图1是本申请中电压量测数据异常状态自动识别模型的组成示意图；

图2是本申请中电压量测数据异常状态自动识别方法的流程示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在相互不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述范围内的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

请参考图1-图2，本申请提供了一种电压量测数据异常状态自动识别模型及方法，模型构成及实现方法：

1、基于多维数据的电压量测数据异常状态自动识别模型的构成及功能：

(1)基于多维数据的电压量测数据异常状态自动识别模型包括数据预处理模块、最优参数匹配模块、异常状态边界求解模块、离群电压量测数据判定模块、电压量测数据异常状态判定模块。该模型首先利用训练样本自动完成训练，得到dbscad密度聚类的两个输入参数(半径r和样本点数k)最优解，以及异常状态边界值；然后利用第一步中训练得到的r、k以及某时刻t1的多维电压量测样本作为dbscan的密度聚类算法的三个输入条件，自动识别出离群点和聚类点；将识别出的离群点作为异常电压量测数据处理；为提高精度，将聚类点作为进一步分析识别的输入条件；最后比较某时刻t1的电压量测值与异常状态边界值的大小，大于边界值的数据点判为异常数据，小于等于边界值的数据点判为正常数据。

1)数据预处理模块的功能：排除人工停电检修操作、电网故障停电、二次电压量测数据传变回路故障等引入的噪声数据，保证训练样本中无状态异常的数据样本；

2)最优参数匹配模块的功能：利用输入的训练样本，遍历样本最大集，匹配出密度聚类算法dbscan的最优组合输入参数，满足半径r尽可能小，样本点数k尽可能大的要求。

3)异常状态边界求解模块：求解出正常数据样本的相对误差最大值，并作为异常状态边界的判定值。

4)离群电压量测数据判定模块：利用最优参数匹配模块提供的最优组合参数作为密度聚类算法dbscan的输入条件，分离出明显远离中心区域的点，即分离出状态异常点。

5)电压量测数据异常状态判定模块：进一步完成电压量测数据异常状态判定，识别精度高于离群pt量测数据判定模块。

2、提前训练：自动识别模型利用训练样本完成密度聚类算法最优输入条件的确定和异常状态判定边界值的计算：

(2)定义一个训练样本{xm×n}，特征为无异常的电压量测值。其中x11lx1n为{xm×n}中第一支pt的t1ltn时刻的电压量测值，x1nlxmn为{xm×n}中tn时刻m支pt的电压量测值。

(3)将电压值小于一次电压额定值(un)10％的数据定义为电压量测值的噪声，引入噪声的原因为人工停电检修操作、电网故障停电、二次电压量测数据传变回路故障。

(4)训练样本{xm×n}送入数据预处理模块后，遍历{xm×n}中样本点，去除小于0.1un样本点所对应的列，形成无异常状态数据的数据集{xi×j}，1≤i≤m,1≤j≤n。

(5)在最优参数匹配模块中，将{xi×j}中tk时刻的i维电压数据、组合参数(r1,0.1,l,δun,k2,1,l,i)作为密度聚类算法dbscan的三个输入变量条件，遍历{xi×j}中的列数据。其中δ为电压互感器校验规程中规定的相对误差值。

(6)以rk为横坐标轴、kl为纵坐标轴画出二维平面坐标，形成rk最优决策树。在决策树中找到半径r尽可能小、样本点数k尽可能大的(r,k)作为训练结果。

(7)在异常状态边界求解模块中，将{xi×j}中tk时刻的i维电压数据、聚类簇数1作为k－mean聚类算法的两个输入参数，求取{xi×j}的均值x(j)mean，然后利用下述计算相对误差公式求解{xi×j}中j列的相对误差值{εj(％)}。

(8)遍历{εj(％)}，将其最大值(cupmax,cdownmax)作为电压异常状态判定边界值c。

3、将上述计算的最优输入参数(r,k)作为电压量测数据离群判定模块的输入条件，将电压量测数据离群判定模块的输出数据、异常状态判定边界值c作为电压量测数据异常状态判定模块的输入条件，识别出t1时刻多维电压量测样本中异常数据。

(9)定义一组待识别多维电压量测样本值{um×1}，里面包含了m支pt的t1时刻的电压量测值。

(10)在电压量测数据离群判定模块中，将待识别样本{um×1}、最优参数匹配模块输出的(r，k)作为密度聚类dbscan算法的三个输入条件，自动识别出离群点和聚类点。离群点{ufocus}被判定为t1时刻状态异常电压数据，聚类点被送入电压量测数据异常状态判定模块。

(11)在电压量测数据异常状态判定模块中，比较{ufocus}中样本点与c的大小，大于c的样本点被判定为状态异常，小于c的样本点被判为状态正常。

本发明提供了一种基于多维数据的变电站电压量测数据异常状态自动识别模型及方法，属于电力系统大数据分析领域。利用本发明专利提供的方法，可在变电站监控后台或调度主站上部署一个软件模块，快速准确地在线分析电压量测数据的状态，具有识别精度高，速度快、操作性强的优点。识别精度小于0.5％。

密度聚类算法dbscan介绍：

dbscan(density-basedspatialclusteringofapplicationswithnoise，基于密度的噪声应用空间聚类)是一种基于密度的聚类算法。假定类别可以通过样本分布的紧密程度决定。同一类别的样本，他们之间的紧密相连的，也就是说，在该类别任意样本周围不远处一定有同类别的样本存在。通过将紧密相连的样本划为一类，这样就得到了一个聚类类别。通过将所有各组紧密相连的样本划为各个不同的类别，则我们就得到了最终的所有聚类类别结果。由密度可达关系导出的最大密度相连的样本集合，即为我们最终聚类的一个类别，或者说一个簇。

这个dbscan的簇里面可以有一个或者多个核心对象。如果只有一个核心对象，则簇里其他的非核心对象样本都在这个核心对象的∈∈-邻域里；如果有多个核心对象，则簇里的任意一个核心对象的∈∈-邻域中一定有一个其他的核心对象，否则这两个核心对象无法密度可达。这些核心对象的∈∈-邻域里所有的样本的集合组成的一个dbscan聚类簇。

那么怎么才能找到这样的簇样本集合呢？dbscan使用的方法很简单，它任意选择一个没有类别的核心对象作为种子，然后找到所有这个核心对象能够密度可达的样本集合，即为一个聚类簇。接着继续选择另一个没有类别的核心对象去寻找密度可达的样本集合，这样就得到另一个聚类簇。一直运行到所有核心对象都有类别为止。

聚类算法k-mean介绍：

k-means算法是很典型的基于距离的聚类算法，采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。该算法认为簇是由距离靠近的对象组成的，因此把得到紧凑且独立的簇作为最终目标。具体实施过程如下：

1、从d中随机取k个元素，作为k个簇各自的中心。

2、分别计算剩下的元素到k个簇中心的相异度，将这些元素分别划归到相异度最低的簇。相异度一般用欧氏距离或者马氏距离来运算，距离越小，说明二者之间越相似。

3、根据聚类结果，重新计算k个簇各自的中心，计算方法是取簇中所有元素各自维度的算术平均数。

4、将d中全部元素按照新的中心重新聚类。

5、重复第4步，直到聚类结果不再变化。

6、将结果输出。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴杰;苏少春;滕予非;常晓青;张仕民;宋梁;龙呈;李小鹏;冷代军;刘明忠;张泰
技术所有人：国网四川省电力公司电力科学研究院;国网四川省电力公司检修公司
我是此专利的发明人

上一篇：便于烘干的果蔬熏硫加工设备的制作方法
上一篇：一种用于区分甘蓝品种的InDel引物及其应用的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、邢老师：1.机械设计及理论 2.生物医学材料及器械 3.声发射检测技术。
2、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
3、王老师：1.机器人 2.嵌入式控制系统开发
4、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。