基于栈式降噪自编码器的输变电设备状态异常检测方法和系统与流程

文档序号:16432329发布日期:2018-12-28 20:14阅读:139来源:国知局
基于栈式降噪自编码器的输变电设备状态异常检测方法和系统与流程

本发明涉及一种检测方法和系统,尤其涉及一种对输变电设备异常的检测方法和系统

背景技术

输变电设备在实际运行过程中会受到过异常事件例如电压、过负荷、内部绝缘老化、自然环境影响,这些异常事件会导致输变电设备缺陷或者故障的发生,因此非常有必要对设备状态进行异常检测。

在实际的设备运维中,现有技术通常采用通过简单阈值判定的方法对单一系统的部分设备信息进行异常检测。然而,该利用阈值进行判定的方法具有一定的局限性,一方面其对于状态评价的正确率和设备信息利用率都偏低,另一方面该方法很难检测出设备的故障类别及潜伏性故障,而且相关规范标准中的固定阈值很难和设备运行工况的差异性相结合。

基于此,期望获得一种输变电站设备状态异常检测方法,其可以有效辨识出输变电设备异常运行状态。



技术实现要素:

本发明的目的之一在于提供一种基于栈式降噪自编码器的输变电设备状态异常检测方法,该输变电设备状态异常检测方法根据所获得的强相关监测数据序列利用栈式降噪自编码器进行训练学习获取最优训练参数以及重构表示,随后计算获得重构误差通过核密度估计确定重构误差的上限阈值thd,基于最优训练参数对需要测试的数据(即测试样本)进行测试,通过测试样本的重构误差与上限阈值进行辨识,从而实现输变电设备状态异常检测。

基于上述目的,本发明提出了一种基于栈式降噪自编码器的输变电设备状态异常检测方法,其包括步骤:

(1)获取输变电设备状态在线监测数据,采用关联规则挖掘方法获得输变电设备状态在线监测数据关联性较强的强相关状态参量,根据强相关状态参量的时间序列获得强相关监测数据序列;

(2)将强相关监测数据序列划分为训练样本和测试样本,采用训练样本对栈式降噪自编码器进行训练学习,获得栈式降噪自编码器的最优训练参数,则具有该最优训练参数的栈式降噪自编码器输出训练样本的重构表示;

(3)基于训练样本的重构表示与所述训练样本得到训练样本的重构误差,对训练样本的重构误差进行核密度估计得到误差概率分布情况,以确定重构误差的上限阈值thd;

(4)将所述测试样本输入具有所述最优训练参数的栈式降噪自编码器,输出得到测试样本的重构误差,将测试样本的重构误差与所述上限阈值thd进行比较,基于比较结果输出输变电设备状态的辨识结果。

需要说明的是,考虑到输变电设备在线监测数据为连续变化的数据,因而在采用关联规则挖掘时,可以先对数据预处理,其包括:先将连续的输变电设备在线监测数据离散化,从而实现输变电设备在线监测数据的区段化映射,随后计算所有表征输变电设备状态的状态参数经过划分后的支持度s。支持度s定义为事务x与事务y同时出现在一次事务中的可能性,由事务x和事务y在事务数据库i中同时出现的事务数占总事务的比例估计,反映事务x与事务y同时出现的可能性,而在本案中,事务x表示输变电设备缺陷和故障发生的事件,而事务y则表示某一个表征输变电设备状态的状态参数,通过支持度s用来分析输变电设备缺陷和故障发生原因同状态参数之间的相关性,进而分析故障发展的客观规律,得到频繁序列,由频繁序列提取故障发展的关联规则,其具体过程如下所述:

设d是包含多元时间序列的数据集,d={a,b,c…n},在本案中,d是由n个表征输变电设备状态的状态参数的时间序列构成,而a,b,c……n则表示某个输变电设备状态的状态参数的时间序列,其由输变设备状态在线监测数据按照时间排列获得。

对d进行等长度的划分,形成q个有限长度的滑动窗口t=<t1,t2,…,tq>,则t1={a1,b1,c1,…},设最小支持度阈值为minsup,单个频繁序列组合记为k-序列,代表序列个数为k个,其算法流程如下:

(1)设k初始值为k=1.

(2)从第i个滑动窗口ti开始找出所有的频繁1-序列

(3)k=k+1,产生候选k-序列

(4)识别包含在ti中的所有候选,产生的候选k-序列的集合为sunsequence(ck,ti),即cti=sunsequence(ck,ti)

(5)计算每个候选k-序列的支持度计数增值;

(6)遍历每个滑动窗口中的数据序列,即i从1至q,计算每个候选k-序列对于所有滑动窗口的平均支持度。若频繁序列fk为空集则算法终止,否则将平均支持度超过minsup的频繁序列fk提取出来,获得频繁序列k-序列。

(7)当某个频繁序列是另一频繁序列的子集时,则将两个序列合并,成为新的频繁序列,最终获得的频繁序列即为强相关监测数据序列。

进一步地,在本发明所述的基于栈式降噪自编码器的输变电设备状态异常检测方法中,在所述步骤(3)中,当测试样本的重构误差≤上限阈值thd时,则辨识结果为输变电设备状态正常;当测试样本的重构误差>上限阈值thd且强相关监测数据序列中与测试样本数据强相关的协同状态数据的重构误差≤上限阈值thd,则辨识结果为输变电设备状态正常;当测试样本的重构误差>上限阈值thd且该测试样本的检测数据值为0或固定不变的值时,则辨识结果为输变电设备状态正常;当测试样本的重构误差>上限阈值thd且强相关监测数据序列中与测试样本数据强相关的协同状态数据的重构误差>上限阈值thd,则辨识结果为输变电设备状态异常。

需要说明的是,当测试样本的重构误差≤上限阈值thd时,即测试样本的数据不包含呈现异常的数据例如奇异点或缺失值,因而,测试样本的数据为无损数据,因此,辨识结果为输变电设备状态正常;当测试样本的重构误差>上限阈值thd且同时段或滞后或超前一定时段的强相关状态量的重构误差≤上限阈值thd,即测试样本的数据中,呈现异常的数据为奇异点或短时缺失值,因此,辨识结果为输变电设备状态正常;当测试样本的重构误差>上限阈值thd且该测试样本的检测数据值为0或固定不变的值时,即测试样本的数据中呈现异常的数据为缺失值,因此,辨识结果为输变电设备状态正常;当测试样本的重构误差>上限阈值thd且同时段或滞后或超前一定时段的强相关状态量的重构误差>上限阈值thd,即测试样本的数据在该时段内出现突变量,导致所获得的强相关状态量受到影响,因而,此时输变电设备发生异常或故障,因此,辨识结果为输变电设备状态异常。

此外,强相关监测数据序列中与测试样本数据强相关的协同状态数据是指强相关监测数据序列中与测试样本关联性较强的状态参数的时间序列中的数据,例如测试样本为2018年5月1日10时-11时的co检测数据,而与co关联性较强的状态参数的时间序列为co2时间序列,则协同因素状态数据可以为测试样本同一时间段的co2检测数据,也可以为2018年5月1日11时-12时的co2检测数据,也可以为2018年5月1日9时-10时的co2检测数据。

强相关监测数据序列中与测试样本数据强相关的协同状态数据的重构误差的获得过程与测试样本的获得过程相同,因而,在此不再赘述。

进一步地,在本发明所述的基于栈式降噪自编码器的输变电设备状态异常检测方法的步骤(3)中,在基于训练样本的重构表示与所述训练样本得到训练样本的重构误差时,采用平均绝对误差来计算获得所述重构误差。

进一步地,在本发明所述的基于栈式降噪自编码器的输变电设备状态异常检测方法的步骤(3)中,在对训练样本的重构误差进行核密度估计得到误差概率分布情况时,以高斯函数为核函数,以重构误差作为核函数的输入,对重构误差进行近似估计,以得到误差概率分布情况。

在一些实施方式中,核密度估计采用的核函数为高斯函数,高斯函数的窗宽为2.5801×10-4

进一步地,在本发明所述的基于栈式降噪自编码器的输变电设备状态异常检测方法的步骤(3)中,在确定重构误差的上限阈值thd时,根据误差概率分布情况所制得的函数图像中对应点对应的纵坐标值为重构误差的上限阈值thd。

进一步地,在本发明所述的基于栈式降噪自编码器的输变电设备状态异常检测方法中,所述的强相关状态参量包括设备中溶解的气体含量、设备油温、设备运行电力数据以及设备环境数据的至少其中之一。

更进一步地,在本发明权所述的基于栈式降噪自编码器的输变电设备状态异常检测方法中,所述的设备中溶解的气体含量包括co、co2、h2、ch4、c2h4的至少其中之一的气体含量。

更进一步地,在本发明所述的基于栈式降噪自编码器的输变电设备状态异常检测方法中,所述的设备油温包括顶层油温、底层油温或绕组温度的至少其中之一。

更进一步地,在本发明所述的基于栈式降噪自编码器的输变电设备状态异常检测方法中,所述的设备运行电力数据包括负荷、铁芯接地电流、套管介损的至少其中之一。

更进一步地,在本发所述的基于栈式降噪自编码器的输变电设备状态异常检测方法中,所述的设备环境数据包括环境湿度和/或环境温度。

相应地,本发明的另一目的在于提供一种基于栈式降噪自编码器的输变电设备状态异常检测系统,通过该输变电设备状态异常检测系统可以有效辨识出输变电设备异常运行状态。

基于上述目的,本发明提出了一种基于栈式降噪自编码器的输变电设备状态异常检测系统,其包括:

数据库,其存储有输变电设备状态在线监测数据;

栈式降噪自编码器,从数据库中获取输变电设备状态在线监测数据,采用关联规则挖掘方法获得输变电设备状态在线监测数据关联性较强的强相关状态参量,根据强相关状态参量的时间序列获得强相关监测数据序列,将强相关监测数据序列划分为训练样本和测试样本;

其中,采用训练样本对栈式降噪自编码器进行训练学习,获得栈式降噪自编码器的最优训练参数,则具有该最优训练参数的栈式降噪自编码器输出训练样本的重构表示;基于所述训练样本的重构表示与训练样本得到训练样本的重构误差,对训练样本的重构误差进行核密度估计得到误差概率分布情况,以确定重构误差的上限阈值thd;将所述测试样本输入具有所述最优训练参数的栈式降噪自编码器,输出得到测试样本的重构误差,将测试样本的重构误差与所述上限阈值thd进行比较,基于比较结果输出输变电设备状态的辨识结果。

进一步地,在本发明所述的基于栈式降噪自编码器的输变电设备状态异常检测系统中,当测试样本的重构误差≤上限阈值thd时,则辨识结果为输变电设备状态正常;当测试样本的重构误差>上限阈值thd且强相关监测数据序列中与测试样本数据强相关的协同状态数据的重构误差≤上限阈值thd,则辨识结果为输变电设备状态正常;当测试样本的重构误差>上限阈值thd且该测试样本的检测数据值为0或某定值时,则辨识结果为输变电设备状态正常;当测试样本的重构误差>上限阈值thd且强相关监测数据序列中与测试样本数据强相关的协同状态数据的重构误差>上限阈值thd,则辨识结果为输变电设备状态异常。

本发明所述的基于栈式降噪自编码器的输变电设备状态检测方法和系统根据所获得的强相关监测数据序列利用栈式降噪自编码器进行训练学习获取最优训练参数以及重构表示,随后计算获得重构误差通过核密度估计确定重构误差的上限阈值thd,基于最优训练参数对需要测试的数据(即测试样本)进行测试,通过测试样本的重构误差与上限阈值进行辨识,从而实现对输变电设备状态异常检测的有效辨识。

附图说明

图1为本发明所述的基于栈式降噪自编码器的输变电设备状态异常检测方法在一种实施方式下的方法示意图。

图2为本发明所述的基于栈式降噪自编码器的输变电设备状态异常检测方法在一种实施方式下的工作流程示意图。

具体实施方式

下面将结合说明书附图和具体的实施例对本发明所述的基于栈式降噪自编码器的输变电设备状态异常检测方法和系统做进一步的解释和说明,然而该解释和说明并不对本发明的技术方案构成不当限定。

在本实施方式中,基于栈式降噪自编码器的输变电设备状态异常系统包括数据库以及栈式降噪自编码器,其中,数据库存储有输变电设备状态在线监测数据。而栈式降噪自编码器从数据库中获取输变电设备状态在线监测数据,采用关联规则挖掘方法获得输变电设备状态在线监测数据中关联性较强的强相关状态参量,根据强相关状态参量的时间序列获得强相关监测数据序列。

其中,采用训练样本对栈式降噪自编码器进行训练学习,获得栈式降噪自编码器的最优训练参数,则具有该最优训练参数的栈式降噪自编码器输出训练样本的重构表示;基于所述训练样本的重构表示与训练样本得到训练样本的重构误差,对训练样本的重构误差进行核密度估计得到误差概率分布情况,以确定重构误差的上限阈值thd;将所述测试样本输入具有所述最优训练参数的栈式降噪自编码器,输出得到测试样本的重构误差,将测试样本的重构误差与所述上限阈值thd进行比较,基于比较结果输出输变电设备状态的辨识结果。

该输变电设备状态异常系统所采用的方法包括步骤:

(1)获取输变电设备状态在线监测数据,采用关联规则挖掘方法获得输变电设备状态在线监测数据关联性较强的强相关状态参量,根据强相关状态参量的时间序列获得强相关监测数据序列;

(2)将强相关监测数据序列划分为训练样本和测试样本,采用训练样本对栈式降噪自编码器进行训练学习,获得栈式降噪自编码器的最优训练参数,则具有该最优训练参数的栈式降噪自编码器输出训练样本的重构表示;

(3)将训练样本的重构表示与训练样本进行计算得到训练样本的重构误差,根据训练样本的重构误差进行核密度估计得到误差概率分布情况,从而确定重构误差的上限阈值thd,其中,核密度估计采用的核函数为高斯函数,采用平均绝对误差来计算重构误差,根据误差概率分布情况所制得的函数图像中对应点对应的纵坐标值为重构误差的上限阈值thd,高斯函数的窗宽为2.5801×10-4。;

(4)基于最优训练参数对测试样本进行测试,输出得到测试样本的重构误差,将测试样本的重构误差与上限阈值thd进行辨识,并输出辨识结果。

在上述方法中,栈式降噪自编码器将训练样本和测试样本作为输入数据x输入时,随机对x添加噪声,噪声可以为0或白噪声,使得数据x中含有一定比例的染躁数据进行破获污染得到,该比例成为数据破坏率,而栈式降噪自编码器中的隐藏层特征y可用下式表示:

式中:θ=(w,b)为编码模型参数;w为d'*d维的编码权值矩阵;b为d'维的偏置向量;σ函数表示激活函数。

经过解码,隐藏层特征y的重构表示z如下式所示:

z=gθ'(y)=σ(w'y+b')

式中:θ'=(w',b')为解码模型参数;w'为d*d'维解码权值矩阵,b'为d维的偏置向量。

通过输入训练样本对栈式降噪自编码器,可以获得编码模型参数θ和解码模型参数θ’,而通过最小化重构误差训练获得最佳训练参数。

而重构误差则通过计算输入数据x与重构表示z获得,如下式所示

l2(x,z)=||x-z||2,xi∈r

而核密度估计中,核函数为高斯函数,窗宽为2.5801*10-4,为了评估栈式降噪自编码器模型的训练性能,使用平均绝对误差(meanabsolutedeviation,mae)来计算训练样本的重构误差,如下式所示:

其中m是输入数据的总数,n是每个输入数据的维数。经训练,得到训练样本的输入数据与重构表示的mae,在核密度估计的误差概率分布情况所制得的函数图像中,横坐标上(1-mae)对应的纵坐标值为上限阈值thd。

图1为本发明所述的基于栈式降噪自编码器的输变电设备状态异常检测方法在一种实施方式下的方法示意图。

如图1所示,考虑到输变电设备在线监测数据为连续变化的数据,因而在采用关联规则挖掘时,可以先对数据预处理,其包括:先将连续的输变电设备在线监测数据离散化,从而实现输变电设备在线监测数据的区段化映射,随后计算所有表征输变电设备状态的状态参数经过划分后的支持度s。支持度s定义为事务x与事务y同时出现在一次事务中的可能性,由事务x和事务y在事务数据库i中同时出现的事务数占总事务的比例估计,反映事务x与事务y同时出现的可能性,而在本案中,事务x表示输变电设备缺陷和故障发生的事件,而事务y则表示某一个表征输变电设备状态的状态参数,通过支持度s用来分析输变电设备缺陷和故障发生原因同状态参数之间的相关性,进而分析故障发展的客观规律,得到频繁序列,由频繁序列提取故障发展的关联规则,其具体过程如下所述:

设d是包含多元时间序列的数据集,d={a,b,c…n},在本案中,d是由n个表征输变电设备状态的状态参数的时间序列构成,而a,b,c……n则表示某个输变电设备状态的状态参数的时间序列,其由输变设备状态在线监测数据按照时间排列获得。

对d进行等长度的划分,形成q个有限长度的滑动窗口t=<t1,t2,…,tq>,则t1={a1,b1,c1,…},设最小支持度阈值为minsup,单个频繁序列组合记为k-序列,代表序列个数为k个,其算法流程如下:

(1)设k初始值为k=1.

(2)从第i个滑动窗口ti开始找出所有的频繁1-序列

(3)k=k+1,产生候选k-序列

(4)识别包含在ti中的所有候选,产生的候选k-序列的集合为sunsequence(ck,ti),即cti=sunsequence(ck,ti)

(5)计算每个候选k-序列的支持度计数增值;

(6)遍历每个滑动窗口中的数据序列,即i从1至q,计算每个候选k-序列对于所有滑动窗口的平均支持度。若频繁序列fk为空集则算法终止,否则将平均支持度超过minsup的频繁序列fk提取出来,获得频繁序列k-序列。

(7)当某个频繁序列是另一频繁序列的子集时,则将两个序列合并,成为新的频繁序列,最终获得的频繁序列即为强相关监测数据序列。

其中,各个表征输变电设备状态的状态参数最终确定关联性较强的状态参数,即为强相关状态参数,在本实施方式中,强相关状态参量包括设备中溶解的气体含量、设备油温、设备运行电力数据以及设备环境数据,而设备中溶解的气体含量包括co、co2、h2、ch4、c2h4,而设备油温包括顶层油温、底层油温或绕组温度,而设备运行电力数据包括负荷、铁芯接地电流、套管介损,并且设备环境数据包括环境湿度和环境温度。需要说明的是,在这种实施方式中,以上只列出了变压器的状态监测数据而没有列出输电设备的状态监测数据,其仅是作为说明本技术方案的例子,本领域内的技术人员知晓,在其他的实施方式中,状态监测数据还可以包括输电设备的状态监测数据。

表1.显示了采用关联规则挖掘方法获得强相关状态参量的挖掘结果。

表1.

图2为本发明所述的基于栈式降噪自编码器的输变电设备状态异常检测方法在一种实施方式下的工作流程示意图。

结合图1和图2可以看出,当测试样本的重构误差≤上限阈值thd时,即测试样本的数据不包含呈现异常的数据例如奇异点或缺失值,因而,测试样本的数据为无损数据,因此,辨识结果为输变电设备状态正常;当测试样本的重构误差>上限阈值thd且强相关监测数据序列中与测试样本数据强相关的协同状态数据的重构误差≤上限阈值thd,即测试样本的数据中,呈现异常的数据为奇异点或短时缺失值,因此,辨识结果为输变电设备状态正常;当测试样本的重构误差>上限阈值thd且该测试样本的检测数据值为0或固定不变的值时,即测试样本的数据中呈现异常的数据为缺失值,因此,辨识结果为输变电设备状态正常;当测试样本的重构误差>上限阈值thd且强相关监测数据序列中与测试样本数据强相关的协同状态数据的重构误差>上限阈值thd,即测试样本的数据在该时段内出现突变量,导致所获得的强相关状态量受到影响,因而,此时输变电设备发生异常或故障,因此,辨识结果为输变电设备状态异常。

由此可以看出,本案的基于栈式降噪自编码器的输变电设备状态检测方法和系统根据所获得的强相关监测数据序列利用栈式降噪自编码器进行训练学习获取最优训练参数以及重构表示,随后计算获得重构误差通过核密度估计确定重构误差的上限阈值thd,基于最优训练参数对需要测试的数据(即测试样本)进行测试,通过测试样本的重构误差与上限阈值进行辨识,从而实现对输变电设备状态异常检测的有效辨识。

需要说明的是,本发明的保护范围中现有技术部分并不局限于本申请文件所给出的实施例,所有不与本发明的方案相矛盾的现有技术,包括但不局限于在先专利文献、在先公开出版物,在先公开使用等等,都可纳入本发明的保护范围。

此外,本案中各技术特征的组合方式并不限本案权利要求中所记载的组合方式或是具体实施例所记载的组合方式,本案记载的所有技术特征可以以任何方式进行自由组合或结合,除非相互之间产生矛盾。

还需要注意的是,以上所列举的实施例仅为本发明的具体实施例。显然本发明不局限于以上实施例,随之做出的类似变化或变形是本领域技术人员能从本发明公开的内容直接得出或者很容易便联想到的,均应属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1