时空联合数据聚类分析的输变电设备状态异常检测方法

文档序号:9811193阅读:343来源:国知局
时空联合数据聚类分析的输变电设备状态异常检测方法
【技术领域】
[0001] 本发明涉及输变电设备检测技术领域,具体是一种时空联合数据聚类分析的输变 电设备状态异常检测方法。
【背景技术】
[0002] 输变电设备在实际运行过程中会受到过负荷、过电压、内部绝缘老化、自然环境等 异常事件影响,这些异常运行状态会导致设备缺陷、故障的发生,所以对输变电设备状态进 行异常检测具有很强的必要性。
[0003] 国内外文献提出了许多输变电设备的异常检测与状态评估技术。《基于MCD稳健统 计分析的变压器油色谱异常值检测及分布特性》采用MCD稳健统计方法进行异常值检测,并 将异常值和正常数据进行单独分析,给出正常油色谱数据的分布规律,《基于贝叶斯网络的 电力变压器状态评估》建立贝叶斯网络对变压器进行状态评估,《基于可拓分析法的电力变 压器本体绝缘状态评估》对变压器本体绝缘状态进行等级划分的基础上,通过构造适当的 评估指标关联函数,进而建立基于物元可拓评价法的变压器本体绝缘状态评估模型,《基于 云理论的电力变压器绝缘状态评估方法》结合油中气体分析、红外色像仪技术与云模型方 法对变压器绝缘状态进行评价,《人工神经网络和信息融合技术在变压器状态评估中的应 用》综合应用人工神经网络和Dempster-ShafeH正据理论构建多信息融合的变压器综合状 态评估模型。
[0004] 目前的输变电设备异常检测方法利用的数据量小,没有充分考虑到历史数据的作 用,并且只考虑了时间维度的数据,没有将时间大数据与地理空间信息结合。设备的状态数 据(包括在线监测、带电检测、预防性试验数据等)具有体量大,种类繁多等特点,常规的数 据处理技术难以对设备状态数据进行全面、深入的分析。近年来大数据技术不断发展,将大 数据技术应用于输变电设备异常检测,可大大提高设备状态数据的利用率,有利于更加全 面,深刻地分析设备状态。输变电设备的某些状态数据与地理空间位置存在一定的关联性, 将空间维度信息与时间维度信息结合考虑,可以更加全面地分析设备的异常情况。

【发明内容】

[0005] 本发明的目的就是为了解决上述问题,提供一种时空联合数据聚类分析的输变电 设备状态异常检测方法,它具有实现状态数据时间与空间维度信息的关联性挖掘的优点。
[0006] 为了实现上述目的,本发明采用如下技术方案:
[0007] 时空联合数据聚类分析的输变电设备状态异常检测方法,包括以下步骤:
[0008] 步骤S1:对输变电设备状态数据的时间分量添加时窗获得时间子序列,通过结合 空间分量以及生成的时间子序列,得到时空子序列;
[0009] 步骤S2:通过使用c均值模糊聚类FCM对时空子序列按不同时窗进行聚类,得到分 块矩阵;进入步骤S3;
[0010] 步骤S3:根据输变电设备状态历史正常数据计算单个时空子序列的异常度值,并 利用步骤S2的分块矩阵对每个时窗的类赋予异常度值,根据异常度值大小判断设备状态的 异常情况。
[0011] 时空联合数据聚类分析的输变电设备状态异常检测方法,还包括:
[0012] 步骤S4:利用步骤S2的分块矩阵建立不同时窗中的各个类之间的模糊关系,并获 得相邻两个时窗之间的模糊关系矩阵,通过模糊关系矩阵观察异常类的发展情况。
[0013] 所述步骤S2:每个分块矩阵中的元素描述分块矩阵对应的时窗中存在的类;
[0014] 所述步骤S3:如果异常度值越高,则说明设备状态存在异常情况的可能性越大。
[0015] 所述步骤S4:每个时窗中都会进行聚类,将每个时窗中的时空子序列分为若干类, 每个时窗对应着分块矩阵,每个时窗中的类对应着分块矩阵中的元素,利用分块矩阵建立 不同时窗中的各个类之间的模糊关系,并获得相邻两个时窗之间的模糊关系矩阵R;
[0016] 模糊关系矩阵R的第i行第j列的元素代表第一个时窗1中的第i类与第二个时 窗W2中的第j类的相关程度,
[0017] rs,t的值越大,则说明第一个时窗I中的第i类与第二个时窗%中的第j类的相关程 度越大,
[0018] 相关程度大说明第二个时窗W2中的第j类是由第一个时窗A中的第i类发展而来 的,由此得出一个时窗中的异常类与相邻时窗中对应的相关类,从而了解异常类的发展情 况。
[0019] 所述步骤S1具体包括:
[0020] 假设有N个数据X1,X2, ...,XN,每个数据由一个空间分量和一个时间分量组成。
[0021] 对于第k个数据xk,有:
[0022] xk= [Xk(s) | Xk(t) ], (1)
[0023] 其中,a(s)代表数据的空间分量,Xk(t)代表数据的时间分量。
[0024] 假设空间分量的维数为r(通常r = 2),时间分量的维数为q,则得到维数为n = r+q 的第k个数据的表达式如公式(2)所示:
[0025] Xk= [xkl(s) , . . . ,Xkr(s) I Xkl(t) , . . . ,Xkq(t) ]τ, (2)
[0026] 其中,Xkr(s)表示第k个数据空间分量的第r个元素,Xkq(t)表示第k个数据时间分 量的第q个元素。
[0027] 假设时窗的长度为1,则第j个时窗中第k个数据的时间子序列Xkj(t)的表达式如公 式(3)所示:
[0028] Xkj(t) = [xk((j-i)*i+i)(t),· · ·,xk(j*i)(t)]T, (3)
[0029] 将第j个时窗中第k个数据的时间子序列与空间分量结合,得到第j个时窗中第k个 数据的时空子序列xkj的表达式如公式(4)所示:
[0030] Xkj = [xki(s), . . . ,xkr(s) I Xk((j-D*i+I)(t), . . . ,xk(j*i)(t) ]τ, (4)
[0031] 所述步骤S2具体包括:
[0032] 利用c均值模糊聚类方法,计算聚类中心以及分块矩阵:

[0035]其中,Vl为第i个聚类中心,ulk为代表分块矩阵的元素,表示第k个数据到第i个聚 类中心的隶属度,
[0037] ch(Vl,xk)表示第i个聚类中心到第k个数据的时空复合距离。λ表示时间分量所占 的权重,Vl(s)表示第i个聚类中心的空间分量,vdt)表示第i个聚类中心的时间分量。
[0038] 通过求得的聚类中心以及分块矩阵对第k个数据进行重构:
[0040]在设定范围内尝试多个不同的λ值,利用重建误差Ε(λ)来评估聚类的质量,选择一 个使重建误差最小的λ值;
[0042]其中,毛表示第k个时空数据的重构值。
[0043]所述步骤S3具体包括:
[0044] 假设^是待检测数据,yk是历史正常数据,Xkj是时空序列Xk在时窗%中的子序列; ykj是时空序列yk在时窗W冲的子序列,用公式(9)计算子序列Xkj的异常度值:
[0045] fkj= | |xkj-ykj | |2, (9)
[0046] 其中,fkj表示第j个时窗中第k个数据时空子序列的异常度值。
[0047] 假设U是对时窗%中时空子序列聚类得到的分块矩阵,对时窗%中的每个子序列的 异常度值进行加权平均得到在时窗W中每个聚类中心对应的类的异常度值~={ Sl,i = l, 2, . . .,Cj},其中
[0049] c沩在时窗W冲类的数目。
[0050] si的值越大,则在时窗Wj中从属于第i类的子序列异常度越高;异常度值越高说明 设备出现异常的可能性越大。
[0051] 81的值越小,则在时窗%中从属于第i类的子序列异常度越低;异常度值越低说明 设备出现异常的可能性越小。
[0052] 所述步骤S4具体包括:
[0053]假设Ui为时窗Wi的分块矩阵,Ui的维数为Cl XN,U2为时窗W2的分块矩阵,U2的维数 Sc2XN,其中N是数据的个数,(^是1]冲类的个数,〇2是1]冲类的个数。
[0054]构建一个维数为C1 X c2的模糊关系矩阵
[0055] R=[ri'j],i = l,2, · · ·,ci, j = l,2, · · ·,C2, (11)
[0056] ri,j表示时窗1中的第i类与时窗此中的第j类的相关程度。
[0057] 用迭代的方式更新R中的项,R中的第s行第t列的元素 ^,*表示为:
[0059] 其中,rs,t(iter+l)表示元素 rs,t示第iter+Ι次的迭代结果。
[0060]〈 >表示rs,t(iter+l)的值限制在[0,1]的区间内,α为正的学习速度,iter为迭代 序号。
[0061 ]通过选用极大极小复合算子,得到:
[0065] uy^k表示分块矩阵1]2第」行第k列的元素,UXl,k表示分块矩阵1^第1行第k列的元素。
[0066] rs,t表示W冲的第s类与W冲的第t类之间的相关程度,rs, t的值越大,则说明两个类 越相关。
[0067]本发明的有益效果:
[0068] 结合了设备状态数据的时间和空间信息,综合考虑其历史数据,可以更加全面地 分析状态数据的异常情况,具有较高的准确性。模糊关系可以从时间发展的维度上观察异 常类的演化情况,能将异常类别的演化情况通过矩阵的形式表征,使得状态数据的结构形 象化、可视化,有利于更好地理解数据,分析数据。
【附图说明】
[0069] 图1(a)为济南地区在线监测导线温度数据图;
[0070] 图1(b)为安丘地区在线监测导线温度数据图;
[0071] 图1(c)为济南地区在线监测环境温度数据图;
[
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1