基于时间序列分析的输变电设备的状态监测数据清洗方法

文档序号:8223556阅读:399来源:国知局
基于时间序列分析的输变电设备的状态监测数据清洗方法
【技术领域】
[0001] 本发明涉及基于时间序列分析的输变电设备的状态监测数据清洗方法。
【背景技术】
[0002] 对设备在线监测、带电检测、离线试验等设备全景状态信息进行全方位分析,提升 输变电设备评价与异常诊断的准确性是设备状态评估诊断技术的发展趋势。输变电设备全 景状态信息呈现来源多、信息异构、数量庞大、属性繁多等特点,其数据往往是不完整的、有 噪声的和不一致的。状态量原始的数据质量往往不能满足后续状态评价模型的要求,因此 在状态评估或诊断分析之前进行数据清洗是必不可少的。数据清洗通过填充缺失值、平滑 噪声数据和识别离群点来提高数据质量,有助于提高数据挖掘过程的准确率和效率。
[0003] 在输变电设备数据清洗方面,国内外现有的研宄较少。文献《基于贝叶斯网络分 类器的变压器综合故障诊断方法》在建立故障与信息的映射关系时将海量数据通过粗糙集 信息熵的方法进行了约简,从而解决了数据缺失的问题,但是破坏了数据自身信息的完整 性。
[0004] 文献《A Kernel Fuzzy c-Means Clustering-Based Fuzzy Support Vector Machine Algorithm for Classification Problems with Outliers or Noises》 和 ((FSVM-CIL: Fuzzy Support Vector Machines for Class Imbalanced Learning〉〉在处理支 持向量机训练集的噪声和异常数据时使用了模型C均值聚类方法,通过计算数据到聚类中 心的距离来分离出噪声数据。但是这种聚类方法将分离出的噪声数据直接剔除,破坏了状 态量数据链的连续性。以上研宄在数据清洗过程中都丢弃了造成了数据的丢失,不利于在 后续状态评估中对数据本身信息的挖掘。

【发明内容】

[0005] 本发明的目的就是为了解决上述问题,提供一种基于时间序列分析的输变电设备 的状态监测数据清洗方法,它具有清洗效率高、保持了数据的完整性、避免数据有用信息丢 失的优点。
[0006] 为了实现上述目的,本发明采用如下技术方案:
[0007] 基于时间序列分析的输变电设备的状态监测数据清洗方法,步骤如下:
[0008] 步骤(1):建立输变电设备状态数据的初始时间序列模型,通过初始时间序列模 型估计初始拟合的残差序列和残差方差;
[0009] 步骤(2):
[0010] 步骤(2-1):利用步骤(1)的初始时间序列模型,计算每个观测点的检验统计量;
[0011] 步骤(2-2):判断检验统计量的绝对值的最大值是否大于设定阈值,如果大于,则 确定存在对初始时间序列模型拟合影响的噪声点,通过修正时间序列数据来修正噪声点, 通过返回步骤(2)继续识别并修正时间序列所有的噪声点,然后进入步骤(2-3);如果小于 就进入步骤(2_3);
[0012] 步骤(2-3):拟合修正后的时间序列模型,估计修正后的时间序列模型的模型残 差;
[0013] 步骤(3):通过步骤(2-3)中修正后的时间序列模型的模型残差计算每个观测点 的检验统计量,根据检验统计量的绝对值的最大值是否大于设定阈值来判断是否存在新的 噪声点,直到所有的噪声点都被识别出,如果存在就返回步骤(2),如果不存在就结束。
[0014] 所述步骤(1)的步骤为:
[0015] 对观测序列zt建立时间序列模型,
[0016] 设Zt是单个状态量的无异常值的时间序列,Z t服从ARIMA(p,d,q)模型,表示为
【主权项】
1. 基于时间序列分析的输变电设备的状态监测数据清洗方法,其特征是,步骤如下: 步骤(1):建立输变电设备状态数据的初始时间序列模型,通过初始时间序列模型估 计初始拟合的残差序列和残差方差; 步骤(2): 步骤(2-1):利用步骤⑴的初始时间序列模型,计算每个观测点的检验统计量; 步骤(2-2):判断检验统计量的绝对值的最大值是否大于设定阈值,如果大于,则确定 存在对初始时间序列模型拟合影响的噪声点,通过修正时间序列数据来修正噪声点,通过 返回步骤(2)继续识别并修正时间序列所有的噪声点,然后进入步骤(2-3);如果小于就进 入步骤(2-3); 步骤(2-3):拟合修正后的时间序列模型,估计修正后的时间序列模型的模型残差; 步骤(3):通过步骤(2-3)中修正后的时间序列模型的模型残差计算每个观测点的检 验统计量,根据检验统计量的绝对值的最大值是否大于设定阈值来判断是否存在新的噪声 点,直到所有的噪声点都被识别出,如果存在就返回步骤(2),如果不存在就结束。
2. 如权利要求1所述的基于时间序列分析的输变电设备的状态监测数据清洗方法,其 特征是,所述步骤(1)的步骤为: 对观测序列Zt建立时间序列模型, 设Zt是单个状态量的无异常值的时间序列,Z t服从ARIMA(p,d,q)模型,表示为
其中,Zt为观测序列,p,q,d为时间序列ARIMA(p,d,q)模型的阶数,Θ⑶为初始拟 合的平稳算子,为初始拟合的可逆算子,et是不含噪声点的序列初始拟合的残差序列, 含,成,·.·,式是Θ⑶中相应的参数,含,色,…,彖是机g)中相应的参数,B表示延迟算子,BdZt =Zt_d,Bd表示延迟d个时刻的延迟算子,Z t表示时刻t的观测值,Z t_d表示时刻t-d的观测 值,▽ d是一个表示t时刻与t-d时刻的观测值间的差值的算子,▽ d= I-B d; 并由所建立的时间序列模型计算初始拟合的残差序列,即:
式⑶中,Zt为观测序列,为含噪声点的序列初始拟合的残差序列,Θ⑶为初始拟 合的平稳算子,为初始拟合的可逆算子,B表示延迟算子,BdZt = Z t_d,Bd表示延迟d个时 刻的延迟算子,Zt表示时刻t的观测值,Z t_d表示时刻t-d的观测值,▽ d是一个表示t时刻与 t-d时刻的观测值间的差值的算子,Vd= I-Bd; π⑶为表征残差影响的算子,先,毛,…,元 为:π⑶相应的参数。
3. 如权利要求2所述的基于时间序列分析的输变电设备的状态监测数据清洗方法,其 特征是,所述π (B)的定义如(9)所示:
(9) 其中,Θ (B)为初始拟合的平稳算子,为初始拟合的可逆算子,η为残差序列长度, η彡I ;Β表示延迟算子,BdZt= Z t_d,元
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1