一种基于多维时间序列的电气设备故障预测方法

文档序号:6547317阅读:199来源:国知局
一种基于多维时间序列的电气设备故障预测方法
【专利摘要】本发明提出一种基于多维时间序列的设备故障预测方法,该方法针对电力系统中高密集采样的在线运行电气测量数据,提出一种多维时间序列的数据挖掘方法,通过历史时间序列训练数据建立与时间序列分解算法、特征事件生成算法和基于关联规则的故障关联关系挖掘算法,与此故障有关联关系的其他设备的变化特征,即“前兆事件”挖掘出来,此关系形成设备故障预测模型,结合在线监测数据,为复杂非线性电气设备的故障预测与判断提供有力支撑。本发明能有效利用设备的海量高密度运行监测历史数据,对电力企业核心设备所可能遭受的故障或冲击进行提前预测,以便及时采取预防措施避免。
【专利说明】一种基于多维时间序列的电气设备故障预测方法
【技术领域】
[0001]本发明属于计算机技术与电力专业交叉的研究领域,具体是提出了针对电力系统的一种基于多维时间序列的设备故障预测方法。
【背景技术】
[0002]在电力行业,有一些设备是维持电网运行的大型设备,如变电站的变压器,发电站的汽轮机、发电机、励磁系统等,这些设备是电力企业设备的核心,如果发生故障,不但会影响企业生产的正常进行,还将造成巨大损失。国内外发生的大型汽轮机严重事故就是典型实例。因此,为了及时采取预防措施,避免不必要的损失,对这些核心设备进行故障预测具有非常重要的意义。
[0003]传统的时间序列预报是用线性模型来拟合数据序列,对线性系统有较好的结果,但不适合对非线性系统的预报。在实际中,由于核心设备与周边设备的拓扑结构复杂,关键核心设备的故障具有突发性,引起其故障的原因可能是外部的冲击或是本体的原因。在当前的研究中经常是通过故障发生时产生的暂态数据,如录波文件、告警等,进行较为独立的单一分析,较难实现对这些故障、冲击的预测。本专利基于多维时间序列历史数据,提出一种设备故障预测的方法,可有效综合利用设备拓扑网上传感器历史监测数据,对其中的信息进行抽样与挖掘,形成准确的预测模式,以达到对核心设备进行在线预测的目的。

【发明内容】
[0004]本发明通过对电力设备的故障点时间序列采样数据及故障点前的历史监测时间序列数据的分析,捕获周边设备、装置发生故障前的变化情况,建立一种通用的基于多维时间序列的分析挖掘方法,通过挖掘捕获关键核心设备发生故障之前,与此故障有关联关系的其他设备的变化特征,即“前兆事件”,达到对故障或冲击进行预测的目标。由于电力系统中的时间序列数据是一种高密度采样数据,采样标准存储方式等各有不同,并且历史时序数据量比较庞大,当前的时序分析算法不能满足当前对故障预测等高级应用的需求,本发明提出一种基于多维时间序列的设备故障预测方法中的三个关键步骤:历史时间序列训练数据建立与时间序列分解、特征事件生成和基于关联规则的故障关联关系挖掘如下详述:
[0005](I)历史时间序列训练数据建立与时间序列分解
[0006]时间序列是一种具有时间信息、并且每一个时间点都由单个或多个变量构成的序列。从时间序列的角度来看,每个数据单元可以被抽象为一个二元组(V,t)。其中:t为时间变量为数据变量,反映数据单元的实际意义,如开关的状态、模拟量的值等。时间序列为一个有限集{(Vo,to),(V1, ti),…},由多个设备多个测量项构成的时间序列数据为多维时间序列。
[0007]建立多维时间序列数据需要对现有的测量数据进行一定的数据转换与规范化。在规范化方面,需要进行时间间隔的统一,比如将电力历史中基于旋转门算法压缩的数据插值为时间、与采样间隔对齐的数据。另外根据设备之间的拓扑关系,如图1所示,将设备的历史数据按照物理连接关系进行逐层分类,分为一次连接,二次连接…η次连接设备。将迭代的范围和时间窗口共同作为迭代调节参数,在训练阶段进行迭代挖掘计算,从而获得满足要求的训练模型。时间窗口 w需要根据实际情况进行多次尝试设定,但至少要大于所有设备正常状态的循环周期,以便对设备的指标变化进行判断。
[0008]电力系统中传感器所采集的时间序列数据的变化受到趋势因素、周期变动因素和不规则扰动因素这三个因素的影响,如图2所示。
[0009]a)趋势因素
[0010]反映了该特征量在一个较长时间内的发展方向,它可以在一个相当长的时间内表现为一种频率较低、变化较慢的行为。这种现象在电力系统中较为常见,比如变压器因介质老化而引起的某种气体含量有随着时间缓慢上升的情况。
[0011]b)周期变动因素
[0012]周期变动因素是测点所采集特征量,受周期性因素变动影响,在一段时间内所形成的一种长度和幅度固定的周期波动。
[0013]c)不规则变动因素
[0014]不规则变动又称随机变动,它是受各种偶然因素影响所形成的不规则变动。
[0015]时间序列y可表示为以上三个因素的函数,即:
[0016]yt = f (Tt, St, It)
[0017]时间序列分解的方法较常用的模型有加法模型yt = Tt+St+It和乘法模型yt =TtXStX It。经过时间序列的周期性分解方法的分解,从原始序列中,得到三个分解因素子序列:趋势因素序列Tt、周期变动因素序列St和不规则变动因素It。
[0018](2)特征事件生成
[0019]时间序列数据具有规模大、短期波动频繁、大量噪声干扰以及非稳态等特点,这使得直接在原始时间序列上进行相似性查询、时间序列分类和聚类、时序模式挖掘等工作不但效率低下,甚至会影响时间序列数据挖掘的准确性和可靠性。因此本专利在对历史时间序列数据进行分解的基础上,提出一种新的时间序列特征描述方法,提取序列主要特征,进而为后续的数据挖掘步骤准备数据。
[0020]本专利针对分解后的因素序列,提出一种时间序列新的模式表示方法:从三种因素序列中提取了其主要特征,并将其特征转换为关联规则挖掘中的样本数据。
[0021]对于趋势序列Tt来说,由于其表示的是长期的趋势,已经去掉了随机的部分,因此采用局部极值点与拐点来描述其变化特征,极值点表示在此时间点前后的采样值由小变大的事件,而拐点是表示趋势变化率的关键点。
[0022]给定时间序列{< X1 = (V1, t)< xn = (vn, tn) > },如果数据点 Xm 满足下面条件之一:
[0023]当l〈m〈n时,存在下标i和j且l<i<m<j;^n使得Vm是Vi,...,Vj中的最小值且ViArm≥R成立;当m = I是即Vm为时间序列的起始数据点时,存在j且m〈j〈 = η是的vm是Vi,...,Vj中的最小值且vj/vm≥R成立;当m = η时,即Vm为时间序列的终止数据点时,存在下标i且1〈 = i〈m使得Vm是Vi,...,Vj中的最小值,且Vj/Vm≥R成立。
[0024]另外本专利关注了函数中斜率变化为零的点即拐点,拐点表明了函数的增长趋势的变换,因此对于采样也非常重要。拐点的二次导数为零,它的离散化表示为:[0025]Δ 2ν [i] = Δ V [i+1] - Δ V [i]
[0026]而其中
[0027]Δ V[i] = v[i+l]-v[i]
[0028]v[i]为时间序列中第i个时间点的值,采样间隔为At。Δν[?]保存了临近两个值之间的差。如果Av[i]Av[i+l] <=0,那么i+Ι次的采样值将同时小于或大于第i和i+2次的采样值。此时,它为一个极值。
[0029]Tt中的极值和拐点对应的特征事件可以标识为趋势变大、趋势变小、趋势增长率变小、趋势增长率变大。
[0030]对于周期序列St来说,序列较为规律,采用序列中的关键特征:周期、幅值、相位来描述其序列。在电力系统正常运行过程中,获得系统正常工作状态下的历史监控数据,用第一步中时间序列分解方法,将建立特征量的正常周期序列关键特征值,建立正常周期特征模型。在训练阶段,将故障样本的周期序列特征值与正常周期特征模型比较,其变化超过设定的阈值则标识为特征事件。
[0031]在分解随机序列It中,通常有一些样本不符合数据模型的一般规则,这些样本和数据集中的其他数据有很大的不同或不一致,而这些数据可能是有测量误差造成的,也可能缘于数据固有的可变性。由于It中数据分布是未知的,采用基于统计学的方法,基于系统正常工作状态下 建立的常态数据统计模型,将反常点检测出来标识为正激励和反激励两种事件,构成关联规则挖掘所依赖的事务数据库中的一项事务。
[0032](3)基于关联规则的故障关联关系挖掘
[0033]经过前两步算法的处理,形成关联规则挖掘的事务数据集:D = IT1, T2,…,TJ。其中Tj (j = I, 2,- ,η)称为事务T ;构成事务T的元素ik(k = I, 2,…,p)被称为项;设0中所有项的集合为I = Ii1, i2,…,im},显然
[0034]关联规则A = >B的支持度就是同时包含项集A和项集B的事务所在事务集合D的所有事务中所占的比例。关联规则A = >B的置信度就是同时包含项集A和项集B的事务在所有事务中所占比例。如果存在关联规则A = >B,其支持度和置信度分别满足用于预设的最小支持度阀值(min_Support)和最小置信度阀值(min_Confidence),则称为强关联规则。强关联规则是故障关联关系存在的可信度较高的潜在规律,具有重要价值。
[0035]关联规则挖掘的基本过程为给定的事务数据集中通过一定的数据挖掘算法搜索满足预设的最小支持度阀值和最小置信度阀值的所有强关联规则。关联规则挖掘的基本过程分为两个阶段:①寻找事务数据库中的所有频繁项集;②由频繁项集产生强关联规则。这两个阶段中,寻找频繁项集最为关键,它决定着关联规则的总体性能。
[0036]表1事务数据集的数据构成
[0037]
【权利要求】
1.一种基于多维时间序列的设备故障预测方法,其特征在于,所述方法分为两个阶段:训练阶段和预测阶段, 其中所述训练阶段为: a)历史时间序列训练数据建立与时间序列分解 对现有的测量数据进行一定的数据转换与规范化:在规范化方面,需要进行时间对齐、时间间隔的统一,另外根据设备之间的拓扑关系,将设备的历史数据按照物理连接关系进行逐层分类,分为广度N次连接的设备,同时提前的时间窗口 w也作为可调整参数,将迭代的范围和时间窗口共同作为迭代调节参数,在训练阶段进行迭代挖掘计算,在迭代中不断调整参数获得最优结果; 在对时间序列分解中,将原始多维时序数据分解得到三个分解因素子序列:趋势因素序列、周期变动因素序列和不规则变动因素,从不同的角度描述时序数据的变化; b)特征事件生成 在此模块中提出一种时间序列新的模式表示方法:从趋势因素、周期变动因素、不规则变动因素三种因素序列中提取了其主要特征,用不同的特征时间模式表示方法来抽取不同的分解序列中的特征事件,并将其特征转换为关联规则挖掘中的事务数据记录; c)基于关联规则的故障关联关系挖掘 关联规则分析所用的事务数据集的记录是由事务项ID和由前两个算法对多维时间序列数据进行分析得到的特征事件构成,表示为设备拓扑网络中设备的某个测量指标分解序列的特征事件,进而采用Aprior算法对事务数据集进行挖掘,算法输出结果是揭示隐含的设备内部故障关联关系的预测规则,即满足一定的支持度和置信度的、设备拓扑网络非核心设备的变化特征与核心设备的故障或冲击事件的关联关系; 所述预测阶段为将一定时间窗口的在线监测时间序列数据用同样的时间序列数据分解、特征生成算法进行特征提取,进而与规则库中的预测规则进行匹配,从而提供故障预测结果给上层高级应用。
【文档编号】G06Q10/04GK103996077SQ201410218375
【公开日】2014年8月20日 申请日期:2014年5月22日 优先权日:2014年5月22日
【发明者】姚浩, 李鹏, 郭晓斌, 许爱东, 陈波, 陈浩敏, 习伟, 段刚, 徐延明 申请人:中国南方电网有限责任公司电网技术研究中心, 南方电网科学研究院有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1