一种高压加热器状态数据分析方法与流程

文档序号:17540581发布日期:2019-04-29 14:32阅读:267来源:国知局
一种高压加热器状态数据分析方法与流程

本发明涉及数据统计技术领域,特别涉及一种高压加热器状态数据分析方法。



背景技术:

高压加热器是火电机组的发电主要辅助设备之一。长期在高温高压状态下的高压加热器系统,旁路切换、给水泵故障、机组负荷突变等因素都会对其有较大影响,导致高压加热器系统故障频繁发生。目前,高压加热器系统故障已成为仅次于锅炉爆管的,影响机组满发稳发的主要原因之一。高压加热器发生故障就可能引起汽轮机水冲击、降低锅炉的安全性、降低热循环效率减少经济性和造成人员伤亡。

发电企业要考虑提高机组可靠性和发电小时数,降低检测成本减少维修时间,对高压加热器状态预警方面的需要日益增加。因此在高压加热器的过程中,如何在高压加热器发生异常或故障之前进行准确及时的预警,提前发现可能的故障并加以预防和排除非常重要。准确及时的设备预警能够为现场高压加热器维护人员提出判断高压加热器状态的依据,并提醒维护人员是否应该对高压加热器的监测力度加强,能够及时地将高压加热器的隐藏故障发现,同时采取相对应的措施,避免出现人员伤亡与高压加热器损坏的重大后果。传统的基于幅值超限的状态预警方法灵敏度低,一旦报警可能故障已经发生;一些基于设备机理的故障预警方法,由于设备老化等等问题使得机理模型难以精确建立,且有时候机理模型的建立非常复杂却未必能够反应设备的真实情况。此外,一些基于智能算法如人工神经网络等,在数据量较大时收敛性又较差,且不能有效处理设备监测中数据的不确定性与不精确性问题。



技术实现要素:

本申请提供一种高压加热器状态数据分析方法,以解决现有技术中的高压加热器的状态数据分析方法难以处理设备监测中数据的不确定性与不精确性导致不能够反映设备的真实情况的问题。

为解决上述技术问题本发明提供如下技术方案:

一种高压加热器状态数据分析方法,所述方法包括以下步骤:

获取高压加热器状态原始数据;

对所述高压加热器状态原始数据进行预处理得到预处理高压加热器状态数据;

选取高压加热器状态测点;

根据所述高压加热器状态测点,对所述预处理高压加热器状态数据进行简化处理,得到高压加热器状态数据;

将所述高压加热器状态数据进行归一化处理,得到高压加热器状态监测模型的训练样本;

获取所述高压加热器状态数据的最佳聚类个数;

根据所述最佳聚类个数,利用基于遗传模拟退火算法的fcm聚类方法对所述高压加热器状态监测模型的训练样本进行聚类,得到隶属度矩阵;

根据所述隶属度矩阵和所述高压加热器状态监测模型训练样本得到高压加热器状态监测模型。

优选的,所述对所述高压加热器状态原始数据进行预处理得到预处理高压加热器状态数据包括:

对所述高压加热器状态原始数据中的过失误差和随机误差进行处理。

优选的,所述高压加热器状态原始数据包括:主给水流量、抽汽温度、抽汽压力、高压加热器的出口水温、进口水温、水位以及疏水温度。

优选的,所述选取高压加热器状态测点,包括:

选择样本空间;

根据所述选择样本空间,利用主元分析法选取高压加热器状态测点。

优选的,所述将所述高压加热器状态数据进行归一化处理,包括:

利用极差变换法消除所述高压加热器状态数据的量纲。

优选的,所述获取所述高压加热器状态数据的最佳聚类个数,包括:

利用xie-beni有效性指标搜索所述高压加热器状态数据,获取所述高压加热器状态数据的最佳聚类个数。

优选的,所述利用基于遗传模拟退火算法的fcm聚类方法对所述高压加热器状态监测模型的训练样本进行聚类,包括:

利用fcm聚类方法对对所述高压加热器状态监测模型的训练样本进行聚类,得到内层聚类循环结果;

利用遗传算法对所述内层聚类循环结果进行优化调整,得到中间层演化循环结果;

利用模拟退火算法对所述中间层演化循环结果进行优化调整,得到所述隶属度矩阵。

优选的,所述方法还包括:根据所述隶属度矩阵,利用最大隶属度评定原则对所述高压加热器状态监测模型训练样本进行归类,得到优化隶属度矩阵。

本申请实施例提供的高压加热器状态数据分析方法包括以下步骤:获取高压加热器状态原始数据,对所述高压加热器状态原始数据进行预处理得到预处理高压加热器状态数据,选取高压加热器状态测点,根据所述高压加热器状态测点,对所述预处理高压加热器状态数据进行简化处理,得到高压加热器状态数据,将所述高压加热器状态数据进行归一化处理,得到高压加热器状态监测模型的训练样本,获取所述高压加热器状态数据的最佳聚类个数,根据所述最佳聚类个数,利用基于遗传模拟退火算法的fcm聚类方法对所述高压加热器状态监测模型的训练样本进行聚类,得到隶属度矩阵,根据所述隶属度矩阵和所述高压加热器状态监测模型训练样本得到高压加热器状态监测模型;本申请实施例提供的高压加热器状态数据分析方法首先对获取高压加热器状态原始数据进行预处理,通过获取高压加热器状态测点对原始数据进行简化,简化后的数据能够减轻分析问题的难度,减少运算步骤提高效率,之后对简化后的数据进行归一化处理,得到了检测模型的训练样本,根据最佳聚类个数利用基于遗传模拟退火算法的fcm聚类方法对所述高压加热器状态监测模型的训练样本进行聚类,得到隶属度矩阵,基于遗传模拟退火算法的fcm聚类方法能够克服容易陷入局部最优解的缺点,加强全局搜索能力,从而算法具有了更好的收敛性能和全局搜索能力,能够有效的处理设备监测中数据的不确定性与不精确性,从而良好的反映设备的真实情况。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的高压加热器状态数据分析方法的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,为本发明实施例提供的高压加热器状态数据分析方法的流程图。所述方法包括以下步骤:

步骤s1、获取高压加热器状态原始数据;

步骤s2、对所述高压加热器状态原始数据进行预处理得到预处理高压加热器状态数据;

步骤s3、选取高压加热器状态测点;

步骤s4、根据所述高压加热器状态测点,对所述预处理高压加热器状态数据进行简化处理,得到高压加热器状态数据;

步骤s5、将所述高压加热器状态数据进行归一化处理,得到高压加热器状态监测模型的训练样本;

步骤s6、获取所述高压加热器状态数据的最佳聚类个数;

步骤s7、根据所述最佳聚类个数,利用基于遗传模拟退火算法的fcm聚类方法对所述高压加热器状态监测模型的训练样本进行聚类,得到隶属度矩阵;

步骤s8、根据所述隶属度矩阵和所述高压加热器状态监测模型训练样本得到高压加热器状态监测模型。

其中,获取高压加热器状态原始数据指根据高压加热器运行状态进行测量所得到的数据,所指的高压加热器状态原始数据可以包括但不限于主给水流量、抽汽温度、抽汽压力、高压加热器的出口水温、进口水温、水位以及疏水温度。高压加热器状态原始数据是指其运行过程中产生的各种代表状态的信号(即测点的数据)。高压加热器的状态原始数据除蕴涵了高压加热器的有用状态信息外同时还蕴涵了很多未知干扰信息,这些干扰信息对高压加热器状态预警的可靠性和精度具有重要影响。对状态原始数据的预处理,要考虑测量信息的一致性、精准性和完备性。高压加热器运行过程进行参数测量时,测量误差的存在不可避免。状态数据的误差可分为两大类:过失误差与随机误差。

过失误差包括工艺泄漏、设备故障、测量仪表零漂现象、严重时包括测量仪表失灵等,以及对过程不完全地建模。实际过程中,虽然发生过失误差是小概率事件,但是万一发生过失误差将会对测量数据的质量及统计特征严重破坏,导致状态预警算法的失败,因此过失误差的判别、剔除和校正是处理误差的优先及重要环节。

观测量变化率的过失误差(奇异值点)的删除和校正,可以按以下流程进行:

step1:计算当前时刻的观测量变化率的标准差σi;

step2:判断|δxi|与3σi的大小,如果|δxi|<3σi,则为正常观测值,否则为过失误差(奇异点);

step3:如果当前时刻是过失误差,对δxi的正负判断。如果δxi>0,则用xi=xi-1+σi校正并替换该奇异值点;如果δxi<0,则用xi=xi-1-σi校正并替换该奇异值点。

step4:采入下一时刻观测值,重复step1-3的计算过程。

随机误差是受不稳定随机因素的影响,例如不稳定的环境条件、不稳定的仪器和信号夹杂的噪声等,几乎无从避免,但是存在某种统计规律。本申请实施例可以采用小波阈值去噪的方法,小波阈值去噪的基本过程为:将采集到的原始信号进行小波变换,得到各分解层次的小波系数;对小波系数进行阈值处理,得到新的小波系数;对新的小波系数进行小波逆变换,得到重构信号。

本申请优选的实施例采用主元分析法选取高压加热器状态测点。主元分析法是基于原始数据变量,建立一组新的隐综合性变量来减少原始数据变量的维数,简化了复杂度,主要变化信息再从新的投影空间中抽取,并获得统计特征,从而加强对原始数据的变量特性理解。本文利用主元分析法对高压加热器运行状态的大量数据简化,对比得出原变量中对运行状态影响的主要过程变量(即测点)。主元分析法(pca),又称主成分分析法,是一种不依靠于准确数学模型的多元统计分析方法,通过进行降维投影处理高维相关变量空间,得到低维的相互独立变量空间,提取了复杂过程的数据特征,并相应过程的主元模型被建立。主元模型为了保留表征数据变异的主要方向而放弃了部分残差,达到了消除系统干扰和提取系统信息的目的。

具体的,首先选择样本空间,样本空间是具有相关关系的n个变量的m个样本值所构建的数据阵列,其通过主元分析法建立较少的综合性变量,可以更加紧密地反映原始n个变量中含有的变化信息。基本的方法是为确定变化方向的主次位置,要比较数据变化的方差大小,得到按主次排列的各主元,这些都是彼此之间独立的主元。在主元分析法的帮助下,可以提取变化信息以降低数据分析的复杂性。设m*n的矩阵x为原始数据矩阵,其表示m个采样值(或称样本)和n个变量,这些数据的相关性可能是很高,于是导致协方差阵逼近奇异阵,这是一般的数值方法无法去分析。主元分析法的目的就是要构建k(k<n)个新的变量,并尽量能够地使n个变量的原有信息保持,主元就是这k个新变量,它们是两两相互独立的。主元分析是通过对样本信息的提取而确定得到的一些主轴(一个多维正态分布等密度椭球面上的主轴)。这是经典统计学的观点。当数据矩阵维数较多时,这种变量数量的减少无疑会减轻分析问题的难度,减少运算步骤提高效率。

根据得到的高压加热器状态测点,对所述预处理高压加热器状态数据进行简化处理,得到高压加热器状态数据,将所述高压加热器状态数据进行归一化处理,得到高压加热器状态监测模型的训练样本,具体的,可以利用极差变换法消除所述高压加热器状态数据的量纲。归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为标量,极差变换法归一化的公式为:y=(x-mean(x))/(max(x)-min(x))。

聚类分析是数据挖掘的算法之一,通过统计学的聚类分析方法进行数据挖掘。聚类分析通过将大量的数据划分为性质相同的子类,去了解数据的分布情况。聚类就是根据相似性把一组个体分成几个类别。它的目标是尽可能地减小相同类别上的个体之间的距离,并尽可能增大属于不同类别的个体的距离。从而得到一组数据对象的集合即聚类的结果,也称聚类的簇(类)。类中的数据相互类似,而其他类中的数据相互不同。本申请实施例利用基于遗传模拟退火算法的fcm聚类方法对所述高压加热器状态监测模型的训练样本进行聚类。

其中,fcm算法是一种基于目标函数的模糊聚类方法,它把聚类当作为一个非线性约束条件的数学规划问题,通过隶属度柔性模糊划分数据集和最优化求解最佳聚类。fcm算法是最受普遍欢迎,应用最为广泛的模糊聚类算法之一。就是因为其设计简单,而且在计算机上容易实现。fcm聚类算法流程包括:设样本的数据x={x1,x2,…,xn},c类(2≤c≤n)是要将数据样本分成的类数的数目,{a1,a2,…,ac}表示相应的c个类别,u是其隶属度矩阵,uij是样本xj对于类ai的隶属度,v={v1,v2,…,vc}为聚类中心矩阵。则fcm目标函数为:

式中:w为加权系数,w∈[1,+∞];dij为每一样本与聚类中心的距离。j(u,v)为每类样本的特征到聚类中心的加权距离平方和,当j(u,v)数值达到最小,证明聚类效果最优。它要求一个样本对于各个聚类的隶属度值和为1,即:

fcm算法需要提前给定聚类个数c,而实际情况中聚类个数一般都不是已知的。因此,随着聚类个数的不同,得到的聚类结果也不同。我们常常采用有效性指标进行搜索去确定最优聚类的个数,从大量聚类个数中判断出最优的聚类数,从而得到最优的聚类结果。有很多fcm聚类的有效性指标,但一些有效性指标仅和数据的几何结构相关,但和模糊划分隶属度没有关联,必然存在局限性。因此,为了提高聚类精度,本申请实施例采用xie-beni有效性指标(同时考虑了数据的几何结构与数据的隶属度)搜索最佳聚类数。文献指出一种具有较好效果的模糊聚类有效性指标为xie-beni指标,其计算为以下公式:

并且当最优类数c*为聚类数c时,vxb值最小,同时意味着,vxb值越小,得到越好的模糊聚类效果。

搜索区间之间的整数,计算每个整数相应的vxb值,得到vxb值最小的c值即为最优聚类数c*,这就是确定最佳聚类数c*的方法。

它的算法步骤为:step1:归一化处理样本数据,无量纲化。对原始数据采用极差变换方法进行归一化处理,消除量纲,计算公式为:

step2:给定聚类数用下式计算隶属度矩阵u和聚类中心矩阵v:

step3:寻找最优聚类结果。给定聚类数计算各个c对应有效性指标vxb的值,搜索最小的vxb值对应的最佳聚类数c*值。计算最佳聚类数c*对应聚类中心矩阵,即最优分类方式,每个样本数据分配到具体的类别,最优聚类结果被获取。

fcm算法对初始聚类中心敏感,需要人为确定聚类数,容易陷入局部最优解,所以fcm算法本质上是一种局部最优搜索算法。本申请实施例对fcm算法进行改进,将其与模拟退火算法和遗传算法结合,形成基于遗传模拟退火算法的fcm聚类,加强了全局搜索能力。从而算法具有了更好的收敛性能和全局搜索能力。

模拟退火算法可以被分为三大部分:解空间,目标函数和初始解。其求解如下流程:

第一步:随机产生初始解状态x0(算法迭代的初始点);

第二步:退火温度t0初始化(尽量的大);

第三步:在温度tk下,运行如下操作:

(1)产生新的可行解x'(x'为x对应的位于解空间新解);

(2)计算新可行解的目标函数f(x')与旧的目标函数f(x)的增量:δf=f(x')-f(x);

(3)若δf<0则接受新解x'替换当前解x,否则以概率exp(-δf/tk)接受新解x'替换当前解x;

第四步:按一定冷却系数,逐渐降低温度,设定tk+1=αtk为降温函数(冷却系数α为略小于1.00的常数);

第五步:若收敛条件满足,结束退火过程。否则,跳转第三步。

遗传算法通过选择复制、交叉遗传与遗传变异等行为保持优化,促使种群进化,使得最终可以收敛到较优解。选择复制给较大适应性值的个体被选择复制的概率更大,而且加快算法收敛的速度。交叉算子可以由父代个体的部分基因互相替换来寻找出更好的个体。变异操作可以带来新的遗传基因,使得进化具有局部搜索能力。

遗传算法是种群在个体的适应度评估上通过选择算子复制个体,选择旨在于把优化的个体复制遗传到下一代。交叉遗传,种群通过交叉算子遗传个体。交叉算子在遗传算法中起核心作用。父代个体的部分通过某种交换重组产生新的个体再遗传到下一代。基因变异,种群通过变异算子遗传个体。即是对群体中随机挑选个体串,并变动其基因座上的基因值。

本申请实施例的算法为减少了遗传算法在选择参数上的困难,通过对模拟退火算法使用。遗传算法的主要算子是交叉遗传,进化过程主要依靠于它。遗传模拟退火算法交叉遗传每一个确定的个体,并让交叉和变异后的子代和父代之间竞争。要求保持良好的个体,并且可以同时避免过早收敛,所以子代接受玻尔兹曼机制。随着个体的不断进化,逐渐降低温度,也逐渐降低接受恶化解的概率。它有效地利用模拟退火算法的爬山特性,并对收敛速度提高。

本文的遗传模拟退火算法步骤如下:

第一步:控制参数初始化。n为种群规模;pm为变异概率;t为退火初始温度;α为温度冷却参数。

第二步:初始解组随机生成。

第三步:对生成的解组如下执行步骤,直到下一代遗传出来。

(1)对该组中的每一个个体评估其适应度值f(xi)(i=1,2,,,,n)。

(2)随机选择两个个体xi与xj来交叉遗传,并生成两个新个体xi'与xj',然后评估出两个新个体的适应度值f(xi')和f(xj'),然后依照一定概率接受新个体。

(3)个体交叉遗传后执行遗传变异,根据(2)中的方法判断是否接受变异后的新解。

第四步:如果tk+1=αtk,则转第三步。或如果满足收敛条件,则进化过程结束。

利用基于遗传模拟退火算法的fcm聚类方法对所述高压加热器状态监测模型的训练样本进行聚类,得到隶属度矩阵,即可获得任意测点数据隶属于某一类别(高压加热器某一运行状态)的隶属程度,表示该样本点隶属于各已知运行状态的可能性,这些隶属度为新的运行状态点的状态识别提供证据。然后对高压加热器样本数据采用最大隶属度的评定原则进行归类。判定各个高压加热器运行状态样本的隶属类别(高压加热器某一运行状态),确定其物理意义上的“状态类别”,获得最优的聚类结果。这些样本点及其隶属度矩阵即构成了一个高压加热器运行状态监测模型。

运行数据是设备状态的真实反映,利用上述模型对高压加热器的新运行数据所处的运行状态进行识别(即判断该高压加热器处于已知某种状态的可能性),确定其物理意义上的“状态类别”。当高压加热器的运行参数发生变化时,算法可以判断出其运行状态的变化。

以下通过具体的实施例详细说明本申请的内容,高压加热器设备可能发生的c个状态为:ω={ω1,ω2,…,ωc},则设备状态预警证据的表征形式为:

式中,xi为选择的测点向量,mi为定义在设备状态空间ω上的证据,a为mi的焦元用于反映对应于xi的输出变量的可能性取值。

对火电厂提供的历史数据进行预处理后,聚类成2个状态(w1,w2),还有已经使用基于遗传模拟退火算法得到对3754组高压加热器的出口水温、抽汽压力、进口水温、疏水温度和有功功率数据聚类的隶属度矩阵如下表1。xi为第i组数据,wj为第j类别。例如m5(w2)=u52=0.2517,即第5组数据的第2类别为0.2517。

为了验证证据库的合理性,在3754组高压加热器的状态数据中加入10组故障数据,对其进行基于遗传模拟退火算法的fcm聚类,并聚成3类,聚类分别如表2。第3类包含10组数据,而且就是加入的10组故障数据。

表1隶属度矩阵

表2聚类分布

高压加热器的主要状态参数包括:出口水温、给水流量、进口水温、抽汽压力、疏水温度等。使用主元分析法确定高压加热器的运行状态测点出口水温、进口水温、疏水温度和有功功率,因此,加热器的运行状态可由上述4个状态参数确定。给水加热系统中,高压加热器的这4个状态参数有很明显的线性相关性,这可以也作为数据预处理的一种剔除标准,即不满足相应的线性规律的数据可以判定为异常数据进行剔除,以免影响设备状态模型的正确性。此外,在短时间内数值波动很大的数据认为是异常,直接剔除。

从电厂获得状态数据作为训练集样本,对训练集样本进行标准化处理后,进行基于遗传模拟退火算法的fcm聚类。将训练样本点聚为2类时效果最好,即将所有正常的运行状态点分为2种不同的运行状态。在建立好高压加热器的状态模型后,模型中每一个样本点对应一个隶属度,表示该样本点隶属于各已知运行状态的可能性,这些隶属度为新的运行状态点的状态识别提供证据。当高压加热器的运行参数发生变化时,算法可以判断出其运行状态的变化。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1