一种基于模糊集关联规则的火电机组运行参数优化方法

文档序号:6310004阅读:235来源:国知局
专利名称:一种基于模糊集关联规则的火电机组运行参数优化方法
技术领域
本发明涉及一种基于模糊集关联规则的火电机组运行参数优化方法,具体涉及利用自动构建模糊集数据挖掘技术确定重要可控运行参数与供电煤耗率之间的定量关联规贝U,从而得到具体工况下的运行参数的优化目标值,它为运行人员提供了机组在不同外部条件(如负荷、煤质、外部环境温度)下的最佳运行参数定值,优化的结果是使机组的供电煤耗率较低,达到较高的经济效益。属于火电厂热工过程节能优化控制技术领域。
背景技术
火电机组提高其经济性的一个重要手段就是通过运行优化控制,使机组的可调运行参数处于优化值,降低火力发电的煤耗率、电耗率等,以提高机组的经济性。而运行优化目标值反映当前运行工况条件下机组所能达到的最佳参数,为运行人员提供机组在特定负荷及外部条件下的最优运行参数,从而为电厂经济运行、操作指导与节能优化控制改造提供理论指引。因此合理确定运行参数的优化目标值,具有十分重要的意义。传统的电站运行参数优化方法需要建立精确的数学模型,应用受到很大局限。并且由于电力数据自身的多元性、动态性与交连性,给数据分析和处理带来困难。数据挖掘技术作为一门新兴学科,有效地解决了这方面的问题,它能够在人工干预很少的情况下,处理复杂的数据信息,提取知识规则。近年来有学者开始投入到基于数据挖掘的电厂运行理论研究中,主要思想是由于运行参数是连续数值属性,因此采用分区技术,将数值属性域划分成一个个区间,转化成量化属性,然后利用数据挖掘算法从电站运行历史数据中挖掘定量关联规则,以指导优化运行,解决了传统优化目标值确定方法中对机组实际状态考虑不足而失去指导意义的问题。但存在的不足是算法量化属性域上的模糊集必须由用户或行业专家定义,当数据量大,在缺乏先验知识的情况下,很难确定合适的模糊集,从而影响挖掘结果的质量。在凝汽式火电机组中,供电煤耗率可以较全面的反映机组的经济性,因此本专利申请是对影响机组供电煤耗率的主要可控参数在稳定运行工况下的历史数据进行挖掘,以确定机组特定工况下主要运行参数的优化目标值。

发明内容
I、目的有鉴于此,本发明的目的是提供一种基于模糊集关联规则的火电机组运行参数优化方法,它是对影响机组运行优化的主要可控参数,包括主蒸汽压力、主蒸汽温度、再热蒸汽温度、凝汽器真空、锅炉给水温度、锅炉排烟温度、过量空气系数、循环水入口温度等参数,在典型负荷稳定运行工况下的历史数据进行分析,利用自动构建模糊集数据挖掘技术挖掘出相关关联规则,确定机组供电煤耗率较低时的运行参数优化目标值,再通过回归分析,得到各参数在确定工况下的运行优化曲线。2、技术方案为达到上述目的,本发明的技术方案是这样的 如图I所示,本发明一种基于模糊集关联规则的火电机组运行参数确定方法,该方法包括以下步骤步骤I.数据选取;在火电机组的运行过程当中,运行参数被实时地存储在历史数据库中。因此,若要对机组某些性能进行分析的话,首先需要确定影响该性能的若干因素参数,然后选择读取数据的时间段和采样频率,最后通过查询厂级监控信息系统,利用通讯方式将这些参数的数据读取出来,这些数据也称之为采样数据,这也是其它工作的基础。步骤2.数据预处理与工况划分;数据预处理是为了从采样数据中得到处于稳态运行工况下的数据。当机组运行工况相距稳态太远时,说明机组的运行参数处于动态变化过程中,得到的参数最优值将不能对机组稳态的运行参数进行指导,因此应该选择机组在典型负荷稳态运行工况下的数据进行分析,用于数据挖掘的数据应处于稳态或准稳态运行工况。通常情况下,当进行数据挖掘的参数数据在某一时间段内的方差小于某一阈值,即可认为得到该稳定运行工况下的运行数据。数据预处理得到稳态运行数据后,接下来进行工况划分。通常,机组运行外部条件并不是一致的,受一些不可控因素的影响,因此有必要对这些外部条件进行划分,对各个工况具体分析,以便得到各工况下的优化运行曲线,这样才具有实际指导意义。划分的依据是首先确定对机组性能具有较大影响的外部因素,然后以它们的参数为依据对工况进行划分,划分的原则是保证每个工况内负荷段覆盖整个运行区域。步骤3.模糊集构建;
对于典型负荷具体工况下的数据,首先进行模糊集构建,为模糊关联规则做准备。聚类分析是对群体及成员进行分类的递归过程。不同于传统的划分,聚类是一种无导师指导的学习过程。可以将数据对象分成多个类或簇,使同一簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。对于本专利申请,要求所选取的聚类算法具有可伸缩性,算法的时间复杂度不能太高,结果对输入数据顺序不敏感。以选用的K-means聚类算法为例,将具体工况下的数据按照负荷分成k类。K-means采用欧式距离作为相似性的评价指标,即认为2个样本的距离越近,其相似性就越大。欧氏距离形式如下β(Χ^) = {ΣΝ-^|2}其处理流程如下首先随机地选择k个对象,每个对象初始的代表一个簇的平均值或中心。然后对剩余的每个对象,根据其与各个簇中心的距离,将它赋予最近的簇,接下来重新计算每个簇的平均值。这一过程不断重复,直到准则函数收敛。通常,采用平方误差
准则,其定义如下式
k^ = ΣΣΙ^-^Γ
i-\ P1EC1这里E是数据库中所有对象的平方误差的总和,p是空间中的点,表示给定的数据对象,%是簇Ci中的平均值(P和Hli都是多维的)。这个准则试图使生成的结果簇尽可能地紧凑和独立。设A为量化属性,其域为[La Ra] , Iivr2,是A的k个聚类中心,且!Ti < ri+1,i = 1,2…k。以下根据k个聚类,将量化属性域划分成k个区间,构造正规模糊集,并允许两相邻模糊集的边界有P%的重叠。定义模糊集的支集上确界(最小的上界)和下确界(最大的下界),如图6所示。定义如下对以rji = 1,2,…,k-Ι)为聚类中心的聚类对应的模糊集Fi,其支集上确界Bi= Γ +0. 5(l+p% ) (ri+1-ri)。而以rk为聚类中心的聚类对应的模糊集Fk,其支集上确界Bk为Ra。
对以!TiQ = 2,3, ···, k)为聚类中心的聚类对应的模糊集Fi,其支集下确界IDi =r-O. 5(l+p% ) (A-Iv1)。以Γι为聚类中心的聚类对应的模糊集F1,其支集下确界、为LA。对以= 1,2,3,…,k)为聚类中心的聚类对应的模糊集Fi,其核(Fi)1Q = 2,3,…k-Ι)的下确界为Bp1,上确界为bi+1 ;其核(F1)1的下确界为La,上确界为b2 ;其核(Fk)1的下确界为Blrf,上确界为Ra。步骤4.模糊关联规则;模糊关联规则是形如j 15的蕴含式,其中化/,5 c /,并且ΑΠΒ=Φ,即A、B是两个模糊项目集,并且这两个模糊项目集中没有共同的项目。规则^ β都是以最小支持度和最小置信度为选择标准,其支持度s描述了数据项集Α、Β同时出现在同一事物中的概率,置信度c是指出现了数据项集A的事务中,数据项集B出现的概率。分别表示如下s(A ^ B) = S(AvjB) = Yjμ(ΑyjB)/\D\
/=1c(A ^B) = s(A^jB)/s(A)
n/ mμ(Α)
^=I/ y=i上式中,μ (A)为A的隶属函数;|D|表示数据集中的事务总数。数据挖掘的目的在于找出可信且有代表性的规则,最小支持度Smin和最小置信度Cmin指定了支持度和置信度的阀值,它们分别规定了关联规则成立必须达到的最小支持度和置信度,即A B(s(A ^ B) > smin, c(A ^B)> cmin)模糊关联规则挖掘算法首先把每一属性转化为用隶属函数表示的模糊变量值,然后计算事务数据库中各属性对应模糊集的权值。本发明采用改进的模糊关联规则,算法流程如图2所示,在基于Apriori算法上主要有2点改进(I)由流程图可知,每次在计算候选集的支持度时都要重新扫描整个数据库,算法时间消耗较大。因此,引入剪枝策略如下式所示,可以减少候选集数量,进而减少挖掘时间,这对于处理机组大量数据是必要的。Dsup (XYZ) ^ Dsup (XY) +Dsup (XZ) -Dsup (X)(2)传统的Apriori算法仅采用“候选集_频繁集”的模式,这样会产生一些冗余的规则,因此人们引入了兴趣度(Interest)的概念。本发明采用兴趣度的定义,如下式所示,兴趣度函数I的值越大,规则越有实际指导意义。
P(B)-
(I-P(A))x(\-P(AuB))
模糊关联规则挖掘的输出是以规则集的形式,本发明中其数学描述为机组运行参数P1 = V1时I机组性 能参数Q1 = W1,这里机组运行参数和性能参数分别指机组运行主汽压力、供电煤耗率。步骤5.回归分析;对以每个典型负荷为中心的小区间,选择规则中供电煤耗率较小的区间对应的参数运行区间作为该参数在该负荷下的最优值区间,就可以得到各参数的一组运行优化目标值。一般情况下,为了保证计算结果的准确和计算方法的简便,火电机组运行曲线多采用二次多项式的曲线拟合方法,最后通过最小二乘拟合得到具体工况下的运行优化曲线,用于指导运行人员调整相应设备或控制器参数以优化运行。其中,步骤3中所述的模糊集构建分为以下2个步骤I)利用已知的聚类算法对数据进行聚类,求出各聚类的中心;2)由聚类的中心构建量化属性域上模糊概念对应的模糊集,并导出隶属函数。3、优点及功效与目前的将关联规则应用于火电机组运行参数定值优化方法相比,本发明改进在于应用了改进模糊聚类算法来自动生成模糊集及隶属函数,更加符合数据的分布特点而不依赖于用户或行业专家的定义,使挖掘结果更加准确和智能。


图I本发明的基于数据挖掘的火电机组运行参数优化流程2模糊关联规则算法流程3从实时/历史数据库提取数据的通讯架构图4确定工况下锅炉给水温度-供电煤耗率关联规则散点5确定工况下锅炉给水温度运行优化曲线图6模糊集的支集隶属函数关系图7梯形隶属函数
具体实施例方式为使本发明的目的、技术方案和优点表达的更加清楚明白,下面结合附图及具体实例对本发明再作进一步详细的说明。本发明的主要思想是利用自动构建模糊集关联规则数据挖掘技术确定火电机组优化运行参数定值。本实例所采样数据来源于某发电厂2009年8-9月两个月的数据,共有43920组。采样数据包括煤质系数、循环水入口温度、主蒸汽压力、主蒸汽温度、再热蒸汽温度、凝汽器真空、排烟温度、锅炉给水温度、供电煤耗率和负荷。见图I,本发明一种基于关联规则的火电机组运行参数优化定值确定方法,该方法具体步骤如下步骤I.数据选取; 用户将先发请求给服务目录,服务目录通过里面包含的信息找到包含这些数据服务的地址,然后返回给用户,用户因此得以与所需的服务通讯,获得需要的数据。其通讯架构如图3所示。步骤2.数据预处理与工况划分;
文件中存储的是2009. 8-2009. 9月两个月的数据。以主蒸汽压力为例,由于主蒸汽压力是最敏感的测点,可以认为某段时间内主蒸
汽压力基本稳定时,该时段内的运行工况是稳定的。具体的判断公式如下
t _ 2Σ [Pimain ~~Pmai ) <ξ i=t-d该式表示主蒸汽压力;4,. 在时间段[t_d,t]内的方差小于阈值ξ UPimairt植时间段内的均值。得到稳定工况所在时间段[t_d,t]后,即可得到该稳定运行工况下的运行数据。此部分对应图中稳态数据筛选部分。其中d由有关设备的热惯性或质量惯性来确定。稳态阈值由用户自己输入设定数值。主要以煤质系数、循环水入口温度对工况进行划分,并同时使每个工况内负荷段覆盖整个运行区域。这里选为10分钟,阈值ξ设为O. 05。最后得到30380条稳态数据,对应的煤质系数取值为[2. 08-3. 33],循环水入口温度取值为[20.21-34.92]。然后进行工况划分,煤质系数以O. 45为一度,循环水入口温度以5为一度进行划分,最终得到9个工况。步骤3.模糊集构造;输入取定所选的工况。输出构造模糊集。模糊集构造是为了模糊关联规则做准备。分别对应低(VL)、较低(L)、中(M)、较高
(H)、高(VH)五个模糊集,采用梯形隶属函数如图7所示。为了更明确的描述模糊集的生成过程,不失一般性,以工况5下典型负荷435丽为例进行以下具体分析,其对应的煤质系数为[2.53 2. 98],循环水入口温度为[25.2130. 21],共有13493组数据,试图得到该具体工况下各参数的优化目标值,并仅列出锅炉给水温度的数据挖掘的具体过程。取工况5下负荷位于435MW附近(433MW-438MW)数据,共有1596条。对这些数据分别进行聚类分析,分成5类,可求得聚类中心和对应支集的上确界和下确界,如表I所示给出对锅炉给水温度进行聚类的结果表I锅炉给水温度对应K-means聚类结果
聚类数__聚类中心__下确界(N )__上确界(Bi )
_I__252.20__—__253.38_
2253.53252.65253.94
_3__254.02__253.61__254.47_
4254.55 254.10 255.11_5__255.21__254.65__—_
在得到聚类结果后就可以构造如图6所示模糊集,聚类数1-5的聚类中心分别对应低(VL)、较低(L)、中(M)、较高(H)、高(VH)五个模糊集的中心,每个模糊集有O. 3的重叠。如表2中所示为任取的工况5下负荷在435WM附近时的10条锅炉给水温度记录,表3为表2中对应数据模糊化后的结果。表2锅炉给水温度的部分数据
记录__锅炉给水温度____锅炉给水温度_
1255.166252.22 2254.847253.62
_3__254.60__8__253.65_
4253.859253.66
_5__253.60__H)__250.93_表3表2中数据对应的模糊化结果
锅炉给水温度
记录^^^^
VL I_L_I M IHI VH
_I__O__O__O__O__I_
20000.510.49
30 0 0 1 0_4__O__O__028__072__O_
50 0 0.56 0.44 O_6__I__O__O__O__O_
70.040.96000
80 1 0 0 0_9__O__I__O__O__O_
10O0.250.75OO步骤4.模糊关联规则;输入给定支持度、置信度、兴趣度,模糊集。输出模糊关联规则。算法Apriori算法。为了生成所有频繁项集,Apriori算法使用了递推的方法。其核心思想简要描述如下(I)Ll = {large 1-item sets} (LI 是指频繁 I-项集);(2) for (k = 2 ;Lk_l 幸 Φ ;k++)do begin ;(3) Ck = apriori_gen (Lk-I)(将Lk_l进行连接操作生成候选k项集的集合Ck);
(4)for all transactions t e D do begin ;(5) Ct = subset (Ck, t)(识别包含在事务t中的候选集);(6) for all candidates c e Ctdo ;(7) c. count++ (支持度计算增值);
(8)end ;(9)end ;(IO)Lk = {c e Ck c. count ^ minsup};(I I) end;(12) answer = U kLk。首先产生频繁I-项集LI,然后是频繁2-项集L2,知道某个r值使得Lr为空,这时算法停止。这里在第k次循环中,过程先产生候选k项集的集合Ck,Ck中的每一个项集是对两个只有一个项不同的属于Lk-I的频繁集做一个(k-2)连接来产生的。Ck中的项集是用来产生频繁的候选集,最后的频繁集Lk必须是Ck的一个子集。Ck中的每个元素需在交易数据库中进行验证来决定其是否加入Lk,这里的验证过程是算法性能的一个瓶颈。这个方法要求多次扫描交易数据库。从以上算法过程可以看出,Apriori算法采用了逐层搜索的迭代方法,以递归的统计方法为基础经剪枝后可能产生大量的候选集和可能需要重复扫描数据库。本文给定最小支持度Smin = 0. 2,最小直彳目度Cmin = 0. 60,最小直彳目度Imin = I。得到满足优化条件的如下关联规则Temp Effi L (s = 0. 25 c = 0. 69 and 1 = 1. 15)Temp表示锅炉给水温度,Effi表示供电煤耗率。上述规则反模糊化解释为,在负荷435MW附近,锅炉给水温度最优值区间为[252.65 253. 94],此时供电煤耗率较低,对应区间为[325. 78 329. 25],运行优化目标值在此区间内选取。本文取最优区间加权平均值作为优化目标值,得到在435WM负荷下,锅炉给水温度最优值为253. 53,对应供电煤耗率值为327. 695。按照上述方法就可以得到所有可控参数在工况5下典型负荷为435MW时对应的优化目标值,如表4所示表4工况5下负荷为435丽时各参数对应的优化目标值
_运行参数__优化目标值_
_主蒸汽压力/Mpa__13.831_
_主蒸汽温度/°C__537.652_
_再热蒸汽温度/°C__538.007_
_凝汽器真空/KPa__-94.906_
_过量空气系数__3.91466_
_排烟温度/°C__123.316_
_锅炉给水温度/°C__253.53_
步骤5.回归分析;输入获得各典型负荷下对应的运行优化参数的定值。输出最小二乘拟合曲线。仍然以锅炉给水温度为例子,按照上述步骤利用模糊关联规则算法对工况5下325MW、380MW、435MW、490MW、545MW、600MW、655MW典型负荷下数据进行挖掘,得到锅炉给水温度的一组运行最优值,如表5所示。表5确定工况下各典型负荷时所得模糊关联规则
权利要求
1.一种基于模糊集关联规则的火电机组运行參数优化方法,其特征在于该方法包括以下步骤 步骤ー.数据选取; 在火电机组的运行过程当中,运行參数被实时地存储在历史数据库中,因此,若要对机组某些性能进行分析的话,首先需要确定影响该性能的若干因素參数,然后选择读取数据的时间段和采样频率,最后通过查询厂级监控信息系统,利用通讯方式将这些參数的数据读取出来,这些数据也称之为采样数据,这也是其它工作的基础; 步骤ニ.数据预处理与エ况划分; 数据预处理是为了从采样数据中得到处于稳态运行エ况下的数据,当机组运行エ况相距稳态太远时,说明机组的运行參数处于动态变化过程中,得到的參数最优值将不能对机组稳态的运行參数进行指导,因此应该选择机组在典型负荷稳态运行エ况下的数据进行分析,用于数据挖掘的数据应处于稳态或准稳态运行エ况;通常情況下,当进行数据挖掘的參数数据在某一时间段内的方差小于某ー阈值,即认为得到该稳定运行エ况下的运行数据;数据预处理得到稳态运行数据后,接下来进行エ况划分;通常,机组运行外部条件并不是一致的,受ー些不可控因素的影响,因此有必要对这些外部条件进行划分,对各个エ况具体分祈,以便得到各エ况下的优化运行曲线,这样才具有实际指导意义;划分的依据是首先确定对机组性能具有较大影响的外部因素,然后以它们的參数为依据对エ况进行划分,划分的原则是保证每个エ况内负荷段覆盖整个运行区域; 步骤三.模糊集构建; 对于典型负荷具体エ况下的数据,首先进行模糊集构建,为模糊关联规则做准备; 聚类分析是对群体及成员进行分类的递归过程,不同于传统的划分,聚类是一种无导师指导的学习过程;将数据对象分成多个类或簇,使同一簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大; 这里要求所选取的聚类算法具有可伸縮性,算法的时间复杂度不能太高,结果对输入数据顺序不敏感;以选用的κ-means聚类算法为例,将具体エ况下的数据按照负荷分成k类,K-means采用欧式距离作为相似性的评价指标,即认为2个样本的距离越近,其相似性就越大;欧氏距离形式如下
2.根据权利要求I所述的ー种基于模糊集关联规则的火电机组运行參数优化方法,其特征在于步骤三中所述的模糊集构建分为以下2个步骤 1)利用已知的聚类算法对数据进行聚类,求出各聚类的中心; 2)由聚类的中心构建量化属性域上模糊概念对应的模糊集,并导出隶属函数。
全文摘要
一种基于模糊集关联规则的火电机组运行参数优化方法,该方法分为五个步骤步骤一数据选取;步骤二数据预处理与工况划分;步骤三模糊集构造;步骤四模糊关联规则提取;步骤五回归分析。本发明考虑当前运行工况条件下机组所能达到的最佳参数与工况,并对影响机组运行优化的主要可控参数及历史数据进行分析,利用自动构建模糊集数据挖掘技术挖掘出相关关联规则,确定机组供电煤耗率较低时的运行参数优化目标值,再通过回归分析,得到各参数在确定工况下的运行优化曲线。它在火电厂热工过程节能优化控制技术领域内具有广泛的实用价值和应用前景。
文档编号G05B13/04GK102636991SQ201210114168
公开日2012年8月15日 申请日期2012年4月18日 优先权日2012年4月18日
发明者成海南, 陈彦桥 申请人:国电科学技术研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1