面向燃煤锅炉流程对象的实时知识发现方法及系统与流程

文档序号:18452223发布日期:2019-08-17 01:21阅读:178来源:国知局
面向燃煤锅炉流程对象的实时知识发现方法及系统与流程

本公开涉及数据处理技术领域,特别是涉及面向燃煤锅炉流程对象的实时知识发现方法及系统。



背景技术:

在流程工业分布式控制系统中,由于存在多个环节的数据,环节之间又具有一定的影响关系。从环节数据中挖掘出这种隐性的相关关系,以便人们更好地了解到生产状况以及是否发生了异常情况,具有很大的实用意义。

目前,dcs分布式控制系统广泛应用于流程工业生产中,该系统可以实时采集流程工业生产过程中各个环节的生产状态。流程工业控制系统采集得到的数据经过长时间的积累形成规模庞大的历史数据库。在这些数据中包含了可用于生产和管理的大量有价值的信息和知识,从中发现比传统查询和统计更重要的内容渐渐成为人们的研究热点。为了能够在过程检测、诊断、优化、调度等方面对流程工业的运行提供辅助决策支持,优化流程工业自动化控制系统的性能,需要一种可靠高效的分析工具,将隐藏在海量数据中的有用的深层次知识和信息挖掘出来,提取这些数据的整体特征、关联以及预测发展趋势等,以帮助决策者发现、分析并解决问题。基于流程工业的需要和数据性质以及所面临的问题,数据挖掘技术是解决流程工业的海量信息数据处理的关键技术。

数据流具有规模不断增长、对象实时更新、属性复杂多变、价值随时间衰减等特点,这就导致很难在数据流中选择具有全局代表性的样本数据,因此有监督的智能计算难以应用于数据流环境中。聚类分析是无监督的机器学习方法,在计算过程中,不需要规范化的样本数据,仅根据数据本身的属性特点就能够进行有效的数据划分,可以实现对海量原始数据的标签化工作,因此在金融分析、环境监测、工业控制等领域有着广泛的用途,与有监督的机器学习方法相比,更适应数据流的应用需求。

针对是热电蒸汽炉的生产环节,可以预测的生产状态参数有气包压力,主汽温度,料层温度,返料温度,烟气含氧量,炉膛差压,料层差压等,根据锅炉的工作特点,蒸汽系统由于设备较复杂、环节较多,因此参数的变化存在着较大的滞后性,但变化的趋势可以保持较长时间,所以在设备调节会采取“提前调节”和“稳定调节相”相结合的方法,但是实际生产中只能由一线工人凭借自己的经验进行调整,无法稳定高效的发现状态变化,生产故障,从而导致蒸汽锅炉工作效率的降低。



技术实现要素:

本说明书实施方式的目的是提供面向燃煤锅炉流程对象的实时知识发现方法,基于当前生产状态的相关参数预测未来一段时间的生产状态,从而辅助指导企业调整生产流程参数。

本说明书实施方式提供面向燃煤锅炉流程对象的实时知识发现方法,基于服务器实现,通过以下技术方案实现:

包括:

对采集到的锅炉的生产状态参数数据进行时序调整,得到正确的时序数据;

采用基于滑动窗口的数据流聚类方法,将采集到的锅炉的生产状态参数数据,分成“正常”,“基本正常”,“异常”,“严重异常”四类;

保存每次聚类中心结果,每次对比上次聚类结果,如果相邻两次聚类结果的差值在设定范围内,不做任何操作,继续等待下一个数据流;否则,对变化趋势数学公式进行修改更新适用于最新的生产状态;

继续进行后续知识发现的过程获得新的公式,通过关联规则算法进行关联链挖掘,得到各个生产参数最新的影响关系与变化规律,生成各参数之间的关联链;

最后通过柔性神经树对数据进行建模预测,输出数据的新的变化趋势数学公式,对工业生产过程进行模拟,基于当前生产状态的相关参数预测未来一段时间的生产状态,从而辅助调整生产流程参数。

本说明书实施方式提供面向燃煤锅炉流程对象的实时知识发现系统,基于服务器实现,通过以下技术方案实现:

包括:

时序数据获得模块,被配置为:对采集到的锅炉的生产状态参数数据进行时序调整,得到正确的时序数据;

数据流聚类模块,被配置为:基于滑动窗口的数据流聚类方法,将采集到的锅炉的生产状态参数数据,分成“正常”,“基本正常”,“异常”,“严重异常”四类;

聚类结果比较模块,被配置为:保存每次聚类中心结果,每次对比上次聚类结果,如果相邻两次聚类结果的差值在设定范围内,不做任何操作,继续等待下一个数据流;否则,对变化趋势数学公式进行修改更新适用于最新的生产状态;

各参数关联链模块,被配置为:继续进行后续知识发现的过程获得新的公式,通过关联规则算法进行关联链挖掘,得到各个生产参数最新的影响关系与变化规律,生成各参数之间的关联链;

参数预测模块,被配置为:通过柔性神经树对数据进行建模预测,输出数据的新的变化趋势数学公式,对工业生产过程进行模拟,基于当前生产状态的相关参数预测未来一段时间的生产状态,从而辅助调整生产流程参数。

与现有技术相比,本公开的有益效果是:

本公开根据蒸汽锅炉的这些特性对热电生产数据进行时序调整,并采用基于滑动窗口的数据流聚类的方法,对新增的数据流实时进行聚类,再通过关联链挖掘得到各个生产环节最新的影响关系与变化规律,最后通过柔性神经树对数据进行建模预测,得到测点数据的变化趋势公式,对工业生产过程进行模拟,基于当前生产状态的相关参数预测未来一段时间的生产状态,从而辅助指导企业调整生产流程参数。

附图说明

构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。

图1本公开实施例子的初始模型建立的算法流程图;

图2本公开实施例子的增量式模型更新的算法流程图;

图3本公开实施例子的基于差分极值时序发现的算法流程图;

图4本公开实施例子的滑动窗口模型效果图,随着数据的不断流入,最先流入的数据将移出窗口不再保存;

图5本公开实施例子的环节关联度表的效果图,根据各个环节之间的关联度,生成关联链;

图6本公开实施例子的关联链效果图,每个环节都依次作为首个环节,生成关联链;

图7本公开实施例子的建模预测效果图,可以的观察下一数据流预测数据与实际生产数据的对比。

具体实施方式

应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

实施例子一

该实施例公开了面向燃煤锅炉流程对象的实时知识发现方法,面向流程工业生产中产生的监测数据,利用数据预处理、基于滑动窗口的数据流聚类、关联链挖掘等算法,对流程工业生产的调控操作起到辅助优化的作用。本公开实施例中所涉及的环节即为燃煤锅炉生产状态参数。

对采集到的锅炉的生产状态参数数据进行时序调整,找到正确的时间序列,得到正确的时序数据;并采用基于滑动窗口的数据流聚类方法,将这些生产状态数据,分成“正常”,“基本正常”,“异常”,“严重异常”四类,从而使数据的复杂度大大降低;并保存每次聚类中心结果,每次对比上次聚类结果,如果没有发现聚类结果有明显的变化,就不做任何操作,继续等待一个数据流的到来;如果发现聚类结果发生明显的变化时,说明整个锅炉的生产状态发生变化了,需要对变化趋势数学公式进行修改更新才能适用于最新的生产状态,继续进行后续知识发现的过程获得新的公式,通过关联规则算法进行关联链挖掘,得到各个生产环节最新的影响关系与变化规律,生成各环节之间的关联链;最后通过柔性神经树对数据进行建模预测,输出数据的新的变化趋势数学公式。对工业生产过程进行模拟,基于当前生产状态的相关参数预测未来一段时间的生产状态,从而辅助指导企业调整生产流程参数。

本公开根据蒸汽锅炉的这些特性对热电生产数据进行时序调整,并采用基于滑动窗口的数据流聚类的方法,对新增的数据流实时进行聚类,再通过关联链挖掘得到各个生产环节最新的影响关系与变化规律,最后通过柔性神经树对数据进行建模预测,得到测点数据的变化趋势公式,对工业生产过程进行模拟,基于当前生产状态的状态参数即锅炉生产中的状态参数预测未来一段时间的生产状态,通过模型预测得到的变化趋势数学公式,应用到新增数据流中,对比预测数据与实际的差值,方差等,以及可视化趋势变化对比图,让操作人员更直观的观测整个锅炉的生产状态,便于有效地发现设备异常。从而辅助指导企业调整生产流程参数。

面向热电蒸汽锅炉流程产生的历史监测数据,该方法大致分为两个部分,初始模型的建立和增量式模型更新,数学模型会随着数据流到来不断进行增量式的更新,对热电生产的调控操作起到辅助优化的作用。采用以下方案:

1、初始模型的建立

首先用流程工业采集到的部分数据,建立一个初始的模型,而后面采集的数据流会对这个模型进行不断完善更新,以保证模型能够适应不断变化的数据流。

先取得一部分的生产状态数据,基于这些数据先建立一个初始的模型,即一个初始的变化趋势数学公式。

后面采集到的数据流,一样标准的运行状态数据,因为初始模型不会长时间适用于实际生产过程中,所以基于不断到来的新增数据流,对这个模型进行动态的更新。对变化趋势数学公式进行修改完善。

2、增量式模型更新

是在初始模型建立的基础上,不断的对新到的工业数据流数据进行分析,然后不断对模型进行修正更新。大致分为以下几个步骤,数据预处理,基于滑动窗口数据流聚类,关联链挖掘,模型更新。

通过模型预测得到的变化趋势数学公式,它可以适用于未来一段时间内的锅炉的生产状态,将其应用到新增数据流中,对比预测数据与实际数据的差值,方差等,以及可视化趋势变化对比图,让操作人员更直观的观测整个锅炉的生产状态,便于有效地发现设备异常。

当该数学公式不再适用于当前的生产状态,即当在基于滑动窗口数据流聚类阶段,检测到锅炉生产状态的数据发生较大变化时,对该数学公式进行修改。

对采集到的锅炉的生产状态参数数据进行时序调整,找到正确的时间序列,得到正确的时序数据;并采用基于滑动窗口的数据流聚类方法,将这些生产状态数据,分成“正常”,“基本正常”,“异常”,“严重异常”四类,从而使数据的复杂度大大降低;并保存每次聚类中心结果,每次对比上次聚类结果,如果没有发现聚类结果有明显的变化,就不做任何操作,继续等待一个数据流的到来;如果发现聚类结果发生明显的变化时,说明整个锅炉的生产状态发生变化了,需要对变化趋势数学公式进行修改更新才能适用于最新的生产状态,继续进行后续知识发现的过程获得新的公式,通过关联规则算法进行关联链挖掘,得到各个生产环节最新的影响关系与变化规律,生成各环节之间的关联链;最后通过柔性神经树对数据进行建模预测,输出数据的新的变化趋势数学公式。对工业生产过程进行模拟,基于当前生产状态的相关参数预测未来一段时间的生产状态,从而辅助指导企业调整生产流程参数。

(1)数据预处理

对于流程工业来说,因为生产环境的关系,采集到的数据难免会存在着噪声,所以首先需要对数据进行清洗,便于后续算法的操作执行。对数据出现缺失,错误,重复的进行修复。

而后我们就要对数据进行时序的调整,因为在实时数据采集时,数据采集是基于一定频率的。各个环节采集到的数据是相互联系的,并且是相互制约的。流程工业中的各个环节具有时序性,但是由于状态传播的延迟,使采集到的数据时序性出现紊乱。相同时刻的各环节数据不该是由其他环节产生响应的数据,表现出了不同步性。

这里本文采用了基于差分极值的方法进行时序发现,首先要计算每个参数数据的数据极值点,然后根据极值出现时间算计环节之间的时间间距,选定一个环节作为时间基准环节,其他环节与基准环节通过时间间距进行比较,得出环节之间的时间序列,也就是流程对象内部环节的具体工艺顺序。在后续关联链挖掘时,环节时间序列也可以对生成的关联规则进行过滤。

(2)基于滑动窗口数据流聚类

在工业生产中,我们需要对不断到来的工业数据流进行处理,因为数据量巨大,我们需要对数据进行聚类,减少数据的离散程度,用少数几类的数据代表整体的数据状态。而滑动窗口是对数据流进行处理时使用的一种比较理想的采样存储技术。基于滑动窗口的数据流处理技术能够很好地实现最近到达的数据处理。它是指在处理数据流中的数据时,开辟一块内存(窗口)存储数据流中的最新数据。数据依次流入窗口相当于窗口逆向滑向数据流,随着数据的不断流入,最先流入的数据将移出窗口不再保存。只保留最近时间的数据状态。

对数据进行聚类时,是对每个环节(属性参数)独立进行聚类,因为工业数据离散状态众多,需要减少其的数据规模,离散化程度,便于后续知识发现步骤的展开。

[1]滑动窗口模型

数据流上的滑动窗口技术是指在处理数据流中的数据时,开辟一块内存(窗口)存储数据流中的最新数据。数据依次流入窗口相当于窗口逆向滑向数据流,随着数据的不断流入,最先流入的数据将移出窗口不再保存。如开辟一个5w数据大小窗口,设计监测机制,每当检测到采集到新增数据流大小累计达到2000时,就将数据流送入到滑动窗口中进行聚类(环节聚类)。

[2]环节聚类

由于工业数据中离散状态众多,直接对其进行关联链挖掘,不仅非常耗时,更会导致生成的关联规则数量过大并进而导致数据挖掘结果的价值密度过低。解决该问题的关键是减少环节数据中的离散状态量,较好的做法是对环节数据进行归类汇总,用少数的几类数据来代表所有的环节数据。我们使用聚类算法将数据进行归类,每个环节(参数)单独进行聚类。得到聚类数据不再是具体的数值,而是数值对应的各自聚类的类别。

[3]不断对新增到窗口的数据进行聚类,a.如果当发现聚类结果发生明显变化时,如簇心个数改变,簇心位置变化巨大,本文称之为发生了概念迁移,可能存在新的生产知识出现,才会继续进行后续知识发现的算法,就将此次的聚类结果庄村到后台数据库中,替换掉原聚类结果,并进行后续关联链挖掘,建模预测等知识发现的步骤;b.如果没有发现聚类结果发生明显变化,就继续等待下一段数据流的到来。

(3)关联链挖掘

在流程工业中,整个生产模式是一个链式的过程,各个环节之间可能存在着链式的影响。因此在关联规则挖掘中,我们只针对两两环节之间生成关联规则,并最终由两两环节的关联规则生成关联链/树。利用关联规则挖掘算法找出的2项关联规则,再根据环节时序对生成的规则进行过滤。具体步骤为,

(1)通过关联规则算法挖掘出任意两个环节中类之间的关联规则(简称环节中类间关联规则)。

(2)通过第一步中得到的两个环节之间全部的类间关联规则,以及每个关联规则的总数占比,计算这两个环节之间的关联度。以此我们计算所有环节之间的关联度。最后可以得到一张环节关联度表,见表1。

表1任意两个环节聚类间的关联规则表

(3)根据得到的环节关联度表,生成每个环节的最强关联链,从一个环节(xi)出发,找出与该环节关联度最大的环节(xj),将环节(xj)加入链中,然后找出与环节(xj)关联度最大的环节,顺次一直寻找,保证各环节不重复出现,当与下一环节的关联度都小于设定阈值时,停止寻找确定最强关联链。

φ={xi,xj,…,xm}

由于流程工业具有单向相关性,它的工作过程是一个链式的流程,以热电蒸汽锅炉为例,该过程是从炉内燃料燃烧,锅炉给水加热,蒸汽吹动汽轮机做功发电。这是一个典型的单向链式流程,也是一个典型的流程对象。这个过程在生产上是不可逆的,针对流程对象的关联性特点,本文采用了维间关联规则算法,得到任意两个环节的类间关联规则,然后利用基于兴趣度的关联度计算方法,得到任意两环节间的规则关系,根据关联度得到多个环节依次影响的关联链。所以本文只需挖掘到2项频繁项集,一定程度缩短了关联规则挖掘的时间。

[1]类间关联规则

设置最小支持度sup,最小置信度conf,对任意两环节的聚类数据进行维间关联规则挖掘,搜索频繁2-维词集,生成不同环节任意两聚类间的二项关联规则,这些规则表示不同环节的两个满足最小支持度和最小置信度的聚类之间的关系。为了使表达更明确,我们进行具体化描述,假设得到的xi与xj关联规则中,前项为xi后项为xj的所有聚类数据集共产生3条聚类关联规则,分别是xika→xjkb,xika→xjkc,xikb→xjka前项为xj后项为xi的所有聚类数据集共产生1条聚类关联规则,xjke→xikb

[2]环节间关联规则

设任意两个环节(属性参数)xi和xj共产生ωij条规则,其中任意一条规则为ia→ib。考虑到每条关联规则的出现的频度不是相同的,所以采用规则数量占比占比,任意一条规则在其两个环节所有规则中的数量占比是sβ(ia→ib),由于兴趣度i(ia→ib)大小对关联规则的意义不同,本文采用数值计算前项为xi和后项为xj的聚类之间的关联度cij(β),则

其中,β表示所有规则中的第β条规则,且

i′β(ia→ib)=iβ(ia→ib)-1(2)

当两个环节的之间关联度小于设定的最小关联度阈值时,将其置为-99999,认为两者没有关联,在关联链生成时,将其筛除,形成一个各个环节之间的关联度表。

[3]关联链生成

对于流程对象来说,多环节之间的关联关系应该是一条单向的链的形式,并且该链无重复节点,从链的第一个环节到最后一个环节表示该流程对象的某运行流程或子流程,即该链为关联链

根据关联度表,生成每个环节的关联链,生成方法是从一个环节x1出发,查找与当前环节关联度最大的另一个环节xn,并且没有遍历过的环节。然后顺次找与环节xn关联度最大的另一个环节。一直找到关联度小于设定阈值的时停止生成,最后就得到了以x1为起始的关联链。通过同样的方法可以生成剩余环节x2,x3…的关联链。

(3)模型更新

建模预测的作用是在关联链的基础上对影响目标环节的相关属性进行科学计算,获取测点数据的变化趋势公式,对工业生产过程进行模拟,基于当前生产状态的相关参数预测未来一段时间的生产状态,对模型进行不断的修正完善,模型与不断新增变化的数据切合,从而辅助指导企业调整生产流程参数。

通过以上数据预处理、基于滑动窗口数据流聚类、关联链挖掘、建模预测。四个步骤,通过在线实时对数据进行操作,对数据校验证实预测的准确度。并使用spark并行开发环境实现算法部分的编写,可以提高算法的运行效率与速度,知识发现的实时获取,可以对工业数据及时作出响应,大大切合工业生产中时效高的要求。同时进行数学建模对数据进行预测和分析。结合流程工业的生产工艺分析。可以用于工业中对工艺参数的分析调整。从而优化生产流程、维护生产安全。

(4)建模预测

在关联链的基础上,利用数学建模,进行环节间的相关性分析,获取数据的变化趋势公式,对流程工业生产的过程进行模拟对比,可以与新到数据流进行数值比较,得到该段时间内的数据趋势对比,便于找出工业生产故障。从而优化流程工业生产流程,辅助决于实际生产。

通过以上数据预处理、基于滑动窗口数据流聚类、关联链挖掘、建模预测。四个步骤,通过在线实时对数据进行操作,对数据校验证实预测的准确度。并使用spark并行开发环境实现算法部分的编写,可以提高算法的运行效率与速度,大大切合工业生产中时效高的要求。同时进行数学建模对数据进行预测和分析。结合流程工业的生产工艺分析。可以用于工业中对工艺参数的分析调整。从而优化生产流程、维护生产安全。

实施例子二

该实施例子公开了面向燃煤锅炉流程对象的实时知识发现系统,基于服务器实现,包括:

时序数据获得模块,被配置为:对采集到的锅炉的生产状态参数数据进行时序调整,得到正确的时序数据;

数据流聚类模块,被配置为:基于滑动窗口的数据流聚类方法,将采集到的锅炉的生产状态参数数据,分成“正常”,“基本正常”,“异常”,“严重异常”四类;

聚类结果比较模块,被配置为:保存每次聚类中心结果,每次对比上次聚类结果,如果相邻两次聚类结果的差值在设定范围内,不做任何操作,继续等待下一个数据流;否则,对变化趋势数学公式进行修改更新适用于最新的生产状态;

各参数关联链模块,被配置为:继续进行后续知识发现的过程获得新的公式,通过关联规则算法进行关联链挖掘,得到各个生产参数最新的影响关系与变化规律,生成各参数之间的关联链;

参数预测模块,被配置为:通过柔性神经树对数据进行建模预测,输出数据的新的变化趋势数学公式,对工业生产过程进行模拟,基于当前生产状态的相关参数预测未来一段时间的生产状态,从而辅助调整生产流程参数。

该模块的相关内容参见实施例一中面向燃煤锅炉流程对象的实时知识发现方法的实现过程,此处不再进行详细说明。

实施例子三

该实施例子公开了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现面向燃煤锅炉流程对象的实时知识发现方法的步骤。

该实施例子中的具体方法参见实施例一中面向燃煤锅炉流程对象的实时知识发现方法的实现过程,此处不再进行详细说明。

实施例子四

该实施例子公开了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现面向燃煤锅炉流程对象的实时知识发现方法的步骤。

该实施例子中的具体方法参见实施例一中面向燃煤锅炉流程对象的实时知识发现方法的实现过程,此处不再进行详细说明。

可以理解的是,在本说明书的描述中,参考术语“一实施例”、“另一实施例”、“其他实施例”、或“第一实施例~第n实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1