一种基于定性趋势分析的多变量报警监控方法与系统与流程

文档序号:15518152发布日期:2018-09-25 18:49阅读:261来源:国知局

本发明涉及工业报警系统等自动化技术领域,具体涉及一种基于定性趋势分析的多变量报警监控方法与系统。



背景技术:

在现代工业报警系统中,需要监控的过程变量数以千计,与这些过程变量相关联的过程变量数量则更为庞大,这些过程变量的时间序列数据具有“大容量、多样性、变化性、真实性、高价值”的特点。针对过程变量时间序列数据的特点,从大量时间序列数据中发掘属于同类典型模式的相似数据段,利用数据段的模式特性进行报警监控,将有助于更好地实现对工业过程运行状况的监控。目前常用“增加、减少、不变”来描述过程变量的变化过程,因此,对具有n个过程变量的多变量系统,所有可能的模式共有3n种,且模式的数量随着n的增加呈指数增加,因而人力完成分析将会是一项巨大的工作。现有的自动化寻找相似数据段的方法较多,较为典型的有:基于动态时间规整(dtw)算法衡量两段时间序列相似性的方法、基于模糊c均值在主成分空间聚类的方法、采用人工神经网络及遗传算法提取时间序列特征并据此对时间序列分类的方法、预先定义若干种基元模式并将时间序列表示成基元序列进行分析的方法等。

现有方法的缺陷主要在于仅能处理单变量的时间序列,而无法有效寻找相似的多变量时间序列,致使工业报警系统中重要的历史数据信息未得到充分有效地利用。



技术实现要素:

本发明为了解决上述问题,提出了一种基于定性趋势分析的多变量报警监控方法与系统,本发明从多变量系统的历史数据中提取多种显著时间序列模式及相应的相似数据段,可实现工业报警系统对生产过程的深层次监控,提高工业报警系统的监控能力。

为了实现上述目的,本发明采用如下技术方案:

一种基于定性趋势分析的多变量报警监控方法,将历史原始数据转换为趋势序列,提取报警和正常数据的显著时间序列模式及相应的相似数据段,将两种显著时间序列模式进行集合运算,实现多变量的报警监控。

上述方法具体包括以下步骤:

选择一段历史数据作为原始数据;

使用定性趋势分析方法,将原始数据转换为趋势序列;

根据报警配置信息,计算历史报警序列,并根据历史报警序列将数据分为报警数据集和正常数据集,将其分别应用多特征主题模型得到主题概率;

计算报警数据集和正常数据集的显著模式及相应的相似数据段,对两组显著模式进行集合运算。

进一步的,使用定性趋势分析方法,将原始数据转换为趋势序列,将其描述成具有特征的文档,该特征提取成基于时间序列的每一时刻的趋势描述。

更进一步的,趋势描述包括增加、减少和不变。

进一步的,依据多特征主题模型迭代求解主题概率模型,对于每一个主题计算主题概率标准差,并对比基于所有文档计算所有主题的全局标准差,再对所有数据段归类为其最有可能隶属的模式。

进一步的,多特征主题模型中每一文档都包含多项相互独立的特征,每项特征可有多种取值,且特征相互独立,计算一次观测的概率,将一次观测展开成包含隐变量的形式,进而构建基于隐变量的未知参数集,得到似然概率函数,通过期望最大化算法最大化该似然概率,不断迭代计算得到未知参数的解。

进一步的,得到主题概率分布,对于每一个主题,计算主题概率标准差,基于所有文档计算所有主题的全局标准差,若某一主题的标准差大于全局标准差,则认为该主题是显著的。

进一步的,对报警数据集和正常数据集分别计算显著主题集合,得到各自的显著模式,对于每个文档,标注其最有可能隶属的模式,将所有数据段归类为相应的模式。

对报警数据集和正常数据集的显著模式取并集。

一种基于定性趋势分析的多变量报警监控系统,包括:

数据选择模块,用于选择一段合适的历史数据作为原始数据;

趋势化模块,使用定性趋势分析方法将原始数据转换为趋势序列;

数据集划分模块,提取历史报警序列,并根据历史报警序列将数据分为报警数据集和正常数据集;

主题模型模块,对报警数据集和正常数据集分别应用多特征主题模型得到主题概率;

后处理模块,计算报警数据集和正常数据集的显著模式及相应的相似数据段,并对得到的两组显著模式进行集合运算。

与现有技术相比,本发明的有益效果为:

本发明可以从多变量系统的历史数据集中快速提取显著的多变量时间序列模式及相似数据段。本发明可实现工业报警系统对生产过程的深层次监控,提高工业报警系统的监控能力。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。

图1基于定性趋势寻找多变量系统中的相似数据段方法的流程图;

图2基于定性趋势寻找多变量系统中的相似数据段方法的系统框图;

图3概率隐变量语义分析模型和多特征主题模型的示意图。其中d代表文档,z代表主题,w代表词语,f代表各个维度上的特征;

图4本发明实施例的多变量系统的时间序列图;

图5本发明实施例的报警数据集和正常数据集的主题概率标准差及全局标准差;

图6本发明实施例的隶属φa-ψna的时间序列片段的时间序列图;

图7本发明实施例的隶属ψna-φa的时间序列片段的时间序列图;

图8本发明实施例的隶属φa∩ψna的时间序列片段的时间序列图;

表1本发明实施例的报警数据集和正常数据集的显著时间序列模式。

具体实施方式:

下面结合附图与实施例对本发明作进一步说明。

应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在本发明中,术语如“上”、“下”、“左”、“右”、“前”、“后”、“竖直”、“水平”、“侧”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,只是为了便于叙述本发明各部件或元件结构关系而确定的关系词,并非特指本发明中任一部件或元件,不能理解为对本发明的限制。

本发明中,术语如“固接”、“相连”、“连接”等应做广义理解,表示可以是固定连接,也可以是一体地连接或可拆卸连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的相关科研或技术人员,可以根据具体情况确定上述术语在本发明中的具体含义,不能理解为对本发明的限制。

首先,本发明提出了一种多特征主题模型。多特征主题模型由概率隐变量语义分析改进而来。概率隐变量语义分析是一种经典的概率语言模型,以无监督学习的方式从文本中发现隐藏的语义信息,即“主题”。概率隐变量语义分析的主要不足在于仅能分析一种数据特征,即“词语”,而多变量系统本身具有多个过程变量,即包含了多种特征。多特征主题模型便是通过增加多个数据特征维度来改进概率隐变量语义分析模型的。概率隐变量语义分析及多特征主题模型的示意图见附图3。具体到本发明中,多特征主题模型中的文档指的是多变量趋势序列,特征指的是各个过程变量上通过定性趋势分析提取的趋势描述信息,主题指的是多变量时间序列的模式。

在此基础上,本发明提出了基于定性趋势分析的多变量报警监控方法,包括如下步骤:

s1,选择一段历史数据作为原始数据;

s2,使用定性趋势分析方法,将原始数据转换为趋势序列;

s3,根据报警配置信息,计算历史报警序列,并根据历史报警序列将数据分为报警数据集和正常数据集;

s4,对报警数据集和正常数据集分别应用多特征主题模型得到主题概率;

s5,计算报警数据集和正常数据集的显著模式及相应的相似数据段;

s6,对两组显著模式进行集合运算。

以下是具体说明。

s1,选择一段合适的历史数据作为原始数据。这段数据中的变化模式、噪声水平、工作状态等应较为全面。

s2,使用定性趋势分析方法,将原始数据转换为趋势序列。

具体地,对于多变量系统x=[x1,x2,…,xn],应用定性趋势分析方法得到趋势序列如下,

{di,i=1,2,…,n}=qta(x(1:t))。(1)

其中di称为“文档”,“文档”的“特征”由时间序列x(t)在每一时刻的趋势描述[x](t)组成,即增加(+1)、减少(-1)、不变(0)。设文档di的始末时刻为ti和ti+1-1,则

di=[x](ti:ti+1-1)。(2)

s3,根据报警配置信息,计算历史报警序列,并根据历史报警序列将数据分为报警数据集和正常数据集。

多变量系统x=[x1,x2,…,xn]的报警序列为a(1:t)。

报警数据集xa和正常数据集xna为

s4,对报警数据集和正常数据集分别应用多特征主题模型得到主题概率。

多特征主题模型中每一文档di都包含r项相互独立的特征fr,r=1,2,…,r。每项特征可以有多种取值如下:

由于特征相互独立,则一次观测的概率为

其中1≤jr≤mr,r=1,2,…,r。进一步地,主题模型中包含“主题”隐变量zk,则将概率展开成包含隐变量zk的形式,

未知参数集为

似然概率函数为

通过期望最大化算法最大化该似然概率,不断交替迭代e步骤和m步骤得到未知参数的解。第(s+1)轮迭代中,e迭代步计算

m迭代步计算

其中是文档di的第r个特征维度中出现特征的次数。

综上,依据多特征主题模型的模型求解主题概率模型包含三个主要步骤:

1、随机初始化未知参数

2、不断交替迭代计算(9)和(10);

3、当参数收敛时结束第二个步骤的迭代过程,即||θ(s+1)-θ(s)||<ε,其中ε是一个非常小的常数,如0.0001。

s5,计算报警数据集和正常数据集的显著模式及相应的相似数据段。

s4得到主题概率分布p(zk|di)。对于每一个主题,计算主题概率标准差

基于所有文档计算所有主题的全局标准差

对于主题zk,若σk>σ0,则认为该主题是显著的。

对报警数据集xa和正常数据集xna分别计算显著主题集合,得到各自的显著模式为

对于每个文档di,标注其最有可能隶属的模式为

基于此,可以对所有数据段归类为相应的模式。

s6,对两组显著模式进行集合运算。

对于多变量系统x,显著模式为报警数据集和正常数据集的显著模式的并集,

z=φa∪ψna。(14)

本发明还提供了一种基于定性趋势分析的多变量报警监控的系统,包括:

数据选择模块,用于选择一段合适的历史数据作为原始数据;

趋势化模块,使用定性趋势分析方法将原始数据转换为趋势序列;

数据集划分模块,提取历史报警序列,并根据历史报警序列将数据分为报警数据集和正常数据集;

主题模型模块,对报警数据集和正常数据集分别应用多特征主题模型得到主题概率;

后处理模块,计算报警数据集和正常数据集的显著模式及相应的相似数据段,并对得到的两组显著模式进行集合运算。

作为一种典型实施例,如图1所示,本发明提供的监控方法包括如下步骤:

s1,选择一段历史数据作为原始数据;

s2,使用定性趋势分析方法,将原始数据转换为趋势序列;

s3,根据报警配置信息,计算历史报警序列,并根据历史报警序列将数据分为报警数据集和正常数据集;

s4,对报警数据集和正常数据集分别应用多特征主题模型得到主题概率;

s5,计算报警数据集和正常数据集的显著模式及相应的相似数据段;

s6,对两组显著模式进行集合运算。

以下结合一个实施例具体说明各个步骤的实施过程。

考虑水箱系统x=[fi1,fi2,fo,h]。其中fi1,fi2为两个入水口的流量,fo为出水口的流量,h为液位高度。变量之间满足如下的动力学关系

其中s1为水箱截面积,s2为出水口截面积。仿真过程中,出水口s2在0.01与0.5之间随机变化且无法测量。当h超过1500时产生报警,低于1500则正常。fi1,fi2,fo,h和s2的时间序列如附图4。考虑增加、减少、不变三种趋势描述,则多变量系统x=[fi1,fi2,fo,h]的模式有34=81种。

s1,选择一段历史数据作为原始数据。这段数据中的变化模式、噪声水平、工作状态等应较为全面。

本实施例中,附图4所示的历史数据作为原始数据,该段数据包含了足够丰富的系统变化过程。

s2,使用定性趋势分析方法将原始数据转换为趋势序列。

具体地,对于多变量系统x=[x1,x2,…,xn],应用定性趋势分析方法得到趋势序列如下,

{di,i=1,2,…,n}=qta(x(1:t))。(16)

其中di称为“文档”,“文档”的“特征”由时间序列x(t)在每一时刻的趋势描述[x](t)组成,即增加(+1)、减少(-1)、不变(0)。设文档di的始末时刻为ti和ti+1-1,则

di=[x](ti:ti+1-1)。(17)

s3,根据报警配置信息,计算历史报警序列,并根据历史报警序列将数据分为报警数据集和正常数据集。

多变量系统x=[x1,x2,…,xn]的报警序列为a(1:t)。本实施例中,当h超过1500时产生报警,低于1500则正常。

报警数据集xa和正常数据集xna为

s4,对报警数据集和正常数据集分别应用多特征主题模型得到主题概率。

依据多特征主题模型求解主题概率模型包含三个主要步骤:

1、随机初始化未知参数

2、不断交替迭代计算以下两步:

e迭代步计算

m迭代步计算

其中是文档di的第r个特征维度中出现特征的次数;

3、当参数收敛时结束第二个步骤的迭代过程,即||θ(s+1)-θ(s)||<ε,其中ε是一个非常小的常数,如0.0001。

本实施例中,报警数据集和正常数据集各指定主题数为k=14。经上述迭代过程后,由(20)式得到参数的计算值。

s5,计算报警数据集和正常数据集的显著模式及相应的相似数据段。

s4得到主题概率分布p(zk|di)。对于每一个主题,计算主题概率标准差

基于所有文档计算所有主题的全局标准差

对于主题zk,若σk>σ0,则认为该主题是显著的。

对报警数据集xa和正常数据集xna分别计算显著主题集合,得到各自的显著模式为

本实施例中,主题概率标准差σk与全局标准差σ0如附图5。进一步得到各自的显著模式如表1。

表1

对于每个文档di,标注其最有可能隶属的模式为

基于此,可以对所有数据段归类为相应的模式。

s6,对两组显著模式进行集合运算。

对于多变量系统x,显著模式为报警数据集和正常数据集的显著模式的并集,

z=φa∪ψna。(24)

本实施例中,提取显著隶属φa-ψna、ψna-φa和φa∩ψna的时间序列片段,分别见附图6,附图7和附图8。可以看到,隶属同一模式的时间序列片段具有较高的相似度,而分属不同模式的时间序列片段间差异较大。

本发明还提供了一种基于定性趋势寻找多变量系统中的相似数据段的系统,如附图2所示,包括:

数据选择模块,用于选择一段合适的历史数据作为原始数据;

趋势化模块,使用定性趋势分析方法将原始数据转换为趋势序列;

数据集划分模块,提取历史报警序列,并根据历史报警序列将数据分为报警数据集和正常数据集;

主题模型模块,对报警数据集和正常数据集分别应用多特征主题模型得到主题概率;

后处理模块,计算报警数据集和正常数据集的显著模式及相应的相似数据段,并对得到的两组显著模式进行集合运算。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1