基于分段线性表示的单变量报警系统性能评价方法及系统与流程

文档序号:22578574发布日期:2020-10-20 16:52阅读:153来源:国知局
基于分段线性表示的单变量报警系统性能评价方法及系统与流程
本公开涉及流程工业的报警监控
技术领域
,特别涉及一种基于分段线性表示的单变量报警系统性能评价方法及系统。
背景技术
:本部分的陈述仅仅是提供了与本公开相关的
背景技术
,并不必然构成现有技术。报警系统可以帮助操作员检测各种大型流程工业(如炼油厂、石化设施和发电厂)的潜在异常和危险情况。一个设计良好、性能优良的报警系统对工艺安全和工厂的运行效率至关重要。然而,目前大多数工业报警系统的性能还远未达到行业标准,而且许多工业报警系统都含有过多的干扰报警。因此,报警系统性能评价及其性能指标的量化显得尤为重要。当前评估报警系统的性能指标包括:干扰报警的数量nu、真实报警的数量nt、误报率far、漏报率mar,但这些指标在实际应用中存在反映性能不全面的问题。本公开发明人发现,针对目前最常用的单变量报警系统,现有研究中采用均值变化检测的方法,通过判断模拟量的均值是否发生变化,将模拟量的历史数据分为正常工况数据和异常工况数据,并计算了报警系统的误报率(far)和漏报率(mar)两个性能指标。该方法对平稳数据非常有效但对非平稳数据效果较差,特别是对实际工业应用中的非平稳数据,该方法所得到的性能指标误差较大,不能很好的反映报警系统的性能,如果不加以解决,将严重影响报警系统性能评价的有效性和准确性。技术实现要素:为了解决现有技术的不足,本公开提供了一种基于分段线性表示的单变量报警系统性能评价方法及系统,将原始数据分为多个数据段,并通过假设检验将数据段分为正常、异常和未定义状态,适用于平稳和非平稳数据,提高了报警系统评估的适用范围;通过引入误报警持续时间比和漏报警持续时间比,提高了报警系统评估的可靠性。为了实现上述目的,本公开采用如下技术方案:本公开第一方面提供了一种基于分段线性表示的单变量报警系统性能评价方法。一种基于分段线性表示的单变量报警系统性能评价方法,包括以下步骤:获取报警系统的报警历史数据;根据预设数据段的数目,对具有相同趋势的相邻数据样本进行聚类,得到历史数据的分段线性表示;通过假设检验,判断各个数据段的属性,至少包括正常工况数据段和异常工况数据段两种属性;根据得到的各个数据段的属性计算报警系统的各个性能指标。作为可能的一些实现方式,利用分段线性表示法将历史数据分割成若干个时间段,每个时间段用一条拟合直线表示。作为进一步的限定,对于获取的整个历史数据,计算合并每对相邻段的拟合误差,并将拟合误差最小的相邻段对合并为一个段,重复合并步骤,直到数据段的数量等于预设数据段的数目。作为可能的一些实现方式,对数据段进行均值假设检验,通过判断数据段均值与报警阈值之间的大小关系将其分为正常段和异常段。作为可能的一些实现方式,所述性能指标至少包括干扰报警的数量、真实报警的数量、误报率、漏报率、误报警持续时间比和漏报警持续时间比。作为进一步的限定,根据各个数据段的属性,得到正常工况数据集和异常工况数据集,根据正常工况数据集和异常工况数据集进行各个性能指标的计算。作为更进一步的限定,误报率为正常工况数据集中的误报警数量与正常工况数据集的总持续时间的比值。作为更进一步的限定,漏报率为异常工况数据集中的漏报警数量与异常工况数据集的总持续时间的比值。作为更进一步的限定,误报警持续时间比为误报警总持续时间与正常工况数据集的总持续时间的比值。作为更进一步的限定,所述漏报警持续时间比为漏报警的总持续时间与异常工况数据集的总持续时间的比值。本公开第二方面提供了一种基于分段线性表示的单变量报警系统性能评价系统。一种基于分段线性表示的单变量报警系统性能评价系统,包括:数据获取模块,被配置为:获取报警系统的报警历史数据;数据分段模块,被配置为:根据预设数据段的数目,对具有相同趋势的相邻数据样本进行聚类,得到历史数据的分段线性表示;数据段分类模块,被配置为:通过假设检验,判断各个数据段的属性,至少包括正常工况数据段和异常工况数据段两种属性;性能评价模块,被配置为:根据得到的各个数据段的属性计算报警系统的各个性能指标。本公开第三方面提供了一种介质,其上存储有程序,该程序被处理器执行时实现如本公开第一方面所述的基于分段线性表示的单变量报警系统性能评价方法中的步骤。本公开第四方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开第一方面所述的基于分段线性表示的单变量报警系统性能评价方法中的步骤。与现有技术相比,本公开的有益效果是:本公开所述的方法、系统、介质及电子设备,提出用分段线性表示法(plrs)来检测正常和异常工况数据,利用该方法将原始数据分为多个数据段,并通过假设检验将数据段分为正常、异常和未定义状态,该方法能够适用于平稳和非平稳数据,提高了报警系统评估的适用范围。本公开所述的方法、系统、介质及电子设备,根据检测结果,计算了单变量报警系统的性能指标,包括两个新的指标,即误报警持续时间比(fadr)和漏报警持续时间比(madr),与现有的研究结果相比,该性能指标来评价报警系统更可靠。附图说明构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。图1为本公开实施例1提供的一种基于分段线性表示的单变量报警系统性能评价方法的流程示意图。图2为本公开实施例1提供的一个数值例子采用plrs与现有方法进行比较的示意图。具体实施方式下面结合附图与实施例对本公开作进一步说明。应该指出,以下详细说明都是示例性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属
技术领域
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。实施例1:如图1所示,本公开实施例1提供了一种基于分段线性表示的单变量报警系统性能评价方法,包括以下步骤:给定预先确定的数据段的数目k,对具有相同趋势的相邻数据样本进行聚类,以获得单变量x(t)的历史数据的分段线性表示,其中t∈[1,t];通过假设检验,判断第k个数据段为正常工况数据段或异常工况数据段,其中,k∈[1,k];将所有数据段划分为正常、异常和未定义数据段后,根据划分结果计算报警系统的性能指标。对具有相同趋势的相邻数据样本进行聚类,具体为:利用分段线性表示法(plrs)将历史数据分割成若干个短时间段,即每个短时间段用一条拟合直线表示,拟合直线反映了相邻数据样本点的变化趋势。获得单变量x(t)的分段线性表示,具体为:x(t)可以分成几个独立的数据段,每个数据段用拟合直线表示,数据段的趋势可以用这些直线来表示。判断第k个数据段为正常段或者异常段,具体为:对数据段进行均值假设检验,通过判断数据段均值与报警阈值之间的大小关系将其分为正常段或异常段。所述分段线性表示法(plrs),具体为:假设被分成k个数据段,使用线性回归模型拟合第k个数据段即:x(t)=ak+bkt+e(t),其中ak和bk分别是上式中线性回归模型的截距和斜率参数。根据中心极限定理,误差e(t)假定为均值为零和方差为的高斯白噪声,线性最小二乘法用于估计参数ak和bk,其中:nk=tk+1-tk,拟合误差其中,采用自下而上的算法得到k个数据段,具体步骤为:对于整个历史数据该算法从初始状态{x(1),x(2)},{x(3),x(4)},……,{x(n-1),x(n)}开始;计算合并每对相邻段的拟合误差,并将拟合误差最小的相邻段对合并为一个段;重复上一步骤,直到数据段的数量等于k。对数据段进行均值假设检验具体方法为:第k个数据段的样本平均值:为了容忍μk的不确定性,采用假设检验,h0:μk=xtp,h1:μk≠xtp.根据中心极限定理,μk是高斯分布的,因此μk的95%置信区间:[μk,-,μk,+]=[μk-1.96σk,μk+1.96σk].其中:如果高报警阈值xtp大于μk,+,则拒绝原假设h0,该数据段被视为正常数据段,因为样本均值μk在统计学上小于xtp。否则,接受h0是安全的,这时μk在统计学上等于xtp。但是,在此情况下很难确定这个数据段是正常的和异常的。判断第k个数据段为正常段或者异常段,表示变量i(k)分别取表示正常、未定义和异常数据段的值“1”、“0”和“-1”,其中:正常工况数据集x+(t)和异常工况数据集x-(t)为:x+(t)={x(t)|t∈[tk,tk+1-1]∧i(k)=1};x-(t)={x(t)|t∈[tk,tk+1-1]∧i(k)=-1}所述计算报警系统的性能指标,具体为干扰报警的数量nu、真实报警的数量nt、误报率far、漏报率mar、误报警持续时间比fadr和漏报警持续时间比madr六个性能指标。nu和nt用于反映干扰和真实警报的数量。干扰报警由误报警和漏报警组成,far和mar用于测量误报警和漏报警发生的概率。但是,由于干扰警报可能是连续发生的,因此应考虑其持续时间,本实施例采用了误报警持续时间比fadr和漏报警持续时间比madr。每个真实的警报都应该与一个新出现的异常数据段相关联,并且真实警报的数量是:其中:干扰报警的数量nu是:这里xa,o(t)仅在发生报警时才取值“1”,即:误报率(far)和漏报率(mar)是反映单变量报警系统准确度的两个常用指标。基于正常工况下的数据段,far为:其中,tn是正常工况数据集x+(t)的总持续时间,xa,o,+(t)是正常工况数据集x+(t)对应的xa,o(t)。基于异常工况下的数据段,mar为:其中ta是异常工况数据集x-(t)的总持续时间,而xa,c,-(t)代表x-(t)的警报清除,xa,c,-(t)仅在警报清除时取值“1”,即:其中xa,-(t)是异常工况数据集x-(t)对应的xa(t)。本实施例定义了两个新的性能指标,即误报警持续时间比(fadr)和漏报警持续时间比(madr)。fadr用于描述误报警总持续时间与所有正常数据段总持续时间的比率。根据正常工况下的数据段,fadr计算如下:其中xa,+(t)是正常工况数据集x+(t)中xa(t)的对应项。madr被定义为漏报警的总持续时间与所有异常工况数据段的总持续时间的比率,madr为:下面结合具体数值和工业实例来说明本实施例所提出的方法的有效性,并与现有的方法进行了比较。过程变量x1(t)生成为:其中,e1(t)是平均值为零和方差的高斯白噪声,e2(t)是产生为e2(t)=0.4e1(t)+0.6e1(t-1)的有色噪声。x1(t)的高报警阈值为xtp,1=0.8。正常数据段为x1(1:500)和x1(1001:3000),异常数据段为x1(501:1000)。第一步,将分段线性表示(plrs)应用于x1(t),x1(t)如图2中的(a)所示,图2中的(b)示出了plrs的六条拟合线,它们能够反映x1(t)的真实趋势。第二步,进行假设检验以确定数据段属于正常或异常工况数据段,指示序列i(k)如图2中的(c)所示。第三步,计算了x1(t)的六个性能指标,并在表1中列出。由于噪声的存在,有相当多的干扰报警。由于e1(t)是白噪声,相邻干扰报警的持续时间较短,因此x1(1:1500)的far/mar和fadr/madr非常相似。相反地,far/mar和fadr/madr有很大的区别,因为e2(t)是一种有色噪声。因此,当干扰报警连续发生时,fadr/madr更适合。表1:用plrs划分数据段计算所得的性能指标。nu,ntfar/marfadr/madrx1(t)102,10.0364/0.0220.0968/0.022x1(1:1500)31,10.02/0.0220.02/0.0221x1(1501:3000)71,00.0474/00.148/0实施例2:本公开实施例2提供了一种基于分段线性表示的单变量报警系统性能评价系统,包括:数据获取模块,被配置为:获取报警系统的报警历史数据;数据分段模块,被配置为:根据预设数据段的数目,对具有相同趋势的相邻数据样本进行聚类,得到历史数据的分段线性表示;数据段分类模块,被配置为:通过假设检验,判断各个数据段的属性,至少包括正常工况数据段和异常工况数据段两种属性;性能评价模块,被配置为:根据得到的各个数据段的属性计算报警系统的各个性能指标。所述评价系统的工作方法与实施例1中的基于分段线性表示的单变量报警系统性能评价方法的步骤相同,这里不再赘述。实施例3:本公开实施例3提供了一种介质,其上存储有程序,该程序被处理器执行时实现如本公开实施例1所述的基于分段线性表示的单变量报警系统性能评价方法中的步骤,所述步骤具体为:获取报警系统的报警历史数据;根据预设数据段的数目,对具有相同趋势的相邻数据样本进行聚类,得到历史数据的分段线性表示;通过假设检验,判断各个数据段的属性,至少包括正常工况数据段和异常工况数据段两种属性;根据得到的各个数据段的属性计算报警系统的各个性能指标。更详细的步骤与实施例1中的评价方法的详细步骤相同,这里不再赘述。实施例4:本公开实施例4提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开实施例1所述的基于分段线性表示的单变量报警系统性能评价方法中的步骤,所述步骤具体为:获取报警系统的报警历史数据;根据预设数据段的数目,对具有相同趋势的相邻数据样本进行聚类,得到历史数据的分段线性表示;通过假设检验,判断各个数据段的属性,至少包括正常工况数据段和异常工况数据段两种属性;根据得到的各个数据段的属性计算报警系统的各个性能指标。本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1