多工况离群点检测模型确定方法及多工况离群点检测方法与流程

文档序号:37081089发布日期:2024-02-20 21:36阅读:17来源:国知局
多工况离群点检测模型确定方法及多工况离群点检测方法与流程

本发明涉及工况检测,尤其涉及一种多工况离群点检测模型确定方法及多工况离群点检测方法。


背景技术:

1、在工业生产中,装置单元的温度、压力、流量等传感器数据组成了工况的数据向量,它表征了装置单元的工况。在一个较长的时间范围内,由于物料性质变化、生产负荷调整等原因,装置单元往往工作在不同的工况上,这会导致数据向量不再符合常见的标准分布,并且可能会呈现出多簇分布的特点。

2、现有技术中,基于统计的简单离群点检测算法,例如:3σ、1.5iqr(interquartilerange,四分位距)等,通过分别计算数据向量每个维度的均值和方差来实现,但是,当每个维度不再符合标准高斯分布时,这些方法的功效将会下降,导致离群点检测的准确性下降。


技术实现思路

1、为了解决现有技术中存在的上述问题,本发明提供了一种多工况离群点检测模型确定方法及多工况离群点检测方法。本发明要解决的技术问题通过以下技术方案实现:

2、本发明实施例第一方面提供一种多工况离群点检测模型确定方法,包括以下步骤:

3、获取数据采集装置在预设历史时间内的历史工况数据;

4、根据多个多元高斯分布模型拟合所述历史工况数据,以确定多个多元高斯分布模型参数;

5、根据所述多个多元高斯分布模型参数确定历史工况数据的对数似然值;

6、根据所述历史工况数据的对数似然值确定对数似然阈值。

7、在本发明的实施例中,所述根据多个多元高斯分布模型拟合所述历史工况数据,以确定多个多元高斯分布模型参数,包括:

8、根据所述历史工况数据、多元高斯分布模型参数的类型和em算法确定模型参数优化目标函数;

9、根据所述模型参数优化目标函数和em算法确定多个多元高斯分布模型参数。

10、在本发明的实施例中,所述多个多元高斯分布模型参数包括:每个多元高斯分布模型的隐变量的概率、均值、协方差矩阵和多元高斯分布模型的数量;

11、所述根据所述模型参数优化目标函数和em算法确定多个多元高斯分布模型参数,包括:

12、根据所述模型参数优化目标函数和em算法对初始多元高斯分布模型参数进行迭代计算,确定所述每个多元高斯分布模型的隐变量的概率、均值和协方差矩阵;

13、根据多个多元高斯分布模型的隐变量的概率、均值、协方差矩阵和所述历史工况数据确定所述历史工况数据的对数似然;

14、根据所述历史工况数据的对数似然和多个多元高斯分布模型的最小bic值确定多元高斯分布模型的数量。

15、在本发明的实施例中,初始多元高斯分布模型参数包括:初始均值、初始协方差矩阵、初始概率和初始数量;

16、所述方法还包括:

17、根据kmean算法确定所述初始均值,以及根据高斯随机方阵和单位矩阵确定所述初始协方差矩阵。

18、在本发明的实施例中,在所述迭代计算过程中,若当前协方差矩阵为非正定协方差矩阵,则根据单位矩阵给当前协方差矩阵赋值。

19、本发明实施例第二方面提供一种多工况离群点检测方法,包括以下步骤:

20、获取数据采集装置的多个待检测工况数据;

21、根据本发明实施例第一方面提供的多个多元高斯分布模型参数和每个所述待检测工况数据确定每个待检测工况数据的待检测对数似然值;

22、若所述待检测对数似然值小于所述对数似然阈值,则确定所述待检测工况数据为离群点。

23、本发明实施例第三方面提供一种多工况离群点检测模型确定装置包括:

24、第一获取模块,用于获取数据采集装置在预设历史时间内的历史工况数据;

25、第一确定模块,用于根据多个多元高斯分布模型拟合所述历史工况数据,以确定多个多元高斯分布模型参数;

26、第二确定模块,用于根据所述多个多元高斯分布模型参数确定历史工况数据的对数似然值;

27、第三确定模块,用于根据所述历史工况数据的对数似然值确定对数似然阈值。

28、本发明实施例第四方面提供一种多工况离群点检测装置,包括:

29、第二获取模块,用于获取数据采集装置的多个待检测工况数据;

30、第四确定模块,用于根据本发明实施例第一方面提供的多个多元高斯分布模型参数和每个所述待检测工况数据确定每个待检测工况数据的待检测对数似然值;

31、第二判断模块,用于若所述待检测对数似然值小于所述对数似然阈值,则确定所述待检测工况数据为离群点。

32、本发明实施例第五方面提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本发明实施例第一方面提供的多工况离群点检测模型确定方法或实现本发明实施例第二方面提供的多工况离群点检测方法。

33、本发明实施例第六方面一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例第一方面提供的多工况离群点检测模型确定方法或实现本发明实施例第二方面提供的多工况离群点检测方法。

34、本发明的有益效果:

35、本发明通过多个多元高斯分布模型对工况数据进行拟合,从而确定多元高斯分布模型参数,根据确定的多个多元高斯分布模型参数确定对数似然阈值。检测时,根据对数似然阈值和待检测工况数据的对数似然值,可以对存在多工况的工作装置的运行数据进行离群点检测,提高了多维工况数据向量的离群点检测的准确性,同时,也适用于一维的工况数据向量的离群点检测,提高了通用性。本发明的多工况离群点检测方法提高了多维工况数据向量的离群点检测的准确性和离群点检测的通用性。

36、本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

37、下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。



技术特征:

1.一种多工况离群点检测模型确定方法,其特征在于,包括以下步骤:

2.如权利要求1所述的方法,其特征在于,所述根据多个多元高斯分布模型拟合所述历史工况数据,以确定多个多元高斯分布模型参数,包括:

3.如权利要求2所述的方法,其特征在于,所述多个多元高斯分布模型参数包括:每个多元高斯分布模型的隐变量的概率、均值、协方差矩阵和多元高斯分布模型的数量;

4.如权利要求3所述的方法,其特征在于,初始多元高斯分布模型参数包括:初始均值、初始协方差矩阵、初始概率和初始数量;

5.如权利要求3所述的方法,其特征在于,在所述迭代计算过程中,若当前协方差矩阵为非正定协方差矩阵,则根据单位矩阵给当前协方差矩阵赋值。

6.一种多工况离群点检测方法,其特征在于,包括以下步骤:

7.一种多工况离群点检测模型确定装置,其特征在于,包括:

8.一种多工况离群点检测装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述的多工况离群点检测模型确定方法或实现如权利要求6所述的多工况离群点检测方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的多工况离群点检测模型确定方法或实现如权利要求6所述的多工况离群点检测方法。


技术总结
本发明公开了一种多工况离群点检测模型确定方法,包括以下步骤:获取数据采集装置在预设历史时间内的历史工况数据;根据多个多元高斯分布模型拟合历史工况数据以确定多个多元高斯分布模型参数;根据多个多元高斯分布模型参数确定历史工况数据的对数似然值;根据历史工况数据的对数似然值确定对数似然阈值。本发明还提供一种多工况离群点检测方法。本发明检测模型确定方法确定的模型参数在离群点检测时提高了多维工况数据向量的离群点检测的准确性,同时,也适用于一维的工况数据向量的离群点检测,提高了通用性。本发明还公开了用于实现上述方法的装置、电子设备和计算机可读存储介质。

技术研发人员:姜洪安,田双昌
受保护的技术使用者:北京名道恒通信息技术有限公司
技术研发日:
技术公布日:2024/2/19
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1