基于互信息与多元线性回归的状态监测数据恢复方法

文档序号：10724747阅读：316来源：国知局

基于互信息与多元线性回归的状态监测数据恢复方法
【专利摘要】基于互信息与多元线性回归的状态监测数据恢复方法，属于系统状态监测技术领域。本发明是为了解决现有系统基础状态数据的准确性与完整性低的问题。本发明所述的基于互信息与多元线性回归的状态监测数据恢复方法，首先，通过已布署在系统中的传感器采集系统状态数据；然后，利用互信息方法分析各个通道的状态监测数据间的相关性，确定待恢复的目标数据和用于恢复目标数据的源数据；最后，利用多元线性回归方法恢复目标状态监测数据。本发明能够用于状态监测数据丢失或故障时对其进行恢复，为基于数据驱动的状态监测方法提供数据源，以确保对于系统整体状态监测结果的正确性。
【专利说明】
基于互信息与多元线性回归的状态监测数据恢复方法
技术领域
[0001] 本发明属于系统状态监测技术领域，尤其涉及基于互信息与多元线性回归的状态监测数据恢复方法。
【背景技术】
[0002] 系统状态监测方法体系中一类主要方法是基于系统状态数据开展的，数据的准确性与完整性是保证此类方法正确执行的基础。因此，状态监测数据的准备性与完整性也是确保系统可靠性的基础要素。在已有的系统状态监测方法体系中，着重于对系统状态的诊断与预测，而忽略了系统基础状态数据的准确性与完整性。

【发明内容】

[0003] 本发明是为了解决现有系统基础状态数据的准确性与完整性低的问题，现提供基于互信息与多元线性回归的状态监测数据恢复方法。
[0004] 本发明采用互信息和多元线性回归相结合的方法实现状态监测数据的恢复。
[0005] 本发明所述的基于互信息与多元线性回归的状态监测数据恢复方法，具体方法如下：
[0006] 首先，通过已布署在系统中的传感器采集系统状态数据；
[0007] 然后，利用互信息方法分析各个通道的状态监测数据间的相关性，确定待恢复的目标数据和用于恢复目标数据的源数据；
[0008] 最后，利用多元线性回归方法恢复目标状态监测数据。
[0009] 本发明致力于提出一种数据恢复方法，能够保证状态监测数据的准确性与完整性，为基于数据驱动的系统状态监测方法提供保障。现有公开发表的关于数据恢复的文献主要集中于三大类对象：
[0010] 1)存储介质，例如磁盘、固态存储；
[0011] 2)数据管理系统，例如文件系统、数据库系统；
[0012] 3)时钟信号。
[0013]上述三大类数据恢复方法并不直接与系统状态监测相关。
[0014] 而本发明提出一种能够实现状态监测数据恢复的方法，在使用互信息分析状态监测数据之间相互关联程度的基础之上，利用多元线性回归方法恢复目标状态数据。该方法能够用于状态监测数据丢失或故障时对其进行恢复，为基于数据驱动的状态监测方法提供数据源，以确保对于系统整体状态监测结果的正确性。
【附图说明】
[0015] 图1为熵、条件熵与互信息关系图；
[0016] 图2为基于互信息与多元线性回归的状态监测数据恢复方法的原理示意图；
[0017]图3为飞机发动机的结构不意图；
[0018] 图4为第一组实验数据的实验结果仿真示意图；
[0019] 图5为第二组实验数据的实验结果仿真示意图。
【具体实施方式】
【具体实施方式】 [0020] 一：参照图2具体说明本实施方式，在被监测的系统中设置传感器，所述传感器用于采集系统状态数据，本实施方式所述的基于互信息与多元线性回归的状态监测数据恢复方法，该方法为：
[0021] 首先，通过已布署在系统中的传感器采集系统状态数据；
[0022] 然后，利用互信息方法分析各个通道的状态监测数据间的相关性，确定待恢复的目标数据和用于恢复目标数据的源数据；
[0023] 最后，利用多元线性回归方法恢复目标状态监测数据。
[0024]本实施方式中，互信息的定义是建立在熵与条件熵的定义基础之上。
[0025]【具体实施方式】二:本实施方式是对【具体实施方式】一所述的基于互信息与多元线性回归的状态监测数据恢复方法作进一步说明，本实施方式中，利用互信息方法分析各个通道的状态监测数据的具体方法是：
[0026] 利用随机变量X表示一个通道内的数据，设X中含有N类数据，Xl表示第i类数据，i = 1,2,3,...，N，N为正整数；
[0027] 将每一类数据个数除以该通道内数据的总个数，获得该类据Xl在总数据中的概率 P(Xl)，利用下式获得该通道内随机变量X的熵值H(X):
[0029] 其中，熵值H(X)的单位为bit，
[0030] 利用随机变量Y表示另一个通道内的数据，利用下式获得已知随机变量Y时，随机变量X的熵值H(x | Y)，已知随机变量X时，随机变量Y的熵值H(Y IX):
[0032]其中，p(yj)表示随机变量Y的第j个边缘概率，H(X|Y = yj)表示随机变量X在Y取yj 的条件下的熵值，H(Y|X = Xl)表示随机变量Y在乂取^的条件下的熵值，
[0033] ρ(η，Χι)为随机变量Y和X的联合分布概率，p(Xl|n)为已知Y的条件下X的条件概率，
[0034] p(Xl，yj)为随机变量X和Υ的联合分布概率，P(yj| Xl)为已知X的条件下Υ的条件概率；
[0035] 利用下式确定互信息值Ι(Χ;Υ)和Ι(Υ;Χ):
[0037] 其中，Ι(Χ;Υ)表示随机变量X与随机变量Υ之间的互信息值，Ι(Υ;Χ)表示随机变量Υ 与随机变量X间的互信息值，Η(γ)表示随机变量Υ的熵值，p(x，y)表示随机变量X与Υ的联合分布概率，p(x)表示随机变量X的边缘概率密度，p(y)表示随机变量Y的边缘概率密度；
[0038]利用互信息值I(X;Y)和I(Y;X)分析各个通道的状态监测数据，确定待恢复的目标状态监测数据。
[0039]本实施方式中，熵、条件熵与互信息的关系如图1所示。
[0040]本实施方式中，每个通道内的数据总个数为已知量，每一类数据Xl的个数为已知量。
【具体实施方式】 [0041] 三:本实施方式是对二所述的基于互信息与多元线性回归的状态监测数据恢复方法作进一步说明，本实施方式中，利用互信息值Ι(χ;γ)和Ι(γ; X)分析各个通道的状态监测数据的具体过程如下：
[0042] 步骤一、将每个通道的数据用随机变量表示；
[0043]步骤二、利用式（1)至式(3)获得所有通道的状态监测数据间的互信息值，
[0044]步骤三、利用所有通道的状态监测数据间的互信息值选取待恢复的目标通道状态监测数据；
[0045] 步骤四、根据其它通道数据与目标通道数据间的互信息值大小，确定要恢复目标状态数据的源数据。
[0046] 本实施方式中，欲作为恢复目标的数据，在原则上可以根据状态监测在系统中的重要性来选取，然后将其它通道数据与待恢复的数据间的互信息值从大到小排序，最后从大到小的顺序中选取源数据用于恢复目标数据。
[0047] 本实施方式中，需要注意的是待恢复的目标状态数据为一路，源数据至少为两路。 [0048]【具体实施方式】四：本实施方式是对【具体实施方式】一所述的基于互信息与多元线性回归的状态监测数据恢复方法作进一步说明，本实施方式中，利用多元线性回归方法恢复目标状态监测数据的具体方法为：
[0049]利用下式恢复目标状态监测数据Yj:
[0050] Yj = β〇+βυχυ+· · -+PkjXkj+e j (4)
[0051] 其中，为回归系数，xkj为自变量，h为误差，k彡2且k与所选取的源数据通道数量相等，且自变量Xkj即为用于恢复目标状态监测数据的状态监测数据源。
[0052] 为验证本发明所述的基于互信息与多元线性回归的状态监测数据恢复方法的效果，采用美国国家航空航天局发布的涡轮发动机实验公开数据集。飞机发动机包括:风扇1、燃烧室2、高压压缩机3、低压压缩机4、高压涡轮5、低压涡轮6、喷嘴7及其他子系统，如图3所不。
[0053]在对发动机状态监测过程中，共有21个传感器获取其工作的气压、温度、转速等信息。其工作包含了一种失效模式、两种失效模式、一种操作方式、六种操作方式等，具体状态监测数据如表1所示。
[0054]表1发动机工作与失效数据集
[0056]实验效果评估过程采用数据集1中的两组数据用于分析，第一组数据中将传感器 15作为目标恢复状态监测数据，传感器2、4、7作为恢复状态监测数据的已知数据源，4个传感器间的互信息如表2所示。
[0057]表2第一组数据间的互信息
[0059]多元线性回归的过程中，关键步骤是确定公式(4)中的回归系数β〇，βυ，···，?^，在具体的实践中，通过已知的传感器15数据和已知的传感器2、4、7数据来确定，…，知。待确定了回归公式后，再来验证恢复数据的准确性，第一组数据的实验结果如图4所示。
[0060] 其中曲线Β1代表传感器15的真实数据，曲线C1代表采用本方明中所提出的方法恢复得到的状态监测数据，曲线Α1和曲线D1代表恢复数据的正负千分之五偏差，本方衡量恢复数据性能指标采用实际数据超过正负千分之五偏差在所有数据中所占的比例。图4所显示的实验结果中该比例为5.21 %。
[0061] 第二组数据采用传感器15作为目标恢复状态监测数据，传感器3、4、9作为恢复状态监测数据的已知数据源，4个传感器间的互信息如表3所示。
[0062]表3第二组数据间的互信息
[0064]第二组数据的实验结果如图5所示.其中曲线Β2代表传感器15的真实数据，曲线C2 代表采用本方明中所提出的方法恢复得到的状态监测数据，曲线Α2和曲线D2分别代表恢复数据的正负千分之五偏差，图5所显示的实验结果中该比例为5.73%。
[0065]通过上述两组实验数据的结果可知，基于互信息与多元线性回归方法的状态监测数据恢复方法具有较好的性能。该方法具有一般性，在其它应用案例中，经过此过程的分析，同样可以得到需要恢复的目标状态监测数据。
【主权项】
1. 基于互信息与多元线性回归的状态监测数据恢复方法，其特征在于，该方法为：首先，通过已布署在系统中的传感器采集系统状态数据；然后，利用互信息方法分析各个通道的状态监测数据间的相关性，确定待恢复的目标数据和用于恢复目标数据的源数据；最后，利用多元线性回归方法恢复目标状态监测数据。2. 根据权利要求1所述的基于互信息与多元线性回归的状态监测数据恢复方法，其特征在于，利用互信息方法分析各个通道的状态监测数据的具体方法是：利用随机变量X表示一个通道内的数据，设X中含有N类数据，XI表示第i类数据，i = 1，2， 3，...，N，N为正整数；将每一类数据个数除W该通道内数据的总个数，获得该类据XI在总数据中的概率P (XI)，利用下式获得该通道内随机变量X的赌值H(X):Cl) 其中，赌值H(X)的单位为bit, 利用随机变量Y表示另一个通道内的数据，利用下式获得已知随机变量Y时，随机变量X 的赌值H(X IY)，已知随机变量別寸，随机变量Y的赌值H(Y IX):(2) 其中，P(yj)表示随机变量Y的第j个边缘概率，H(X|Y = yj)表示随机变量X在Y取yj的条件下的赌值，H(Y I X = xi)表示随机变量Y在X取xi的条件下的赌值， P(化XI)为随机变量Y和X的联合分布概率，P(xi|yj)为已知Y的条件下X的条件概率， P(xi，yj)为随机变量X和Y的联合分布概率，P如|xi)为已知X的条件下Y的条件概率；利用下式确定互信息值Ι(Χ;Υ)和Ι(Υ;Χ):(3) 其中，I (X; Υ)表示随机变量X与随机变量Υ之间的互信息值，I (Υ; X)表示随机变量Υ与随机变量X间的互信息值，Η(γ)表示随机变量Υ的赌值，p(x，y)表示随机变量X与Υ的联合分布概率，p(x)表示随机变量X的边缘概率密度，p(y)表示随机变量Y的边缘概率密度；利用互信息值Ι(Χ;Υ)和Ι(Υ;Χ)分析各个通道的状态监测数据，确定待恢复的目标状态监测数据。3. 根据权利要求2所述的基于互信息与多元线性回归的状态监测数据恢复方法，其特征在于，利用互信息值Ι(Χ;Υ)和Ι(Υ;Χ)分析各个通道的状态监测数据的具体过程如下：步骤一、将每个通道的数据用随机变量表示；步骤二、利用式(1)至式(3)获得所有通道的状态监测数据间的互信息值，步骤Ξ、利用所有通道的状态监测数据间的互信息值选取待恢复的目标通道状态监测数据；步骤四、根据其它通道数据与目标通道数据间的互信息值大小，确定要恢复目标状态数据的源数据。4.根据权利要求1所述的基于互信息与多元线性回归的状态监测数据恢复方法，其特征在于，利用多元线性回归方法恢复目标状态监测数据的具体方法为：利用下式恢复目标状态监测数据Yj: Yj二Po+Pijxij·! 故jXkj+εj (4)其中，化j为回归系数,:xkj为自变重，εj为|；^差,2且k 与所选取的源数据通道数量相等，自变量XW为用于恢复目标状态监测数据的状态监测数据源。
【文档编号】G06F11/14GK106095616SQ201610382647
【公开日】2016年11月9日
【申请日】2016年6月1日公开号201610382647.4, CN 106095616 A, CN 106095616A, CN 201610382647, CN-A-106095616, CN106095616 A, CN106095616A, CN201610382647, CN201610382647.4
【发明人】刘连胜, 刘大同, 彭喜元, 彭宇
【申请人】哈尔滨工业大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘连胜;刘大同;彭喜元;彭宇;
技术所有人：哈尔滨工业大学;
我是此专利的发明人

上一篇：一种文件备份方法及文件备份装置的制造方法
上一篇：应用数据还原方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。