一种数据驱动的卫星分系统异常预测方法与流程

文档序号:16739848发布日期:2019-01-28 12:54阅读:360来源:国知局
一种数据驱动的卫星分系统异常预测方法与流程

本发明涉及一种数据驱动的卫星分系统异常预测方法,是一种针对卫星遥测数据流的高精度分系统异常预测方法,属于工程应用与信息科学的交叉领域。



背景技术:

卫星运行的太空环境复杂多变,其健康安全时刻面临着威胁和挑战。如何确保卫星系统的正常运行,找出运行过程中可能会出现的异常已经成为航天和信息科学研究领域的热点。数据驱动的异常预测方法为研究卫星分系统的异常情况提供了一种便捷的、高效的解决方法。无需专业的卫星领域知识,一种数据驱动的卫星分系统异常预测方法就可以利用模式挖掘技术预测出卫星分系统中可能出现的异常。

卫星遥测数据是以数据流的形式呈现的。所谓数据流是指只能以预先规定的顺序被读取一次的数据序列。起初,卫星产生的海量数据流大多用二三级存储设备进行存储,但随着内存技术和处理器技术的进步,二三级存储设备的数据处理速度越来越跟不上数据传输的速度。如果数据处理的速度比数据传输的速度慢,就会导致大量的信息流失。如何实时地处理数据流成为卫星分系统异常预测的难点。利用滑动窗口技术对遥测数据流进行分段处理,可以得到部分实时的处理结果,避免未处理的原始数据流失。

异常检测是数据流分析的一个重要方向。异常值是一组与其他数据有很大差异的数据。存在多种传统的异常检测的方法,例如:基于距离的异常检测,基于分布的异常检测,基于密度的异常检测和基于聚类的异常检测方法。大多数这些方法大多都是通过计算全维度空间中点与点的距离来检测异常的。这些方法的计算量会随着数据量和维度的增加而急剧增加,从而变得不再具有定性意义。此外,还有许多异常检测的方法,例如:基于智能神经网络的异常检测和基于信息理论的异常检测。这两种方法和传统方法相比,具有一定的进步,但仍然存在时间复杂度随着维度的升高而急剧增加的问题。通过稀有模式挖掘来检测异常的方法,在结果准确率和运行速度上都取得了很大的提高。

稀有模式一般是指支持度小于指定最小支持度阈值的模式。在安全预防、入侵检测和海量数据异常检测等领域,稀有模式挖掘非常重要,例如:网络安全检测、药物不良反应检测和卫星分系统异常预测等。



技术实现要素:

发明目的:本发明提出一种数据驱动的卫星分系统异常预测方法。该方法以卫星遥测数据流为处理对象,利用最小稀有模式挖掘技术提高异常检测的效率。该方法可以对动态数据流进行分段的异常预测,得到实时的结果反馈,避免造成数据流失。该方法结合使用自顶向下和自底向上相的遍历技术来搜索候选集,进一步提高了算法的速度。

本发明的具体技术方案包括以下几个步骤:

步骤一:针对卫星遥测数据流的每条事务,利用分类法选择属性。

步骤二:设置滑动窗口尺寸,消除主观因素的影响,并对步骤一中筛选的遥测数据流进行分段。

(1)利用小波分析获取选择属性的第一主周期;

(2)采用第一主周期设置滑动窗口尺寸;

(3)利用滑动窗口划分分类后的遥测数据流。

步骤三:针对步骤二中分段后的遥测数据流,利用双向遍历挖掘出最小稀有模式。

步骤四:计算异常识别因子,对步骤三挖掘出来的最小稀有模式进行异常检测,根据检测结果预测卫星分系统中存在的异常。

(1)合并现有的3个因子:twf、mipdf和mifpof,形成新的异常识别因子isoutlier;

(2)利用异常识别因子isoutlier,检测卫星遥测数据流中的异常,预测卫星分系统中可能出现的异常情况。

本发明的有益效果是:

本发明从稀有模式挖掘的角度,针对卫星分系统的遥测数据流本身进行属性选择和窗口划分,结合最小稀有模式挖掘、双向遍历和异常识别因子isoutlier,提出了一种新颖的卫星分系统异常预测方法,有效地解决了卫星遥测数据流易流失、异常检测效率低和滑动窗口受主观因素影响等一系列问题。该方法适合用于数据量大、无需专业领域知识的卫星分系统异常预测。本发明经扩展后,还可应用于大数据平台上的稀有模式挖掘和并行系统中的异常检测。

附图说明

图1是本发明方法的总体流程图。

具体实施方式

下面结合附图和相关算法,对本发明做进一步说明。

本发明的总体流程图如图1所示。

本发明利用卫星遥测数据流进行卫星分系统的异常预测,采用分类法筛选卫星遥测数据流的属性。利用小波分析将滑动窗口尺寸设置为选择属性的第一主周期,消除主观因素的影响,并用此窗口划分卫星遥测数据流。使用双向遍历从分段后的窗口数据中挖掘出最小稀有模式,提高挖掘效率。针对挖掘出来的最小稀有模式,计算其异常识别因子,检测卫星遥测数据中的异常,预测卫星分系统中可能出现的异常情况。具体实施步骤如下:

1.分类法选择属性

由于卫星系统的精密部件较多,所以遥测数据流维数高、数据量大。本发明利用分类法对高维遥测数据流进行属性选择。其过程可以用算法1描述:

算法1:分类法

输入:数据流ds,所有属性的健康值范围[low,up]

输出:新的数据流nds

1:ds_tmp=null//存放临时数据

2:num=遥测数据流ds中包含属性的数量

3:for(i=0;;i++)

4:for(j=0;j<num;j++)

5:if(attribute[j]∈[low,up])

6:ds_tmp[i]+=attribute[j]

7:elsecontinue

8:endfor

9:endfor

10:nds=ds_tmp

2.划分数据流

针对分类后的数据流nds,利用小波分析获取选择属性的第一主周期,并设置滑动窗口尺寸为第一主周期,消除人为主观因素对滑动窗口的影响,利用客观化后的滑动窗口划分数据流nds。其过程可用算法2描述:

算法2:划分数据流

输入:分类后的数据流nds

输出:分段后的得到的窗口数据[nds]

1:选择所需属性进行小波分析,绘制小波方差图

2:第一主周期t=小波方差图的最高峰值

3:滑动窗口尺寸|sw|=t

4:以|sw|尺寸为一个窗口,划分数据流nds

5:[nds]=分段后的数据流

3.挖掘所有窗口数据中的最小稀有模式

利用步骤2得到的分段后的卫星遥测数据流,利用双向遍历挖掘出数据流中的最小稀有模式。具体步骤如下:

(1)找出所有长度为1的模式,将其放入集合c1。根据公式(8)计算出c1中所有模式的支持度,根据公式(9)找出所有稀有模式,并将它们放入集合mrp1,然后将剩余的频繁1-项集放入集合fp1,并按其支持度升序排序。

其中,i={i1,i2,...,im},ik(1≤k≤m)为一个项,每一个项表示事务的一条信息,|sw|表示滑动窗口尺寸,countsw(i)表示在滑动窗口sw中包含模式i的事务数量,δ表示最小支持度阈值。

(2)找出所有长度为len(len是不同属性的个数)的模式,并将其放入集合clen,然后根据公式(8)计算它们的支持度,根据公式(9)找出所有稀有的len-模式,根据公式(10)找出所有频繁的len-模式,并将稀有的len-项集放入集合rplen,将频繁的len-项集放入集合fplen。

(3)以集合rplen为顶部,集合fp1为底部,调用双向遍历算法bt(bidirectionaltraversal)找出所有长度大于1的最小稀有模式,并与集合mrp1做交集,输出最小稀有模式集合mrp。

其具体过程如算法3,算法4描述:

算法3:挖掘最小稀有模式

输入:[nds]:分段后的卫星遥测数据流

|sw|:滑动窗口尺寸

δ:最小支持度阈值

输出:mrp:最小稀有模式

1:c1←{1-itemset}

2:

3:

4:

5:

6:clen←{len-itemset}

7:

8:

9:

10:

11:forallsiinrplen

12:forallsjinfp1

13:mrpnext←bt(sj,si)

14:endfor

15:endfor

16:mrp←filtering(mrp1∪mrpxext)

算法4:双向遍历

1:startbt(sbottom,stop)

2:

3:if(top-bottom≤1)

4:if(sbottom是稀有的)

5:stop不属于mrpnext

6:elseif(stop的所有子集都是频繁的)

7:mrpnext←stop

8:endif

9:else

10:smid←生成sbottom和stop的中间项

11:forallsiinsmid

12:if(si是频繁的)

13:bt(si,stop)

14:elsebt(sbottom,si)

15:endfor

16:endif

17:returnmrpnext

18:endstart

4.检测卫星遥测数据流的异常情况

利用步骤3挖掘到的最小稀有模式进行遥测数据流的异常检测,根据检测结果预测卫星分系统可能发生的异常。具体步骤如下:

(1)合并已有的3个异常相关性的因子:twf,mipdf和mifpof,形成新的异常识别因子isoutlier,提高异常检测方法的运行效率。其具体计算过程如下:

根据因子mifpof有:

根据因子twf有:

根据因子mipdf有:

把公式(12)和公式(13)代入到公式(11),得到新的异常识别因子isoutlier,如公式(14)所示:

其中是一个函数,表示在事务ti的所有子集中,属于最小稀有模式mrp的子集的数量,表示包含于事务ti中的最小稀有模式x的支持度,x是一个变量,泛指那些既属于稀有模式mrp,又是事务ti的子集的模式,|mrp|表示最小稀有模式的长度。

(2)在步骤3的基础上,为每个滑动窗口sw中包含最小稀有模式的事务流计算其异常识别因子。根据不等式(15)判定事务的异常情况,其中v表示异常阈值。若大于v,则该事务为异常;否则,该事物没有异常。

isoutlier(ti)>v,ti∈sw(15)

其具体过程如算法5描述:

算法5.检测异常

输入:[nds]:分段后的卫星遥测数据流

|sw|:滑动窗口尺寸

δ:最小支持度阈值

v:异常阈值

输出:ti:检测到的异常事务

1:mrp=算法3挖掘出来的最小稀有模式

2:foreachx∈mrp

3:temp(x)=support(x)

4:endfor

5:for(i=1;i≤n;i++)

6:if(ti在滑动窗口sw中)

7:num(ti)=0,support(ti)=0

8:foreachx∈mrp

9:if

10:num(ti)+=1

11:support(ti)+=temp(x)

12:endif

13:endfor

14:isoutlier(ti)=1-(num(ti)/|mp|)2*[δ-(support(ti)/num(ti))]

15:if(isoutlier(ti)>v)

16:outputti

17:endif

18:endif

19:endfor。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1