一种飞行数据异常模式相似性查询方法

文档序号:6553856阅读:245来源:国知局
专利名称:一种飞行数据异常模式相似性查询方法
技术领域
本发明属于飞机的故障诊断技术领域,具体涉及一种飞行数据异常模式相似性查询方法。
背景技术
二十一世纪,随着高科技的不断注入,现代飞机的高集成化、高智能化以及分析处理问题的高效化日益增强,随之而来的飞机的安全性、可靠性、经济性和维修保障等问题日益突出,因此故障诊断技术得到了前所未有的关注。飞机在飞行过程中以及维修时产生的大量飞行数据(例如记录在飞行数据记录仪以及QAR中的数据、飞机状态监控系统采集的数据、起飞报告中的数据、巡航报告中的数据等)中蕴含了丰富的关于飞机状态的信息,因此研究如何运用这些数据,实现对飞机的故障诊断,对于提高飞机的安全性和可靠性具有重要的意义。依据飞行数据进行故障诊断,最基本的功能就要能够发现飞行数据中与知识库中的异常模式相似的情形,但是飞行数据具有高维性、复杂性和噪声干扰等特点,直接利用原始飞行数据进行相似性查询不仅计算量大,而且影响查询结果的准确性和可靠性,因此需要将飞行数据进行模式表示,这样不仅可以大大压缩飞行参数的数据量,同时还可以有效剔除原始飞行数据中的噪声干扰,从而提高相似性查询的准确性和可靠性。对于高维数据的模式表示,目前国内外已经有了一些研究成果,其中Eamorm Keogh在文献《A Fast and RobustMethod for Pattern Matching in Time Series》中提出的基于重要点的分段线性表示方法,是一种效率比较高的方法,适合于处理飞行数据。为了提高相似性查询的效率,还需要将知识中的异常模式进行索引,从而提高相似性查询时搜索的效率。索引技术的关键问题是如何划分数据空间,以及如何根据划分方法将数据组织起来。目前虽然已经有了一些高维数据索引的方法,如R树、R*树等,但是这些方法多是根据对数据空间的直接划分,然后利用层次结构进行索引,因此当数据的维数比较高时,很可能会导致索引次数和存储空间的大量增加,严重影响相似性查询的效率,不适合应用于飞行数据的索引。虽然可以利用聚类技术,增加索引结构中每个节点中数据的相关性,从而降低索引的层数以及存储空间,但是飞行数据多是没有标记的数据,也就是无法了解其属于哪一类,因此不能采用传统的聚类方法。竞争聚类技术是由Hichem Frigui 等研究者在 1999 年在文献《A Robust Competitive Clustering Algorithm With Applications in ComputerVision》中提出的,此方法适合于处理无标记的高维数据的划分问题,目前已经成功应用于无标记数据的分类,但是目前尚没有应用到飞行数据索引建立的先例。在求解竞争聚类的问题的过程中,会涉及线性约束的二次规划问题求解。因为飞行数据的维数比较高,所以可以采取邓乃杨在《数据挖掘的新方法——支持向量机》一书中介绍的序列最小最优化(SMO)算法进行求解。

发明内容
本发明在利用了背景技术中提到的基于重要点的分段线性表示以及竞争聚类技术的基础上,提出了一种飞行数据异常模式相似性查询方法,用于查询飞行数据中是否有与知识库中的异常模式相似的情形。本发明提出的一种飞行数据异常模式相似性查询方法,具体包括以下几个步骤步骤一、模式表示过程(1)设飞行数据库中飞行数据序列X = (X1, x2, -,xn)的重要点集合为P = Ix1, X1J,计算余下的n-2个飞行数据(xk,k)到直线L(Xl,Xn)的距离dk,其中(xk, k)表示飞行数据序列X中第k个时刻该飞行数据的值xk,当dk> δ JljP= {χ17χη} U {xj,
3 M1 M
δ为精度因子,一般取为;;Σ(χ;,1彡i彡η,1彡j彡η,获得筛选后的重要点集
η ;=1 n i=l
合?变为{\,^ 2,-_\ },&<&<夂<8 1;当4彡δ时,筛选的重要点集合P中飞行数据个数不变。(2)设非重要点集合S = X-P= Ix1J2,"Ιη}-Ρ,计算非重要点集合S中任意点 (xffl,m)到直线L(\,\)的距离dm,其中e S,(xffl,m)表示非重要点集合第m个时刻的飞行数据值xm,&彡m彡gj ;若dm > δ,则筛选后的重要点集合P变为{、,、,…夂㈨ ;若 dffl^ δ,筛选后的重要点集合P不变;(3)判断通过步骤(2)筛选后的重要点集合P与筛选前的重要点集合P的元素个数关系,若筛选后的重要点集合P中元素的个数大于筛选前的重要点集合P中元素的个数, 则返回步骤二,进行下一次筛选;若筛选后的重要点集合P与筛选前得重要点集合P的元素个数相等,则筛选结束,得到最终筛选后的重要点集合P为飞行数据库中飞行数据序列X = (XpX2, …,χη)的模式表示。步骤二、异常模式索引过程(1)设知识库中含有ρ个关于某一飞行数据的异常模式,表示为 Q = {qk\k = l,2,--,p}。其中Q表示该飞行数据异常模式的集合、 表示该知识库中飞行数据的第k个异常模式,P表示知识库中该飞行数据异常模式的个数。(2)利用竞争聚类方法将该飞行数据异常模式的集合ρ =丨^ μ = 1,2,...,丨进行分类,设所分的类别集合为B,分类后形成的各个子类分为β2,…,βν,即B=
β2,…,β ν);其中V为分类后形成的子类别个数。(3)将异常模式的集合Q作为索引树的根节点,将β” β2,…,βν作为索引树中 Q的子节点;(4)将β2,…,的包含的异常模式再以竞争聚类技术进行分类,然后将 β2,…,β ν分类后的子类别分别做为索引树中β2,…,β ν的子节点;(5)返回步骤(4)继续进行分类,直至最后分类后形成的每个子类别中只含有一个异常模式,最终获得异常模式的索引树。所述的竞争聚类方法具体为预先设定一个比较大的类别值C,为了不漏掉类,取 C = P,其中P为所要分的异常模式集合中异常模式的个数。然后利用聚类技术进行分类, 使分好的这C个类进行竞争,竞争后留下的类别即为分类后形成的子类别。竞争的标准为在Ix的约束下,求使得函数
权利要求
1. 一种飞行数据异常模式相似性查询方法,其特征在于具体包括以下几个步骤步骤一、模式表示过程(1)飞行数据库中飞行数据序列X= (X1, X2,…,Xffl)的重要点集合为P = Ix1, XfflI, 其中χι,χ2,…,^分别表示该飞行数据在不同时刻的值,η表示该飞行数据的维数,计算余下的η-2个飞行数据(xk,k),2彡k彡n-1,到直线L(Xl,Xm)的距离dk,其中L(Xl,xn)为连接(Xl,1)与(xm,η)的直线;(xk,k)表示飞行数据序列X中第k个时刻飞行数据的值& ; 当dk> δ,则卩={Xl, xj U {xk},其中δ为精度因子,获得筛选后的重要点集合P变为δ时,筛选后的重要点集合P中飞行数据个数不变;(2)设非重要点集合5= X-P= Ix1, X2,…xJ-Ρ,,计算非重要点集合S中任意点(xffl, m)到直线的距离dm,其中为连接私)与的直线;xm e S,(xffl, m)表示非重要点集合中第m个飞行数据值xm,gj ;若dm > δ,则筛选后的重要点集合P变为;若dm彡δ,筛选后的重要点集合P不变;(3)判断通过步骤(2)筛选后的重要点集合P与进行筛选前的重要点集合P的元素个数关系,若筛选后的重要点集合P中元素的个数大于筛选前的重要点集合P中元素的个数, 则返回步骤二,进行下一次筛选;若筛选后的重要点集合P与筛选前的重要点集合P的元素个数相等,则筛选结束,得到最终筛选后的重要点集合P为飞行数据库中飞行数据序列X = (XpX2, …,Xn)的模式表示;步骤二、异常模式索引过程(1)知识库中含有P个关于飞行数据的异常模式,表示为β= {qk I k = l,2,-,p},其中Q 表示该飞行数据异常模式的集合, 表示该知识库中飞行数据的第k个异常模式,ρ表示知识库中该飞行数据异常模式的个数;(2):利用竞争聚类方法将该飞行数据异常模式的集合β=丨^ |& = 1,2,...』丨进行分类, 设所分的类别集合为B,分类后形成的各个子类分为β2,…,βν,Β= (βι; β2,…, β ν),其中V为分类后形成的子类别个数;(3)将异常模式的集合Q作为索引树的根节点,将β”β2,…,βν作为索引树中Q的子节点;(4)将β2,…,的包含的异常模式再以竞争聚类技术进行分类,然后将 β2,…,β ν分类后的子类别分别做为索引树中β2,…,βν的子节点;(5)返回步骤(4)继续进行分类,直至最后分类后形成的每个子类别中只含有一个异常模式,最终获得异常模式的索引树;步骤三、相似性查询过程(1)设索引树自顶向下的层数为第0层、第1层…、第L层,计算重要点集合P到第一层的自个子节点所对应类的距离,得到与重要点集合P距离最短的子节点所对应的子节点 β,;(2)计算重要点集合P到该子节点βk的各个子节点所对应类的距离,得到与重要点集合P距离最短的子节点f1;(3)判断子节点是否包含子节点,若子节点包含子节点,则返回步骤二,计算重要点集合P到子节点的各个子节点所对应类的距离;若子节点不包含子节点,则子节点 fx所对应的异常模式为与重要点集合P相似的模式。
2.根据权利要求1所述的一种飞行数据异常模式相似性查询方法,其特征在于所述的步骤二中竞争聚类方法具体为设定类别值C,取C = p,其中ρ为所要分的异常模式集合中异常模式的个数,然后利用聚类技术进行分类,使C个类进行竞争,竞争后留下的类别为分类后形成的子类别。
3.根据权利要求2所述的一种飞行数据异常模式相似性查询方法,其特征在于所述竞争的标准为在=1,K^jP的约束下,求使得函数 χ^ ,/^ι ^ ^]i=l i=l k=l i=l k=l取得最小值的Uik,其中β = {qk I k = 1,2,...,/7丨表示飞行参数异常模式的集合,i表示第k个飞行参数异常模式,B= (βι;β2,…,β。)表示C个包含异常模式的类,表示二与类I之间的距离,1为β2,…,^中的第1个类,1彡(;1^表示第1^个飞行参数异常模式i属于类1的程度,n为权重因子,利用序列最小最优化方法求解,若求解出类
4.根据权利要求3所述的一种飞行数据异常模式相似性查询方法,其特征在于所述的权重因子n的取值为n e (o,o. 2)。
5.根据权利要求3所述的一种飞行数据异常模式相似性查询方法,其特征在于所述类别重要度ε的取值为ε彡0.5。
6.根据权利要求1所述的一种飞行数据异常模式相似性查询方法,其特征在于所述
全文摘要
本发明提出的一种飞行数据异常模式相似性查询方法,具体包括步骤一、模式表示过程;步骤二、异常模式索引过程;步骤三、相似性查询过程。所述的飞行数据异常模式相似性查询方法利用基于重要点的模式表示技术,不仅降低了飞行数据维数,减少了相似性查询的计算量,而且有效剔除了飞行数据中的噪声干扰,提高了相似性查询的准确性和可靠性。且本发明提出的飞行数据异常模式相似性查询方法利用竞争聚类技术,获得了飞行数据异常模式的紧凑划分,使得索引结构简洁,提高了相似性查询的效率。
文档编号G06F17/30GK102163236SQ20111010942
公开日2011年8月24日 申请日期2011年4月22日 优先权日2011年4月22日
发明者王园, 邓小乐, 郎荣玲 申请人:北京航空航天大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1