基于数据挖掘的系留气球故障关联规则挖掘方法及系统与流程

文档序号:31468270发布日期:2022-09-09 22:18阅读:77来源:国知局
基于数据挖掘的系留气球故障关联规则挖掘方法及系统与流程

1.本发明涉及数据挖掘技术领域,更具体涉及基于数据挖掘的系留气球故障关联规则挖掘方法及系统。


背景技术:

2.系留气球因其滞空时间长、服役效费比高、机动性强、载重大、保障要求低、覆盖范围广等特点,广泛应用于海、陆、空军现代信息化作战条件中。在滞空值班过程中,运行工况复杂、外界未知环境因素扰动多,子系统或者关重件故障可能影响系留气球关键性能指标,甚至引发系留气球脱离地面系统以及任务载荷高空坠落的事故发生。因此,对于系留气球系统的可靠性、安全性、保障性提出了更高的要求。
3.目前在系留气球故障分析方法中一般有以下两种:(1)故障树方法,该方法通过构建树形网络将故障顶事件于底事件进行关联,找出系统故障和故障原因之间的逻辑关系,例如公开号为cn113960546a的现有发明专利申请文献《球载雷达稳定平台方位增量脉冲输出异常排障装置及方法》异常排障装置包括模拟脉冲调制装置,稳定平台包括平台控制部、平台驱动部、汇流环、传感器部及视频摄录部,传感器部包括角度传感器和速度传感器,平台控制部包含解算量化装置,模拟脉冲调制装置设置于平台控制部内;解算量化装置将角度传感器和速度传感器的反馈数据解算、量化为方位增量脉冲,经过汇流环后传输至地面监控站,形成点迹扫描线,若点迹扫描线异常,通过模拟脉冲调制装置产生模拟脉冲以替代方位增量脉冲,进一步对球载雷达方位增量脉冲输出异常作故障定位。该现有申请文献中披露的技术方案采用故障树模型进行故障排查,但上述方法依赖于故障系统经验库完整性。(2)d-s证据理论,该方法通过多类传感器提供的证据信息,采用d-s证据理论获得所有证据作用下的基本概率函数,输出故障诊断结果,但上述方法的前提假设是所有证据独立,在系留气球的状态数据中,部分信息数据线性相关。虽然上述方法虽然对系留气球单点故障可以解决,但在系留气球系统层面上,存在多子系统、多个故障因素耦合,历史故障数据和状态数据利用率低,通过历史故障记录,仅能获得相对分散、独立的故障信息,但无法挖掘内在的故障数据之间的关联规则以及量化故障数据之间的关联程度。因此,数据挖掘系留气球的故障信息对于事前预防和控制系留气球故障、维保具有重要意义。
4.综上,现有技术存在依赖于故障系统经验库完整性以及数据利用率低的技术问题。


技术实现要素:

5.本发明所要解决的技术问题在于如何解决现有技术中存在的依赖于故障系统经验库完整性以及数据利用率低的技术问题。
6.本发明是采用以下技术方案解决上述技术问题的:一种基于数据挖掘的系留气球故障关联规则挖掘方法包括:
7.s1、读取系留气球的运维管理系统故障数据库中的系留气球历史故障数据,据以
统计各系留气球子系统的故障频次数据。
8.s2、利用apriori算法建立系留气球分系统挖掘模型,以根据所述故障频次数据,通过预设最小支持度阈值判定断获取频繁项集,根据所述频繁项集,并以预设置信度为指标,逐层迭代搜索挖掘所述频繁项集中的项目集内部的潜在关联规则,所述步骤s2还包括:
9.s21、根据实际情况预设所述最小支持度阈值和所述最小置信度阈值;
10.s22、获取第一频繁项集l1,以所述第一频繁项集l1自连接产生第二频繁项集l2,以所述第二频繁项集l2与第三频繁项集l3连接,以产生候选集c3,删除所述候选集中c3低于所述最小支持度阈值的项,循环执行本步骤,删除所述所述候选集中低于最小支持度阈值的项;
11.s23、执行所述步骤s22,直至所述候选集为空,当支持度不小于所述最小支持度阈值且所述预设置信度不小于所述最小置信度阈值时,判定找到最大频繁项集;
12.s24、根据所述最大频繁项集确定所述潜在关联规则;
13.s3、采集并读取多类传感器数据中的气球状态数据,数据类型多样且量纲不统一,对所述气球状态数据进行补全、正则化以及归一化处理,以统一气球状态数据的量纲,据以得到关重件状态数据;
14.s4、评价各所述子系统中的所述关重件状态数据的特征相关性,据以进行特征排序得到相关性排序关重件状态数据,以预设阈值过滤筛选所述相关性排序关重件状态数据,以获得强关联度特征,将所述强关联度特征作为子系统-关重件故障树状网路关联规则。
15.本发明结合系留气球的故障特点,根据系留气球各子系统的故障历史数据频次,采用apriori数据挖掘各层次故障数据的关联规则,初步定性确定了各子系统历史故障数据之间的关联规则,然后以互信息方法对系留气球相同时间段的关重件运行状态数据进行进一步的挖掘,与前述初步确定的关联规则形成树状网络故障关联规则,并量化了关重件故障因素的关联度。为后续系留气球实现装备精细化、智能化持续管理和自主化保障奠定基础。
16.本发明相较于现有技术,减少了对故障系统经验库完整性的依赖,摆脱了系留气球单点故障的局限,针对现实应用场景中系留气球系统存在多子系统、多个故障因素耦合,对于获得相对分散、独立的故障信息,本发明挖掘内在的故障数据之间的关联规则并量化故障数据之间的关联程度。本发明通过以分系统故障数据和关重件状态数据为驱动,挖掘多层次、内在、隐含的故障关联规则,为故障诊断及预防控制提供决策依据。
17.在更具体的技术方案中,所述步骤s1包括:
18.s11、连接系留气球在特定时间段内的所述运维管理系统故障数据库,通过udp协议传输所述所述运维管理系统故障数据库中的系留气球历史故障数据表;
19.s12、统计所述系留气球子系统在所述特定时间段内的故障频次。
20.在更具体的技术方案中,所述步骤s12中的所述系留气球子系统包括:球体结构分系统、地面系留设施分系统、测控分系统、地面保障系统、系留缆绳、压调分系统及电源分系统。
21.本发明读取系留气球各子系统故障数据和关重件状态数据,根据系留气球分系统相同时间段故障频次,挖掘最大故障频繁项集,初步确定了分系统各故障关联规则,构建关
重件状态数据互信息模型,过滤筛选获得关重件故障强关联规则,并量化了故障数据之间的关联度,实现了分系统-关重件树状网络故障关联规则挖掘。
22.在更具体的技术方案中,所述步骤s22还包括:
23.s221、第k-1次找到所述频繁项集k-1的项集lk-1,据以产生k-候选项集合ck;
24.s222、确定所述k-候选项集合ck中每项的所述支持度;
25.s223、删除所述k-候选项集合ck中低于所述最小支持度阈值的项。
26.在更具体的技术方案中,所述步骤s23还包括:
27.s231、找出k-频繁项集lk,直至所述候选集ck为空集;
28.s232、判断是否支持度不小于所述最小支持度阈值且所述预设置信度不小于所述最小置信度阈值;
29.s233、若是,则判定找到所述最大频繁项集;
30.s234、若否,则持续执行所述步骤s231至所述步骤s233。
31.本发明通过预设最小支持度阈值来判断频繁项集,然后找到频繁项集后,以置信度为指标,逐层迭代搜索挖掘项目集内部潜在的关联规则。本发明针对现有系留气球在长期滞空运行过程中产生海量的数据,提高了数据利用率低,深入挖掘内在的、隐性的关联规则及运维保障知识,本发明结合系留气球分系统故障频次和相同时间段的故障数据,基于数据挖掘方法先后确定了分系统、关重件故障强关联规则,量化关重件故障之间的关联度,有利于实现进一步故障精准定位和故障预测,为系留气球的智能健康管理夯实了坚实的基础。
32.在更具体的技术方案中,所述步骤s3包括:
33.s31、读取并通过udp协议传输分系统故障相同时间段的所述气球状态数据;
34.s32、对所述气球状态数据中各分系统原始状态数据的缺失值进行补全;
35.s33、采用python正则表达式从所述各分系统原始状态数据中提取状态参数值,合并坐标数据,以得到正则化气球数据;
36.s34:以下述最大最小归一化逻辑处理所述正则化气球数据,以统一所述正则化气球数据的量纲:
[0037][0038]
其中x
imin
表示数据集x
ij
中的最小值,x
imax
表示数据集x
ij
中的最大值,x
in
为归一化的值。
[0039]
本发明读取气球状态数据由多类传感器数据,由于数据存在缺失值现象,数据类型多样且量纲不统一,需要对数据进行补全、正则化以及归一化处理来进一步提升数据质量和有效性。
[0040]
在更具体的技术方案中,所述步骤s4包括:
[0041]
s41、利用预置逻辑计算所述关重件状态数据,以获取关重件故障因素间互信息值;
[0042]
s42、处理所述关重件故障因素间互信息值,以量化关重件故障因素之间的关联程度,滤除低于所述预设阈值的弱关联因素,以获得所述关重件故障因素之间的强关联规则;
[0043]
s43、处理所述关重件故障因素之间的强关联规则,据以验证补充所述潜在关联规
则,以获取所述子系统-关重件故障树状网路关联规则。
[0044]
本发明通过评价各子系统中关重件状态数据特征的相关性,完成特征排序,设定阈值来过滤筛选获得关联度强的特征。结合步骤s2和s4,确定了子系统、关重件故障因素强关联规则,并量化了关重件故障因素之间的关联度。
[0045]
本发明提出结合子系统历史故障数据和状态数据,采用apriori算法初步建立系留气球个子系统故障关联规则挖掘模型,然后以互信息方法对关重件状态数据进行进一步的挖掘,与前述初步确定的关联规则互补、形成子系统-关重件树状网络故障关联规则,最后关重件故障因素之间的关联度。
[0046]
在更具体的技术方案中,所述步骤s41包括:
[0047]
s411、以预置导入逻辑从sklearn工具中导入度量指标数据metrics;
[0048]
s412、调用mutual_info_score,以下述逻辑计算所述关重件故障因素间互信息值:
[0049][0050]
其中a,b分别为给定的随机变量,p(a)为离散随机变量a的边缘分布概率,p(b)为离散随机变量b的边缘分布概率,p(a)p(b)为上述离散随机变量a、b的联合概率分布p(a,b)。
[0051]
在更具体的技术方案中,所述步骤s42包括:
[0052]
s421、量化关重件故障因素之间的关联程度,设定阈值为4.0,以过滤筛选低于阈值的弱关联因素;
[0053]
s422、获得所述关重件故障因素之间的所述强关联规则。
[0054]
在更具体的技术方案中,一种基于数据挖掘的系留气球故障关联规则挖掘系统包括:
[0055]
故障频次统计模块,用以读取系留气球的运维管理系统故障数据库中的系留气球历史故障数据,据以统计各系留气球子系统的故障频次数据。
[0056]
挖掘模型建立模块,用以利用apriori算法建立系留气球分系统挖掘模型,以根据所述故障频次数据,通过预设最小支持度阈值判定断获取频繁项集,根据所述频繁项集,并以预设置信度为指标,逐层迭代搜索挖掘所述频繁项集中的项目集内部的潜在关联规则,所述挖掘模型建立模块与所述故障频次统计模块连接,所述挖掘模型建立模块还包括:
[0057]
阈值模块,用以根据实际情况预设最小支持度阈值和最小置信度阈值;
[0058]
频繁项集处理模块,用以获取第一频繁项集l1,以所述第一频繁项集l1自连接产生第二频繁项集l2,以所述第二频繁项集l2与第三频繁项集l3连接,以产生候选集c3,删除所述候选集中c3低于所述最小支持度阈值的项,循环执行本步骤,删除所述所述候选集中低于最小支持度阈值的项,所述频繁项集处理模块与所述阈值模块连接;
[0059]
最大频繁项集获取模块,用以持续连接生成所述频繁项集,并删除所述所述候选集中低于最小支持度阈值的项,直至所述候选集为空,当支持度不小于所述最小支持度阈值且所述预设置信度不小于所述最小置信度阈值时,判定找到最大频繁项集,所述最大频繁项集获取模块与所述频繁项集处理模块连接;
[0060]
潜在关联获取模块,用以根据所述最大频繁项集确定所述潜在关联规则,所述潜
在关联获取模块与所述最大频繁项集获取模块连接;
[0061]
气球状态数据预处理模块,用以采集并读取多类传感器数据中的气球状态数据,数据类型多样且量纲不统一,对所述气球状态数据进行补全、正则化以及归一化处理,以统一气球状态数据的量纲,据以得到关重件状态数据,所述气球状态数据预处理模块与所述故障频次统计模块连接;
[0062]
强关联规则获取模块,用以评价各所述子系统中的所述关重件状态数据的特征相关性,据以进行特征排序得到相关性排序关重件状态数据,以预设阈值过滤筛选所述相关性排序关重件状态数据,以获得强关联度特征,将所述强关联度特征作为子系统-关重件故障树状网路关联规则,所述强关联规则获取模块与所述气球状态数据预处理模块及所述挖掘模型建立模块连接。
[0063]
本发明相比现有技术具有以下优点:本发明结合系留气球的故障特点,根据系留气球各子系统的故障历史数据频次,采用apriori数据挖掘各层次故障数据的关联规则,初步定性确定了各子系统历史故障数据之间的关联规则,然后以互信息方法对系留气球相同时间段的关重件运行状态数据进行进一步的挖掘,与前述初步确定的关联规则形成树状网络故障关联规则,并量化了关重件故障因素的关联度。为后续系留气球实现装备精细化、智能化持续管理和自主化保障奠定基础。
[0064]
本发明相较于现有技术,减少了对故障系统经验库完整性的依赖,摆脱了系留气球单点故障的局限,针对现实应用场景中系留气球系统存在多子系统、多个故障因素耦合,对于获得相对分散、独立的故障信息,本发明挖掘内在的故障数据之间的关联规则并量化故障数据之间的关联程度。本发明通过以分系统故障数据和关重件状态数据为驱动,挖掘多层次、内在、隐含的故障关联规则,为故障诊断及预防控制提供决策依据。
[0065]
本发明读取系留气球各子系统故障数据和关重件状态数据,根据系留气球分系统相同时间段故障频次,挖掘最大故障频繁项集,初步确定了分系统各故障关联规则,构建关重件状态数据互信息模型,过滤筛选获得关重件故障强关联规则,并量化了故障数据之间的关联度,实现了分系统-关重件树状网络故障关联规则挖掘。
[0066]
本发明通过预设最小支持度阈值来判断频繁项集,然后找到频繁项集后,以置信度为指标,逐层迭代搜索挖掘项目集内部潜在的关联规则。本发明针对现有系留气球在长期滞空运行过程中产生海量的数据,提高了数据利用率低,深入挖掘内在的、隐性的关联规则及运维保障知识,本发明结合系留气球分系统故障频次和相同时间段的故障数据,基于数据挖掘方法先后确定了分系统、关重件故障强关联规则,量化关重件故障之间的关联度,有利于实现进一步故障精准定位和故障预测,为系留气球的智能健康管理夯实了坚实的基础。
[0067]
本发明读取气球状态数据由多类传感器数据,由于数据存在缺失值现象,数据类型多样且量纲不统一,需要对数据进行补全、正则化以及归一化处理来进一步提升数据质量和有效性。
[0068]
本发明通过评价各子系统中关重件状态数据特征的相关性,完成特征排序,设定阈值来过滤筛选获得关联度强的特征。结合步骤s2和s4,确定了子系统、关重件故障因素强关联规则,并量化了关重件故障因素之间的关联度。
[0069]
本发明提出结合子系统历史故障数据和状态数据,采用apriori算法初步建立系
留气球个子系统故障关联规则挖掘模型,然后以互信息方法对关重件状态数据进行进一步的挖掘,与前述初步确定的关联规则互补、形成子系统-关重件树状网络故障关联规则,最后关重件故障因素之间的关联度。本发明解决了现有技术中存在的依赖于故障系统经验库完整性以及数据利用率低的技术问题。
附图说明
[0070]
图1为本发明实施例1的基于数据挖掘的系留气球故障关联规则挖掘方法基本步骤示意图;
[0071]
图2为本发明实施例1的统计系留气球子系统故障数据频次具体步骤示意图;
[0072]
图3为本发明实施例1的子系统故障关联挖掘具体步骤示意图;
[0073]
图4为本发明实施例1的关重件状态数据预处理具体步骤示意图;
[0074]
图5为本发明实施例1的强关联规则及其关联度获取具体步骤示意图;
[0075]
图6为本发明实施例2的基于数据挖掘的系留气球故障关联规则挖掘方法的细化步骤示意图。
具体实施方式
[0076]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0077]
实施例1
[0078]
如图1所示,一种基于数据挖掘的系留气球故障关联规则分析方法,所述方法包括:
[0079]
s1、统计系留气球子系统故障数据频次;在本实施例中,读取系留气球运维管理系统故障数据库中系留气球历史故障数据,统计球体结构分系统、地面系留设施分系统、测控分系统、地面保障系统、系留缆绳、压调分系统、电源分系统等故障频次。
[0080]
s2、基于apriori算法构建子系统故障关联挖掘模型;在本实施例中,在步骤s1故障频次数据的基础上,通过预设最小支持度阈值来判断频繁项集,然后找到频繁项集后,以置信度为指标,逐层迭代搜索挖掘项目集内部潜在的关联规则。
[0081]
s3、关重件状态数据预处理;在本实施例中,读取气球状态数据由多类传感器数据,由于数据存在缺失值现象,数据类型多样且量纲不统一,需要对数据进行补全、正则化以及归一化处理来进一步提升数据质量和有效性。
[0082]
s4:基于互信息挖掘关重件故障关联规则,获取强关联规则及其关联度;在本实施例中,在步骤s3关重件状态数据的基础上,通过评价各子系统中关重件状态数据特征的相关性,完成特征排序,设定阈值来过滤筛选获得关联度强的特征。结合步骤s2和s4,确定了子系统、关重件故障因素强关联规则,并量化了关重件故障因素之间的关联度。
[0083]
本发明读取系留气球各子系统故障数据和关重件状态数据,根据系留气球分系统相同时间段故障频次,挖掘最大故障频繁项集,初步确定了分系统各故障关联规则,构建关重件状态数据互信息模型,过滤筛选获得关重件故障强关联规则,并量化了故障数据之间
的关联度,实现了分系统-关重件树状网络故障关联规则挖掘。
[0084]
如图2所示,进一步地,所述步骤s1包括:
[0085]
s11:连接系留气球某段时间内运维管理系统故障数据库,读取数据库表格中的系留气球历史故障数据;
[0086]
s12:统计球体结构分系统、地面系留设施分系统、测控分系统、地面保障系统、系留缆绳、压调分系统、电源分系统等在相同时间段内的故障频次;
[0087]
如图3所示,更进一步地,所述步骤s2的具体过程如下:
[0088]
s21:预先设定最小支持度阈值和最小置信度阈值;
[0089]
s22:频繁1-项集的集合l1,然后l1自连接产生2项频繁项集l2,l2与l3连接产生候选集c3,删除候选集中低于最小支持度的项;
[0090]
s23:以此类推,第k-1次找到频繁项集k-1项集lk-1,产生k-候选项集合ck,确定ck中每项的支持度,删除候选集中低于最小支持度的项;
[0091]
s24:最后找出k-频繁项集lk,直到ck为空集,找到最大频繁项集。
[0092]
s25:初步确定系留气球子系统故障强关联规则;
[0093]
如图4所示,更进一步地,所述步骤s3的具体过程如下:
[0094]
s31:读取系留气球关重件状态数据,并通过udp协议传输;
[0095]
s32:对缺失值部分进行补全(空值nan补全为0,其它非空值的缺失部分采用均值插补);
[0096]
s33:数据类型多样,正则化提取状态参数对应的数值及布尔值,合并经纬度,布尔值true设为1,false设为0;
[0097]
s34:数据统一量纲,对数据进行归一化处理,所有且在0-1之间,采用公式进行最大-最小归一化处理。
[0098]
如图5所示,步骤s4的具体过程如下:
[0099]
s41:在步骤s3的基础上,计算关重件故障因素之间的互信息值;
[0100]
s42:设定阈值,过滤筛选低于阈值的弱关联因素;
[0101]
s43:获得关重件故障因素之间强关联规则;
[0102]
s44:进一步验证和补充了步骤s25子系统强关联规则,形成子系统-关重件故障树状网路关联规则。
[0103]
实施例2
[0104]
本实施例提供一种技术方案:一种基于数据挖掘的系留气球故障关联规则分析方法。首先,读取系留气球分系统故障数据、关重件状态运行数据,其次,基于apriori算法构建分系统故障挖掘模型,初步确定分系统故障关联规则。然后,采用互信息方法对关重件状态参数数据进行预处理,过滤筛选进一步挖掘关重件状态数据关联规则,最后,获得子系统-关重件故障数据强关联规则及关重件故障数据之间关联度。
[0105]
本实施例中采用c#连接sqlserver数据库,数据挖掘方法通过python软件工具编写程序,结合pandas、numpy、sklearn库等工具来进行数据预处理、apriori算法编写以及互信息模块导入。
[0106]
如图6所示,本实施例中数据挖掘的系留气球故障关联规则分析方法,具体包括以
下步骤:
[0107]
s1’、统计系留气球子系统故障数据频次;在本实施例中,所述步骤s1’包括:
[0108]
采用c#连接系留气球某段时间内运维管理系统故障数据库,通过udp协议传输数据库表格中的共32条系留气球历史故障数据;统计球体结构分系统、地面系留设施分系统、测控分系统、地面保障系统、系留缆绳、压调分系统、电源分系统等在相同时间段内的故障频次;
[0109]
s2’、创建长度为1的初始频繁集l1;
[0110]
s3’、所有频繁集的超集lk-1创建候选集ck;
[0111]
s4’、判断候选集中的项是否大于最小支持度;
[0112]
s5’、若是,则保留频繁项集,若否,则返回步骤s3’;
[0113]
s6’、判断频繁项集的置信度是否大于最小置信度;
[0114]
s7’、若是,则判定为初步强关联规则;
[0115]
s8’、若否,则判定为初步弱关联规则;在本实施例中,预先设定最小支持度阈值6.25%,为和最小置信度阈值6.25%,,具体阈值可根据实际情况调整;频繁1-项集的集合l1,然后l1自连接产生2项频繁项集l2,l2与l3连接产生候选集c3,删除候选集中低于最小支持度阈值的项;以此类推,第k-1次找到频繁项集k-1项集lk-1,产生k-候选项集合ck,确定ck中每项的支持度,删除候选集中低于最小支持度阈值的项;最后找出k-频繁项集lk,直到ck为空集,若支持度和置信度不小于设定阈值,则找到最大频繁项集。初步确定系留气球子系统故障强关联规则。
[0116]
s9’、读取故障时间段系留气球关重件状态数据;在本实施例中,读取分系统故障相同时间段的系留气球关重件状态数据,以主缆绳拉力故障为例,在经验分析的基础上,读取相关分系统中缆绳拉力、气球高度、气球方位、俯仰角、风速、紊流等等大致故障因素,并通过udp协议传输。
[0117]
s10’、数值异常值、正则化处理;在本实施例中,为了保证数据的一致性,对各分系统状态数据的缺失值进行补全(空值nan补全为0,其它非空值的缺失部分采用均值插补),采用python正则表达式re模块从上述各分系统状态原始数据中提取每个参数对应的数值或布尔值,合并经度、纬度,去除标签列和单位,并将布尔值false对应设置为0,布尔值true对应设置为1;
[0118]
s11’、数据归一化处理;在本实施例中,为了统一数据量纲,进行最大-最小归一化处理,使得上述各类数据在(0,1)之间;
[0119]
最大-最小归一化处理:
[0120]
其中x
imin
表示数据集x
ij
中的最小值,x
imax
表示数据集x
ij
中的最大值,x
in
为归一化的值。
[0121]
s12’、互信息方法过滤;在本实施例中,基于互信息计算公式或者从sklearn工具中导入metrics,调用mutual_info_score计算关重件故障因素之间的互信息值,具体公式如下:
[0122][0123]
其中a,b分别为给定的随机变量,p(a)为离散随机变量a的边缘分布概率,p(b)为
离散随机变量b的边缘分布概率,p(a)p(b)为上述离散随机变量a、b的联合概率分布p(a,b)。若变量a与变量b互信息值越大,表示两者之间的相关性越强,且包含的信息量越大。
[0124]
s13’、量化分析关联度;在本实施例中,量化了关重件故障因素之间的关联程度,设定阈值为4.0(具体阈值可根据实际情况调整),过滤筛选低于阈值的弱关联因素;
[0125]
s14’、挖掘故障关联规则,量化各子系统关联程度;在本实施例中,获得关重件故障因素之间强关联规则;进一步验证和补充了步骤s25子系统强关联规则,形成子系统-关重件故障树状网路关联规则。
[0126]
综上所述,上述实施例的结合各子系统故障频次,采用apriori算法建立系留气球分系统挖掘模型,初步挖掘各子系统故障之间的强关联规则,然后基于各子系统关重件状态数据进一步挖掘故障期间关重件强关联规则,并量化期间的关联程度。最后以某型系留气球子系统故障和缆绳拉力故障为例,验证了所提方法的有效性,结果表明了,所提的方法可实现分系统-关重件故障树状网络关联规则挖掘,提高故障诊断结果的准确性和可靠性,对系留气球子系统、关重件故障智能诊断、智能化运维保障具有重要研究意义。
[0127]
本发明结合系留气球的故障特点,根据系留气球各子系统的故障历史数据频次,采用apriori数据挖掘各层次故障数据的关联规则,初步定性确定了各子系统历史故障数据之间的关联规则,然后以互信息方法对系留气球相同时间段的关重件运行状态数据进行进一步的挖掘,与前述初步确定的关联规则形成树状网络故障关联规则,并量化了关重件故障因素的关联度。为后续系留气球实现装备精细化、智能化持续管理和自主化保障奠定基础。
[0128]
本发明相较于现有技术,减少了对故障系统经验库完整性的依赖,摆脱了系留气球单点故障的局限,针对现实应用场景中系留气球系统存在多子系统、多个故障因素耦合,对于获得相对分散、独立的故障信息,本发明挖掘内在的故障数据之间的关联规则并量化故障数据之间的关联程度。本发明通过以分系统故障数据和关重件状态数据为驱动,挖掘多层次、内在、隐含的故障关联规则,为故障诊断及预防控制提供决策依据。
[0129]
本发明读取系留气球各子系统故障数据和关重件状态数据,根据系留气球分系统相同时间段故障频次,挖掘最大故障频繁项集,初步确定了分系统各故障关联规则,构建关重件状态数据互信息模型,过滤筛选获得关重件故障强关联规则,并量化了故障数据之间的关联度,实现了分系统-关重件树状网络故障关联规则挖掘。
[0130]
本发明通过预设最小支持度阈值来判断频繁项集,然后找到频繁项集后,以置信度为指标,逐层迭代搜索挖掘项目集内部潜在的关联规则。本发明针对现有系留气球在长期滞空运行过程中产生海量的数据,提高了数据利用率低,深入挖掘内在的、隐性的关联规则及运维保障知识,本发明结合系留气球分系统故障频次和相同时间段的故障数据,基于数据挖掘方法先后确定了分系统、关重件故障强关联规则,量化关重件故障之间的关联度,有利于实现进一步故障精准定位和故障预测,为系留气球的智能健康管理夯实了坚实的基础。
[0131]
本发明读取气球状态数据由多类传感器数据,由于数据存在缺失值现象,数据类型多样且量纲不统一,需要对数据进行补全、正则化以及归一化处理来进一步提升数据质量和有效性。
[0132]
本发明通过评价各子系统中关重件状态数据特征的相关性,完成特征排序,设定
阈值来过滤筛选获得关联度强的特征。结合步骤s2和s4,确定了子系统、关重件故障因素强关联规则,并量化了关重件故障因素之间的关联度。
[0133]
本发明提出结合子系统历史故障数据和状态数据,采用apriori算法初步建立系留气球个子系统故障关联规则挖掘模型,然后以互信息方法对关重件状态数据进行进一步的挖掘,与前述初步确定的关联规则互补、形成子系统-关重件树状网络故障关联规则,最后关重件故障因素之间的关联度。本发明解决了现有技术中存在的依赖于故障系统经验库完整性以及数据利用率低的技术问题。
[0134]
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1