一种基于数据的轴温关联分析方法与流程

文档序号:18776232发布日期:2019-09-29 15:31阅读:133来源:国知局
一种基于数据的轴温关联分析方法与流程
本发明属于轴温关联分析方法
技术领域
,具体涉及一种基于数据的轴温关联分析方法。
背景技术
:高速铁路作为国民经济的大动脉,它的延伸带动着经济的发展。多年来,高速列车行车安全的可靠性一直是社会各界关注的重点,其中,列车车轴作为列车运行的主要设备,其实时监控和故障预警是关系到行车安全的一项重要工作,而过高的轴温则是故障的一个重要指标。当车轴故障时,其摩擦加剧,温度突升,达到一定程度便形成热轴,严重者会导致燃轴、切轴、车辆颠覆,若未能提前预报,将导致重大事故。因此,保证车轴的安全运行是保障高速列车安全运行的一个重要课题。但在实际运行中,由于设备受到空气介质、周围环境、车型以及行驶中车体晃动等因素的影响,轴温监测会有误报和漏报。万薇针对多点红外轴温探测器的数据融合处理问题进行了重要探讨;张矢设计了基于无线传感器网络的列车轴温监测系统,能够利用无线传感网络对铁路货运列车轴温进行实时监测;曹源基于DTW算法,提出一种能够实时对列车轴温实现状态监测和故障诊断的方法,有效降低列车轴温探测的误报率。武峥嵘引入一种新型智能线阵式多点红外探头,结合数据融合思想和模式识别技术,探讨了基于四点线阵式轴温探测模型的热轴判别方法。以上这些方法都是对采集过程进行优化,或者直接对轴温的数据进行处理。本发明提供了另一种思路,用现有采集到的数据挖掘出影响轴温变化的关联规则,从而保证即便我们采集不到正确的数据,通过观察其它属性的变化,也能够判断轴温的老化程度和其他部件的故障,为车轴的异常发现和预警提供决策支持。技术实现要素:本发明的目的在于提供一种基于数据的轴温关联分析方法,其能够挖掘出影响轴温相变化的关联规则,在无法采集到正确数据的情况下,通过观察相关属性的变化,也能够判断轴温的老化程度和其他部件的故障,为车轴的异常发现和预警提供决策支持。本发明所采用的技术方案是:一种基于数据的轴温关联分析方法,具体按照以下步骤实施:步骤1.在通过对实际采集得到的数据进行特征选择,以得到后期分析的原始数据,原始数据按照时间序列进行采集,每秒采集一次;然后将原始数据进行预处理,得到预处理后数据;步骤2.对步骤1中得到的预处理后的数据找出强关联规则R,即找出满足最小支持度和最小置信度的关联规则。本发明的特点还在于:步骤1中所述的对原始数据的预处理包括以下几步:步骤1.1、采用线性插值法对缺失数据进行处理:针对极少个别点缺失数据的情况,将原始数据进行插值处理之后,得到矩阵Am*n,矩阵Am*n按照时间序列进行采集,Am*n表示的含义为第m个时刻的第n个属性;步骤1.2、利用步骤1.1得到的矩阵Am*n生成0-1矩阵,将该0-1矩阵表示为矩阵D:将第1个时刻的第1个属性(A11)和第2个时刻的第1个属性(A21)的数据进行对比,如果A21大于等于A11,将矩阵D的第1行第1列(D11)标记为1,否则标记为0;然后将第1个时刻的第2个属性(A12)和第2个时刻的第2个属性(A22)的数据进行对比,如果A22大于等于A12,将矩阵D的第1行第2列(D12)标记为1,否则标记为0;以此类推,…,直到将第1个时刻的第n个属性(A1n)和第2个时刻的第n个属性(A2n)的数据进行对比,如果A2n大于等于A1n,将矩阵D的第1行第n列(D1n)标记为1,否则标记为0;然后用同样的方法将第2个时刻的n个属性和第3个时刻的n个属性数据进行对比,将得到的标记存入矩阵D的第2行,以此类推,…,直到将第m-1个时刻的n个属性和第m个时刻的n个属性数据进行对比并将标记存入矩阵D的第m-1行,即得到矩阵D,矩阵D称为预处理后数据:步骤1.1中所述线性插值法对缺失数据进行处理的步骤如下:设有数据(x0,f(x0)),(x1,f(x1)),解方程组得此时的插值多项式为x表示未知数缺失的个数,例如缺失3个数据,则y1(1)代表第一个缺失的数据,y1(2)代表第二个缺失的数据,y1(3)代表第三个缺失的数据。步骤2具体按照以下步骤实施:步骤2.1、生成频繁项集,并存入频繁项集集合L中;步骤2.2、找出强关联规则R,即要找出满足最小支持度和最小置信度的关联规则:通过步骤2.1生成频繁项集集合L后,首先利用公式(2)来计算所有关联规则的置信度:其中support_count(A∪B)为包含项集(A∪B)的记录数目;support_count(A)为包含项集A的记录数目。步骤2.1具体按照以下步骤实施:步骤2.1.1、设定最小支持度s和最小置信度c;步骤2.1.2、找出频繁1-项集首先遍历矩阵D,获得各项集的支持频度:项目的集合I={i1,i2,…,in}称为项集,是n个不同项目即属性的集合,每个属性ik(1≤k≤n,k∈Z)称为一个项目,其元素的个数称为项集的长度,长度为k的项集称为k-项集;矩阵D的每一列对应的属性分别为速度、环境温度、EC车转向架1一轴左侧温度、EC车转向架1一轴右侧温度、EC车转向架2三轴左侧温度、EC车转向架2四轴左侧温度、EC车转向架2三轴右侧温度、EC车转向架2四轴右侧温度、本单元空簧载重,所以项目的集合I={速度,环境温度,EC车转向架1一轴左侧温度,EC车转向架1一轴右侧温度,EC车转向架2三轴左侧温度,EC车转向架2四轴左侧温度,EC车转向架2三轴右侧温度,EC车转向架2四轴右侧温度,本单元空簧载重};扫描矩阵D,统计C1和C1中的每个候选1-项集在D中出现的次数,即支持频度;支持频度大于最小支持度s的候选1-项集C1组成频繁1-项集L1;步骤2.1.3、找出频繁2-项集为找出频繁2-项集,首先生成候选2-项集C2,候选2-项集C2是由频繁1-项集自身连接获得,即扫描矩阵D,统计C2和C2中的每个候选2-项集在D中出现的次数,即支持频度;支持频度大于最小支持度s的候选2-项集组成频繁2-项集L2;步骤2.1.4、找出频繁k-项集用频繁2-项集L2找出频繁3-项集L3,如此不断循环下去直到无法发现更多的频繁k-项集为止;最终频繁1-项集,频繁2-项集,…,频繁k-项集组成了频繁项集集合L;其中利用Lk-1获得Lk主要包含两个步骤:连接操作和删除操作。步骤2.1.4中所述利用Lk-1获得Lk主要包含的两个步骤,即连接操作和删除操作具体为:(a)连接操作:为找出频繁k-项集Lk,可以将频繁(k-1)-项集Lk-1中两个项集相连接以获得一个Lk的候选k-项集Ck;设l1和l2为Lk-1中的两个项集,li[j]表示li中的第j个项;为方便起见,假设D中各项记录均已按字典排序;若Lk-1的连接操作记为Lk-1⊕Lk-1,它表示若l1和l2中的前(k-2)项是相同的,即如果有:(l1[1]=l2[1])∧…∧(l1[k-2]=l2[k-2])∧(l1[k-1]=l2[k-1]),则Lk-1中l1和l2就可以连接到一起;而条件(l1[k-1]=l2[k-1])可以确保不产生重复项集;(b)删除操作:Lk是Ck的一个子集,它其中的各项集不一定都是频繁项集,但所有的频繁k-项集一定都在Ck,即扫描一遍D,找出矩阵D中包含Ck的项级出现的次数,即Ck中各候选项集的支持频度,由此获得频繁k-项集;所有频度不小于最小支持频度的候选项集就是属于Lk的频繁项集;然而由于Ck中的候选项集很多,该操作的时间复杂度会高,为了减少Ck的大小,需要利用Apriori性质:“一个非频繁(k-1)-项集不可能成为频繁k-项集的一个子集”;因此如果一个候选k-项集中任一子集((k-1)-项集)不属于Lk-1,那么该候选k-项集就不可能成为一个频繁k-项集,因而也就可以将其从Ck中删去。步骤2.2具体按照以下步骤实施:步骤2.2.1、对于频繁项集集合L中的每个频繁项集l,产生l的所有非空子集;步骤2.2.2、对于每个l的非空子集s,如果成立,则产生一个关联规则"s=>(l-s)",其中min_conf为最小置信度阈值;步骤2.2.3、遍历频繁项集集合L中所有的频繁项集,重复步骤2.2.1和步骤2.2.2得到关联规则,将关联规则存入强关联规则R中;步骤2.2.4、将强关联规则R输出到文本文件中进行分析、筛选得到有效的关联规则。本发明的有益效果是:本发明将关联挖掘算法Apriori算法应用于轴温数据的关联分析中,用现有采集到的数据挖掘出影响轴温变化的关联规则,通过观察规则中属性的变化,进而判断轴温的老化程度和其他部件的故障,为车轴的异常发现和预警提供决策支持。附图说明图1为本发明的关联分析流程图;图2为本发明中Apriori算法流程图。具体实施方式下面结合附图和具体实施方式对本发明进行详细说明:如图1所示,选择xx车xx天从xx-xx时间段的数据,即高速列车运行过程中一个速度的上升段作为研究对象,其属性包括速度、环境温度、EC车转向架1一轴左侧温度、EC车转向架1一轴右侧温度、EC车转向架2三轴左侧温度、EC车转向架2四轴左侧温度、EC车转向架2三轴右侧温度、EC车转向架2四轴右侧温度、本单元空簧载重。用Apriori算法来挖掘各属性之间的关联关系。表1轴温原始数据步骤1、数据预处理:步骤1.1、缺失数据的处理:本发明选择的如表1的原始数据,需要进行关联挖掘的属性包括:速度、环境温度、EC车转向架1一轴左侧温度、EC车转向架1一轴右侧温度、EC车转向架2三轴左侧温度、EC车转向架2四轴左侧温度、EC车转向架2三轴右侧温度、EC车转向架2四轴右侧温度、本单元空簧载重。在该步骤中,进行数据预处理。对于表1中缺失的数据,用线性插值的方法进行处理。由于该数据是每秒采集一条,所以(x0,f(x0)),(x1,f(x1))中的两个数据为(0,142.5797),(6,153.0797),由此得到a0=142.5797,a1=1.75,插值多项式为y1(x)=142.5797+1.75·x,所以,插入缺失的5个数据依次为144.3297,146.0797,147.8297,149.5797,151.3297。插值处理后的原始数据,用smooth函数滤波,得到表2的滤波处理后的原始数据。表2滤波处理后的原始数据步骤1.2、生成0-1矩阵:针对步骤1.1得到的矩阵A,将某一时刻和后一个时刻的数据进行对比,如果后一时刻数据大于此时刻数据,将此时刻的数据标记为1,否则标记为0,将标记存储到矩阵D中。步骤2、如图2所示,本步骤将预处理后数据矩阵D,利用关联挖掘算法Apriori算法进行训练得到强关联规则R,具体按照以下步骤实施:步骤2.1、生成频繁项集,并存入频繁项集集合L中;步骤2.1.1、设定最小支持度s=0.001,最小置信度c=0.7;步骤2.1.2、找出频繁1-项集:首先遍历矩阵D,获得各项集的支持频度:在本例中,项集I={I1,I2,…,I9}分别代表{速度,环境温度,EC车转向架1一轴左侧温度,EC车转向架1一轴右侧温度,EC车转向架2三轴左侧温度,EC车转向架2四轴左侧温度,EC车转向架2三轴右侧温度,EC车转向架2四轴右侧温度,本单元空簧载重},I为9个不同的项目的集合。遍历矩阵D得到候选1-项集C1见表4,在表4中,1代表该候选/频繁项集中有这一项,0代表没有,比如表3代表的候选1-项集为{I1},{I2},{I3},{I4},{I5},{I6},{I7},{I8}。支持度大于最小支持度0.001的为频繁1-项集,由于这里所有的项集支持度都大于0.001,所以,频繁1-项集L1等于候选1-项集C1。表3候选1-项集I1I2I3I4I5I6I7I8I9支持度1000000000.8440860220100000000.0994623660010000000.0295698920001000000.0080645160000100000.013440860000010000.0403225810000001000.0107526880000000100.01344086步骤2.1.3、找出频繁2-项集:为找出频繁2-项集,首先生成候选2-项集C2,遍历矩阵D,找到C2中的项集和每个候选2-项集的支持频度,C2中,支持频度大于最小支持度0.001的候选2-项集组成频繁2-项集L2。L2中所有项集的支持度都大于0.001,所以频繁2-项集L2等于候选2-项集C2,见表4。表4候选2-项集I1I2I3I4I5I6I7I8I9支持度1100000000.0887096771010000000.0295698921001000000.0080645161000100000.0107526881000010000.0322580651000001000.0107526881000000100.013440860101000000.0026881720100100000.0053763440100010000.0053763440100001000.0053763440010000100.0026881720001100000.005376344步骤2.1.4、找出频繁3-项集、频繁4-项集和频繁5-项集:为找出频繁3-项集,首先生成候选3-项集C3,见表5,遍历矩阵D,找到C3中的项集和每个候选3-项集的支持频度,C3中,支持频度大于最小支持度0.001的候选3-项集组成频繁3-项集L3。L3中所有项集的支持度都大于0.001,所以频繁3-项集L3为候选3-项集C3。循环该方法,得到如表6的频繁4-项集L4。表5候选3-项集I1I2I3I4I5I6I7I8I9支持度1101000000.0026881721100100000.0053763441100010000.0053763441100001000.0053763441010000100.0026881721001100000.0053763440101100000.002688172表6候选4-项集I1I2I3I4I5I6I7I8I9支持度1101100000.002688172步骤2.2、找出关联规则:通过这一步骤,找到满足最小支持度和最小置信度的关联规则,见表7,在该表格中,-1代表条件,1代表结论。然后根据实际需求进行筛选:(1)删除第一列到第九列只有1或者只有-1的行,因为其不构成关联规则;(2)删除只有-1的和只有1的行,-1只有蕴含式的前件,没有后件;1只有蕴含式的后件,没有前件;(3)删除后件中有I1(速度)的蕴含式,因为速度不由I2-I9的任何一个属性决定。筛选得到如表8的强关联规则。表7关联规则表表8强关联规则表表8的强关联规则可用如下的蕴含式来表示:1.EC车转向架1一轴右侧温度=>EC车转向架2三轴左侧温度;2.速度∧EC车转向架1一轴右侧温度=>EC车转向架2三轴左侧温度;3.环境温度∧EC车转向架1一轴右侧温度=>EC车转向架2三轴左侧温度;4.速度∧环境温度∧EC车转向架1一轴右侧温度=>EC车转向架2三轴左侧温度;实验证明,高速列车运行过程速度的上升段中,支持度和置信度都比较适中。EC车转向架1一轴左侧温度、EC车转向架2四轴左侧温度、EC车转向架2三轴右侧温度、EC车转向架2四轴右侧温度、本单元空簧载重这几个量之间可以认为没有关联。速度、环境温度、EC车转向架1一轴右侧温度、EC车转向架2三轴左侧温度之间的关联关系为速度∧环境温度∧EC车转向架1一轴右侧温度=>EC车转向架2三轴左侧温度,即EC车转向架2三轴左侧温度与速度、环境温度和EC车转向架1一轴右侧温度相关。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1