基于混合深度学习的高铁道岔智能故障检测方法与流程

文档序号:17698087发布日期:2019-05-17 21:51阅读:219来源:国知局
基于混合深度学习的高铁道岔智能故障检测方法与流程

本发明属于道岔故障检测领域,特别涉及一种基于混合深度学习的高铁道岔智能故障检测方法。



背景技术:

近年来,中国高速铁路快速发展,目前已经拥有世界上最大规模以及最高运营速度的铁路网,给人们的出行带来了极大便利的同时,其安全性也受到了广泛的关注。道岔用于实现高速列车的转线或者跨线运行,是保证铁路安全运行的关键地面信号设备;其运行现状表现出数量庞大、运行频繁、所处环境恶劣等特点,容易引发道岔故障,造成列车运行安全隐患。目前道岔故障检测依靠人工判别,为了避免故障,普遍采取了过度防护和维护措施,造成人力物力的浪费。因此强烈需要一种能够代替人工的智能化道岔故障检测方法。

国内外研究人员针对道岔故障检测这一问题做了大量的研究。目前,针对转辙机的故障检测方法主要集中在解析模型和人工智能两种方法。基于模型的检测方法是通过构造出的解析模型估计输出结果,从而进行故障检测。基于人工智能的方法主要采用数据驱动的策略,数据驱动的故障检测方法就是对过程运行数据进行分析处理,从而在不需知道精确解析模型的情况下完成故障检测。基于人工智能的方法主要可分为基于神经网络的方法和基于支持向量机的方法。基于神经网络的方法包括基于常规神经网络及其改进算法、基于pnn(product-basedneuralnetwork)神经网络及基于贝叶斯神经网络的道岔故障检测方法;基于支持向量机的方法主要包括基于最小二乘支持向量机的道岔控制电路故障诊断方法和基于单分类(oneclass)支持向量机的道岔故障检测方法。

对于基于模型的道岔故障检测方法,其性能完全由所构造的模型决定,该类方法过于依赖于被诊断对象数学模型的精确性。然而实际中难以建立精准的数学解析模型。对于基于神经网络的故障检测方法,在大量的故障样本情况下,能获得较好的故障模式识别效果。但在实际中,由于人工标注样本困难,使得道岔故障检测过程中难以获得大量具有标签的样本;道岔正常样本远多于故障样本,神经网络在训练时容易出现过拟合的问题。支持向量机的故障检测方法采用的特征提取多从几何参数的角度入手,特征提取依赖人工经验,且训练过程需要大量有标签数据,不符合现有大量道岔动作电流曲线数据无精确故障标签的实际情况。



技术实现要素:

为了解决现有技术中存在的问题,本发明提供了一种基于混合深度学习的高铁道岔智能故障检测方法。

本发明具体技术方案如下:

本发明提供一种基于混合深度学习的高铁道岔智能故障检测方法,该方法包括如下步骤:

s1:利用深度降噪自编码器自动提取每个道岔动作电流曲线数据的特征,获得无标签特征数据;

s2:利用密度聚类算法对步骤s1获得的无标签特征数据进行聚类,得到若干聚类簇,选取非异常聚类簇对应的原始数据作为正常数据;

s3:利用正常数据对单分类支持向量机进行训练,构建故障检测模型;将待检测数据输入到故障检测模型中,根据输出结果判断待检测数据是否为故障数据。

进一步的改进,所述降噪自编码器通过如下方法构建:构建自编码器基本结构,包括输入层、隐层及输出层,隐层及输出层值可以通过如下方程求出:

h=σ(wx+b)ⅰ

y=σ(w′h+b′)ⅱ

其中w和w′为权值,b和b′为偏置;σ(·)表示非线性变换,x、y和h分别代表了输入值、输出值及隐层值,训练自编码器的过程就是最小化损失函数j:

其中j1为输入与输出之间的误差,k为训练样本数;j2为防止过拟合的权值衰减项,λ为其系数;j3是稀疏惩罚项,ρ为指定参数,β为j3的系数,为第i隐层单元平均激活数,其计算公式如下:

进一步的改进,步骤s1具体方法为:

s11:数据预处理及数据集划分:将获取的道岔动作电流曲线原始数据按照时间顺序进行排序,并进行归一化处理,将经过归一化处理的道岔动作电流曲线数据分成训练集和测试集;

s12:自动特征提取:利用降噪自编码器提取训练集的特征,获得无标签特征数据。

进一步的改进,深度降噪自编码器自动提取无标签特征数据的特征维数为d,d为最内层隐层神经元的个数。

进一步的改进,所述单分类支持向量机的模型如下所示:

优化目标为求一个中心为a,半径为r的最小球面;其中数据点位于超球面内部或表面时松弛变量ξi=0,c是一个常数,用于平衡超球面半径及异常点数目。

进一步的改进,步骤s2具体方法为:

s21:聚类:利用密度聚类算法对步骤s1获得的无标签特征数据进行聚类,并选取相应簇对应的原始数据,得到若干原始数据聚类簇;

s22:结合专家知识从若干个聚类簇内挑选出非异常聚类簇和异常聚类簇,将非异常聚类簇对应的原始数据作为正常数据,为异常聚类簇内故障数据添加故障标签,将添加有故障标签的故障数据作为验证集。

进一步的改进,步骤s2聚类的无标签特征数据的特征维数为d+1,增加的1维为道岔动作电流曲线采样点个数。

进一步的改进,步骤s2中所述密度聚类算法为dbscan算法。

进一步的改进,所述降噪自编码器包括6个隐层,每一隐层的神经元个数分别为200、128、64、32、16和d,其中d为降噪自编码器编码的特征维数。

进一步的改进,步骤s3具体方法为:

s31:利用正常数据对单分类支持向量机进行训练,获得训练后的故障检测模型;

s32:利用验证集对故障检测模型的超参数进行选取,构建故障检测模型,将待检测数据输入到故障检测模型中,根据输出结果判断待检测数据是否为故障数据;

s33:利用测试集对故障检测模型的检测性能进行评估。

本发明的有益效果:

本发明提供一种基于混合深度学习的高铁道岔智能故障检测方法,该方法结合道岔运维实际情况,将结合深度学习自动特征提取及传统机器学习异常点检测的混合深度学习方法运用到道岔故障检测方法研究中,利用深度学习进行自动特征提取,形成了维度更小且更加抽象的特征数据,解决了特征提取过程依赖人工经验及聚类算法在高维数据下的计算困难问题;然后使用聚类算法结合专家知识选取正常数据簇,解决无法获得大量有标签数据问题;最后使用标注为正常的数据训练单分类支持向量机,进行异常点检测解决道岔故障检测过程中样本不均衡问题,本发明所提供的方法可以解决无精确故障标签数据下的故障检测问题,很大程度上提高了道岔运维的效率,节约了人力资源,具有很高的实用价值。

附图说明

图1为实施例1一种基于混合深度学习的高铁道岔智能故障检测方法的流程图;

图2为降噪自编码器的结构图;

图3为步骤s1的具体步骤;

图4为自编码器结构图;

图5为步骤s2的具体步骤;

图6为步骤s3的具体步骤;

图7为实施例2一种基于混合深度学习的高铁道岔智能故障检测方法的流程图;

图8为道岔动作电流曲线图;

图9为最小化损失函数变化趋势图,其中各变化趋势线上的数字代表所设定的特征维数;

图10为优化结束时编码实时解码重构道岔曲线图;

图11为聚类各簇道岔动作电流曲线图,c-1至c-14分别表示簇1至簇14;

图12为聚类各簇曲线数目图。

附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所描述的步骤。

具体实施方式

由于本发明的方法描述是在计算机系统中实现的,该计算机系统可以设置在服务器或客户端的处理器中。例如本文所述的方法可以实现为能以控制逻辑来执行的软件,其由服务器中的cpu来执行。本文所述的功能可以实现为存储在非暂时性有形计算机可读介质中的程序指令集合。当以这种方式实现时,该计算机程序包括一组指令,当该组指令由计算机运行时其促使计算机执行能实施上述功能的方法。可编程逻辑可以暂时或永久地安装在非暂时性有形计算机可读介质中,例如只读存储器芯片、计算机存储器、磁盘或其他存储介质。除了以软件来实现之外,本文所述的逻辑可以利用分立部件、集成电路、与可编程逻辑设备(诸如,现场可编程门阵列(fpga)或微处理器)结合使用的可编程逻辑,或者包括它们任意组合的任何其他设备来体现。所有此类实施均落入本发明的范围之内。

实施例1

本发明实施例1提供一种基于混合深度学习的高铁道岔智能故障检测方法,如图1所示,该方法包括如下步骤:

s1:利用深度降噪自编码器自动提取每个道岔动作电流曲线数据的特征,获得无标签特征数据;

步骤s1中,道岔的正常动作过程一般分为:解锁-转换-锁闭三个时段,根据每个时段动作的不同形成了相应的道岔动作电流曲线。

步骤s1中,深度降噪自编码器,结构如图2所示,是在自编码器的基础上,为了使自编码器学得高维数据更加鲁棒的低维表示,在原始输入向量基础上引入噪声,然后使用自编码器将带噪声的高维输入映射为低维的编码,通过自解码器将编码解码为重构数据。降噪自编码的训练就是要最小化对原始输入向量的重构误差。其中自编码器是一个多层感知机,输入端接受高维数据,输出端输出低维编码;解码器为与编码器对称的多层感知机;降噪自编码器具有高度非线性表示能力和良好的自动特征提取效果,对道岔动作电流曲线数据进行自动特征提取。所提取的特征不仅具有很强的降噪效果,而且可以解决高维数据给后续聚类带来的计算困难问题。

s2:利用密度聚类算法对步骤s1获得的无标签特征数据进行聚类,得到若干聚类簇,选取非异常聚类簇对应的原始数据作为正常数据;

步骤s2中,使用密度聚类算法,优选dbscan算法,对无标签特征数据进行聚类。dbscan算法的聚类结构可以通过道岔动作电流曲线样本分布的紧密程度确定。通过改变算法参数,可以使得聚类得到簇的数量以及簇内曲线形状有很大不同,算法参数的选择需要结合现有专家知识,观察各簇内道岔动作电流曲线形态确定。使用dbscan算法不需要事先知道要形成的簇类数量,并可在特征空间中发现任意形状的聚类。

对各簇的判断需要结合专家知识,可以通过人机交互界面向专家展示聚类结果,专家对各聚类簇是否包含故障数据进行判别,不包括故障数据的聚类簇为非异常聚类簇;

s3:利用正常数据对单分类支持向量机进行训练,构建故障检测模型;将待检测数据输入到故障检测模型中,根据输出结果判断待检测数据是否为故障数据。

步骤s3中,单分类支持向量机中只有一个类,训练出一个最小的超球面(超球面是指3维以上的空间中的球面,对应的2维空间中就是封闭曲线,3维空间中就是球面,3维以上的称为超球面),把这些数据全都包起来,识别一个新的数据点时,如果这个数据点落在超球面内,就是这个类,否则不是;对于待检测数据,将其投射到分类平面中,看待检测数据是否处于分类边界内,进而得出待检测数据是否故障的结论。

参考图3,本实施例s1步骤具体步骤为:

s11:数据预处理及数据集划分:将获取的道岔动作电流曲线原始数据按照时间顺序进行排序,并进行归一化处理,将经过归一化处理的道岔动作电流曲线数据分成训练集和测试集;

s12:自动特征提取:利用降噪自编码器提取训练集的特征,获得无标签特征数据,深度降噪自编码器自动提取无标签特征数据的特征维数为d,d为最内层隐层神经元的个数。

其中降噪自编码器是通过如下方法构建的:

构建自编码器基本结构,如图4所示,包括n个输入层、m个隐层及n个输出层,隐层及输出层值可以通过如下方程求出:

h=σ(wx+b)ⅰ

y=σ(w′h+b′)ⅱ

其中w和w′为权值,b和b′为偏置;σ(·)表示非线性变换,x、y和h分别代表了输入值、输出值及隐层值。训练自编码器的过程就是最小化损失函数j:

其中j1为输入与输出之间的误差,k为训练样本数;j2为防止过拟合的权值衰减项,λ为其系数;j3是稀疏惩罚项,ρ为指定参数,β为j3的系数,为第i隐层单元平均激活数,其计算公式如下:

参考图5,本实施例s2步骤具体步骤为:

s21:聚类:利用密度聚类算法对步骤s1获得的无标签特征数据进行聚类,并选取相应簇对应的原始数据,得到若干原始数据聚类簇;

s22:结合专家知识从若干个聚类簇内挑选出非异常聚类簇和异常聚类簇,将非异常聚类簇对应的原始数据作为正常数据,为异常聚类簇内故障数据添加故障标签,将添加有故障标签的故障数据作为验证集。

利用密度聚类算法对步骤s1获得的无标签特征数据进行聚类,例如获得15个聚类簇,通过人机交互界面可视化聚类结果,专家根据经验,判断每一聚类簇是否包含故障数据。由于对聚类所得数据,结合专家知识对各簇进行是否包含故障数据的判别,因不需要对每条数据进行判别,大大减小故障数据判别的工作量。

步骤s2中为弥补道岔动作电流曲线长度截取及补零带来的道岔动作电流曲线长度信息的缺失,将道岔动作电流曲线采样点个数作为1维特征与降噪自编码器提取的d维特征组合,构成表示动作电流曲线信息的d+1维特征,采用密度聚类算法对获得的d+1维特征数据进行聚类。

参考图6,本实施例s3步骤具体步骤为:

s31:利用正常数据对单分类支持向量机进行训练,获得训练后的故障检测模型;

s32:利用验证集对故障检测模型的超参数进行选取,构建故障检测模型,将待检测数据输入到故障检测模型中,根据输出结果判断待检测数据是否为故障数据;

s33:利用测试集对故障检测模型的检测性能进行评估。

其中,单分类支持向量机的模型如下所示:

优化目标为求一个中心为a,半径为r的最小球面;其中数据点位于超球面内部或表面时松弛变量ξi=0,c是一个常数,用于平衡超球面半径及异常点数目。

步骤s3中,通过改变模型参数,可以使得单分类支持向量机分离超平面的形状有很大不同,导致故障检测结果差异较大,使用验证集进行验证,可以提高单分类支持向量机检测的准确性。

实施例2

为评估所提出故障检测模型的有效性,实验选取s700k转辙机现场道岔动作电流曲线数据进行故障检测模型的训练及测试过程的验证,共选取1200条无标签数据。

参考图7,具体过程如下:

a.数据预处理及数据集划分:取同一转辙机下的所有道岔动作电流曲线原始数据,道岔动作电流曲线如图8所示,将所选取道岔动作电流曲线原始数据以时间顺序进行排序,并进行归一化处理,然后采取分层采样的方法选取数据集,3/4作为训练集,另外1/4作为测试集,对测试集的数据结合专家知识进行标注。

b.自动特征提取:构建用于自动特征提取的降噪自编码器,其中编码部分由6个隐层构成,解码部分与编码部分结构对称;每一隐层所含神经元个数为200-128-64-32-16-d,通过敏感度分析确定降噪自编码器编码的特征维数及训练轮数。训练的敏感度分析结果见表1和图9。

表1编码特征维数及训练轮数的敏感度分析结果

从实验中可知,在编码特征维数为8维,训练轮数达到30000步时损失最小;因此选择编码特征维数d=8、训练轮数为30000时的模型作为本实验自动特征提取模型。确定进行聚类的无标签特征数据的特征维数为9。

c.聚类及数据选取:采用dbscan算法依据特征将9维无标签特征数据进行聚类。设置邻域半径为0.62,邻域密度阈值为2时,聚类为14个簇,各簇曲线如图10所示,(x轴为采样点序号,采样间隔0.04s;y轴为归一化电流值)。

通过人机交互界面,展示聚类结果,聚类各簇道岔动作电流曲线如图11所示,聚类各簇曲线数目如图12所示,结合专家知识观察聚类结果可知:簇1中聚集了所有的故障曲线及部分正常曲线。因而考虑选取除簇1外所有的道岔动作电流曲线数据作为正常数据,共880条道岔动作电流曲线。

对簇1中20条数据结合专家知识进行故障标注,进行数据增强后作为进行故障检测模型参数敏感度分析的验证集。

d.故障检测模型构建:将880条用于训练故障检测模型的正常数据输入单分类支持向量机进行训练,获得故障检测模型,用验证集对故障检测模型进行超参数优化,在保证漏报率为0的情况下对模型参数异常点比例进行关于误报率的敏感度分析,分析结果见表2,确定异常点比例参数为0.001,完成故障检测模型构建。

表2故障检测结果

由表2可以看出本发明提供的故障检测率的准确性高达98.67%。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1