一种故障检测的启动方法及装置与流程

文档序号:12131636阅读:199来源:国知局
一种故障检测的启动方法及装置与流程

本发明实施例涉及交通领域中设备运维管理服务领域,尤其涉及一种故障检测的启动方法及装置。



背景技术:

传统故障诊断技术是通过收集故障原始信息,通过各种分析、处理手段结合工作人员的丰富经验,对故障信息进行综合分析及识别。该方法依托操作人员的干预完成,诊断结果受人为因素影响大,且针对交通运维系统的诊断工作量巨大,不适合信息化发展的需求。

智能故障诊断方法采用智能算法自动对故障状态进行分析识别,是故障诊断领域的重要发展方向。目前对网络服务故障建模及诊断方法研究较多,如人工智能应用中的专家系统、神经网络技术、模糊理论等,可以从不同途径解决故障诊断问题。但在大数据背景下的智能交通系统中,普遍存在运算过于复杂,可靠性差及结果不准确的问题。目前成熟的故障诊断技术方法,无法适应智能交通运维管理服务。



技术实现要素:

本发明实施例提供一种故障检测的启动方法及装置,用以实现交通领域中快速的启动终端设备故障检测的流程,准确的确定出终端设备的故障。

本发明实施例提供的一种故障检测的启动方法,包括:

服务器获取设定时间段内终端设备的上传数据的历史时间间隔;

所述服务器对所述历史时间间隔进行优化,并确定出优化后的历史时间间隔的第一平均值和第一方差;

所述服务器根据所述优化后的历史时间间隔的第一平均值和第一方差,确定出故障检测的时间间隔阈值;

所述服务器若确定终端设备当前上传数据的时间间隔大于所述故障检测的时间间隔阈值,则进行所述终端设备的故障检测。

可选地,所述确定出优化后的历史时间间隔的第一平均值和第一方差,包括:

所述服务器计算优化后的历史时间间隔的第一平均值,并基于所述优化后的历史时间间隔的第一平均值,确定所述优化后的历史时间间隔的第一方差。

可选地,所述服务器对所述历史时间间隔进行优化,包括:

所述服务器删除所述历史时间间隔中的极大值和极小值,并计算剩余历史时间间隔的第二平均值和第二方差;

所述服务器依据所述剩余历史时间间隔的第二平均值和第二方差,删除所述剩余历史时间间隔中的异常历史时间间隔,获得优化后的历史时间间隔。

可选地,所述服务器进行所述终端设备的故障检测,包括

所述服务器通过网络适配器向网络中所有网络设备发送巡检指令,若所有网络设备通信正常,则确定所述网络中网络设备未发生故障,所述服务器向所述网络中数据层的所有数据通信服务适配器发送测试指令,若数据通信服务适配器未返回数据,则确定所述数据链路发生故障,若所述数据通信服务适配器返回数据,则确定所述终端设备发生故障;

若所述网络中的网络设备通信异常,所述服务器则确定所述网络中发生故障的网络设备。

可选地,所述服务器确定所述网络中发生故障的网络设备,包括:

所述服务器针对网路中的任一条网络链路,以所述网络链路的底层的终端设备为起始点,向所述网络链路中的每个网络设备发送巡检指令,直到接收到反馈指令为止;

所述服务器将所述反馈指令对应的网络设备的下一级的网络设备确定为待确认故障的网络设备;

所述服务器若未收到与所述反馈指令对应的网络设备的下一级的网络设备相连接的所有网络设备的反馈指令,则将所述待确认故障的网络设备确定为发生故障的网络设备。

相应地,本发明实施例还提供了一种故障检测的启动装置,包括:

获取单元,用于获取设定时间段内终端设备的上传数据的历史时间间隔;

处理单元,用于对所述历史时间间隔进行优化,并确定出优化后的历史时间间隔的第一平均值和第一方差;并根据所述优化后的历史时间间隔的第一平均值和第一方差,确定出故障检测的时间间隔阈值;

启动单元,用于在确定终端设备当前上传数据的时间间隔大于所述故障检测的时间间隔阈值时,进行所述终端设备的故障检测。

可选地,所述处理单元还用于:

所述服务器计算优化后的历史时间间隔的第一平均值,并基于所述优化后的历史时间间隔的第一平均值,确定所述优化后的历史时间间隔的第一方差。

可选地,所述处理单元具体用于:

删除所述历史时间间隔中的极大值和极小值,并计算剩余历史时间间隔的第二平均值和第二方差;

依据所述剩余历史时间间隔的第二平均值和第二方差,删除所述剩余历史时间间隔中的异常历史时间间隔,获得优化后的历史时间间隔。

可选地,所述启动单元具体用于:

通过网络适配器向网络中所有网络设备发送巡检指令,若所有网络设备通信正常,则确定所述网络中网络设备未发生故障,向所述网络中数据层的所有数据通信服务适配器发送测试指令,若数据通信服务适配器未返回数据,则确定所述数据链路发生故障,若所述数据通信服务适配器返回数据,则确定所述终端设备发生故障;

若所述网络中的网络设备通信异常,则确定所述网络中发生故障的网络设备。

可选地,所述启动单元具体用于:

针对网路中的任一条网络链路,以所述网络链路的底层的终端设备为起始点,向所述网络链路中的每个网络设备发送巡检指令,直到接收到反馈指令为止;

将所述反馈指令对应的网络设备的下一级的网络设备确定为待确认故障的网络设备;

若未收到与所述反馈指令对应的网络设备的下一级的网络设备相连接的所有网络设备的反馈指令,则将所述待确认故障的网络设备确定为发生故障的网络设备。

本发明实施例表明,服务器获取设定时间段内终端设备的上传数据的历史时间间隔,对所述历史时间间隔进行优化,并确定出优化后的历史时间间隔的第一平均值和第一方差,根据所述优化后的历史时间间隔的第一平均值和第一方差,确定出故障检测的时间间隔阈值,若确定终端设备当前上传数据的时间间隔大于所述故障检测的时间间隔阈值,则进行所述终端设备的故障检测。通过通过终端设备的上传数据的历史时间间隔,自动运算产生故障检测的时间间隔阈值,并在确定终端设备当前上传数据的时间间隔超过该时间间隔阈值之后自动启动故障检测的流程,可以实现快速的启动故障检测,提高故障检测的效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种故障检测的启动方法的流程示意图;

图2为本发明实施例提供的网络中的网络链接的示意图;

图3为本发明实施例提供的一种故障检测的方法的流程示意图;

图4为本发明实施例提供的一种故障检测的启动装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

在本发明实施例中,服务器为运维服务器,即交通领域运维管理的服务器。

图1示例性的示出了一种故障检测的启动方法的流程,该流程可以由故障检测的启动装置执行,该装置可以位于运维服务器内,可以是该运维服务器。

如图1所示,该流程的具体步骤包括:

步骤101,服务器获取设定时间段内终端设备的上传数据的历史时间间隔。

步骤102,所述服务器对所述历史时间间隔进行优化,并确定出优化后的历史时间间隔的第一平均值和第一方差。

步骤103,所述服务器根据所述优化后的历史时间间隔的第一平均值和第一方差,确定出故障检测的时间间隔阈值;

步骤104,所述服务器若确定终端设备当前上传数据的时间间隔大于所述故障检测的时间间隔阈值,则进行所述终端设备的故障检测。

在步骤101中,由于终端设备需要经常向服务器上传数据,服务器可以获取终端设备上传数据的时间间隔来判断该终端设备是否故障,故服务器可以获取该终端设备上传数据的时间间隔。

在得到终端设备上传数据的时间间隔之后,服务器就需要确定该终端设备上传数据的时间间隔是否大于时间间隔阈值。

服务器可以自动维护终端设备阈值表格及终端设备信息表格,终端设备与服务器始终维持链接状态,采用基于终端设备数据采集频率特征自适应运算产生方法,自动设置时间间隔阈值。具体的,服务器获取设定时间段内终端设备的上传数据的历史时间间隔。该设定时间段可以依据经验进行设置。服务器根据终端设备统计周期内的历史数据,提取历史数据上传的时间间隔,假设采集到N+1个数据,计算数据间的时间间隔,生成数据序列,记为{Ti|i=1,2,3,...N},N为正整数。

在步骤102中,通过步骤101获取历史时间间隔之后,服务器对该历史时间间隔进行优化,并计算优化后的历史时间间隔的第一平均值。具体的,服务器删除历史时间间隔中的极大值和极小值,并计算剩余历史时间间隔的第二平均值和第二方差,依据剩余历史时间间隔的第二平均值和第二方差,删除剩余历史时间间隔中的异常历史时间间隔,完成对历史时间间隔的优化。设上述历史时间间隔的数据序列中极大极小值分别为Tmin、Tmax,删除极大值和极小值后计算平均值,记为TM。计算方式如下公式(1):

其中,TM为剩余历史时间间隔的第二平均值,Ti为第i个历史时间间隔,Tmin为历史时间间隔中的极小值,Tmax为历史时间间隔中的极大值。

去除Tmin,Tmax后,重新组织历史时间间隔的数据序列为{Ti|i=1,2,3,...(N-2)}。计算N-2个历史时间间隔的数据序列的方差,记为Tσ。计算公式如下:

其中,Tσ为剩余历史时间间隔的第二方差,TM为剩余历史时间间隔的第二平均值,Ti为第i个历史时间间隔。

计算出Tσ之后,根据该Tσ和TM确定数据偏差,剔除异常数据。其中k为系数,在程序中动态设定,以确定剔除数据的比例。可以通过公式(3)确定出异常历史时间间隔。

|Ti-TM|≥k·Tσ…………………………(3)

其中,Tσ为剩余历史时间间隔的第二方差,TM为剩余历史时间间隔的第二平均值,Ti为第i个历史时间间隔,k为系数,该系数k由系统动态设定。

服务器基于优化后的历史时间间隔的第一平均值,确定优化后的历史时间间隔的第一方差。最后服务器根据优化后的历史时间间隔的第一平均值和第一方差,确定故障检测的时间间隔阈值。

具体的,假设删除的历史时间间隔的个数为m个,重新组织历史时间间隔的数据序列为{Ti|i=1,2,3,...N-m-2},依据公式(4)和公式(5)分别重新计算优化后的历史时间间隔的第一平均值及第一方差。

其中,TM'为优化后的历史时间间隔的第一平均值,Ti为第i个历史时间间隔。

其中,Tσ'为优化后的历史时间间隔的第一方差,TM'为优化后的历史时间间隔的第一平均值,Ti为第i个历史时间间隔。

根据该Tσ'以及TM'可以得到故障检测的时间间隔阈值,具体的可以根据公式(6)得到该故障检测的时间间隔阈值。

该公式(6)为:

TG=Tm'+k'×Tσ'…………………………(6)

其中,TG为故障检测的时间间隔阈值,Tσ'为优化后的历史时间间隔的第一方差,TM'为优化后的历史时间间隔的第一平均值,k'为系数,可以根据数据方差值动态设定。

假设当前未上传数据的终端设备的时间间隔Td,当Td满足公式(7)时,也就是确定终端设备当前上传数据的时间间隔大于故障检测的时间间隔阈值时,进行终端设备的故障检测。

Td≥TM'+k'·Tσ'…………………………(7)

其中,Td为终端设备当前上传数据的时间间隔,Tσ'为优化后的历史时间间隔的第一方差,TM'为优化后的历史时间间隔的第一平均值,k'为系数。

在步骤104中,在服务器服务器进行终端设备的故障检测之前,服务器还需要确定该终端设备是否已主动上传自身的详细故障信息代码,若是,则可以确定该终端设备自身故障,无需再进行终端设备的故障检测。

若没有收到终端设备主动上传的自身的详细故障信息代码,则服务器需要进行终端设备的故障检测,具体的:

服务器检测网络设备是否发生故障,主要是通过网络适配器向网络中所有网络设备发送巡检指令,若所有网络设备通信正常,则确定网络中网络设备未发生故障,否则,确定网络中发生故障的网络设备。也就是说,服务器利用网络适配器,定时所有网络设备广播发送巡检指令,对网络中的所有网络设备进行检测。若所有网络设备通信正常,则确定网络中网络设备未发生故障,否则,确定网络中发生故障的网络设备。

具体的,服务器针对网路中的任一条网络链路,以网络链路的底层的终端设备为起始点,向网络链路中的每个网络设备发送巡检指令,直到接收到反馈指令为止。服务器将反馈指令对应的网络设备的下一级的网络设备确定为待确认故障的网络设备。之后服务器若未收到与反馈指令对应的网络设备的下一级的网络设备相连接的所有网络设备的反馈指令,则将待确认故障的网络设备确定为发生故障的网络设备。从底层网络的终端设备逐层追溯网络状态,以轮询的方式发送诊断指令,对返回结果进行识别判断,一直追溯到无故障的网络设备。

举例来说,如图2所示,假设网络共5层结构,假设网络设备C0故障,该网络设备下所有网络设备都处于异常通信状态,检测方法如下:

第一条链路:巡检顺序为E0,D0,C0,B0。到正常的网络设备B0后结束。

第二条链路:巡检顺序为E1,D0,C0,B0。到正常的网络设备B0后结束。

第三条链路:巡检顺序为E2,D1,C0,B0。到正常的网络设备B0后结束。

则其他链路检测方法同上。

网络设备C0下的所有通信异常网络设备反向追溯到网络设备B0,将网络设备C0确定为待确认故障的网络链路。每条链路检测结果可定位到网络设备C0发生故障,满足所有网络设备的故障判断状态一致后,即多异常网络设备的互相验证后,可以待确认故障的网络设备确定为发生故障的网络设备。若故障网络设备下的网络设备数量大于100个,为提高遍历速度,则只判断100个网络设备的互锁验证状态,屏蔽其它网络设备的故障信息。

通过上述方法反向逐层多路诊断,并发多线程多维度进行反推演,以网络设备故障定位相互验证,并屏蔽已获验证的网络设备下层网络设备故障信。

若网络设备故障修复完成,或无网络设备发生故障,还是无法接收到终端设备上传数据,则故障来源可能为数据链路故障或终端设备故障。

服务器继续确定数据链路是否发生故障,具体的,服务器向网络中数据层的所有数据通信服务适配器发送测试指令,若数据通信服务适配器未返回数据,则确定数据链路发生故障。服务器在判断无网络链路故障后,启动数据链路的通信测试线程,进行数据链路的故障排除。由服务器下发测试指令,在数据层面各服务适配器程序依序返回回传数据。如果异常,修改数据链路表的异常标识,标识此数据链路的数据通信服务适配器故障,进行报障。通过该诊断方法,可精确定位故障到数据通信服务适配器,确定出数据链路发生故障。

若上述数据链路修复完成,或无数据链路层发生故障,而还是无法接收到终端设备上传数据,则表明该终端设备自身发生故障,可以确定该终端设备发生故障,通知工作人员对该终端设备进行检修。

为了更好的解释本发明实施例,下面将通过具体的实施场景来描述故障检测的流程。

在本发明实施例中,服务器为运维服务器,即交通领域运维管理的服务器。

如图3所示,该流程具体步骤包括:

步骤301,运维服务器获取终端设备上传数据的时间间隔。

步骤302,运维服务器判断获取的终端设备上传数据的时间间隔是否超过时间间隔阈值,若是,则转入步骤303,若否,则转入步骤301。

步骤303,运维服务器判断终端设备是否已主动上报故障代码,若是,则转入步骤308,若否,则转入步骤304。

步骤304,运维服务器启动网络设备诊断线程。

步骤305,运维服务器判断网络设备是否故障,若是,则转入步骤309,若否,则转入步骤306。

步骤306,运维服务器启动数据链路诊断线程。

步骤307,运维服务器判断数据链路是否故障,若是,则转入步骤310,若否,则转入步骤308。

步骤308,运维服务器确定该终端设备发生故障。

步骤309,网络设备故障处理。

步骤310,数据链路故障处理。

步骤311,终端设备故障处理。

上述步骤的具体实施方式已在上述实施例中描述,不再赘述。

上述实施例表明,服务器获取设定时间段内终端设备的上传数据的历史时间间隔,对所述历史时间间隔进行优化,并确定出优化后的历史时间间隔的第一平均值和第一方差,根据所述优化后的历史时间间隔的第一平均值和第一方差,确定出故障检测的时间间隔阈值,若确定终端设备当前上传数据的时间间隔大于所述故障检测的时间间隔阈值,则进行所述终端设备的故障检测。通过通过终端设备的上传数据的历史时间间隔,自动运算产生故障检测的时间间隔阈值,并在确定终端设备当前上传数据的时间间隔超过该时间间隔阈值之后自动启动故障检测的流程,可以实现快速的启动故障检测,提高故障检测的效率

本发明实施例是基于设备历史数据的上传频率自动产生时间间隔数据序列,剔除异常数据后,通过统计平均法,获取设备的数据上传时间间隔标准值,在加权方差的基础上,自适应运算产生时间间隔阈值,超过阈值后,自动启动故障诊断流程。通过开辟网络链路监测线程及数据链路监测线程,对智能交通系统全故障状态进行精准定位。所能判别的故障信息包括:终端设备故障(硬件)、网络设备故障(硬件)、通信服务适配器(软件)故障。其中终端设备可定位到某台设备;网络设备可定位到网络结构中的某台设备;通信服务程序可定位到软件构架中的某个程序接口。依据网络链路结构及终端数,设置多维度网络故障探测线程。依据探测返回信息,进行故障反推演定位。从网络底层开始逐层探测,定位到终端设备故障信息源,若有多个报障信息,结合已报故障设备地址信息,进行故障信息互锁验证。通过该方法可实现智能交通终端设备的精确定位。

基于相同的技术构思,图4示例性的示出了本发明实施例提供的一种故障检测的启动装置,该装置可以执行故障检测的启动的流程,该装置可以位于运维服务器内,也可以是该运维服务器。

如图4所述,该装置具体包括:

获取单元401,用于获取设定时间段内终端设备的上传数据的历史时间间隔;

处理单元402,用于对所述历史时间间隔进行优化,并确定出优化后的历史时间间隔的第一平均值和第一方差;并根据所述优化后的历史时间间隔的第一平均值和第一方差,确定出故障检测的时间间隔阈值;

启动单元403,用于在确定终端设备当前上传数据的时间间隔大于所述故障检测的时间间隔阈值时,进行所述终端设备的故障检测。

可选地,所述处理单元402还用于:

所述服务器计算优化后的历史时间间隔的第一平均值,并基于所述优化后的历史时间间隔的第一平均值,确定所述优化后的历史时间间隔的第一方差。

可选地,所述处理单元402具体用于:

删除所述历史时间间隔中的极大值和极小值,并计算剩余历史时间间隔的第二平均值和第二方差;

依据所述剩余历史时间间隔的第二平均值和第二方差,删除所述剩余历史时间间隔中的异常历史时间间隔,获得优化后的历史时间间隔。

可选地,所述启动单元403具体用于:

通过网络适配器向网络中所有网络设备发送巡检指令,若所有网络设备通信正常,则确定所述网络中网络设备未发生故障,向所述网络中数据层的所有数据通信服务适配器发送测试指令,若数据通信服务适配器未返回数据,则确定所述数据链路发生故障,若所述数据通信服务适配器返回数据,则确定所述终端设备发生故障;

若所述网络中的网络设备通信异常,则确定所述网络中发生故障的网络设备。

可选地,所述启动单元403具体用于:

针对网路中的任一条网络链路,以所述网络链路的底层的终端设备为起始点,向所述网络链路中的每个网络设备发送巡检指令,直到接收到反馈指令为止;

将所述反馈指令对应的网络设备的下一级的网络设备确定为待确认故障的网络设备;

若未收到与所述反馈指令对应的网络设备的下一级的网络设备相连接的所有网络设备的反馈指令,则将所述待确认故障的网络设备确定为发生故障的网络设备。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1