故障诊断方法和装置的制造方法

文档序号:8324952阅读:216来源:国知局
故障诊断方法和装置的制造方法
【技术领域】
[0001]本发明涉及通信领域,尤其涉及一种故障诊断方法和装置。
【背景技术】
[0002]在无线网络中,链路和节点状态是网络可靠程度的重要参数。及时、准确的获得这些状态是网络维护的功能之一。传统的网络故障诊断需建立一个由被怀疑节点的邻居节点组成的故障诊断树,通过收集被怀疑节点到所有邻居节点的链路状态(证据),并融合这些状态来做出对被怀疑节点状态的判定。这一方法称为基于主动问询的故障诊断。这种方法的缺点是:针对每一个怀疑的故障,诊断过程一旦被触发,都需要建立一个完整的诊断树,并通过诊断树收集所有相关节点的证据。而某些情况下,仅收集部分节点的证据,就已经可以得到正确的诊断结果。如当链路故障时,仅收集到一个说明被怀疑节点的状态是正常的,就可以做出链路故障而非节点故障的诊断。因此,这种方法在通信开销和诊断可靠性方面还有进一步改进的空间。
[0003]应该注意,上面对技术背景的介绍只是为了方便对本发明的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本发明的【背景技术】部分进行了阐述而认为上述技术方案为本领域技术人员所公知。

【发明内容】

[0004]本发明实施例提供了一种故障诊断方法和装置,通过被动侦听的方式获取被怀疑节点的状态,以实现故障诊断。
[0005]根据本发明实施例的一个方面,提供了一种故障诊断方法,所述方法应用于Adhoc网络中的节点,其中,所述方法包括:
[0006]所述节点发送第一存活消息,启动针对被怀疑节点的定时器,将所述第一存活消息对应的存活节点和被怀疑节点的信息存储到存活消息表中,所述第一存活消息包含存活节点和被怀疑节点的信息,所述存活节点为所述节点;
[0007]如果在所述针对被怀疑节点的定时器的计时时间内,收到所述被怀疑节点广播的第二存活消息,所述第二存活消息包含以所述被怀疑节点作为存活节点,以所述节点作为被怀疑节点的信息,则确定所述节点与所述被怀疑节点之间的链路故障;否则,确定所述被怀疑节点故障或疑似节点故障。
[0008]根据本发明实施例的另一个方面,提供了一种Ad hoc网络中的节点,其中,所述节点包括:
[0009]发送单元,其发送第一存活消息,启动针对被怀疑节点的定时器,所述第一存活消息包含存活节点和被怀疑节点的信息,所述存活节点为所述节点;
[0010]存储单元,其在所述发送单元发送了所述第一存活消息后,将所述第一存活消息对应的存活节点和被怀疑节点的信息存储到存活消息表中;
[0011]第一确定单元,其在所述针对被怀疑节点的定时器的计时时间内,收到所述被怀疑节点广播的第二存活消息时,如果所述第二存活消息包含以所述被怀疑节点作为存活节点,以所述节点作为被怀疑节点的信息,则确定所述节点与所述被怀疑节点之间的链路故障;否则,确定所述被怀疑节点故障或疑似节点故障。
[0012]本发明实施例的有益效果在于,通过本发明实施例的方法和装置,节点无需发起针对被怀疑节点的状态的问询,也无需从怀疑故障节点的其它邻居节点处收集证据,即可实现故障诊断,从而改善了通信开销和诊断可靠性。
[0013]参照后文的说明和附图,详细公开了本发明的特定实施方式,指明了本发明的原理可以被采用的方式。应该理解,本发明的实施方式在范围上并不因而受到限制。在所附权利要求的精神和条款的范围内,本发明的实施方式包括许多改变、修改和等同。
[0014]针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
[0015]应该强调,术语“包括/包含”在本文使用时指特征、整件、步骤或组件的存在,但并不排除一个或更多个其它特征、整件、步骤或组件的存在或附加。
【附图说明】
[0016]所包括的附图用来提供对本发明实施例的进一步的理解,其构成了说明书的一部分,用于例示本发明的实施方式,并与文字描述一起来阐释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0017]在附图中:
[0018]图1是一个Ad hoc网络的树状拓扑结构示意图;
[0019]图2是本发明一个实施例的故障诊断方法的流程图;
[0020]图3是一节点根据本实施例的方法发起故障诊断的流程图;
[0021]图4是本发明另一个实施例的故障诊断方法流程图;
[0022]图5是图4的实施例中步骤402的一个实施方式的方法流程图;
[0023]图6是图4的实施例中步骤402的另一个实施方式的方法流程图;
[0024]图7是图4的实施例中步骤403的一个实施方式的方法流程图;
[0025]图8是本发明实施例的Ad hoc网络中的节点组成示意图;
[0026]图9是本发明实施例的Ad hoc网络中的节点构成示意图。
【具体实施方式】
[0027]以下结合附图对本发明的各种实施方式进行说明。这些实施方式只是示例性的,不是对本发明的限制。为了使本领域的技术人员能够容易地理解本发明的原理和实施方式,本发明实施例以Ad-hoc网络为例对该故障诊断方法和装置进行说明,但可以理解,本发明实施例并不限于Ad-hoc网络,对于涉及故障诊断的其他网络均适用。
[0028]图1是本发明实施例的一个应用场景的不意图,如图1所不,A、B、C、D是Ad-hoc网络中的四个节点,根据本发明实施例的方法,当节点A怀疑节点B故障,即启动针对节点B的“状态判定延时”定时器,并立即向外广播自身的存活消息(alive message)。在该定时器到时前,若节点A收到了来自节点B的存活消息,则说明节点B是正常工作的,由此判定与节点B之间链路故障,否则说明节点B可能出现了故障,由此判定节点B节点故障。另一方面,接收到节点A发送的存活消息的节点,例如节点C和节点D,若与节点B是邻居关系,则继续判定其间的链路状态是否正常,若正常,如节点C,其判定其与节点B之间的链路状态正常,则节点C向节点B通过单播直接转发节点A的存活消息,否则,如节点D,其判定其与节点B之间的链路状态不正常,则节点D通过广播再次转发这一消息。同样的,若节点B怀疑节点A故障,也广播存活消息,同时启动针对节点A的“状态判定延时”定时器。因此,当节点B在该定时器到时前,接收到表明节点A的存活消息,即可判定与节点A间链路故障(link failure),而非节点 A 节点故障(node failure)。
[0029]下面参照附图对本发明实施例的优选实施方式进行说明。
[0030]实施例1
[0031]本发明实施例提供了一种故障诊断方法,该方法应用于Ad hoc网络中的节点。图2是该方法的流程图,请参照图2,该方法包括:
[0032]步骤201,所述节点发送第一存活消息,启动针对被怀疑节点的定时器,将所述第一存活消息对应的存活节点和被怀疑节点的信息存储到存活消息表中,该第一存活消息包含存活节点和被怀疑节点的信息,该存活节点为该节点;
[0033]步骤202,如果在该针对被怀疑节点的定时器的计时时间内,收到该被怀疑节点广播的第二存活消息,该第二存活消息包含以该被怀疑节点作为存活节点,以该节点作为被怀疑节点的信息,则确定该节点与该被怀疑节点之间的链路故障;否则,确定该被怀疑节点故障或疑似节点故障。
[0034]在步骤201的一个实施方式中,当节点怀疑其邻居节点非可用时,可以广播一个包含存活节点(alive node)和被怀疑节点(suspected node)的存活消息(称为第一存活消息),用于通知被怀疑的邻居节点自身处于可用(available)状态,并启动一个针对该被怀疑的邻居节点的“状态判定延时”定时器,作为判定该被怀疑的邻居节点为非可用(unavailable)状态的最大延时。
[0035]在步骤201的另一个实施方式中,该节点也可以单播发送上述第一存活消息。在该实施方式中,当该节点怀疑其邻居节点非可用时,可以先获取到达该被怀疑的邻居节点的路由信息,再根据获取到的路由信息选择到达所述被怀疑的邻居节点的最佳路由,从而单播发送该第一存活消息。
[0036]可选的,该存活消息中还可以包含一个存活消息扩散度(简称为扩散度),以作为被怀疑节点不是本地的邻居节点时,本地是否广播该存活消息的依据,例如,如果该扩散度不为0,则收到该存活消息的节点帮忙转发该存活消息,否则,也即该扩散度为0,则收到该存活消息的节点对该存活消息不做任何处理。
[0037]在步骤201中,该节点在发送了该第一存活消息后,将该第一存活消息对应的存活节点和被怀疑节点的信息存储到存活消息表中,也即将包含自身作为alive node,被怀疑节点作为suspected node的一个条目存储到存活消息表中。作为存活消息表的一个例子,其可以由两列构成,一列代表存活消息中的存活节点(alive node),即存活消息的发送节点,另一列代表存活消息中的被怀疑节点(suspected node),即存活消息的目的节点。以上存活消息表的构成只是举例说明,本发明实施例并不以此作为限制。
[0038]在步骤202中,如果在该状态判定延时定时器到达前,该节点收到指示被怀疑的邻居节点为可用状态的存活消息(称为第二存活消息),则判定该节点与该被怀疑的邻居节点之间的链路故障。相反,如果在该状态判定延时定时器到达前,该节点没有收到指示被怀疑节点为可用状态的存活消息,则判定被怀疑的邻居节点故障。此时,该节点可以根据应用对故障诊断的具体需求,选择是否向GW (Gateffay,网关)或簇头等报告诊断结果。
[0039]在本实施例的一个实施方式中,当该节点怀疑其邻居节点非可用时,可以先检查存活消息表中是否包含alive node为被怀疑的邻居节点,suspected node为自身的条目,如果有,则说明该节点所怀疑的邻居节点已经怀疑过自己,由此直接判定为链路故障而无需再发送前述的第一存活消息,而后,该节点可以根据应用对故障诊断的具体需求,选择是否向GW、簇头等报告诊断结果。另一方面,如果没有,则说明该节点所怀疑的邻居节点还没有怀疑自己,此时,该节点可以按照前述步骤201、202进行故障诊断。由此,在本实施方式中,在该节点发送该第一存活消息之前,该方法还包括:
[0040]步骤200,查找该节点的存活消息表,确定该存活消息表中是否存在以该被怀疑节点作为存活节点,以该节点作为被怀疑节点的信息;如果存在,则确定该节点与该被怀疑节点之间的链路故障;否则执行步骤201,发送所述第一存活消息,将所述第一存活消息对应的存活节点和被怀疑节点的信息存储到存活消息表中。
[0041]图3是ad hoc网络中的节点根据本实施例的方法进行故障诊断的流程图,其中,如前所述,有些步骤是可选的,有些步骤可以通过其他方式实施,而有些步骤的执行顺序可以互换,图3的实施方式只是为了对本发明实施例进行说明,而并非是对本发明实施例的限制。请参照图3,该流程包括:
[0042]步骤301:判断存活消息表中是否有被怀疑节点为存活节点,节点自身为被怀疑节点的条目;如果有,则确定为链路故障,根据应用对故障诊断的具体需求进行相应处理;否则执行步骤302 ;
[0043]步骤302:广播通知被怀疑节点关于所述节点自身状态的存活消息;
[0044]步骤303:设置针对被怀疑节点的“状态判定延时”定时器;
[0045]步骤304:将节点自身ID和被怀疑节点ID存储在存活消息表中;
[0046]步骤305:判断在该“状态判定延时”定时器的
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1