一种主控单板及一种主控单板故障检测方法

文档序号:7800433阅读:112来源:国知局
一种主控单板及一种主控单板故障检测方法
【专利摘要】本发明提供了一种主控单板及一种主控单板故障检测方法,该主控单板包括:检测单元,用于检测对侧板的心跳;第一定时器,用于在检测单元检测到对侧板心跳丢失时,开始计时,其中,第一定时器的定时时长不小于外围单板检测心跳丢失的时延;第二定时器,用于在第一定时器超时后,开始计时;统计单元,用于统计在线外围单板的数量和统计第二定时器定时内主控单板检测到的心跳正常的外围单板的第一数量;判断单元,用于判断统计单元统计出的第一数量与在线的外围单板的数量之间的比值是否小于预设值,当小于预设值时,判定本主控单板故障,当不小于预设值时,判断对侧板故障,所述预设值小于1。通过本发明能够提高主控单板故障检测的准确性。
【专利说明】一种主控单板及一种主控单板故障检测方法
【技术领域】
[0001]本发明涉及故障检测【技术领域】,尤其涉及一种主控单板及一种主控单板故障检测方法。
【背景技术】
[0002]为了保证系统的高可靠性,需要对单板做备份处理,防止单板故障后无法提供正常功能。采用以单板为备份单位的备份方式,只要主用单板出现故障,就要触发切换,主用单板复位,备用单板升主用,新主用单板继续提供服务。
[0003]在这个过程中,涉及到主备用单板的故障检测方法,现有技术中,主用单板和备用单板之间通过心跳消息来判断对侧板是否正常,如果在检测时间段内无法收到对侧板的心跳消息,则认为对侧单板异常。
[0004]现有技术中,只要主备用单板上接收模块、发送模块或者网络任务出现异常,就会导致误判,故障检测的准确性低。

【发明内容】

[0005]本发明提供了一种主控单板及一种主控单板故障检测方法,能够提高主控单板故障检测的准确性。
[0006]一方面,本发明提供了一种主控单板,所述主控单板包括:
[0007]检测单元,用于检测对侧板的心跳;
[0008]第一定时器,用于在检测单元检测到对侧板心跳丢失时,开始计时,其中,所述第一定时器的定时时长不小于外围单板检测心跳丢失的时延;
[0009]第二定时器,用于在第一定时器超时后,开始计时;
[0010]统计单元,用于统计在线外围单板的数量和统计第二定时器定时内主控单板检测到的心跳正常的外围单板的第一数量;
[0011]判断单元,用于判断所述统计单元统计出的所述第一数量与所述在线的外围单板的数量之间的比值是否小于预设值,当小于预设值时,判定本主控单板故障,当不小于预设值时,判断对侧板故障,其中,所述预设值小于I。
[0012]进一步地,所述统计单元,用于接收并保存所述对侧板心跳丢失后外围单板发来的心跳消息,并根据所述心跳消息计算心跳正常的外围单板的第一数量。
[0013]进一步地,所述主控单板还包括:触发信号生成单元,用于在第一定时器超时后,生成启动第二定时器的触发信号。
[0014]进一步地,所述预设值为0.5。
[0015]另一方面,本发明提供了一种主控单板故障检测方法,所述方法包括:
[0016]S1.检测对侧板的心跳;
[0017]S2.当检测到对侧板心跳丢失时,开启第一定时器,所述第一定时器的定时时长不小于外围单板检测心跳丢失的时延;[0018]S3.第一定时器超时后,开启第二定时器;
[0019]S4.统计在线外围单板的数量,并统计第二定时器定时内主控单板检测到的心跳正常的外围单板的第一数量;
[0020]S5.判断所述第一数量与在线的外围单板的数量之间的比值是否小于预设值,如果是,则判定本主控单板故障,否则判定对侧板故障,所述预设值小于I。
[0021]进一步地,所述步骤S4包括:
[0022]接收并保存所述对侧板心跳丢失后外围单板发来的心跳消息;
[0023]根据所述心跳消息计算心跳正常的外围单板的第一数量。
[0024]进一步地,所述方法还包括:
[0025]在第一定时器超时后,生成启动第二定时器的触发信号。
[0026]进一步地,所述预设值为0.5。
[0027]本发明提供了一种主控单板及一种主控单板故障检测方法,通过外围单板来检测主控单板的故障情况,在本主控单板接收不到对侧板的心跳时,通过与本主控单板的心跳正常的外围单板占总的外围单板的比例来判断本主控单板是否故障,能够提高主控单板故障检测的准确性。
【专利附图】

【附图说明】
[0028]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0029]图1是本发明实施例1提供的一种主控单板结构示意图;
[0030]图2是本发明实施例2提供的一种主控单板故障检测方法流程图;
[0031]图3是本发明实施例3提供的一种主控单板故障检测方法流程图。
【具体实施方式】
[0032]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0033]实施例1:
[0034]在一个框内,包括一个主用主控单板、一个备用主控单板和外围单板。其中,在每个单板上部署有心跳模块,主控单板能够对整个系统的心跳资源进行管理。外围单板会周期性的向主控单板发送心跳消息,主控单板在接收到外围单板发来的心跳消息后,会给外围单板回发心跳消息。主用主控单板和备用主控单板之间会周期性地向对方发送心跳消
肩、O
[0035]本发明实施例提供了一种主控单板,参见图1,该主控单板包括:
[0036]检测单元101,用于检测对侧板的心跳;
[0037]第一定时器102,用于在检测单元101检测到对侧板心跳丢失时,开始计时,其中,所述第一定时器的定时时长不小于外围单板检测心跳丢失的时延;
[0038]第二定时器103,用于在第一定时器102超时后,开始计时;
[0039]统计单元104,用于统计在线外围单板的数量和统计第二定时器103定时内主控单板检测到的心跳正常的外围单板的第一数量;
[0040]判断单元105,用于判断所述统计单元统计出的所述第一数量与所述在线的外围单板的数量之间的比值是否小于预设值,当小于预设值时,判定本主控单板故障,当不小于预设值时,判断对侧板故障,其中,所述预设值小于I。
[0041 ] 本发明实施例提供了 一种主控单板,通过外围单板来检测主控单板的故障情况,在本主控单板接收不到对侧板的心跳时,通过与本主单板的心跳正常的外围单板占总的在线的外围单板的比例来判断本主控单板是否故障,能够提高主控单板故障检测的准确性。
[0042]其中,本发明实施例中,框内有至少一个外围单板。
[0043]所述统计单元104,用于接收并保存所述对侧板心跳丢失后外围单板发来的心跳消息,并根据所述心跳消息计算心跳正常的外围单板的第一数量。
[0044]所述主控单板还包括:触发信号生成单元,用于在第一定时器超时后,生成启动第二定时器的触发信号。
[0045]所述预设值为0.5。
[0046]其中,第一定时器的定时时长可以设置为2s,第二定时器的定时时长可以设置为
2s0
[0047]实施例2:
[0048]本发明实施例提供了一种主控单板故障检测方法,参见图2,该方法包括:
[0049]S1:检测对侧板的心跳;
[0050]S2:当检测到对侧板心跳丢失时,开启第一定时器,所述第一定时器的定时时长不小于外围单板检测心跳丢失的时延;
[0051]S3:第一定时器超时后,开启第二定时器;
[0052]S4:统计在线外围单板的数量,并统计第二定时器定时内主控单板检测到的心跳正常的外围单板的第一数量;
[0053]S5:判断所述第一数量与在线的外围单板的数量之间的比值是否小于预设值,如果是,则判定本主控单板故障,否则判定对侧板故障,所述预设值小于I。
[0054]本发明实施例提供了一种主控单板故障检测方法,通过外围单板来检测主控单板的故障情况,在本主控单板接收不到对侧板的心跳时,通过与本主控单板的心跳正常的外围单板占总的在线的外围单板的比例来判断本主控单板是否故障,能够提高主控单板故障检测的准确性。
[0055]其中,本发明实施例中,框内有至少一个外围单板。
[0056]本发明实施例中,主用主控单板和备用主控单板互为对侧板。
[0057]单板之间心跳消息的发送和接收存在时延,例如当外围单板向主控单板发送出心跳消息后,主控单板并不能立即收到该心跳消息,需要等待一段时间才能接收到该心跳消息,外围单板检测到心跳丢失存在时延。本实施例通过设置第一定时器来消除该时延造成的影响,由于第一定时器的定时时长不小于外围单板检测心跳丢失的时延,因此,在第一定时器超时后收到的心跳消息都是在本主控单板检测到对侧板心跳丢失后,外围单板发送出的心跳消息。
[0058]该方法还包括:在第一定时器超时后,生成启动第二定时器的触发信号。
[0059]步骤S5中的预设值可以取值0.5,当预设值取值为0.5时,当与本主控单板心跳正常的外围单板数量占在线的外围单板的数量的比值小于50%,则判定本主控单板故障。
[0060]其中,第一定时器的定时时长可以设置为2s,第二定时器的定时时长可以设置为2s0
[0061]实施例3:
[0062]本发明实施例提供了一种主控单板故障检测方法,参见图3,该方法包括:
[0063]301:检测对侧板的心跳;
[0064]302:当检测到对侧板心跳丢失时,开启第一定时器,所述第一定时器的定时时长不小于外围单板检测心跳丢失的时延;
[0065]303:第一定时器超时后,开启第二定时器;
[0066]304:统计在线外围单板的数量;
[0067]305:接收并保存所述对侧板心跳丢失后外围单板发来的心跳消息;
[0068]306:根据所述心跳消息计算心跳正常的外围单板的第一数量;
[0069]307:判断所述第一数量与在线的外围单板的数量之间的比值是否小于预设值,如果是,则判定本主控单板故障,否则判定对侧板故障,所述预设值小于I。
[0070]本发明实施例中,主用主控单板和备用主控单板互为对侧板。
[0071]由于外围单板会周期性的向主控单板发送心跳消息,主控单板接收到外围单板发送的心跳消息后,保存该心跳消息,可以在该心跳消息中携带外围单板记录的主用主控单板和备用主控单板的状态,该状态为故障或正常。并且,心跳消息中携带有发送该心跳消息的外围单板的标识,主控单板根据该心跳消息中的标识统计心跳正常的外围单板的数量。
[0072]上述设备内的各单元、子单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述。
[0073]另外,需要说明的是:本发明提供的一种主控单板及一种主控单板故障检测方法,可以用于主备单板的切换:当主用主控单板检测到本单板故障后,本单板自复位,当主用主控单板检测到备用主控单板故障后,上报备用主控单板通信异常告警;当备用主控单板检测到本单板故障后,本单板自复位,当备用主控单板检测到主用主控单板故障后,开始升主操作,升主完成后,复位原主用主控单板。
[0074]通过上述描述可见,本发明实施例具有如下有益效果:
[0075]本发明实施例提供了一种主控单板及一种主控单板故障检测方法,通过外围单板来检测主控单板的故障情况,在本主控单板接收不到对侧板的心跳时,通过与本主控单板的心跳正常的外围单板占总的外围单板的比例来判断本主控单板是否故障,能够提高主控单板故障检测的准确性,降低了误检的几率,提高了设备的可用性和可靠性。
[0076]需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不
排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
[0077]本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:R0M、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
[0078]最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
【权利要求】
1.一种主控单板,其特征在于,所述主控单板包括: 检测单元,用于检测对侧板的心跳; 第一定时器,用于在检测单元检测到对侧板心跳丢失时,开始计时,其中,所述第一定时器的定时时长不小于外围单板检测心跳丢失的时延; 第二定时器,用于在第一定时器超时后,开始计时; 统计单元,用于统计在线外围单板的数量和统计第二定时器定时内主控单板检测到的心跳正常的外围单板的第一数量; 判断单元,用于判断所述统计单元统计出的所述第一数量与所述在线的外围单板的数量之间的比值是否小于预设值,当小于预设值时,判定本主控单板故障,当不小于预设值时,判断对侧板故障,其中,所述预设值小于I。
2.根据权利要求1所述的主控单板,其特征在于,所述统计单元,用于接收并保存所述对侧板心跳丢失后外围单板发来的心跳消息,并根据所述心跳消息计算心跳正常的外围单板的第一数量。
3.根据权利要求1所述的主控单板,其特征在于,所述主控单板还包括:触发信号生成单元,用于在第一定时器超时后,生成启动第二定时器的触发信号。
4.根据权利要求1所述的主控单板,其特征在于,所述预设值为0.5。
5.一种主控单板故障检测方法,其特征在于,所述方法包括: 51.检测对侧板的心跳; 52.当检测到对侧板心跳丢失时,开启第一定时器,所述第一定时器的定时时长不小于外围单板检测心跳丢失的时延; 53.第一定时器超时后,开启第二定时器; 54.统计在线外围单板的数量,并统计第二定时器定时内主控单板检测到的心跳正常的外围单板的第一数量; 55.判断所述第一数量与在线的外围单板的数量之间的比值是否小于预设值,如果是,则判定本主控单板故障,否则判定对侧板故障,所述预设值小于I。
6.根据权利要求5所述的方法,其特征在于,所述步骤S4包括: 接收并保存所述对侧板心跳丢失后外围单板发来的心跳消息; 根据所述心跳消息计算心跳正常的外围单板的第一数量。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括: 在第一定时器超时后,生成启动第二定时器的触发信号。
8.根据权利要求5所述的方法,其特征在于,所述预设值为0.5。
【文档编号】H04L12/24GK103916272SQ201410126377
【公开日】2014年7月9日 申请日期:2014年3月31日 优先权日:2014年3月31日
【发明者】汪丽, 杨焕军, 王雪平 申请人:大唐移动通信设备有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1