一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法与流程

文档序号:11709975阅读:416来源:国知局
一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法与流程

本发明属于通信网络故障诊断领域,尤其涉及一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法。



背景技术:

战术通信网络是一种典型的军用网络,具有机动性好、抗毁性强、及时性好等特点,满足了军队在战争中对通信联络的保密、迅速、不间断、准确等高要求。由于战场环境复杂多变、通信装备的运载平台震动大、环境高低温差大、风沙盐雾等自然条件十分恶劣,导致路由交换设备容易出现硬件层面的间歇性故障或者永久性故障,影响通信网络的正常运行。

现有路由交换设备一般由一块控制交换板和若干业务单元板构成,采用背板实现各功能板之间的互连,其硬件结构如图1所示。设备开机时各单元板进行加电自检,主控板对各个单元板的自检信息进行维护,能够在开机时发现单元板硬件故障,网络操作人员需要通过设备面板指示灯或者人机界面查询才能明确故障单元,这属于单节点单设备行为。而在战术通信网络的演训和实战运用过程中,通信节点散布在各个地域,路由交换设备持续工作时间长,出现运行时硬件故障时,需要网络操作人员采用第三方通信手段(例如民用电话网络)进行逐层上报,网络管理人员无法及时获取硬件故障的详细信息,给解决问题带来很大难度。

可见,现有技术对于路由交换设备的硬件诊断方式比较单一,无法及时发现大规模组网时设备的运行时硬件故障。为了保证通信网络的可靠运行,如何以最少的操作、最低的代价及时发现网络中路由交换设备的硬件故障,及时进行维修或者器件替换,仍然是一个棘手的问题。



技术实现要素:

本发明公开了一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法。路由交换设备的各业务单元板需要向控制交换板注册,使得控制交换板能掌握各业务单元板的存在状况,注册过程通过控制交换板的询问和业务单元板的应答实现;注册后控制交换板需要监视各业务单元板的运行状态,监视过程通过控制交换板对各业务单元板的定时询问机制实现。故障搜集诊断设备能够自动发现通信网络中的故障节点,批量搜集和保存设备硬件故障信息,辅助网络管理人员快速定位设备的硬件故障及类型,加快故障排除的进度。

如图2所示,本发明中涉及两种设备:故障搜集诊断设备、路由交换设备。故障搜集诊断设备是负责故障搜集和诊断的计算机终端。路由交换设备是通信网络中的网络交换节点。路由交换设备之间按正常的网间链路互连;故障搜集诊断设备与路由交换设备之间采用eth链路互连。

如图3所示,本发明中涉及三种软件模块:故障搜集诊断模块、故障搜集模块、故障监控模块。其中:

故障搜集诊断模块运行在故障搜集诊断设备上。该模块能够发起故障搜集请求组播消息;能够接收通信网络中各节点的故障搜集响应单播消息,解析并保存故障搜集结果;能够向网络管理人员显示故障告警信息;能够对通信网络的故障历史信息进行统计分析。

故障搜集模块运行在路由交换设备的控制交换板上。该模块能够接收故障搜集请求组播消息,并将该请求消息在网络中泛洪转播;能够查看故障监控模块中是否存在硬件故障信息;能够生成故障搜集响应单播消息回传给故障搜集诊断设备。

故障监控模块运行在路由交换设备的控制交换板上。该模块能够监控设备各业务单元板的运行状态;发现单元板出现故障时能够主动将故障信息向故障搜集模块汇报。

故障搜集诊断模块与故障搜集模块之间的消息采用udp报文进行封装,故障搜集模块之间的消息采用udp报文进行封装,udp收发端口号均采用固定值。

本发明有益技术效果是:提供了一种大规模组网时路由交换设备硬件故障在线诊断和批量搜集方法,网络管理人员能够以最少的操作、最低的代价及时发现网络中路由交换设备各业务单元板的硬件故障,加快故障排除的进度。通过对故障历史信息的统计分析,能够发现通信网络中故障率较高的设备或单元板,为推动设备质量改进提供信息依据。

附图说明

图1、路由交换设备的硬件结构;

图2、设备间的连接关系图;

图3、设备的功能模块组成及模块间的关系图。

具体实施方式

本发明提供一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法,实现该方法包括故障搜集诊断模块、故障搜集模块、故障监控模块。模块之间关系可参见图3。故障监控模块与业务单元板之间采用板间总线维护通道通信,其交互流程及报文格式在此不作详细阐述。需要说明的是,为了更加清楚、简要的描述本发明的实现方式,图3中省略了节点的原有功能模块,仅仅示出与本发明相关的功能模块。具体实施方式如下:

故障搜集诊断模块主要包括如下功能:

1)故障搜集诊断模块定期(5-10分钟一次,可配置)向路由交换设备发送故障搜集请求组播消息,消息内部需携带故障搜集诊断设备的通信ip地址、udp收端口号以及请求消息的序列号,序列号逐次递增;

2)故障搜集诊断模块接收路由交换设备的故障搜集响应单播消息,解析并保存故障搜集响应消息到数据库中,需要记录下接收时间、响应设备ip地址、故障具体信息等;

3)能够向网络管理人员显示故障告警信息,明确指出哪一台设备的哪一块业务单元板发生故障,具体信息包括单元板类型、生产厂家代号、硬件版本号、软件版本号、故障编码等;

4)能够对通信网络的故障历史信息进行统计分析,向网络管理人员提供故障查询、统计、显示等功能,辅助网络管理人员进行故障数据挖掘。

故障搜集模块主要包括如下功能:

1)全网的故障搜集模块均采用固定统一的udp端口号接收和发送报文;

2)故障搜集模块接收故障搜集诊断设备的故障搜集请求组播消息,并将该请求消息在网络中泛洪传输;

3)故障搜集模块通过故障搜集请求组播消息中携带的序列号进行识别,同一个消息只处理一次,避免在泛洪时形成网络风暴;

4)故障搜集模块记录下故障诊断设备的通信ip地址及udp端口号便于回传故障响应报文使用;

5)故障搜集模块查看故障监控模块是否存在硬件故障信息,如果有则生成故障搜集响应单播消息回传给故障搜集诊断设备;

6)故障搜集模块接收故障监控模块主动汇报的故障信息,及时生成故障搜集响应单播消息回传给故障搜集诊断设备。

故障监控模块主要包括如下功能:

1)故障监控模块需要完成对业务单元板的注册及运行状态监视,对各业务单元板进行定时询问,第一轮使用强制warm询问消息,以后采用定时询问消息;业务单元板收到强制warm询问消息后,必须使用warm消息应答;控制交换板收到warm消息时,向业务单元板应答warm确认消息;业务单元板在收到控制交换板发送的warm确认消息后,对以后的定时询问消息使用业务单元板正常消息或故障消息进行应答;如果没有收到warm确认消息,业务单元板使用warm消息应答定时询问消息,直到收到warm确认消息后再使用业务单元板正常消息或故障消息进行应答;

2)故障监控模块发现某块业务单元板出现硬件故障时,主动将故障信息向故障搜集模块汇报;

3)故障信息中应包含业务单元板类型、生产厂家代号、硬件版本号、软件版本号、故障编码等。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换,都应涵盖在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1