交换机的故障自诊断、自恢复方法及系统的制作方法

文档序号:7795082阅读:389来源:国知局
交换机的故障自诊断、自恢复方法及系统的制作方法
【专利摘要】本发明提供一种交换机的故障自诊断、自恢复方法及系统。根据所述方法,所述系统监测所述交换机运行时产生故障报告;从预先保存的故障报告和所对应的故障诊断测试方案的库中获取对应所监测到的故障报告的诊断测试方案;执行所获取的故障诊断测试方案以得到对应所述故障报告的故障确诊报告,并根据预保存的故障关键信息的库提取所述故障确诊报告中所包含的故障关键信息;从预先保存的故障关键信息和所对应的故障自恢复方案的库中,获取所得到的故障关键信息所对应的故障自恢复方案并予以执行,以使所述交换机的故障自动恢复。本发明通过进行故障测试来精准的定位故障原因,有效减少在自动恢复后出现同一故障的情况。
【专利说明】交换机的故障自诊断、自恢复方法及系统
【技术领域】
[0001]本发明涉及一种故障自诊断、自恢复方法,特别是涉及一种交换机的故障自诊断、自恢复方法及系统。
【背景技术】
[0002]交换机(Switch)也叫交换式集线器,是一种工作在OSI数据链路层上的、基于MAC(网卡的介质访问控制地址)识别、能完成封装转发数据包功能的网络设备。它通过对信息进行重新生成,并经过内部处理后转发至指定端口,具备自动寻址能力和交换作用。交换机上的所有端口均有独享的信道带宽,以保证每个端口上数据的快速有效传输。由于交换机根据所传递信息包的目的地址,将每一信息包独立地从源端口送至目的端口,而不会向所有端口发送,避免了和其它端口发生冲突,因此,交换机可以同时互不影响的传送这些信息包,并防止传输冲突,提高了网络的实际吞吐量。
[0003]对于一个大型交换机网络,由成千上万台交换机构成,分布区域十分广泛。如果某台交换机故障,可能对全局用户的使用产生影响。因此,技术人员需要及时发现交换机故障点,以便有效防范交换机故障对网络的影响。
[0004]目前,针对交换机的各种故障,技术人员设计了对应各种故障的修复方案,并保存在交换机中,当交换机发生故障时,交换机能够针对当前的故障提供相应的修复方案,以实现自我恢复。该方式有效解决了交换机发生故障时,需要人工处理的问题。然而,随着交换机的功能复杂,很多故障不能从表象直接确定故障原因,因此,上述方法逐渐的不能适用于交换机的有效自我修复。需要技术人员提出更为智能的方案。

【发明内容】

[0005]鉴于以上所述现有技术的缺点,本发明的目的在于提供一种交换机的故障自诊断、自恢复方法及系统,用于解决现有技术中交换机的自修复技术无法根据故障表象诊断故障原因,致使所预设的故障修复方案不能有效修复故障的问题。
[0006]为实现上述目的及其他相关目的,本发明提供一种交换机的故障自诊断、自恢复方法,包括:监测所述交换机运行时产生故障报告;从预先保存的故障报告和所对应的故障诊断测试方案的库中获取对应所监测到的故障报告的诊断测试方案;执行所获取的故障诊断测试方案以得到对应所述故障报告的故障确诊报告,并根据预保存的故障关键信息的库提取所述故障确诊报告中所包含的故障关键信息;从预先保存的故障关键信息和所对应的故障自恢复方案的库中,获取所得到的故障关键信息所对应的故障自恢复方案并予以执行,以使所述交换机的故障自动恢复。
[0007]优选地,在监测到所述故障报告时,所述方法还包括以下任一种或多种的组合:保存所监测的故障报告、标记所保存的故障报告为未恢复、以及保存监测到所述故障报告时的时间。
[0008]优选地,在监测到所述故障报告时,所述方法还包括:确定所监测到的故障报告是否属于历史所保存的标记为未恢复的故障报告,若是,则将所述故障报告交由人工处理,若否,则从预先保存的故障报告和所对应的故障诊断测试方案的库中获取对应所述故障报告的诊断测试方案。
[0009]优选地,当监测到所述交换机产生的故障报告与历史所保存的标记为未恢复的故障报告相同时,所述方法还包括:确定当前所监测的故障报告的时间与上次所监测的同一故障报告的时间差是否在所述预设时限内,若是,则将所述故障报告交由人工处理,反之,则从预先保存的故障报告和所对应的故障诊断测试方案的库中获取对应所述故障报告的诊断测试方案。
[0010]优选地,所述方法还包括:在执行了相应的故障自恢复方案后、或在执行了相应的故障自恢复方案后且在预设时限内未出现同样的故障报告时,将所对应的故障报告标记为已恢复。
[0011]优选地,所述故障关键信息包括:文本式的故障关键信息、和/或故障代码;所述故障报告包括以下至少一种:内存自检失败、telnet服务拒绝。
[0012]基于上述目的,本发明还提供一种交换机的故障自诊断、自恢复系统,其包括:存储单元,用于保存包含故障报告和所对应的故障诊断测试方案的库、包含故障关键信息的库、以及包括故障关键信息和所对应的故障自恢复方案的库;监测单元,用于监测所述交换机运行时产生故障报告;诊断测试方案获取单元,用于从所述存储单元所提供的故障报告和所对应的故障诊断测试方案的库中获取对应所监测到的故障报告的诊断测试方案;故障确诊报告生成单元,用于执行所述诊断测试方案获取单元所提供的故障诊断测试方案以得到对应所述故障报告的故障确诊报告,并根据所述存储单元所提供的故障关键信息的库提取所述故障确诊报告中所包含的故障关键信息;故障恢复单元,用于从所述存储单元所提供的故障关键信息和所对应的故障自恢复方案的库中,获取所述故障确诊报告生成单元所提供的故障关键信息所对应的故障自恢复方案并予以执行,以使所述交换机的故障自动恢复。
[0013]优选地,所述监测单元在监测到所述故障报告时,还执行以下任一种或多种的组合:保存所监测的故障报告、标记所保存的故障报告为未恢复、以及保存监测到所述故障报告时的时间。
[0014]优选地,所述监测单元还用于确定所监测到的故障报告是否属于历史所保存的标记为未恢复的故障报告,若是,则将所述故障报告交由人工处理,若否,则从预先保存的故障报告和所对应的故障诊断测试方案的库中获取对应所述故障报告的诊断测试方案。
[0015]优选地,所述监测单元还用于确定当前所监测的故障报告的时间与上次所监测的同一故障报告的时间差是否在所述预设时限内,若是,则将所述故障报告交由人工处理,反之,则从预先保存的故障报告和所对应的故障诊断测试方案的库中获取对应所述故障报告的诊断测试方案。
[0016]优选地,所述故障恢复单元还用于在执行了相应的故障自恢复方案后、或在执行了相应的故障自恢复方案后且在预设时限内未出现同样的故障报告时,将所对应的故障报告标记为已恢复。
[0017]优选地,所述故障关键信息包括:文本式的故障关键信息、和/或故障代码;所述故障报告包括以下至少一种:内存自检失败、telnet服务拒绝。[0018]如上所述,本发明的交换机的故障自诊断、自恢复方法及系统,具有以下有益效果:根据故障报告进行自我测试,以诊断故障来源,并进行自我恢复,由此,本发明能够精准的定位故障原因,有效减少在自动恢复后出现同一故障的情况。
【专利附图】

【附图说明】
[0019]图1显示为本发明的交换机的故障自诊断、自恢复方法的流程图。
[0020]图2显示为本发明的交换机的故障自诊断、自恢复系统的结构示意图。
[0021]元件标号说明
[0022]I自诊断自恢复系统
[0023]11存储单元
[0024]12监测单元
[0025]13诊断测试方案获取单元
[0026]14故障确诊报告生成单元
[0027]15故障恢复单元
[0028]SI ?S4 步骤
【具体实施方式】
[0029]以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的【具体实施方式】加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
[0030]实施例一
[0031]请参阅图1,本发明提供一种交换机的故障自诊断、自恢复方法。所述方法主要由安装在所述交换机中的自诊断自恢复系统来执行。所述交换机能根据所产生的故障报告进行自我测试,以确定故障所对应的原因(即故障确诊),再根据所确定的原因进行自我恢复。由于能够自我诊断,所述交换机能准确、高效的恢复故障,减少其对网络的影响。其中,所述交换机在安装所述自诊断自恢复系统时,同时保存故障报告和所对应的故障诊断测试方案的库、故障关键信息的库、故障关键信息和所对应的故障自恢复方案的库。其中,一个故障报告可对应一个故障诊断测试方案,也可以对应多个故障诊断测试方案。类似的,一个故障关键信息可对应一个故障自恢复方案,也可以对应多个故障自恢复方案。
[0032]在步骤SI中,所述自诊断自恢复系统监测所述交换机运行时产生故障报告。其中,所述故障报告为所述交换机在运行出现异常时自动产生的故障报告,其包括但不限于以下至少一种:内存自检失败、telnet服务拒绝等。
[0033]具体地,所述自诊断自恢复系统实时监测所述交换机在运行出现异常时自动产生的故障报告。
[0034]在步骤S2中,所述自诊断自恢复系统从预先保存的故障报告和所对应的故障诊断测试方案的库中获取对应所监测到的故障报告的诊断测试方案。
[0035]具体地,所述自诊断自恢复系统从该库中获取对应所监测到的故障报告的至少一个诊断测试方案,并执行步骤S3。
[0036]在步骤S3中,所述自诊断自恢复系统执行所获取的故障诊断测试方案以得到对应所述故障报告的故障确诊报告,并根据预保存的故障关键信息的库提取所述故障确诊报告中所包含的故障关键信息。其中,所述故障关键信息包括但不限于:文本式的故障关键信息、和/或故障代码。
[0037]具体地,所述自诊断自恢复系统依次执行所获取的故障诊断测试方案,以得到相应的所测试的结果,所述自诊断自恢复系统将各测试结果以预设格式整理为故障确诊报告,并按照所述故障关键信息的库中所保存的各故障关键信息来提取所述故障确诊报告中所包含的故障关键信息。
[0038]在步骤S4中,所述自诊断自恢复系统从预先保存的故障关键信息和所对应的故障自恢复方案的库中,获取所得到的故障关键信息所对应的故障自恢复方案并予以执行,以使所述交换机的故障自动恢复。
[0039]具体地,所述自诊断自恢复系统根据故障关键信息和所对应的故障自恢复方案的库来获取所提取的故障关键信息所对应的故障自恢复方案,并予以执行,如此实现所述交换机的故障自动恢复。
[0040]当所述自诊断自恢复系统未能获取到所得到的故障确诊报告相对应的故障自恢复方案,则将所述故障报告交由人工处理。
[0041]实施例二
[0042]与实施例一不同的是,所述步骤SI还包括:步骤SI I,所述步骤S4还包括步骤S41(均未予图示)。
[0043]在步骤Sll中,所述自诊断自恢复系统在监测到所述故障报告的同时,还按照预设的规则执行以下中的任一种或多种组合:保存所监测的故障报告、标记所保存的故障报告为未恢复、及保存监测到所述故障报告时的时间。
[0044]例如,当所述自诊断自恢复系统监测到所述故障报告时,确定所监测到的故障报告是否属于历史所保存的标记为未恢复的故障报告,若是,则将所述故障报告交由人工处理,若否,则执行步骤S2、S3、以及S41。
[0045]又如,当所述自诊断自恢复系统监测到所述故障报告时,确定所监测到的故障报告是否属于历史所保存的标记为未恢复的故障报告,若否,则保存所述故障报告并标记为未恢复,继续执行步骤S2、S3、以及S41 ;若是,则进一步的比较当前所监测到的故障报告与所保存的同样的且标记为未恢复的故障报告的时间间隔是否小于预设时限,若小于,则将所述故障报告交由人工处理,若大于则保存所述故障报告、标记为未恢复并保存当前监测到所述故障报告时的时间,继续执行步骤S2、S3、以及S41。
[0046]在步骤S41,当所述自诊断自恢复系统在执行了相应的故障自恢复方案后、或在执行了相应的故障自恢复方案后且在预设时限内未出现同样的故障报告时,将所对应的故障报告标记为已恢复。
[0047]实施例三
[0048]与实施例二不同的是,当所述自诊断自恢复系统保存了所监测的故障报告、标记所保存的故障报告为未恢复、及保存监测到所述故障报告时的时间,则所述步骤Si还包括步骤S12 (未予图示)。[0049]在步骤S12中,当监测到所述交换机产生的故障报告与历史所保存的标记为未恢复的故障报告相同时,所述自诊断自恢复系统确定当前所监测的故障报告的时间与上次所监测的同一故障报告的时间差是否在所述预设时限内,若是,则将所述故障报告交由人工处理,反之,则执行步骤S2、S3、以及S4 (或S41 )。
[0050]本案以所监测到的故障报告为telnet服务拒绝故障为例,描述所述自诊断自恢复方法的执行过程:
[0051]当所述自诊断自恢复系统监测到telnet服务拒绝故障的故障报告,先确认所述telnet服务拒绝故障的故障报告是否属于已保存的标记为未恢复的故障报告,若是,则t匕较当前所监测的故障报告的时间与上次所监测的telnet服务拒绝故障的故障报告的时间差是否在所述预设时限内,若是,则将所述故障报告通过邮件、推送窗口警告、短信等方式通知技术人员,以便技术人员及时处理,若否,则保存所述telnet服务拒绝故障的故障报告并标记该故障报告为未恢复,同时保存当前监测到所述telnet服务拒绝故障的故障报告的时间;
[0052]接着,所述自诊断自恢复系统从预先保存的故障报告和所对应的故障诊断测试方案的库中获取对应所监测到的telnet服务拒绝故障的故障报告的诊断测试方案,其中,所获取的诊断测试方案包括:检查etc/xinnetd.d目录中的telnet文件;
[0053]所述自诊断自恢复系统执行所获取的诊断测试方案,得到包含未能在etc/xinnetd.d目录中找到telnet文件的故障诊断报告,贝U所述自诊断自恢复系统从预保存的故障关键信息的库中提取未能在etc/xinnetd.d目录中找到telnet文件的故障关键信息,并从预先保存的故障关键信息和所对应的故障自恢复方案的库中,获取该故障关键信息所对应的故障自恢复方案,即将备份中的telnet文件复制到etc/xinnetd.d目录中,并予以执行,则所述自诊断自恢复系统自动恢复了所述交换机的telnet服务拒绝故障;
[0054]所述自诊断自恢复系统还将该故障报告的标记改为已恢复,或者,当所述自诊断自恢复系统从所保存的时间开始的所述预设时限还没有收到所述telnet服务拒绝故障的故障报告,则将该故障报告的标记改为已恢复。
[0055]本案再以所监测到的故障报告为内存故障为例,描述所述自诊断自恢复方法的执行过程:
[0056]当所述自诊断自恢复系统监测到内存故障的故障报告,先确认所述内存故障的故障报告是否属于已保存的标记为未恢复的故障报告,若是,则比较当前所监测的故障报告的时间与上次所监测的内存故障的故障报告的时间差是否在所述预设时限内,若是,则将所述故障报告通过邮件、推送窗口警告、短信等方式通知技术人员,以便技术人员及时处理,若否,则保存所述内存故障的故障报告并标记该故障报告为未恢复,同时保存当前监测到所述内存故障的故障报告的时间;
[0057]接着,所述自诊断自恢复系统从预先保存的故障报告和所对应的故障诊断测试方案的库中获取对应所监测到的内存故障的故障报告的诊断测试方案,其中,所获取的诊断测试方案包括:令所述交换机切换到硬件自检状态,进行内存自检;
[0058]所述自诊断自恢复系统执行所获取的诊断测试方案,得到包含内存自检失败错误的故障诊断报告,则所述自诊断自恢复系统从预保存的故障关键信息的库中提取内存自检失败错误的故障关键信息,并从预先保存的故障关键信息和所对应的故障自恢复方案的库中,未能获取该故障关键信息所对应的故障自恢复方案,则所述自诊断自恢复系统将所述故障报告通过邮件、推送窗口警告、短信等方式通知技术人员,以便技术人员及时处理;
[0059]当技术人员解决了该故障,手动的将该故障报告的标记改为已恢复,或者,当所述自诊断自恢复系统从所保存的时间开始的所述预设时限还没有收到所述内存故障的故障报告,则将该故障报告的标记改为已恢复。
[0060]实施例四
[0061]请参阅图2,本发明提供一种交换机的故障自诊断、自恢复系统。所述自诊断自恢复系统I安装在所述交换机中。所述交换机能根据所产生的故障报告进行自我测试,以确定故障所对应的原因(即故障确诊),再根据所确定的原因进行自我恢复。由于能够自我诊断,所述交换机能准确、高效的恢复故障,减少其对网络的影响。
[0062]所述自诊断自恢复系统I包括:存储单元11、监测单元12、诊断测试方案获取单元
13、故障确诊报告生成单元14、故障恢复单元15。
[0063]所述存储单元11用于保存包含故障报告和所对应的故障诊断测试方案的库、包含故障关键信息的库、以及包括故障关键信息和所对应的故障自恢复方案的库。
[0064]其中,所述交换机在安装所述自诊断自恢复系统I时,同时将所述故障报告和所对应的故障诊断测试方案的库、故障关键信息的库、故障关键信息和所对应的故障自恢复方案的库保存在所述存储单元11中。其中,一个故障报告可对应一个故障诊断测试方案,也可以对应多个故障诊断测试方案。类似的,一个故障关键信息可对应一个故障自恢复方案,也可以对应多个故障自恢复方案。
[0065]所述监测单元12用于监测所述交换机运行时产生故障报告。其中,所述故障报告为所述交换机在运行出现异常时自动产生的故障报告,其包括但不限于以下至少一种:内存自检失败、telnet服务拒绝等。
[0066]具体地,所述监测单元12实时监测所述交换机在运行出现异常时自动产生的故
障报告。
[0067]所述诊断测试方案获取单元13用于从所述存储单元11所提供的故障报告和所对应的故障诊断测试方案的库中获取对应所监测到的故障报告的诊断测试方案。
[0068]具体地,所述诊断测试方案获取单元13从所述故障报告和所对应的故障诊断测试方案的库中获取对应所监测到的故障报告的至少一个诊断测试方案,并输至所述故障确诊报告生成单元14。
[0069]所述故障确诊报告生成单元14用于执行所述诊断测试方案获取单元13所提供的故障诊断测试方案以得到对应所述故障报告的故障确诊报告,并根据所述存储单元11所提供的故障关键信息的库提取所述故障确诊报告中所包含的故障关键信息。
[0070]具体地,所述故障确诊报告生成单元14依次执行所获取的故障诊断测试方案,以得到相应的所测试的结果,所述故障确诊报告生成单元14将各测试结果以预设格式整理为故障确诊报告,并按照所述故障关键信息的库中所保存的各故障关键信息来提取所述故障确诊报告中所包含的故障关键信息。
[0071]所述故障恢复单元15用于从所述存储单元11所提供的故障关键信息和所对应的故障自恢复方案的库中,获取所述故障确诊报告生成单元14所提供的故障关键信息所对应的故障自恢复方案并予以执行,以使所述交换机的故障自动恢复。[0072]具体地,所述故障恢复单元15根据故障关键信息和所对应的故障自恢复方案的库来获取所提取的故障关键信息所对应的故障自恢复方案,并予以执行,如此实现所述交换机的故障自动恢复。
[0073]当所述故障恢复单元15未能获取到与所述故障确诊报告生成单元14所提供的故障确诊报告相对应的故障自恢复方案,则将所述故障报告交由人工处理。
[0074]实施例五
[0075]与实施例四不同的是:
[0076]所述监测单元12在监测到所述故障报告的同时,还按照预设规则执行以下中的任一种或多种组合:保存所监测的故障报告、标记所保存的故障报告为未恢复、及保存监测到所述故障报告时的时间。
[0077]例如,当所述监测单元12监测到所述故障报告时,确定所监测到的故障报告是否属于历史所保存的标记为未恢复的故障报告,若是,则将所述故障报告交由人工处理,若否,则执行诊断测试方案获取单元13、故障确诊报告生成单元14、故障恢复单元15。
[0078]又如,当所述监测单元12监测到所述故障报告时,确定所监测到的故障报告是否属于历史所保存的标记为未恢复的故障报告,若否,则保存所述故障报告并标记为未恢复,继续执行诊断测试方案获取单元13、故障确诊报告生成单元14、故障恢复单元15 ;若是,则进一步的比较当前所监测到的故障报告与所保存的同样的且标记为未恢复的故障报告的时间间隔是否小于预设时限,若小于,则将所述故障报告交由人工处理,若大于则保存所述故障报告、标记为未恢复并保存当前监测到所述故障报告时的时间,继续执行诊断测试方案获取单元13、故障确诊报告生成单元14、故障恢复单元15。
[0079]其中,所述故障恢复单元15还用于当所述自诊断自恢复系统I在执行了相应的故障自恢复方案后、或在执行了相应的故障自恢复方案后且在预设时限内未出现同样的故障报告时,将所对应的故障报告标记为已恢复。
[0080]实施例六
[0081]与实施例五不同的是,当所述自诊断自恢复系统I保存了所监测的故障报告、标记所保存的故障报告为未恢复、及保存监测到所述故障报告时的时间,则所述监测单元12当监测到所述交换机产生的故障报告与历史所保存的标记为未恢复的故障报告相同时,所述自诊断自恢复系统I确定当前所监测的故障报告的时间与上次所监测的同一故障报告的时间差是否在所述预设时限内,若是,则将所述故障报告交由人工处理,反之,则执行诊断测试方案获取单元13、故障确诊报告生成单元14、故障恢复单元15。
[0082]本案以所监测到的故障报告为telnet服务拒绝故障为例,描述所述自诊断自恢复系统的工作过程:
[0083]当所述监测单元监测到telnet服务拒绝故障的故障报告,先确认所述telnet服务拒绝故障的故障报告是否属于已保存的标记为未恢复的故障报告,若是,则比较当前所监测的故障报告的时间与上次所监测的telnet服务拒绝故障的故障报告的时间差是否在所述预设时限内,若是,则将所述故障报告通过邮件、推送窗口警告、短信等方式通知技术人员,以便技术人员及时处理,若否,则保存所述telnet服务拒绝故障的故障报告并标记该故障报告为未恢复,同时保存当前监测到所述telnet服务拒绝故障的故障报告的时间;
[0084]接着,所述诊断测试方案获取单元从预先保存的故障报告和所对应的故障诊断测试方案的库中获取对应所监测到的telnet服务拒绝故障的故障报告的诊断测试方案,其中,所获取的诊断测试方案包括:检查etc/xinnetd.d目录中的telnet文件;
[0085]所述故障确诊报告生成单元执行所获取的诊断测试方案,得到包含未能在etc/xinnetd.d目录中找到telnet文件的故障诊断报告,贝U所述故障确诊报告生成单元从预保存的故障关键信息的库中提取未能在etc/xinnetd.d目录中找到telnet文件的故障关键信息,并由所述故障恢复单元从预先保存的故障关键信息和所对应的故障自恢复方案的库中,获取该故障关键信息所对应的故障自恢复方案,即将备份中的telnet文件复制到etc/xinnetd.d目录中,并予以执行,则所述故障恢复单元自动恢复了所述交换机的telnet服务拒绝故障;
[0086]所述故障恢复单元还将该故障报告的标记改为已恢复,或者,当所述自诊断自恢复系统从所保存的时间开始的所述预设时限还没有收到所述telnet服务拒绝故障的故障报告,则将该故障报告的标记改为已恢复。
[0087]本案再以所监测到的故障报告为内存故障为例,描述所述自诊断自恢复系统的工作过程:
[0088]当所述监测单元监测到内存故障的故障报告,先确认所述内存故障的故障报告是否属于已保存的标记为未恢复的故障报告,若是,则比较当前所监测的故障报告的时间与上次所监测的内存故障的故障报告的时间差是否在所述预设时限内,若是,则将所述故障报告通过邮件、推送窗口警告、短信等方式通知技术人员,以便技术人员及时处理,若否,则保存所述内存故障的故障报告并标记该故障报告为未恢复,同时保存当前监测到所述内存故障的故障报告的时间;
[0089]接着,所述诊断测试方案获取单元从预先保存的故障报告和所对应的故障诊断测试方案的库中获取对应所监测到的内存故障的故障报告的诊断测试方案,其中,所获取的诊断测试方案包括:令所述交换机切换到硬件自检状态,进行内存自检;
[0090]所述故障确诊报告生成单元执行所获取的诊断测试方案,得到包含内存自检失败错误的故障诊断报告,则所述故障确诊报告生成单元从预保存的故障关键信息的库中提取内存自检失败错误的故障关键信息,并由所述故障恢复单元从预先保存的故障关键信息和所对应的故障自恢复方案的库中,未能获取该故障关键信息所对应的故障自恢复方案,则所述自诊断自恢复系统将所述故障报告通过邮件、推送窗口警告、短信等方式通知技术人员,以便技术人员及时处理;
[0091]当技术人员解决了该故障,手动的将该故障报告的标记改为已恢复,或者,当所述故障确诊报告生成单元从所保存的时间开始的所述预设时限还没有收到所述内存故障的故障报告,则将该故障报告的标记改为已恢复。
[0092]综上所述,本发明的交换机的故障自诊断、自恢复方法及系统,根据故障报告进行自我测试,以诊断故障来源,并进行自我恢复,由此,本发明能够精准的定位故障原因,有效减少在自动恢复后出现同一故障的情况;另外,当在预设时限内多次出现同样的故障报告时,及时通知技术人员,以便尽快修复,以减轻网络上其他交换机的压力;此外,当在预设时限后未出现同样的故障报告,则将故障报告的标记改为已恢复,一方面能够记录本发明自我恢复的历史记录,另一方面还能确保定位故障原因的精准。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。[0093]上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属【技术领域】中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
【权利要求】
1.一种交换机的故障自诊断、自恢复方法,其特征在于,包括: 监测所述交换机运行时产生故障报告; 从预先保存的故障报告和所对应的故障诊断测试方案的库中获取对应所监测到的故障报告的诊断测试方案; 执行所获取的故障诊断测试方案以得到对应所述故障报告的故障确诊报告,并根据预保存的故障关键信息的库提取所述故障确诊报告中所包含的故障关键信息; 从预先保存的故障关键信息和所对应的故障自恢复方案的库中,获取所得到的故障关键信息所对应的故障自恢复方案并予以执行,以使所述交换机的故障自动恢复。
2.根据权利要求1所述的交换机的故障自诊断、自恢复方法,其特征在于,在监测到所述故障报告时,所述方法还包括按照预设规则执行以下任一种或多种的组合:保存所监测的故障报告、标记所保存的故障报告为未恢复、以及保存监测到所述故障报告时的时间。
3.根据权利要求2所述的交换机的故障自诊断、自恢复方法,其特征在于,在监测到所述故障报告时,所述方法还包括:确定所监测到的故障报告是否属于历史所保存的标记为未恢复的故障报告,若是,则将所述故障报告交由人工处理,若否,则从预先保存的故障报告和所对应的故障诊断测试方案的库中获取对应所述故障报告的诊断测试方案。
4.根据权利要求3所述的交换机的故障自诊断、自恢复方法,其特征在于,当监测到所述交换机产生的故障报告与历史所保存的标记为未恢复的故障报告相同时,所述方法还包括:确定当前所监测的故障报告的时间与上次所监测的同一故障报告的时间差是否在所述预设时限内,若是,则将所述故障报告交由人工处理,反之,则从预先保存的故障报告和所对应的故障诊断测试方案的库中获取对应所述故障报告的诊断测试方案。
5.根据权利要求2所述的交换机的故障自诊断、自恢复方法,其特征在于,所述方法还包括:在执行了相应的故障自恢复方案后、或在执行了相`应的故障自恢复方案后且在预设时限内未出现同样的故障报告时,将所对应的故障报告标记为已恢复。
6.根据权利要求1所述的交换机的故障自诊断、自恢复方法,其特征在于,所述故障关键信息包括:文本式的故障关键信息、和/或故障代码;所述故障报告包括以下至少一种:内存自检失败、telnet服务拒绝。
7.一种交换机的故障自诊断、自恢复系统,其特征在于,包括: 存储单元,用于保存包含故障报告和所对应的故障诊断测试方案的库、包含故障关键信息的库、以及包括故障关键信息和所对应的故障自恢复方案的库; 监测单元,用于监测所述交换机运行时产生故障报告; 诊断测试方案获取单元,用于从所述存储单元所提供的故障报告和所对应的故障诊断测试方案的库中获取对应所监测到的故障报告的诊断测试方案; 故障确诊报告生成单元,用于执行所述诊断测试方案获取单元所提供的故障诊断测试方案以得到对应所述故障报告的故障确诊报告,并根据所述存储单元所提供的故障关键信息的库提取所述故障确诊报告中所包含的故障关键信息; 故障恢复单元,用于从所述存储单元所提供的故障关键信息和所对应的故障自恢复方案的库中,获取所述故障确诊报告生成单元所提供的故障关键信息所对应的故障自恢复方案并予以执行,以使所述交换机的故障自动恢复。
8.根据权利要求7所述的交换机的故障自诊断、自恢复系统,其特征在于,所述监测单元在监测到所述故障报告时,还按照预设规则执行以下任一种或多种的组合:保存所监测的故障报告、标记所保存的故障报告为未恢复、以及保存监测到所述故障报告时的时间。
9.根据权利要求8所述的交换机的故障自诊断、自恢复系统,其特征在于,所述监测单元还用于确定所监测到的故障报告是否属于历史所保存的标记为未恢复的故障报告,若是,则将所述故障报告交由人工处理,若否,则从预先保存的故障报告和所对应的故障诊断测试方案的库中获取对应所述故障报告的诊断测试方案。
10.根据权利要求9所述的交换机的故障自诊断、自恢复系统,其特征在于,所述监测单元还用于确定当前所监测的故障报告的时间与上次所监测的同一故障报告的时间差是否在所述预设时限内,若是,则将所述故障报告交由人工处理,反之,则从预先保存的故障报告和所对应的故障诊 断测试方案的库中获取对应所述故障报告的诊断测试方案。
11.根据权利要求8所述的交换机的故障自诊断、自恢复系统,其特征在于,所述故障恢复单元还用于在执行了相应的故障自恢复方案后、或在执行了相应的故障自恢复方案后且在预设时限内未出现同样的故障报告时,将所对应的故障报告标记为已恢复。
12.根据权利要求7所述的交换机的故障自诊断、自恢复系统,其特征在于,所述故障关键信息包括:文本式的故障关键信息、和/或故障代码;所述故障报告包括以下至少一种:内存自检失败、telnet服务拒绝。
【文档编号】H04L12/24GK103701655SQ201410014589
【公开日】2014年4月2日 申请日期:2014年1月13日 优先权日:2014年1月13日
【发明者】阮象华 申请人:加弘科技咨询(上海)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1