网络拓扑的分析处理方法、系统和管理服务器的制作方法

文档序号:7752236阅读:151来源:国知局
专利名称:网络拓扑的分析处理方法、系统和管理服务器的制作方法
技术领域
本发明实施例涉及网络通信技术领域,尤其涉及一种网络拓扑的分析处理方法、 系统和管理服务器。
背景技术
弹性分组环(Resilient Packet Ring ;以下简称RPR)作为一种新型的介质接 入控制(Media Access Control ;以下简称MAC)协议,具有同步数字体系(Synchronous Digital Hierarchy ;以下简称SDH)/同步光网络(Synchronous Optical Network;以下 简称S0NET)环网的保护机制和以太网传输数据报文的有效性。因此,RH 环网具有高可靠 性、稳定性、电信级的快速故障恢复能力,且通常用于相对核心的骨干网络中。相应地,其对 网络维护人员也提出了较高的要求,快速定位并解决可能出现的故障,即时排除网络隐患。 而由于RH 环网的复杂性,网络维护人员需要经过专业的培训才能理解并定位当前网络中 的各种故障原因,这无疑增加了企业的运营成本。在现有技术中,电气电子工程师协会(Institute of Electrical and Electronics Engineers ;以下简称IEEE)组织提出了对应的RPR管理信息库(Management Information Base ;以下简称MIB),用于呈现RH 环网中报文的收发情况、当前的配置情 况以及当前的网络拓扑情况,使得网络维护人员根据RPR MIB中的信息以及自身的经验判 断当前网络可能发生的故障。然而,现有技术中对RH 环网中故障的分析、定位和解决仍依赖于网络维护人员 的自身能力,且无法及时发现并排除一些一闪而逝的故障,从而造成了 RH 环网中的故障 隐患,降低了环网的可维护性和稳定性。

发明内容
本发明实施例提供一种网络拓扑的分析处理方法、系统和管理服务器,用以解决 现有技术中依赖于网络维护人员来分析、定位和解决网络故障的缺陷,实现对网络拓扑事 件的收集和分析,为网络维护人员提供拓扑事件的分析结果,降低对网络维护人员的技术 要求,提高网络的可维护性和稳定性。本发明实施例提供一种网络拓扑的分析处理方法,包括接收环网设备收集的网络中产生的拓扑信息,并将所述拓扑信息写入事件库中;根据所述拓扑信息对网络拓扑状态进行分析,并生成故障事件的处理对策。本发明实施例提供一种管理服务器,包括接收模块,用于接收环网设备收集的网络中产生的拓扑信息;写入模块,用于将所述拓扑信息写入事件库中;分析模块,用于根据所述拓扑信息对网络拓扑状态进行分析,并生成故障事件的 处理对策。本发明实施例提供一种网络拓扑的分析处理系统,包括多个环网设备和上述管理服务器。本发明实施例的网络拓扑的分析处理方法、系统和管理服务器,通过环网设备对 网络中产生的各种拓扑信息进行收集处理,管理服务器接收到由环网设备发送的拓扑信 息,根据该拓扑信息对网络拓扑状态进行分析,并生成故障事件的处理对策,将处理对策反 馈给网管,以使得网管可以根据处理对策对网络中的故障事件进行即时有效的处理,解决 了现有技术中依赖于网络维护人员来分析、定位和解决网络故障的缺陷,实现了对网络拓 扑事件的收集和分析,为网络维护人员提供拓扑事件的分析结果,降低了对网络维护人员 的技术要求,提高了网络的可维护性和稳定性。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发 明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以 根据这些附图获得其他的附图。图1为本发明网络拓扑的分析处理方法实施例一的流程图;图2为本发明网络拓扑的分析处理方法实施例一中RH 环网的结构示意图;图3为本发明网络拓扑的分析处理方法实施例一中RH 环网的工作示例图;图4为本发明网络拓扑的分析处理方法实施例二的流程5为本发明管理服务器实施例一的结构示意图;图6为本发明管理服务器实施例二的结构示意图。
具体实施例方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例 中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是 本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员 在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。图1为本发明网络拓扑的分析处理方法实施例一的流程图,如图1所示,本实施例 提供了一种网络拓扑的分析处理方法,可以具体包括如下步骤步骤101,管理服务器接收环网设备收集的网络中产生的拓扑信息,并将所述拓扑 信息写入事件库中。在本步骤中,环网设备对网络中产生的拓扑信息进行收集处理,包括每次的拓扑 变化事件和拓扑稳定事件,管理服务器从与其相连的多个环网设备接收拓扑信息,并将接 收到的拓扑信息写入管理服务器的事件库中。本实施例的网络拓扑的分析处理方法可以具体应用于RH 环网中,如图2所示为 本发明网络拓扑的分析处理方法实施例一中RH 环网的结构示意图,图中包括6个RH 站 点,g卩S1-S6,相邻的RPR站点间通过RPR接口连接,以形成一个环状网络。其中,每个RPR 接口均包括接收线路与发送线路,则形成如图2所示的可双向传输的RH 环网,即顺时针 或环0、逆时针或环1。其中,局域网(Local Area Network ;以下简称LAN) 1、LAN2、LAN3、 LAN4、LAN5、LAN6分别表示与各RTO站点互联的内部网络,这些网络通过RPR环网建立相互
8之间的通讯。如图3所示为本发明网络拓扑的分析处理方法实施例一中RH 环网的工作示例 图,其中,链路(link)表示RH 站点之间每个方向的连接,线路(span)为RH 环网中相邻两 个站点间的部分,其由一对互为相反方向传输的单向link组成,例如图2中SO与S1之间 的span由SO向SI发送数据的linkO和S1向SO发送数据的linkl组成。每一个RPR站 点均与其他两个RPR站点进行互联,则每个站点对应有两个span,通常将这两个span按照 方位进行区分,即分为west span和east span。如对于图2中的S2而言,S2与SI互联的 span可以称为S2的west span,可以称为SI的east span,S2与S3互联的span可以称为 S2的east span,可以称为S3的west span。边缘(edge)为不能正常传送数据的span,即 处于故障状态的span。在本实施例中,RPR的拓扑发现与保护可能出现以下几种保护请求状态,按其优 先级从高到低的顺序可以为强制倒换(Forced Switch ;以下简称FS)、信号失效(Signal Fail ;以下简称SF)、信号衰弱(Signal Dgrade ;以下简称SD)、人为倒换(Manual Switch ;以下简称MS)、等待恢复(Wait To Restore ;以下简称WTR)和空闲(IDLE)。其 中,FS为用户强制保护请求,即用户强制请求将相应的link断掉而引起的保护请求;SF为 接口信号失效引起的保护请求;SD为接口信号衰弱引起的保护请求;MS也是用户强制保护 请求,其与FS类似,只是优先级较低;WTR为处于WTR期间的保护请求,WTR事件是当发生SF 或SD的线路故障恢复后,RHU办议定义的一种恢复过渡状态,主要目的为防止频繁的SF、SD 恢复事件导致网络拓扑频繁振荡。另外,RH 还提供了一个配置供用户选择是否希望WTR事 件能够自动恢复还是永久保留WTR状态,除非发生了更高优先级的事件将其替代。IDLE为 无保护请求状态。其中FS、SF、SD、MS、WTR等原因可能引起span的edge状态,是本次设计 中重点关注的环节。其中,SF、SD的状态由接收方检测,其绝大多数情况由外部线路故障或 对端故障触发,而除SF、SD之外的其余状态由设备主动通告,其由用户配置或设备内部状 态控制触发。例如,假定图2中在S3与S4互联的两个link中,上面的link称为linkl、下 面的link称为link2。从图中的箭头方向可以看出,linkl对应为S3发送、S4接收,link2 对应为S4发送、S3接收。当linkl的连接断掉时,此时由S4检测到SF状态;同理当link2 的连接断掉时,则S3会检测到SF状态;若两个link同时断掉,则S3、S4同时会检测到SF 状态。步骤102,管理服务器根据所述拓扑信息对网络拓扑状态进行分析,并生成故障事 件的处理对策。管理服务器在接收到新的拓扑信息后,根据从事件库中读取的拓扑信息对网络拓 扑状态进行分析,并根据分析的结果生成故障事件的相应地处理对策,将生成的处理对策 反馈给网管,可以协助网管对网络中出现的故障事件进行实时有效的处理。本实施例提供了一种网络拓扑的分析处理方法,通过环网设备对网络中产生的各 种拓扑信息进行收集处理,管理服务器接收到由环网设备发送的拓扑信息,根据该拓扑信 息对网络拓扑状态进行分析,并生成故障事件的处理对策,将处理对策反馈给网管,以使得 网管可以根据处理对策对网络中的故障事件进行即时有效的处理,解决了现有技术中依赖 于网络维护人员来分析、定位和解决网络故障的缺陷,实现了对网络拓扑事件的收集和分 析,为网络维护人员提供拓扑事件的分析结果,降低了对网络维护人员的技术要求,提高了网络的可维护性和稳定性。图4为本发明网络拓扑的分析处理方法实施例二的流程图,如图4所示,本实施例 提供了一种网络拓扑的分析处理方法,可以包括如下步骤步骤401,环网设备对网络中产生的拓扑信息进行收集处理。在本步骤中,环网设备对网络中产生的拓扑变化事件、拓扑稳定事件等的拓扑信 息进行收集处理。此处的拓扑信息可以包括但不限于本次拓扑发生变化的时间、本次拓扑 稳定的时间、本次拓扑持续稳定的时间、上一次拓扑最终持续稳定的时间、本次拓扑发生变 化的直接原因、本次发生拓扑变化的根源站点的拓扑变化的真实事件、本次发生拓扑变化 的站点和所述站点与网络中其余站点的相对位置,以及当前网络中存在的缺陷指示。其中,本次拓扑发生变化的时间可以依据RH 环网设备的设备启动时间来获得, 即与设备启动时间相对的相对时间,也可以依据当前标准时间来获得,即为绝对时间。本次 拓扑稳定的时间也可以依据RH 环网设备的设备启动时间或当前标准时间来获得,通常, RH 环网的从拓扑变化到拓扑稳定的时间间隔需要再50ms以内。本次拓扑持续稳定的时 间可以根据本次拓扑稳定时间来确定,例如本次拓扑稳定事件发生在2010-5-9 1:00,则在 2010-5-9 18:00查看当前的网络拓扑情况时,该域的值为0天17小时,表示本次拓扑已经 持续稳定了 17个小时。由于只能等到下一次拓扑发生变化时才能获得前次拓扑的最终稳 定时间,则上一次拓扑最终持续稳定的时间可以根据本次拓扑发生变化的时间来获得。本 次拓扑发生变化的直接原因可能为保护配置、SD、SF、FS、MS等,即本次拓扑发生变化可以 表现为发生SD或SF等事件,在本次拓扑发生变化时,RH 环网设备可以根据接收到的RPR 报文来获取其中携带的次拓扑发生变化的直接原因。对于发生拓扑变化的根源站点来说, 即对于第一个检测到故障的故障站点来说,还需要记录拓扑变化的真实事件。例如,触发 SF事件的原因可以为由于线路连接断开、保活超时或者错接环等等。其中,由于每个RPR span互联的两个站点在线路连接正常的情况下,都会主动对外发送保活报文,当一方在设 定的持续时间内未收到保活报文,则认为对端站点失效,进而检测到产生SF事件,则这种 情况的SF事件产生的真实事件为保活超时。而错接环为互联的两个站点之间的两条线路 发生连接错位,例如,图3中S3和S4之间的两个link发生连接错位,即linkl的发送接到 link2的接收,link2的发送接到linkl的接收。环网设备还需记录本次发生拓扑变化的站 点和该站点与网络中其余站点的相对位置,以图2为例,假设S2站点引发了拓扑变化,则在 S1站点上记录的发生拓扑变化的站点为S1站点在环0发送的第一跳对应的站点,即S1站 点在顺时针方向发送的第一跳对应的站点,或者S1站点在环1发送的第五跳对应的站点, 即S1站点在逆时针方向发送的第五跳对应的站点。另外,环网设备还对当前网络中存在的 缺陷指示进行记录,环网设备可以查看当前RH 环网中是否存在缺陷指示,如果存在,则对 该缺陷指示进行记录。步骤402,管理服务器接收环网设备收集的拓扑信息,并将拓扑信息写入事件库 中。本步骤为管理服务器从与其连接的多个环网设备中接收各环网设备收集的拓 扑信息,并将该拓扑信息写入管理服务器的事件库中。在本实施例中站点和管理服务 器之间进行通讯的数据报文可以使用简单网络管理协议(Simple Network Management Protocol ;以下简称SNMP)格式,其中,SNMP报文中携带的负载内容即为上述步骤401中环网设备记录的拓扑信息。本实施例中管理服务器与RH 环网设备之间的通讯方式主要包 括两种,其中一种形式为由RH 环网设备主动向管理服务器通告拓扑信息,这种情况主要 发生在RH 环网的网络状态发生变化的情况下,即可能由于用于的配置发生修改、设备变 更或连接变更等;另外一种形式为管理服务器向环网设备发起查询请求,根据该查询请求 接收环网设备收集的拓扑信息,这种情况发生在由网管主动发起的查询操作的情况。步骤403,管理服务器根据获取的拓扑信息分别对单次拓扑事件的网络拓扑状态 进行分析,并生成单次故障事件的处理对策,所述单次故障事件为出现故障的所述单次拓 扑事件。当管理服务器通过主动查询方式或环网设备主动通告方式接收到环网设备收集 的拓扑信息后,管理服务器将接收到的拓扑信息写入本地的事件库中,同时新的拓扑信息 触发管理服务器的分析进程。在本实施例中,拓扑发生变化的事件分为两类,一类是出现故 障需要进行处理,另一类是故障恢复,无需处理。因此,对于单次拓扑事件来说,需要针对单 次故障事件采用相应地对策,本实施例的单次故障事件为对单次拓扑事件进行分析时故障 出现相关的事件,而对于历史事件来说,则需要进行所有事件的统计分析,本步骤具体为对 单次故障事件的分析处理。在本步骤中,管理服务器在执行分析进程时,通过记录上一次的 事件处理编号,进而识别哪些是新增事件,编号可以采用64bit编码,理论上可以记录2的 64次方条记录,因此不会发生编号回绕问题。在上一次事件处理编号之后的人一个事件均 为新增事件,则管理服务器先读取上次分析处理完的记录编号,从事件库中读取该记录编 号之后的所有记录,然后对每个记录逐一进行单次分析处理。管理服务器在对单次拓扑事件进行分析时,可以根据拓扑信息获取事件的具体类 型,由于拓扑信息中已经记录了哪个站点的哪个span发生故障,因此再通过该span互联的 两个站点对应的设备的记录,便可以定位到具体的发生故障的link。当拓扑信息指示某一 个站点发生信号失效SF事件时,管理服务器可以根据当前拓扑信息中该站点本次的拓扑 事件和该站点相邻站点的事件记录,对本次故障进行分类如下具体地,当根据拓扑信息检测到该站点发生保活失效且未检测到所述站点发生链 路失效时,生成单次故障事件的处理对策为与所述故障站点互联的对端站点对应的设备很 可能出现故障,尤其当该对端站点对应的设备的另外一个span的互联站点也同样检测到 保活超时时。例如,参照图3,S4的westspan检测到保活超时,S2的east span也检测到 保活超时,则基本可以确定S3设备发生了故障,如果S3的两侧都发生保活失效,则可以建 议网管在排除故障之前将S3设置为直通模式以保证环网按闭环的方式运行。当对端站点 对应的设备未出现故障时,监测站点对应的设备是否出现故障,可能由于该站点的保活检 测机制出现了问题,如出现误报的情况。具体地,当根据拓扑信息检测到该站点发生链路失效且与该站点互联的对端站点 发生链路失效时,生成单次故障事件的处理对策为建议网管重点监测该对端站点向该站点 发送数据的链路是否出现故障。例如,参照图3,如果S4的west span的link2检测到SF, 而S3的east span未检测到SF,则建议网管重点关注S4和S3的span中的link2是否发 生了故障。具体地,当根据拓扑信息检测到所述站点和与所述站点互联的对端站点均发生链 路失效时,生成单次故障事件的处理对策为建议网管重点监测所述站点与所述对端站点之间的链路是否出现故障。例如,参照图3,如果S4的west span的link2检测到SF,而S3 的east span也检测到SF,则建议网管重点关注S4和S3的span中的link2和linkl是否 均发生了故障。具体地,当根据拓扑信息检测到所述站点和与所述站点互联的对端站点均发生错 接环时,生成单次故障事件的处理对策为修订所述站点与所述对端站点之间线路的错接 环。当拓扑信息指示某一个站点发生信号衰弱SD事件时,管理服务器可以根据当前 拓扑信息中该站点本次的拓扑事件和该站点相邻站点的事件记录,对本次故障进行分类如 下具体地,当根据拓扑信息检测到所述站点发生线路信号衰弱且与所述站点互联的 对端站点未检测到发生线路信号衰弱时,生成单次故障事件的处理对策为统计所述站点从 所述对端站点接收到的错误报文的数量。当所述错误报文的数量与预设的错误报文门限值 之差小于预设的错误容忍量时,提高所述错误报文门限值,当所述错误报文的数量与预设 的错误报文门限值之差大于预设的错误容忍量时,对所述对端站点向所述站点发送数据的 链路进行更换处理,其中,所述错误容忍量为网管根据应用情况而设定的,即不同的应用情 况下网管的错误容忍量不同。例如,参照图3,如果S4的west span的link2检测到SD,而 S3的east span未检测到SD,则建议网管重点关注S4和S3 span中的link2线路。由于 SD的告警表示这段link的信号质量存在问题,但是有可能还能通讯,因此进一步建议网管 观察S4的west span接收的数据统计中是否存在较多的错误报文,如果错误报文的数量与 预设的错误报文门限值之差小于预设的错误容忍量,即表明错误报文的数量在可容忍的范 围内,此处的错误容忍量与当前的网络应用相关,需要网管根据实际情况进行预设,则建议 网管提高错误报文门限值,即降低SD检测的门限,然后判断是否能排除该SD故障。如果错 误报文的数量与预设的错误报文门限值之差大于预设的错误容忍量,即表明错误报文的数 量太多而无法忍受,则建议网管对该link进行更换。其中,所述错误容忍量为网管根据应 用情况而设定的,即不同的应用情况下网管的错误容忍量不同。具体地,当根据拓扑信息检测到所述站点和所述站点互联的对端站点均发生线路 信号衰弱时,生成单次故障事件的处理对策为统计所述站点从所述对端站点接收到的错误 报文的数量以及所述对端站点从所述站点接收到的错误报文的数量;当所述对端站点向所 述站点发送的错误报文的数量与预设的第一错误报文门限值之差小于预设的错误容忍量 时,提高所述第一错误报文门限值之差,当所述对端站点向所述站点发送的错误报文的数 量与预设的第一错误报文门限值之差大于预设的错误容忍量时,对所述对端站点向所述站 点发送数据的链路进行更换处理;当所述站点向所述对端站点发送的错误报文的数量与预 设的第二错误报文门限值之差小于预设的错误容忍量时,提高所述第二错误报文门限值, 当所述站点向所述对端站点发送的错误报文的数量与预设的第二错误报文门限值之差大 于预设的错误容忍量时,对所述站点向所述对端站点发送数据的链路进行更换处理。例如, 参照图3,如果S4的west span的link2检测到SD, S3的east span也检测到SD,则建议 网管重点关注S4和S3 span中的link2和linkl线路。并进一步建议网管观察S4的west span接收的数据统计中是否存在较多的错误报文,如果错误报文的数量小于预设的错误容 忍量,即表明错误报文的数量在可容忍的范围内,此处的错误容忍量与当前的网络应用相关,需要网管根据实际情况进行预设,则建议网管降低SD检测门限,即提高错误容忍量,然 后判断是否能排除该SD故障。如果错误报文的数量大于预设的错误容忍量,即表明错误报 文的数量太多而无法忍受,则建议网管对相应的link进行更换。当拓扑信息指示某一个站点发生强制倒换FS或人为倒换MS事件时,管理服务器 可以根据当前拓扑信息中该站点本次的拓扑事件和该站点相邻站点的事件记录,对本次故 障的处理对策如下根据拓扑信息获取所述站点中发生FS或MS事件的线路,生成单次故障 事件的处理对策为向网管反馈发生FS或MS事件的站点中的线路。即由于FS或MS事件只 有通过用户配置产生,因此此时只需通知网管某个站点的某个span发生了 FS或MS事件, 请确认是否为期望的结果即可。当拓扑信息指示某一个站点发生等待恢复WTR事件时,管理服务器可以根据当前 拓扑信息中该站点本次的拓扑事件和该站点相邻站点的事件记录,对本次故障的处理对策 如下管理服务器先根据拓扑信息获取所述站点对应的设备的WTR配置信息,由于WTR是一 个临时状态,SF/SD故障恢复后先进入WTR状态,此时span依然处于edge状态,无法收发 数据,当经过一段时间(默认是10秒,最长1440秒)未发生其它高优先级的保护事件后, 如果用户配置了 WTR允许恢复,则WTR将恢复成IDLE状态,此时edge状态被排除,通讯正 常。当所述WTR配置信息为WTR不可恢复时,则只需向网管反馈该WTR配置信息,通知网管 判断该配置是否为期望的结果。当所述WTR配置信息为WTR可恢复,且在WTR恢复时间超 过预设的可恢复时间的两倍后所述站点对应的设备仍保持WTR状态时,生成单次故障事件 的处理对策为所述设备的软件出现异常。进一步地,在保留故障内容以便与设备厂商交流 外,还可以通过在故障span上进行MS配置、解除MS配置的操作以解决该问题。当拓扑信息指示某一个站点发生配置改变事件时,管理服务器可以根据当前拓扑 信息中该站点本次的拓扑事件和该站点相邻站点的事件记录,对本次故障的处理对策如 下根据拓扑信息获取所述站点的配置改变信息,生成单次故障事件的处理对策为向网管 提示所述站点的配置改变信息。即向网管给出提示信息,表明哪些站点的哪些配置引发了 本次拓扑变化事件,由网管来判断该事件的合理性。步骤404,管理服务器根据预设的关联历史记录条数从所述事件库中读取对应数 量的所述单次拓扑事件对应的最新历史记录事件。当一个单次拓扑事件分析完成之后,管理服务器根据预设的关联历史记录条数从 事件库中读取对应数量的该单次拓扑事件对应的最新历史记录事件,此处的关联历史记录 条数可以由网管根据需要来设定,如设定为5,则管理服务器从事件库中读取5条最新历史 记录事件,即该单次拓扑事件的记录编号之前的5条最新历史记录事件。本实施例对历史 事件的分析与之前单次拓扑事件的分析的最大区别在于,普通的单次线路发生SF事件,例 如因施工原因将光纤挖断,则没有人工的干预来替换新的光纤,因此SF事件无法恢复。而 大多接触不良引起线路SF后会在极短的时间内自动恢复,因此仅查看当前拓扑状态很难 察觉到该故障,需要对多个历史记录事件进行分析。管理服务器判断读取的最新历史记录事件的记录编号是否连续,如果是,则使用 这些最新历史记录事件启动历史数据分析进程;否则直接使用当前连续的最新历史记录事 件启动历史数据分析进程。由于网管可以对事件库中的历史数据进行查询或删除等操作, 则可能造成历史数据丢失,导致历史数据的前后关联丢失,即出现记录编号不连续的情况,
13则本实施例仅对连续编号的历史事件进行分析,一旦发现编号不连续,则仅分析道编号断 点对应的历史事件为止。如果最终发现连续的历史事件仅为一条,则按照上述步骤403的 单次拓扑事件的分析方法进行分析。步骤405,管理服务器根据读取的所述最新历史记录事件对历史事件的网络拓扑 状态进行分析,并生成历史事件的处理对策。管理服务器在对历史事件进行分析时,可以根据拓扑信息获取历史记录事件的统 计情况,根据历史记录事件的统计情况来进行分析处理。当最新历史记录事件指指示一个 站点发生SF/SF恢复事件的连续次数超过预设的第一次数阈值,或指示一个站点发生SF/ SF恢复事件的次数超过预设的第二次数阈值时,此处的第一次数阈值和第二次数阈值可以 具体由网管根据实际情况进行设定,如分别设定为3和5,即管理服务器根据获取的历史数 据获知某个站点连续3次或以上发生SF/SF恢复(从WTR到IDLE)事件,典型地为某个站点 连续多次发生SF/SF恢复事件,且每次拓扑稳定持续的时间均比较短,如在一个小时以内, 或获知某个站点曾经至少发生或5次或以上的SF/SF恢复事件。此时,管理服务器可以对 本次故障进行分类如下具体地,当根据所述最新历史记录事件检测到所述SF由所述站点的链路无效引 起时,生成历史事件的处理对策为所述站点对应的线路互联的光纤线或光模块出现异常。 最常见的情况是触发多次SF的均为链路发生SF事件引起的,根据单次故障分析中可以知 道,SF还分单个link发生SF事件和两个link同时发生SF事件。则管理服务器可以向网 管给出告警通知网管有可能该故障span互联的光纤线接触不良或光模块异常,需要更换 光纤线或光模块。进一步地,如果故障仍未能排除,则很可能是设备引发的故障,建议网管 需要通知厂商维修并提供历史记录供厂商人员查询。具体地,当根据所述最新历史记录事件检测到所述SF由所述站点的保活失效引 起时,生成历史事件的处理对策为按照预设的执行概率执行以下对策,此处的执行概率可 以由管理服务器自行设定,较优地为以下述排列顺序作为执行概率的高低,即排在前面的 优先执行,如果之前的对策未排除故障,则继续执行后续的对策。建议网管按照执行概率执 行以下对策由于双方的保护机制不兼容,则建议网管将一直检测到保活失效的站点的保 活失效时间设置为最长保活失效时间;如果上一个对策不能解决问题,则建议网管将所述 站点对应的线路互联的光纤线、光模块或与所述站点互联的对端站点的光模块进行更换处 理;如果上一个对策不能解决问题,则建议网管对所述对端站点对应的设备的运行情况和 联通性进行监测处理,并在观察到故障的情况下及时联系厂商进行维修并提供对应的历史 记录和观察结果。当最新历史记录事件指指示一个站点的两个线路的对端站点交替地发生SF事件 或保活失效事件时,如图3中S3的两侧相邻站点S2和S4连续检测到SF或保活失效事件, 管理服务器可以根据读取的最新历史记录事件生成历史事件的处理对策为按照预设的执 行概率执行以下对策,此处的执行概率的解释与上述类似,此处不再赘述管理服务器建议 网管对所述站点对应的设备的运行情况和联通性进行监测处理,在观察到故障的情况下及 时联系厂商进行维修并提供对应的历史记录和观察结果;如果上一条对策不能解决问题, 则管理服务器建议网管对所述站点的两个线路互联的光纤线和光模块进行更换处理。当最新历史记录事件指示一个站点发生FS/MS事件和FS解除事件的次数超过预设的第三次数阈值时,管理服务器可以根据读取的最新历史记录事件生成历史事件的处理 对策为检测测试过程中使用的用户配置脚本是否未关闭。即向网管给出告警并通知网管可 能存在某些测试过程使用的用户配置脚本忘记关闭,在不停的进行FS/MS然后删除FS/MS 配置,需要网管检查对应的控制终端的行为。本实施例提供了一种网络拓扑的分析处理方法,通过环网设备对网络中产生的各 种拓扑信息进行收集处理,管理服务器接收到由环网设备发送的拓扑信息,根据该拓扑信 息对网络拓扑状态进行分析,并生成故障事件的处理对策,将处理对策反馈给网管,以使得 网管可以根据处理对策对网络中的故障事件进行即时有效的处理,解决了现有技术中依赖 于网络维护人员来分析、定位和解决网络故障的缺陷,实现了对网络拓扑事件的收集和分 析,为网络维护人员提供拓扑事件的分析结果,有利于网管更好地维护网络设备并及时地 分析解决故障,降低了对网络维护人员的技术要求,提高了网络的可维护性和稳定性。本领域普通技术人员可以理解实现上述方法实施例的全部或部分步骤可以通过 程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序 在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括R0M、RAM、磁碟或者 光盘等各种可以存储程序代码的介质。图5为本发明管理服务器实施例一的结构示意图,如图5所示,本实施例提供了一 种管理服务器,可以具体执行上述方法实施例一的各个步骤,此处不再赘述。本实施例提供 的管理服务器可以具体包括接收模块501、写入模块502和分析模块503。其中,接收模块 501用于接收环网设备收集的网络中产生的拓扑信息。写入模块502用于将所述拓扑信息 写入事件库中。分析模块503用于根据所述拓扑信息对网络拓扑状态进行分析,并生成故 障事件的处理对策。图6为本发明管理服务器实施例二的结构示意图,如图6所示,本实施例提供了 一 种管理服务器,可以具体执行上述方法实施例二的各个步骤,此处不再赘述。本实施例提供 的管理服务器在上述图5所示的基础之上,分析模块503可以具体包括第一分析单元513、 读取单元523和第二分析单元533。其中,第一分析单元513用于根据获取的拓扑信息分别 对单次拓扑事件的网络拓扑状态进行分析,并生成单次故障事件的处理对策,所述单次故 障事件为出现故障的所述单次拓扑事件。读取单元523用于根据预设的关联历史记录条数 从所述事件库中读取对应数量的所述单次拓扑事件对应的最新历史记录事件。第二分析单 元533用于根据读取的所述最新历史记录事件对历史事件的网络拓扑状态进行分析,并生 成历史事件的处理对策。进一步地,当所述拓扑信息指示一个站点发生信号失效SF事件时,第一分析单元 513可以具体包括第一对策生成子单元5131、第二对策生成子单元5132、第三对策生成子 单元5133和第四对策生成子单元5134。其中,第一对策生成子单元5131用于当根据拓扑 信息检测到所述站点发生保活失效且未检测到所述站点发生链路失效时,生成单次故障事 件的处理对策为监测与所述站点互联的对端站点对应的设备是否出现故障,且当所述对端 站点对应的设备未出现故障时,监测所述站点对应的设备是否出现故障。第二对策生成子 单元5132用于当根据拓扑信息检测到所述站点发生链路失效且与所述站点互联的对端站 点发生链路失效时,生成单次故障事件的处理对策为监测所述对端站点向所述站点发送数 据的链路是否出现故障。第三对策生成子单元5133用于当根据拓扑信息检测到所述站点
15和与所述站点互联的对端站点均发生链路失效时,生成单次故障事件的处理对策为监测所 述站点与所述对端站点之间的链路是否出现故障。第四对策生成子单元5134用于当根据 拓扑信息检测到所述站点和与所述站点互联的对端站点均发生错接环时,生成单次故障事 件的处理对策为修订所述站点与所述对端站点之间线路的错接环。或者,当所述拓扑信息指示一个站点发生信号衰弱SD事件时,第一分析单元513 可以具体包括第五对策生成子单元5135和第六对策生成子单元5136。其中,第五对策生 成子单元5135用于当根据拓扑信息检测到所述站点发生线路信号衰弱且与所述站点互联 的对端站点未检测到发生线路信号衰弱时,生成单次故障事件的处理对策为统计所述站点 从所述对端站点接收到的错误报文的数量;当所述错误报文的数量与预设的错误报文门限 值之差小于预设的错误容忍量时,提高所述错误报文门限值,当所述错误报文的数量与预 设的错误报文门限值之差大于预设的错误容忍量时,对所述对端站点向所述站点发送数据 的链路进行更换处理,其中,所述错误容忍量为根据应用情况而设定的。第六对策生成子单 元5136用于当根据拓扑信息检测到所述站点和所述站点互联的对端站点均发生线路信号 衰弱时,生成单次故障事件的处理对策为统计所述站点从所述对端站点接收到的错误报文 的数量以及所述对端站点从所述站点接收到的错误报文的数量;当所述对端站点向所述站 点发送的错误报文的数量与预设的第一错误报文门限值之差小于预设的错误容忍量时,提 高所述第一错误报文门限值,当所述对端站点向所述站点发送的错误报文的数量与预设的 第一错误报文门限值之差大于预设的错误容忍量时,对所述对端站点向所述站点发送数据 的链路进行更换处理;当所述站点向所述对端站点发送的错误报文的数量与预设的第二错 误报文门限值之差小于预设的错误容忍量时,提高所述第二错误报文门限值,当所述站点 向所述对端站点发送的错误报文的数量与预设的第二错误报文门限值之差大于预设的错 误容忍量时,对所述站点向所述对端站点发送数据的链路进行更换处理,其中,所述错误容 忍量为根据应用情况而设定的。或者,当所述拓扑信息指示一个站点发生强制倒换FS或人为倒换MS事件时,第一 分析单元513可以具体包括第七对策生成子单元5137,第七对策生成子单元5137用于根据 拓扑信息获取所述站点中发生FS或MS事件的线路,生成单次故障事件的处理对策为向网 管反馈发生FS或MS事件的站点中的线路。或者,当所述拓扑信息指示一个站点发生等待恢复WTR事件时,第一分析单元513 可以具体包括获取子单元5138、第八对策生成子单元5139和第九对策生成子单元5231。其 中,获取子单元5138用于根据拓扑信息获取所述站点对应的设备的WTR配置信息。第八对 策生成子单元5139用于当所述WTR配置信息为WTR不可恢复时,生成单次故障事件的处理 对策为向网管反馈所述WTR配置信息。第九对策生成子单元5231用于当所述WTR配置信 息为WTR可恢复,且在WTR恢复时间超过预设的可恢复时间的两倍后所述站点对应的设备 仍保持WTR状态时,生成单次故障事件的处理对策为所述设备的软件出现异常。或者,当所述拓扑信息指示一个站点发生配置改变事件时,第一分析单元513可 以具体包括第十对策生成子单元5232,第十对策生成子单元5232用于根据拓扑信息获取 所述站点的配置改变信息,生成单次故障事件的处理对策为向网管提示所述站点的配置改 变{曰息。更进一步地,当所述最新历史记录事件指示一个站点发生SF/SF恢复事件的连续次数超过预设的第一次数阈值,或指示一个站点发生SF/SF恢复事件的次数超过预设的第 二次数阈值时,第二分析单元533可以具体包括第一历史对策生成子单元5331和第二历史 对策生成子单元5332。其中,第一历史对策生成子单元5331用于当根据所述最新历史记录 事件检测到所述SF由所述站点的链路无效引起时,生成历史事件的处理对策为所述站点 对应的线路互联的光纤线或光模块出现异常。第二历史对策生成子单元5332用于当根据 所述最新历史记录事件检测到所述SF由所述站点的保活失效引起时,生成历史事件的处 理对策为按照预设的执行概率执行以下对策将所述站点的保活失效时间设置为最长保活 失效时间;将所述站点对应的线路互联的光纤线、光模块或与所述站点互联的对端站点的 光模块进行更换处理;对所述对端站点对应的设备的运行情况和联通性进行监测处理。或者,当所述最新历史记录事件指示一个站点的两个线路的对端站点交替地发 生SF事件或保活失效事件时,第二分析单元533可以具体包括第三历史对策生成子单元 5333,第三历史对策生成子单元5333用于根据读取的最新历史记录事件生成历史事件的 处理对策为按照预设的执行概率执行以下对策对所述站点对应的设备的运行情况和联通 性进行监测处理;对所述站点的两个线路互联的光纤线和光模块进行更换处理。或者,当所述最新历史记录事件指示一个站点发生FS/MS事件和FS解除事件的次 数超过预设的第三次数阈值时,第二分析单元533可以具体包括第四历史对策生成子单元 5334,第四历史对策生成子单元5334用于根据读取的最新历史记录事件生成历史事件的 处理对策为检测测试过程中使用的用户配置脚本是否未关闭。本实施例提供了一种管理服务器,通过环网设备对网络中产生的各种拓扑信息进 行收集处理,管理服务器接收到由环网设备发送的拓扑信息,根据该拓扑信息对网络拓扑 状态进行分析,并生成故障事件的处理对策,将处理对策反馈给网管,以使得网管可以根据 处理对策对网络中的故障事件进行即时有效的处理,解决了现有技术中依赖于网络维护人 员来分析、定位和解决网络故障的缺陷,实现了对网络拓扑事件的收集和分析,为网络维护 人员提供拓扑事件的分析结果,有利于网管更好地维护网络设备并及时地分析解决故障, 降低了对网络维护人员的技术要求,提高了网络的可维护性和稳定性。本实施例还提供了一种网络拓扑的分析处理系统,具体可以包括多个环网设备和 上述图5或图6所示的管理服务器。最后应说明的是以上实施例仅用以说明本发明的技术方案,而非对其限制;尽 管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解其依然 可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替 换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精 神和范围。
1权利要求
一种网络拓扑的分析处理方法,其特征在于,包括接收环网设备收集的网络中产生的拓扑信息,并将所述拓扑信息写入事件库中;根据所述拓扑信息对网络拓扑状态进行分析,并生成故障事件的处理对策。
2.根据权利要求1所述的方法,其特征在于,所述拓扑信息包括本次拓扑发生变化的 时间、本次拓扑稳定的时间、本次拓扑持续稳定的时间、上一次拓扑最终持续稳定的时间、 本次拓扑发生变化的直接原因、本次发生拓扑变化的根源站点的拓扑变化的真实事件、本 次发生拓扑变化的站点和所述站点与网络中其余站点的相对位置,以及当前网络中存在的 缺陷指示。
3.根据权利要求1所述的方法,其特征在于,所述根据所述拓扑信息对网络拓扑状态 进行分析,并生成故障事件的处理对策包括根据获取的拓扑信息分别对单次拓扑事件的网络拓扑状态进行分析,并生成单次故障 事件的处理对策,所述单次故障事件为出现故障的所述单次拓扑事件;根据预设的关联历史记录条数从所述事件库中读取对应数量的所述单次拓扑事件对 应的最新历史记录事件;根据读取的所述最新历史记录事件对历史事件的网络拓扑状态进行分析,并生成历史 事件的处理对策。
4.根据权利要求3所述的方法,其特征在于,当所述拓扑信息指示一个站点发生信号 失效SF事件时,所述根据获取的拓扑信息分别对单次拓扑事件的网络拓扑状态进行分析, 并生成单次故障事件的处理对策包括当根据拓扑信息检测到所述站点发生保活失效且未检测到所述站点发生链路失效 时,生成单次故障事件的处理对策为监测与所述站点互联的对端站点对应的设备是否出现 故障,且当所述对端站点对应的设备未出现故障时,监测所述站点对应的设备是否出现故 障;当根据拓扑信息检测到所述站点发生链路失效且与所述站点互联的对端站点发生链 路失效时,生成单次故障事件的处理对策为监测所述对端站点向所述站点发送数据的链路 是否出现故障;当根据拓扑信息检测到所述站点和与所述站点互联的对端站点均发生链路失效时,生 成单次故障事件的处理对策为监测所述站点与所述对端站点之间的链路是否出现故障;当根据拓扑信息检测到所述站点和与所述站点互联的对端站点均发生错接环时,生成 单次故障事件的处理对策为修订所述站点与所述对端站点之间线路的错接环。
5.根据权利要求3所述的方法,其特征在于,当所述拓扑信息指示一个站点发生信号 衰弱SD事件时,所述根据获取的拓扑信息分别对单次拓扑事件的网络拓扑状态进行分析, 并生成单次故障事件的处理对策包括当根据拓扑信息检测到所述站点发生线路信号衰弱且与所述站点互联的对端站点未 检测到发生线路信号衰弱时,生成单次故障事件的处理对策为统计所述站点从所述对端站 点接收到的错误报文的数量;当所述错误报文的数量与预设的错误报文门限值之差小于预 设的错误容忍量时,提高所述错误报文门限值,当所述错误报文的数量与预设的错误报文 门限值之差大于预设的错误容忍量时,对所述对端站点向所述站点发送数据的链路进行更 换处理,其中,所述错误容忍量为根据应用情况而设定的;当根据拓扑信息检测到所述站点和所述站点互联的对端站点均发生线路信号衰弱时, 生成单次故障事件的处理对策为统计所述站点从所述对端站点接收到的错误报文的数量 以及所述对端站点从所述站点接收到的错误报文的数量;当所述对端站点向所述站点发送 的错误报文的数量与预设的第一错误报文门限值之差小于预设的错误容忍量时,提高所述 第一错误报文门限值,当所述对端站点向所述站点发送的错误报文的数量与预设的第一错 误报文门限值之差大于预设的错误容忍量时,对所述对端站点向所述站点发送数据的链路 进行更换处理;当所述站点向所述对端站点发送的错误报文的数量与预设的第二错误报文 门限值之差小于预设的错误容忍量时,提高所述第二错误报文门限值,当所述站点向所述 对端站点发送的错误报文的数量与预设的第二错误报文门限值之差大于预设的错误容忍 量时,对所述站点向所述对端站点发送数据的链路进行更换处理,其中,所述错误容忍量为 根据应用情况而设定的。
6.根据权利要求3所述的方法,其特征在于,当所述拓扑信息指示一个站点发生强制 倒换FS或人为倒换MS事件时,所述根据获取的拓扑信息分别对单次拓扑事件的网络拓扑 状态进行分析,并生成单次故障事件的处理对策包括根据拓扑信息获取所述站点中发生FS或MS事件的线路,生成单次故障事件的处理对 策为向网管反馈发生FS或MS事件的站点中的线路。
7.根据权利要求3所述的方法,其特征在于,当所述拓扑信息指示一个站点发生等待 恢复WTR事件时,所述根据获取的拓扑信息分别对单次拓扑事件的网络拓扑状态进行分 析,并生成单次故障事件的处理对策包括根据拓扑信息获取所述站点对应的设备的WTR配置信息;当所述WTR配置信息为WTR不可恢复时,生成单次故障事件的处理对策为向网管反馈 所述WTR配置信息;当所述WTR配置信息为WTR可恢复,且在WTR恢复时间超过预设的可恢复时间的两倍 后所述站点对应的设备仍保持WTR状态时,生成单次故障事件的处理对策为所述设备的软 件出现异常。
8.根据权利要求3所述的方法,其特征在于,当所述拓扑信息指示一个站点发生配置 改变事件时,所述根据获取的拓扑信息分别对单次拓扑事件的网络拓扑状态进行分析,并 生成单次故障事件的处理对策包括根据拓扑信息获取所述站点的配置改变信息,生成单次故障事件的处理对策为向网管 提示所述站点的配置改变信息。
9.根据权利要求3-8中任一项所述的方法,其特征在于,当所述最新历史记录事件指 示一个站点发生SF/SF恢复事件的连续次数超过预设的第一次数阈值,或指示一个站点发 生SF/SF恢复事件的次数超过预设的第二次数阈值时,所述根据读取的所述最新历史记录 事件对历史事件的网络拓扑状态进行分析,并生成历史事件的处理对策包括当根据所述最新历史记录事件检测到所述SF由所述站点的链路无效引起时,生成历 史事件的处理对策为所述站点对应的线路互联的光纤线或光模块出现异常;当根据所述最新历史记录事件检测到所述SF由所述站点的保活失效引起时,生成历 史事件的处理对策为按照预设的执行概率执行以下对策将所述站点的保活失效时间设置 为最长保活失效时间;将所述站点对应的线路互联的光纤线、光模块或与所述站点互联的对端站点的光模块进行更换处理;对所述对端站点对应的设备的运行情况和联通性进行监 测处理。
10.根据权利要求3-8中任一项所述的方法,其特征在于,当所述最新历史记录事件指 示一个站点的两个线路的对端站点交替地发生SF事件或保活失效事件时,所述根据读取 的所述最新历史记录事件对历史事件的网络拓扑状态进行分析,并生成历史事件的处理对 策包括根据读取的最新历史记录事件生成历史事件的处理对策为按照预设的执行概率执行 以下对策对所述站点对应的设备的运行情况和联通性进行监测处理;对所述站点的两个 线路互联的光纤线和光模块进行更换处理。
11.根据权利要求3-8中任一项所述的方法,其特征在于,当所述最新历史记录事件指 示一个站点发生FS/MS事件和FS解除事件的次数超过预设的第三次数阈值时,所述根据读 取的所述最新历史记录事件对历史事件的网络拓扑状态进行分析,并生成历史事件的处理 对策包括根据读取的最新历史记录事件生成历史事件的处理对策为检测测试过程中使用的用 户配置脚本是否未关闭。
12.—种管理服务器,其特征在于,包括接收模块,用于接收环网设备收集的网络中产生的拓扑信息;写入模块,用于将所述拓扑信息写入事件库中;分析模块,用于根据所述拓扑信息对网络拓扑状态进行分析,并生成故障事件的处理 对策。
13.根据权利要求12所述的管理服务器,其特征在于,所述分析模块包括第一分析单元,用于根据获取的拓扑信息分别对单次拓扑事件的网络拓扑状态进行 分析,并生成单次故障事件的处理对策,所述单次故障事件为出现故障的所述单次拓扑事 件;读取单元,用于根据预设的关联历史记录条数从所述事件库中读取对应数量的所述单 次拓扑事件对应的最新历史记录事件;第二分析单元,用于根据读取的所述最新历史记录事件对历史事件的网络拓扑状态进 行分析,并生成历史事件的处理对策。
14.根据权利要求13所述的管理服务器,其特征在于,当所述拓扑信息指示一个站点 发生信号失效SF事件时,所述第一分析单元包括第一对策生成子单元,用于当根据拓扑信息检测到所述站点发生保活失效且未检测到 所述站点发生链路失效时,生成单次故障事件的处理对策为监测与所述站点互联的对端站 点对应的设备是否出现故障,且当所述对端站点对应的设备未出现故障时,监测所述站点 对应的设备是否出现故障;第二对策生成子单元,用于当根据拓扑信息检测到所述站点发生链路失效且与所述站 点互联的对端站点发生链路失效时,生成单次故障事件的处理对策为监测所述对端站点向 所述站点发送数据的链路是否出现故障;第三对策生成子单元,用于当根据拓扑信息检测到所述站点和与所述站点互联的对端 站点均发生链路失效时,生成单次故障事件的处理对策为监测所述站点与所述对端站点之间的链路是否出现故障;第四对策生成子单元,用于当根据拓扑信息检测到所述站点和与所述站点互联的对端 站点均发生错接环时,生成单次故障事件的处理对策为修订所述站点与所述对端站点之间 线路的错接环。
15.根据权利要求13所述的管理服务器,其特征在于,当所述拓扑信息指示一个站点 发生信号衰弱SD事件时,所述第一分析单元包括第五对策生成子单元,用于当根据拓扑信息检测到所述站点发生线路信号衰弱且与所 述站点互联的对端站点未检测到发生线路信号衰弱时,生成单次故障事件的处理对策为统 计所述站点从所述对端站点接收到的错误报文的数量;当所述错误报文的数量与预设的错 误报文门限值之差小于预设的错误容忍量时,提高所述错误报文门限值,当所述错误报文 的数量与预设的错误报文门限值之差大于预设的错误容忍量时,对所述对端站点向所述站 点发送数据的链路进行更换处理,其中,所述错误容忍量为根据应用情况而设定的;第六对策生成子单元,用于当根据拓扑信息检测到所述站点和所述站点互联的对端站 点均发生线路信号衰弱时,生成单次故障事件的处理对策为统计所述站点从所述对端站点 接收到的错误报文的数量以及所述对端站点从所述站点接收到的错误报文的数量;当所述 对端站点向所述站点发送的错误报文的数量与预设的第一错误报文门限值之差小于预设 的错误容忍量时,提高所述第一错误报文门限值,当所述对端站点向所述站点发送的错误 报文的数量与预设的第一错误报文门限值之差大于预设的错误容忍量时,对所述对端站点 向所述站点发送数据的链路进行更换处理;当所述站点向所述对端站点发送的错误报文 的数量与预设的第二错误报文门限值之差小于预设的错误容忍量时,提高所述第二错误报 文门限值,当所述站点向所述对端站点发送的错误报文的数量与预设的第二错误报文门限 值之差大于预设的错误容忍量时,对所述站点向所述对端站点发送数据的链路进行更换处 理,其中,所述错误容忍量为根据应用情况而设定的。
16.根据权利要求13所述的管理服务器,其特征在于,当所述拓扑信息指示一个站点 发生强制倒换FS或人为倒换MS事件时,所述第一分析单元包括第七对策生成子单元,用于根据拓扑信息获取所述站点中发生FS或MS事件的线路,生 成单次故障事件的处理对策为向网管反馈发生FS或MS事件的站点中的线路。
17.根据权利要求13所述的管理服务器,其特征在于,当所述拓扑信息指示一个站点 发生等待恢复WTR事件时,所述第一分析单元包括获取子单元,用于根据拓扑信息获取所述站点对应的设备的WTR配置信息;第八对策生成子单元,用于当所述WTR配置信息为WTR不可恢复时,生成单次故障事件 的处理对策为向网管反馈所述WTR配置信息;第九对策生成子单元,用于当所述WTR配置信息为WTR可恢复,且在WTR恢复时间超过 预设的可恢复时间的两倍后所述站点对应的设备仍保持WTR状态时,生成单次故障事件的 处理对策为所述设备的软件出现异常。
18.根据权利要求13所述的管理服务器,其特征在于,当所述拓扑信息指示一个站点 发生配置改变事件时,所述第一分析单元包括第十对策生成子单元,用于根据拓扑信息获取所述站点的配置改变信息,生成单次故 障事件的处理对策为向网管提示所述站点的配置改变信息。
19.根据权利要求13-18中任一项所述的管理服务器,其特征在于,当所述最新历史记 录事件指示一个站点发生SF/SF恢复事件的连续次数超过预设的第一次数阈值,或指示一 个站点发生SF/SF恢复事件的次数超过预设的第二次数阈值时,所述第二分析单元包括第一历史对策生成子单元,用于当根据所述最新历史记录事件检测到所述SF由所述 站点的链路无效引起时,生成历史事件的处理对策为所述站点对应的线路互联的光纤线或 光模块出现异常;第二历史对策生成子单元,用于当根据所述最新历史记录事件检测到所述SF由所述 站点的保活失效引起时,生成历史事件的处理对策为按照预设的执行概率执行以下对策 将所述站点的保活失效时间设置为最长保活失效时间;将所述站点对应的线路互联的光纤 线、光模块或与所述站点互联的对端站点的光模块进行更换处理;对所述对端站点对应的 设备的运行情况和联通性进行监测处理。
20.根据权利要求13-18中任一项所述的管理服务器,其特征在于,当所述最新历史记 录事件指示一个站点的两个线路的对端站点交替地发生SF事件或保活失效事件时,所述 第二分析单元包括第三历史对策生成子单元,用于根据读取的最新历史记录事件生成历史事件的处理对 策为按照预设的执行概率执行以下对策对所述站点对应的设备的运行情况和联通性进行 监测处理;对所述站点的两个线路互联的光纤线和光模块进行更换处理。
21.根据权利要求13-18中任一项所述的管理服务器,其特征在于,当所述最新历史记 录事件指示一个站点发生FS/MS事件和FS解除事件的次数超过预设的第三次数阈值时,所 述第二分析单元包括第四历史对策生成子单元,用于根据读取的最新历史记录事件生成历史事件的处理对 策为检测测试过程中使用的用户配置脚本是否未关闭。
22.—种网络拓扑的分析处理系统,其特征在于,包括多个环网设备和根据权利要求 12-21中任一项所述的管理服务器。
全文摘要
本发明提供一种网络拓扑的分析处理方法、系统和管理服务器,其中,方法包括接收环网设备收集的网络中产生的拓扑信息,并将拓扑信息写入事件库中;根据拓扑信息对网络拓扑状态进行分析,并生成故障事件的处理对策。管理服务器包括接收模块,用于接收环网设备收集的网络中产生的拓扑信息;写入模块,用于将拓扑信息写入事件库中;分析模块,用于根据拓扑信息对网络拓扑状态进行分析,并生成故障事件的处理对策。网络拓扑的分析处理系统包括多个环网设备和上述管理服务器。本发明实施例实现了对网络拓扑事件的收集和分析,为网络维护人员提供拓扑事件的分析结果,降低了对网络维护人员的技术要求,提高了网络的可维护性和稳定性。
文档编号H04L12/26GK101854263SQ20101020844
公开日2010年10月6日 申请日期2010年6月13日 优先权日2010年6月13日
发明者吴航 申请人:北京星网锐捷网络技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1