基于网管代理的网络管理方法及装置的制作方法

文档序号:7959954阅读:188来源:国知局
专利名称:基于网管代理的网络管理方法及装置的制作方法
技术领域
本发明涉及网络管理技术,特别涉及一种基于网管代理的网络管理方法及装置。
背景技术
网管系统是互联网系统中的一个重要组成部分,对于随时掌握庞大互联网中网络设备的运行状况、发现和解决网络设备的故障以及优化和提高网络设备的性能,网管系统都有着不可或缺的重要作用。在目前网管系统中采用的网管监控采集方式分为无网管代理的监控采集方式和基于网管代理的监控采集方式。其中,无网管代理的监控采集方式是通过标准的网络管理协议将管理设备和被管理设备连接起来,从管理设备中发出网管操作指令来直接获取被管理设备在运行过程中的运行数据;而基于网管代理的监控采集方式是在被管理设备中设置网管代理模块,管理设备向位于被管理系统中的网管代理模块发送网管操作指令,并且接收所述网管代理模块发送的被管理设备的运行数据,管理设备通过该网管代理模块来管理被管理设备。在基于网管代理的监控采集方式中,可以通过对网管代理模块进行二次开发来扩展其监控采集能力,因此,基于网管代理的监控采集方式成为目前网管系统中采用的主流方式。在采用基于网管代理的监控采集方式时,如何保障网管代理模块的稳定性,一直是困扰网管系统的一个技术难题。图1为现有技术基于网管代理的监控采集方式中的交叉监控采集方法流程图。如图1所示,管理设备和网管代理模块之间的信息交换可以分为两种:管理设备向网管代理模块发送网管操作指令以及网管代理模块向管理设备发送被管理设备的运行数据。其中,管理设备和被管理设备中的网管代理模块之间的通信遵从SNMP协议(Simple Network Management Protocol,简单网络管理协议)。对于管理设备向网管代理模块发送网管操作指令的流程,首先管理设备向位于被管理系统中的网管代理模块A发送网管操作指令,管理设备接收网管代理模块A发送的被管理设备的运行数据,管理设备通过网管代理模块A来管理被管理设备。为了保障网管代理模块A的稳定性,可以在被管理设备中设置网管代理模块B,此时,管理设备首先向位于被管理系统中的网管代理模块B发送网管操作指令,网管代理模块B将所述网管操作指令发送给网管代理模块A,由网管代理模块A来管理被管理设备;当管理设备在接收被管理设备的运行数据时,首先由网管代理模块A获取被管理设备的运行数据,然后将所述运行数据发送给网管代理模块B,再由网管代理模块B发送给管理设备。在实现本发明的过程中,发明人发现现有技术中至少存在如下问题:在现有的基于网管代理的监控采集方式中的交叉监控采集方法,由于网管代理模块A和网管代理模块B在通常情况下是一个生产厂家生产的设备,所以网管代理模块A和网管代理模块B通常会出现同样的故障,因此,采用现有的基于网管代理的监控采集方式中的交叉监控采集方法,仍然无法快速判断网管代理模块是否发生异常,不能保证网管代理模块A在运行过程中的稳定性。

发明内容
有鉴于此,本发明的主要目的在于提供一种基于网管代理的网络管理方法,可以快速判断网管代理模块是否发生异常,能够提高网管代理模块在运行过程中的稳定性。本发明的另一目的在于提供一种基于网管代理的网络管理装置,可以快速判断网管代理模块是否发生异常,能够提高网管代理模块在运行过程中的稳定性。为达到上述目的,本发明的技术方案是这样实现的:一种基于网管代理的网络管理方法,该方法包括:根据预设的读取周期,从被管理设备中的网管代理模块中获取所述网管代理模块在运行过程中的两个以上运行指标;根据所述两个以上运行指标,判断所述网管代理模块是否发生异常,如果所述网管代理模块发生异常,则检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,则在所述网管代理模块中删除预先定义的故障进程;将所述网管代理模块中的所述预处理标志设置为已预处理。一种基于网管代理的网络管理装置,包括:获取单元,用于根据预设的读取周期,从被管理设备中的网管代理模块中获取所述网管代理模块在运行过程中的两个以上运行指标,将所述两个以上运行指标发送给判断单元;所述判断单元,用于根据所述两个以上运行指标,判断所述网管代理模块是否发生异常,如果所述网管代理模块发生异常,向检查单元发送一个检查指令;所述检查单元,用于在接收到所述检查指令之后,检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,向删除单元发送一个删除指令;所述删除单元,用于在接收到所述删除指令之后,在所述网管代理模块中删除预先定义的故障进程,并向设置单元发送一个第一设置指令;所述设置单元,用于在接收到所述第一设置指令之后,将所述网管代理模块中的所述预处理标志设置为已预处理。本发明提出的基于网管代理的网络管理方法及装置,首先根据预设的读取周期,从被管理设备中的网管代理模块中获取所述网管代理模块在运行过程中的两个以上运行指标,根据所述两个以上运行指标,判断所述网管代理模块是否发生异常,如果所述网管代理模块发生异常,则检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,则在所述网管代理模块中删除预先定义的故障进程,将所述网管代理模块中的所述预处理标志设置为已预处理。和现有技术相比,本发明提出的基于网管代理的网络管理方法及装置,可以快速判断网管代理模块是否发生异常,能够提高网管代理模块在运行过程中的稳定性,而且可扩展性很强,实现方式简便可靠。


图1为现有技术基于网管代理的监控采集方式中的交叉监控采集方法流程图。图2为本发明基于网管代理的网络管理方法第一实施例的实现流程图。图3为本发明根据网管代理模块的运行时间来判断网管代理模块是否发生异常的方法流程图。图4为本发明根据网管代理模块的数据采集时间来判断网管代理模块是否发生异常的方法流程图。图5为本发明基于网管代理的网络管理装置的组成结构示意图。
具体实施例方式针对现有技术中存在的问题,本发明中提出一种改进后的基于网管代理的网络管理方法及装置,可以快速判断网管代理模块是否发生异常,能够提高网管代理模块在运行过程中的稳定性。为使本发明的技术方案更加清楚、明白,以下参照附图并举实施例,对本发明所述方案作进一步地详细说明。图2为本发明基于网管代理的网络管理方法第一实施例的实现流程图。如图2所示,包括以下步骤:步骤201,根据预设的读取周期,从被管理设备中的网管代理模块中获取网管代理模块在运行过程中的两个以上运行指标。在本步骤中,网管代理模块在运行过程中的两个以上运行指标可以为网管代理模块中网管进程的在线状态以及所述网管进程占用的系统资源。具体地,通过向被管理设备中的网管代理模块发送进程状态获取指令来获取网管代理模块中网管进程的在线状态,以及通过向网管代理模块发送资源获取指令,来获取所述网管进程占用的系统资源。例如,可以通过向网管代理模块发送psef进程状态获取指令来获取网管代理模块中的网管进程的在线状态;另外,可以通过向网管代理模块发送top资源获取指令来获取网管代理模块占用CPU的百分比;还可以通过向网管代理模块发送glance资源获取指令来获取网管代理模块占用内存的百分比。步骤202,根据网管代理模块的两个以上运行指标,判断网管代理模块是否发生异常,如果所述网管代理模块发生异常,则检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,则在所述网管代理模块中删除预先定义的故障进程。具体地,通过向被管理设备中的网管代理模块发送进程状态获取指令来获取网管代理模块中网管进程的在线状态,以及通过向网管代理模块发送资源获取指令,来获取所述网管进程占用的系统资源。例如,首先向网管代理模块发送psef进程状态获取指令,判断网管代理模块中的网管进程是否在线,如果网管进程在线,则向网管代理模块发送top资源获取指令,获取网管代理模块占用CPU的百分比,判断所述网管代理模块占用CPU的百分比是否大于或等于CPU占用预设阈值,如果网管进程占用的系统资源大于或等于所述CPU占用预设阈值,则判定所述网管代理模块发生异常。其中,所述CPU占用预设阈值是根据网管代理模块的运行情况预先设置的CPU占用门限值,例如,可以将所述CPU占用预设阈值设置为50%,另外,在后续流程中还可以根据网管代理模块的运行情况将所述CPU占用预设阈值进行调整。或者,当所述网管代理模块中的网管进程在线时,通过向被管理设备中的网管代理模块发送内存获取指令,来获取所述网管进程占用的内存资源,例如,向网管代理模块发送glance内存获取指令,获取网管代理模块占用内存的百分比,判断所述网管代理模块占用内存的百分比是否大于或等于内存占用预设阈值,如果网管进程占用的系统资源大于或等于所述内存占用预设阈值,则判定所述网管代理模块发生异常。同样,所述内存占用预设阈值是根据网管代理模块的运行情况预先设置的内存占用门限值,例如,可以将所述内存占用预设阈值设置为50%,另外,在后续流程中还可以根据网管代理模块的运行情况将所述内存占用预设阈值进行调整。另外,当判定所述网管代理模块中的网管进程在线时,还可以获取所述网管代理模块占用的其他系统资源,例如所述网管代理模块占用系统输入输出资源的百分比,判断所述网管代理模块是否发生异常。根据上述描述的网管代理模块发生异常的判断方法,如果判定所述网管代理模块发生异常,则检查网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,则在所述网管代理模块中删除预先定义的故障进程。由于在现有的基于网管代理的监控采集方式中,一般只监控网管代理模块中网管进程的在线状态,而没有对所述网管代理模块的其他运行指标进行监控,例如,所述网管代理模块的其他运行指标可以为所述网管代理模块占用CPU的百分比或占用内存的百分比。对于部分网管代理模块,即使判定网管代理模块中的网管进程在线,但是因为其他外部原因,例如,所述网管代理模块超出预设的数据采集权限,或者网管代理模块与被管理设备之间的连接端口被占用等原因,导致网管代理模块仍然无法正常工作。为了克服现有技术中不能快速判断网管代理模块是否发生异常的技术缺陷,本发明提出根据网管代理模块的两个以上运行指标,判断网管代理模块是否发生异常,可以快速判断网管代理模块是否发生异常,能够提高网管代理模块在运行过程中的稳定性。此外,如果网管代理模块的预处理标志已经被设置为已处理,则获取所述网管代理模块在运行过程中的异常数据,例如所述网管代理模块占用CPU的百分比或占用内存的百分比,接着向管理设备发送一个告警通知,所述告警通知中携带有所述异常数据,管理设备在收到所述告警通知之后,调用其他管理资源对网管代理模块中的异常数据进行处理,并且在对网管代理模块中的异常数据进行处理之后,将所述网管代理模块的预处理标志设置已预处理。步骤203,将网管代理模块的预处理标志设置为已预处理。根据上述的描述可知,通过上述的步骤201 203,可以实现快速判断网管代理模块是否发生异常,能够提高网管代理模块在运行过程中的稳定性。由上可知,在本发明的具体实施例中,不仅根据网管代理模块中的网管进程是否在线来判断所述网管代理模块是否发生异常,还需要进一步根据所述网管进程占用的系统资源来判断所述网管代理模块是否发生异常,从而可以更加快速地判断网管代理模块是否发生异常。较佳地,如果判定网管代理模块中的网管进程在线,并且所述网管进程占用的系统资源小于预设阈值,在本发明的技术方案中,进一步提出根据网管代理模块的运行时间来判断所述网管代理模块是否发生异常的方法。图3为本发明根据网管代理模块的运行时间来判断网管代理模块是否发生异常的方法流程图。如图3所示,在本发明的具体实施例中,还可以进一步包括如下所述的步骤:步骤301,从网管代理模块的运行日志中获取所述网管代理模块的最后一个运行周期结束的系统时间,并且获取网管代理模块所在系统的当前系统时间。在本步骤中,通过向被管理设备中的网管代理模块发送运行时间查询指令,在网管代理模块的运行日志中获取所述网管代理模块的最后一个运行周期结束的系统时间,并且通过向所网管代理模块发送系统时间查询指令,获取网管代理模块所在系统的当前系统时间。步骤302,计算所述当前系统时间与所述最后一个运行周期结束的系统时间的运行时间差值。步骤303,判断所述运行时间差值是否大于或等于所述网管代理模块的一个运行周期,如果是,则判定网管代理模块发生异常。在本步骤中,由于网管代理模块在每个运行周期结束后,都会在所述网管代理模块的运行日志中更新所述网管代理模块的最后一个运行周期结束的系统时间,因此,可以根据所述当前系统时间与网管代理模块最后一个运行周期结束的系统时间的运行时间差值,来判断所述网管代理模块是否发生异常。具体地,判断所述当前系统时间与网管代理模块最后一个运行周期结束的系统时间的运行时间差值是否大于或等于所述网管代理模块的一个运行周期,如果是,则判定网管代理模块发生异常。根据上述的描述可知,通过上述的步骤301 303,可以进一步实现快速判断网管代理模块是否发生异常,从而能够提高网管代理模块在运行过程中的稳定性。由上可知,在本发明的具体实施例中,当网管代理模块中的网管进程在线,并且网管进程占用的系统资源小于预设阈值时,需要进一步根据当前系统时间与网管代理模块最后一个运行周期结束的系统时间的运行时间差值,来判断所述网管代理模块是否发生异常,从而进一步实现快速判断网管代理模块是否发生异常,能够提高网管代理模块在运行过程中的稳定性。较佳地,如果当前系统时间与网管代理模块最后一个运行周期结束的系统时间的运行时间差值小于网管代理模块的一个运行周期,在本发明的技术方案中,进一步提出根据网管代理模块的数据采集时间来判断所述网管代理模块是否发生异常的方法。图4为本发明根据网管代理模块的数据采集时间来判断网管代理模块是否发生异常的方法流程图。如图4所示,在本发明的具体实施例中,还可以进一步包括如下所述的步骤:步骤401,从网管代理模块的数据采集日志中获取网管代理模块的最后一个数据采集周期结束的系统时间,并且获取网管代理模块所在系统的当前系统时间。在本步骤中,通过向被管理设备中的网管代理模块发送数据采集时间查询指令,在网管代理模块的运行日志中获取所述网管代理模块的最后一个数据采集周期结束的系统时间,并且通过向所网管代理模块发送系统时间查询指令,获取网管代理模块所在系统的当前系统时间。步骤402,计算所述当前系统时间与所述最后一个数据采集周期结束的系统时间的数据采集时间差值。步骤403,判断所述数据采集时间差值是否大于所述网管代理模块的一个数据采集周期,如果是,则判定所述网管代理模块发生异常。在本步骤中,由于网管代理模块在每个数据采集周期结束后,都会在所述网管代理模块的数据采集日志中更新所述网管代理模块的最后一个数据采集周期结束的系统时间,因此,可以根据所述当前系统时间与网管代理模块最后一个数据采集周期结束的系统时间的运行时间差值,来判断所述网管代理模块是否发生异常。具体地,判断所述当前系统时间与网管代理模块最后一个数据采集周期结束的系统时间的运行时间差值是否大于所述网管代理模块的一个运行周期,如果是,则判定网管代理模块发生异常。本发明提出的基于网管代理的网络管理方法,首先根据预设的读取周期,从被管理设备中的网管代理模块中获取所述网管代理模块在运行过程中的两个以上运行指标,根据所述两个以上运行指标,判断所述网管代理模块是否发生异常,如果所述网管代理模块发生异常,则检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,则在所述网管代理模块中删除预先定义的故障进程,将所述网管代理模块中的所述预处理标志设置为已预处理。和现有技术相比,本发明提出的基于网管代理的网络管理方法,可以快速判断网管代理模块是否发生异常,能够提高网管代理模块在运行过程中的稳定性,而且可扩展性很强,实现方式简便可靠。图5为本发明基于网管代理的网络管理装置的组成结构示意图。如图5所示,包括:获取单元501,用于根据预设的读取周期,从被管理设备中的网管代理模块中获取所述网管代理模块在运行过程中的两个以上运行指标,将所述两个以上运行指标发送给判断单元502 ;所述判断单元502,用于根据所述两个以上运行指标,判断所述网管代理模块是否发生异常,如果所述网管代理模块发生异常,向检查单元503发送一个检查指令;所述检查单元503,用于在接收到所述检查指令之后,检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,向删除单元504发送一个删除指令;所述删除单元504,用于在接收到所述删除指令之后,在所述网管代理模块中删除预先定义的故障进程,并向设置单元505发送一个第一设置指令;所述设置单元505,用于在接收到所述第一设置指令之后,将所述网管代理模块中的所述预处理标志设置为已预处理。进一步的,所述判读单元502包括:判断子单元5021,用于判断所述网管代理模块中的网管进程是否在线,以及所述网管进程占用的系统资源是否大于或等于预设阈值,如果所述网管进程掉线,或者所述网管进程占用的系统资源大于或等于所述预设阈值,则判定所述网管代理模块发生异常,如果判定所述网管进程在线,并且所述网管进程占用的系统资源小于所述预设阈值,向获取子单元5022发送一个第一获取指令进一步的,所述判断单元502还包括:获取子单元5022,用于在接收到所述第一获取指令之后,从所述网管代理模块的运行日志中获取所述网管代理模块的最后一个运行周期结束的系统时间,并且获取所述网管代理模块所在系统的当前系统时间,将所述当前系统时间和所述最后一个运行周期结束的系统时间发送给计算子单元5023 ;所述计算子单元5023,用于在接收到所述当前系统时间和所述最后一个运行周期结束的系统时间之后,计算所述当前系统时间与所述最后一个运行周期结束的系统时间的运行时间差值,并将所述运行时间差值发送给所述判断子单元5021 ;
所述判断子单元5021,用于在接收到所述运行时间差值之后,判断所述运行时间差值是否大于或等于所述网管代理模块的一个运行周期,如果是,则判定所述网管代理模块发生异常,如果所述运行时间差值小于所述网管代理模块的一个运行周期,向所述获取子单元5022发送一个第二获取指令。进一步的,所述获取子单元5022,还用于在接收到所述第二获取指令之后,从所述网管代理模块的数据采集日志中获取所述网管代理模块的最后一个数据采集周期结束的系统时间,并且获取所述网管代理模块所在系统的当前系统时间,将所述当前系统时间与所述最后一个数据采集周期结束的系统时间发送给所述计算子单元5023 ;所述计算子单元5023,用于在接收到所述当前系统时间与所述最后一个数据采集周期结束的系统时间之后,计算所述当前系统时间与所述最后一个数据采集周期结束的系统时间的数据采集时间差值,并将所述数据采集时间差值发送给所述判断子单元5021 ;所述判断子单元5021,还用于在接收到所述数据采集时间差值之后,判断所述数据采集时间差值是否大于所述网管代理模块的一个数据采集周期,如果是,则判定所述网管代理模块发生异常。进一步的,所述装置还包括发送单元506 ;所述检查单元503,用于在接收到所述检查指令之后,检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志已经被设置为已处理,则向所述获取单元501发送一个第三获取指令;所述获取单元501,还用于在接收到所述第三获取指令之后,获取所述网管代理模块在运行过程中的异常数据,将所述异常数据发送给所述发送单元506 ;所述发送单元506,用于在接收到所述异常数据之后,向管理设备发送一个告警通知,所述告警通知中携带有所述异常数据,并向所述设置单元505发送一个第二设置指令;所述设置单元505,还用于在接收到所述第二设置指令之后,将所述网管代理模块的所述预处理标志设置为已预处理。本发明提出的基于网管代理的网络管理装置,获取单元首先根据预设的读取周期,从被管理设备中的网管代理模块中获取所述网管代理模块在运行过程中的两个以上运行指标,判断单元根据所述两个以上运行指标,判断所述网管代理模块是否发生异常,如果所述网管代理模块发生异常,则通过检查单元检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,则通过删除单元在所述网管代理模块中删除预先定义的故障进程,通过设置单元将所述网管代理模块中的所述预处理标志设置为已预处理。和现有技术相比,本发明提出的基于网管代理的网络管理装置,可以快速判断网管代理模块是否发生异常,能够提高网管代理模块在运行过程中的稳定性,而且可扩展性很强,实现方式简便可靠。图5所示装置实施例的具体工作流程请参照图2所示方法实施例中的相应说明,不再赘述。另外,需要说明的是,本发明所述方案适用于Windows或Unix操作系统,对于其他操作系统也将同样适用。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
权利要求
1.一种基于网管代理的网络管理方法,其特征在于,包括: 根据预设的读取周期,从被管理设备中的网管代理模块中获取所述网管代理模块在运行过程中的两个以上运行指标; 根据所述网管代理模块的所述两个以上运行指标,判断所述网管代理模块是否发生异常,如果所述网管代理模块发生异常,则检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,则在所述网管代理模块中删除预先定义的故障进程; 将所述网管代理模块的所述预处理标志设置为已预处理。
2.根据权利要求1所述的方法,其特征在于,所述根据所述两个以上运行指标,判断所述网管代理模块是否发生异常,包括: 判断所述网管代理模块中的网管进程是否在线,以及所述网管进程占用的系统资源是否大于或等于预设阈值,如果所述网管进程掉线,或者所述网管进程占用的系统资源大于或等于所述预设阈值,则判定所述网管代理模块发生异常。
3.根据权利要求2所述的方法,其特征在于,还包括: 如果判定所述网管进程在线,并且所述网管进程占用的系统资源小于所述预设阈值,则从所述网管代理模块的运 行日志中获取所述网管代理模块的最后一个运行周期结束的系统时间,并且获取所述网管代理模块所在系统的当前系统时间; 计算所述当前系统时间与所述最后一个运行周期结束的系统时间的运行时间差值; 判断所述运行时间差值是否大于或等于所述网管代理模块的一个运行周期,如果是,则判定所述网管代理模块发生异常。
4.根据权利要求3所述的方法,其特征在于,还包括: 如果所述运行时间差值小于所述网管代理模块的一个运行周期,则从所述网管代理模块的数据采集日志中获取所述网管代理模块的最后一个数据采集周期结束的系统时间,并且获取所述网管代理模块所在系统的当前系统时间; 计算所述当前系统时间与所述最后一个数据采集周期结束的系统时间的数据采集时间差值; 判断所述数据采集时间差值是否大于所述网管代理模块的一个数据采集周期,如果是,则判定所述网管代理模块发生异常。
5.根据权利要求1所述的方法,其特征在于,还包括: 如果所述预处理标志已经被设置为已处理,获取所述网管代理模块在运行过程中的异常数据; 向管理设备发送一个告警通知,所述告警通知中携带有所述异常数据; 将所述网管代理模块的预处理标志设置未已预处理。
6.一种基于网管代理的网络管理装置,其特征在于,包括: 获取单元,用于根据预设的读取周期,从被管理设备中的网管代理模块中获取所述网管代理模块在运行过程中的两个以上运行指标,将所述两个以上运行指标发送给判断单元; 所述判断单元,用于根据所述两个以上运行指标,判断所述网管代理模块是否发生异常,如果所述网管代理模块发生异常,向检查单元发送一个检查指令;所述检查单元,用于在接收到所述检查指令之后,检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,向删除单元发送一个删除指令; 所述删除单元,用于在接收到所述删除指令之后,在所述网管代理模块中删除预先定义的故障进程,并向设置单元发送一个第一设置指令; 所述设置单元,用于在接收到所述第一设置指令之后,将所述网管代理模块中的所述预处理标志设置为已预处理。
7.根据权利要求6所述的装置,其特征在于,所述判断单元包括: 判断子单元,用于判断所述网管代理模块中的网管进程是否在线,以及所述网管进程占用的系统资源是否大于或等于预设阈值,如果所述网管进程掉线,或者所述网管进程占用的系统资源大于或等于所述预设阈值,则判定所述网管代理模块发生异常,如果判定所述网管进程在线,并且所述网管进程占用的系统资源小于所述预设阈值,向获取子单元发送一个第一获取指令。
8.根据权利要求7所述的装置,其特征在于,所述判断单元还包括: 获取子单元,用于在接收到所述第一获取指令之后,从所述网管代理模块的运行日志中获取所述网管代理模块的最后一个运行周期结束的系统时间,并且获取所述网管代理模块所在系统的当前系统时间,将所述当前系统时间和所述最后一个运行周期结束的系统时间发送给计算子单元; 所述计算子单元,用于在接收到所述当前系统时间和所述最后一个运行周期结束的系统时间之后,计算所述当前系统时间与所述最后一个运行周期结束的系统时间的运行时间差值,并将所述运行时间差值发送给所述判断子单元; 所述判断子单元,用于在接收到所述运行时间差值之后,判断所述运行时间差值是否大于或等于所述网管代理模块的一个运行周期,如果是,则判定所述网管代理模块发生异常,如果所述运行时间差值小于所述网管代理模块的一个运行周期,向所述获取子单元发送一个第二获取指令。
9.根据权利要求8所述的装置,其特征在于,所述获取子单元,还用于在接收到所述第二获取指令之后,从所述网管代理模块的数据采集日志中获取所述网管代理模块的最后一个数据采集周期结束的系统时间,并且获取所述网管代理模块所在系统的当前系统时间,将所述当前系统时间与所述最后一个数据采集周期结束的系统时间发送给所述计算子单元; 所述计算子单元,用于在接收到所述当前系统时间与所述最后一个数据采集周期结束的系统时间之后,计算所述当前系统时间与所述最后一个数据采集周期结束的系统时间的数据采集时间差值,并将所述数据采集时间差值发送给所述判断子单元; 所述判断子单元,还用于在接收到所述数据采集时间差值之后,判断所述数据采集时间差值是否大于所述网管代理模块的一个数据采集周期,如果是,则判定所述网管代理模块发生异常。
10.根据权利要求6所述的装置,其特征在于,还包括发送单元; 所述检查单元,用于在接收到所述检查指令之后,检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志已经被设置为已处理,则向所述获取单元发送一个第三获取指令;所述获取单元,还用于在接收到所述第三获取指令之后,获取所述网管代理模块在运行过程中的异常数据,将所述异常数据发送给所述发送单元; 所述发送单元,用于在接收到所述异常数据之后,向管理设备发送一个告警通知,所述告警通知中携带有所述异常数据,并向所述设置单元发送一个第二设置指令; 所述设置单元,还用于在接收到所述第二设置指令之后,将所述网管代理模块的所述预处理标志设置为已 预处理。
全文摘要
本发明公开了一种基于网管代理的网络管理方法及装置,所述方法包括根据预设的读取周期,从被管理设备中的网管代理模块中获取所述网管代理模块在运行过程中的两个以上运行指标;根据所述网管代理模块的所述两个以上运行指标,判断所述网管代理模块是否发生异常,如果所述网管代理模块发生异常,则检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,则在所述网管代理模块中删除预先定义的故障进程;将所述网管代理模块的所述预处理标志设置为已预处理。和现有技术相比,本发明提出的基于网管代理的网络管理方法及装置,可以快速判断网管代理模块是否发生异常,能够提高网管代理模块在运行过程中的稳定性。
文档编号H04L12/24GK103095476SQ20111034152
公开日2013年5月8日 申请日期2011年11月2日 优先权日2011年11月2日
发明者李凯, 项捷, 王黎明 申请人:中国移动通信集团浙江有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1