分布式网络服务器监控方法及系统的制作方法

文档序号:7732472阅读:159来源:国知局
专利名称:分布式网络服务器监控方法及系统的制作方法
技术领域
本发明涉及网络通信领域,特别涉及一种分布式网络服务器监控方法及系统。
背景技术
网络服务器是依托网络,向客户端提供实时在线服务的服务器。此类服务器对于网络中客户端的正常工作极为重要,通过在网络服务器上保持大量的用户数据,并通过搭建各类服务,如文件服务、数据库服务或邮件服务等,对大量的工作任务进行有效支持。这些服务对于企业来说往往是业务能够正常进行的基本需求,所以网络服务器的正常运行和故障后的快速响应,对于企业具有非常重要的意义。现有的一些对网络服务器监控的方法中,提供了对网络服务器的异常监控方法, 这些方法对于正常网络环境中的网络服务器异常情况可以进行有效监控,但是在异常网络环境中,如通信不畅、DNS解析错误、监控发起点自身网络故障,则会将正常在线的服务器误报为异常。这种情况将对服务器的运维体系的正常运作产生不利影响,并极大增加服务器运维体系的维护成本。

发明内容
本发明提供了一种分布式网络服务器监控方法及系统,通过多台监控服务器协同工作的方式,进行多点验证,解决了由于监控服务器局部网络异常引起的误报事件。一种分布式网络服务器监控方法,包括
至少两台监控服务器分别定期监控网络中的网络服务器;
当前监控服务器监控所有网络服务器,若监控到网络服务器出现异常,则向其它监控服务器发出协助核查请求;
当前监控服务器根据其它监控服务器返回的核查结果,确定是否为误报。所述的当前服务器是指在本次监控任务中发起监控请求的监控服务器;
所述方法中所使用的协议包括但不限于ICMP、socket、http、ftp、ssh、dns、arp、 telnet、samba、nfs 等。所述的分布式网络服务器监控方法中,当前监控服务器监控所有网络服务器,若监控到网络服务器出现异常,则向其它监控服务器发出协助核查请求,包括
当前监控服务器向网络服务器发起监控任务;所述的监控任务由监控服务器自身网络环境中发起。识别并判断监控结果,若监控结果正常,则结束监控,若监控结果异常,则向其它监控服务器发出协助核查请求。所述的分布式网络服务器监控方法中,当前监控服务器根据其它监控服务器返回的核查结果,确定是否为误报,包括
接收其它监控服务器返回的核查结果;
分析核查结果,若核查结果中报告为异常的数量超过预设值,则确认网络服务器异常,否则确认为误报;
当确认网络服务器异常时,发出网络服务器异常报警。所述的分布式网络服务器监控方法中,所述的监控任务至少包括网络服务是否正常、网络服务器域名解析是否正常、开放性数据库服务是否正常、WEB服务是否正常或文件传输服务是否正常。所述的分布式网络服务器监控方法中,所述的监控结果异常至少包括网络无法连接、域名解析失败、数据库无法连接、WEB服务失效或文件传输服务无法访问。所述的分布式网络服务器监控方法中,所述的协助核查请求的内容至少包括目标网络服务器地址、监控任务类别、服务端口及预设的核查方法。所述的分布式网络服务器监控方法中,所述的核查结果至少包括 网络服务器是否异常、异常种类及异常原因。一种分布式网络服务器监控系统,包括
至少两台监控服务器,用于分别定期监控网络中的网络服务器; 所述的监控服务器包括
监控模块,用于当前监控服务器监控所有网络服务器,若监控到网络服务器出现异常, 则向其它监控服务器发出协助核查请求;
误报判定模块,当前监控服务器根据其它监控服务器返回的监控结果,确定是否为误报。所述的分布式网络服务器监控系统中,所述的监控模块还包括 发送子模块,用于当前监控服务器向网络服务器发起监控任务;
判断子模块,用于识别并判断监控结果,若监控结果正常,则结束监控,若监控结果异常,则进入请求模块;
请求子模块,用于当判断模块判断监控结果异常时,向其他监控服务器发出协助核查请求。所述的分布式网络服务器监控系统中,所述的误报判定模块还包括 接收子模块,用于接收其他监控服务器返回的核查结果;
分析子模块,用于分析核查结果,若核查结果中报告为异常的数量超过预设值,则确认网络服务器异常,否则确认为误报;
报警子模块,用于当确认网络服务器异常时,发出网络服务器异常报警。所述的分布式网络服务器监控系统中,所述的监控任务至少包括网络服务是否正常、网络服务器域名解析是否正常、开放性数据库服务是否正常、WEB服务是否正常或文件传输服务是否正常。所述的分布式网络服务器监控系统中,所述的监控结果异常至少包括网络无法连接、域名解析失败、数据库无法连接、WEB服务失效或文件传输服务无法访问。所述的分布式网络服务器监控系统中,所述的协助核查请求的内容至少包括目标网络服务器地址、监控任务类别、服务端口及预设的核查方法。所述的分布式网络服务器监控系统中,所述的核查结果至少包括 网络服务器是否异常、异常种类、异常原因。本发明提供一种分布式网络服务器监控方法包括至少两台监控服务器分别定期监控网络中的网络服务器;当前监控服务器监控所有网络服务器,若监控到网络服务器出现异常,则向其它监控服务器发出协助核查请求;当前监控服务器根据其它监控服务器返回的监控结果,确定是否为误报。本发明还提供了一种分布式网络服务器监控系统,包括至少两台监控服务器。通过本发明的技术方案,对服务器异常时间,进行多点验证,解决了由于监控服务器局部网络异常引起的误报事件,有效降低了误报率,提供了一种更高效的网络服务器监控方法。


为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明提供的一种分布式网络服务器监控方法流程图; 图2为监控服务器监控所有网络服务器流程图3为监控服务器根据其它监控服务器的核查结果,确定是否为误报流程图; 图4为本发明提供的一分布式网络服务器监控系统实施例示意图; 图5为本发明提供的一种监控服务器结构示意图。
具体实施例方式为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明中技术方案作进一步详细的说明。本发明提供了一种分布式网络服务器监控方法及系统,通过多台监控服务器协同工作的方式,进行多点验证,解决了由于监控服务器局部网络异常引起的误报事件。适应局部监控服务器断网、离线等情况引起局部监控失效的情况。一种分布式网络服务器监控方法,如图1所示,包括
5101至少两台监控服务器分别定期监控网络中的网络服务器;
5102当前监控服务器监控所有网络服务器,若监控到网络服务器出现异常,则向其它监控服务器发出协助核查请求;
5103当前监控服务器根据其它监控服务器返回的核查结果,确定是否为误报。其中所述的分别定期监控是指,由一台当前监控服务器监控网络服务器,在指定的一段时间后,由下一监控服务器监控网络服务器,所有监控服务器循环监控。所述方法中所使用的协议包括但不限于ICMP、socket、http、ftp、ssh、dns、arp、 telnet、samba、nfs 等。所述的分布式网络服务器监控方法中,当前监控服务器监控所有网络服务器,若监控到网络服务器出现异常,则向其它监控服务器发出协助核查请求,如图2所示,包括
S201 当前监控服务器向网络服务器发起监控任务;所述的监控任务由监控服务器自身网络环境中发起。S202 识别并判断监控结果是否正常,若监控结果正常,则结束监控,若监控结果异常,则执行S203;
S203 向其它监控服务器发出协助核查请求。所述的分布式网络服务器监控方法中,当前监控服务器根据其它监控服务器返回的核查结果,确定是否为误报,如图3所示,包括
S301 接收其它监控服务器返回的核查结果;
S302:分析核查结果中报告为异常的数量是否超过预设值,则确认网络服务器异常,执行S303,否则确认为误报;
例如当10个监控服务器中有8个监控服务器报告异常时,则认为此异常发生,否则认为此异常未发生。S303 发出网络服务器异常报警;
所述的网络异常报警,可以根据事件的紧急程度选择报警方式,例如短信报警、邮件报警、扬声器发声报警或报警灯闪烁等。所述的分布式网络服务器监控方法中,所述的监控任务至少包括网络服务是否正常、网络服务器域名解析是否正常、开放性数据库服务是否正常、WEB服务是否正常或文件传输服务是否正常。可监控的服务还可以包括例如,PHP服务、ASP服务等。所述的分布式网络服务器监控方法中,所述的监控结果异常至少包括网络无法连接、域名解析失败、数据库无法连接、WEB服务失效或文件传输服务无法访问。所述的分布式网络服务器监控方法中,所述的协助核查请求的内容至少包括目标网络服务器地址、监控任务类别、服务端口及预设的核查方法。协助核查请求的内容例如地址为 www. example, com, WEB 服务、80 端口及 socket 连接。所述的分布式网络服务器监控方法中,所述的核查结果至少包括
网络服务器是否异常、异常种类、异常原因。核查结果例如异常、socket无法连接、连接超时。为了更有效的理解本发明方法,提供了一种分布式网络服务器监控方法实施例, 可有多个监控点对网络中的网络服务器运行状态进行监控,通过TCP/IP网络与被监控网络服务器进行通信,如图4所示,监控服务器401、402、403和404监控同一网络中的所有网络服务器405,下面对本技术方案进行详细描述。监控服务器401对网络服务器进行域名解析有效性监控;例如对www. example, com进行解析申请;
识别并判断监控结果;结果为未知,则认为监控服务器本地监控结果为异常,但此时不可确定为监控目标网络服务器异常,因此执行下一步骤;
向监控服务器402、403及404发出协助核查请求;其他监控服务器接收协助核查请求后,根据协助核查请求内容,对网络服务器进行域名解析核查,并将核查结果返回发起协助核查请求的监控服务器;
接收监控服务器402、403及404返回的核查结果,并进行分析;拟定监控服务器402、 403及404返回的核查结果均为异常,则确认本次域名解析异常; 发出网络服务器异常报警。上述所提供的方法,有效解决了由于网络故障,如监控服务器本地断网或监控服务器访问被监控网络服务器异常而引起的误报。在监控服务器本地断网的情况下,可通过预先设定的轮流监控的方式,由其他监控服务器继续监控任务;在监控服务器访问被监控网络服务器异常的情况下,可通过其他监控服务器的协查,修正误报。通过分布式监控,对服务器异常时间,进行多点验证,有效降低了误报率。本发明还提供了一种分布式网络服务器监控系统,包括 至少两台监控服务器,用于分别定期监控网络中的网络服务器; 所述的监控服务器,如图5所示,包括
监控模块501,用于当前监控服务器监控所有网络服务器,若监控到网络服务器出现异常,则向其它监控服务器发出协助核查请求;
误报判定模块502,当前监控服务器根据其它监控服务器返回的监控结果,确定是否为误报。所述的分布式网络服务器监控系统中,所述的监控模块501-1还包括 发送子模块501-1,用于当前监控服务器向网络服务器发起监控任务;
判断子模块501-2,用于识别并判断监控结果,若监控结果正常,则结束监控,若监控结果异常,则进入请求模块;
请求子模块501-3,用于当判断模块判断监控结果异常时,向其他监控服务器发出协助核查请求。所述的分布式网络服务器监控系统中,所述的误报判定模块501-2还包括 接收子模块502-1,用于接收其他监控服务器返回的核查结果;
分析子模块502-2,用于分析核查结果,若核查结果中报告为异常的数量超过预设值, 则确认网络服务器异常,否则确认为误报;
报警子模块502-3,用于当确认网络服务器异常时,发出网络服务器异常报警。所述的分布式网络服务器监控系统中,所述的监控任务至少包括网络服务是否正常、网络服务器域名解析是否正常、开放性数据库服务是否正常、WEB服务是否正常或文件传输服务是否正常。所述的分布式网络服务器监控系统中,所述的监控结果异常至少包括网络无法连接、域名解析失败、数据库无法连接、WEB服务失效或文件传输服务无法访问。所述的分布式网络服务器监控系统中,所述的协助核查请求的内容至少包括目标网络服务器地址、监控任务类别、服务端口及预设的核查方法。所述的分布式网络服务器监控系统中,所述的核查结果至少包括 网络服务器是否异常、异常种类、异常原因。本发明提供一种分布式网络服务器监控方法包括至少两台监控服务器分别定期监控网络中的网络服务器;当前监控服务器监控所有网络服务器,若监控到网络服务器出现异常,则向其它监控服务器发出协助核查请求;当前监控服务器根据其它监控服务器返回的监控结果,确定是否为误报。本发明还提供了一种分布式网络服务器监控系统,包括至少两台监控服务器。通过本发明的技术方案,对服务器异常时间,进行多点验证,解决了由于监控服务器局部网络异常引起的误报事件,有效降低了误报率,提供了一种更高效的网络服务器监控方法。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。 虽然通过实施例描绘了本发明,本领域普通技术人员知道,本发明有许多变形和变化而不脱离本发明的精神,希望所附的权利要求包括这些变形和变化而不脱离本发明的精神。
权利要求
1.一种分布式网络服务器监控方法,其特征在于,包括至少两台监控服务器分别定期监控网络中的网络服务器;当前监控服务器监控所有网络服务器,若监控到网络服务器出现异常,则向其它监控服务器发出协助核查请求;当前监控服务器根据其它监控服务器返回的核查结果,确定是否为误报。
2.如权利要求1所述的分布式网络服务器监控方法,其特征在于,当前监控服务器监控所有网络服务器,若监控到网络服务器出现异常,则向其它监控服务器发出协助核查请求,包括当前监控服务器向网络服务器发起监控任务;识别并判断监控结果,若监控结果正常,则结束监控,若监控结果异常,则向其它监控服务器发出协助核查请求。
3.如权利要求1所述的分布式网络服务器监控方法,其特征在于,当前监控服务器根据其它监控服务器返回的核查结果,确定是否为误报,包括接收其它监控服务器返回的核查结果;分析核查结果,若核查结果中报告为异常的数量超过预设值,则确认网络服务器异常, 否则确认为误报;当确认网络服务器异常时,发出网络服务器异常报警。
4.如权利要求2所述的分布式网络服务器监控方法,其特征在于,所述的监控任务至少包括网络服务是否正常、网络服务器域名解析是否正常、开放性数据库服务是否正常、 WEB服务是否正常或文件传输服务是否正常。
5.如权利要求2所述的分布式网络服务器监控方法,其特征在于,所述的监控结果异常至少包括网络无法连接、域名解析失败、数据库无法连接、WEB服务失效或文件传输服务无法访问。
6.如权利要求2所述的分布式网络服务器监控方法,其特征在于,所述的协助核查请求的内容至少包括目标网络服务器地址、监控任务类别、服务端口及预设的核查方法。
7.如权利要求3所述的分布式网络服务器监控方法,其特征在于,所述的核查结果至少包括网络服务器是否异常、异常种类及异常原因。
8.一种分布式网络服务器监控系统,其特征在于,包括至少两台监控服务器,用于分别定期监控网络中的网络服务器;所述的监控服务器包括监控模块,用于当前监控服务器监控所有网络服务器,若监控到网络服务器出现异常, 则向其它监控服务器发出协助核查请求;误报判定模块,当前监控服务器根据其它监控服务器返回的监控结果,确定是否为误报。
9.如权利要求8所述的分布式网络服务器监控系统,其特征在于,所述的监控模块还包括发送子模块,用于当前监控服务器向网络服务器发起监控任务;判断子模块,用于识别并判断监控结果,若监控结果正常,则结束监控,若监控结果异常,则进入请求模块;请求子模块,用于当判断模块判断监控结果异常时,向其他监控服务器发出协助核查请求。
10.如权利要求8所述的分布式网络服务器监控系统,其特征在于,所述的误报判定模块还包括接收子模块,用于接收其他监控服务器返回的核查结果;分析子模块,用于分析核查结果,若核查结果中报告为异常的数量超过预设值,则确认网络服务器异常,否则确认为误报;报警子模块,用于当确认网络服务器异常时,发出网络服务器异常报警。
11.如权利要求9所述的分布式网络服务器监控系统,其特征在于,所述的监控任务至少包括网络服务是否正常、网络服务器域名解析是否正常、开放性数据库服务是否正常、 WEB服务是否正常或文件传输服务是否正常。
12.如权利要求9所述的分布式网络服务器监控系统,其特征在于,所述的监控结果异常至少包括网络无法连接、域名解析失败、数据库无法连接、WEB服务失效或文件传输服务无法访问。
13.如权利要求9所述的分布式网络服务器监控系统,其特征在于,所述的协助核查请求的内容至少包括目标网络服务器地址、监控任务类别、服务端口及预设的核查方法。
14.如权利要求10所述的分布式网络服务器监控系统,其特征在于,所述的核查结果至少包括网络服务器是否异常、异常种类及异常原因。
全文摘要
本发明提供一种分布式网络服务器监控方法包括至少两台监控服务器分别定期监控网络中的网络服务器;当前监控服务器监控所有网络服务器,若监控到网络服务器出现异常,则向其它监控服务器发出协助核查请求;当前监控服务器根据其它监控服务器返回的监控结果,确定是否为误报。本发明还提供了一种分布式网络服务器监控系统,包括至少两台监控服务器。通过本发明的技术方案,对网络服务器异常事件,进行多点验证,有效降低了误报率,提供了一种更高效的网络服务器监控方法。
文档编号H04L29/08GK102347976SQ20111020872
公开日2012年2月8日 申请日期2011年7月25日 优先权日2011年7月25日
发明者徐翰隆, 杨祖明, 高树磊 申请人:北京安天电子设备有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1