分布式网络系统的监控方法、装置、设备及存储介质与流程

文档序号:17429186发布日期:2019-04-17 03:16阅读:173来源:国知局
分布式网络系统的监控方法、装置、设备及存储介质与流程

本发明涉及监控技术领域,尤其涉及一种分布式网络系统的监控方法、装置、设备及存储介质。



背景技术:

随着互联网业务的发展,网络规模越来越大,接入网络的网络设备也越来越多,为了保障网络性能,网络的监控工作也变得越来越重要。

目前对网络的监控机制通常是通过在网络中指定一个专属的中心服务器,由该中心服务器调用针对网络中各网络设备的监控接口,主动获取各网络设备的监控数据,然后对获取到的各网络设备的监控数据进行分析处理,在确定某一网络设备存在异常时,生成相应的预警信息通知网络监管人员进行处理。虽然,这一监控方式能够对接入网络的网络设备进行监控,但是对各网络设备的监控数据的分析处理均是由中心服务器完成的,因此会严重占用中心服务器的处理资源,影响其分析速度,从而不能向监管人员及时反馈网络异常。此外,上述监控方式需要中心服务器不断的从各网络设备获取监控数据,因而经常会出现由于某一时刻数据丢失、异常,导致分析结果不准确,误导监管人员。

所以,亟需提供一种能够降低中心服务器资源,且保证监控结果准确性的网络监控方法。

上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。



技术实现要素:

本发明的主要目的在于提供一种分布式网络系统的监控方法、装置、设备及存储介质,旨在解决现有技术中对中心服务器的资源占用较大,且监控结果不准确的技术问题。

为实现上述目的,本发明提供了一种分布式网络系统的监控方法,所述方法包括以下步骤:

分布式网络系统中的计算节点执行对应的监控任务,收集虚拟网络层中的网络监控数据;

所述计算节点根据预设的网络性能评估指标对所述网络监控数据进行分析,判断是否发生异常;

若确定发生异常,则由所述计算节点获取本节点的标识信息,并基于事件处理机制,将所述网络监控数据和所述标识信息封装成事件报文;

所述计算节点将所述事件报文发送至所述分布式系统中的控制节点,以使所述控制节点根据所述事件报文将所述计算节点存在的异常反馈给监管人员。

优选地,所述计算节点执行对应的监控任务,收集虚拟网络层中的网络监控数据,包括:

所述计算节点获取本节点的标识信息,根据所述标识信息生成监控任务获取请求;

所述计算节点将所述监控任务获取请求发送至所述控制节点,以使所述控制节点根据所述标识信息从所述分布式系统中的存储节点中查找针对所述计算节点的监控任务;

所述计算节点接收所述控制节点下发的监控任务并执行,收集虚拟网络层中符合所述监控任务的网络监控数据。

优选地,所述监控任务规定了收集所述网络监控数据时需要依据的网络指标;

所述收集虚拟网络层中符合所述监控任务的网络监控数据,包括:

所述计算节点分时段收集网络虚拟层中所述网络指标对应的网络指标数据,并将所述网络指标数据作为符合所述监控任务的网络监控数据。

优选地,所述计算节点根据预设的网络性能评估指标对所述网络监控数据进行分析,判断是否发生异常,包括:

所述计算节点根据各时段的网络指标数据,计算所述网络指标对应的变化率;

所述计算节点根据预设的网络性能评估指标对所述变化率进行分析,判断是否发生异常,若所述变化率按照预设的网络性能评估指标的规定变化,则确定发生异常。

优选地,所述计算节点将所述事件报文发送至控制节点,包括:

所述计算节点获取本节点的位置坐标;

所述计算节点将所述位置坐标和所述事件报文发送至所述控制节点,以使所述控制节点根据所述事件报文将所述计算节点存在的异常反馈给监管人员,并根据所述位置坐标告知所述监管人员所述计算节点所处的位置。

优选地,所述计算节点获取本节点的位置坐标之后,所述方法还包括:

所述计算节点基于差分定位技术对所述位置坐标进行修正,得到修正后的位置坐标;

其中,所述计算节点将所述位置坐标和所述事件报文发送至所述控制节点,包括:

所述计算节点将所述修正后的位置坐标和所述事件报文发送至所述控制节点,以使所述控制节点根据所述事件报文将所述计算节点存在的异常反馈给监管人员,并根据所述修正后的位置坐标告知所述监管人员所述计算节点所处的位置。

优选地,所述计算节点将所述位置坐标和所述事件报文发送至所述控制节点之后,所述方法还包括:

所述计算节点根据所述监控任务,确定所述计算节点处理的业务;

所述计算节点根据所述网络监控数据,确定导致异常的业务的业务特征信息;

所述计算节点将所述业务特征信息发送至所述控制节点,以使所述控制节点根据所述业务特征信息生成管控指令,并将所述管控指令分发至分布式网络系统中与所述计算节点有业务关系的计算节点,使其他计算节点拒绝处理导致异常的所述业务。

此外,为实现上述目的,本发明还提出一种分布式网络系统的监控装置,所述装置包括:

数据收集模块,用于执行对应的监控任务,收集虚拟网络层中的网络监控数据;

异常判断模块,用于根据预设的网络性能评估指标对所述网络监控数据进行分析,判断是否发生异常;

报文封装模块,用于在确定发生异常时,获取本节点的标识信息,并基于事件处理机制,将所述网络监控数据和所述标识信息封装成事件报文;

报文发送模块,用于将所述事件报文发送至分布式网络系统中的控制节点,以使所述控制节点根据所述事件报文将所述计算节点存在的异常反馈给监管人员。

此外,为实现上述目的,本发明还提出一种分布式网络系统的监控设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的分布式网络系统的监控程序,所述分布式网络系统的监控程序配置为实现如上文所述的分布式网络系统的监控方法的步骤。

此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有分布式网络系统的监控程序,所述分布式网络系统的监控程序被处理器执行时实现如上文所述的分布式网络系统的监控方法的步骤。

本发明提供的分布式网络系统的监控方案,通过将部署于分布式网络系统中任意网络设备分别看作一个独立的计算节点,在对网络设备的监控过程中,设置每一个计算节点自己来执行对应的监控任务,并收集本节点在虚拟网络层中产生的网络监控数据,然后根据预设的网络性能评估指标对收集到的网络监控数据进行分析,判断是否发生异常,若确定发生异常,则获取本节点的标识信息,并基于事件处理机制,将收集到的网络监控数据和标识信息封装成事件报文,最后只需将得到的事件报文发送至分布式网络系统中的控制节点(相当于中心服务器),即可完成对分布式网络系统中任意网络设备的监控。通过上述描述不难发现,本发明提供的分布式网络系统的监控方案,对各网络设备的监控是由网络设备自己完成的,需要中心服务器介入处理的操作从现有的对各网络设备的网络监控数据的分析处理,简化为仅需对发生异常的网络设备上报的事件报文进行简单处理,以告知监管人员网络设备存在的异常,因而大大减少了对中心服务器资源的占用,并且由于整个监控过程都是在网络设备本地完成,因而不会出现传输过程导致的网络监控数据丢失、异常等现象,所以也有效的保证了分析结果的准确性。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的分布式网络系统的监控设备的结构示意图;

图2为本发明分布式网络系统的监控方法第一实施例的流程示意图;

图3为本发明分布式网络系统的监控方法第二实施例的流程示意图;

图4为本发明分布式网络系统的监控装置第一实施例的结构框图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

参照图1,图1为本发明实施例方案涉及的硬件运行环境的分布式网络系统的监控设备结构示意图。

如图1所示,该分布式网络系统的监控设备可以包括:处理器1001,例如中央处理器(centralprocessingunit,cpu),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(wireless-fidelity,wi-fi)接口)。存储器1005可以是高速的随机存取存储器(randomaccessmemory,ram)存储器,也可以是稳定的非易失性存储器(non-volatilememory,nvm),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的结构并不构成对分布式网络系统的监控设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及分布式网络系统的监控程序。

在图1所示的分布式网络系统的监控设备中,网络接口1004主要用于与分布式网络系统中的控制节点、监管人员的终端设备进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明分布式网络系统的监控设备中的处理器1001、存储器1005可以设置在分布式网络系统的监控设备中,所述分布式网络系统的监控设备通过处理器1001调用存储器1005中存储的分布式网络系统的监控程序,并执行本发明实施例提供的分布式网络系统的监控方法。

本发明实施例提供了一种分布式网络系统的监控方法。

应当理解的是,分布式网络是由分布在不同地点且具有多个终端的节点机互连而成的。在分布式网络中,任一点均至少与两条线路相连,当任意一条线路发生故障时,通信可转经其他链路完成,具有较高的可靠性。同时,网络易于扩充。

因而,为了便于对分布式网络系统的监控,本发明提供了一种应用于分布式网络系统中的计算节点的监控方法,以下结合图2所示的分布式网络系统的监控方法的流程示意图,进行具体说明。

在本实施例中,所述分布式网络系统的监控方法包括以下步骤:

步骤s10,分布式网络系统中的计算节点执行对应的监控任务,收集虚拟网络层中的网络监控数据。

具体的说,本实施例中所说的计算节点指的是分布式网络系统中的连接点,其表示的是一个再分发点(redistributionpoint)或一个通信端点(一些网络设备,如计算机(无论其为个人计算机或服务器)、集线器、交换机、网桥、路由器、网关、网络接口卡(nic)、无线接入点(wap)、打印机和调制解调器、光纤收发器、光缆等),此处不再一一列举,对此也不做限制。

为了便于后续说明,本实施例以计算节点为个人计算机为例,则计算节点在执行对应的监控任务时,收集到虚拟网络层中的网络监控数据,具体可以是所述个人计算机在运行安装于其上的程序时产生的程序运行状态数据,或者是与所述个人计算机连接的其他网络设备的程序运行状态数据和连接各网络设备与所述个人计算机的网络链路的网络通讯状况数据,此处不再一一列举,对此也不做限制。

通过对上述信息的分析处理,从而可以确定说一声计算节点是否收到与之通信的网络设备的数据报文信息、所述计算节点上应用程序的活动性(例如接口程序是否正常运行等)、所述计算节点的网络连通性、稳定性等。

需要说明的是,在实际应中,运行在计算节点上的监控任务可以是直接集成在安装于计算节点上的监控程序内的一个监控事件;也可以是将监控任务单独存放在控制节点上,然后在需要收集与计算节点相关的网络监控数据时,将与各计算节点对应的监控任务下发至计算节点,然后由计算节点执行收集虚拟网络层中的网络监控数据的操作。

由于上述提到的第二种方式,在具体实现中式将监控程序内的功能,根据功能的不同模块化处理,将不同的功能模块单独存储管理,在监控程序中仅预留调用功能的接口,关于功能的具体实现,则是通过单独封装的程序、事件实现的。因而在具体应用中优选该方式,从而可以大大方便后期的维护,即开发人员和运维人员在对任意监控任务进行修改后,都无需重新更新安装于计算节点上的监控程序,这样不仅减少了工作人员的工作量,也可以有效降低维护成本。

为了便于理解上述方式的实现,以下给出一种从控制节点获取监控任务的具体方式,其实现过程大致如下:

首先,获取本节点的标识信息,根据所述标识信息生成监控任务获取请求。

具体的说,获取到的本节点的标识信息可以是当前计算节点在出厂时分配的设备号。因而在根据所述标识信息生成的监控任务获取请求,能够保证控制节点根据监控任务获取请求中携带的标识信息快速查找到与该计算节点对应的监控任务。

然后,将所述监控任务获取请求发送至所述控制节点,以使所述控制节点根据所述标识信息从存储节点中查找针对所述计算节点的监控任务。

具体的说,为了保证控制节点能够根据监控任务获取请求从存储节点中查找针对所述计算节点的监控任务,在存储节点中存储各计算节点能够知晓的监控任务时,可以选用计算节点对应的标识信息作为主键,从而在查找监控任务时,只需从监控任务获取请求中提取计算节点的标识信息,然后以提取到的标识信息作为索引,在存储节点中进行搜索即可。

最后,接收所述控制节点下发的监控任务并执行,收集虚拟网络层中符合所述监控任务的网络监控数据。

此外,值得一提的是,在具体实现中,在计算节点上执行的监控任务通常会规定收集所述网络监控数据时需要依据的网络指标,比如规定的网络指标为数据流量,则收集的网络监控数据则为不同时刻数据流量的使用情况的相关数据。

还比如,规定的网络指标为地址解析协议(addressresolutionprotocol,arp),则收集的网络监控数据则为不同时刻arp的数量。

此外,关于上述所说的收集虚拟网络层中符合所述监控任务的网络监控数据的操作,具体可以是:分时段收集网络虚拟层中所述网络指标对应的网络指标数据,然后将所述网络指标数据作为符合所述监控任务的网络监控数据。

需要说明的是,以上给出的仅为一种在计算节点执行对应的监控任务,收集虚拟网络层中的网络监控数据的具体实现方式,对本发明的技术方案并不构成限定,在具体实现中,本领域的技术人员可以根据需要设置,此处不做限制。

步骤s20,所述计算节点根据预设的网络性能评估指标对所述网络监控数据进行分析,判断是否发生异常。

为了便于理解,判断计算节点是否发生异常的操作,以下给出一种具体的实现方式,具体如下:

比如,首先由所述计算节点根据各时段的网络指标数据,计算所述网络指标对应的变化率。

具体的说,在计算所述变化率时,可以是由所述计算节点基于预设的分析模型对各时段的网络指标数据进行分析,得到所述网络指标在各时段的指标数值;接着,根据各时段的指标数值,计算所述网络指标对应的变化率。

需要说明的是,为了保证实际应用中对各时段的网络指标数据的分析能够顺利执行,分析过程中需要应用到的分析模型需要预先构建。并且,为了使后续预测结果更加精准,在本实施例中分析模型具体是基于深度机器学习法构建而来的。

具体的说,本实施例中所说的深度学习法具体是采用无监督学习方式(如深度置信网(deepbeliefnets,dbns))和有监督学习方式(如卷积神经网络(convolutionalneuralnetworks,cnns))相结合的方式,来构建所述分析模型。

由于深度学习法在实际应用中已经较为普遍,基于上述方式训练分析模型的过程,本领域的技术人员可以通过查找相关资料实现,此处不再赘述,对此也不做限制。

然后,在得到所述网络指标对应的变化率后,由所述计算节点根据预设的网络性能评估指标对所述变化率进行分析,判断是否发生异常,若所述变化率按照预设的网络性能评估指标的规定变化,则确定发生异常。

具体的说,本实施例中所说的预先设置的网络性能评估指标,可以根据执行的监控任务中规定的网络指标的来设置,比如在网络指标为数据流量时,网络性能评估指标可以包括双向网络延迟、网络带宽、网络性能稳定性等各项的正常通讯指标,并且规定变化率符合什么条件或按照什么规则变化时会认为发生异常。

还比如,在网络指标为arp时,网络性能评估指标可以包括arp的变化量等,此处不再一一列举,对此也不做限制。

比如说,在连续时间内,t1时刻计算节点处理的arp数量为n1,t2时刻处理的arp数量为n2,t3时刻处理的arp数量为n3。而设定的网络性能评估指标为:如果从t1时刻到t2时刻,t2时刻到t3时刻,每个时间点递增超过20%,则预测所述计算节点处理的arp数量按照当前变化率递增下去,将要出现异常。

需要说明的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,本领域的技术人员可以根据需要设置网络性能评估指标,此处不做限制。

步骤s30,若确定发生异常,则由所述计算节点获取本节点的标识信息,并基于事件处理机制,将所述网络监控数据和所述标识信息封装成事件报文。

具体的说,若确定发生异常的为当前计算节点,则获取的标识信息为标识当前计算节点唯一性的标识号,比如在该计算节点为个人计算机时,该标识信息则为所述个人计算机出厂时分配的设备号;若确定发生异常的为与所述计算节点通信的任意网络设备时,则获取的标识信息为标准该网络设备唯一性的标识号,同样可以是该网络设备出厂时分配的设备号,此处不再一一列举,对此也不做限制。

通过基于事件处理机制,封装事件报文发送至控制节点,使得控制节点可以根据收到的事件报文被动触发,即仅获取和处理预估可能发生故障的计算节点提供的数据,改变了现有控制节点(相对于主节点或者中心服务器)想要实现对网络中各种网络设备的监控必需通过轮询调用接口的方式去获取各网络设备的网络监控数据,然后进行分析判断哪一个网络设备存在异常的监控方式,从而有效的降低了对控制记得资源的消耗。

步骤s40,所述计算节点将所述事件报文发送至所述分布式系统中的控制节点,以使所述控制节点根据所述事件报文将所述计算节点存在的异常反馈给监管人员。

具体的说,为了使监管人员能够快速赶往发生异常的计算节点进行后续处理,所述计算节点将所述事件报文发送至所述分布式系统中的控制节点的时候,还可以获取本节点的位置坐标,然后将所述位置坐标和所述事件报文发送至所述控制节点,从而可以使所述控制节点根据所述事件报文将所述计算节点存在的异常反馈给监管人员,并根据所述位置坐标告知所述监管人员所述计算节点所处的位置。

进一步地,为了保证发送给监管人员的位置坐标足够精确,还可以对获取到的位置坐标进行修正,得到修正后的位置坐标,然后将事件报文和修正后的位置坐标发送给控制节点,以使所述控制节点根据所述事件报文将所述计算节点存在的异常反馈给监管人员,并根据所述修正后的位置坐标告知所述监管人员所述计算节点所处的位置。

为了便于理解,以下给出一种具体的方式,进行说明:

首先,获取所述计算节点的第一位置坐标。

具体的说,如果计算节点为固定不会运动的,则获取到的第一位置坐标是当初部署计算节点时预设的位置坐标;如果计算节点是可以移动的,则获取的第一位置坐标具体可以通过计算节点内部的卫星定位模块采集到的实时位置坐标。

然后,根据所述第一位置坐标,选取定位差分基站,并获取所述定位差分基站对应的目标差分值。

具体的说,上述所说的定位差分基站,具体可以是采用实时动态(real-timekinematic,rtk)载波相位差分技术制备的专用定位设备进行定位校正处理的设备,其位置坐标可以看出是绝对位置坐标。

最后,根据所述目标差分值,对所述第一位置坐标进行修正,获得第二位置坐标,并将所述第二位置坐标作为所述计算节点当前所处的位置坐标。

即,在所述第一位置坐标的基础上,增加或减去目标差分值,以使第一位置坐标的精确度能够与定位差分基站的绝对位置坐标具有相同的精度。

此外,值得一提的是,为了减少不必要的投入,本实施例中所说的定位差分基站具体可以选用目前较为常见的路灯。这是因为,在当前的城市建设中,路灯已经是必不可少的基础设备,并且为了方便对不同区域设置的路灯维护和管理,通常会在路灯内设置其所处为在的坐标信息,并且为了保证其精确度,在安装路灯时,还会采用实时动态(real-timekinematic,rtk)载波相位差分技术制备的专用定位设备对路灯的坐标进行校准,从而便可确定路灯的绝对位置坐标。因而,本实施例中选用具有绝对位置坐标的路灯作为定位差分基站,在不增加资金投入的情况下,就可以实现对计算节点的第一位置坐标的修正,从而获取到计算节点的绝对位置坐标,进而保证管理人员能够快速找到计算节点。

为了便于理解,以下针对所述定位差分基站为路灯时,所述根据所述第一位置坐标,选取定位差分基站时所作的操作进行简要说明。

比如,可以通过根据所述第一位置坐标,查找距离所述第一位置坐标最近的路灯,将距离所述第一位置坐标最近的路灯确定为定位差分基站。

此外,应当理解的是,上述所说的根据所述第一位置坐标,查找距离所述第一位置坐标最近的路灯,在具体应用中,可以通过如下操作实现:获取预设区域内所有路灯的位置坐标,所述预设区域为以所述第一位置坐标为圆心,以预设长度为半径确定的区域;将所述第一位置坐标与获取到的各路灯的位置坐标进行对比,确定距离所述第一位置坐标最近的位置坐标;将确定的所述位置坐标对应的路灯作为距离所述第一位置坐标最近的路灯。

需要说明的,以上仅为举例说明,对本发明的技术方案并不构成任何限定,本领域的技术人员可以根据需要选取修正位置坐标的方式,此处不做限制。

此外,值得一提的是,由于本实施例是以计算节点为执行主体进行方案描述的,因而为了便于说明,在上述部分步骤的描述中省略掉了执行主体,但是并不影响对方案的理解。

本实施例提供的分布式网络系统的监控方法,通过将部署于分布式网络系统中任意网络设备分别看作一个独立的计算节点,在对网络设备的监控过程中,设置每一个计算节点自己来执行对应的监控任务,并收集本节点在虚拟网络层中产生的网络监控数据,然后根据预设的网络性能评估指标对收集到的网络监控数据进行分析,判断是否发生异常,若确定发生异常,则获取本节点的标识信息,并基于事件处理机制,将收集到的网络监控数据和标识信息封装成事件报文,最后只需将得到的事件报文发送至分布式网络系统中的控制节点(相当于中心服务器),即可完成对分布式网络系统中任意网络设备的监控。

也就是说,对各网络设备的监控是由网络设备自己完成的,需要中心服务器介入处理的操作从现有的对各网络设备的网络监控数据的分析处理,简化为仅需对发生异常的网络设备上报的事件报文进行简单处理,以告知监管人员网络设备存在的异常,因而大大减少了对中心服务器资源的占用,并且由于整个监控过程都是在网络设备本地完成,因而不会出现传输过程导致的网络监控数据丢失、异常等现象,所以也有效的保证了分析结果的准确性。

此外,通过上述描述不难发现,所述分布式网络系统中的控制节点与计算节点遵循客户机/服务器模式,即client/server结构(c/s结构)。

由于c/s结构的优点是能充分发挥客户机(本案中的计算节点)的处理能力,很多工作可以在客户机处理后再提交给服务器(本案中的控制节点),因而可以及时准确的对网络进行监控预警,并且可以有效缓解对服务器资源的占用。

参考图3,图3为本发明一种分布式网络系统的监控方法第二实施例的流程示意图。

基于上述第一实施例,本实施例分布式网络系统的监控方法在所述步骤s40之后,还包括:

步骤s50,所述计算节点根据所述监控任务,确定所述计算节点处理的业务。

具体的说,在实际应用中,不同的监控任务通常会监控计算节点处理的不同业务,因而通过根据计算节点当前执行的监控任务便可确定计算节点当前处理的业务。

步骤s60,所述计算节点根据所述网络监控数据,确定导致异常的业务的业务特征信息。

应当理解的是,由于不同的业务所能够实现的功能,达到的效果会有所差异,因而不通过的业务在处理过程中产生的网络监控数据也会有所不同。因而,根据得到网络监控数据,辅以各业务的预设信息,便可以确定导致异常的业务的业务特征信息。

步骤s70,所述计算节点将所述业务特征信息发送至所述控制节点。

具体的说,在确定导致异常的业务的业务特征信息后,通过将所述业务特征信息发送至所述控制节点,从而可以使所述控制节点能够根据所述业务特征信息生成管控指令,并将所述管控指令分发至分布式网络系统中与所述计算节点有业务关系的计算节点,使其他计算节点拒绝处理导致异常的所述业务。

本实施例提供的分布式网络系统的监控方法,在确定当前计算节点存在异常,并将封装成的事件报文发送至控制节点之后,通过根据执行的监控任务和收集到的网络监控数据来确定计算节点处理的业务以及导致异常的业务的业务特征信息,然后将得到的业务特征信息发送给控制节点,从而可以使得控制节点根据所述业务特征信息生成管控指令,并将所述管控指令分发至分布式网络系统中与所述计算节点有业务关系的计算节点,使其他计算节点拒绝处理导致异常的所述业务。即能够尽可能的减少其他计算节点出现相同的异常,从而有效保证了分布式网络系统的稳定性。

此外,本发明实施例还提出一种存储介质,所述存储介质上存储有分布式网络系统的监控程序,所述分布式网络系统的监控程序被处理器执行时实现如上文所述的分布式网络系统的监控方法的步骤。

参照图4,图4为本发明分布式网络系统的监控装置第一实施例的结构框图。

如图4所示,本发明实施例提出的分布式网络系统的监控装置包括:数据收集模块4001、异常判断模块4002、报文封装模块4003和报文发送模块4004。

其中,数据收集模块4001,用于执行对应的监控任务,收集虚拟网络层中的网络监控数据;异常判断模块4002,用于根据预设的网络性能评估指标对所述网络监控数据进行分析,判断是否发生异常;报文封装模块4003,用于若确定发生异常,则获取本节点的标识信息,并基于事件处理机制,将所述网络监控数据和所述标识信息封装成事件报文;报文发送模块4004,用于将所述事件报文发送至分布式网络系统中的控制节点,以使所述控制节点根据所述事件报文将所述计算节点存在的异常反馈给监管人员。

需要说明的是,在实际应中,运行在计算节点上的监控任务可以是直接集成在安装于计算节点上的监控程序内的一个监控事件;也可以是将监控任务单独存放在控制节点上,然后在需要收集与计算节点相关的网络监控数据时,将与各计算节点对应的监控任务下发至计算节点,然后由计算节点执行收集虚拟网络层中的网络监控数据的操作。

由于上述提到的第二种方式,在具体实现中式将监控程序内的功能,根据功能的不同模块化处理,将不同的功能模块单独存储管理,在监控程序中仅预留调用功能的接口,关于功能的具体实现,则是通过单独封装的程序、事件实现的。因而在具体应用中优选该方式,从而可以大大方便后期的维护,即开发人员和运维人员在对任意监控任务进行修改后,都无需重新更新安装于计算节点上的监控程序,这样不仅减少了工作人员的工作量,也可以有效降低维护成本。

为了便于理解上述方式的实现,以下给出一种从控制节点获取监控任务的具体方式,其实现过程大致如下:

首先,获取本节点的标识信息,根据所述标识信息生成监控任务获取请求。

具体的说,获取到的本节点的标识信息可以是当前计算节点在出厂时分配的设备号。因而在根据所述标识信息生成的监控任务获取请求,能够保证控制节点根据监控任务获取请求中携带的标识信息快速查找到与该计算节点对应的监控任务。

然后,将所述监控任务获取请求发送至所述控制节点,以使所述控制节点根据所述标识信息从存储节点中查找针对所述计算节点的监控任务。

具体的说,为了保证控制节点能够根据监控任务获取请求从存储节点中查找针对所述计算节点的监控任务,在存储节点中存储各计算节点能够知晓的监控任务时,可以选用计算节点对应的标识信息作为主键,从而在查找监控任务时,只需从监控任务获取请求中提取计算节点的标识信息,然后以提取到的标识信息作为索引,在存储节点中进行搜索即可。

最后,接收所述控制节点下发的监控任务并执行,收集虚拟网络层中符合所述监控任务的网络监控数据。

此外,值得一提的是,在具体实现中,在计算节点上执行的监控任务通常会规定收集所述网络监控数据时需要依据的网络指标,比如规定的网络指标为数据流量,则收集的网络监控数据则为不同时刻数据流量的使用情况的相关数据。

还比如,规定的网络指标为地址解析协议(addressresolutionprotocol,arp),则收集的网络监控数据则为不同时刻arp的数量。

此外,关于上述所说的收集虚拟网络层中符合所述监控任务的网络监控数据的操作,具体可以是:分时段收集网络虚拟层中所述网络指标对应的网络指标数据,然后将所述网络指标数据作为符合所述监控任务的网络监控数据。

需要说明的是,以上给出的仅为一种在计算节点执行对应的监控任务,收集虚拟网络层中的网络监控数据的具体实现方式,对本发明的技术方案并不构成限定,在具体实现中,本领域的技术人员可以根据需要设置,此处不做限制。

此外,值得一提的是,在具体实现中异常判断模块4002可以具体细化为变化率计算子模块和变化率分析子模块。

相应地,所述变化率计算子模块,主要用于根据各时段的网络指标数据,计算所述网络指标对应的变化率;所述变化率分析子模块,主要用于根据预设的网络性能评估指标对所述变化率进行分析,判断是否发生异常,并在所述变化率按照预设的网络性能评估指标的规定变化时,确定发生异常。

需要说明的是,以上仅为举例说明,对本发明的技术方案并不构成限定,在具体实现中,本领域的技术人员可以根据需要对各功能模块进行划分,此处不做限制。

此外,为了使监管人员能够快速赶往发生异常的计算节点进行后续处理,本实施例中所说的报文发送模块4004可以具体划分为位置获取子模块和异常信息发送子模块。

具体的,所述位置获取子模块,用于获取本节点的位置坐标;所述异常信息发送子模块,用于将所述位置坐标和所述事件报文发送至所述控制节点。

通过上述描述不难发现,报文发送模型4004在将所述事件报文发送至控制节点的时候,通过将计算节点的位置坐标也发送给控制节点,从而可以使所述控制节点根据所述事件报文将所述计算节点存在的异常反馈给监管人员,并根据所述位置坐标告知所述监管人员所述计算节点所处的位置,使得监管人员能够快速赶往发生异常的计算节点进行后续处理。

此外,值得一提的是,为了保证位置坐标的精确度,在获取到上述位置坐标之后,还可以基于差分定位技术对所述位置坐标进行修正,以得到修正后的位置坐标。

相应地,所述将所述位置坐标和所述事件报文发送至所述控制节点,则变为将所述修正后的位置坐标和所述事件报文发送至所述控制节点。

需要说明的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体实现中,本领域的技术人员可以根据需要设置,此处不做限制。

此外,应当理解的是,本实施例中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施例中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。

本实施例提供的分布式网络系统的监控装置,通过将部署于分布式网络系统中任意网络设备分别看作一个独立的计算节点,在对网络设备的监控过程中,设置每一个计算节点自己来执行对应的监控任务,并收集本节点在虚拟网络层中产生的网络监控数据,然后根据预设的网络性能评估指标对收集到的网络监控数据进行分析,判断是否发生异常,若确定发生异常,则获取本节点的标识信息,并基于事件处理机制,将收集到的网络监控数据和标识信息封装成事件报文,最后只需将得到的事件报文发送至分布式网络系统中的控制节点(相当于中心服务器),即可完成对分布式网络系统中任意网络设备的监控。

也就是说,对各网络设备的监控是由网络设备自己完成的,需要中心服务器介入处理的操作从现有的对各网络设备的网络监控数据的分析处理,简化为仅需对发生异常的网络设备上报的事件报文进行简单处理,以告知监管人员网络设备存在的异常,因而大大减少了对中心服务器资源的占用,并且由于整个监控过程都是在网络设备本地完成,因而不会出现传输过程导致的网络监控数据丢失、异常等现象,所以也有效的保证了分析结果的准确性。

需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制

另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的分布式网络系统的监控方法,此处不再赘述。

基于上述分布式网络系统的监控装置的第一实施例,提出本发明分布式网络系统的监控装置第二实施例。

在本实施例中,所述分布式网络系统的监控装置还包括业务确定模块、业务特征信息确定模块和业务特征信息发送模块。

其中,所述业务确定模块,用于根据所述监控任务,确定所述计算节点处理的业务;所述业务特征信息确定模块,用于根据所述网络监控数据,确定导致异常的业务的业务特征信息;所述业务特征信息发送模块将所述业务特征信息发送至所述控制节点,以使所述控制节点根据所述业务特征信息生成管控指令,并将所述管控指令分发至分布式网络系统中与所述计算节点有业务关系的计算节点,使其他计算节点拒绝处理导致异常的所述业务。

本实施例提供的分布式网络系统的监控装置,在确定当前计算节点存在异常,并将封装成的事件报文发送至控制节点之后,通过根据执行的监控任务和收集到的网络监控数据来确定计算节点处理的业务以及导致异常的业务的业务特征信息,然后将得到的业务特征信息发送给控制节点,从而可以使得控制节点根据所述业务特征信息生成管控指令,并将所述管控指令分发至分布式网络系统中与所述计算节点有业务关系的计算节点,使其他计算节点拒绝处理导致异常的所述业务。即能够尽可能的减少其他计算节点出现相同的异常,从而有效保证了分布式网络系统的稳定性。

需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。

另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的分布式网络系统的监控方法,此处不再赘述。

此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(readonlymemory,rom)/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1