一种节点设备的运维方法及系统与流程

文档序号：18009214发布日期：2019-06-25 23:47阅读：196来源：国知局

本发明涉及信息处理技术领域，特别涉及一种节点设备的运维方法及系统。

背景技术：

在集群系统比如内容分发网络(contentdeliverynetwork，cdn)系统总一般包括多个节点设备及可以管理多个节点设备的中控系统，这样，通过多个节点设备之间的配合，共同处理外网的业务请求，从而可以提高对业务请求的处理效率；而中控系统可以监控在该中控系统管理下的节点设备的状态，如果某些节点设备异常，则中控系统会下发自杀命令或其它踢出集群命令等给异常的节点设备，实现异常的节点设备自动运维功能。

但是在集群系统的实践过程中，由于集群系统中的节点设备的数量较多，不同节点设备的状态复杂多变，即使通过中控系统监控各个节点设备，也会出现由于不在中控系统监管内的节点设备突然加入集群服务而中控系统无法感知的问题，也会出现由于某些异常的节点设备仍然在线网服务而导致用户访问失败的问题。

技术实现要素：

本发明实施例提供一种节点设备的运维方法及系统，实现了对集群系统中所有节点设备的自动运维。

本发明实施例第一方面提供一种节点设备的运维方法，包括：

统计集群系统中所有节点设备分别对应的来源流量信息，及统计所有节点设备分别与所述集群系统中的中控系统的配置心跳状态；

如果所述多个节点设备中待运维的节点设备的来源流量信息与配置心跳状态所指示的所述待运维的节点设备是否异常的信息不一致，确定所述待运维的节点设备的运维处理信息包括禁用的信息；

根据所述禁用的信息，将所述待运维的节点设备退出所述集群系统的服务中。

本发明实施例第二方面提供一种节点设备的运维系统，包括：

统计单元，用于统计集群系统中所有节点设备分别对应的来源流量信息，及统计所有节点设备分别与所述集群系统中的中控系统的配置心跳状态；

分析确定单元，用于如果所述多个节点设备中待运维的节点设备的来源流量信息与配置心跳状态所指示的所述待运维的节点设备是否异常的信息不一致，确定所述待运维的节点设备的运维处理信息包括禁用的信息；

运维单元，用于根据所述禁用的信息，将所述待运维的节点设备退出到所述集群系统的服务中。

本发明实施例第三方面提供一种存储介质，所述存储介质储存多条指令，所述指令适于由处理器加载并执行如本发明实施例第一方面所述的节点设备的运维方法。

本发明实施例第四方面提供一种服务器，包括处理器和存储介质，所述处理器，用于实现各个指令；所述存储介质用于储存多条指令，所述指令用于由处理器加载并执行如本发明实施例第一方面所述的节点设备的运维方法。

在本实施例的方法中，节点设备的运维系统会统计集群系统中所有节点设备分别对应的来源流量信息和与中控系统的配置心跳状态，如果所有节点设备中待运维的节点设备的来源流量信息和配置心跳状态所指示的待运维的节点设备是否异常的信息不一致，确定对待运维的节点设备的运维处理信息为禁用的信息，则将待运维的节点设备退出集群系统的服务中。这样，如果部署在集群系统中的有些节点设备由于故障未加入到中控系统的管理下，当这些节点设备恢复正常后，导致集群系统的对外服务异常，比如对外产生404信息，这些情况虽然不能被中控系统所感知，但是可以通过本实施例中节点设备的运维系统所执行的运维方法禁用这些节点设备。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种节点设备的运维方法所应用于的系统的结构示意图；

图2是本发明实施例提供的一种节点设备的运维方法的流程图；

图3是本发明应用实施例提供的一种节点设备的运维方法的流程图；

图4a是本发明应用实施例中终端设备显示的来源流量信息和配置心跳状态的示意图；

图4b是本发明应用实施例中终端设备显示的对待运维的节点设备进行运维处理的结果信息的示意图；

图4c是本发明应用实施例中终端设备显示的对机房禁用的详细情况的示意图；

图5是本发明实施例提供的一种节点设备的运维系统的结构示意图；

图6是本发明实施例提供的一种服务器的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排它的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明实施例提供一种节点设备的运维方法，主要是对如图1所示的集群系统中的各个节点设备进行监控，从而实现对各个节点设备的自动运维。在该集群系统中可以包括中控系统和多个节点设备，本实施例中可以通过节点设备的运维系统监控集群系统中的各个节点设备，并对节点设备进行自动运维，比如对异常的节点设备禁用，对正常的节点设备恢复启用等。

具体地，本发明实施例中节点设备的运维系统可以通过如下的步骤实现对节点设备的运维：

统计集群系统中所有节点设备分别对应的来源流量信息，及统计所有节点设备分别与所述集群系统中的中控系统的配置心跳状态；如果所述多个节点设备中待运维的节点设备的来源流量信息与配置心跳状态所指示的所述待运维的节点设备是否异常的信息不一致，确定所述待运维的节点设备的运维处理信息包括禁用的信息；根据所述禁用的信息，将所述待运维的节点设备退出集群系统的服务中。

在实际的应用过程中，在节点设备的运维系统中可以包括监控装置和调度器，其中，监控装置主要是执行上述统计来源流量信息和配置心跳状态，及确定运维处理信息的步骤；调度器用于根据监控装置确定的运维处理信息，对相应的节点设备进行运维处理。

进一步地，在节点设备的运维系统中还可以包括终端设备，该终端设备可以显示节点设备的运维系统执行的各个步骤的执行结果，比如显示节点设备的运维系统统计的各个节点设备的来源流量信息和配置心跳状态等。

这样，如果部署在集群系统中的有些节点设备由于故障未加入到中控系统的管理下，当这些节点设备恢复正常后，导致集群系统的对外服务异常，比如对外产生404信息，这些情况虽然不能被中控系统所感知，但是可以通过本实施例中节点设备的运维系统所执行的运维方法禁用这些节点设备。

本发明实施例提供一种节点设备的运维方法，主要是由上述节点设备的运维系统所执行的方法，流程图如图2所示，包括：

步骤101，统计集群系统中所有节点设备分别对应的来源流量信息，及统计所有节点设备分别与集群系统中的中控系统的配置心跳状态。

这里集群系统中所有节点设备是指通常通过快速局域网连接方式，比如组播的方式，连接的多个节点设备，这些节点设备对外呈现出相同的网络地址。比如在快播应用平台下，有多个机房，而每个机房中包括通过组播方式连接的多个(比如10个)机器，这些机器对外提供服务，实现共享存储等功能，这样每个机房可以称为一个集群系统，而机房中的机器为集群系统中的节点设备。

可以理解，节点设备的运维系统中的监控装置可以按照一定的周期发起本实施例的方法；或者，用户可以通过操作节点设备的运维系统中包括的终端设备，使得终端设备向节点设备的运维系统中的监控装置发起本实施例的方法。

其中，节点设备的运维系统统计的各个节点设备的来源流量信息是指节点设备接收的请求的信息，比如请求的来源途径等信息，具体可以包括节点设备接收到集群系统内部透传请求的信息，及节点设备接收到的集群系统之外的其它设备发送的访问请求的信息等。其中，其它设备发送的访问请求的信息可以包括是否为开放式最短路径优先(openshortestpathfirst，ospf)协议访问请求等信息。

而节点设备与中控系统的配置心跳状态主要包括节点设备与中控系统之间的网络是否连通的状态，及节点设备的业务配置信息与中控系统上储存的业务配置是否一致的状态(即节点设备的业务配置信息是否具有时效性)等。由于在集群系统中，处于中控系统管理下的节点设备会按照一定的周期发送配置心跳信息给中控系统，这样，中控系统会根据节点设备发送的配置心跳信息确定节点设备与中控系统之间的网络是否连通，及业务配置信息是否有时效性，以保证节点设备的业务配置是最新的等，因此，在本实施例中，节点设备的运维系统统计的节点设备对应的配置心跳状态时，可以统计节点设备在一定时间段内向中心系统发送配置心跳信息的情况，比如发送配置心跳信息的频率等，及中控系统根据配置心跳信息向节点设备备返回的信息，比如返回配置心跳超时等信息。

其中，如果某一节点设备在一段时间内都未发送配置心跳信息，说明节点设备与中控系统之间的连接断开；如果配置心跳超时，说明节点设备与中控系统之间的网络连接不稳定或节点设备的业务配置信息不具有时效性等。这里，节点设备的业务配置信息主要是指节点设备在处理业务数据时的信息。

步骤102，根据上述来源流量信息和/或配置心跳状态，确定多个节点设备中待运维的节点设备的运维处理信息。

这里待运维的节点设备是多个节点设备中的部分节点设备，可以是一个或多个；每个待运维的节点设备的运维处理信息可以为：禁用节点设备，或恢复启用节点设备，或对节点设备进行运维关注等。

具体地，节点设备的运维系统在确定待运维的节点设备的运维处理信息时，可以包括但不限于如下几种情况：

(1)节点设备的运维系统根据节点设备的来源流量信息和配置心跳状态，确定待运维的节点设备的运维处理信息是否包括禁用的信息。

具体地，某一节点设备的来源流量信息与配置心跳状态指示的待运维的节点设备是否异常的信息不一致，比如，节点设备的来源流量信息指示该节点设备能正常接收请求；而该节点设备的配置心跳状态指示该节点设备与中控系统未连接，即该节点设备未在中控系统的管理下，或该节点设备当前的业务配置信息不具有时效性。说明该节点设备异常，或者该节点设备之前可能发生故障，使得该节点设备不在中控系统的管理下或业务配置信息未更新，但是之后该节点设备又恢复正常，可以接收集群系统内部透传请求，和/或，集群系统之外其它设备的访问请求，会导致集群系统的对外服务异常，比如产生404信息。

在这种情况下，节点设备的运维系统会确定该节点设备的运维处理信息包括禁用的信息，则该节点设备为待运维的节点设备。

(2)节点设备的运维系统直接根据节点设备的配置心跳状态，确定待运维的节点设备的运维处理信息是否包括禁用的信息。具体地，如果某一节点设备的配置心跳状态指示该节点设备与中控系统的连接异常或者该节点设备的业务配置信息不具有时效性，比如，该节点设备发送配置心跳信息给中控系统的频率不稳定，比如在一段时间内，发送配置心跳信息的频率高，在另一段时间内，发送配置心跳信息的频率低等，说明该节点设备与中控系统的连接异常。

在这种情况下，节点设备的运维系统会确定该节点设备的运维处理信息包括为禁用的信息，则该节点设备为待运维的节点设备。

(3)如果节点设备的运维系统直接根据节点设备的来源流量信息，确定待运维的节点设备的运维处理信息是否包括禁用的信息。具体地，如果同一集群系统中的多个节点设备之间的来源流量信息中集群系统内部透传请求严重不一致。

在这种情况下，节点设备的运维系统会确定集群系统中多个节点设备为待运维的节点设备，这多个节点设备的运维处理信息分别包括禁用的信息。

(4)如果节点设备的运维系统直接根据节点设备的来源流量信息和配置心跳状态，确定待运维的节点设备的运维处理信息包括恢复启用的信息。具体地，如果某一节点设备的来源流量信息指示该节点设备正常接收请求，但是该节点设备的配置心跳状态为空，比如该节点设备为新加入到集群系统中的节点设备，与中控系统之间还未通信，则该节点设备的配置心跳状态为空。

在这种情况下，节点设备的运维系统会确定该节点设备为待运维的节点设备，该节点设备的运维处理信息包括恢复启用的信息。

(5)节点设备的运维系统根据节点设备的来源流量信息和配置心跳状态，确定待运维的节点设备的运维处理信息是否包括运维关注的信息。具体地，如果某一节点设备的来源流量信息指示该节点设备未接收任何请求；而该节点设备的配置心跳状态指示该节点设备与中控系统正常连接，即该节点设备在中控系统的管理下，且该节点设备的业务配置信息具有时效性。

在这种情况下，节点设备的运维系统会确定该节点设备的运维处理信息包括运维关注的信息，则该节点设备为待运维的节点设备。

且需要说明的是，如果节点设备的运维系统确定待运维的节点的运维处理信息包括禁用或恢复启用的同时，还可以包括运维关注的信息，这样，如果对某些节点设备禁用或恢复启用的运维处理有误时，可以及时修正对这些节点设备的运维。

步骤103，如果确定多个节点设备中待运维的节点设备的运维处理信息包括禁用的信息，根据禁用的信息，将待运维的节点设备退出集群系统的服务中。

具体地，节点设备的运维系统中的监控装置可以将确定的运维处理信息发送给调度器，由调度器进行运维处理。

如果运维处理信息为对待运维的节点设备恢复启用的信息，调度器会配置待运维的节点设备加入到集群系统的服务中，这样待运维的节点设备会加入中控系统的管理，会发送配置心跳信息给中控系统，接收外网的访问请求；如果禁用待运维的节点设备的信息，则调度器会配置待运维的节点设备退出集群系统的服务中，这样待运维的节点设备不会发送配置心跳信息给中控系统，也不会接收外网的访问请求。

需要说明的是，如果待运维的节点设备为集群系统中的所有节点设备，则调度器可以配置该集群系统退出对外网的服务或加入对外网的服务。且如果节点设备的运维系统对待运维的节点设备的自动运维失败，可以通过该系统中的终端设备发送告警信息，以提示用户手动禁用或恢复启用待运维的节点。

进一步地，如果运维处理信息为对待运维的节点设备进行运维关注的信息，则节点设备的运维系统会将对待运维的节点设备进行运维关注的信息直接发送给终端设备进行显示。这样终端设备会提示用户关注节点设备的运维系统对待运维的节点设备的自动运维，如果对某些节点设备禁用或恢复启用的运维处理有误时，可以及时修正对这些节点设备的运维。

另外，需要说明的是，由于一个集群系统中的节点设备可以为多个应用平台进行服务，上述禁用或恢复启用或运维关注待运维的节点设备，是指将待运维的节点设备退出或加入集群系统基于一个或多个应用的服务，或对待运维的节点设备基于一个或多个应用的服务进行运维关注，至于具体针对哪个应用，就需要根据上述步骤101中获取的来源流量信息和配置心跳状态来决定。

进一步地，节点设备的运维系统还会将上述步骤101到103中各个步骤的执行结果都发送给节点设备的运维系统中的终端设备进行显示。比如，将上述步骤101统计的来源流量信息和配置心跳状态、上述步骤102确定的运维处理信息及步骤103中根据运维处理信息的运维处理结果发送给终端设备进行显示。

如果上述步骤102确定的运维处理信息为禁用待运维的节点设备的信息，节点设备的运维系统还会将恢复启用待运维的节点设备的接口信息发送给终端设备进行显示，这样终端设备会显示恢复启用待运维的节点设备的接口，用户可以操作该接口，使得终端设备通过接口信息，发起对待运维的节点设备的恢复启用。

如果上述步骤102确定的运维处理信息为恢复启用待运维的节点设备的信息，节点设备的运维系统还会将禁用待运维的节点设备的接口信息发送给终端设备进行显示，使得用户通过终端设备显示的接口信息，发起对待运维的节点设备的禁用。

这样，可以如果节点设备的运维系统对有些节点设备禁用失误时，可以通过终端设备显示的接口来恢复启用这些节点设备，提高了节点设备的运维系统的容错性。

可见，在本实施例的方法中，节点设备的运维系统会统计集群系统中所有节点设备分别对应的来源流量信息和与中控系统的配置心跳状态，如果所有节点设备中待运维的节点设备的来源流量信息和配置心跳状态所指示的待运维的节点设备是否异常的信息不一致，确定对待运维的节点设备的运维处理信息为禁用的信息，则将待运维的节点设备退出集群系统的服务中。这样，如果部署在集群系统中的有些节点设备由于故障未加入到中控系统的管理下，当这些节点设备恢复正常后，导致集群系统的对外服务异常，比如对外产生404信息，这些情况虽然不能被中控系统所感知，但是可以通过本实施例中节点设备的运维系统所执行的运维方法禁用这些节点设备。

以下一个具体的应用实例来说明本发明中节点设备的运维方法，本实施例的方法可以应用于如图1所述的系统中，在本实施例中的方法可以包括如下两个部分：

(一)节点设备的运维系统对节点设备的自动运维可以包括如下步骤，流程图如图3所示，包括：

步骤201，节点设备的运维系统中的监控装置会按照一定的周期监控集群系统中所有节点设备的来源流量信息和与中控系统的配置心跳状态。其中，来源流量信息可以包括集群系统内部透传请求的信息，及集群系统之外的其它设备的访问请求，比如ospf请求的信息；配置心跳状态可以包括节点设备发送配置心跳信息的情况。

步骤202，监控装置获取现网服务设备信息和运维业务的配置信息等信息。其中，现网服务设备信息主要是指集群系统中对外提供服务的各个节点设备的信息，比如集群系统中哪些节点设备提供服务等；运维业务的配置信息是指对集群系统中各个节点设备是否进行自动运维的配置信息等，这些配置信息可以事先储存到节点设备的运维系统中。

步骤203，监控装置根据上述步骤201获取的各个节点设备的来源流量信息和配置心跳状态，及步骤202获取的信息，确定集群系统中所有节点设备的待运维的节点设备的运维处理信息。

具体地，监控装置可以根据步骤202中获取的运维业务的配置信息，针对需要进行自动运维的节点设备，确定步骤202中获取的现网服务设备信息与步骤201监控的信息是否一致，如果一致，可以继续按照上述实施例中的方法确定运维处理信息；如果不一致，则可以直接禁用信息不一致的节点设备，比如现网服务器设备信息指示某一机房的某些节点设备提供某一应用下的服务，而在上述步骤201的监控步骤中，得到该机房的这些节点设备不会接收该应用下的请求，则可以禁用该机房在该应用下进行服务。

其中，对于需要恢复启用的待运维的节点设备1，监控装置执行步骤204；对于需要禁用的待运维的节点设备2，监控装置执行步骤205；对于需要运维关注的待运维的节点设备3，监控装置执行步骤206。

步骤204，监控装置联动节点设备的运维系统中的调度器，通过调度器恢复启用待运维的节点设备1。

步骤205，监控装置联动节点设备的运维系统中的调度器，通过调度器强制禁用待运维的节点设备2。

步骤206，监控装置会直接将对待运维的节点设备3进行运维关注的信息，发送给节点设备的运维系统中的终端设备进行显示。

(二)节点设备的运维系统中的监控装置和调度器会将执行的各个步骤的执行结果发送给运维系统中的终端设备进行显示。

例如图4a所示为终端设备显示的监控装置获取的多个节点设备的来源流量信息和配置心跳状态。具体地，终端设备显示监控装置所监控的集群系统的信息，包括集群系统对应的业务平台、机房、集群信息、ospf信息、配置心跳信息(比如配置心跳超时)和备注等，其中，集群信息为集群系统内部透传请求的信息。

例如图4b所示为终端设备显示的通过调度器对待运维的节点设备进行运维处理的结果信息。具体地，终端设备显示对各个节点设备进行运维处理的信息，包括集群系统对应的业务平台、机房、禁用或告警时间、恢复启用时间、备注和恢复接口，其中，一个业务平台可以对应多个机房，每个机房为一个计量单位的集群系统。

例如，对于业务平台2中某一地区连通机房的集群系统，在t4时刻将该机房的节点设备恢复启用后，在t3时刻又将该机房的阶段设备禁用，该机房的节点设备处于已禁用的状态。这样，终端设备还会显示该机房的节点设备的恢复接口，比如“手动恢复”的按钮，用户可以点击该“手动恢复”的按钮，使得终端设备发起恢复启用该机房的节点设备。

在各个机房的“备注”项中，还会显示“查看详情”的按钮，当用户点击“查看详情”的按钮，这样，终端设备可以显示节点设备被禁用或恢复启动的具体信息。例如图4c所示为终端设备显示的某一“备注”的具体信息，包括：

对某一视频应用品台的某一电信机房，且机房在集群系统内和外的路由地址分别为“172.21.165.47”和“27.152.185.77”，节点设备的运维系统的运维处理的结果信息，具体为：由于该机房的配置心跳超时，但是该机房又处于集群系统的服务中，因此对该机房进行禁用，且成功。

可见，通过本实施例的方法，可以实现如下效果：

1、保证了所有属于集群系统的中控系统管理的所有节点设备都是正常的。

2、保证了不在中控系统管理的节点设备加入到集群系统时，能及时恢复启用这些节点设备并通过终端设备告知运维人员。

3、保证了同一集群系统下多个节点设备的来源流量信息不一致时，可以通过终端设备告知运维人员。

4、实现了对集群系统中各个节点设备的监控和运维的信息通过终端设备进行展示。

本发明实施例还提供一种节点设备的运维系统，其结构示意图如图5所示，具体可以包括：

统计单元10，用于统计集群系统中所有节点设备分别对应的来源流量信息，及统计所有节点设备分别与所述集群系统中的中控系统的配置心跳状态。

该统计单元10，具体用于统计所述所有节点设备中各个节点设备接收的集群内部透传请求的信息，及所述各个节点设备接收所述集群系统之外的其它设备的访问请求的信息。

分析确定单元11，用于如果所述统计单元10统计的多个节点设备中待运维的节点设备的来源流量信息与配置心跳状态所指示的所述待运维的节点设备是否异常的信息不一致，确定所述待运维的节点设备的运维处理信息包括禁用的信息。

该分析确定单元11，具体用于如果待运维的节点设备的来源流量信息指示所述待运维的节点设备正常接收请求，所述待运维的节点设备的配置心跳状态指示所述待运维的节点设备与中控系统未连接或待运维的节点设备的业务配置信息不具有时效性，则确定所述待运维的节点设备的运维处理信息包括禁用的信息。

运维单元12，用于根据所述分析确定单元11确定的禁用的信息，将所述待运维的节点设备退出集群系统的服务中。

在其它情况下，上述分析确定单元11，还用于如果根据所述来源流量信息或配置心跳状态，确定所述多个节点设备中待运维的节点设备的运维处理信息包括禁用的信息；根据所述禁用的信息，将所述待运维的节点设备退出所述集群系统的服务中。

其中，分析确定单元11，具体用于如果某一节点设备的配置心跳状态指示所述某一节点设备与中控系统的连接异常或所述某一节点设备的业务配置信息不具有时效性，确定所述某一节点为待运维的节点设备，所述某一节点设备的运维处理信息为禁用的信息；如果同一集群系统中的多个节点设备之间的来源流量信息中集群系统内部透传请求不一致，确定所述集群系统中的多个节点设备为待运维的节点设备，所述多个节点设备的运维处理信息分别包括禁用的信息。

在其它情况下，上述分析确定单元11，还用于如果根据所述来源流量信息和配置心跳状态，确定所述多个节点设备中待运维的节点设备的运维处理信息包括运维关注的信息；则运维单元12，还用于根据所述运维关注的信息，向所述节点设备的运维系统中的终端设备发送运维关注的信息。

其中，分析确定单元11，具体用于如果某一节点设备的来源流量信息指示该节点设备未接收任何请求，所述某一节点设备的配置心跳状态指示所述某一节点设备与中控系统之间正常连接，且所述某一节点设备的业务配置信息具有时效性，则确定所述某一节点为待运维的节点设备，所述某一节点设备的运维处理信息为运维关注的信息。

进一步地，本实施例的节点设备的运维系统还可以包括：信息发送显示单元13，用于将所述统计单元10统计的来源流量信息和配置心跳状态、所述分析确定单元11确定的运维处理信息及运维单元12根据所述运维处理信息的运维处理结果发送给终端设备进行显示。

该信息发送显示单元13，还用于如果运维处理信息包括禁用待运维的节点设备的信息，将恢复启用所述待运维的节点设备的接口信息发送给所述终端设备进行显示，以便所述终端设备通过所述接口信息，发起对所述待运维的节点设备的恢复启用。

可见，在本实施例的节点设备的运维系统中，统计单元10会统计集群系统中所有节点设备分别对应的来源流量信息和与中控系统的配置心跳状态，如果分析确定单元11根据节点设备的来源流量信息和配置心跳状态所指示的待运维的节点设备是否异常的信息不一致，确定对所有节点设备中待运维的节点设备的运维处理信息包括禁用的信息，则运维单元12将待运维的节点设备退出集群系统的服务中。这样，如果部署在集群系统中的有些节点设备由于故障未加入到中控系统的管理下，当这些节点设备恢复正常后，导致集群系统的对外服务异常，比如对外产生404信息，这些情况虽然不能被中控系统所感知，但是可以通过本实施例中节点设备的运维系统所执行的运维方法禁用这些节点设备。

本发明实施例还提供一种服务器，其结构示意图如图6所示，该服务器可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(centralprocessingunits，cpu)20(例如，一个或一个以上处理器)和存储器21，一个或一个以上存储应用程序221或数据222的存储介质22(例如一个或一个以上海量存储设备)。其中，存储器21和存储介质22可以是短暂存储或持久存储。存储在存储介质22的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器20可以设置为与存储介质22通信，在服务器上执行存储介质22中的一系列指令操作。

具体地，在存储介质22中储存的应用程序221包括节点设备的运维的应用程序，且该程序可以包括上述节点设备的运维系统中的统计单元10，分析确定单元11，运维单元12和信息发送显示单元13，在此不进行赘述。更进一步地，中央处理器20可以设置为与存储介质22通信，在服务器上执行存储介质22中储存的节点设备的运维的应用程序对应的一系列操作。

服务器还可以包括一个或一个以上电源23，一个或一个以上有线或无线网络接口24，和/或，一个或一个以上操作系统223，例如windowsservertm，macosxtm，unixtm,linuxtm，freebsdtm等等。

上述方法实施例中所述的由节点设备的运维系统所执行的步骤可以基于该图6所示的服务器的结构。

本发明实施例还提供一种存储介质，所述存储介质储存多条指令，所述指令适于由处理器加载并执行如上述节点设备的运维系统所执行的节点设备的运维方法。

本发明实施例还提供一种服务器，包括处理器和存储介质，所述处理器，用于实现各个指令；所述存储介质用于储存多条指令，所述指令用于由处理器加载并执行如上述节点设备的运维系统所执行的节点设备的运维方法。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(rom)、随机存取存储器ram)、磁盘或光盘等。

以上对本发明实施例所提供的一种节点设备的运维方法及系统进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘化伟;李丛
技术所有人：腾讯科技（深圳）有限公司
我是此专利的发明人

上一篇：电子装置及扩展外围设备的方法与流程
上一篇：微通道反应器的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。