集群节点网络连接检测方法、电子设备以及存储介质与流程

文档序号:37935145发布日期:2024-05-11 00:14阅读:7来源:国知局
集群节点网络连接检测方法、电子设备以及存储介质与流程

本申请涉及系统集群管理,尤其涉及一种集群节点网络连接检测方法、电子设备以及存储介质。


背景技术:

1、一个集群可以包含多个节点(node),其中,每个节点可以相互分担协作,且任意两个节点或者任意多个节点可以作为一个整体对外提供服务,为了提高集群的可靠性和容灾能力,这些节点可能分布在多个可用区(availability zone,az)。

2、当前集群管理系统(cluster manager,cm)的可用区(availability zone,az)间网络连通性是通过各az的集群管理服务端(cluster manager server,cms)进程给其他az的节点发送ping命令,并将当前az和其他az的连通性更新到etcd,从而实现与各az之间共享网络连通状态。

3、当通过cms进行网络连接状态检测时,整个az的依赖于cms节点的网络状态,在当前az存在网络问题时,当前az对应的cms的网络连接状态检测的检测结果不可信。


技术实现思路

1、本申请实施例提供一种集群节点网络连接检测方法、电子设备以及存储介质,通过该方法可以控制集群中每个节点主动广播自身的网络连通状态信息,从而使每个节点都能获取到其他节点的网络连通状态,通过节点间的信息直接和间接的共享,实现每个节点都能够尽可能的收集到更多的连通信息,维护整个集群的网络状态。

2、第一方面,本申请实施例提供集群节点网络连接检测方法,包括:控制集群中所有节点相互共享各自的心跳信息并融合共享信息;以及根据融合后的多个心跳信息,确定集群中的故障节点;其中,一个节点共享心跳信息并融合共享信息的过程包括:将当前节点的第一心跳信息发送给当前集群中的其他节点;获取当前集群中其他每一个节点发送的第二心跳信息;将第一心跳信息与所有第二心跳信息融合,并得到第三心跳信息。

3、进一步地,控制集群中所有节点相互共享各自的心跳信息并融合共享信息包括:周期性控制集群中所有节点相互共享各自的心跳信息并融合共享信息。

4、进一步地,将当前节点的第一心跳信息发送给当前集群中的其他节点包括:向当前集群中的其他节点广播当前节点的第一心跳信息。

5、进一步地,心跳信息为二维矩阵信息;其中,二维矩阵信息的列信息为心跳信息发送节点,行信息为心跳信息接收节点,对应的值为接收到心跳信息的时间。

6、进一步地,将第一心跳信息与所有第二心跳信息融合,并得到第三心跳信息包括:心跳信息接收节点根据接收到的心跳信息发送节点发送的心跳信息,刷新二维矩阵信息中的对应的心跳信息的接收时间值;其中,二维矩阵信息中心跳信息接收节点对应的所有心跳信息的接收时间值定义为心跳信息接收节点的直通信息。

7、进一步地,根据融合后的多个心跳信息,确定集群中的故障节点包括:将融合得到的多个心跳信息再次融合,并得到目标心跳信息;以及基于目标心跳信息,筛选出多个节点中存在单边断网或者双边断网的节点。

8、进一步地,将融合得到的多个心跳信息再次融合,并得到目标心跳信息包括:获取每个节点对应的第三心跳信息,并融合第三心跳信息,得到目标心跳信息。

9、进一步地,获取每个节点对应的第三心跳信息,并融合第三心跳信息,得到目标心跳信息包括:以集群中的可用区为粒度融合第三心跳信息,并得到可用区对应的目标心跳信息;其中,获取一个可用区对应的目标心跳信息的流程包括:获取一个可用区中所有节点对应的第三心跳信息并融合并得到一个可用区对应的目标心跳信息。

10、第二方面,本申请实施例还提供一种电子设备,该电子设备可以包括处理器和存储器,存储器用于存储至少一条指令,指令由处理器加载并执行时以实现第一方面提供的集群节点网络连接检测方法。

11、第三方面,本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现第一方面提供的集群节点网络连接检测方法。

12、第四方面,本申请实施例还提供一种计算机程序产品,包括计算机程序或指令,计算机程序或指令被处理器执行时实现第一方面提供的集群节点网络连接检测方法。



技术特征:

1.一种集群节点网络连接检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述控制集群中所有节点相互共享各自的心跳信息并融合共享信息包括:

3.根据权利要求1或2所述的方法,其特征在于,所述将当前节点的第一心跳信息发送给当前集群中的其他节点包括:

4.根据权利要求1所述的方法,其特征在于,所述心跳信息为二维矩阵信息;

5.根据权利要求4所述的方法,其特征在于,将所述第一心跳信息与所有第二心跳信息融合,并得到第三心跳信息包括:

6.根据权利要求1所述的方法,其特征在于,所述根据融合后的多个心跳信息,确定集群中的故障节点包括:

7.根据权利要求6所述的方法,其特征在于,所述将融合得到的多个心跳信息再次融合,并得到目标心跳信息包括:

8.根据权利要求7所述的方法,其特征在于,所述获取每个节点对应的第三心跳信息,并融合所述第三心跳信息,得到所述目标心跳信息包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8中任意一项所述的集群节点网络连接检测方法。


技术总结
本申请实施例提供一种集群节点网络连接检测方法、电子设备及存储介质,该方法包括:控制集群中所有节点相互共享各自的心跳信息并融合共享信息;以及根据融合后的多个心跳信息,确定集群中的故障节点;一个节点共享心跳信息并融合共享信息的过程包括:将当前节点的第一心跳信息发送给当前集群中的其他节点;获取当前集群中其他每一个节点发送的第二心跳信息;将第一心跳信息与所有第二心跳信息融合,并得到第三心跳信息。可以控制集群中每个节点主动广播自身的网络连通状态信息,使每个节点都能获取到其他节点的网络连通状态,通过节点间的信息直接和间接的共享,实现每个节点都能够尽可能的收集到更多的连通信息,维护整个集群的网络状态。

技术研发人员:于正
受保护的技术使用者:华为技术有限公司
技术研发日:
技术公布日:2024/5/10
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1