分布式数据库集群的管理方法、装置、设备及介质与流程

文档序号:37595302发布日期:2024-04-18 12:31阅读:4来源:国知局
分布式数据库集群的管理方法、装置、设备及介质与流程

本申请适用于数据库,尤其涉及一种分布式数据库集群的管理方法、装置、设备及介质。


背景技术:

1、在分布式数据库集群的管理体系中,由于需要管理大量节点,因此,分布式数据库集群管理系统针对节点管理非常复杂,特别是在节点探活、节点上下线等场景中,对管理的效率和性能的要求较高。分布式数据库集群的管理需要快速响应故障以及能快速恢复集群的稳定,都是对分布式数据库集群管理系统可靠性的考验。

2、目前,中心化集群管理的分布式数据库都是由网络心跳去保证对各个节点的故障监控,当数据库处于网络波动环境中时,中心化集群管理服务容易产生节点故障的误判,导致集群处于非正常状态,另外,如果只是通过中心化集群管理服务节点使用网络心跳检测故障,就必须保持其与所有节点的网络心跳,这就需要周期性的对所有数据节点发送心跳消息,导致网络开销较大,并且集群管理节点在网络波动时需要同时处理大量的网络异常流程,导致管理压力较大,同时也会出现消息延时、故障反馈不及时等问题。可见,通过上述的网络心跳实现节点故障监控,存在可靠性差和网络开销较大等问题。

3、因此,如何减少管理服务与其他节点的网络心跳连接,以降低网络开销的同时,保证及时发现并处理故障,以保证节点信息的一致性成为亟待解决的问题。


技术实现思路

1、有鉴于此,本申请实施例提供了一种分布式数据库集群的管理方法、装置、设备及介质,以解决如何减少管理服务与其他节点的网络心跳连接,以降低网络开销的同时,保证及时发现并处理故障,以保证节点信息的一致性的问题。

2、第一方面,本申请实施例提供一种分布式数据库集群的管理方法,所述分布式数据库集群包括n个数据节点和至少一个服务节点,n为大于一的整数,所述管理方法包括:

3、在任一第一数据节点检测到与其连接的第二数据节点的心跳断链时,确定所述第二数据节点为异常数据节点,所述第一数据节点将所述异常数据节点的异常信息通知给所述服务节点;

4、所述服务节点根据所述异常信息,对所述异常数据节点进行异常探测,并在探测到所述异常数据节点通知的最新动态信息时,确定探测成功并结束异常探测;

5、所述异常数据节点在接收到异常探测后,更新自身动态信息得到所述最新动态信息,并将所述最新动态信息通知给所述服务节点,以及将自身静态信息的版本与所述服务节点中的全局静态信息的版本进行校验,并根据校验的结果判断是否向所述服务节点主动拉取所述全局静态信息。

6、第二方面,本申请实施例提供一种分布式数据库集群的管理装置,所述分布式数据库集群包括n个数据节点和至少一个服务节点,n为大于一的整数,所述管理装置包括:

7、异常通知模块,用于在任一第一数据节点检测到与其连接的第二数据节点的心跳断链时,确定所述第二数据节点为异常数据节点,所述第一数据节点将所述异常数据节点的异常信息通知给所述服务节点;

8、异常探测模块,用于所述服务节点根据所述异常信息,对所述异常数据节点进行异常探测,并在探测到所述异常数据节点通知的最新动态信息时,确定探测成功并结束异常探测;

9、主动拉取模块,用于所述异常数据节点在接收到异常探测后,更新自身动态信息得到所述最新动态信息,并将所述最新动态信息通知给所述服务节点,以及将自身静态信息的版本与所述服务节点中的全局静态信息的版本进行校验,并根据校验的结果判断是否向所述服务节点主动拉取所述全局静态信息。

10、第三方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的管理方法。

11、第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的管理方法。

12、本申请实施例与现有技术相比存在的有益效果是:本申请的分布式数据库集群包括n个数据节点和至少一个服务节点,在任一第一数据节点检测到与其连接的第二数据节点的心跳断链时,确定所述第二数据节点为异常数据节点,所述第一数据节点将所述异常数据节点的异常信息通知给所述服务节点,所述服务节点根据所述异常信息,对所述异常数据节点进行异常探测,并在探测到所述异常数据节点通知的最新动态信息时,确定探测成功并结束异常探测,所述异常数据节点在接收到异常探测后,更新自身动态信息得到所述最新动态信息,并将所述最新动态信息通知给所述服务节点,以及将自身静态信息的版本与所述服务节点中的全局静态信息的版本进行校验,并根据校验的结果判断是否向所述服务节点主动拉取所述全局静态信息从而通过数据节点间的通讯来及时感知到异常的节点,无需管理服务节点与数据节点的网络心跳连接,采用网络开销远小于与全部数据节点的心跳链接的针对性的异常探测,使得异常的数据节点能够及时获取到最新版本的静态信息,保证及时发现并处理故障。



技术特征:

1.一种分布式数据库集群的管理方法,其特征在于,所述分布式数据库集群包括n个数据节点和至少一个服务节点,n为大于一的整数,所述管理方法包括:

2.根据权利要求1所述的管理方法,其特征在于,所述服务节点包括管理服务节点,所述管理方法还包括:

3.根据权利要求2所述的管理方法,其特征在于,所述服务节点还包括协调服务节点,所述管理方法还包括:

4.根据权利要求2所述的管理方法,其特征在于,所述管理服务节点对其中的全局静态信息进行更新,得到更新的全局静态信息,包括:

5.根据权利要求1至4任一项所述的管理方法,其特征在于,所述根据所述异常信息,对所述异常数据节点进行异常探测,包括:

6.根据权利要求1至4任一项所述的管理方法,其特征在于,所述在探测到所述异常数据节点通知的最新动态信息时,确定探测成功并结束异常探测,包括:

7.根据权利要求6所述的管理方法,其特征在于,在所述确定所述最新动态信息的版本为更新的版本之后,还包括:

8.一种分布式数据库集群的管理装置,其特征在于,所述分布式数据库集群包括n个数据节点和至少一个服务节点,n为大于一的整数,所述管理装置包括:

9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的管理方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的管理方法。


技术总结
本申请适用于数据库技术领域,尤其涉及一种分布式数据库集群的管理方法、装置、设备及介质。该方法在一数据节点检测到与其连接的数据节点的心跳断链时,生成异常数据节点的异常信息并通知服务节点,服务节点会根据异常信息对异常数据节点进行异常探测,在异常探测成功后,异常数据节点会通过校验全局静态信息版本号,以确认是否需要主动从服务节点拉取全局静态数据。从而通过数据节点间的通讯来及时感知到异常的节点,无需管理服务节点与数据节点的网络心跳连接,采用网络开销远小于与全部数据节点的心跳链接的针对性的异常探测,使得异常数据节点能够及时主动拉取静态信息,保证及时发现并处理故障。

技术研发人员:李伟超,李晶
受保护的技术使用者:深圳计算科学研究院
技术研发日:
技术公布日:2024/4/17
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1