分布式数据库集群的管理方法、装置、设备及介质与流程

文档序号：37595302发布日期：2024-04-18 12:31阅读：4来源：国知局

本申请适用于数据库，尤其涉及一种分布式数据库集群的管理方法、装置、设备及介质。

背景技术：

1、在分布式数据库集群的管理体系中，由于需要管理大量节点，因此，分布式数据库集群管理系统针对节点管理非常复杂，特别是在节点探活、节点上下线等场景中，对管理的效率和性能的要求较高。分布式数据库集群的管理需要快速响应故障以及能快速恢复集群的稳定，都是对分布式数据库集群管理系统可靠性的考验。

2、目前，中心化集群管理的分布式数据库都是由网络心跳去保证对各个节点的故障监控，当数据库处于网络波动环境中时，中心化集群管理服务容易产生节点故障的误判，导致集群处于非正常状态，另外，如果只是通过中心化集群管理服务节点使用网络心跳检测故障，就必须保持其与所有节点的网络心跳，这就需要周期性的对所有数据节点发送心跳消息，导致网络开销较大，并且集群管理节点在网络波动时需要同时处理大量的网络异常流程，导致管理压力较大，同时也会出现消息延时、故障反馈不及时等问题。可见，通过上述的网络心跳实现节点故障监控，存在可靠性差和网络开销较大等问题。

3、因此，如何减少管理服务与其他节点的网络心跳连接，以降低网络开销的同时，保证及时发现并处理故障，以保证节点信息的一致性成为亟待解决的问题。

技术实现思路

1、有鉴于此，本申请实施例提供了一种分布式数据库集群的管理方法、装置、设备及介质，以解决如何减少管理服务与其他节点的网络心跳连接，以降低网络开销的同时，保证及时发现并处理故障，以保证节点信息的一致性的问题。

2、第一方面，本申请实施例提供一种分布式数据库集群的管理方法，所述分布式数据库集群包括n个数据节点和至少一个服务节点，n为大于一的整数，所述管理方法包括：

3、在任一第一数据节点检测到与其连接的第二数据节点的心跳断链时，确定所述第二数据节点为异常数据节点，所述第一数据节点将所述异常数据节点的异常信息通知给所述服务节点；

4、所述服务节点根据所述异常信息，对所述异常数据节点进行异常探测，并在探测到所述异常数据节点通知的最新动态信息时，确定探测成功并结束异常探测；

5、所述异常数据节点在接收到异常探测后，更新自身动态信息得到所述最新动态信息，并将所述最新动态信息通知给所述服务节点，以及将自身静态信息的版本与所述服务节点中的全局静态信息的版本进行校验，并根据校验的结果判断是否向所述服务节点主动拉取所述全局静态信息。

6、第二方面，本申请实施例提供一种分布式数据库集群的管理装置，所述分布式数据库集群包括n个数据节点和至少一个服务节点，n为大于一的整数，所述管理装置包括：

7、异常通知模块，用于在任一第一数据节点检测到与其连接的第二数据节点的心跳断链时，确定所述第二数据节点为异常数据节点，所述第一数据节点将所述异常数据节点的异常信息通知给所述服务节点；

8、异常探测模块，用于所述服务节点根据所述异常信息，对所述异常数据节点进行异常探测，并在探测到所述异常数据节点通知的最新动态信息时，确定探测成功并结束异常探测；

9、主动拉取模块，用于所述异常数据节点在接收到异常探测后，更新自身动态信息得到所述最新动态信息，并将所述最新动态信息通知给所述服务节点，以及将自身静态信息的版本与所述服务节点中的全局静态信息的版本进行校验，并根据校验的结果判断是否向所述服务节点主动拉取所述全局静态信息。

10、第三方面，本申请实施例提供一种计算机设备，所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的管理方法。

11、第四方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的管理方法。

12、本申请实施例与现有技术相比存在的有益效果是：本申请的分布式数据库集群包括n个数据节点和至少一个服务节点，在任一第一数据节点检测到与其连接的第二数据节点的心跳断链时，确定所述第二数据节点为异常数据节点，所述第一数据节点将所述异常数据节点的异常信息通知给所述服务节点，所述服务节点根据所述异常信息，对所述异常数据节点进行异常探测，并在探测到所述异常数据节点通知的最新动态信息时，确定探测成功并结束异常探测，所述异常数据节点在接收到异常探测后，更新自身动态信息得到所述最新动态信息，并将所述最新动态信息通知给所述服务节点，以及将自身静态信息的版本与所述服务节点中的全局静态信息的版本进行校验，并根据校验的结果判断是否向所述服务节点主动拉取所述全局静态信息从而通过数据节点间的通讯来及时感知到异常的节点，无需管理服务节点与数据节点的网络心跳连接，采用网络开销远小于与全部数据节点的心跳链接的针对性的异常探测，使得异常的数据节点能够及时获取到最新版本的静态信息，保证及时发现并处理故障。

技术特征：

1.一种分布式数据库集群的管理方法，其特征在于，所述分布式数据库集群包括n个数据节点和至少一个服务节点，n为大于一的整数，所述管理方法包括：

2.根据权利要求1所述的管理方法，其特征在于，所述服务节点包括管理服务节点，所述管理方法还包括：

3.根据权利要求2所述的管理方法，其特征在于，所述服务节点还包括协调服务节点，所述管理方法还包括：

4.根据权利要求2所述的管理方法，其特征在于，所述管理服务节点对其中的全局静态信息进行更新，得到更新的全局静态信息，包括：

5.根据权利要求1至4任一项所述的管理方法，其特征在于，所述根据所述异常信息，对所述异常数据节点进行异常探测，包括：

6.根据权利要求1至4任一项所述的管理方法，其特征在于，所述在探测到所述异常数据节点通知的最新动态信息时，确定探测成功并结束异常探测，包括：

7.根据权利要求6所述的管理方法，其特征在于，在所述确定所述最新动态信息的版本为更新的版本之后，还包括：

8.一种分布式数据库集群的管理装置，其特征在于，所述分布式数据库集群包括n个数据节点和至少一个服务节点，n为大于一的整数，所述管理装置包括：

9.一种计算机设备，其特征在于，所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的管理方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的管理方法。

技术总结
本申请适用于数据库技术领域，尤其涉及一种分布式数据库集群的管理方法、装置、设备及介质。该方法在一数据节点检测到与其连接的数据节点的心跳断链时，生成异常数据节点的异常信息并通知服务节点，服务节点会根据异常信息对异常数据节点进行异常探测，在异常探测成功后，异常数据节点会通过校验全局静态信息版本号，以确认是否需要主动从服务节点拉取全局静态数据。从而通过数据节点间的通讯来及时感知到异常的节点，无需管理服务节点与数据节点的网络心跳连接，采用网络开销远小于与全部数据节点的心跳链接的针对性的异常探测，使得异常数据节点能够及时主动拉取静态信息，保证及时发现并处理故障。

技术研发人员：李伟超,李晶
受保护的技术使用者：深圳计算科学研究院
技术研发日：
技术公布日：2024/4/17

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李伟超,李晶
技术所有人：深圳计算科学研究院
我是此专利的发明人

上一篇：一种涤纶纤维原料生产加工设备的制作方法
上一篇：油气管网跨安全区的数据通信方法、系统、计算机和介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。