分布式存储系统节点故障的侦测方法和装置的制造方法

文档序号:9787437阅读:533来源:国知局
分布式存储系统节点故障的侦测方法和装置的制造方法
【技术领域】
[0001]本发明涉及计算机技术领域,特别是一种分布式存储系统节点故障的侦测方法和
目.0
【背景技术】
[0002]分布式存储系统,一般采用多副本的分布存储策略,通过多副本冗余存储来保证数据的可靠性。例如,可以采用3副本存储,利用hash(哈希)算法确定节点后,将数据的一个副本存储在该节点(或机器)上,而将另外2份副本存储在其他节点上。当某个节点出现故障时,仍然保证另外两个副本可以访问,并在合适的条件下完成故障副本的修复。
[0003]为了提高分布式存储系统中各个节点对外提供业务服务的性能,可以对各个节点进行数据分片,各个数据分片具有接收并响应数据请求的主副本以及同步该主副本的数据操作的从副本,且主副本与其对应的一个或多个从副本位于不同的节点。并且,考虑到分布式存储系统的负载均衡,应尽可能保证各个节点上面的主副本是一样多的。
[0004]分布式存储系统中的节点可能会出现故障,如何侦测故障节点成为亟待解决的技术问题。

【发明内容】

[0005]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的分布式存储系统节点故障的侦测方法和相应的装置。
[0006]依据本发明的一方面,提供了一种分布式存储系统节点故障的侦测方法,包括:
[0007]监测目标分片的副本的在线数量,其中,所述目标分片具有用于接收并响应数据请求的主副本和用于同步该主副本的数据操作的从副本,所述主副本和所述从副本位于分布式存储系统的不同节点;
[0008]当监测到所述目标分片的副本的在线数量与预设数量不一致时,确定所述目标分片的副本所在节点出现故障。
[0009]可选地,所述监测目标分片的副本的在线数量的步骤包括:
[00?0]获取所述分布式存储系统的meta信息,其中,所述meta信息中记录了所述分布式存储系统中各分片的副本的在线状态;
[0011]在所述meta信息中查找所述目标分片的副本的在线状态;以及
[0012]根据所述目标分片的副本的在线状态,确定所述目标分片的副本的在线数量。
[0013I可选地,若所述meta信息存储在所述分布式存储系统的一个或多个节点,当所述一个或多个节点中的任意一个节点上的分片的副本的在线状态发生变化时,对应修改该任意一个节点的meta信息,并广播给所述一个或多个节点中的其它节点,同步修改该其它节点上的meta信息;
[0014]所述获取所述分布式存储系统的meta信息的步骤包括:
[0015]从所述一个或多个节点处获取所述meta信息。
[0016]可选地,所述meta信息中还记录了所述分布式存储系统中各分片的副本存储在哪个节点;
[0017]在确定所述目标分片的副本所在节点出现故障之后,所述方法还包括通过以下步骤确定所述故障节点:
[0018]在所述meta信息中查找所述目标分片的副本所在节点;以及
[0019]根据所述目标分片的副本所在节点以及副本的在线状态,确定所述故障节点。
[0020]可选地,所述监测目标分片的副本的在线数量的步骤包括:
[0021]以广播的方式向所述分布式存储系统的各节点发送查找所述目标分片的副本的请求,所述请求中携带有所述目标分片的副本的标识;
[0022]接收所述各节点返回的响应信息;以及
[0023]根据所述响应信息确定所述目标分片的副本的在线数量。
[0024]可选地,当所述目标分片包括多个时,所述监测目标分片的副本的在线数量的步骤包括:
[0025]按照指定的顺序,依次对多个目标分片的副本的在线数量进行监测。
[0026]可选地,在确定所述目标分片的副本所在节点出现故障之后,所述方法还包括:
[0027]发出报警提示。
[0028]依据本发明的另一方面,还提供了一种分布式存储系统节点故障的侦测装置,包括:
[0029]监测模块,适于监测目标分片的副本的在线数量,其中,所述目标分片具有用于接收并响应数据请求的主副本和用于同步该主副本的数据操作的从副本,所述主副本和所述从副本位于分布式存储系统的不同节点;
[0030]确定模块,适于当监测到所述目标分片的副本的在线数量与预设数量不一致时,确定所述目标分片的副本所在节点出现故障。
[0031]可选地,所述监测模块还适于:
[0032]获取所述分布式存储系统的meta信息,其中,所述meta信息中记录了所述分布式存储系统中各分片的副本的在线状态;
[0033]在所述meta信息中查找所述目标分片的副本的在线状态;以及
[0034]根据所述目标分片的副本的在线状态,确定所述目标分片的副本的在线数量。
[0035]可选地,若所述meta信息存储在所述分布式存储系统的一个或多个节点,当所述一个或多个节点中的任意一个节点上的分片的副本的在线状态发生变化时,对应修改该任意一个节点的meta信息,并广播给所述一个或多个节点中的其它节点,同步修改该其它节点上的meta信息;
[0036]所述监测模块还适于:
[0037]从所述一个或多个节点处获取所述meta信息。
[0038]可选地,所述meta信息中还记录了所述分布式存储系统中各分片的副本存储在哪个节点;
[0039]所述确定模块还适于:
[0040]在所述meta信息中查找所述目标分片的副本所在节点;以及
[0041]根据所述目标分片的副本所在节点以及副本的在线状态,确定所述故障节点。
[0042]可选地,所述监测模块还适于:
[0043]以广播的方式向所述分布式存储系统的各节点发送查找所述目标分片的副本的请求,所述请求中携带有所述目标分片的副本的标识;
[0044]接收所述各节点返回的响应信息;以及
[0045]根据所述响应信息确定所述目标分片的副本的在线数量。
[0046]可选地,所述监测模块还适于:
[0047]当所述目标分片包括多个时,按照指定的顺序,依次对多个目标分片的副本的在线数量进行监测。
[0048]可选地,所述装置还包括:
[0049]报警模块,适于在所述确定模块确定所述目标分片的副本所在节点出现故障之后,发出报警提示。
[0050]在本发明实施例中,目标分片具有用于接收并响应数据请求的主副本和用于同步该主副本的数据操作的从副本,并且主副本和从副本位于分布式存储系统的不同节点。本发明实施例主动监测目标分片的副本的在线数量,当监测到目标分片的副本的在线数量与预设数量不一致时,则确定目标分片的副本所在节点出现故障,从而实现及时、有效地侦测到故障节点的目的。
[0051]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的【具体实施方式】。
[0052]根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
【附图说明】
[0053]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0054]图1示出了根据本发明一个实施例的分布式存储系统节点故障的侦测方法的流程示意图;
[0055]图2示出了根据本发明一个实施例的分布式存储系统各个节点的数据分片示意图;
[0056]图3示出了根据本发明一个实施例的利用日志记录在目标分片的当前主副本与原主副本之间进行数据同步的方法的流程示意图;
[0057]图4示出了根据本发明一个实施例的日志记录的示意图;
[0058]图5示出了根据本发明另一个实施例的日志记录的示意图;
[0059]图6示出了根据本发明一个实施例的利用日志记录在目标分片的当前主副本与原从副本之间进行数据同步的方法的流程示意图;
[0060]图7示出了根据本发明又一个实施例的日志记录的示意图;
[0061]图8示出了根据本发明一个实施例的分布式存储系统节点故障的侦测装置的结构不意图;以及
[0062]图9示出了根据本发明另一个实施例的分布式存储系统节点故障的侦测装置的结构示意图。
【具体实施方式】
[0063]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0064]为解决上述技术问题,本发明实施例提供了一种分布式存储系统节点故障的侦测方法。图1示出了根据本发明一个实施例的分布式存储系统节点故障的侦测方法的流程示意图。如图1所示,该方法
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1