数据节点存活的检测方法及装置的制造方法

文档序号:9891532阅读:444来源:国知局
数据节点存活的检测方法及装置的制造方法
【技术领域】
[0001]本发明涉及计算机技术领域,具体涉及一种数据节点存活的检测方法及装置。
【背景技术】
[0002]随着计算技术的发展,分布式数据存储系统已经成为了一种重要的现代计算架构。分布式数据存储系统就是将数据分散存储在多台独立的设备上。分布式数据存储系统为具有很多数据节点的集群系统,每个数据节点可以理解为一个数据存储服务器。在做数据存储时,将若干条数据存储到对应的数据节点中,这是分布式系统核心的概念。
[0003]为了保证分布式数据存储系统的高可用性,需要对系统中的所有数据节点进行存活监控,现有技术方案中,主要是通过检测数据节点间的网络连接情况来确定数据节点的存活情况,例如当检测到网络连接处于断开时,则认定为数据节点未处于存活状态,然而这种检测方法的准确率太低,有可能是由于网络抖动而造成网络连接暂时性断开,而数据节点却处于存活状态。

【发明内容】

[0004]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的数据节点存活的检测方法和相应的数据节点存活的检测装置。
[0005]根据本发明的一个方面,提供了一种数据节点存活的检测方法,应用于包括通过网络连接的多个数据节点的数据存储系统,方法包括:
[0006]对于每个数据节点:
[0007]判断与待检测数据节点之间当前的网络连接是否成功;
[0008]若网络连接失败,则从上一次成功的网络连接结束后,间隔第一预设时间向待检测数据节点发送数据节点存活检测消息;
[0009]若未收到待检测数据节点返回的数据节点处于存活状态的消息,则间隔第二预设时间向待检测数据节点发送数据节点存活检测消息;重复执行此步骤η次,若在第一预设时间与η个第二预设时间之和的时间段内,未收到待检测数据节点返回的数据节点处于存活状态的消息,则将该待检测数据节点确定为未处于存活状态。
[0010]根据本发明的另一方面,提供了一种数据节点存活的检测装置,应用于包括通过网络连接的多个数据节点的数据存储系统,装置包括:判断模块、发送模块和确定模块;
[0011]其中,对于每个数据节点:
[0012]判断模块,适于判断与待检测数据节点之间当前的网络连接是否成功;
[0013]发送模块,适于在判断模块判断出网络连接失败的情况下,从上一次成功的网络连接结束后,间隔第一预设时间向待检测数据节点发送数据节点存活检测消息;若未收到待检测数据节点返回的数据节点处于存活状态的消息,则间隔第二预设时间向待检测数据节点发送数据节点存活检测消息;发送模块重复运行η次;
[0014]确定模块,适于在第一预设时间与η个第二预设时间之和的时间段内,未收到待检测数据节点返回的数据节点处于存活状态的消息的情况下,将该待检测数据节点确定为未处于存活状态。
[0015]根据本发明提供的方案,为了能够及时地检测出待检测数据节点的存活情况,需要判断与待检测数据节点之间当前的网络连接是否成功,若网络连接失败,则从上一次成功的网络连接结束后,间隔第一预设时间向待检测数据节点发送数据节点存活检测消息,若未收到待检测数据节点返回的数据节点处于存活状态的消息,则间隔第二预设时间向待检测数据节点发送数据节点存活检测消息;重复执行此步骤η次,若在第一预设时间与η个第二预设时间之和的时间段内,未收到待检测数据节点返回的数据节点处于存活状态的消息,则将该待检测数据节点确定为未处于存活状态,从而更为精确地检测出数据节点是否处于存活状态,克服因网络问题而错误地将数据节点认定为未处于存活状态的缺陷,提高了检测的准确率。
[0016]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的【具体实施方式】。
【附图说明】
[0017]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0018]图1示出了根据本发明一个实施例的数据节点存活的检测方法的流程示意图;
[0019]图2示出了根据本发明另一个实施例的数据节点存活的检测方法的流程示意图;
[0020]图3示出了根据本发明一个实施例的数据节点存活的检测装置的功能框图;
[0021 ]图4示出了根据本发明另一个实施例的数据节点存活的检测装置的功能框图。
【具体实施方式】
[0022]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0023]图1示出了根据本发明一个实施例的数据节点存活的检测方法的流程示意图。该方法应用于包括通过网络连接的多个数据节点的数据存储系统,如图1所示,对于每个数据节点,该方法包括以下步骤:
[0024]步骤S100,判断与待检测数据节点之间当前的网络连接是否成功。
[0025]数据存储系统中的各数据节点之间通过网络连接,并通过网络进行通信,例如可以发送数据节点存活检测消息、数据节点处于存活状态的消息等。当某一数据节点未处于存活状态时,其与其他数据节点之间的网络连接处于断开状态,也就无法有效通信。
[0026]为了能够及时地检测出待检测数据节点的存活情况,在本发明实施例中,首先判断与待检测数据节点之间当前的网络连接是否成功,若当前的网络连接成功,说明数据节点间能够正常通信,待检测数据节点处于存活状态;若当前的网络连接失败,则需要检测待检测数据节点是否处于存活状态,以排除由于网络抖动而导致网络连接失败而非待检测数据节点未处于存活状态造成的网络连接失败的问题,或者由于待检测数据节点侧的请求过多而导致阻塞,造成数据节点间通信中断的问题。
[0027]步骤SlOl,若网络连接失败,则从上一次成功的网络连接结束后,间隔第一预设时间向待检测数据节点发送数据节点存活检测消息。
[0028]具体地,数据节点存活指该数据节点目前处于可操作状态或有效工作状态。第一预设时间指从上一次成功的网络连接结束时间开始,到向待检测数据节点发送数据节点存活检测消息所经过的时间,举例说明,若从上一次成功的网络连接结束时间为I秒,第一预设时间为5秒,则在第6秒时向待检测数据节点发送数据节点存活检测消息,本领域技术人员可以根据实际需要设置第一预设时间。
[0029]为了克服由于网络抖动而导致数据节点存活检测消息或数据节点处于存活状态的消息未能被及时地接收,或者由于待检测数据节点侧的请求过多而导致阻塞,进而错误地将待检测数据节点认定为未处于存活状态的缺陷,在本发明实施例中,在根据步骤SlOO检测到网络连接失败的情况下,从上一次成功的网络连接结束后,在第一预设时间之后,再向待检测数据节点发送数据节点存活检测消息,例如,在5秒之后向待检测数据节点发送数据节点存活检测消息。
[0030]步骤S102,若未收到待检测数据节点返回的数据节点处于存活状态的消息,则间隔第二预设时间向待检测数据节点发送数据节点存活检测消息;重复执行此步骤η次,若在第一预设时间与η个第二预设时间之和的时间段内,未收到待检测数据节
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1