分布式NAS系统异常掉电快速检测装置及其方法与流程

文档序号:36805506发布日期:2024-01-23 12:34阅读:14来源:国知局
分布式NAS系统异常掉电快速检测装置及其方法与流程

本发明涉及检测,特别是涉及一种分布式nas系统异常掉电快速检测装置及其方法。


背景技术:

1、分布式nas集群是由多个主机节点构成的一种松散耦合的主机节点集合,协同起来对外提供服务。集群nas是指协同多个节点提供高性能、高可用或高负载均衡的nas(nfs/cifs/ftp)服务。当对外提供服务的节点宕机了,这就会导致共享中断,这就涉及了共享的高可用。

2、高可用性ha(high availability),通常来描述一个系统经过专门的设计,采取一定措施减少系统服务中断时间,从而保持其服务的高度可用性。高可用集群nas,致力于提供高度可靠的nas服务。高可用性集群中的节点一般是一主一备,或者一主多备,通过备份提高整个系统可用性。会一直对活动节点进行监视,一旦活动节点出现故障,备用节点就会接管它的工作,这样就能使得关键的系统能够持续工作。

3、如图1所示,异常掉电是集群中比较容易出现的问题,而且异常的现象比较明显。现有的技术在网络程序中经常用到心跳检测,通过在主备节点之间定时发送简易的通信包,假如在特定时间内未接收到对方响应,则判定对方已离线。心跳检测可以由主端主动发起,也可以由备端主动发起。

4、在系统中,每隔5秒发送一次心跳,当连续3次未收到对方响应,则判定对方异常,进行接管切换操作。

5、现有的技术方案具有较强的通用性,但是耗时太长。例如:设置每次心跳间隔时间为5秒,如果刚好发送一次心跳后立马异常掉电,则备端需要等待3次心跳丢失才判定异常进行主备切换,三次心跳丢失耗时15秒;如果在刚好发送心跳之前异常掉电,则备端需要再等待2次心跳丢失才判定异常进行主备切换,两次心跳丢失耗时10秒。所以现有技术方案需要10秒-15秒才能发现对方异常,再加上业务切换需要的时间,整个切换耗时过长,上层业务中断时间长,用户体验较差。

6、由此可见,上述现有的掉电检测方法在使用上,显然仍存在有不便与缺陷,而亟待加以进一步改进。如何能创设一种新的掉电检测方法,成为当前业界急需改进的目标。


技术实现思路

1、有鉴于此,本公开实施例提供一种分布式nas系统异常掉电快速检测方法,至少部分解决现有技术中存在的问题。

2、第一方面,本公开实施例提供了一种分布式nas系统异常掉电快速检测装置,直接安装在主机主板上,所述装置包括:掉电检测模块、信号发送模块和电容模块;

3、所述掉电检测模块检测到异常掉电后,发送掉电信号给信号发送模块;

4、所述信号发送模块根据收到的掉电信号,向备端发送主端已掉电信息;

5、所述备端在收到掉电信号后,立即启动主备切换;

6、所述电容模块用于保障异常掉电后,所述信号发送模块的正常工作。

7、根据本公开实施例的一种具体实现方式,所述掉电检测模块为电源掉电检测电路。

8、根据本公开实施例的一种具体实现方式,所述信号发送模块支持多种通信协议,所述多种通信协议包括:tcp/ip、http、nvme和iscsi协议。

9、第二方面,本公开实施例提供了一种分布式nas系统异常掉电快速检测方法,所述方法包括以下步骤:

10、当检测到异常掉电后,发送掉电信号给信号发送模块;

11、信号发送模块根据收到的掉电信号,向备端发送主端已掉电信息;

12、所述备端在收到掉电信号后,立即启动主备切换;

13、电容模块用于保障异常掉电后,所述信号发送模块的正常工作。

14、第三方面,本公开实施例还提供了一种电子设备,该电子设备包括:

15、至少一个处理器;以及,

16、与所述至少一个处理器通信连接的存储器;其中,

17、所述存储器存储有能够被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行时,使所述至少一个处理器前述第二方面所述的分布式nas系统异常掉电快速检测方法。

18、第四方面,本公开实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令当由至少一个处理器执行时使所述至少一个处理器执行前述第二方面的分布式nas系统异常掉电快速检测方法。

19、本公开实施例中的分布式nas系统异常掉电快速检测方法,通过对特定场景定向优化,例如因某一个机房断电、机架电源故障、某主机电源故障发生异常掉电时,极速检测快速切换,提高系统可用性。



技术特征:

1.一种分布式nas系统异常掉电快速检测装置,直接安装在主机主板上,其特征在于,所述装置包括:掉电检测模块、信号发送模块和电容模块;

2.根据权利要求1所述的分布式nas系统异常掉电快速检测装置,其特征在于,所述掉电检测模块为电源掉电检测电路。

3.根据权利要求1所述的分布式nas系统异常掉电快速检测装置,其特征在于,所述信号发送模块支持多种通信协议,所述多种通信协议包括:tcp/ip、http、nvme和iscsi协议。

4.一种分布式nas系统异常掉电快速检测方法,其特征在于,所述方法包括以下步骤:

5.一种电子设备,其特征在于,该电子设备包括:

6.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令当由至少一个处理器执行时使所述至少一个处理器执行如权利要求4所述的分布式nas系统异常掉电快速检测方法。


技术总结
本发明公开了一种分布式NAS系统异常掉电快速检测装置及其方法,所述装置包括:掉电检测模块、信号发送模块和电容模块;所述掉电检测模块检测到异常掉电后,发送掉电信号给信号发送模块;所述信号发送模块根据收到的掉电信号,向备端发送主端已掉电信息;所述备端在收到掉电信号后,立即启动主备切换;所述电容模块用于保障异常掉电后,所述信号发送模块的正常工作。通过本公开的处理方案,针对特定场景定向优化,当发生异常掉电时,极速检测快速切换,提高系统可用性。

技术研发人员:胡晓鹏,周泽湘,尹微,文中领
受保护的技术使用者:北京同有飞骥科技股份有限公司
技术研发日:
技术公布日:2024/1/22
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1