一种服务器节点间的链路切换方法、装置及电子设备与流程

文档序号:35679700发布日期:2023-10-08 15:40阅读:26来源:国知局
一种服务器节点间的链路切换方法、装置及电子设备与流程

本申请涉及数据存储领域,尤其涉及一种服务器节点间的链路切换方法、装置及电子设备。


背景技术:

1、在分布式存储系统中,服务器节点间通过通信链路来实现网络通信。为保证网络连接的冗余性,消除网络连接的单点故障,通常在服务器节点间设置多条物理链路。在实际应用中,可由软件管理多条链路,当服务器节点间传输数据的链路出现故障时,可将服务器节点间的通信链路由故障的链路切换为正常链路,以保证服务器节点间的正常通信。

2、通常,通过探测报文来监测通信链路是否存在故障,例如,服务器节点1向服务器节点2发送数据报文,如果服务器节点1未在保活时长内接收到服务器节点2针对数据报文所返回的响应报文,则确定服务器节点1与服务器节点2之间的通信链路发生了故障。

3、然而,在相关技术中,保活时长通常设置为固定时长,而固定的保活时长无法适应网络变化,进而影响了通信业务的连续性。例如,保活时长设置得较长,则通信链路故障的发现时间较长,导致通信业务出现卡顿,从而降低了上层应用(例如,数据库、文件系统)的业务处理性能;保活时长设置得较短,则在数据传输时通信链路存在微小的网络延迟时,就判定该链路发生故障,导致链路切换频繁,增加探测报文的数量,而大量的探测报文在一定程度上会占用较多的网络带宽资源,同样会影响上层应用的业务处理性能。


技术实现思路

1、有鉴于此,本申请实施例提供一种服务器节点间的链路切换方法、装置及电子设备,以保证服务器节点间通信业务的连续性。

2、根据本申请实施例的第一方面,提供一种服务器节点间的链路切换方法,应用于分布式全闪存存储系统中的第一服务器节点中,第一服务器节点通过通信链路与第二服务器节点通信,通信链路至少包括第一链路和第二链路,该方法包括:在当前时刻通过第一链路向第二服务器节点发送目标数据处理报文,根据目标数据处理报文的大小以及平均报文响应时长确定目标数据处理报文所对应的第一保活时长,其中,平均报文响应时长为在第一服务器节点发送目标数据处理报文的发送时间之前的预设时长内,第一服务器节点所发送的数据处理报文的报文响应时长的平均值;若在第一保活时长内,第一服务器节点未接收到第二服务器节点通过第一链路所反馈的针对目标数据处理报文的数据处理响应报文,则通过第一链路向第二服务器节点发送探测报文;若在第二保活时长内,第一服务器节点未接收到第二服务器节点通过第一链路所反馈的针对探测报文的探测响应报文,则确定第一链路存在故障,并将第一服务器节点与第二服务器节点之间的通信链路由第一链路切换为第二链路,其中,第二保活时长由平均报文响应时长所确定,并且,第二保活时长小于第一保活时长。

3、根据本申请实施例的第二方面,提供一种服务器节点间的链路切换装置,应用于分布式全闪存存储系统中的第一服务器节点中,第一服务器节点通过通信链路与第二服务器节点通信,通信链路至少包括第一链路和第二链路,该装置包括:保活时长确定模块,用于在当前时刻通过第一链路向第二服务器节点发送目标数据处理报文,根据目标数据处理报文的大小以及平均报文响应时长确定目标数据处理报文所对应的第一保活时长,其中,平均报文响应时长为在第一服务器节点发送目标数据处理报文的发送时间之前的预设时长内,第一服务器节点所发送的数据处理报文的报文响应时长的平均值;探测报文发送模块,用于在第一保活时长内,第一服务器节点未接收到第二服务器节点通过第一链路所反馈的针对目标数据处理报文的数据处理响应报文时,通过第一链路向第二服务器节点发送探测报文;链路切换模块,用于若在第二保活时长内,第一服务器节点未接收到第二服务器节点通过第一链路所反馈的针对探测报文的探测响应报文,则确定第一链路存在故障,并将第一服务器节点与第二服务器节点之间的通信链路由第一链路切换为第二链路,其中,第二保活时长由平均报文响应时长所确定,并且,第二保活时长小于第一保活时长。

4、根据本申请实施例的第三方面,提供一种电子设备,电子设备包括:处理器和存储器;其中,所述存储器,用于存储机器可执行指令;处理器用于读取并执行存储器存储的机器可执行指令,以实现如第一方面所述的方法。

5、根据本申请实施例的第四方面,提供一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所述的方法。

6、本申请实施例提供的技术方案可以包括以下有益效果:

7、在本实施例中,根据当前的数据处理报文的大小以及最近一段时长(即发送时间之前的预设时长)内的平均报文响应时长确定保活时长,进而根据保活时长来确定两个服务器节点间的链路是否存在故障,而最近一段时长内的平均报文响应时长表征了网络的变化情况,即本申请采用与网络变化相适应的保活时长来确定是否对服务器节点间的链路进行切换。而通过与网络变化相适应的保活时长,能够更加准确地确定通信链路是否存在故障,进而保证了通信业务的连续性。

8、另外,在第一服务器节点未在第一保活时长内接收到数据处理响应报文时,无法确定是通信链路发生了故障,还是第二服务器节点的数据处理性能发生了故障。对此,本申请还设置了时长较短的第二保活时长以探测两个服务器节点的链路是否存在故障,该方式能够提高服务器节点间通信链路故障的判断准确度,进一步保证了通信业务的连续性。



技术特征:

1.一种服务器节点间的链路切换方法,其特征在于,应用于分布式全闪存存储系统中的第一服务器节点中,所述第一服务器节点通过通信链路与第二服务器节点通信,所述通信链路至少包括第一链路和第二链路,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,根据所述目标数据处理报文的大小以及平均报文响应时长确定第一保活时长确定第一保活时长,包括:

3.根据权利要求2所述的方法,其特征在于,在根据所述目标数据处理报文的大小以及平均报文响应时长确定第一保活时长确定第一保活时长之前,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,在通过所述第一链路向所述第二服务器节点发送探测报文之前,所述方法还包括:

5.根据权利要求1或4所述的方法,其特征在于,在通过所述第一链路向所述第二服务器节点发送探测报文之后,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,在将所述第一服务器节点与所述第二服务器节点之间的通信链路由所述第一链路切换为所述第二链路之后,所述方法还包括:

8.一种服务器节点间的链路切换装置,其特征在于,应用于分布式全闪存存储系统中的第一服务器节点中,所述第一服务器节点通过通信链路与第二服务器节点通信,所述通信链路至少包括第一链路和第二链路,所述装置包括:

9.一种电子设备,其特征在于,电子设备包括:处理器和存储器;

10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一所述的方法。


技术总结
本申请提供一种服务器节点间的链路切换方法、装置及电子设备。在本申请中,根据当前的数据处理报文的大小以及最近一段时长内的平均报文响应时长所确定的保活时长,能够与网络变化相适应,采用与网络变化相适应的保活时长,能够更加准确地确定服务器节点间通信链路是否存在故障,进而保证了服务器节点间通信业务的连续性。本申请还设置时长较短的与网络变化相适应的第二保活时长以进一步检测服务器节点间的链路是否存在故障,该方式能够提高服务器节点间通信链路故障的判断准确度,进一步保证了服务器节点间通信业务的连续性。

技术研发人员:陈武雄
受保护的技术使用者:杭州宏杉科技股份有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1