一种网络管理方法、系统、电子设备及存储介质与流程

文档序号:22621715发布日期:2020-10-23 19:27阅读:111来源:国知局
一种网络管理方法、系统、电子设备及存储介质与流程

本申请涉及计算机技术领域,特别涉及一种网络管理方法、系统、一种电子设备及一种存储介质。



背景技术:

随着信息技术的不断发展,数据存储作为数据资源的核心要素之一也迎来了高速发展的时期。传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈,也是可靠性和安全性的焦点,无法满足大规模存储应用的需要。分布式网络存储系统采用可扩展的系统结构,不但提高了系统的可靠性、可用性和存取效率,还易于扩展,从而被越来越多的企业单位接受认可。

在分布式存储组网环境中,一般使用两张网卡分别接在两台交换机上以便实现网络实现冗余,若子网管理器检测到网卡状态异常后进行网络切换。但是在分布式存储系统进行测试时,需要向某一存储节点注入能够中断网络的故障,若利用上述主备切换的判断机制将会导致网卡错误切换。

因此,如何准确检测网络状态,提高网卡主备切换效率是本领域技术人员目前需要解决的技术问题。



技术实现要素:

本申请的目的是提供一种网络管理方法、系统、一种存储介质及一种电子设备,能够准确检测网络状态,提高网卡主备切换效率。

为解决上述技术问题,本申请提供一种网络管理方法,应用于分布式存储系统中的存储节点,所述存储节点包括主网卡和备用网卡,该网络管理方法包括:

按照预设周期获取所述主网卡的网卡状态;其中,当所述主网卡的网卡状态为正常状态时所述存储节点通过所述主网卡接入infiniband网络;

若所述存储节点的主网卡的网卡状态为异常状态,则获取所述分布式存储系统中其他存储节点的主网卡的网卡状态;

判断所有所述其他存储节点的主网卡的网卡状态是否均为异常状态;若是,则切换网卡并利用所述存储节点的备用网卡接入infiniband网络;若否,则不执行网卡切换操作;

当检测到所述存储节点的主网卡的网卡状态恢复为正常状态时,判断所述其他存储节点的主网卡的网卡状态是否均为正常状态;若是,则切换网卡并利用所述存储节点的主网卡接入infiniband网络;若否,则不执行网卡切换操作。

可选的,所述分布式存储系统中所有存储节点的主网卡与第一infiniband交换机连接,所述分布式存储系统中所有存储节点的备用网卡与第二infiniband交换机连接。

可选的,获取所述分布式存储系统中其他存储节点的主网卡的网卡状态,包括:

通过所述存储节点的管理网口远程获取所述分布式存储系统中其他存储节点的主网卡的网卡状态。

可选的,还包括:

若所述存储节点的主网卡的网卡状态为异常状态、且所有所述其他存储节点的主网卡的网卡状态不均为异常状态,则判定所述存储节点被注入网络故障。

可选的,还包括:

若所述存储节点利用主网卡接入infiniband网络,则将所述存储节点的当前网卡标识设置为所述存储节点的主网卡的全局唯一标识符;

若所述存储节点利用备用网卡接入infiniband网络,则将所述存储节点的当前网卡标识设置为所述存储节点的备用网卡的全局唯一标识符。

可选的,在按照预设周期获取所述主网卡的网卡状态之后,还包括:

根据所述存储节点的主网卡的网卡状态设置所述存储节点的网卡标志位的值;

相应的,获取所述分布式存储系统中其他存储节点的主网卡的网卡状态,包括:

获取所述分布式存储系统中其他存储节点的网卡标志位;

根据所述其他存储节点的网卡标志位的值确定所述其他存储节点的主网卡的网卡状态。

本申请还提供了一种网络管理系统,应用于分布式存储系统中的存储节点,所述存储节点包括主网卡和备用网卡,该网络管理系统包括:

第一网卡状态获取模块,用于按照预设周期获取所述主网卡的网卡状态;其中,当所述主网卡的网卡状态为正常状态时所述存储节点通过所述主网卡接入infiniband网络;

第二网卡状态获取模块,用于若所述存储节点的主网卡的网卡状态为异常状态,则获取所述分布式存储系统中其他存储节点的主网卡的网卡状态;

第一网卡切换模块,用于判断所有所述其他存储节点的主网卡的网卡状态是否均为异常状态;若是,则切换网卡并利用所述存储节点的备用网卡接入infiniband网络;若否,则不执行网卡切换操作;

第二网卡切换模块,用于当检测到所述存储节点的主网卡的网卡状态恢复为正常状态时,判断所述其他存储节点的主网卡的网卡状态是否均为正常状态;若是,则切换网卡并利用所述存储节点的主网卡接入infiniband网络;若否,则不执行网卡切换操作。

可选的,所述第二网卡状态获取模块为用于通过所述存储节点的管理网口远程获取所述分布式存储系统中其他存储节点的主网卡的网卡状态的模块。

本申请还提供了一种存储介质,其上存储有计算机程序,所述计算机程序执行时实现上述网络管理方法执行的步骤。

本申请还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现上述网络管理方法执行的步骤。

本申请提供了一种网络管理方法,应用于分布式存储系统中的存储节点,所述存储节点包括主网卡和备用网卡,该网络管理方法包括:按照预设周期获取所述主网卡的网卡状态;其中,当所述主网卡的网卡状态为正常状态时所述存储节点通过所述主网卡接入infiniband网络;若所述存储节点的主网卡的网卡状态为异常状态,则获取所述分布式存储系统中其他存储节点的主网卡的网卡状态;判断所有所述其他存储节点的主网卡的网卡状态是否均为异常状态;若是,则切换网卡并利用所述存储节点的备用网卡接入infiniband网络;若否,则不执行网卡切换操作;当检测到所述存储节点的主网卡的网卡状态恢复为正常状态时,判断所述其他存储节点的主网卡的网卡状态是否均为正常状态;若是,则切换网卡并利用所述存储节点的主网卡接入infiniband网络;若否,则不执行网卡切换操作。

本申请应用于分布式存储系统中的存储节点,分布式存储系统中可以包括多个存储节点,本申请所提供的网络管理方法按照预设周期获取主网卡的网卡状态,若主网卡为异常状态则获取分布式存储系统中其他存储节点的主网卡状态。导致存储节点主网卡状态异常的原因可以为交换机故障,也可以为存储节点被注入故障。若存储节点被注入能够中断网络的故障,无论存储节点切换至哪个网卡都无法实现网络功能,本申请通过获取其他存储节点的主网卡状态可以判断是否为交换机故障导致的主网卡状态异常。若其他存储节点的主网卡状态均为异常状态则说明存在交换机故障,可以切换网卡并利用所述存储节点的备用网卡接入infiniband网络。本申请还在存储节点的主网卡恢复正常后判断其他存储节点的主网卡的网卡状态是否均恢复正常,若分布式存储系统的所有存储节点的主网卡均恢复正常,则执行网卡切换操作,避免了网卡状态误判导致的网卡错误切换。可见,本申请能够准确检测网络状态,提高网卡主备切换效率。本申请同时还提供了一种网络管理系统、一种电子设备和一种存储介质,具有上述有益效果,在此不再赘述。

附图说明

为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例所提供的一种网络管理方法的流程图;

图2为本申请实施例所提供的一种网络管理系统的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

下面请参见图1,图1为本申请实施例所提供的一种网络管理方法的流程图。

具体步骤可以包括:

s101:按照预设周期获取主网卡的网卡状态;

其中,本实施例可以应用于分布式存储系统中的存储节点,分布式存储系统中可以包括多个存储节点,每一存储节点均可以设置有主网卡和备用网卡,所有的主网卡均与主交换机连接,所有的备用网卡均与备用交换机连接。当存储节点将当前网卡切换至主网卡时,存储节点通过主网卡和主交换机接入网络;当存储节点将当前网卡切换至备用网卡时,存储节点通过备用网卡和备用交换机接入网络。

作为一种可行的实施方式,当存储节点的主网卡的网卡状态为正常状态时,其中,当主网卡的网卡状态为正常状态时存储节点可以通过主网卡接入infiniband网络。进一步的,分布式存储系统中所有存储节点的主网卡与第一infiniband交换机(即主交换机)连接,分布式存储系统中所有存储节点的备用网卡与第二infiniband交换机(即备用交换机)连接。本实施例可以按照预设周期获取主网卡的网卡状态。具体的,本实施例可以通过读取主网卡的运行状态参数(如传输速率)与预设参数进行比较,若不为预设参数则判定主网卡的网卡状态为异常状态,若运行状态参数为预设参数或在预设参数对应的取值范围内则判定主网卡的网卡状态为正常状态。infiniband缩写为ib,是一个用于高性能计算的计算机网络通信标准,infiniband具有极高的吞吐量和极低的延迟,用于计算机与计算机之间的数据互连。infiniband也用作服务器与存储系统之间的直接或交换互连,以及存储系统之间的互连。

s102:若存储节点的主网卡的网卡状态为异常状态,则获取分布式存储系统中其他存储节点的主网卡的网卡状态;

其中,在本步骤之前还可以存在存储节点判断主网卡的网卡状态是否为异常状态的操作,若主网卡的网卡状态为正常状态则可以重复执行s101的相关操作,若主网卡的网卡状态为异常状态则可以执行s102的相关操作。本步骤建立在已经判定主网卡的网卡状态为异常状态的基础上,导致网卡出现异常状态的原因可以包括交换机故障(如交换机突然断电),还可以包括存储节点被注入能够中断网络的故障。

作为一种可行的实施方式,本实施例可以通过以下方式获取其他存储节点的主网卡的网卡状态:通过所述存储节点的管理网口远程获取所述分布式存储系统中其他存储节点的主网卡的网卡状态。

s103:判断所有其他存储节点的主网卡的网卡状态是否均为异常状态;若是,则进入s104;若否,则结束流程,不执行网卡切换操作;

本步骤在确定存储节点的主网卡的网卡状态为异常状态之后,根据其他存储节点的主网卡的网卡状态确定导致网卡状态为异常状态的原因。若与主网卡连接的交换机故障,分布式存储系统中所有的存储节点均无法通过主网卡接入网络;若存储节点被注入能够中断网络的故障,则那么分布式存储系统中其他存储节点仍能够通过主网卡计入网络,即其他存储节点的主网卡的网卡状态为正常状态。

进一步的,若存储节点的主网卡的网卡状态为异常状态、且所有其他存储节点的主网卡的网卡状态不均为异常状态,则判定存储节点被注入网络故障。

s104:切换网卡并利用存储节点的备用网卡接入infiniband网络。

其中,本步骤建立在已经确定分布式存储系统内所有存储节点的主网卡的网卡状态均为异常状态的基础上,将存储节点的当前网卡由主网卡切换至备用网卡,进而利用备用网卡接入infiniband网络。

作为一种可行的实施方式,在执行s104之后,还可以存在检测述存储节点的主网卡的网卡状态的操作,当检测到所述存储节点的主网卡的网卡状态恢复为正常状态时,判断所述其他存储节点的主网卡的网卡状态是否均为正常状态;若是,则切换网卡并利用所述存储节点的主网卡接入infiniband网络;若否,则不执行网卡切换操作。

本实施例应用于分布式存储系统中的存储节点,分布式存储系统中可以包括多个存储节点,本实施例所提供的网络管理方法按照预设周期获取主网卡的网卡状态,若主网卡为异常状态则获取分布式存储系统中其他存储节点的主网卡状态。导致存储节点主网卡状态异常的原因可以为交换机故障,也可以为存储节点被注入故障。若存储节点被注入能够中断网络的故障,无论存储节点切换至哪个网卡都无法实现网络功能,本实施例通过获取其他存储节点的主网卡状态可以判断是否为交换机故障导致的主网卡状态异常。若其他存储节点的主网卡状态均为异常状态则说明存在交换机故障,可以切换网卡并利用所述存储节点的备用网卡接入infiniband网络。本实施例还在存储节点的主网卡恢复正常后判断其他存储节点的主网卡的网卡状态是否均恢复正常,若分布式存储系统的所有存储节点的主网卡均恢复正常,则执行网卡切换操作,避免了网卡状态误判导致的网卡错误切换。可见,本实施例能够准确检测网络状态,提高网卡主备切换效率。

作为对于图1对应实施例的进一步介绍,在切换网卡并利用所述存储节点的备用网卡接入infiniband网络之后,还可以持续检测存储节点的主网卡的网卡状态,当检测到所述存储节点的主网卡的网卡状态有异常状态恢复为正常状态时,可以判断所述其他存储节点的主网卡的网卡状态是否均为正常状态;若是,则切换网卡并利用所述存储节点的主网卡接入infiniband网络。

作为对于图1对应实施例的进一步介绍,若所述存储节点利用主网卡接入infiniband网络,则将所述存储节点的当前网卡标识设置为所述存储节点的主网卡的全局唯一标识符;若所述存储节点利用备用网卡接入infiniband网络,则将所述存储节点的当前网卡标识设置为所述存储节点的备用网卡的全局唯一标识符。用户可以根据当前网卡标识确定存储节点当前使用的网卡。

作为对于图1对应实施例的进一步介绍,在按照预设周期获取所述主网卡的网卡状态之后,还可以根据所述存储节点的主网卡的网卡状态设置所述存储节点的网卡标志位的值。相应的,获取其他存储节点的主网卡的网卡状态的操作可以包括:获取所述分布式存储系统中其他存储节点的网卡标志位;根据所述其他存储节点的网卡标志位的值确定所述其他存储节点的主网卡的网卡状态。

下面通过在实际应用中的实施例说明上述实施例描述的流程。在实际使用过程中,当作为主交换机的infiniband交换机断电后,infiniband网络会中断约60s,这段时间内子网管理器判断交换机故障后完成切换子网络,网络通信恢复。当infiniband网络中断后,存储集群服务不可用,客户业务因此而中断。当前没有手段快速检测infiniband网络故障,没有手段减少这60s的网络中断时间,也没有技术手段避免存储业务不断流。本申请提供了一种分布式存储环境下infiniband交换机主备切换不断流的设计方法,能够解决上述相关技术中主备网卡切换时间过长、网卡切换效率较低的问题,具体可以包括以下步骤:

步骤1:根据存储节点上两张网卡a(即主网卡)和网卡b(即备用网卡)的全局唯一标识符(guid信息),设定网卡a所在的交换机为主交换机,网卡b所在的交换机为备交换机;

步骤2:定时扫描网卡a的状态,如果网卡a状态正常则退出流程等待下一次检查周期;如果a网卡异常,则执行步骤3;

步骤3:网卡a异常时通过存储节点的管理网口远程查看集群中其他节点上网卡a的状态,如果其他节点上网卡a正常,则本地不作调整;如果其他节点上网卡a同样异常,则完成infiniband网络切换,从交换机a(即第一infiniband交换机)切换到交换机b(即第二infiniband交换机)上;完成后执行步骤4;

步骤4:继续检查网卡a的状态,如果网卡a重新工作,检查集群中其他节点上的网卡a是否正常工作,如果不正常则不作调整,如果正常则将infiniband网络重新切换到交换机a上;完成后执行步骤1。

上述实施例根据as13000分布式存储的特性,提供了一种分布式存储环境下infiniband交换机主备切换不断流的设计方法,可以在主infiniband交换机断电后,快速检测到网络异常并完成子网切换,使infiniband网络中断时间控制在1秒以内,此时存储集群因为有内部缓存,可以解决infiniband交换机主备切换断流问题,保证前端业务持续读写、不断流。

本实施例通过主动监测infiniband网络状态,在每次网络故障时主动切换故障网络,使网络中断时间极致缩短,达到交换机故障时业务不断流的目的,解决infiniband交换机主备切换断流问题。

请参见图2,图2为本申请实施例所提供的一种网络管理系统的结构示意图;应用于分布式存储系统中的存储节点,所述存储节点包括主网卡和备用网卡,所述网络管理系统包括:

第一网卡状态获取模块100,用于按照预设周期获取所述主网卡的网卡状态;其中,当所述主网卡的网卡状态为正常状态时所述存储节点通过所述主网卡接入infiniband网络;

第二网卡状态获取模块200,用于若所述存储节点的主网卡的网卡状态为异常状态,则获取所述分布式存储系统中其他存储节点的主网卡的网卡状态;

第一网卡切换模块300,用于判断所有所述其他存储节点的主网卡的网卡状态是否均为异常状态;若是,则切换网卡并利用所述存储节点的备用网卡接入infiniband网络;若否,则不执行网卡切换操作;

第二网卡切换模块400,用于当检测到所述存储节点的主网卡的网卡状态恢复为正常状态时,判断所述其他存储节点的主网卡的网卡状态是否均为正常状态;若是,则切换网卡并利用所述存储节点的主网卡接入infiniband网络;若否,则不执行网卡切换操作。

本实施例应用于分布式存储系统中的存储节点,分布式存储系统中可以包括多个存储节点,本实施例所提供的网络管理方法按照预设周期获取主网卡的网卡状态,若主网卡为异常状态则获取分布式存储系统中其他存储节点的主网卡状态。导致存储节点主网卡状态异常的原因可以为交换机故障,也可以为存储节点被注入故障。若存储节点被注入能够中断网络的故障,无论存储节点切换至哪个网卡都无法实现网络功能,本实施例通过获取其他存储节点的主网卡状态可以判断是否为交换机故障导致的主网卡状态异常。若其他存储节点的主网卡状态均为异常状态则说明存在交换机故障,可以切换网卡并利用所述存储节点的备用网卡接入infiniband网络。本实施例还在存储节点的主网卡恢复正常后判断其他存储节点的主网卡的网卡状态是否均恢复正常,若分布式存储系统的所有存储节点的主网卡均恢复正常,则执行网卡切换操作,避免了网卡状态误判导致的网卡错误切换。可见,本实施例能够准确检测网络状态,提高网卡主备切换效率。

进一步的,所述分布式存储系统中所有存储节点的主网卡与第一infiniband交换机连接,所述分布式存储系统中所有存储节点的备用网卡与第二infiniband交换机连接。

进一步的,第二网卡状态获取模块200具体为用于通过所述存储节点的管理网口远程获取所述分布式存储系统中其他存储节点的主网卡的网卡状态的模块。

进一步的,还包括:

故障确定模块,用于若所述存储节点的主网卡的网卡状态为异常状态、且所有所述其他存储节点的主网卡的网卡状态不均为异常状态,则判定所述存储节点被注入网络故障。

进一步的,还包括:

当前网卡标识设置模块,用于若所述存储节点利用主网卡接入infiniband网络,则将所述存储节点的当前网卡标识设置为所述存储节点的主网卡的全局唯一标识符;还用于若所述存储节点利用备用网卡接入infiniband网络,则将所述存储节点的当前网卡标识设置为所述存储节点的备用网卡的全局唯一标识符。

进一步的,还包括:

标志位设置模块,用于在按照预设周期获取所述主网卡的网卡状态之后,根据所述存储节点的主网卡的网卡状态设置所述存储节点的网卡标志位的值;

相应的,第二网卡状态获取模块200用于获取所述分布式存储系统中其他存储节点的网卡标志位;还用于根据所述其他存储节点的网卡标志位的值确定所述其他存储节点的主网卡的网卡状态。

由于系统部分的实施例与方法部分的实施例相互对应,因此系统部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。

本申请还提供了一种存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

本申请还提供了一种电子设备,可以包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然所述电子设备还可以包括各种网络接口,电源等组件。

说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1