一种分布式存储节点网络错包检测方法及装置与流程

文档序号:23097424发布日期:2020-11-27 12:59阅读:153来源:国知局
一种分布式存储节点网络错包检测方法及装置与流程

本发明属于网络检测技术领域,具体涉及一种分布式存储节点网络错包检测方法及装置。



背景技术:

bond,是linux系统中双网卡绑定技术。

网卡绑定就是把多张物理网卡通过软件虚拟成一个虚拟的网卡,配置完毕后,所有的物理网卡的ip和mac将会变成相同的。多网卡同时工作可以提高网络速度,还可以实现网卡的负载均衡、冗余。而网卡绑定模式有七种,常用的有轮转模式和主备模式。

分布式存储应用场景中,不能保证每个存储节点的网络都是正常的,若网络异常,存储节点会出现数据丢失,造成损失,而且如果某个存储节点的网络错包率过大一直没有相应处理,将导致整个存储出现稳定性及性能异常。

此为现有技术的不足,因此,针对现有技术中的上述缺陷,提供一种分布式存储节点网络错包检测方法及装置,是非常有必要的。



技术实现要素:

针对现有技术的上述分布式存储系统中,存储节点网络异常,导致网络错包率过大,影响整个存储系统性能的缺陷,本发明提供一种分布式存储节点网络错包检测方法及装置,以解决上述技术问题。

第一方面,本发明提供一种分布式存储节点网络错包检测方法,包括如下步骤:

s1.设置分布式存储系统中每个节点的网卡绑定采用双网口主备模式;

s2.在分布式存储系统内设置测试域,设置测试域内一个节点作为待测节点,设置测试域内其他节点作为辅助节点,设置待测节点向辅助节点发送报文,并接收辅助节点返回的报文,计算错包率;

s3.判断测试域内待测节点的错包率是否超过设定阈值,并在错包率超过设定阈值时,判定待测节点网口故障,并设置待测节点启动主备网口切换;

s4.判断测试域内待测节点是否主备网口均故障,并在主备网口均故障时,将待测节点从分布式存储系统进行隔离。

进一步地,步骤s2具体步骤如下:

s21.在分布式存储系统中选择n个节点,并对n个节点进行排序,设置为环形;

s22.设置每个节点作为待测节点,而将待测节点后的n/2+1个节点作为同一个测试域内的辅助节点;

s23.设置待测节点向其测试域内所有辅助节点发送报文,并在设定时间段内接收辅助节点返回的报文,计算错包率。n个节点随机选择,并人为认定排序;设置n个节点为环形保证每个待测节点都有辅助节点,若不设置为环形,则会出现有的待测节点没有辅助节点的情形。

进一步地,设置n的取值为3≤n≤6。合适的n取值既不能使得计算量过大,又保证能反应出待测节点的出错包率。

进一步地,步骤s23中,设置所有待测节点同时向各自测试域内所有辅助节点发送报文。发送报文之前需要获取测试域内辅助节点的ip信息和端口信息,为报文发送做好准备。

进一步地,步骤s23具体步骤如下:

s231.设置待测节点向其测试域内所有辅助节点发送设定数量的udp报文,且udp报文带有序号和时间标签;

s232.设置待测节点在设定时间段内接收辅助节点返回的udp报文,并根据各udp报文序号和时间标签判断是否存在错包,并统计错包率。udp报文为无需建立连接而直接发送的报文,因为报文带有时间标签和序号,所以可根据时间标签和序号进行报文验证,所以采用无需验证连接建立再发送的udp报文。

进一步地,步骤s3具体步骤如下:

s31.判断测试域内待测节点针对每个辅助节点的错包率是否均超过阈值;

若是,进入步骤s32;

若否,进入步骤s33;

s32.判定待测节点网口故障,待测节点启动主备网口切换,进入步骤s4;

s33.判定待测节点网口正常,结束。当发向每个辅助节点的报文错包率都超过阈值,才判定待测节点网口故障。

进一步地,步骤s4具体步骤如下:

s41.判断测试域内待测节点主备网口切换频率是否超过阈值;

若是,判定待测节点主备网口均故障,进入步骤s42;

若否,判定待测节点网络正常,结束;

s42.将待测节点从分布式存储系统进行隔离。主备网口切换频率超限,说明主备两个网口均故障,进入了切换死循环。

第二方面,本发明提供一种分布式存储节点网络错包检测装置,包括:

网卡绑定模式设置模块,用于设置分布式存储系统中每个节点的网卡绑定采用双网口主备模式;

错包率计算模块,用于在分布式存储系统内设置测试域,设置测试域内一个节点作为待测节点,设置测试域内其他节点作为辅助节点,设置待测节点向辅助节点发送报文,并接收辅助节点返回的报文,计算错包率;

网口切换模块,用于判断测试域内待测节点的错包率是否超过设定阈值,并在错包率超过设定阈值时,判定待测节点网口故障,并设置待测节点启动主备网口切换;

待测节点隔离模块,用于判断测试域内待测节点是否主备网口均故障,并在主备网口均故障时,将待测节点从分布式存储系统进行隔离。

进一步地,错包率计算模块包括:

节点选择单元,用于在分布式存储系统中选择n个节点,并对n个节点进行排序,设置为环形;

测试域设定单元,用于设置每个节点作为待测节点,而将待测节点后的n/2+1个节点作为同一个测试域内的辅助节点;

错包率计算单元,设置待测节点向其测试域内所有辅助节点发送报文,并在设定时间段内接收辅助节点返回的报文,计算错包率。

进一步地,网口切换模块包括:

错包率判断单元,用于判断测试域内待测节点针对每个辅助节点的错包率是否均超过阈值;

主备网口切换单元,用于错包率超过阈值时,判定待测节点网口故障,待测节点启动主备网口切换;

网口正常判定单元,用于错包率不超过阈值时,判定待测节点网口正常。

进一步地,待测节点隔离模块包括:

网口切换频率判断单元,用于判断测试域内待测节点主备网口切换频率是否超过阈值;

主备网口故障判定单元,用于主备网口切换频率超过阈值时,判定待测节点主备网口均故障;

网络正常判定单元,用于主备网口切换频率不超过阈值时,判定待测节点网络正常;

待测节点隔离单元,用于待测节点主备网口均故障时,将待测节点从分布式存储系统进行隔离。

本发明的有益效果在于,

本发明提供的分布式存储节点网络错包检测方法及装置,通过设置测试域对待测节点进行报文测试,计算错包率,并在错包率超过阈值时,进行双网卡绑定的主备切换,并在主备网口均故障时,将待测节点从存储系统网络进行隔离;本发明及时发现存储系统节点网络故障,并解决网络故障,在网络故障无法解决时,隔离节点,避免错包率高的存储系统节点对整个存储造成影响。

此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。

由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明的方法流程示意图一;

图2是本发明的方法流程示意图二;

图3为本发明的系统示意图;

图中,1-网卡绑定模式设置模块;2-错包率计算模块;2.1-节点选择单元;2.2-测试域设定单元;2.3-错包率计算单元;3-网口切换模块;3.1-错包率判断单元;3.2-主备网口切换单元;3.3-网口正常判定单元;4-待测节点隔离模块;4.1-网口切换频率判断单元;4.2-主备网口故障判定单元;4.3-网络正常判定单元;4.4-待测节点隔离单元。

具体实施方式

为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

实施例1:

如图1所示,本发明提供一种分布式存储节点网络错包检测方法,包括如下步骤:

s1.设置分布式存储系统中每个节点的网卡绑定采用双网口主备模式;

s2.在分布式存储系统内设置测试域,设置测试域内一个节点作为待测节点,设置测试域内其他节点作为辅助节点,设置待测节点向辅助节点发送报文,并接收辅助节点返回的报文,计算错包率;

s3.判断测试域内待测节点的错包率是否超过设定阈值,并在错包率超过设定阈值时,判定待测节点网口故障,并设置待测节点启动主备网口切换;

s4.判断测试域内待测节点是否主备网口均故障,并在主备网口均故障时,将待测节点从分布式存储系统进行隔离。

实施例2:

如图2所示,本发明提供一种分布式存储节点网络错包检测方法,包括如下步骤:

s1.设置分布式存储系统中每个节点的网卡绑定采用双网口主备模式;

s2.在分布式存储系统内设置测试域,设置测试域内一个节点作为待测节点,设置测试域内其他节点作为辅助节点,设置待测节点向辅助节点发送报文,并接收辅助节点返回的报文,计算错包率;具体步骤如下:

s21.在分布式存储系统中选择n个节点,并对n个节点进行排序,设置为环形;

s22.设置每个节点作为待测节点,而将待测节点后的n/2+1个节点作为同一个测试域内的辅助节点;

s23.设置待测节点向其测试域内所有辅助节点发送报文,并在设定时间段内接收辅助节点返回的报文,计算错包率;

s3.判断测试域内待测节点的错包率是否超过设定阈值,并在错包率超过设定阈值时,判定待测节点网口故障,并设置待测节点启动主备网口切换;具体步骤如下:

s31.判断测试域内待测节点针对每个辅助节点的错包率是否均超过阈值;

若是,进入步骤s32;

若否,进入步骤s33;

s32.判定待测节点网口故障,待测节点启动主备网口切换,进入步骤s4;

s33.判定待测节点网口正常,结束;

s4.判断测试域内待测节点是否主备网口均故障,并在主备网口均故障时,将待测节点从分布式存储系统进行隔离;具体步骤如下:

s41.判断测试域内待测节点主备网口切换频率是否超过阈值;

若是,判定待测节点主备网口均故障,进入步骤s42;

若否,判定待测节点网络正常,结束;

s42.将待测节点从分布式存储系统进行隔离。

在某些实施例中,步骤s23,设置所有待测节点同时向各自测试域内所有辅助节点发送报文。

在某些实施例中,步骤s23具体步骤如下:

s231.设置待测节点向其测试域内所有辅助节点发送100个的udp报文,且udp报文带有序号和时间标签;

s232.设置待测节点在5s内接收辅助节点返回的udp报文,并根据各udp报文序号和时间标签判断是否存在错包,并统计错包率。

在某些实施例中,步骤s2中,具体步骤如下:

s21.在分布式存储系统中选择n个节点,并对n个节点进行排序,设置为环形;设置n的取值为3≤n≤6;

s22.设置每个节点作为待测节点,而将待测节点后的n/2+1个节点作为同一个测试域内的辅助节点;

s23.设置待测节点向其测试域内所有辅助节点发送报文,并在设定时间段内接收辅助节点返回的报文,计算错包率。

实施例3:

如图3所示,本发明提供一种分布式存储节点网络错包检测装置,包括:

网卡绑定模式设置模块1,用于设置分布式存储系统中每个节点的网卡绑定采用双网口主备模式;

错包率计算模块2,用于在分布式存储系统内设置测试域,设置测试域内一个节点作为待测节点,设置测试域内其他节点作为辅助节点,设置待测节点向辅助节点发送报文,并接收辅助节点返回的报文,计算错包率;错包率计算模块2包括:

节点选择单元2.1,用于在分布式存储系统中选择n个节点,并对n个节点进行排序,设置为环形;

测试域设定单元2.2,用于设置每个节点作为待测节点,而将待测节点后的n/2+1个节点作为同一个测试域内的辅助节点;

错包率计算单元2.3,设置待测节点向其测试域内所有辅助节点发送报文,并在设定时间段内接收辅助节点返回的报文,计算错包率;

网口切换模块3,用于判断测试域内待测节点的错包率是否超过设定阈值,并在错包率超过设定阈值时,判定待测节点网口故障,并设置待测节点启动主备网口切换;网口切换模块3包括:

错包率判断单元3.1,用于判断测试域内待测节点针对每个辅助节点的错包率是否均超过阈值;

主备网口切换单元3.2,用于错包率超过阈值时,判定待测节点网口故障,待测节点启动主备网口切换;

网口正常判定单元3.3,用于错包率不超过阈值时,判定待测节点网口正常;

待测节点隔离模块4,用于判断测试域内待测节点是否主备网口均故障,并在主备网口均故障时,将待测节点从分布式存储系统进行隔离;待测节点隔离模块4包括:

网口切换频率判断单元4.1,用于判断测试域内待测节点主备网口切换频率是否超过阈值;

主备网口故障判定单元4.2,用于主备网口切换频率超过阈值时,判定待测节点主备网口均故障;

网络正常判定单元4.3,用于主备网口切换频率不超过阈值时,判定待测节点网络正常;

待测节点隔离单元4.4,用于待测节点主备网口均故障时,将待测节点从分布式存储系统进行隔离。

尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1