一种弹性网卡稳定性自动巡检方法及系统与流程

文档序号:28917516发布日期:2022-02-16 11:48阅读:86来源:国知局
一种弹性网卡稳定性自动巡检方法及系统与流程

1.本发明属于通信技术领域,尤其涉及一种弹性网卡稳定性自动巡检方法及系统。


背景技术:

2.当前云服务不仅仅是提供vm计算服务、disk存储服务以及ip网络服务,还有很多衍生产品,如:私有网络vpc、waf防火墙、slb负载均衡服务、安全组、弹性网卡等等,而弹性网卡提供的服务就是进行网络连通,这种服务主要是对内网进行配置进而连通内网,具体的,弹性网卡也会像云服务vm一样也由不同的节点来提供不同地域的服务。具体的,不同节点如:购买价格、创建成功与否、配置设置、调度算法、超时控制、是否符合需求情况等等,并且,在不断迭代的服务期间,新节点会持续不断增加。目前的弹性网卡并没有设定通信稳定性实时监控机制,存在无法及时发现问题以及无法提前维护的滞后性问题,网络容易出现全面瘫痪的情况,经济损失较大。


技术实现要素:

3.(一)发明目的为了克服以上不足,本发明的目的在于提供一种弹性网卡稳定性自动巡检方法及系统,以解决现有的弹性网卡缺少稳定性监控机制,导致网络容易出现全面瘫痪的情况,经济损失较大的技术问题。
4.(二)技术方案为实现上述目的,本技术一方面提供的技术方案如下:一种弹性网卡稳定性自动巡检方法,包括:预先设定弹性网卡不合格节点数量的标准控制界限;每个第一单位时间段内,获取弹性网卡在当前第一单位时间段内所有节点测试样本并且计算当前所有节点测试样本的平均不合格节点数量;判断当前平均不合格节点数量是否超出标准控制界限;若未超出,判断弹性网卡当前处于稳定状态;若超出,判断弹性网卡当前处于不稳定状态。
5.本技术通过预先设定弹性网卡不合格节点数量的标准控制界限,然后每到一个第一单位时间段的最后时刻,自动获取当前第一单位时间段弹性网卡所有节点测试样本,然后计算当前所有节点测试样本的平均不合格节点数量,最后将当前平均不合格节点数量与标准控制界限进行比对,若比对到当前平均不合格节点数量未超出标准控制界限,则判断弹性网卡当前处于稳定状态,否则,判断弹性网卡当前不处于稳定状态,如此,可以实现对弹性网卡稳定性进行自动化检测,在弹性网卡初期出现不稳定状态时就可以做到提前发现以及提前维护,避免在弹性网卡在所有节点均出现问题,网络全面瘫痪后才发现问题,若网络全面瘫痪,经济损失较大。
6.进一步的,还包括:
预先设定弹性网卡不合格节点数量的标准中心线;每个第二单位时间段内,检测当前第二单位时间段内多个平均不合格节点数量与标准中心线的偏离程度;若偏离程度超过预定范围,预判弹性网卡趋向不稳定状态;其中,第二单位时间段的时长大于第一单位时间段的时长;通过设置预判的步骤,维护人员可以提前了解弹性网卡的稳定性发展趋势,可以做到提前了解节点的发展趋势,在节点还处于正常稳定状态,但是有向不稳定方向发展的趋势时提前对节点进行维护,避免节点出现问题不合格时才发现,进一步起到及时发现问题以及及时维护的作用。
7.进一步的,还包括:在每个第一单位时间段内,计算多个节点测试样本的样本控制界限;每个第三单位时间段内,将当前第三单位时间段内多个样本控制界限所对应的界限数值以及上一个第三单位时间段的标准控制界限所对应的界限数值进行逐个比对,选取界限数值最小的控制界限作为最新的标准控制界限;其中,第三单位时间段的时长大于第一单位时间段的时长;通过将历史数据进行比对,选取最小的控制界限作为标准控制界限,如此可以逐步缩小控制界限的范围,优化出既符合当前弹性网卡工作属性又可提升弹性网卡的稳定性要求的控制界限范围。
8.进一步的,计算多个节点测试样本的平均不合格节点数量之前,还包括:对获取到的所有节点测试样本进行分组;分别检测各组中不合格节点测试样本的数量。
9.进一步的,每隔第一单位时间段,计算所有节点测试样本的平均不合格节点数量包括:计算每组节点测试样本的不合格品率;基于平均计算:,求出当前所有节点测试样本的平均不合格品率;其中, 为平均不合格品率, 为第一分组的不合格品率, 为第二分组的不合格品率, 为第三分组的不合格品率, 第分组的不合格品率,为总分组数;将平均不合格品率与当前所有节点测试样本总数相乘,求出当前所有节点测试样本的平均不合格节点数量。
10.进一步的,计算测试样本控制界限包括:基于控制界限计算公式:
ꢀꢀ
,计算测试样本的控制界限,其中, 为平均不合格品率, 为组数。
11.本技术另一方面提供了一种弹性网卡巡检系统,包括:
获取模块,用于在每个第一单位时间段内,获取弹性网卡在当前第一单位时间段内所有的节点测试样本;平均不合格节点数量计算模块,用于计算当前第一单位时间段内所有节点测试样本的平均不合格节点数量;标准控制界限判断模块,用于判断平均不合格节点数量是否超出标准控制界限;其中,标准控制界限是预先设定的;当标准控制界限判断模块判断到平均不合格节点数量未超出标准控制界限,判断弹性网卡当前处于稳定状态;当标准控制界限判断模块判断到平均不合格节点数量超出标准控制界限,判断弹性网卡当前处于不稳定状态。
12.进一步的,还包括:偏离程度检测模块,用于检测一个第二单位时间段内多个平均不合格节点数量与标准中心线的偏离程度;其中,标准中心线是预先设定的;趋势判断模块,当偏离程度检测模块检测到多个平均不合格节点数量偏离程度超过预定范围,预判弹性网卡当前趋向不稳定状态。
13.进一步的,还包括:样本控制界限计算模块,在每个第一单位时间段内计算多个节点测试样本的样本控制界限;控制界限比对模块,在第三单位时间段内,将第三单位时间段内多个样本控制界限对应的界限数值以及上一个第三单位时间段的标准控制界限对应的界限数值进行逐个比对,选取界限数值最小的控制界限作为最新的标准控制界限。
14.进一步的,还包括:分组模块,对第一单位时间段内获取到的多个节点测试样本进行分组;不合格节点测试样本检测模块,检测各组中不合格节点测试样本的数量。
附图说明
15.图1是本发明的弹性网卡稳定性自动巡检方法的流程图;图2是本发明的弹性网卡稳定性自动巡检方法生成的图表。
具体实施方式
16.为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
17.本发明提供的一种弹性网卡稳定性自动巡检方法,包括:预先设定弹性网卡不合格节点数量的标准控制界限;每到一个第一单位时间段内(0-t1、t1-t2.....t(n-1)-tn),获取弹性网卡在当前第一单位时间段内所有节点测试样本,然后计算所有节点测试样本的平均不合格节点数
量;判断当前平均不合格节点数量是否超出标准控制界限;若未超出,判断弹性网卡当前处于稳定状态;若超出,判断弹性网卡当前处于不稳定状态。
18.具体的,由于弹性网卡的节点不断迭代,节点测试样本的数量可能增加或减少,因此,每到另一个第一单位时间段,需要重新获取所有节点测试样本,然后再对获取到的所有节点测试样本进行平均不合格节点数量计算。
19.计算所有节点测试样本的平均不合格节点数量的具体步骤如下:第一步:对获取到的所有节点测试样本进行分组;第二步:分别检测各分组中不合格节点测试样本的数量;第三步:分别计算每个分组不合格节点测试样本的不合格品率;第四步:对所有分组的不合格品率相加,然后取平均值,求出所有节点测试样本的平均不合格品率;第五步:将平均不合格品率与当前所有节点测试样本总数相乘,求出当前平均不合格节点数量。
20.优选的,本技术还可以对弹性网卡稳定状态进行提前预判,可以提前了解弹性网卡稳定性的发展趋势,具体的,预判步骤如下:预先设定弹性网卡不合格节点数量的标准中心线;每到一个第二单位时间段,检测当前第二单位时间段内多个平均不合格节点数量对应的数值与标准中心线的偏离程度;若检测到偏离程度超过预定范围,预判弹性网卡当前趋向不稳定状态;若检测到未超过预定范围,判断弹性网卡当前处于稳定状态。
21.具体的,第二单位时间段的时长大于第一单位时间段的时长,每个第二单位时间段内含有多个平均不合格节点。
22.具体的,可以根据以往历史数据自定义标准控制界限和标准中心线,也可以在弹性网卡的初始阶段实时选取多个节点测试样本,然后计算初始阶段的多个节点测试样本的控制界限和中心线,以计算出的控制界限和中心线作为标准控制界限以及标准中心线。
23.具体的,结合图2和表格1,对弹性网卡的稳定性自动巡检方法进行举例说明,在下面例子中,标准控制界限以及标准中心线是以初始阶段取多个节点测试样本进行计算的。
24.表格1中初始阶段获取到100个节点测试样本,自定义将节点测试样本分成25组,p为分组的不合格率。
25.图2中横坐标表示每个第一单位时间段的末端时刻,纵坐标分别表示平均不合格节点的数量,其中,为标准中心线对应的平均不合格节点的数量,为标准控制界限对应的平均不合格节点的数量。
26.表格1具体步骤如下:

分别计算每个分组中不合格品率 : =4/100=0.04, =2/100=0.02,....... =2/100=0.02;

计算所有分组中所有节点测试样本的平均不合格品率 : ;

计算标准中心线:(件) ;

计算标准控制界限:(个) ;从计算结果可知,100个节点测试样本稳定在0-9个这个水平,以9个作为标准控制界限。
27.在到达另一个第一单位时间段后,重新获取所有节点测试样本,然后对所有节点测试样本进行分组,复用步骤
①②③
的公式,分别求出当前的平均不合格节点数量,然后判断当前的平均不合格节点数量是否在0-9的范围内,若是,判断弹性网卡当前处于稳定状态,若否,判断弹性网卡当前处于不稳定状态(如图2中b的框选区域)。
28.请参阅图2,具体的,判断多个平均不合格节点数量与标准中心线的偏离程度可采用七点规则方式,具体的,在一个第二单位时间段时,检测连续的7个平均不合格节点数量与标准中心线的位置,若连续的7个平均不合格节点数量均处于弹性网卡不合格节点数量的上方(如图2中a的框选区域),表示偏离程度较大,预断弹性网卡趋向不稳定方向发展,若连续的7个平均不合格节点数量至少有一个点位于标准中心线上或位于标准中心线下方(如图2中c的框选区域),表示弹性网卡处于正常的上下浮动范围,判断为正常状态,判断弹性网卡持续保持稳定状态。
29.具体的,若预断到趋向不稳定方向发展,可以向维护人员发送提示信息,提示维护人员进行提前检查。
30.优选的,本技术还可以对标准控制界限进行逐步优化,具体优化步骤如下:在每个第一单位时间段内计算节点测试样本的平均不合格节点数量时,同时计算所有节点测试样本的样本控制界限,具体的,计算样本控制界限可以复用上述

的计算公式;在一个第三单位时间段内(第三单位时间段的时长大于第一单位时间段的时长,第三单位时间段内经过多次样本控制界限计算,有多个样本控制界限),将第三单位时间段内多个样本控制界限以及将原先的标准控制界限进行逐个比对,选取对应数值最小的控制
界限作为最新标准控制界限。
31.具体的,例如:第三单位时间段多个样本控制界限分别为8个、10个、12个、15个,上一个第三单位时间段的标准控制界限为10个,此时需要将几个数值进行比对,选出数值最小的控制界限8个作为最新标准控制界限。
32.具体的,若直接人工设定控制界限,不同型号或种类的弹性网卡稳定性不同,设定后可能与当前弹性网卡的稳定性不符合,容易出现频繁报告不稳定的误报情况。
33.具体的,可以根据数据生成对应的图表,如图2所示,提高了所弹性网卡稳定性测试质量及报告可视化。具体的,在节点测试样本超出控制界限时,则自动将图表直接发送测试报告到指定人员,告知测试通过或进一步解决问题。对弹性网卡的快速更新及迭代做出快速的响应并测试大大减少了浪费在如此之多的稳定性测试时间。
34.本技术另一方面提供了一种弹性网卡巡检系统,该系统能够实现上述的弹性网卡稳定性自动巡检方法,系统包括:获取模块,用于在每到一个第一单位时间段内,获取弹性网卡在当前第一单位时间段内所有的节点测试样本;平均不合格节点数量计算模块,用于计算当前第一单位时间段内所有节点测试样本的平均不合格节点数量;标准控制界限判断模块,用于判断平均不合格节点数量是否超出标准控制界限;其中,标准控制界限是预先设定的;当标准控制界限判断模块判断到平均不合格节点数量未超出标准控制界限,判断弹性网卡当前处于稳定状态;当标准控制界限判断模块判断到平均不合格节点数量超出标准控制界限,判断弹性网卡当前处于不稳定状态。
35.在一些实施例中,还包括:偏离程度检测模块,用于检测一个第二单位时间段内多个平均不合格节点数量与标准中心线的偏离程度;其中,标准中心线是预先设定的;趋势判断模块,当偏离程度检测模块检测到多个平均不合格节点数量偏离程度超过预定范围,预判弹性网卡当前趋向不稳定状态。
36.在一些实施例中,还包括:样本控制界限计算模块,在每个第一单位时间段内计算多个节点测试样本的样本控制界限;控制界限比对模块,在第三单位时间段内,将第三单位时间段内多个样本控制界限对应的界限数值以及上一个第三单位时间段的标准控制界限对应的界限数值进行逐个比对,选取界限数值最小的控制界限作为最新的标准控制界限。
37.在一些实施例中,还包括:分组模块,对第一单位时间段内获取到的多个节点测试样本进行分组;不合格节点测试样本检测模块,检测各组中不合格节点测试样本的数量。
38.应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何
修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1