一种预测Kubernetes挂载卷时长的方法及装置与流程

文档序号:23628405发布日期:2021-01-12 10:41阅读:70来源:国知局
一种预测Kubernetes挂载卷时长的方法及装置与流程

本发明涉及kubernetes挂载卷领域,具体涉及一种预测kubernetes挂载卷时长的方法及装置。



背景技术:

kubernetes(容器编排系统)是一个可移植,可扩展,开源的,以容器为中心的管理平台,利用声明式配置以及自动化处理来完成容器的管理,根据用户业务来统一调度管理计算、网络、存储等基础设施资源,是目前容器编排服务领域的事实标准。

csi(containerstorageinterface,容器存储接口)的目的是定义行业标准的“容器存储接口”,使存储供应商能够开发一个符合csi标准的插件并使其可以在多个kubernetes中工作。csi的主要功能包括创建卷、删除卷、挂载卷、卸载卷、扩容卷等操作,这些操作中,比较耗时的是挂载卷,由于耗时较长,用户无法判断当前状态(可能是正在进行中,也可能已经出错,某条指令已卡住)。研发人员可通过查看日志分析运行状态,但是日志的可阅读性较差,用户不易看懂。



技术实现要素:

为解决上述问题,本发明提供一种预测kubernetes挂载卷时长的方法及装置,在挂载卷过程中显示挂载卷剩余时长,避免盲目等待。

本发明的技术方案是:一种预测kubernetes挂载卷时长的方法,包括以下步骤:

获取多组历史挂载卷时长参数组成预测样本;

根据预测样本建立正态分布模型,计算挂载卷理论时长;

执行挂载卷时,根据挂载卷理论时长预测挂载卷剩余时长并显示。

进一步地,挂载卷时长参数包括创建主机时长、映射卷时长、登录主机时长、扫描主机时长、搜索单路径时长、搜索多路径时长、格式化卷时长、挂载时长。

进一步地,该方法还包括以下步骤:

将各个格式化卷时长按对应卷大小等比例缩放;

其中,格式化卷时长按对应卷大小等比例缩放是指:若某组挂载卷时长参数对应卷大小为c*1g,缩放后格式化卷时长=原始格式化卷时长/c。

进一步地,根据预测样本建立正态分布模型,包括:

步骤一,计算每个特征的均值和方差;

第i个特征的均值为:

第i个特征的方差为:

其中,i=1、2……8,k表示第k个预测样本,k=1、2……n,n为预测样本总数;

步骤二,根据每个特征的均值和方差,计算每个特征正态分布的均值和方差;

第i个特征正态分布的均值为:

第i个特征正态分布的方差为:

步骤三:根据每个特征正态分布的均值和方差,计算总体正态分布均值和方差;

总体正态分布均值为:

总体正态分布方差为:

其中,μ7是指缩放后格式化卷时长这一特征正态分布的均值,是指缩放后格式化卷时长这一特征正态分布的方差;m表示特征总个数;

总体整体分布均值即挂载卷理论时长。

进一步地,根据挂载卷理论时长预测挂载卷剩余时长,具体为:

挂载卷剩余时长=挂载卷理论时长-挂载卷已耗时长。

进一步地,当挂载卷已耗时长少于挂载卷理论时长时,根据挂载卷理论时长预测挂载卷剩余时长并显示;

当挂载卷已耗时长超过挂载卷理论时长时,计算发生故障概率并显示;

其中z为挂载卷已耗时长。

本发明的技术方案还包括一种预测kubernetes挂载卷时长的装置,包括,

预测样本建立模块:获取多组历史挂载卷时长参数组成预测样本;

挂载卷理论时长计算模块:根据预测样本建立正态分布模型,计算挂载卷理论时长;

挂载卷剩余时长预测模块:执行挂载卷时,根据挂载卷理论时长预测挂载卷剩余时长并显示。

进一步地,挂载卷时长参数包括创建主机时长、映射卷时长、登录主机时长、扫描主机时长、搜索单路径时长、搜索多路径时长、格式化卷时长、挂载时长;

预测样本建立模块还将各个格式化卷时长按对应卷大小等比例缩放;

其中,格式化卷时长按对应卷大小等比例缩放是指:若某组挂载卷时长参数对应卷大小为c*1g,缩放后格式化卷时长=原始格式化卷时长/c。

进一步地,挂载卷理论时长计算模块包括,

第一计算单元:计算每个特征的均值和方差;

第i个特征的均值为:

第i个特征的方差为:

其中,i=1、2……8,k表示第k个预测样本,k=1、2……n,n为预测样本总数;

第二计算单元:根据每个特征的均值和方差,计算每个特征正态分布的均值和方差;

第i个特征正态分布的均值为:

第i个特征正态分布的方差为:

第三计算单元:根据每个特征正态分布的均值和方差,计算总体正态分布均值和方差;

总体正态分布均值为:

总体正态分布方差为:

其中,μ7是指缩放后格式化卷时长这一特征正态分布的均值,是指缩放后格式化卷时长这一特征正态分布的方差;m表示特征总个数;

总体整体分布均值即挂载卷理论时长;

挂载卷剩余时长预测模块根据挂载卷理论时长预测挂载卷剩余时长的公式为:挂载卷剩余时长=挂载卷理论时长-挂载卷已耗时长。

进一步地,该装置还包括,

发生故障概率计算模块:当挂载卷已耗时长超过挂载卷理论时长时,计算发生故障概率并显示;

其中z为挂载卷已耗时长。

本发明提供的一种预测kubernetes挂载卷时长的方法及装置,利用历史参数基于正态分布预测一个卷的挂载总时长,挂载过程中动态提示剩余时长,优选地在耗时超过预测总时长时,利用累计概率预估发生故障的概率,使用户不再盲目等待,实时了解运行动态。

附图说明

图1是本发明具体实施例一方法流程示意图;

图2是本发明具体实施例二结构示意框图。

具体实施方式

下面结合附图并通过具体实施例对本发明进行详细阐述,以下实施例是对本发明的解释,而本发明并不局限于以下实施方式。

实施例一

如图1所示,本实施例提供一种预测kubernetes挂载卷时长的方法,包括以下步骤:

s1,获取多组历史挂载卷时长参数组成预测样本;

s2,根据预测样本建立正态分布模型,计算挂载卷理论时长;

s3,执行挂载卷时,根据挂载卷理论时长预测挂载卷剩余时长并显示。

该方法根据多组挂载卷时长参数的历史数据建立正态分布模型,计算出挂载卷理论时长,执行挂载卷时,根据挂载卷理论时长推算挂载卷剩余时长,并实时显示,避免用户盲目等待。优选地,当挂载卷实际已消耗时长超过挂载卷理论时长时,根据正态分布模型预测可能发生故障的概率,使用户实时了解挂载卷进度和状态。

本实施例中,挂载卷时长参数包括创建主机时长、映射卷时长、登录主机时长、扫描主机时长、搜索单路径时长、搜索多路径时长、格式化卷时长、挂载时长。这八个特征的单位均是秒。

通过多次挂载卷获取大量原始样本,以提高预测准确率。上述8个特征的时长跟对接的存储类型、存储与kubernetes的部署网络有很大关系,建议将同一存储的操作归为一类原始样本,然后对同一类样本进行建模分析,而不要将不同存储的样本放在一起分析。如下表1所示为采集的6组原始样本示例。

表1历史挂载卷时长参数原始样本示例

每次挂载的卷大小不一定相同,对于同一存储,格式化卷的耗时与卷的大小有直接关系,一般来说,大卷的格式化时间长,小卷的格式化时间短。为了处理方便,本实施例将各个格式化卷时长按对应卷大小等比例缩放后,将各组挂载卷时长参数组成预测样本。具体实施例时,将所有样本的卷大小处理成1g,格式化卷的耗时等比例缩放,其他特征不做改变。即若某组挂载卷时长参数对应卷大小为c*1g,缩放后格式化卷时长=原始格式化卷时长/c。如下表2为将格式化卷缩放后的历史挂载卷时长参数预测样本示例。

表2格式化卷缩放后的历史挂载卷时长参数预测样本示例

获得预测样本后建立正态分布模型,计算挂载卷理论时长,该过程包括以下步骤。

步骤一,计算每个特征的均值和方差;

第i个特征的均值为:

第i个特征的方差为:

其中,i=1、2……8(如上共有8个特征),k表示第k个预测样本,k=1、2……n,n为预测样本总数。

以上述表2示例为例,n的取值为6,即有6组样本。

步骤二,根据每个特征的均值和方差,计算每个特征正态分布的均值和方差;

根据中心极限定理,每个特征的特征值均满足正态分布。

第i个特征正态分布的均值为:

第i个特征正态分布的方差为:

以上述表2示例为例,各个特征正态分布的均值和方差计算结果如下表3所示,其中x1指创建主机时长,x2指映射卷时长、x3指登录主机时长、x4指扫描主机时长、x5指搜索单路径时长、x6指搜索多路径时长、x7指缩放后格式化卷时长、x8指挂载时长。

表3各个特征正态分布的均值和方差计算结果

步骤三,根据每个特征正态分布的均值和方差,计算总体正态分布均值和方差;

卷大小会影响x7对应的均值和方差,如果x7扩大到c倍,则均值和方差计算公式如下:

e(cx7)=ce(x7);

d(cx7)=c2d(x7)。

对于c倍大小的卷,挂载该卷的总时长服从正态分布,获得总体正态分布均值和方差如下:

总体正态分布均值为:

总体正态分布方差为:

其中,μ7是指缩放后格式化卷时长这一特征正态分布的均值,是指缩放后格式化卷时长这一特征正态分布的方差;m表示特征总个数。本实施例m为8,是指i=1、2、3、4、5、6、8。

所计算总体正态分布均值μ即挂载卷理论时长。

当挂载卷已耗时长少于挂载卷理论时长时,预测挂载卷剩余时长如下:

挂载卷剩余时长=挂载卷理论时长-挂载卷已耗时长。

本实施例,当挂载卷已耗时长超过挂载卷理论时长时,不再预测剩余时长,而是计算发生故障概率并显示。

其中,其中z为挂载卷已耗时长,另外,该式中t为时间参数。

实施例二

如图2所示,在实施例一基础上,本实施例提供一种预测kubernetes挂载卷时长的装置,包括以下功能模块。

预测样本建立模块101:获取多组历史挂载卷时长参数组成预测样本;

挂载卷理论时长计算模块102:根据预测样本建立正态分布模型,计算挂载卷理论时长;

挂载卷剩余时长预测模块103:执行挂载卷时,根据挂载卷理论时长预测挂载卷剩余时长并显示。

其中,挂载卷时长参数包括创建主机时长、映射卷时长、登录主机时长、扫描主机时长、搜索单路径时长、搜索多路径时长、格式化卷时长、挂载时长。

考虑到格式卷时长与卷大小有关,为方便处理预测样本建立模块101将各个格式化卷时长按对应卷大小等比例缩放后,将各组挂载卷时长参数组成预测样本。

具体的,格式化卷时长按对应卷大小等比例缩放是指:若某组挂载卷时长参数对应卷大小为c*1g,缩放后格式化卷时长=原始格式化卷时长/c。

挂载卷理论时长计算模块102包括以下第一计算单元、第二计算单元和第三计算单元。

第一计算单元:计算每个特征的均值和方差;

第i个特征的均值为:

第i个特征的方差为:

其中,i=1、2……8,k表示第k个预测样本,k=1、2……n,n为预测样本总数。

第二计算单元:根据每个特征的均值和方差,计算每个特征正态分布的均值和方差;

第i个特征正态分布的均值为:

第i个特征正态分布的方差为:

第三计算单元:根据每个特征正态分布的均值和方差,计算总体正态分布均值和方差;

总体正态分布均值为:

总体正态分布方差为:

其中,μ7是指缩放后格式化卷时长这一特征正态分布的均值,是指缩放后格式化卷时长这一特征正态分布的方差;m表示特征总个数。

总体整体分布均值即挂载卷理论时长;挂载卷剩余时长预测模块根据挂载卷理论时长预测挂载卷剩余时长的公式为:挂载卷剩余时长=挂载卷理论时长-挂载卷已耗时长。

另外该装置还包括发生故障概率计算模块104:当挂载卷已耗时长超过挂载卷理论时长时,计算发生故障概率并显示。

其中z为挂载卷已耗时长。

以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1