一种分布式存储扩容方法、装置、存储介质和设备与流程

文档序号:25542499发布日期:2021-06-18 20:39阅读:155来源:国知局
一种分布式存储扩容方法、装置、存储介质和设备与流程

本申请涉及分布式存储领域,尤其涉及一种分布式存储扩容方法、装置、存储介质和设备。



背景技术:

在分布式存储领域中,关于分布式存储的扩容(即存储设备的采购)、以及容量的使用情况等方面尚无通用的标准。尤其在容量部署规模较大、且多个资源池互相隔离的情况下,用户无法感知分布式存储的扩容需求,给分布式存储的使用和成本带来较多的不利因素。

因此,如何感知分布式存储的扩容需求,成为本领域技术人员亟需解决的问题。



技术实现要素:

本申请提供了一种分布式存储扩容方法、装置、存储介质和设备,目的在于精准感知分布式存储的扩容需求。

为了实现上述目的,本申请提供了以下技术方案:

一种分布式存储扩容方法,包括:

部署一个资源池,得到所述资源池对外提供的总容量;

对分布式存储进行容量初始化,得到所述分布式存储对外提供的总容量;

在当前时间进入新的时间节点的情况下,将所述分布式存储在当前时间节点的分配容量和使用容量,输入至预测模型中,得到所述预测模型的输出结果;其中,所述时间节点用于指示采购存储设备的时间周期;所述预测模型基于所述分布式存储在各个历史时间节点的分配容量和使用容量预先构建;所述输出结果用于指示,所述新的时间节点相较于所述当前时间节点的分配容量和使用容量各自的变化量;

依据所述变化量、所述分布式存储在当前时间节点的分配容量和使用容量、预先配置的运维数据、所述资源池对外提供的总容量、以及所述分布式存储对外提供的总容量,计算得到所述新的时间节点所需采购存储设备的数量。

可选的,所述将所述分布式存储在当前时间节点的分配容量和使用容量,输入至预测模型中,得到所述预测模型的输出结果,包括:

将所述分布式存储在当前时间节点的分配容量,输入至第一预测模型中,得到所述第一预测模型的输出结果;所述第一预测模型基于所述分布式存储在各个历史时间节点的分配容量预先构建;所述第一预测模型的输出结果用于指示,所述新的时间节点相较于所述当前时间节点的分配容量的变化量;

将所述分布式存储在当前时间节点的使用容量,输入至第二预测模型中,得到所述第二预测模型的输出结果;所述第二预测模型基于所述分布式存储在各个历史时间节点的使用容量预先构建;所述第二预测模型的输出结果用于指示,所述新的时间节点相较于所述当前时间节点的使用容量的变化量。

可选的,基于所述分布式存储在各个历史时间节点的分配容量构建所述第一预测模型的过程,包括:

预先获取所述分布式存储在各个历史时间节点的分配容量;

将所述历史时间节点与所述分配容量进行映射关联,得到第一映射关系;所述第一映射关系用于反映所述分配容量的历史变化趋势;

解析所述历史变化趋势,得到第一参数和第二参数;所述第一参数用于反映所述分配容量在所述历史变化趋势中的阶跃性变化,所述第二参数用于反映所述分配容量在所述历史变化趋势中的惯性变化;

基于所述分配容量、所述第一参数、所述第二参数、以及所述历史时间节点之间的对应关系进行数学建模,得到所述第一预测模型。

可选的,基于所述分布式存储在各个历史时间节点的使用容量构建所述第二预测模型的过程,包括:

预先获取所述分布式存储在各个历史时间节点的使用容量;

将所述历史时间节点与所述使用容量进行映射关联,得到第二映射关系;所述第二映射关系用于反映所述使用容量的历史变化趋势;

解析所述历史变化趋势,得到第三参数和第四参数;所述第三参数用于反映所述使用容量在所述历史变化趋势中的阶跃性变化,所述第四参数用于反映所述使用容量在所述历史变化趋势中的惯性变化;

基于所述使用容量、所述第三参数、所述第四参数、以及所述历史时间节点之间的对应关系进行数学建模,得到所述第二预测模型。

可选的,所述运维数据包括单位时间内的预设预留容量、所述时间节点的预设时长、所述新的时间节点的预设增长容量、预设的超卖比、以及预设的使用率容忍度;

所述依据所述变化量、所述分布式存储在当前时间节点的分配容量和使用容量、预先配置的运维数据、所述资源池对外提供的总容量、以及所述分布式存储对外提供的总容量,计算得到所述新的时间节点所需采购存储设备的数量,包括:

将所述分布式存储在当前时间节点的分配容量、所述新的时间节点相较于所述当前时间节点的分配容量的变化量、所述预设预留容量、所述预设时长、所述预设增长容量、以及所述超卖比,代入到预设第一公式中,计算得到第一数值;

将所述分布式存储在当前时间节点的使用容量、所述新的时间节点相较于所述当前时间节点的使用容量的变化量、以及所述使用率容忍度,代入到预设第二公式中,计算得到第二数值;

比较所述第一数值和所述第二数值,并从所述第一数值和所述第二数值中选取目标数值;若所述第一数值大于所述第二数值,则将所述第一数值作为所述目标数值;若所述第一数值不大于所述第二数值,则将所述第二数值作为所述目标数值;

计算所述目标数值与所述分布式存储对外提供的总容量的差值;

计算所述差值与所述资源池对外提供的总容量的比值,得到所述新的时间节点所需采购存储设备的数量。

可选的,还包括:

在所述当前时间还未进入新的时间节点的情况下,依据所述分布式存储中物理层与逻辑层路由环之间的映射关系,判断所述分布式存储中的数据是否均衡;

在所述分布式存储中的数据不均衡的情况下,对所述分布式存储进行数据均衡。

可选的,还包括:

在所述分布式存储中的数据均衡的情况下,按照预设时间间隔,定期巡检所述物理层与逻辑层路由环之间的映射关系。

一种分布式存储扩容装置,包括:

部署单元,用于部署一个资源池,得到所述资源池对外提供的总容量;

初始化单元,用于对分布式存储进行容量初始化,得到所述分布式存储对外提供的总容量;

预测单元,用于在当前时间进入新的时间节点的情况下,将所述分布式存储在当前时间节点的分配容量和使用容量,输入至预测模型中,得到所述预测模型的输出结果;其中,所述时间节点用于指示采购存储设备的时间周期;所述预测模型基于所述分布式存储在各个历史时间节点的分配容量和使用容量预先构建;所述输出结果用于指示,所述新的时间节点相较于所述当前时间节点的分配容量和使用容量各自的变化量;

计算单元,用于依据所述变化量、所述分布式存储在当前时间节点的分配容量和使用容量、预先配置的运维数据、所述资源池对外提供的总容量、以及所述分布式存储对外提供的总容量,计算得到所述新的时间节点所需采购存储设备的数量。

一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,所述程序执行所述的分布式存储扩容方法。

一种分布式存储扩容设备,包括:处理器、存储器和总线;所述处理器与所述存储器通过所述总线连接;

所述存储器用于存储程序,所述处理器用于运行程序,其中,所述程序运行时执行所述的分布式存储扩容方法。

本申请提供的技术方案,部署一个资源池,得到资源池对外提供的总容量。对分布式存储进行容量初始化,得到分布式存储对外提供的总容量。在当前时间进入新的时间节点的情况下,将分布式存储在当前时间节点的分配容量和使用容量,输入至预测模型中,得到预测模型的输出结果。其中,时间节点用于指示采购存储设备的时间周期。预测模型基于分布式存储在各个历史时间节点的分配容量和使用容量预先构建。输出结果用于指示,新的时间节点相较于当前时间节点的分配容量和使用容量各自的变化量。依据变化量、分布式存储在当前时间节点的分配容量和使用容量、预先配置的运维数据、资源池对外提供的总容量、以及分布式存储对外提供的总容量,计算得到新的时间节点所需采购存储设备的数量。基于分布式存储在各个历史时间节点的分配容量和使用容量预先构建预测模型,并以预测模型的输出结果、分布式存储在当前时间节点的分配容量和使用容量、预先配置的运维数据、资源池对外提供的总容量、以及分布式存储对外提供的总容量作为参考依据,计算得出新的时间节点所需采购存储设备的数量,相较于人工凭主观意识预测的采购数量,更为客观和合理。可见,利用本申请所述的方法,能够精准感知分布式存储的扩容需求。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种分布式存储扩容方法的示意图;

图2为本申请实施例提供的另一种分布式存储扩容方法的示意图;

图3为本申请实施例提供的一种分布式存储扩容装置的架构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

如图1所示,为本申请实施例提供的一种分布式存储扩容方法的示意图,包括如下步骤:

s101:部署一个资源池,得到单个资源池对外提供的总容量。

其中,部署资源池的具体过程,实质就是释放容量。所谓的部署资源池、以及释放容量,均为本领域技术人员所熟悉的公知常识,这里不再赘述。

需要说明的是,分布式存储包括多个资源池,每个资源池对外提供的总容量是相同。

s102:对分布式存储进行容量初始化,得到分布式存储对外提供的总容量。

其中,对分布式存储进行容量初始化的具体过程,为本领域技术人员所述所熟悉的公知常识,具体的,假设一个资源池对外提供的容量为100tb,且首次初始化需要的总容量为800tb,则部署一个资源池释放100tb容量后,还需要部署七个资源池释放700tb容量,才能实现初始化要求的800tb总容量。

s103:判断当前时间是否进入新的时间节点。

若当前时间进入新的时间节点,则执行s104,否则执行s111。

需要说明的,时间节点用于指示采购存储设备的时间周期,在现实应用中,企业单位都会预先设置一个用于采购设备的时间节点。

s104:将分布式存储在当前时间节点的分配容量,输入至预先构建的第一预测模型中,得到第一预测模型的输出结果。

其中,第一预测模型的输出结果用于指示新的时间节点相较于当前时间节点的分配容量的变化量。

需要说明的是,第一预测模型的构建过程包括:

1、预先获取分布式存储在各个历史时间节点的容量使用信息。

其中,容量使用信息用于指示分布式存储的分配容量和使用容量。

需要说明的是,在分布式存储系统中,分布式存储通过虚拟化协议(现有术语)对外提供块存储设备,即容量需求方通过访问块存储设备来使用分布式存储提供的容量。分布式存储提供的容量,具体可以分为分配容量和使用容量。所谓的分配容量,即分布式存储提供给容量需求方的总容量。所谓的使用容量,即容量需求方所使用的容量。具体的,以云服务器为例,云服务器使用者向分布式存储申请了一块容量为100gb的云硬盘,但是目前只使用了40gb的容量,为此,分布式存储的分配容量为100gb、使用容量为40gb。

2、将历史时间节点与分配容量进行映射关联,得到第一映射关系。

其中,第一映射关系用于反映分配容量的历史变化趋势。

3、解析分配容量的历史变化趋势,得到第一参数和第二参数。

其中,第一参数用于反映分配容量在历史变化趋势中的阶跃性变化,第二参数用于反映分配容量在历史变化趋势中的惯性变化。

4、基于分配容量、第一参数、第二参数、以及历史时间节点之间的对应关系进行数学建模,得到第一预测模型。

其中,第一预测模型的类型包括但不限于神经网络模型、线性模型、以及决策树模型等。数学建模的具体实现过程,为本领域技术人员所熟悉的公知常识,这里不再赘述。

s105:将分布式存储在当前时间节点的使用容量,输入至预先构建的第二预测模型中,得到第二预测模型的输出结果。

其中,第二预测模型的输出结果用于指示新的时间节点相较于当前时间节点的使用容量的变化量。

需要说明的是,第二预测模型的构建过程包括:

1、预先获取分布式存储在各个历史时间节点的容量使用信息。

其中,容量使用信息用于指示分布式存储的分配容量和使用容量。

2、将历史时间节点与使用容量进行映射关联,得到第二映射关系。

其中,第二映射关系用于反映使用容量的历史变化趋势。

3、解析使用容量的历史变化趋势,得到第三参数和第四参数。

其中,第三参数用于反映使用容量在历史变化趋势中的阶跃性变化,第四参数用于反映使用容量在历史变化趋势中的惯性变化。

4、基于使用容量、第三参数、第四参数、以及历史时间节点之间的对应关系进行数学建模,得到第二预测模型。

其中,第二预测模型的类型包括但不限于神经网络模型、线性模型、以及决策树模型等。数学建模的具体实现过程,为本领域技术人员所熟悉的公知常识,这里不再赘述。

s106:将分布式存储在当前时间节点的分配容量、新的时间节点相较于当前时间节点的分配容量的变化量、单位时间内的预设预留容量、时间节点的预设时长、新的时间节点的预设增长容量、以及预设的超卖比,代入到预设第一公式中,计算得到第一数值。

其中,预设第一公式可以参见公式(1)所示。

在公式(1)中,p1,t+t代表第一数值,t+t代表新的时间节点,t代表当前时间节点,t代表时间节点的预设时长,ft代表分布式存储在当前时间节点的分配容量,δf(α1,β1,t)代表新的时间节点相较于当前时间节点的分配容量的变化量,α1代表第一参数,β1代表第二参数,ω代表单位时间内的预设预留容量,s代表新的时间节点的预设增长容量,η代表预设的超卖比、且η的取值大于1。

需要说明的是,单位时间内的预设预留容量、时间节点的预设时长、新的时间节点的预设增长容量、以及预设的超卖比,均是预先配置的运维数据。

s107:将分布式存储在当前时间节点的使用容量、新的时间节点相较于当前时间节点的使用容量的变化量、以及预设的使用率容忍度,代入到预设第二公式中,计算得到第二数值。

其中,预设第二公式可以参见公式(2)所示。

在公式(2)中,p2,t+t代表第二数值,gt代表分布式存储在当前时间节点的使用容量,δg(α2,β2,t)代表新的时间节点相较于当前时间节点的使用容量的变化量,α2代表第三参数,β2代表第四参数,γ代表预设的使用率容忍度、且γ为大于0小于1的自然数。

需要说明的是,预设的使用率容忍度也是预先配置的运维数据。

s108:比较第一数值和第二数值,并从第一数值和第二数值中选取目标数值。

其中,若第一数值大于第二数值,则将第一数值作为目标数值,若第一数值不大于第二数值,则将第二数值作为目标数值。在本申请实施例中,目标数值用于表征分布式存储在新的时间节点对外提供的总容量。

具体的,从第一数值和第二数值中选取目标数值的表达式,如公式(3)所示。

pt+t=max{p1,t+t,p2,t+t}(3)

在公式(3)中,pt+t代表目标数值。

s109:计算目标数值与第三数值的差值。

其中,第三数值用于指示分布式存储对外提供的总容量。在本申请实施例中,目标数值与第三数值的差值,用于表征分布式存储所需扩充的容量。

具体的,目标数值与第三数值的差值的计算公式,如公式(4)所示。

δp=pt+t-pt(4)

在公式(4)中,δp代表目标数值与第三数值的差值,pt代表第三数值。

s110:计算差值与第四数值的比值,得到新的时间节点所需采购存储设备的数量。

其中,第四数值用于指示单个资源池对外提供的总容量。

具体的,差值与第四数值的比值的计算公式,如公式(5)所示。

在公式(5)中,n代表新的时间节点所需采购存储设备的数量,u代表单个资源池对外提供的总容量。

s111:依据分布式存储中物理层与逻辑层路由环之间的映射关系,判断分布式存储中的数据是否均衡。

若分布式存储中的数据均衡,则执行s112,否则执行s113。

其中,所谓的物理层是指:实际存储数据的物理空间。

所谓的逻辑层是指:在分布式存储中,不会直接管理物理层,需要增加一个逻辑层,由逻辑层管理物理层,使得分布式存储对物理层的管理更加灵活。

所谓的路由环是指:逻辑层中的一部分形成一个路由环,实际数据所在位置对应的逻辑层的编号会对应路由环内,不会对应路由环之外。具体的,路由环包括使用部分和空闲部分,使用部分的占比、以及空闲部分的占比可由技术人员根据实际情况进行设置。

需要说明的是,数据均衡的充要条件为:路由环的使用部分与物理层的对应关系均衡。

具体的,假设分布式存储集群包括4组物理机,每组物理机上均包含1000个逻辑单元,分布式存储在数据均衡的情况下,则每组物理机上应有750个逻辑单元作为使用部分、250个逻辑单元作为空闲部分。此外,分布式存储在数据极端不均衡的情况下,可能3组物理机上的1000个逻辑单元均作为使用部分,而剩余1组物理机上的1000个逻辑单元作为空闲部分,从而导致分布式存储集群对外提供的总容量降低25%。

s112:按照预设时间间隔,定期巡检物理层与逻辑层路由环之间的映射关系。

在执行s112之后,返回执行s103。

s113:对分布式存储进行数据均衡。

其中,对分布是存储进行数据均衡的具体实现过程,为本领域技术人员所熟悉的公知常识,这里不再赘述。

在执行s113之后,返回执行s103。

需要说明的是,当分布式存储中的数据不均衡时,分布式存储会产生物理容量失效,从而影响s104-s110的计算结果,致使对分布式存储的扩容需求的感知失准。所谓的物理容量失效,可以理解为:分布式存储中的某一台物理机完全不对应于逻辑层路由环时,这台物理机的容量无法被使用,即假定分布式存储的总容量为100tb,数据均衡的情况下最多可对外提供100tb的容量,在数据不均衡的情况下,分布式存储对外提供的最大容量却变成了75tb,有25tb的容量无法被使用,造成容量的浪费。

综上所述,基于分布式存储在各个历史时间节点的分配容量和使用容量预先构建预测模型,并以预测模型的输出结果、分布式存储在当前时间节点的分配容量和使用容量、预先配置的运维数据、资源池对外提供的总容量、以及分布式存储对外提供的总容量作为参考依据,计算得出新的时间节点所需采购存储设备的数量,相较于人工凭主观意识预测的采购数量,更为客观和合理。可见,利用本实施例所述的方法,能够精准感知分布式存储的扩容需求。

需要说明的是,上述实施例提及的s104,为本申请实施例所述分布式存储扩容方法的一种可选的具体实现方式。此外,上述实施例提及的s105,也为本申请实施例所述分布式存储扩容方法的一种可选的具体实现方式。为此,上述实施例提及的流程,可以概括为图2所示的方法。

如图2所示,为本申请实施例提供的另一种分布式存储扩容方法的示意图,包括如下步骤:

s201:部署一个资源池,得到资源池对外提供的总容量。

s202:对分布式存储进行容量初始化,得到分布式存储对外提供的总容量。

s203:在当前时间进入新的时间节点的情况下,将分布式存储在当前时间节点的分配容量和使用容量,输入至预测模型中,得到预测模型的输出结果。

其中,时间节点用于指示采购存储设备的时间周期,预测模型基于分布式存储在各个历史时间节点的分配容量和使用容量预先构建,输出结果用于指示,新的时间节点相较于当前时间节点的分配容量和使用容量各自的变化量。

s204:依据变化量、分布式存储在当前时间节点的分配容量和使用容量、预先配置的运维数据、资源池对外提供的总容量、以及分布式存储对外提供的总容量,计算得到新的时间节点所需采购存储设备的数量。

综上所述,基于分布式存储在各个历史时间节点的分配容量和使用容量预先构建预测模型,并以预测模型的输出结果、分布式存储在当前时间节点的分配容量和使用容量、预先配置的运维数据、资源池对外提供的总容量、以及分布式存储对外提供的总容量作为参考依据,计算得出新的时间节点所需采购存储设备的数量,相较于人工凭主观意识预测的采购数量,更为客观和合理。可见,利用本实施例所述的方法,能够精准感知分布式存储的扩容需求。

与上述本申请实施例提供的分布式存储扩容方法相对应,本申请实施例还提供了一种分布式存储扩容装置。

如图3所示,为本申请实施例提供的一种分布式存储扩容装置的架构示意图,包括:

部署单元100,用于部署一个资源池,得到资源池对外提供的总容量。

初始化单元200,用于对分布式存储进行容量初始化,得到分布式存储对外提供的总容量。

预测单元300,用于在当前时间进入新的时间节点的情况下,将分布式存储在当前时间节点的分配容量和使用容量,输入至预测模型中,得到预测模型的输出结果;其中,时间节点用于指示采购存储设备的时间周期;预测模型基于分布式存储在各个历史时间节点的分配容量和使用容量预先构建;输出结果用于指示,新的时间节点相较于当前时间节点的分配容量和使用容量各自的变化量。

其中,预测单元300具体用于:将分布式存储在当前时间节点的分配容量,输入至第一预测模型中,得到第一预测模型的输出结果;第一预测模型基于分布式存储在各个历史时间节点的分配容量预先构建;第一预测模型的输出结果用于指示,新的时间节点相较于当前时间节点的分配容量的变化量;将分布式存储在当前时间节点的使用容量,输入至第二预测模型中,得到第二预测模型的输出结果;第二预测模型基于分布式存储在各个历史时间节点的使用容量预先构建;第二预测模型的输出结果用于指示,新的时间节点相较于当前时间节点的使用容量的变化量。

预测单元300基于分布式存储在各个历史时间节点的分配容量构建第一预测模型的过程,包括:预先获取分布式存储在各个历史时间节点的分配容量;将历史时间节点与分配容量进行映射关联,得到第一映射关系,第一映射关系用于反映分配容量的历史变化趋势;解析历史变化趋势,得到第一参数和第二参数,第一参数用于反映分配容量在历史变化趋势中的阶跃性变化,第二参数用于反映分配容量在历史变化趋势中的惯性变化;基于分配容量、第一参数、第二参数、以及历史时间节点之间的对应关系进行数学建模,得到第一预测模型。

预测单元300基于分布式存储在各个历史时间节点的使用容量构建第二预测模型的过程,包括:预先获取分布式存储在各个历史时间节点的使用容量;将历史时间节点与使用容量进行映射关联,得到第二映射关系,第二映射关系用于反映使用容量的历史变化趋势;解析历史变化趋势,得到第三参数和第四参数,第三参数用于反映使用容量在历史变化趋势中的阶跃性变化,第四参数用于反映使用容量在历史变化趋势中的惯性变化;基于使用容量、第三参数、第四参数、以及历史时间节点之间的对应关系进行数学建模,得到第二预测模型。

计算单元400,用于依据变化量、分布式存储在当前时间节点的分配容量和使用容量、预先配置的运维数据、资源池对外提供的总容量、以及分布式存储对外提供的总容量,计算得到新的时间节点所需采购存储设备的数量。

其中,运维数据包括单位时间内的预设预留容量、时间节点的预设时长、新的时间节点的预设增长容量、预设的超卖比、以及预设的使用率容忍度。

计算单元400具体用于:将分布式存储在当前时间节点的分配容量、新的时间节点相较于当前时间节点的分配容量的变化量、预设预留容量、预设时长、预设增长容量、以及超卖比,代入到预设第一公式中,计算得到第一数值;将分布式存储在当前时间节点的使用容量、新的时间节点相较于当前时间节点的使用容量的变化量、以及使用率容忍度,代入到预设第二公式中,计算得到第二数值;比较第一数值和第二数值,并从第一数值和第二数值中选取目标数值;若第一数值大于第二数值,则将第一数值作为目标数值;若第一数值不大于第二数值,则将第二数值作为目标数值;计算目标数值与分布式存储对外提供的总容量的差值;计算差值与资源池对外提供的总容量的比值,得到新的时间节点所需采购存储设备的数量。

数据均衡单元500,用于在当前时间还未进入新的时间节点的情况下,依据分布式存储中物理层与逻辑层路由环之间的映射关系,判断分布式存储中的数据是否均衡;在分布式存储中的数据不均衡的情况下,对分布式存储进行数据均衡。

巡检单元600,用于在分布式存储中的数据均衡的情况下,按照预设时间间隔,定期巡检物理层与逻辑层路由环之间的映射关系。

综上所述,基于分布式存储在各个历史时间节点的分配容量和使用容量预先构建预测模型,并以预测模型的输出结果、分布式存储在当前时间节点的分配容量和使用容量、预先配置的运维数据、资源池对外提供的总容量、以及分布式存储对外提供的总容量作为参考依据,计算得出新的时间节点所需采购存储设备的数量,相较于人工凭主观意识预测的采购数量,更为客观和合理。可见,利用本实施例所述的方法,能够精准感知分布式存储的扩容需求。

本申请还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,程序执行上述本申请提供的分布式存储扩容方法。

本申请还提供了一种分布式存储扩容设备,包括:处理器、存储器和总线。处理器与存储器通过总线连接,存储器用于存储程序,处理器用于运行程序,其中,程序运行时执行上述本申请提供的分布式存储扩容方法,包括如下步骤:

部署一个资源池,得到所述资源池对外提供的总容量;

对分布式存储进行容量初始化,得到所述分布式存储对外提供的总容量;

在当前时间进入新的时间节点的情况下,将所述分布式存储在当前时间节点的分配容量和使用容量,输入至预测模型中,得到所述预测模型的输出结果;其中,所述时间节点用于指示采购存储设备的时间周期;所述预测模型基于所述分布式存储在各个历史时间节点的分配容量和使用容量预先构建;所述输出结果用于指示,所述新的时间节点相较于所述当前时间节点的分配容量和使用容量各自的变化量;

依据所述变化量、所述分布式存储在当前时间节点的分配容量和使用容量、预先配置的运维数据、所述资源池对外提供的总容量、以及所述分布式存储对外提供的总容量,计算得到所述新的时间节点所需采购存储设备的数量。

可选的,所述将所述分布式存储在当前时间节点的分配容量和使用容量,输入至预测模型中,得到所述预测模型的输出结果,包括:

将所述分布式存储在当前时间节点的分配容量,输入至第一预测模型中,得到所述第一预测模型的输出结果;所述第一预测模型基于所述分布式存储在各个历史时间节点的分配容量预先构建;所述第一预测模型的输出结果用于指示,所述新的时间节点相较于所述当前时间节点的分配容量的变化量;

将所述分布式存储在当前时间节点的使用容量,输入至第二预测模型中,得到所述第二预测模型的输出结果;所述第二预测模型基于所述分布式存储在各个历史时间节点的使用容量预先构建;所述第二预测模型的输出结果用于指示,所述新的时间节点相较于所述当前时间节点的使用容量的变化量。

可选的,基于所述分布式存储在各个历史时间节点的分配容量构建所述第一预测模型的过程,包括:

预先获取所述分布式存储在各个历史时间节点的分配容量;

将所述历史时间节点与所述分配容量进行映射关联,得到第一映射关系;所述第一映射关系用于反映所述分配容量的历史变化趋势;

解析所述历史变化趋势,得到第一参数和第二参数;所述第一参数用于反映所述分配容量在所述历史变化趋势中的阶跃性变化,所述第二参数用于反映所述分配容量在所述历史变化趋势中的惯性变化;

基于所述分配容量、所述第一参数、所述第二参数、以及所述历史时间节点之间的对应关系进行数学建模,得到所述第一预测模型。

可选的,基于所述分布式存储在各个历史时间节点的使用容量构建所述第二预测模型的过程,包括:

预先获取所述分布式存储在各个历史时间节点的使用容量;

将所述历史时间节点与所述使用容量进行映射关联,得到第二映射关系;所述第二映射关系用于反映所述使用容量的历史变化趋势;

解析所述历史变化趋势,得到第三参数和第四参数;所述第三参数用于反映所述使用容量在所述历史变化趋势中的阶跃性变化,所述第四参数用于反映所述使用容量在所述历史变化趋势中的惯性变化;

基于所述使用容量、所述第三参数、所述第四参数、以及所述历史时间节点之间的对应关系进行数学建模,得到所述第二预测模型。

可选的,所述运维数据包括单位时间内的预设预留容量、所述时间节点的预设时长、所述新的时间节点的预设增长容量、预设的超卖比、以及预设的使用率容忍度;

所述依据所述变化量、所述分布式存储在当前时间节点的分配容量和使用容量、预先配置的运维数据、所述资源池对外提供的总容量、以及所述分布式存储对外提供的总容量,计算得到所述新的时间节点所需采购存储设备的数量,包括:

将所述分布式存储在当前时间节点的分配容量、所述新的时间节点相较于所述当前时间节点的分配容量的变化量、所述预设预留容量、所述预设时长、所述预设增长容量、以及所述超卖比,代入到预设第一公式中,计算得到第一数值;

将所述分布式存储在当前时间节点的使用容量、所述新的时间节点相较于所述当前时间节点的使用容量的变化量、以及所述使用率容忍度,代入到预设第二公式中,计算得到第二数值;

比较所述第一数值和所述第二数值,并从所述第一数值和所述第二数值中选取目标数值;若所述第一数值大于所述第二数值,则将所述第一数值作为所述目标数值;若所述第一数值不大于所述第二数值,则将所述第二数值作为所述目标数值;

计算所述目标数值与所述分布式存储对外提供的总容量的差值;

计算所述差值与所述资源池对外提供的总容量的比值,得到所述新的时间节点所需采购存储设备的数量。

可选的,还包括:

在所述当前时间还未进入新的时间节点的情况下,依据所述分布式存储中物理层与逻辑层路由环之间的映射关系,判断所述分布式存储中的数据是否均衡;

在所述分布式存储中的数据不均衡的情况下,对所述分布式存储进行数据均衡。

可选的,还包括:

在所述分布式存储中的数据均衡的情况下,按照预设时间间隔,定期巡检所述物理层与逻辑层路由环之间的映射关系。

本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1