存储集群的负载预测方法和装置、存储介质及电子设备

文档序号:36402601发布日期:2023-12-16 07:40阅读:25来源:国知局
存储集群的负载预测方法和装置、存储介质及电子设备与流程

本技术涉及存储集群领域,具体而言,涉及一种存储集群的负载预测方法和装置、存储介质及电子设备。


背景技术:

1、相关技术中,在选择对存储集群进行负载预测时所使用的预测方法时,往往只能依据经验选择所使用的预测方法,并且往往是为不同的存储集群选择相同的预测方法来进行负载预测,比如:通过相同的预测算法对存储集群1和存储集群2的负载进行预测,而不同的存储集群的负载情况并不相同,并且同一个存储集群的负载情况也可能随着时间的变化发生变化,可能导致采用相同的预测算法可能会导致预测出的存储集群1或者存储集群2的负载不准确。

2、针对上述存储集群的负载预测的准确率较低的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本技术实施例提供了一种存储集群的负载预测方法和装置、存储介质及电子设备,以至少解决存储集群的负载预测的准确率较低的技术问题。

2、根据本技术实施例的一个方面,提供了一种存储集群的负载预测方法,包括:获取目标存储集群的第i个集群负载序列,其中,所述目标存储集群包括一组存储设备,所述第i个集群负载序列包括第i组时间点上所述目标存储集群的实际负载,i为大于或等于1的正整数;确定所述第i个集群负载序列所属的目标序列类别,其中,所述目标序列类别是序列类别集合中的序列类别,所述序列类别集合包括至少对样本集群负载序列集合进行聚类所得到的多个序列类别,所述样本集群负载序列集合包括多个存储集群的多个样本集群负载序列,每个样本集群负载序列是在对应的一组时间点上所述多个存储集群中的一个存储集群的实际负载,多个存储集群包括所述目标存储集群,或者,所述目标存储集群与所述多个存储集群不同;将所述第i个集群负载序列输入与所述目标序列类别对应的目标预测神经网络模型,得到在所述第i组时间点的下一个时间点上所述目标存储集群的预测负载,其中,所述目标预测神经网络是使用样本集群负载序列子集对待训练的预测神经网络模型进行训练得到的模型,所述样本集群负载序列子集包括所述样本集群负载序列集合中属于所述目标序列类别的样本集群负载序列。

3、根据本技术实施例的另一方面,还提供了一种存储集群的负载预测装置,包括:获取单元,用于获取目标存储集群的第i个集群负载序列,其中,所述目标存储集群包括一组存储设备,所述第i个集群负载序列包括第i组时间点上所述目标存储集群的实际负载,i为大于或等于1的正整数;确定单元,用于确定所述第i个集群负载序列所属的目标序列类别,其中,所述目标序列类别是序列类别集合中的序列类别,所述序列类别集合包括至少对样本集群负载序列集合进行聚类所得到的多个序列类别,所述样本集群负载序列集合包括多个存储集群的多个样本集群负载序列,每个样本集群负载序列是在对应的一组时间点上所述多个存储集群中的一个存储集群的实际负载,多个存储集群包括所述目标存储集群,或者,所述目标存储集群与所述多个存储集群不同;输入单元,用于将所述第i个集群负载序列输入与所述目标序列类别对应的目标预测神经网络模型,得到在所述第i组时间点的下一个时间点上所述目标存储集群的预测负载,其中,所述目标预测神经网络是使用样本集群负载序列子集对待训练的预测神经网络模型进行训练得到的模型,所述样本集群负载序列子集包括所述样本集群负载序列集合中属于所述目标序列类别的样本集群负载序列。

4、可选的,所述确定单元,包括:第一确定模块,用于在所述序列类别集合包括对所述样本集群负载序列集合进行聚类所得到的n个序列类别、且所述n个序列类别与n个参考负载序列具有一一对应的情况下,确定所述第i个集群负载序列分别与所述n个参考负载序列中的每个参考负载序列的相似度,得到n个相似度,其中,所述n个参考负载序列中的第j个参考负载序列是根据所述样本集群负载序列集合中属于第j个序列类别的样本集群负载序列确定得到的序列,所述n个序列类别包括所述第j个序列类别,n为大于或者等于2的正整数,j为大于或者等于1、且小于或者等于n的正整数;第二确定模块,用于在所述n个相似度中的第p个相似度最大、且所述第p个相似度大于或等于预设阈值的情况下,将所述目标序列类别确定为所述n个序列类别中与所述第p个相似度对应的序列类别,其中,p为大于或等于1、且小于或等于n的正整数。

5、可选的,所述确定单元,包括:聚类模块,用于对所述样本集群负载序列集合和所述第i个集群负载序列进行聚类,得到m个序列类别,其中,m为大于或等于2的正整数;第三确定模块,用于将所述目标序列类别确定为所述m个序列类别中所述第i个集群负载序列所属的序列类别。

6、可选的,所述装置还包括:第一聚类单元,用于在确定所述第i个集群负载序列所属的目标序列类别之前,对所述样本集群负载序列集合进行聚类,得到所述序列类别集合;或者第二聚类单元,用于在所述样本集群负载序列集合包括p个样本集群负载序列的情况下,在所述p个样本集群负载序列中的每个样本集群负载序列中截取相同长度的子序列,得到p个子序列,其中,所述p个子序列中的每个子序列包括q个时间点上所述多个存储集群中的一个存储集群的实际负载;对所述p个子序列进行聚类,得到所述序列类别集合。

7、可选的,所述第二聚类单元,包括:第四确定模块,用于分别确定所述p个子序列中的每个子序列与所述p个子序列中的每个子序列之间的相似度,得到维度为p×p的相似度矩阵,其中,所述p个子序列中的第a个子序列与所述p个子序列中的第b个子序列之间的相似度是所述第a个子序列中的q个实际负载与所述第b个子序列中的q个实际负载之间的相似度,a和b为大于或等于1、且小于或等于p的正整数;第五确定模块,用于根据所述p×p的相似度矩阵,确定维度为1×p的类别标签向量,其中,所述1×p的类别标签向量表示所述p个子序列中的每个子序列所属的序列类别,其中,所述序列类别集合包括所述类别标签向量所表示的不同序列类别。

8、可选的,所述输入单元,包括:输入模块,用于将所述第i个集群负载序列输入所述目标预测神经网络模型,得到在第i组时间点的所述下一个时间点上所述目标存储集群的预测负载均值和预测负载方差;第六确定模块,用于根据所述预测负载均值和所述预测负载方差,确定在所述第i组时间点的所述下一个时间点上所述目标存储集群的所述预测负载。

9、可选的,第六确定模块,用于:将所述预测负载确定为等于所述预测负载均值与目标加权值之和,其中,所述目标加权值是预设的方差影响因子与所述预测负载方差之间的乘积。

10、可选的,所述装置还包括:训练单元,用于在将所述第i个集群负载序列输入与所述目标序列类别对应的目标预测神经网络模型,得到在所述k个时间点的下一个时间点上所述目标存储集群的预测负载之前,使用所述样本集群负载序列子集对所述待训练的预测神经网络模型进行训练,直到所述待训练的预测神经网络模型对应的目标损失值满足预设的收敛条件的情况下,结束训练,并将结束训练时的待训练的预测神经网络模型确定为所述目标预测神经网络模型,其中,所述目标损失值是样本预测负载与样本实际负载之间的损失值,所述样本预测负载是所述待训练的预测神经网络模型根据输入的样本集群负载序列子集确定的在一个时间点上所述多个存储集群中的一个存储集群的预测负载,所述样本实际负载是预先获取到的在所述一个时间点上所述多个存储集群中的一个存储集群的实际负载。

11、可选的,所述训练单元,用于通过以下步骤对所述待训练的预测神经网络模型进行第r轮训练,其中,r为大于或等于2的正整数:将所述第r轮训练使用的第r个样本集群负载序列输入第r-1轮训练确定的预测神经网络模型,得到所述第r轮训练的样本预测负载,其中,所述第r轮训练的样本预测负载表示在第r+1个时间点上所述多个存储集群中的一个存储集群的预测负载;确定所述第r轮训练的样本预测负载与所述第r轮训练的样本实际负载之间的损失值,得到所述第r轮训练的所述目标损失值,其中,所述第r轮训练的样本实际负载是预先获取到的在所述第r+1个时间点上所述多个存储集群中的一个存储集群的实际负载;在所述第r轮训练的所述目标损失值不满足所述预设的收敛条件的情况下,调整所述第r-1轮训练确定的预测神经网络模型中的参数,得到所述第r轮训练确定的预测神经网络模型;在所述第r轮训练的所述目标损失值满足所述预设的收敛条件的情况下,结束训练,并将所述第r-1轮训练确定的预测神经网络模型确定为所述目标预测神经网络模型。

12、可选的,所述训练单元,还用于:将所述第r轮训练使用的所述第r个样本集群负载序列输入所述第r-1轮训练确定的预测神经网络模型,得到在所述第r+1个时间点上所述多个存储集群中的一个存储集群的预测负载均值和预测负载方差;根据在所述第r+1个时间点上所述多个存储集群中的一个存储集群的所述预测负载均值和所述预测负载方差,确定所述第r轮训练的样本预测负载。

13、可选的,所述训练单元,还用于:将所述第r轮训练的样本预测负载确定为等于在所述第r+1个时间点上所述多个存储集群中的一个存储集群的所述预测负载均值与样本加权值之和,其中,所述样本加权值是预设的方差影响因子与在所述第r+1个时间点上所述多个存储集群中的一个存储集群的所述预测负载方差之间的乘积。

14、根据本技术实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述存储集群的负载预测方法。

15、根据本技术实施例的又一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以上存储集群的负载预测方法。

16、根据本技术实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过所述计算机程序执行上述的存储集群的负载预测方法。

17、在本技术实施例中,将存储集群的集群负载序列输入集群负载序列所属的序列类别所对应的预测神经网络模型中,可以理解的是,属于不同序列类别的集群负载序列所输入的预测神经网络模型可能是不同的,即通过与集群负载序列所属的序列类别所对应的预测神经网络模型对存储集群的负载进行预测,避免了通过相同的预测神经网络模型对不同的存储集群的负载进行预测,提升了存储集群的负载预测的准确率,进而解决了存储集群的负载预测的准确率较低的技术问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1