磁盘故障预测方法、装置、设备及计算机可读存储介质与流程

文档序号:16207760发布日期:2018-12-08 07:19阅读:170来源:国知局
磁盘故障预测方法、装置、设备及计算机可读存储介质与流程

本发明涉及磁盘故障预测技术领域,更具体地说,涉及一种磁盘故障预测方法、装置、设备及计算机可读存储介质。

背景技术

磁盘smart(self-monitoringanalysisandreportingtechnology),即“自我监测、分析及报告技术”,通过在硬盘硬件内的检测指令对硬盘的硬件如磁头、盘片、马达、电路的运行情况进行监控和记录。通过记录的磁盘smart信息可以实现磁盘状态的检测。磁盘的smart信息通常是按时间采集,目前根据磁盘smart信息预测磁盘故障时,仅仅通过当前时刻磁盘smart值进行分析,预测效果不准确。

因此,如何利用磁盘的smart信息对磁盘进行准确的预测,是本领域技术人员需要解决的问题。



技术实现要素:

本发明的目的在于提供一种磁盘故障预测方法、装置、设备及计算机可读存储介质,以实现对磁盘故障进行准确预测。

为实现上述目的,本发明实施例提供了如下技术方案:

一种磁盘故障预测方法,包括:

获取距离当前时刻之前的n个统计时刻的统计特征集合;其中,每个统计特征集合为:通过与每个统计时刻对应的统计时间窗内的smart记录计算得到;n为大于1的正整数;

利用所述n个统计时刻的统计特征集合,生成统计特征矩阵;

将所述统计特征矩阵输入预先训练的磁盘故障预测模型,以通过所述预测模型对当前时刻磁盘状态进行故障预测。

其中,统计特征集合的生成方法包括:

获取与统计特征集合对应的统计时刻之前的时间窗口内的每个统计时刻的smart记录;其中,每个时刻的smart记录是根据前一统计时刻与本次统计时刻之间的smart数据计算得到;

根据每个统计时刻的smart记录,计算每种统计特征的特征值;

通过每种统计特征的特征值生成统计特征集合。

其中,利用所述n个统计时刻的统计特征集合,生成统计特征矩阵之前,还包括:

根据每个统计特征集合中每种统计特征的特征值及当前时刻的磁盘状态,计算每种统计特征的相关性;

根据每种统计特征的相关性,从n个统计特征集合中删除不相关统计特征,以便利用删除不相关统计特征的n个统计特征集合继续执行所述生成统计特征矩阵的步骤。

其中,smart记录的生成方法包括:

获取本次统计时刻至前一统计时刻之间所有的smart数据;其中,所述本次统计时刻为需要生成smart记录的时刻;

从smart数据中采样,得到每个采样时刻的smart数据;

计算每个采样时刻的smart数据的均值,得到smart记录。

一种磁盘故障预测装置,包括:

统计特征集合确定模块,用于获取距离当前时刻之前的n个统计时刻的统计特征集合;其中,每个统计特征集合为:通过与每个统计时刻对应的统计时间窗内的smart记录计算得到;n为大于1的正整数;

统计特征矩阵生成模块,用于利用所述n个统计时刻的统计特征集合,生成统计特征矩阵;

磁盘故障预测模块,用于将所述统计特征矩阵输入预先训练的磁盘故障预测模型,以通过所述预测模型对当前时刻磁盘状态进行故障预测。

其中,本方案包括统计特征集合生成模块,所述统计特征集合生成模块包括:

记录获取单元,用于获取与统计特征集合对应的统计时刻之前的时间窗口内的每个统计时刻的smart记录;其中,每个时刻的smart记录是根据前一统计时刻与本次统计时刻之间的smart数据计算得到;

特征值计算单元,用于根据每个统计时刻的smart记录,计算每种统计特征的特征值;

统计特征集合生成单元,用于通过每种统计特征的特征值生成统计特征集合。

其中,本方案还包括:

相关性计算模块,用于根据每个统计特征集合中每种统计特征的特征值及当前时刻的磁盘状态,计算每种统计特征的相关性;

统计特征删除模块,用于根据每种统计特征的相关性,从n个统计特征集合中删除不相关统计特征,以便利用删除不相关统计特征的n个统计特征集合继续执行所述生成统计特征矩阵的步骤。

其中,本方案包括smart记录生成模块;

所述smart记录生成模块包括:

数据获取单元,用于获取本次统计时刻至前一统计时刻之间所有的smart数据;其中,所述本次统计时刻为需要生成smart记录的时刻;

采样单元,用于从smart数据中采样,得到每个采样时刻的smart数据;

均值计算单元,用于计算每个采样时刻的smart数据的均值,得到smart记录。

一种磁盘故障预测设备,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如上述磁盘故障预测方法的步骤。

一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述磁盘故障预测方法的步骤。

通过以上方案可知,本发明实施例提供的一种磁盘故障预测方法,包括:获取距离当前时刻之前的n个统计时刻的统计特征集合;其中,每个统计特征集合为:通过与每个统计时刻对应的统计时间窗内的smart记录计算得到;n为大于1的正整数;利用所述n个统计时刻的统计特征集合,生成统计特征矩阵;将所述统计特征矩阵输入预先训练的磁盘故障预测模型,以通过所述预测模型对当前时刻磁盘状态进行故障预测。

可见,由于目前对故障进行预测时,仅仅是通过当前时刻的smart值来进行故障预测。但是,仅从当前时刻的smart信息不足以分析磁盘的状态,因此在本申请中,根据当前时刻之前的smart记录来生成统计特征矩阵,从而更加精准的表现磁盘的特征,进而通过磁盘故障预测模型对统计特征矩阵进行预测,提高了对磁盘预测的准确率。

本发明还公开了一种磁盘故障预测装置、设备及计算机可读存储介质,同样能实现上述技术效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例公开的一种磁盘故障预测方法流程示意图;

图2为本发明实施例公开的一种磁盘故障预测装置结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例公开了一种磁盘故障预测方法、装置、设备及计算机可读存储介质,以实现对磁盘故障进行准确预测。

参见图1,本发明实施例提供的一种磁盘故障预测方法,包括:

s101、获取距离当前时刻之前的n个统计时刻的统计特征集合;其中,每个统计特征集合为:通过与每个统计时刻对应的统计时间窗内的smart记录计算得到;n为大于1的正整数;

具体的,在本实施例中,当前时刻为需要进行磁盘故障检测的时刻,统计时刻为需要生成统计特征集合的时刻,每个统计时刻之间的间隔可以为12小时,或者24小时,或者48小时;例如:若统计时刻为24小时,即为一天,那么本方案中获取距离当前时刻之前的n个统计时刻的统计特征集合,即为获取当前时刻之前的n天的统计特征集合,每天均有一个统计特征集合。为了方便描述,在本实施例中,以每两个统计时刻之间的间隔一致,且每两个统计时刻之间的间隔时间为1天进行描述。

s102、利用所述n个统计时刻的统计特征集合,生成统计特征矩阵;

具体的,在本实施例中,获取了n个统计时刻的统计特征集合后,便可以生成一个smart统计特征列表,并将第i个统计时刻的第j个统计特征写入矩阵m[i][j],从而得到统计特征矩阵。

可以看出,本方案通过提取smart数据的时序特征,并按时间将原本一维的特征向量构造成二维的特征矩阵,能够更全面的反映smart数据在时序上的特点,对于下一步分析和判断磁盘的状态,提供更丰富的维度,提高检测的准确率。

需要说明的是,在本方案中,利用所述n个统计时刻的统计特征集合,生成统计特征矩阵之前,还包括:

根据每个统计特征集合中每种统计特征的特征值及当前时刻的磁盘状态,计算每种统计特征的相关性;

根据每种统计特征的相关性,从n个统计特征集合中删除不相关统计特征,以便利用删除不相关统计特征的n个统计特征集合继续执行所述生成统计特征矩阵的步骤。

需要说明的是,由于统计特征集合中可能存在一些统计特征一直为常数,因此无法用于区分磁盘故障状态,所以本方案通过计算统计特征和磁盘状态的相关性,来确定哪些统计特征是不相关特征,并将不相关特征从n个统计时刻的统计特征集合中删除;这样,在执行s103时,便将删除不相关统计特征的统计特征矩阵输入预先训练的磁盘故障预测模型,以通过预测模型对当前时刻磁盘状态进行故障预测。

s103、将所述统计特征矩阵输入预先训练的磁盘故障预测模型,以通过所述预测模型对当前时刻磁盘状态进行故障预测。

具体的,本实施例中的磁盘故障预测模型的训练过程如下所示:

(1)通过本实施例中的统计特征矩阵生成方法,构造磁盘故障预测模型的训练集和测试集。其中在每个样本中,磁盘的特征矩阵对应一个磁盘状态0或者1,0表示磁盘正常,1表示磁盘故障,磁盘状态由人工标注。训练集和测试集比例为8:2。

(2)对训练集的空值填充0,并使用minmax方法进行归一化处理。

(3)利用lstm算法,对训练集构建模型。

(4)测试集按照(2)标准,执行空值填充和归一化处理。

(5)利用测试集验证模型的的准确率。

综上可见,由于磁盘smart数据是按时间收集的,磁盘发生故障时,不仅仅表现在故障时刻的smart值上,与其之前时间的状态也有关,因此,如果仅对单一一点的smart信息进行分析会产生信息遗失,导致磁盘检测准确率降低。因此,本发明根据smart数据在时间上进行采样和统计,计算统计特征,将原本一维的磁盘smart特征转化成特征矩阵,从而更加精准的表现磁盘的特征,便于提高对磁盘检测的准确率。

基于上述实施例,在本实施例中,公开了一种smart记录的生成方法,该方法具体包括:

获取本次统计时刻至前一统计时刻之间所有的smart数据;其中,所述本次统计时刻为需要生成smart记录的时刻;

从smart数据中采样,得到每个采样时刻的smart数据;

计算每个采样时刻的smart数据的均值,得到smart记录。

具体的,在生成smart记录之前,需要收集某个磁盘一段时间t区间内的所有smart数据。若:每两个统计时刻之间的间隔一致,且每两个统计时刻之间的间隔时间为1天,那么本方案中的时间t可以设置为至少30天,从而为计算统计特征提供数据。若:本方案需要获取的n个统计时刻的统计特征集合中n为7,也就是需要统计当前时刻的前7天的统计特征集合;那么时间窗口w与时间t的关系可以为:t>w+7,也就是说,7天中的第一天的统计特征集合要由他前w天内的smart记录来计算,也就是说,w的值可在(1,t-7)内自由指定,但是具体如何取值,可根据实际情况进行调整,在此并不具体限定。

在本实施例中,将每次需要生成smart记录的时刻称为本次统计时刻,若本次统计时刻为28日11:00,那么获取本次统计时刻至前一统计时刻之间所有的smart数据,可以理解为:获取27日11:00至28日11:00内所有的smart数据。并且,本实施例中的采样时刻之间的间隔比统计时刻的间隔要小,例如:统计时刻之间的间隔为1天,那么采样时刻的间隔可以为1小时,因此,本实施例中从smart数据中采样,得到每个采样时刻的smart数据;计算每个采样时刻的smart数据的均值,得到smart记录,可以理解为:在27日11:00至28日11:00内所有的smart数据中,每隔1小时记录收集一次smart数据,并将所有时刻的smart数据进行均值计算,得到每个统计时刻的smart记录。

进而,在本实施例中,还公开了一种统计特征集合的生成方法,该方法具体包括:

获取与统计特征集合对应的统计时刻之前的时间窗口内的每个统计时刻的smart记录;其中,每个时刻的smart记录是根据前一统计时刻与本次统计时刻之间的smart数据计算得到;

根据每个统计时刻的smart记录,计算每种统计特征的特征值;

通过每种统计特征的特征值生成统计特征集合。

具体的,在本实施例中,若本方案需要获取的n个统计时刻的统计特征集合中n为7,也就是需要统计当前时刻的前7天的统计特征集合;那么时间窗口w与时间t的关系可以为:t>w+7,也就是说,7天中的第一天的统计特征集合要由他前w天内的smart记录来计算。

因此,在本实施例中设置w为20,那么假设计算统计特征集合的统计时刻为28日,那么获取的在该时间窗口内的每个统计时刻的smart记录包括:9日至28日中20天的smart记录。进而,根据20天的smart记录计算smart数据的统计特征,如均值,方差,差分等等;例如:w=20,第i天的smart1的值为ai,则其统计特征均值:(a1+…+a20)/20。将通过每种特征计算方式得到的特征值组合生成统计特征集合。

可见,通过这种方式便可以生成每天的统计特征集合,在确定n后,便可以得到n天的统计特征集合,从而根据n天的统计特征值生成包含n天统计特征值的统计矩阵。综上可见,本方案提取smart时序统计特征,组合成二维特征矩阵,主要包括如下几个步骤:

步骤一:收集某个磁盘一段时间t区间内的所有smart数据;

步骤二:对这些smart数据按天进行采样,取均值,每天生成一条smart记录;

步骤三:根据时间窗口w计算smart的统计特征;

步骤四:删除不相关的统计特征;

步骤五:取最后7天的smart统计特征列表,第i天的第j个统计特征存入矩阵m[i][j];

步骤六:得到该磁盘的smart7天特征矩阵。

综上可见,由于目前对故障进行预测时,仅仅是通过当前时刻的smart值来进行故障预测。但是,仅从当前时刻的smart信息不足以分析磁盘的状态,因此在本申请中,通过提取smart的时序统计特征,按时间窗口w计算smart数据的统计特征,构造成二维的特征矩阵,使特征矩阵对磁盘的状态反映更全面,提高后续对磁盘检测的准确率。

下面对本发明实施例提供的磁盘故障预测装置进行介绍,下文描述的磁盘故障预测装置与上文描述的磁盘故障预测方法可以相互参照。

参见图2,本发明实施例提供的一种磁盘故障预测装置,包括:

统计特征集合确定模块100,用于获取距离当前时刻之前的n个统计时刻的统计特征集合;其中,每个统计特征集合为:通过与每个统计时刻对应的统计时间窗内的smart记录计算得到;n为大于1的正整数;

统计特征矩阵生成模块200,用于利用所述n个统计时刻的统计特征集合,生成统计特征矩阵;

磁盘故障预测模块300,用于将所述统计特征矩阵输入预先训练的磁盘故障预测模型,以通过所述预测模型对当前时刻磁盘状态进行故障预测。

其中,本方案包括统计特征集合生成模块,所述统计特征集合生成模块包括:

记录获取单元,用于获取与统计特征集合对应的统计时刻之前的时间窗口内的每个统计时刻的smart记录;其中,每个时刻的smart记录是根据前一统计时刻与本次统计时刻之间的smart数据计算得到;

特征值计算单元,用于根据每个统计时刻的smart记录,计算每种统计特征的特征值;

统计特征集合生成单元,用于通过每种统计特征的特征值生成统计特征集合。

其中,本方案包括还包括:

相关性计算模块,用于根据每个统计特征集合中每种统计特征的特征值及当前时刻的磁盘状态,计算每种统计特征的相关性;

统计特征删除模块,用于根据每种统计特征的相关性,从n个统计特征集合中删除不相关统计特征,以便利用删除不相关统计特征的n个统计特征集合继续执行所述生成统计特征矩阵的步骤。

其中,本方案包括:包括smart记录生成模块,所述smart记录生成模块包括:

数据获取单元,用于获取本次统计时刻至前一统计时刻之间所有的smart数据;其中,所述本次统计时刻为需要生成smart记录的时刻;

采样单元,用于从smart数据中采样,得到每个采样时刻的smart数据;

均值计算单元,用于计算每个采样时刻的smart数据的均值,得到smart记录。

本发明实施例还提供一种磁盘故障预测设备,包括:

存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述磁盘故障预测方法的步骤。

本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述磁盘故障预测方法的步骤。

其中,该存储介质可以包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1