磁盘的故障预测方法和装置与流程

文档序号：11590149阅读：186来源：国知局

本发明涉及磁盘领域，具体而言，涉及一种磁盘的故障预测方法和装置。

背景技术：

目前，硬盘是存储数据的主要介质，硬盘一旦出故障，便会造成巨大的数据损失。因此如何保证硬盘的稳定性能非常重要。在通常状态下，硬盘在24小时中出错的概率在是万分之一左右，当一台服务器具有十块硬盘时，服务器硬盘出错的概率就会上升到千分之一，而随着当前网站等业务的发展，服务器需要使用的硬盘会越来越多，多块硬盘同时出错的概率也会提升。

通常情况下，数据存储通常会有多个备份，如mysql主备库，gfs文件默认3个备份。在大量数据存储平台上，如果多个硬盘同时出故障，那么这些硬盘上存储着同一个文件的备份的概率就会很高，即如果多块硬盘同时出现故障，就会导致一些文件的丢失，对于一些线上的服务，大都依赖于服务器中存储的海量数据，如果硬盘出故障，就会导致上述在线服务异常，甚至暂停使用。

由于上述原因，需要具有预测硬盘是否会出错的系统需要有一套系统能提前告诉我们哪些硬盘会出错，数据可能丢失导致硬盘故障的原因有很多，最常见的有以下几种：外部振动、温度和湿度、电器元件损坏、声音和灰尘，在上述因素中，有些因素能够被采集到，比如温度和湿度、一些元器件数据，但是更多的数据无法被采集和量化，因此便会导致预测结果不准确。

针对现有技术的硬盘故障预测系统中一些容易致使硬盘故障的因素不能被采集胡或量化导致的预测结果不准确的问题，目前尚未提出有效的解决方案。

技术实现要素：

本发明实施例提供了一种磁盘的故障预测方法和装置，以至少解决现有技术的硬盘故障预测系统中一些容易致使硬盘故障的因素不能被采集胡或量化导致的预测结果不准确的技术问题。

根据本发明实施例的一个方面，提供了一种磁盘的故障预测方法，包括：通过磁盘监控技术获取磁盘的样本磁盘数据，其中，样本磁盘数据包括多个维度上的样本数据；采用gbdt算法对样本磁盘数据进行样本训练，得到由多个决策树组成的磁盘预测模型；在接收到待测磁盘的磁盘数据之后，使用由多个决策树组成的磁盘预测模型对待测磁盘的磁盘数据进行处理，确定待测磁盘是否为故障磁盘。

根据本发明实施例的另一方面，还提供了一种磁盘的故障预测装置，包括：通过磁盘监控技术获取磁盘的样本磁盘数据，其中，样本磁盘数据包括多个维度上的样本数据；采用gbdt算法对样本磁盘数据进行样本训练，得到由多个决策树组成的磁盘预测模型；在接收到待测磁盘的磁盘数据之后，使用由多个决策树组成的磁盘预测模型对待测磁盘的磁盘数据进行处理，确定待测磁盘是否为故障磁盘。

在本发明实施例中，采用通过磁盘监控技术获取磁盘的样本磁盘数据，其中，样本磁盘数据包括多个维度上的样本数据；采用gbdt算法对样本磁盘数据进行样本训练，得到由多个决策树组成的磁盘预测模型方式，通过在接收到待测磁盘的磁盘数据之后，使用由多个决策树组成的磁盘预测模型对待测磁盘的磁盘数据进行处理，达到了确定待测磁盘是否为故障磁盘的目的，从而实现了预测磁盘故障状态的技术效果，进而解决了现有技术的硬盘故障预测系统中一些容易致使硬盘故障的因素不能被采集胡或量化导致的预测结果不准确的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种磁盘的故障预测方法的计算机终端的硬件结构框图；

图2是根据本发明实施例的一种磁盘的故障预测方法的流程图；

图3是根据本发明实施例的一种使用gbdt算法对样本磁盘数据进行训练的示意图；

图4为根据本发明实施例的一种使用gbdt算法计算磁盘预测值的示意图；

图5是根据本发明实施例的一种可选的磁盘的故障预测方法的流程图；

图6是根据本发明实施例的一种磁盘的故障预测装置的结构示意图；

图7是根据本发明实施例的一种可选的磁盘的故障预测装置的结构示意图；

图8是根据本发明实施例的一种可选的磁盘的故障预测装置的结构示意图；

图9是根据本发明实施例的一种可选的磁盘的故障预测装置的结构示意图；

图10是根据本发明实施例的一种可选的磁盘的故障预测装置的结构示意图；以及

图11是根据本发明实施例的一种计算机终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本发明实施例，还提供了一种磁盘的故障预测方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例，图1是根据本发明实施例的一种磁盘的故障预测方法的计算机终端的硬件结构框图。如图1所示，计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算机终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

存储器104可用于存储应用软件的软件程序以及模块，如本发明实施例中的磁盘的故障预测方法对应的程序指令/模块，处理器102通过运行存储在存储器104内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的应用程序的漏洞检测方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(networkinterfacecontroller，nic)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(radiofrequency，rf)模块，其用于通过无线方式与互联网进行通讯。

在上述运行环境下，本申请提供了如图2所示的一种磁盘的故障预测方法。图2是根据本发明实施例的一种磁盘的故障预测方法的流程图。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

在上述运行环境下，本申请提供了如图2所示的反编译数据的处理方法。图2是根据本发明实施例一的反编译数据的处理方法的流程图，如图2所示，该方法包括：

步骤21，通过磁盘监控技术获取磁盘的样本磁盘数据，其中，所述样本磁盘数据包括多个维度上的样本数据。

在上述步骤中，磁盘监控技术用于监测磁盘出厂后的使用过程中产生的各项磁盘数据，以预测磁盘的故障状态，使得磁盘使用者能够在磁盘发生故障之前便能知晓磁盘即将发生故障，从而对磁盘中的数据进行拷贝存储，避免数据的丢失。

在一种可选的实施例中，上述样本磁盘数据可以包括：底层数据读取错误率、启动/停止计数、重映射扇区数、通电时间累计、主轴起旋重试次数、磁盘校准重试次数、磁盘通电次数、温度以及写错误率，可以根据磁盘历史故障情况获取样本磁盘数据。例如，可以按照正负样本比例为1:5的比例进行样本获取，其中，正样本为存在故障的磁盘，负样本为不存在故障的磁盘。

此处需要说明的是，在通过磁盘监控技术获取磁盘的样本磁盘数据时，由于预测磁盘故障的各个机构使用的磁盘并不一定相同，且由于各个机构不同温湿度等环境因素对磁盘的影响，使得不同机构的磁盘的好坏比例并不相同，为了使样本磁盘数据的训练提供更可靠的样本磁盘数据，还可以根据机构的实际上磁盘损坏情况进行获取样本磁盘数据。

步骤s23，采用gbdt算法对所述样本磁盘数据进行样本训练，得到由多个决策树组成的磁盘预测模型。

在上述步骤中，gbdt(gradientboostingdecisiontree)为一种迭代的决策树算法，该算法由多棵决策树组成，并通过对所有决策树的结论进行累加，得到最终结果。上述决策树作为一种预测模型，是在上一层决策得到的结果的基础上，进行下一层决策，包括决策点、状态结点、结果结点等参数，树中的每个节点表示被预测的对象，二每个分叉路径则代表该对象可能的属性。

在一种可选的实施例中，在上述样本磁盘为磁盘的s.m.a.r.t的原始值的情况下，对样本磁盘进行样本训练，例如，原始值大于等于预设原始值，可以认为该样本磁盘发生故障的概率较大，原始值小于预设值原始时，可以认为该样本磁盘发生故障的概率较小，因此在确定磁盘预测模型时，在样本磁盘的原始值大于等于预设原始值的情况下，确认该样本磁盘的属性为故障，在样本磁盘的原始值小于预设原始值的情况下，确认该样本磁盘的属性为非故障。建立具备上述决策能力的磁盘预测模型，即向决策树输入待检测磁盘时，若待检测磁盘的原始值大于等于预设原始值，决策树自动确认该待检测磁盘为故障的情况下，确认该样本磁盘的属性为故障，当样本磁盘的原始值小于预设原始值的情况下，确认该样本磁盘的属性为非故障。

步骤s25，在接收到待测磁盘的磁盘数据之后，使用所述由多个决策树组成的磁盘预测模型对所述待测磁盘的磁盘数据进行处理，确定所述待测磁盘是否为故障磁盘。

在一种可选的实施例中，将样本磁盘的多个维度的值作为决策树的评价指标，得到多个决策树，再由多个决策树构成一个磁盘预测模型，对待检测磁盘进行检测。

此处值得注意的是，根据磁盘每一个维度得到的决策树可能相同，可能不相同，因此在使用多个决策树构成磁盘预测模型时，需要根据每个决策树在评价体系中的重要性，来确认每个决策树的权重值，从而得到磁盘预测模型。

此处需要说明的是，在通过磁盘监控技术获取磁盘的样本磁盘数据时，采用了磁盘检测技术，使得获取样本磁盘数据的过程更为简单，且获取的数据更为全面，为样本磁盘数据的训练提供了丰富的磁盘样本数据。在上述步骤中，采用gbdt算法对所述样本磁盘数据进行样本训练可以是分两次或多次进行训练，以提高与训练结果对应的决策树构成的磁盘预测模型的准确率和召回率。

由此，本申请提供的上述实施例一的方案解决了现有技术的硬盘故障预测系统中一些容易致使硬盘故障的因素不能被采集或量化导致的预测结果不准确的技术问题。

根据本申请上述实施例，在一种优选的方案中，所述样本磁盘数据至少包括如下四个维度上的样本数据：原始值、标准值、最差值和累积值。

上述原始值为磁盘运行时的当前参数；上述标准值为正常磁盘运行时各项参数的数值；上述最差值为磁盘运行时，磁盘的各项检测参数曾出现过与正常值偏差最大的非正常值；上述累计值为磁盘的各项检测参数从磁盘使用至当前时刻的累计结果。

在一种可选的实施例中，磁盘的各项参数可以是对磁盘的各项属性进行描述的信息，可以包括错误读取率、加电次数、重新分配扇区数、旋转重试次数、磁盘校准重试次数以及奇偶校验错误率中的一项或多项，也可以包括磁盘的其他属性信息。

本申请上述步骤可以分别以上述四个维度上的样本数据得到多个不同的决策树。

在一种可选的实施例中，可以采用hdtune、crystaldiskinfo等软件获取样本磁盘数据。

根据本申请上述实施例，在一种优选的方案中，在通过磁盘监控技术获取磁盘的样本磁盘数据之后，所述方法还包括：

步骤s211，对所述每个维度上的样本数据进行如下任意一种或多种运算：差分运算、平方运算和分布求和运算，使得任意一个维度上的样本数据被扩展出新的维度上的样本数据。

在上述步骤中，对决策结果进行进一步运算，可将决策树根据运算结果拓展出新的维度，得到这一维度上的样本数据。

此处值得注意的时，每个维度的样本数据都可以进行多种运算以在这一维度的基础上得到更多维度的样本数据，在有四个维度的基础上，每个维度再分别进行差分运算、平方运算和分布求和运算，便能够得到十六个维度的样本数据，且通过每个维度的样本数据进行决策的侧重点均不同。

在一种可选的实施例中，仍以原始值这一维度的样本数据为例，对原始值的样本数据进行差分运算、平方运算和分布求和运算，由此得到新的四个维度的样本数据，采用新的四个维度的样本数据最为决策指标进行训练，并得到新的四个决策树。

根据本申请上述实施例，在一种优选的方案中，采用gbdt算法对所述样本磁盘数据进行样本训练，得到由多个决策树组成的磁盘预测模型，包括：

步骤s231，以所有磁盘的样本磁盘数据作为训练数据，并采用默认值初始化所述训练数据的分类模型参数。

在上述步骤中，初始化训练数据的分类模型参数可以是预先设置上述决策树的个数、每个决策树的层数，即对决策树的属性进行初步设置。

步骤s233，提取所述训练数据中的多个特征数据，将每个特征数据作为根节点在创建所述多个决策树，并将每个特征数据对应的特征值作为对应的决策树的叶子节点。

步骤s235，计算当前所有叶子节点的最优划分以及其增益，并以增益最大的叶子节点以及对应的划分点进行分裂，使得将所述样本磁盘数据划分到子节点中。

在上述步骤中，增益可以是标签值的最小化均方差，即每个样本的标签值与预测标签值做差后，求的差的平方，并计算所有差的平方的和，可以认为被预测出错的样本越多，均方差就越大，因此通过最小化均方差能够找到最优的分枝依据

上述决策树可以是以每个特征数据作为根节点的二叉树，且每个特数据对应于一个特征值，该特征值为以该特征数据为根节点的决策树的叶子节点。在确定决策树的叶子节点后，对叶子节点在进行下一步划分，此处值得注意的是，当对叶子节点进行进一步划分时，在多个叶子节点的增益不相同的情况下，划分增益最大的叶子节点，使所有样本数据都能划分至相应的叶子节点中。

在一种可选的实施例中，以样本磁盘为a、b、c和d四块磁盘为例，其中，a磁盘和b磁盘为正常磁盘，c磁盘和d磁盘为损坏的磁盘，在这一示例中，将正常磁盘对应于0，故障磁盘对应于1，因此，a、b、c和d四块磁盘分别对应为0、0、1、1。获取上述磁盘在第一维度上的特征值为a，使用gbdt算法对样本磁盘数据进行训练，图3是根据本发明实施例的一种使用gbdt算法对样本磁盘数据进行训练的示意图，结合图3所示，设置默认初始值为0.5，即每个磁盘为故障磁盘的概率为0.5，第一维度的阀值为a0，将特征值大于a0的磁盘划分为一个子节点，将第一维度上的特征值小于等于a0的磁盘划分为另一个子节点，并设置两个子节点的磁盘为故障磁盘的概率为0.5。

此处需要说明的当是，上述实施例为方便说明，仅选用了四个样本数据进行说明，因此只划分得到两个叶子节点，在实际应用中，根节点划分为两个叶子节点之后，仍可以继续划分，样本数据量越大，划分的层次就越多。

根据本申请上述实施例，在一种优选的方案中，提取所述训练数据中的多个特征数据，将每个特征数据作为根节点在创建所述多个决策树，并将每个特征数据对应的特征值作为对应的决策树的叶子节点，包括：

步骤s2331，读取任意一个特征数据对应的阈值。

步骤s2333，将所述任意一个特征数据的特征值与所述阈值进行比较，并根据比较结果得到两个分支的熵。

步骤s2335，根据所述两个分支的熵确定两个新节点作为所述任意一个特征数据的两个叶子节点。

步骤s2337，采用上述步骤对每一个特征数据进行处理，直到每个特征数据得到预定的两个唯一的叶子节点。

在上述步骤中，穷举每一个特征的每一个阈值，找到使得按照特征小于等于阈值，和特征大于阈值分成的两个分枝的熵最小的特征和阈值，按照该标准分枝得到两个新节点，使用同样方法继续分枝直到所有样本都被分入只有正常磁盘或只有故障磁盘的叶子节点，或达到预设的终止条件，若最终叶子节点中不是只有正常磁盘或故障磁盘，则以该节点上所有样本的平均标签值作为该叶子节点的预测标签值。

此处需要说明的是，标签值即为该磁盘为故障磁盘的概率。

此处仍需要说明的是，熵最小是指尽可能的使每个分枝中，正样本和负样本的比例远离1:1，熵最小的情况为该分枝上只有正样本或负样本，即该分支上只有正常的磁盘，或故障磁盘。

在一种可选的实施例中，在决策树为回归树的示例中，每个节点都会得一个预测值，该预测值等于属于该节点的所有标签值的平均值，对该节点进行划分时，穷举每一个特征的每个阈值，找最好的分割点进行划分，直到每个叶子节点上每个样本的标签值都唯一或者达到预设的终止条件，若最终叶子节点上样本的标签值不唯一，则以该节点上所有样本的平均标签值作为该叶子节点的预测标签值。

此处需要说明的是，在上述实施例中，最优的划分标准不再是最小化熵，而是最小化均方差，即每个样本的标签值与预测标签值做差后，求的差的平方，并计算所有差的平方的和，可以认为被预测出错的样本越多，均方差就越大，因此通过最小化均方差能够找到最优的分枝依据。

此处还需要说明的是，在进行划分时，使每个叶子节点上每个样本的标签值都唯一是很难达到的，因此为了得到最接近真实情况的预测结果可以预设一个终止条件，该终止条件可以是叶子的上限。

根据本申请上述实施例，在一种优选的方案中，在得到由多个决策树组成的磁盘预测模型之后，所述方法还包括：对所述分类模型参数进行调整，其中，在所述分类模型参数包括故障磁盘样本和非故障磁盘样本的情况下，如果要确定所述待测磁盘是否为故障磁盘，则将所述分类模型参数中的故障磁盘样本的比例调高。

根据本申请上述实施例，在一种优选的方案中，使用所述由多个决策树组成的磁盘预测模型对所述待测磁盘的磁盘数据进行处理，确定所述待测磁盘是否为故障磁盘，包括：

步骤s251，接收到所述待测磁盘的磁盘数据之后，对所述待测磁盘的磁盘数据赋予一个初始值。

步骤s253，根据所述待测磁盘的初始值遍历每一个决策树，计算得到第一个决策树所确定的预测结果和第一残差，并将所述第一残差赋值给所述初始值，得到更新后的初始值。

步骤s255，以所述更新后的初始值计算得到第二个决策树所确定的预测结果和第二残差，并所述第二残差赋值所述更新后的初始值，以此遍历所有的决策树，得到预测所述待测磁盘是否为故障磁盘的结果。

步骤s257，每一棵树学的是之前所有树结论和的残差，这个残差就是一个加预测值后能得真实值的累加量。

在一种可选的实施例中，仍以上述a,b,c,d四个磁盘为例，采用特征a可将a,b,c,d四个磁盘分为两个部分，分别为a,b和c,d，每个部分用平均标签值作为预测值。此时计算残差，其中残差至为磁盘的预测值与磁盘的实际值的差，所以a的残差就是1-0.5＝0.5进而得到a,b,c,d的残差分别为0.5,-0.5，0.5,-0.5。然后结合图4所示，图4为根据本发明实施例的一种使用gbdt算法计算磁盘预测值的示意图，使用残差替代a,b,c,d的原值，输入至第二棵决策树进行训练，并根据与特征b的比对结果分为两个叶子节点，如果预测值和它们的残差相等，则只需把第二棵树的结论累加到第一棵树上就能得到磁盘的实际值。第二棵树仅有两个值0.5和-0.5，因此直接分成两个节点。此时所有人的残差都是0，即每个人都得到了真实的预测值。

此处需要说明的是，上述实施例以说明为目的，因此只有两颗决策树，在实际应用中，根据样本数据量可以获得到个决策树，且预测值是指之前所有树累加的和，由于此实施例中，这棵决策树之前仅有一颗决策树，因此直接是0.5，如果还有奇特决策树，则需要都累加起来作为a的预测值。

图5是根据本发明实施例的一种可选的磁盘的故障预测方法的流程图，下面结合图5详细介绍本申请的一种优选的实施例。

如图5所示，提供了一种磁盘的故障预测方法，该方法可以包括如下步骤s51至步骤s57：

s51，获取样本磁盘的样本数据。

具体的，在上述步骤中，可以通过hdtune、crystaldiskinfo等软件获取样本磁盘数据。

s52，对样本数据进行差分运算。

具体的，在上述步骤中，差分运算指磁盘在某一时刻的特征数据与过该磁盘在24小时之前的特征数据做差运算得到的值。

s53，对差分运算得到的结果进行分布求和和/或平方运算。

s54，得到训练和预测数据。

s55，第一步训练和预测，使召回率较大。

s56，第二步训练和预测，平衡召回率和准确率。

具体的，在上述步骤中，由于训练数据中负样本占比很大，正样本占比小，例如，当二者比例为1000:1时，如果用全部的训练数据做训练，能准确预测的正样本是很少的，由于训练数据中正样本较少，很多真实值为负样本的数据可能被误判为正样本，因此第一步在训练时使正样本的召回率较大，第二步在训练时，把第一步预测为正样本的训练数据作为第二步的训练数据，即选择为与正样本接近的那些样本作为训练样本，如此在做训练时，训练出的模型会更有利于预测出正样本，这样第二步预测得到的结果，正样本的准确率会比第一步有大幅度提高，从而使准确率和召回率达到一定的平衡程度。

实施例2

根据本发明实施例，还提供了一种用于实施上述反编译数据的处理方法的反编译数据的处理装置，图6是根据本发明实施例的一种磁盘的故障预测装置的结构示意图，如图6所示，该装置包括：获取模块60，训练模块62和处理模块64。

获取模块60，用于通过磁盘监控技术获取磁盘的样本磁盘数据，其中，所述样本磁盘数据包括多个维度上的样本数据；

训练模块62，用于采用gbdt算法对所述样本磁盘数据进行样本训练，得到由多个决策树组成的磁盘预测模型；

处理模块64，在接收到待测磁盘的磁盘数据之后，使用所述由多个决策树组成的磁盘预测模型对所述待测磁盘的磁盘数据进行处理，确定所述待测磁盘是否为故障磁盘。

此处需要说明的是，上述获取模块60，训练模块62和处理模块64对应于实施例一种的步骤s21至步骤s25所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

根据本申请上述实施例，在一种优选的方案中，所述样本磁盘数据为smart磁盘数据，其中，所述样本磁盘数据至少包括如下四个维度上的样本数据：原始值、标准值、最差值和累积值。

根据本申请上述实施例，在一种优选的方案中，结合图7所示，上述装置还包括：

运算模块70，用于对所述每个维度上的样本数据进行如下任意一种或多种运算：差分运算、平方运算和分布求和运算，使得任意一个维度上的样本数据被扩展出新的维度上的样本数据。

此处需要说明的是，上述运算模块770对应与实施例一中的步骤s21至步骤s25所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

根据本申请上述实施例，在一种优选的方案中，结合图8所示，上述训练模块62还包括：

初始模块80，用于以所有磁盘的样本磁盘数据作为训练数据，并采用默认值初始化所述训练数据的分类模型参数；

提取模块82，用于提取所述训练数据中的多个特征数据，将每个特征数据作为根节点在创建所述多个决策树，并将每个特征数据对应的特征值作为对应的决策树的叶子节点；

第一计算模块84，用于计算当前所有叶子节点的最优划分以及其增益，并以增益最大的叶子节点以及对应的划分点进行分裂，使得将所述样本磁盘数据划分到子节点中。

此处需要说明的是，上述初始模块80，提取模块82和第一计算模块84对应于实施例一种的步骤s231至步骤s235所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

根据本申请上述实施例，在一种优选的方案中，结合图9所示，所述提取模块82包括：

读取模块90，用于读取任意一个特征数据对应的阈值；

比较模块92，用于将所述任意一个特征数据的特征值与所述阈值进行比较，并根据比较结果得到两个分支的熵；

确定模块94，用于根据所述两个分支的熵确定两个新节点作为所述任意一个特征数据的两个叶子节点；

处理子模块96，用于采用上述步骤对每一个特征数据进行处理，直到每个特征数据得到预定的两个唯一的叶子节点。

此处需要说明的是，上述读取模块90，比较模块92、确定模块94和处理子模块96对应于实施例一种的步骤s2331至步骤s2337所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

根据本申请上述实施例，在一种优选的方案中，结合图10所示，上述处理模块 64包括：

接收模块100，用于接收到所述待测磁盘的磁盘数据之后，对所述待测磁盘的磁盘数据赋予一个初始值；

第二计算模块102，用于根据所述待测磁盘的初始值遍历每一个决策树，计算得到第一个决策树所确定的预测结果和第一残差，并将所述第一残差赋值给所述初始值，得到更新后的初始值；

遍历模块104，用于以所述更新后的初始值计算得到第二个决策树所确定的预测结果和第二残差，并所述第二残差赋值所述更新后的初始值，以此遍历所有的决策树，得到预测所述待测磁盘是否为故障磁盘的结果。

此处需要说明的是，上述接收模块100，第二计算模块102和遍历模块104对应于实施例一种的步骤s251至步骤s255所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

实施例3

本发明的实施例可以提供一种计算机终端，该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地，在本实施例中，上述计算机终端也可以替换为移动终端等终端设备。

可选地，在本实施例中，上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

在本实施例中，上述计算机终端可以执行磁盘的故障预测方法中以下步骤的程序代码：通过磁盘监控技术获取磁盘的样本磁盘数据，其中，样本磁盘数据包括多个维度上的样本数据；采用gbdt算法对样本磁盘数据进行样本训练，得到由多个决策树组成的磁盘预测模型；在接收到待测磁盘的磁盘数据之后，使用由多个决策树组成的磁盘预测模型对待测磁盘的磁盘数据进行处理，确定待测磁盘是否为故障磁盘。

可选地，图11是根据本发明实施例的一种计算机终端的结构框图。如图11所示，该计算机终端a可以包括：一个或多个(图中仅示出一个)处理器111、存储器113、以及传输装置115。

其中，存储器可用于存储软件程序以及模块，如本发明实施例中的磁盘的故障预测方法和装置对应的程序指令/模块，处理器通过运行存储在存储器内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的磁盘的故障预测方法。存储器可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至终端a。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器可以通过传输装置调用存储器存储的信息及应用程序，以执行下述步骤：样本磁盘数据为smart磁盘数据，其中，样本磁盘数据至少包括如下四个维度上的样本数据：原始值、标准值、最差值和累积值。

可选的，上述处理器还可以执行如下步骤的程序代码：对每个维度上的样本数据进行如下任意一种或多种运算：差分运算、平方运算和分布求和运算，使得任意一个维度上的样本数据被扩展出新的维度上的样本数据。

可选的，上述处理器还可以执行如下步骤的程序代码：以所有磁盘的样本磁盘数据作为训练数据，并采用默认值初始化训练数据的分类模型参数；提取训练数据中的多个特征数据，将每个特征数据作为根节点在创建多个决策树，并将每个特征数据对应的特征值作为对应的决策树的叶子节点；计算当前所有叶子节点的最优划分以及其增益，并以增益最大的叶子节点以及对应的划分点进行分裂，使得将样本磁盘数据划分到子节点中。

可选的，上述处理器还可以执行如下步骤的程序代码：读取任意一个特征数据对应的阈值；将任意一个特征数据的特征值与阈值进行比较，并根据比较结果得到两个分支的熵；根据两个分支的熵确定两个新节点作为任意一个特征数据的两个叶子节点；采用上述步骤对每一个特征数据进行处理，直到每个特征数据得到预定的两个唯一的叶子节点。

可选的，上述处理器还可以执行如下步骤的程序代码：在得到由多个决策树组成的磁盘预测模型之后，方法还包括：对分类模型参数进行调整，其中，在分类模型参数包括故障磁盘样本和非故障磁盘样本的情况下，如果要确定待测磁盘是否为故障磁盘，则将分类模型参数中的故障磁盘样本的比例调高。

可选的，上述处理器还可以执行如下步骤的程序代码：接收到待测磁盘的磁盘数据之后，对待测磁盘的磁盘数据赋予一个初始值；根据待测磁盘的初始值遍历每一个决策树，计算得到第一个决策树所确定的预测结果和第一残差，并将第一残差赋值给初始值，得到更新后的初始值；以更新后的初始值计算得到第二个决策树所确定的预测结果和第二残差，并第二残差赋值更新后的初始值，以此遍历所有的决策树，得到预测待测磁盘是否为故障磁盘的结果。

本领域普通技术人员可以理解，图11所示的结构仅为示意，计算机终端也可以是智能手机(如android手机、ios手机等)、平板电脑、掌声电脑以及移动互联网设备(mobileinternetdevices，mid)、pad等终端设备。图11其并不对上述电子装置的结构造成限定。例如，计算机终端a还可包括比图11中所示更多或者更少的组件(如网络接口、显示装置等)，或者具有与图11所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(read-onlymemory，rom)、随机存取器(randomaccessmemory，ram)、磁盘或光盘等。

实施例4

本发明的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以用于保存上述实施例一所提供的磁盘的故障预测方法所执行的程序代码。

可选地，在本实施例中，上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中，或者位于移动终端群中的任意一个移动终端中。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：通过磁盘监控技术获取磁盘的样本磁盘数据，其中，样本磁盘数据包括多个维度上的样本数据；采用gbdt算法对样本磁盘数据进行样本训练，得到由多个决策树组成的磁盘预测模型；在接收到待测磁盘的磁盘数据之后，使用由多个决策树组成的磁盘预测模型对待测磁盘的磁盘数据进行处理，确定待测磁盘是否为故障磁盘。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：对每个维度上的样本数据进行如下任意一种或多种运算：差分运算、平方运算和分布求和运算，使得任意一个维度上的样本数据被扩展出新的维度上的样本数据。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：以所有磁盘的样本磁盘数据作为训练数据，并采用默认值初始化训练数据的分类模型参数；提取训练数据中的多个特征数据，将每个特征数据作为根节点在创建多个决策树，并将每个特征数据对应的特征值作为对应的决策树的叶子节点；计算当前所有叶子节点的最优划分以及其增益，并以增益最大的叶子节点以及对应的划分点进行分裂，使得将样本磁盘数据划分到子节点中。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：读取任意一个特征数据对应的阈值；将任意一个特征数据的特征值与阈值进行比较，并根据比较结果得到两个分支的熵；根据两个分支的熵确定两个新节点作为任意一个特征数据的两个叶子节点；采用上述步骤对每一个特征数据进行处理，直到每个特征数据得到预定的两个唯一的叶子节点。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：在得到由多个决策树组成的磁盘预测模型之后，方法还包括：对分类模型参数进行调整，其中，在分类模型参数包括故障磁盘样本和非故障磁盘样本的情况下，如果要确定待测磁盘是否为故障磁盘，则将分类模型参数中的故障磁盘样本的比例调高。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：接收到待测磁盘的磁盘数据之后，对待测磁盘的磁盘数据赋予一个初始值；根据待测磁盘的初始值遍历每一个决策树，计算得到第一个决策树所确定的预测结果和第一残差，并将第一残差赋值给初始值，得到更新后的初始值；以更新后的初始值计算得到第二个决策树所确定的预测结果和第二残差，并第二残差赋值更新后的初始值，以此遍历所有的决策树，得到预测待测磁盘是否为故障磁盘的结果。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：丁永明;周俊;崔卿;瞿神全
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。