一种磁盘使用健康状态监控管理方法与流程

文档序号:34981388发布日期:2023-08-02 07:41阅读:46来源:国知局
一种磁盘使用健康状态监控管理方法与流程

本发明涉及数据处理,具体涉及一种磁盘使用健康状态监控管理方法。


背景技术:

1、通过记录磁盘运行时的各项指标,例如磁盘温度、磁头垂直位移、寻道时间等等,可以得到一个关于磁盘当前状态的全面而准确的评估,进而实现对磁盘使用健康状态的监测。同时,通过长期记录各项指标,可以建立一个磁盘状态的历史指标数据库,通过比对历史指标数据和当前指标数据,可以给磁盘提供状态评估、预警报警和优化建议;因此,磁盘的历史指标数据对于磁盘使用健康状态的监测和管理至关重要。

2、随着磁盘使用时间的增加,磁盘的历史指标数据的数据量越来越大,为了在根据磁盘的历史指标数据对磁盘使用健康状态进行监测和管理的同时,尽可能地不影响磁盘的使用,需要使存储在磁盘中的历史指标数据的数据量尽可能小,这就需要对磁盘的历史指标数据进行压缩,较少磁盘的历史指标数据占用的存储空间小,进而降低存储磁盘的历史指标数据对使用磁盘的影响。

3、霍夫曼编码是常用的数据压缩方法,利用霍夫曼编码对数据进行压缩具有局限性,即如果所有种数据的概率分布不服从是2负n次方的形式,则数据压缩的结果无法达到熵极限,即数据的压缩效果没有达到最好;同时,当数据的概率分布服从2负n次方的形式时,数据压缩的结果达到熵极限,也就意味着达到熵极限是通过霍夫曼编码对数据进行压缩时的极限,无法再提高;综上,通过霍夫曼编码对数据进行压缩的压缩效果存在极限。

4、因此,如果使所有种数据的概率分布尽可能服从是2负n次方的形式,使数据压缩的结果达到熵极限,在此基础上,对霍夫曼编码进行改进使数据压缩结果突破熵极限,是提高数据压缩效果,减少磁盘的历史指标数据占用的存储空间,进而降低存储磁盘的历史指标数据对使用磁盘的影响的关键。


技术实现思路

1、本发明提供一种磁盘使用健康状态监控管理方法,以解决现有的问题。

2、本发明的一种磁盘使用健康状态监控管理方法采用如下技术方案:

3、本发明一个实施例提供了一种磁盘使用健康状态监控管理方法,该方法包括以下步骤:

4、将预设时间段内的磁盘数据按照顺序组成的序列记为磁盘历史数据序列,将磁盘历史数据序列转换为二值数据序列;

5、构建每个分组长度对应的理想频率序列,根据每个分组长度对二值数据序列进行划分获得每个分组长度对应的所有分组,根据每个分组长度对应的所有种分组的实际频率序列和理想频率序列计算每个分组长度的适用程度;将适用程度最大的分组长度记为适用长度,根据适用长度获得数据序列和所有适用分组组成的适用分组序列,根据适用分组序列获得霍夫曼编码总表;

6、将除实际频率最大的适用分组外的任意一种适用分组记为目标适用分组,对目标适用分组对应的分组序列进行处理,获得目标适用分组的霍夫曼编码分表,包括:

7、k1,根据目标适用分组对应的分组序列构建范式霍夫曼树,根据范式霍夫曼树获得目标适用分组对应的目标霍夫曼编码表;

8、k2,根据霍夫曼编码总表和目标适用分组对应的目标霍夫曼编码表,计算每种适用分组的优先排除度,将优先排除度大于等于0且优先排除度最大的适用分组从目标适用分组对应的分组序列中去除;

9、k3,重复k1到k2,直至目标适用分组对应的分组序列中所有适用分组的优先排除度均小于0,将根据目标适用分组对应的分组序列构建的目标霍夫曼编码表作为目标适用分组对应的霍夫曼编码分表;

10、对所有适用分组对应的分组序列进行处理,获得所有适用分组的霍夫曼编码分表;

11、根据霍夫曼编码总表和所有适用分组的霍夫曼编码分表,对磁盘指标序列进行压缩,获得磁盘指标序列的压缩结果。

12、进一步地,所述构建每个分组长度对应的理想频率序列,包括的具体步骤如下:

13、将分组长度取值范围内的任意一个整数作为分组长度f,获得长度等于的长度的理想概率序列,记为分组长度f对应的理想概率序列,理想概率序列中的最后一个理想概率为,除最后一个理想概率以外,理想概率序列中第i个理想概率为。

14、进一步地,所述根据每个分组长度对二值数据序列进行划分获得每个分组长度对应的所有分组,根据每个分组长度对应的所有种分组的实际频率序列和理想频率序列计算每个分组长度的适用程度,包括的具体步骤如下:

15、将分组长度取值范围内的任意一个整数作为分组长度f,根据分组长度将二值数据序列划分为若干个子序列,将相同的若干个子序列划分为一种分组,获得所有种分组的实际频率,将所有种分组的实际频率按照从大到小的顺序排列组成的序列记为分组长度对应的实际频率序列;

16、分组长度f的适用程度的计算公式为:

17、

18、式中,表示分组长度f的适用程度,n表示所有分组的数量,表示实际频率序列中的第i个实际概率,表示理想频率序列中的第i个理想概率,表示累加长度。

19、进一步地,所述根据适用长度获得数据序列和所有适用分组组成的适用分组序列,包括的具体步骤如下:

20、根据适用长度将二值数据序列划分为若干个子序列,将每个子序列记为数据,将所有数据按照顺序组成的序列记为数据序列,将适用长度对应的所有种分组,记为适用分组;将所有适用分组按照实际频率从大到小的顺序排序组成的序列记为适用分组序列。

21、进一步地,所述根据适用分组序列获得霍夫曼编码总表,包括的具体步骤如下:

22、构建n层的二叉树,要求二叉树中所有层的左节点以及最后一层的右节点均为叶子节点,二叉树中的其他节点均为父节点,其中,n为适用分组序列中的所有种适用分组的数量;将所有层的左节点以及最后一层的右节点记为目标节点,按照从上到下的顺序,将适用分组序列中的每个分组依次分配给每个目标节点,按照左0右1方式给二叉树分配编码,将获得的二叉树记为范式霍夫曼树,进而获得霍夫曼编码表,记为霍夫曼编码总表。

23、进一步地,所述目标适用分组对应的分组序列具体为:

24、获得数据序列中属于目标适用分组的所有数据,记为目标数据,将每个目标数据在数据序列中的后一个数据记为目标后近邻数据,获得所有目标后近邻数据,统计所有目标后近邻数据中每种适用分组的频率,记为目标适用分组对应的每种适用分组的目标频率,将所有适用分组按照目标频率从大到小的顺序排序组成的序列记为目标适用分组对应的分组序列。

25、进一步地,所述根据目标适用分组对应的分组序列构建范式霍夫曼树,包括的具体步骤如下:

26、构建t+1层的二叉树,要求二叉树中所有层的左节点以及最后一层的右节点均为叶子节点,二叉树中的其他节点均为父节点,其中,t为目标适用分组对应的分组序列的长度;将除前两层外所有层的左节点以及最后一层的右节点(共t个节点)记为目标节点,按照从上到下的顺序,将目标适用分组对应的分组序列中的每个适用分组依次分配给每个目标节点,按照左0右1方式给二叉树分配编码,将获得的二叉树记为范式霍夫曼树。

27、进一步地,所述计算每种适用分组的优先排除度,包括的具体步骤如下:

28、将每种适用分组在霍夫曼编码总表中对应的编码的长度记为每种适用分组的第一长度,将每种适用分组在目标适用分组对应的目标霍夫曼编码表中对应的编码的长度记为每种适用分组的第二长度,将每种适用分组的第二长度加1后与每种适用分组的第一长度的差值记为每种适用分组的增加程度,将每种适用分组的增加程度与每种适用分组的目标频率的乘积记为。

29、进一步地,所述对磁盘指标序列进行压缩,获得磁盘指标序列的压缩结果,包括的具体步骤如下:

30、将采集的磁盘运行时刻的所有指标数据组成的序列记为磁盘指标序列,通过gb2312编码方式对磁盘指标序列进行编码,获得磁盘二值序列,根据适用长度对磁盘二值序列进行划分获得磁盘数据序列,按照顺序对磁盘数据序列中的所有数据进行压缩,获得磁盘指标序列的压缩结果,包括:将任意一个数据记为当前数据,将磁盘数据序列中当前数据的前一个数据记为前近邻数据,判断当前数据是否能够用前近邻数据对应的霍夫曼编码分表进行压缩,如果能够进行压缩,则根据前近邻数据对应的霍夫曼编码分表对当前数据进行压缩,且在获得的编码结果前加一个标识符,如果不能够进行压缩,则根据霍夫曼编码总表对当前数据进行压缩。

31、本发明的技术方案的有益效果是:达到熵极限是通过现有的霍夫曼编码对磁盘指标序列进行压缩时的极限,导致通过现有霍夫曼编码对磁盘指标序列进行压缩的压缩效率有限,本发明通过将磁盘历史数据序列转换为二值数据序列,通过每个分组长度对应的所有种分组的频率和理想频率的差异构建每个分组长度的适用程度,获得使数据压缩的结果尽可能达到熵极限的适用长度,根据所有分组的实际频率构建范式霍夫曼总树,在此基础上,通过目标分组对应的目标数据的目标后邻接数据获得目标分组对应的每种分组的目标频率,根据目标分组对应的目标频率序列构建范式霍夫曼分树,判断每种分组在范式霍夫曼总树和范式霍夫曼分树中编码结果的长度,保留在范式霍夫曼分树中编码结果的长度小于在范式霍夫曼总树中编码结果的长度的分组,进而根据范式霍夫曼分树对保留的分组对应的数据进行编码,使磁盘指标序列的压缩结果尽可能达到熵极限的基础上,进一步通过对霍夫曼编码进行改进使磁盘指标序列的压缩结果突破熵极限,减少磁盘指标序列的压缩结果的数据量,提高磁盘指标序列的压缩效果,减少磁盘的历史指标数据占用的存储空间,进而降低存储磁盘的历史指标数据对使用磁盘的影响。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1