一种基于smart的预测硬盘亚健康指标的方法及装置的制造方法

文档序号:10534699阅读:376来源:国知局
一种基于smart的预测硬盘亚健康指标的方法及装置的制造方法
【专利摘要】本发明提供了一种基于SMART的预测硬盘亚健康指标的方法及装置,其中方法包括:监测硬盘的自我监测分析与报告技术SMART参数,所述SMART参数包括:重分配扇区参数、当前待映射扇区参数、错误无法恢复参数和指令超时参数;根据所述SMART参数中各项参数的监测值判断所述硬盘是否出现状态异常;如果是,根据所述SMART参数中各项参数的监测值调整所述硬盘的健康指标值;根据当前所述硬盘的健康指标值确定所述硬盘当前的健康状态。能够在硬盘状态出现异常时对硬盘健康状态的进行有效预估,给使用者提供准确的参考数据。
【专利说明】
一种基于SMART的预测硬盘亚健康指标的方法及装置
技术领域
[0001] 本发明涉及硬盘监测保护技术领域,具体而言,涉及一种基于SMART的预测硬盘亚 健康指标的方法及装置。
【背景技术】
[0002] 硬盘在使用的过程中随着时间的推移会逐步产生坏道,坏道足够多时,将影响数 据存储的安全,一般解决该问题的方式是对数据进行冗余备份,但即使采用了 RAID1,也无 法避免数据硬盘和备份硬盘同时出现故障的情况。
[0003] SMART(Self-Monitoring Analysis And Reporting Technology,自我监测分析 与报告技术)作为一种自动监控硬盘驱动器完好状况和报告潜在问题的技术标准,是硬盘 普遍采用的数据安全技术,在硬盘工作的时候监测系统中电极、电路、磁盘、磁头等的状态; 现有技术中,硬盘厂商普遍采用阔值判定方法来预测硬盘故障,即利用硬盘SMART技术,采 集硬盘运行时的各项监测数据项的指标信息,并分别与预先设定的各项监测数据项的指标 信息的硬盘故障预警阔值相比较,超过故障预警阔值时便触发故障报警;但是在设定各项 监测数据项的指标信息的故障预警阔值时往往选择将误报率降至最低,此种做法同时也牺 牲了预测的准确率,并且上述SMART各项监测数据项的指标信息中大多数指标与硬盘故障 不存在关联,因此导致现有技术中在误报率约为〇. 1 %时,其硬盘故障监测准确率仅为3 % -10%〇

【发明内容】

[0004] 有鉴于此,本发明实施例的目的在于提供一种基于SMART的预测硬盘亚健康指标 的方法及装置,以实现准确地监测硬盘的健康状态。
[0005] 有鉴于此,一方面本发明实施例提供了一种基于SMART的预测硬盘亚健康指标的 方法,包括:
[0006] 监测硬盘的自我监测分析与报告技术SMART参数,所述SMART参数包括:重分配扇 区参数、当前待映射扇区参数、错误无法恢复参数和指令超时参数;
[0007] 根据所述SMART参数中各项参数的监测值判断所述硬盘是否出现状态异常;
[0008] 如果是,根据所述SMART参数中各项参数的监测值调整所述硬盘的健康指标值;
[0009] 根据当前所述硬盘的健康指标值确定所述硬盘当前的健康状态。
[0010] 上一个实施例中,根据所述SMART参数中各项参数的监测值判断所述硬盘是否出 现状态异常包括:
[0011]当所述SMART参数的监测值存在以下情况中的至少一项时,确定所述硬盘出现状 态异常:
[0012] 所述重分配扇区计数参数的监测值非0;
[0013] 所述当前待映射扇区计数参数的监测值大于第一设定值;
[0014] 所述无法恢复的错误参数的监测值非0;
[0015] 所述指令超时参数的监测值大于第二设定值。
[0016] 上一个实施例中,所述SMART参数还包括:颗粒平均擦写参数;
[0017] 根据所述SMART参数中各项参数的监测值判断所述硬盘是否出现状态异常还包 括:当所述颗粒平均擦写参数的监测值小于第三设定值时,确定所述硬盘出现状态异常。
[0018] 上一个实施例中,根据所述SMART参数中各项参数的监测值调整所述硬盘的健康 指标值包括:根据所述SMART参数中各项参数的监测值查找预先设定的健康指标值调整幅 度列表,所述健康指标值调整幅度列表包括所述SMART参数中各项参数的监测值所处区间 对应的健康指标调整幅度值;
[0019] 按照所述监测值查找到的健康指标调整幅度值计算调整所述硬盘的健康指标值。
[0020] 上一个实施例中,根据当前所述硬盘的健康指标值确定所述硬盘当前的健康状 态,还包括:
[0021 ]根据所述健康指标值计算得到硬盘的健康百分比;
[0022]读取所述硬盘的累计通电时间;
[0023] 基于所述健康百分比和所述硬盘的累计通电时间初步计算得到硬盘的剩余寿命;
[0024] 以及收集硬盘运维数据,形成硬盘运维知识库,在所述硬盘运维知识库中获取所 述累计通电时间和硬盘的亚健康指标数据,构建不同类型、品牌、型号硬盘的平衡预测系数 模型,根据所述平衡预测系数模型计算得到平衡预测系数,并通过所述平衡预测系数对所 述硬盘的剩余寿命作进一步的精确计算。
[0025]另一方面,本发明实施例还提供了一种基于SMART的预测硬盘亚健康指标的装置, 包括:
[0026]监测模块,用于监测硬盘的自我监测分析与报告技术SMART参数,所述SMART参数 包括:重分配扇区参数、当前待映射扇区参数、错误无法恢复参数和指令超时参数;
[0027]判断模块,用于根据所述SMART参数中各项参数的监测值判断所述硬盘是否出现 状态异常;
[0028] 健康指标值调整模块,用于根据所述SMART参数中各项参数的监测值调整所述硬 盘的健康指标值;
[0029] 健康状态确定模块,用于根据当前所述硬盘的健康指标值确定所述硬盘当前的健 康状态。
[0030] 上一个实施例中,所述判断模块还用于当所述SMART参数的监测值存在以下情况 中的至少一项时,确定所述硬盘出现状态异常:
[0031] 所述重分配扇区计数参数的监测值非0;
[0032] 所述当前待映射扇区计数参数的监测值大于第一设定值;
[0033] 所述无法恢复的错误参数的监测值非0;
[0034] 所述指令超时参数的监测值大于第二设定值。
[0035] 上一个实施例中,所述判断模块还用于:当所述颗粒平均擦写参数的监测值小于 第三设定值时,确定所述硬盘出现状态异常。
[0036] 上一个实施例中,所述健康指标值调整模块,包括:
[0037]查找单元,用于根据所述SMART参数中各项参数的监测值查找预先设定的健康指 标值调整幅度列表,所述健康指标值调整幅度列表包括所述SMART参数中各项参数的监测 值所处区间对应的健康指标调整幅度值;
[0038] 第一计算单元,用于按照所述监测值查找到的健康指标调整幅度值计算调整所述 硬盘的健康指标值。
[0039] 上一个实施例中,所述健康状态确定模块,包括:
[0040] 读取单元,用于读取所述硬盘的累计通电时间;
[0041] 第二计算单元,用于根据所述健康指标值计算得到硬盘的健康百分比;还用于基 于所述健康百分比和所述硬盘的累计通电时间初步计算得到硬盘的剩余寿命;
[0042] 第三计算单元,用于收集硬盘运维数据,形成硬盘运维知识库,在所述硬盘运维知 识库中获取所述累计通电时间和硬盘的亚健康指标数据,构建不同类型、品牌、型号硬盘的 平衡预测系数模型,根据所述平衡预测系数模型计算得到平衡预测系数,并通过所述平衡 预测系数对所述硬盘的剩余寿命作进一步的精确计算。
[0043]本申请实施例中提供的一种基于SMA R T的预测硬盘亚健康指标的方法,能够在 SMART参数基础上获取与硬盘故障密切相关联的有效参数,根据该参数进行判断硬盘是否 出现状态异常,并在硬盘状态出现异常时对硬盘健康状态进行有效预估,给使用者提供准 确的参考数据。
[0044]为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合 所附附图,作详细说明如下。
【附图说明】
[0045]为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附 图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对 范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这 些附图获得其他相关的附图。
[0046]图1示出了本发明一个实施例所提供的一种基于SMART的预测硬盘亚健康指标的 方法的流程示意图;
[0047]图2示出了本发明一个实施例所提供的预测平衡系数与累计通电时间关系示意 图;
[0048]图3示出了本发明一个实施例所提供的一种基于SMART的预测硬盘亚健康指标的 装置的结构示意图。
【具体实施方式】
[0049] 下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整 地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在 此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因 此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的 范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做 出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0050] 硬盘在使用过程中,硬盘内存储的数据的宝贵性往往远大于硬盘自身的价值,硬 盘通常是通过SMART技术进行硬盘故障监测,并且SMART监测信息存储在硬盘的固件区内。
[0051 ]如图1所示的实施例,本实施例中给出了一种基于SMART的预测硬盘亚健康指标的 方法,该方法包括以下步骤:
[0052] SI 10、监测硬盘的SMART参数,该SMART参数包括:重分配扇区参数、当前待映射扇 区参数、错误无法恢复参数和指令超时参数;
[0053] S120、根据上述的SMART参数中各项参数的监测值判断所述硬盘是否出现状态异 常;
[0054]本实施例中,当所述的SMART参数的监测值存在以下情况中的至少一项时,确定所 述硬盘出现状态异常:
[0055] 所述重分配扇区计数参数的监测值非0;
[0056] 所述当前待映射扇区计数参数的监测值大于第一设定值;
[0057]所述无法恢复的错误参数的监测值非0;
[0058]所述指令超时参数的监测值大于第二设定值。
[0059] S130、如果是,则根据上述的SMART参数中各项参数的监测值调整所述硬盘的健康 指标值;
[0060] 上述根据SMART参数中各项参数的监测值调整硬盘的健康指标值,按照如下方式 实现:根据SMART参数中各项参数的监测值查找预先设定的健康指标值调整幅度列表,该健 康指标值调整幅度列表包括SMART参数中各项参数的监测值所处区间对应的健康指标调整 幅度值;查找到对应的健康指标值幅度值以后,按照该健康指标调整幅度值计算调整硬盘 的健康指标值,直至得到最终的健康指标值,并根据该健康指标值进行确定硬盘当前的健 康状态。
[0061] 此处的健康指标值调整幅度列表包括上述的SMART各项参数的监测值在硬盘出现 异常时所处的区间以及该区间对应的健康指标调整幅度值,当查找到某一参数的监测值位 于某一区间时,根据该参数的监测值所处的区间对应的健康指标调整幅度值进行对硬盘健 康指标值的调整,最终得到硬盘的健康指标值,此种方式与现有技术中设置单一的硬盘故 障预警阔值的方式相比较能够更准确给出硬盘的健康指标值,能够为使用者提供更可靠的 参考数据,为客户的硬盘使用过程中提供更高的数据存储安全性。
[0062 ] S140、根据当前所述硬盘的健康指标值确定该硬盘当前的健康状态。
[0063] 上述根据当前所述硬盘的健康指标值确定该硬盘当前的健康状态的过程,通过以 下方式实现:
[0064] 根据上述最终得到的健康指标值计算得到硬盘的健康百分比;并读取所述硬盘的 累计通电时间,该硬盘的累计通电时间也可以由监测SMART参数获得,获取上述的硬盘健康 百分比和硬盘的累计通电时间以后,基于该健康百分比和该硬盘的累计通电时间初步计算 得到硬盘的剩余寿命,进一步的,在对硬盘的运维过程中,收集硬盘运维数据(此处的硬盘 运维数据也包括人工输入的硬盘数据),形成硬盘运维知识库,该硬盘运维知识库中的数据 包括但不限于:硬盘生产时间、累计运行时间、SMART参数(含:重分配扇区参数、当前待映射 扇区参数、错误无法恢复参数和指令超时参数)改变的时间点和当前SMART参数值以及硬盘 的亚健康指标数据。在硬盘运维知识库中获取所述累计通电时间以及对硬盘的亚健康指标 数据并进行分析,构建不同类型、品牌、型号硬盘的平衡预测系数模型,根据所述平衡预测 系数模型计算得到平衡预测系数,并通过所述平衡预测系数对所述硬盘的剩余寿命作进一 步的精确计算;并且随着收集到的同类型、同品牌、同型号硬盘数据的积累,该平衡预测系 数模型会越来越精确,最终计算得出硬盘的剩余寿命也更加符合硬盘的真实剩余寿命。
[0065] 本发明法能够十分准确的预测硬盘的剩余寿命,为硬盘使用者提供准确的硬盘剩 余寿命信息,一方面提醒使用者在硬盘剩余使用寿命被耗尽前,及时进行对硬盘内的数据 进行备份或转存,防止硬盘寿命到尽头时会导致数据丢失而给使用者带来巨大损失的情况 发生;另一方面能够满足使用者对硬盘寿命进行充分的利用,避免使用者在硬盘还具有相 当多的使用寿命时将硬盘丢弃,因此而造成资源的浪费。
[0066] 在某一实施例中,根据参数的监测值所处的区间所对应的健康指标调整幅度值进 行对硬盘健康指标值的调整,可以是通过以下方式实现:最初先给出某一基数,该基数作为 最初的健康指标值,当根据SMART参数中各项参数的监测值判断所述硬盘出现状态异常时, 根据该参数的监测值所处的区间对应的调整幅度值来调整健康指标值,如果该基数为健康 状态下的最高健康指标值时,在此基数基础上,减去上述调整幅度值,最终得到当前硬盘的 健康指标值。
[0067] 上述的根据当前硬盘的健康指标值确定该硬盘当前的健康状态,该处的健康状态 可以包括:健康、亚健康和危险三种状态;并分别划分出满足上述三种状态时的健康指标值 所处的三个数值区间,例如三个健康状态的健康指标值分别对应的三个数值区间为:(a, b]、(b,c]以及(c,d],其中如果最终所得到的健康指标值落入到"健康"的健康指标值区间 范围内时,即落到(a,b]区间内时,则确定硬盘当前的健康状态为"健康";进一步的,如果最 终所得的健康指标值落入到"危险"的健康指标值区间范围内时,即位于(b,c]区间内时,则 确定硬盘当前的健康状态为"危险";上述"亚健康"的状态以此类推,用此种方式进行判断; 需要说明的是此处的三个区间为半开半闭区间,实际操作时也可以根据实际需要设置成为 全部开区间、全部闭区间等多种划分方式;在该实施例中,(b,c]区间的右端点值c为"亚健 康"区间与"危险"区间的界限值,硬盘的健康百分比可以是用最终得到的健康指标值减去 该界限值c后得到的差值占整个健康满分值a(最初的最高健康指标值)的比例计算得到。
[0068] 需要说明的是,健康指标值和健康百分比的计算方法并不局限于此,健康指标值 的计算也可以采用依次累加(减法的逆向运算)的方式,只是最终得到的结论会与上述算法 中相反而已;在此不加以叙述。
[0069] 此实施例中的健康状态预估方法,克服了现有技术中仅通过人为查看SMART的各 项参数给出的告警信息来判断硬盘状态所存在的过程麻烦、预估准确度低的缺陷。
[0070] 需要说明的是,SMART的常用的、关键的监测项主要有:Raw Read Error Rate原始 读取错误率、Wear Leveling Count颗粒平均擦写次数、Runtime Bad Block运行时环块计 数、End To End Error端到端校验错误、Reported Uncorrect无法恢复的错误、Command Timeout指令超时、Seek Error Rate寻道错误率、Reallocated Sector Ct重分配扇区计 数、Unexpect Power Loss Ct/Power-〇ff Retract Count/Emergency Retract Cycle Count异常断电计数、High Fly Writes磁头在异常高度工作、G-sense Error Rate加速度 传感器告警、Current Pending Sector当前待映射扇区计数等等,经过反复的测试和统计, 分析得出与磁盘故障存在较强关联性的SMART参数为:重分配扇区参数、当前待映射扇区参 数、错误无法恢复参数和指令超时参数;因此,本实施例中正是应用上述与磁盘故障具有较 强关联性的参数作为依据进行磁盘健康状态的监测,以实现准确的预估硬盘的健康状态。
[0071 ]在某一具体实施例中,上述的SMART参数还包括:颗粒平均擦写参数;当所述颗粒 平均擦写参数的监测值小于第三设定值时,确定所述硬盘出现状态异常。
[0072]进一步的,当出现上述的如:所述重分配扇区计数参数的监测值非0、所述当前待 映射扇区计数参数的监测值大于第一设定值、所述无法恢复的错误参数的监测值非〇、所述 指令超时参数的监测值大于第二设定值中的情况时,则判断硬盘出现了状态异常,但上述 参数的监测值可以进一步进行划分成不同的区间段,不同区间段对应不同的硬盘故障程 度,进而予以分配不同的健康指标调整幅度值,以此进一步提高对硬盘健康状态监测的准 确性,划分方式包含如下内容:
[0073]①第一种情形:
[0074] 重分配扇区计数参数的监测值非0且增长加速度值为0;
[0075] 当前待映射扇区计数参数的监测值大于3且小于等于10;
[0076] 颗粒平均擦写次数参数的监测值大于1且小于15;
[0077]②第二种情形:
[0078] 重分配扇区计数参数的监测值非0且增长加速度值非0;
[0079] 当前待映射扇区计数参数的监测值值大于10;
[0080] 指令超时参数的监测值大于10;
[0081 ]无法恢复的错误参数的监测值非0;
[0082]颗粒平均擦写次数参数的监测值小于等于1;
[0083]上述第一种情形下的各种情况对应第一种健康指标调整幅度值,上述第二种情形 下的各种情况对应第二种健康指标调整幅度值,需要说明的是第二种情形下的各种情况出 现时代表硬盘的故障程度较第一种情形下的各种情况严重,因此第二种健康指标调整幅度 值较大。
[0084]下面通过举例进行说明:
[0085] 在进行一次健康指标值计算过程中,初始时,将硬盘的初始健康值设为10分;
[0086] 当判断硬盘出现状态异常时,根据SMART各项参数的的监测值查找健康指标值调 整幅度列表,该健康指标值调整幅度列表包含以下内容:
[0087]当监测到SMART参数的监测值出现以下表1中的某一种情况时,在初始健康值基础 上或者在已进行减分操作以后得到的中间值基础上减1分:
[0090]当监测到SMART参数的监测值出现以下表2中的某一种情况时,在初始健康值基础 上或者在已进行减分操作以后得到的中间值基础上减5分;

[0092] 表 2
[0093] 最后,在初始健康指标值基础上得到的最终剩余得分即为最终的健康指标值,进 一步的,根据该健康指标值确定硬盘的当前健康状态按照如下方式进行:
[0094] 判断该健康指标值所处的代表不同健康状态的区间范围,由于此例中数值均设置 的为整数值,所以区间范围划分状态如下表3所示:
[0097] 当最终得到的健康指标值为8~10分之间(包括8分和10分),则确定硬盘处于健康 状态,依次类推。
[0098] 进一步的,在得到最终健康指标值和硬盘健康状态结果以后,将该健康指标值和 健康状态结果进行显示,当处于亚健康或者危险状态时进行告警。
[0099] 通过健康指标值和硬盘累计通电时间T按照以下方式初步计算出硬盘的剩余寿 命:
[0102] 然后,基于上述的累计通电时间和得到的硬盘的亚健康指标数据构建不同类型、 品牌、型号硬盘的平衡预测系数模型,该亚健康指标数据包括硬盘的故障率、期望值等,根 据该平衡预测系数模型计算得到平衡预测系数,并通过所述的平衡预测系数对上述硬盘的 剩余寿命作进一步的精确计算以得到硬盘精准剩余寿命,并且随着收集到的同类型、同品 牌、同型号硬盘数据的积累,该平衡预测系数模型会越来越精确,最终得出的硬盘精准剩余 寿命会更加符合硬盘的真实剩余寿命;
[0103] 其中,硬盘精准剩余寿命=硬盘的剩余寿命XE,式中E为平衡预测系数。
[0104] 进一步的,上述的平衡预测系数模型是硬盘累计通电时间与平衡预测系数的关系 模型,可以通过对不同的类型或者品牌型号的硬盘的出现故障的时间点分类统计进行分别 构建,出现故障频率高的时间点,平衡预测系数相对较低;出现故障频率低的时间点,平衡 预测系相对较高;应用该平衡预测系数可以对初步计算得到的硬盘的剩余寿命进一步精确 化。
[0105] 下面通过举例进行介绍:
[0106] 对同类型某品牌的硬盘累计通电时间和故障硬盘数进行数据统计,会得到如下表 4中的结果:

[0108] 表4
[0109] 100块硬盘中,累计通电时间一年内出现故障的硬盘有10块,两年内出现故障的硬 盘有29块,三年内出现故障的硬盘有56块,四年内出现故障的硬盘有75块,五年内出现故障 的硬盘有87块,六年内出现故障的硬盘98块、7年内出现问题硬盘数100;则可以得出每年的 当年内出现故障的硬盘数目,进而计算得到当年的故障率。
[0110] 进一步得出累计通电时间与当年的故障率的关系表如下表5所示,
[0113]由表5根据概率论和统计学计算得出硬盘寿命期望值=3.45年,然后构建平衡预 测系数模型为:
[0115]通过上述平衡预测系数模型计算得到如下关系表6:
[0117] 表6
[0118] 并进一步绘制得出如图2所示的预测平衡系数与累计通电时间关系图,得到上述 平衡预测系数以后,可以对硬盘的剩余寿命进行进一步的精确化;
[0119] 例如:有一块硬盘在使用一年时监测到的硬盘健康指标值为8,那么通过计算可以
得出: 再通过上述平衡预测系数E计算出硬 盘精准剩余寿命=1*1.34 = 1.34年。
[0120] 需要说明的是上述的平衡预测系数E对于不同型号、品牌的硬盘可能是不同的,在 得到硬盘精准剩余寿命以后,设置使硬盘本身或者硬盘检测装置进行显示和提醒,提醒硬 盘使用者在剩余寿命被耗尽之前进行数据转存或备份,此处需要说明的是应当在硬盘处于 亚健康或者健康状态时进行硬盘剩余寿命的计算,在硬盘处于危险状态时,其剩余寿命可 以被判断是〇。
[0121] 进一步需要说明的是,此处仅是通过举例进行对本发明的设计思路的说明,具体 实现时并不局限于上述举例中的一种实现方式。
[0122] 如图3所示的实施例,本实施例中提供了一种基于SMART的预测硬盘亚健康指标的 装置,包括:
[0123] 监测模块210,用于监测硬盘的自我监测分析与报告技术SMART参数,所述SMART参 数包括:重分配扇区参数、当前待映射扇区参数、错误无法恢复参数和指令超时参数;
[0124] 判断模块220,用于根据所述SMART参数中各项参数的监测值判断所述硬盘是否出 现状态异常;
[0125] 健康指标值调整模块230,用于根据所述SMART参数中各项参数的监测值调整所述 硬盘的健康指标值;
[0126] 健康状态确定模块240,用于根据当前所述硬盘的健康指标值确定所述硬盘当前 的健康状态。
[0127] 上述的判断模块220还用于当所述SMART参数的监测值存在以下情况中的至少一 项时,确定所述硬盘出现状态异常:
[0128] 所述重分配扇区计数参数的监测值非0;
[0129] 所述当前待映射扇区计数参数的监测值大于第一设定值;
[0130] 所述无法恢复的错误参数的监测值非0;
[0131]所述指令超时参数的监测值大于第二设定值。
[0132] 上述判断模块220还用于:当所述颗粒平均擦写参数的监测值小于第三设定值时, 确定所述硬盘出现状态异常。
[0133] 健康指标值调整模块230,包括:
[0134] 查找单元,用于根据所述SMART参数中各项参数的监测值查找预先设定的健康指 标值调整幅度列表,所述健康指标值调整幅度列表包括所述SMART参数中各项参数的监测 值所处区间对应的健康指标调整幅度值;
[0135] 第一计算单元,用于按照所述监测值查找到的健康指标调整幅度值计算调整所述 硬盘的健康指标值。
[0136] 健康状态确定模块240,包括:
[0137] 读取单元,用于读取所述硬盘的累计通电时间;
[0138] 第二计算单元,用于根据所述健康指标值计算得到硬盘的健康百分比;还用于基 于所述健康百分比和所述硬盘的累计通电时间初步计算得到硬盘的剩余寿命;
[0139] 第三计算单元,用于收集硬盘运维数据,形成硬盘运维知识库,在所述硬盘运维知 识库中获取所述累计通电时间和硬盘的亚健康指标数据,构建不同类型、品牌、型号硬盘的 平衡预测系数模型,根据所述平衡预测系数模型计算得到平衡预测系数,并通过所述平衡 预测系数对所述硬盘的剩余寿命作进一步的精确计算。
[0140] 所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置的 具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0141] 所述方法如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以 存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说 对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计 算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个 人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。 而前述的存储介质包括:U盘、移动硬盘、只读存储器(R0M,Read-0nly Memory)、随机存取存 储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0142] 最后应说明的是:以上所述实施例,仅为本发明的【具体实施方式】,用以说明本发明 的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发 明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员 在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻 易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使 相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护 范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
【主权项】
1. 一种基于SMART的预测硬盘亚健康指标的方法,其特征在于,包括: 监测硬盘的自我监测分析与报告技术SMART参数,所述SMART参数包括:重分配扇区参 数、当前待映射扇区参数、错误无法恢复参数和指令超时参数; 根据所述SMART参数中各项参数的监测值判断所述硬盘是否出现状态异常; 如果是,根据所述SMART参数中各项参数的监测值调整所述硬盘的健康指标值; 根据当前所述硬盘的健康指标值确定所述硬盘当前的健康状态。2. 根据权利要求1所述的方法,其特征在于,根据所述SMART参数中各项参数的监测值 判断所述硬盘是否出现状态异常包括: 当所述SMART参数的监测值存在以下情况中的至少一项时,确定所述硬盘出现状态异 常: 所述重分配扇区计数参数的监测值非O; 所述当前待映射扇区计数参数的监测值大于第一设定值; 所述无法恢复的错误参数的监测值非O; 所述指令超时参数的监测值大于第二设定值。3. 根据权利要求1所述的方法,其特征在于,所述SMART参数还包括:颗粒平均擦写参 数; 根据所述SMART参数中各项参数的监测值判断所述硬盘是否出现状态异常还包括:当 所述颗粒平均擦写参数的监测值小于第三设定值时,确定所述硬盘出现状态异常。4. 根据权利要求1所述的方法,其特征在于,根据所述SMART参数中各项参数的监测值 调整所述硬盘的健康指标值包括:根据所述SMART参数中各项参数的监测值查找预先设定 的健康指标值调整幅度列表,所述健康指标值调整幅度列表包括所述SMART参数中各项参 数的监测值所处区间对应的健康指标调整幅度值; 按照所述监测值查找到的健康指标调整幅度值计算调整所述硬盘的健康指标值。5. 根据权利要求1所述的方法,其特征在于,根据当前所述硬盘的健康指标值确定所述 硬盘当前的健康状态,还包括: 根据所述健康指标值计算得到硬盘的健康百分比; 读取所述硬盘的累计通电时间; 基于所述健康百分比和所述硬盘的累计通电时间初步计算得到硬盘的剩余寿命; 以及收集硬盘运维数据,形成硬盘运维知识库,在所述硬盘运维知识库中获取所述累 计通电时间和硬盘的亚健康指标数据,构建不同类型、品牌、型号硬盘的平衡预测系数模 型,根据所述平衡预测系数模型计算得到平衡预测系数,并通过所述平衡预测系数对所述 硬盘的剩余寿命作进一步的精确计算。6. -种基于SMART的预测硬盘亚健康指标的装置,其特征在于,包括: 监测模块,用于监测硬盘的自我监测分析与报告技术SMART参数,所述SMART参数包括: 重分配扇区参数、当前待映射扇区参数、错误无法恢复参数和指令超时参数; 判断模块,用于根据所述SMART参数中各项参数的监测值判断所述硬盘是否出现状态 异常; 健康指标值调整模块,用于根据所述SMART参数中各项参数的监测值调整所述硬盘的 健康指标值; 健康状态确定模块,用于根据当前所述硬盘的健康指标值确定所述硬盘当前的健康状 ??τ O7. 根据权利要求6所述的装置,其特征在于,所述判断模块还用于当所述SMART参数的 监测值存在以下情况中的至少一项时,确定所述硬盘出现状态异常: 所述重分配扇区计数参数的监测值非O; 所述当前待映射扇区计数参数的监测值大于第一设定值; 所述无法恢复的错误参数的监测值非O; 所述指令超时参数的监测值大于第二设定值。8. 根据权利要求6所述的装置,其特征在于,所述判断模块还用于:当所述颗粒平均擦 写参数的监测值小于第三设定值时,确定所述硬盘出现状态异常。9. 根据权利要求8所述的装置,其特征在于,所述健康指标值调整模块,包括: 查找单元,用于根据所述SMART参数中各项参数的监测值查找预先设定的健康指标值 调整幅度列表,所述健康指标值调整幅度列表包括所述SMART参数中各项参数的监测值所 处区间对应的健康指标调整幅度值; 第一计算单元,用于按照所述监测值查找到的健康指标调整幅度值计算调整所述硬盘 的健康指标值。10. 根据权利要求6所述的装置,其特征在于,所述健康状态确定模块,包括: 读取单元,用于读取所述硬盘的累计通电时间; 第二计算单元,用于根据所述健康指标值计算得到硬盘的健康百分比;还用于基于所 述健康百分比和所述硬盘的累计通电时间初步计算得到硬盘的剩余寿命; 第三计算单元,用于收集硬盘运维数据,形成硬盘运维知识库,在所述硬盘运维知识库 中获取所述累计通电时间和硬盘的亚健康指标数据,构建不同类型、品牌、型号硬盘的平衡 预测系数模型,根据所述平衡预测系数模型计算得到平衡预测系数,并通过所述平衡预测 系数对所述硬盘的剩余寿命作进一步的精确计算。
【文档编号】G06F11/34GK105893231SQ201610298338
【公开日】2016年8月24日
【申请日】2016年5月6日
【发明人】范光彬, 刘皙
【申请人】思创数码科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1