一种磁盘告警方法、系统及电子设备和存储介质与流程

文档序号:18188724发布日期:2019-07-17 05:29阅读:234来源:国知局
一种磁盘告警方法、系统及电子设备和存储介质与流程

本申请涉及计算机技术领域,更具体地说,涉及一种磁盘告警方法、系统及一种电子设备和一种计算机可读存储介质。



背景技术:

随着云计算和大数据的崛起,每天产生的数据量呈指数级增长,并且这些数据越发的与人们的生活息息相关,数据安全也就显的格外的重要了。由于分布式存储集群的特殊构成,磁盘的损坏可能会造成数据的跨节点迁移,这样势必会占用正常业务的网络带宽,对正常的存储业务造成影响,甚至可能造成用户数据的丢失。

因此,如何对磁盘的损坏进行预测和告警,降低磁盘损坏对存储集群的影响是本领域技术人员需要解决的技术问题。



技术实现要素:

本申请的目的在于提供一种磁盘告警方法、系统及一种电子设备和一种计算机可读存储介质,对磁盘的损坏进行预测和告警,降低磁盘损坏对存储集群的影响。

为实现上述目的,本申请提供了一种磁盘告警方法,包括:

获取当前待映射扇区、重新映射扇区和气流温度,并判断所述重新映射扇区是否超过第一预设值;

若是,则上报严重级别的磁盘损坏告警;若否,则判断所述重新映射扇区是否超过所述第一预设值的第一比值;

若超过,则根据所述当前待映射扇区的当前值和上一周期值确定第一告警标志位,当所述第一告警标志位为1时,上报告警级别的磁盘即将损坏告警;

根据所述气流温度和第二预设值确定第二告警标志位,当所述第二告警标志位为1时,上报用户告警类型的磁盘温度过高告警。

其中,所述第一比值为80%。

其中,根据所述当前待映射扇区的当前值和上一周期值确定第一告警标志位,包括:

判断所述当前待映射扇区的当前值是否大于上一周期值;

若是,则将所述第一告警标志位置1;若否,则将所述第一告警标志位置0。

其中,当所述第一告警标志位为1时,上报告警级别的磁盘即将损坏告警,包括:

当预设数量个周期后所述第一告警标志位为1时,上报告警级别的磁盘即将损坏告警。

其中,根据所述气流温度和第二预设值确定第二告警标志位,包括:

判断所述气流温度是否大于或等于所述第二预设值;

若是,则将所述第二告警标志位置1;

若否,则判断所述气流温度是否小于所述第二预设值的第二比值;若小于,则将所述第二告警标志位置0。

其中,当所述第二告警标志位为1时,上报用户告警类型的磁盘温度过高告警,包括:

当预设数量个周期后所述第二告警标志位为1时,上报用户告警类型的磁盘温度过高告警。

其中,所述第二比值为90%。

为实现上述目的,本申请提供了一种磁盘告警系统,包括:

第一判断模块,用于获取当前待映射扇区、重新映射扇区和气流温度,并判断所述重新映射扇区是否超过第一预设值;若是,则启动第一上报模块的工作流程;若否,则启动第二判断模块的工作流程;

所述第一上报模块,用于上报严重级别的磁盘损坏告警;

所述第二判断模块,用于判断所述重新映射扇区是否超过所述第一预设值的第一比值;若是,则启动第二上报模块的工作流程;若否,则启动第三上报模块的工作流程;

所述第二上报模块,用于根据所述当前待映射扇区的当前值和上一周期值确定第一告警标志位,当所述第一告警标志位为1时,上报告警级别的磁盘即将损坏告警;

所述第三上报模块,用于根据所述气流温度和第二预设值确定第二告警标志位,当所述第二告警标志位为1时,上报用户告警类型的磁盘温度过高告警。

为实现上述目的,本申请提供了一种电子设备,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如上述磁盘告警方法的步骤。

为实现上述目的,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述磁盘告警方法的步骤。

通过以上方案可知,本申请提供的一种磁盘告警方法,包括:获取当前待映射扇区、重新映射扇区和气流温度,并判断所述重新映射扇区是否超过第一预设值;若是,则上报严重级别的磁盘损坏告警;若否,则判断所述重新映射扇区是否超过所述第一预设值的第一比值;若超过,则根据所述当前待映射扇区的当前值和上一周期值确定第一告警标志位,当所述第一告警标志位为1时,上报告警级别的磁盘即将损坏告警;根据所述气流温度和第二预设值确定第二告警标志位,当所述第二告警标志位为1时,上报用户告警类型的磁盘温度过高告警。

本申请提供的磁盘告警方法,从映射扇区和气流温度两个方面监控磁盘,当满足不同的条件时,上报不同级别的告警,实现了对磁盘的损坏进行预测和告警,帮助用户预测磁盘的健康状态,提早进行相应的预防措施,以达到避免数据丢失,影响正常存储业务的目的。本申请还公开了一种磁盘告警系统及一种电子设备和一种计算机可读存储介质,同样能实现上述技术效果。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:

图1为根据一示例性实施例示出的一种磁盘告警方法的流程图;

图2为根据一示例性实施例示出的另一种磁盘告警方法的流程图;

图3为根据一示例性实施例示出的一种磁盘告警系统的结构图;

图4为根据一示例性实施例示出的一种电子设备的结构图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请实施例公开了一种磁盘告警方法,对磁盘的损坏进行预测和告警,降低磁盘损坏对存储集群的影响。

参见图1,根据一示例性实施例示出的一种磁盘告警方法的流程图,如图1所示,包括:

s101:获取当前待映射扇区、重新映射扇区和气流温度,并判断所述重新映射扇区是否超过第一预设值;若是,则进入s102:若否,则进入s103;

本实施例提供的磁盘告警方法可应用于分布式存储集群,在集群内的每个节点,启动一个进程,该进程使用smartctl工具周期对本节点各个磁盘的健康状态的检测以及告警上报,该周期是可配置参数,可跟据当前集群的资源占用情况来决定检测周期,以减小检测活动对集群正常业务的影响。在每个节点启动的进程中,根据当前节点的磁盘个数n,启动n个线程并发的进行磁盘健康状态的监控,由进程统一进行告警上报。

在本步骤中,首先获取当前待映射扇区、重新映射扇区和气流温度,判断所述重新映射扇区是否超过第一预设值,若是,则进入s102:若否,则进入s103,该第一预设值为磁盘出厂时进行设置,在此不进行具体限定。

s102:上报严重级别的磁盘损坏告,并进入s105;

在具体实施中,当重新映射扇区超过出厂时设置的第一预设值时,说明磁盘已损坏,立即上报严重级别的磁盘损坏告警,提示用户立即更换磁盘,防止数据丢失。

s103:判断所述重新映射扇区是否超过所述第一预设值的第一比值;若是,则进入s104:若否,则进入s105;

在本步骤中,当重新映射扇区没有超过出厂时设置的第一预设值时,重新检查该重新映射扇区是否超过第一预设值的第一比值,例如80%,即当重新映射扇区超过所述第一预设值的80%时进入s104,否则进入s105。

s104:根据所述当前待映射扇区的当前值和上一周期值确定第一告警标志位,当所述第一告警标志位为1时,上报告警级别的磁盘即将损坏告警;

在本步骤中,根据当前待映射扇区的当前值和上一周期值确定第一告警标志位,该第一告警标志位为磁盘坏块预告警的标志位。优选的,根据所述当前待映射扇区的当前值和上一周期值确定第一告警标志位的步骤可以包括:判断所述当前待映射扇区的当前值是否大于上一周期值;若是,则将所述第一告警标志位置1;若否,则将所述第一告警标志位置0。

确定第一告警标志位后,当该第一告警标志位为1时,上报告警级别的磁盘即将损坏告警,提示用户该磁盘可能要发生损坏,需要用户持续关注。

s105:根据所述气流温度和第二预设值确定第二告警标志位,当所述第二告警标志位为1时,上报用户告警类型的磁盘温度过高告警。

在本步骤中,根据气流温度和第二预设值确定第二告警标志位,该第二告警标志位为磁盘温度过高的告警标志位。优选的,根据所述气流温度和第二预设值确定第二告警标志位的步骤可以包括:判断所述气流温度是否大于或等于所述第二预设值;若是,则将所述第二告警标志位置1;若否,则判断所述气流温度是否小于所述第二预设值的第二比值;若小于,则将所述第二告警标志位置0。

确定第二告警标志位后,当该第二告警标志位为1时,上报用户告警类型的磁盘温度过高告警,提示用户硬盘工作温度过高,请检查设备工作环境以及散热情况。

本申请实施例提供的磁盘告警方法,从映射扇区和气流温度两个方面监控磁盘,当满足不同的条件时,上报不同级别的告警,实现了对磁盘的损坏进行预测和告警,帮助用户预测磁盘的健康状态,提早进行相应的预防措施,以达到避免数据丢失,影响正常存储业务的目的。

本申请实施例公开了一种磁盘告警方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:

参见图2,根据一示例性实施例示出的另一种磁盘告警方法的流程图,如图2所示,包括:

s201:获取当前待映射扇区、重新映射扇区和气流温度,并判断所述重新映射扇区是否超过第一预设值;若是,则进入s202:若否,则进入s203;

s202:上报严重级别的磁盘损坏告警,并进入s206;

s203:判断所述重新映射扇区是否超过所述第一预设值的第一比值;若是,则进入s204:若否,则进入s206;

s204:判断所述当前待映射扇区的当前值是否大于上一周期值;若是,则将所述第一告警标志位置1;若否,则将所述第一告警标志位置0。

s205:当预设数量个周期后所述第一告警标志位为1时,上报告警级别的磁盘即将损坏告警。

在本实施例中,为防止当前待映射扇区的抖动,导致第一告警标志位频繁的变化,需在预设数量个周期后该第一告警标志位仍为1时,才上报告警级别的磁盘即将损坏告警,此处的预设数量例如5,本领域技术人员可以根据实际情况灵活设置,在此不进行具体限定。

s206:判断所述气流温度是否大于或等于所述第二预设值;若是,则将所述第二告警标志位置1;若否,则判断所述气流温度是否小于所述第二预设值的第二比值;若小于,则将所述第二告警标志位置0。

s207:当预设数量个周期后所述第二告警标志位为1时,上报用户告警类型的磁盘温度过高告警。

由于温度可能存在在门限值附近上下波动,所以为了防止告警的准确和时效,在本实施例中,在判断气流温度大于或等于第二预设值时立即上报,但是在进行告警清除时,需要气流温度回落到第二预设值的第二比值一下,再进行告警清除,且在预设数量个周期后第二告警标志位仍为1时,才上报用户告警类型的磁盘温度过高告警。

下面介绍本申请提供的磁盘告警方法的应用实施例,具体可以包括以下步骤:

步骤一:通过smartctl工具获取并记录该磁盘的当前待映射扇区计数、气流温度、重新映射扇区计数的参数值。

步骤二:分析参数重新映射扇区计数,判断查询所得值,是否超过了厂商给定的门限;如果超过了,则立即上报严重级别的磁盘坏块告警,提示用户立即更换磁盘,防止数据丢失;如果没有超过,则检查重新映射扇区计数的值,是否已达到该门限的80%,如果没有则进行步骤三,如果超过了则比较当前待映射扇区计数的当前值current和上次查出来的值old,如果current>old,将磁盘坏块预告警标志位置为1,如果current<=old,则将磁盘坏块预告警标志清除,如果连续五个检测周期磁盘坏块预告警标志位都是1,则上报警告级别的磁盘即将损坏告警。

步骤三:完成步骤二的检查流程后,检查参数气流温度,如果该参数的数值t大于等于门限值,则将磁盘温度过高的告警标志位置为1,如果该参数值小于门限值的90%,则清除告警标志位,如果连续五个检测周期,该标志位仍为1,则上报用户警告类型的磁盘温度过高告警。

下面对本申请实施例提供的一种磁盘告警系统进行介绍,下文描述的一种磁盘告警系统与上文描述的一种磁盘告警方法可以相互参照。

参见图3,根据一示例性实施例示出的一种磁盘告警系统的结构图,如图3所示,包括:

第一判断模块301,用于获取当前待映射扇区、重新映射扇区和气流温度,并判断所述重新映射扇区是否超过第一预设值;若是,则启动第一上报模块302的工作流程;若否,则启动第二判断模块303的工作流程;

所述第一上报模块302,用于上报严重级别的磁盘损坏告警;

所述第二判断模块303,用于判断所述重新映射扇区是否超过所述第一预设值的第一比值;若是,则启动第二上报模块304的工作流程;若否,则启动第三上报模块305的工作流程;

所述第二上报模块304,用于根据所述当前待映射扇区的当前值和上一周期值确定第一告警标志位,当所述第一告警标志位为1时,上报告警级别的磁盘即将损坏告警;

所述第三上报模块305,用于根据所述气流温度和第二预设值确定第二告警标志位,当所述第二告警标志位为1时,上报用户告警类型的磁盘温度过高告警。

本申请实施例提供的磁盘告警系统,从映射扇区和气流温度两个方面监控磁盘,当满足不同的条件时,上报不同级别的告警,实现了对磁盘的损坏进行预测和告警,帮助用户预测磁盘的健康状态,提早进行相应的预防措施,以达到避免数据丢失,影响正常存储业务的目的。

在上述实施例的基础上,作为一种优选实施方式,所述第一比值为80%。

在上述实施例的基础上,作为一种优选实施方式,所述第二上报模块304包括:

第一判断单元,用于判断所述当前待映射扇区的当前值是否大于上一周期值;若是,则将所述第一告警标志位置1;若否,则将所述第一告警标志位置0;

第一上报单元,用于当所述第一告警标志位为1时,上报告警级别的磁盘即将损坏告警。

在上述实施例的基础上,作为一种优选实施方式,所述第一上报单元具体为当预设数量个周期后所述第一告警标志位为1时,上报告警级别的磁盘即将损坏告警的单元。

在上述实施例的基础上,作为一种优选实施方式,所述第三上报模块305包括:

第二判断单元,用于判断所述气流温度是否大于或等于所述第二预设值;若是,则将所述第二告警标志位置1;若否,则启动第三判断单元的工作流程;

第三判断单元,用于判断所述气流温度是否小于所述第二预设值的第二比值;若小于,则将所述第二告警标志位置0;

第二上报单元,用于当所述第二告警标志位为1时,上报用户告警类型的磁盘温度过高告警。

在上述实施例的基础上,作为一种优选实施方式,所述第二上报单元具体当预设数量个周期后所述第二告警标志位为1时,上报用户告警类型的磁盘温度过高告警的单元。

在上述实施例的基础上,作为一种优选实施方式,所述第二比值为90%。

关于上述实施例中的系统,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

本申请还提供了一种电子设备,参见图4,本申请实施例提供的一种电子设备400的结构图,如图4所示,可以包括处理器11和存储器12。该电子设备400还可以包括多媒体组件13,输入/输出(i/o)接口14,以及通信组件15中的一者或多者。

其中,处理器11用于控制该电子设备400的整体操作,以完成上述的磁盘告警方法中的全部或部分步骤。存储器12用于存储各种类型的数据以支持在该电子设备400的操作,这些数据例如可以包括用于在该电子设备400上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器12可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(staticrandomaccessmemory,简称sram),电可擦除可编程只读存储器(electricallyerasableprogrammableread-onlymemory,简称eeprom),可擦除可编程只读存储器(erasableprogrammableread-onlymemory,简称eprom),可编程只读存储器(programmableread-onlymemory,简称prom),只读存储器(read-onlymemory,简称rom),磁存储器,快闪存储器,磁盘或光盘。多媒体组件13可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器12或通过通信组件15发送。音频组件还包括至少一个扬声器,用于输出音频信号。i/o接口14为处理器11和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件15用于该电子设备400与其他设备之间进行有线或无线通信。无线通信,例如wi-fi,蓝牙,近场通信(nearfieldcommunication,简称nfc),2g、3g或4g,或它们中的一种或几种的组合,因此相应的该通信组件15可以包括:wi-fi模块,蓝牙模块,nfc模块。

在一示例性实施例中,电子设备400可以被一个或多个应用专用集成电路(applicationspecificintegratedcircuit,简称asic)、数字信号处理器(digitalsignalprocessor,简称dsp)、数字信号处理设备(digitalsignalprocessingdevice,简称dspd)、可编程逻辑器件(programmablelogicdevice,简称pld)、现场可编程门阵列(fieldprogrammablegatearray,简称fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的磁盘告警方法。

在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述磁盘告警方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器12,上述程序指令可由电子设备400的处理器11执行以完成上述的磁盘告警方法。

说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1