硬盘异常自动复位方法及其装置与流程

文档序号:12063494阅读:384来源:国知局
硬盘异常自动复位方法及其装置与流程

本发明属于硬盘性能检测领域,尤其涉及一种硬盘异常自动复位方法及其装置。



背景技术:

硬盘作为电脑主要的存储核心部件之一,其可靠性至关重要;但是目前的系统设计中,关于硬盘的关注度主要集中在软件方面,比如硬盘修改、raid、数据克隆等等,而对于硬盘本身的可靠性问题关注度不高。

据统计数字显示,在被存储厂家换下来的硬盘中,有60%的硬盘属于无异常、可使用的硬盘,只不过在系统因为一次的某种原因硬盘无响应夯住,使硬盘处于“假死”状态,导致系统误以为硬盘损坏而剔除硬盘,使硬盘被迫下线退回至存储厂家,但这时候硬盘其实是没有损坏的、可使用的,只要重新对硬盘进行一次插拔作业,硬盘又会重新上线;硬盘“假死”故障属于不定时现象,没有规则性,有时候一天出现一次,有时候长时间不出现一次,影响系统的正常运行,增加维修成本,因此,对于本技术领域成员而言,如何在系统运行过程中解决硬盘的假死故障为亟需解决的技术问题。



技术实现要素:

本发明提供一种硬盘异常自动复位方法及其装置,当硬盘无响应时,能够自动对硬盘进行复位,使得硬盘重新上线,及时在系统中恢复硬盘的使用,从而避免硬盘被误剔除。

为了实现上述目的,本发明采用以下的技术方案:

一种硬盘异常自动复位方法,包括以下步骤:

磁盘阵列系统检测到异常硬盘;

通过磁盘阵列柜的机箱管理体系定位出异常硬盘;

对异常硬盘进行复位;

验证复位后的硬盘。

优选地,磁盘阵列系统检测到异常硬盘,包括:磁盘阵列系统向硬盘读写数据时进行校验,当校验发生无响应或错误时,则判定该硬盘为异常硬盘。

优选地,对异常硬盘进行复位,包括:磁盘阵列柜的机箱管理体系发送信号至控制器,控制器控制逻辑线路断电,间隔预设时间后,再次恢复供电,并通过总线返回操作信号给计算机管理系统。

优选地,所述验证为对复位后的硬盘进行读写测试。

优选地,验证复位后的硬盘之后,还包括:复位后的硬盘通过验证测试,则上线;否则,下线。

一种硬盘异常自动复位装置,包括:

检测模块,用于检测异常硬盘;

触发模块,用于对异常硬盘进行定位;

复位模块,用于对异常硬盘进行复位;

验证模块,用于验证复位后的硬盘。

优选地,还包括:处理模块,用于处理验证后硬盘的上线或下线。

本发明的有益效果:

本发明在读写时的校验判定硬盘是否处于异常,若硬盘异常,继而通过触发、复位操作,复位之后再对复位后的硬盘进行验证,若验证成功,则判定硬盘为假死状态,在系统中对硬盘进行重新上线,实现对硬盘的自动复位,使硬盘以毫秒级时间重新上线,及时在系统中恢复硬盘的使用,而且不需要对硬盘进行插拔即可恢复硬盘,避免硬盘被误剔除,有效保证系统工作的稳定性,降低硬盘应用的风险,提高硬盘的使用寿命。

现有的技术是,硬盘因出现异常情况被夯住短时间无响应,导致系统误以为硬盘损坏而剔除硬盘,其实被剔除的硬盘可能是出于“假死”状态,导致硬盘被误判,继而进行下线处理,增加了硬盘的维护费用,本发明通过触发、复位和验证对于硬盘短时间无响应的问题进行甄别,来确定硬盘是否可以继续使用,防止硬盘被系统误判,可以有效的节省60%的硬盘维护费用。

附图说明

图1为本发明硬盘异常自动复位方法的流程示意图之一;

图2为本发明硬盘异常自动复位方法的流程示意图之二;

图3为本发明硬盘异常自动复位装置的结构示意图。

具体实施方式

为了便于理解,对本发明中出现的部分名词作以下解释说明:

磁盘阵列:英文全称为Redundant Arrays of Independent Disks,以下简称RAID,是由多个磁盘组合成一个磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。

SES管理体系:SES为SCSI Enclosure Service的简称,是T10技术委员会制定的用于机箱管理的标准,主要负责SSA/SCSI/SAS等技术、标准的开发和制定,硬盘阵列柜都设计了总线环路来获许各种状态数据和传输SES规范中的命令,在发送的时候把SES规范中的SCSI命令包裹到I2C总线中进行传递,之后传输到硬盘阵列柜的控制器中。

复杂可编程逻辑器件: 英文全称为Complex Programmable Logic Device,以下简称CPLD,是以乘积项结构方式构成逻辑行为的器件,由可编程逻辑宏单元(Macro Cell)围绕中心的可编程互连矩阵单元组成。

I2C总线:是一个双向的两线连续总线,提供集成电路(integrated circuit)之间的通信线路。

操作系统: 英文全称为Operating System,以下简称OS,是管理和控制计算机硬件与软件资源的计算机程序。

脚本:英文全称为script,是批处理文件的延伸,是一种纯文本保存的程序;脚本可以由应用程序临时调用并执行。

下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述:

实施例一

如图1所示,一种硬盘异常自动复位方法,包括以下步骤:

步骤S101:使用RAID作为本发明磁盘阵列系统,系统RAID读写数据时进行校验,当校验发生无响应或错误时,则判定该硬盘发生异常。

步骤S102:使用SES管理体系作为本发明的磁盘阵列柜的机箱管理体系,发现硬盘异常后,通过SES管理体系定位出异常硬盘。

步骤S103:使用CPLD作为本发明的控制器,SES管理体系通过管理总线将信号发送至CPLD,CPLD控制逻辑线路断电,间隔预设时间后,再次恢复供电,并通过管理总线返回操作信号给SES管理体系。

上述管理总线为I2C总线。

作为一种可实施方式,间隔预设时间为毫秒级时间,毫秒级时间可以设置为10ms。

步骤S104:SES管理体系触发OS下脚本程序,完成读写测试。

步骤S105:通过读写测试的硬盘,则上线,转步骤S101。

步骤S106:不通过读写测试的硬盘,则下线。

实施例二

如图2所示,一种硬盘异常自动复位方法,包括以下步骤:

步骤S201:磁盘阵列系统检测到异常硬盘。

步骤S202:通过磁盘阵列柜的机箱管理体系定位出异常硬盘。

步骤S203:对异常硬盘进行复位。

步骤S204:验证复位后的硬盘。

实施例三

如图3所示,一种硬盘异常自动复位装置,包括检测模块301、触发模块302、复位模块303、验证模块304和处理模块305,所述检测模块301依次顺序连接触发模块302、复位模块303、验证模块304和处理模块305。

检测模块301,用于检测异常硬盘;触发模块302,用于对异常硬盘进行定位;复位模块303,用于对异常硬盘进行复位;验证模块304,用于验证复位后的硬盘;处理模块305,用于处理验证后硬盘的上线或下线。

以上所示仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1