硬盘装置损坏监测方法及系统的制作方法

文档序号:6757964阅读:154来源:国知局
专利名称:硬盘装置损坏监测方法及系统的制作方法
技术领域
本发明涉及一种服务器系统设备异常状态的监测方法及系统,特别是关于一种硬盘装置的损坏状态监测方法及系统。
背景技术
硬盘是计算机系统中最主要的存储设备,作为计算机用户的资料和信息的载体,硬盘上往往保存有大量重要资料。在一般的服务器中,由于服务器长时间不间断地运行,以及来自网络的巨大的数据访问量,服务器硬盘几乎是24小时不停地运转,承受着巨大的工作量,造成硬盘运行中发生不同程度的损坏。虽然大多数硬盘的平均无故障时间(MTBF)已达30000~50000小时以上,然而对于不少用户,特别是商业用户而言,一次普通的硬盘故障便足以造成灾难性后果。及时发现硬盘的异常是保持服务器稳定运行、保护数据安全的根本前提。人们早就意识到资料的宝贵性胜于硬盘自身价值,渴望有种技术能对硬盘故障进行预测并实现相对安全的数据保护。
针对上述问题,目前已提出了各种监测硬盘损坏的方法。已知的硬盘监测方法通常是利用系统访问而实现,其原理是对指定硬盘的寄存器或盘面扇区进行全面的读写,从而判断硬盘的状态。但是上述硬盘监测方法存在以下缺点1.在系统运行过程中进行全面的扇区读写测试会占用大量的系统资源,影响硬盘正常的数据存储;2.因有的坏硬盘系统完全不能识别,只能通过用户确定指定硬盘是否存在,这样则降低了监测的自动化程度。

发明内容
鉴于以上问题,本发明的主要目的在于提供一种硬盘损坏监测方法,不仅提高了硬盘的检测的效率,还可以实现监测的自动化,藉以避免出现已知技术所存在的缺点。
因此,为达上述目的,本发明提出了一种硬盘装置损坏监测方法,应用以执行于一服务器上,该伺服器具有可连接多个硬盘装置的一插槽装置,该方法包含下列步骤指示该插槽装置的硬盘状态;读取该硬盘状态判断该插槽装置上是否存在有硬盘装置;及对当前存在硬盘装置进行检测,对该当前存在的硬盘装置执行打开(open)操作,更包含下列步骤对该当前存在的硬盘装置发送输入/输出(IO)调用指令;读取并解析该当前存在的硬盘装置的自动检测分析及报告技术(S.M.A.R.T.)相关信息;及截获该服务器的一系统日志中的硬盘读写错误信息。
上述的硬盘装置损坏监测方法,还包括下列步骤在遍历该当前存在的硬盘装置之后,创建一“状态良好的硬盘列表”;及根据所述三种操作对该“状态良好的硬盘列表”进行修改,将存在至少一种损坏状态的当前存在硬盘装置从该“状态良好的硬盘列表”中删除。
上述的硬盘装置损坏监测方法,更包括记录该“状态良好的硬盘列表”所删除的当前硬盘装置的损坏状态信息至该系统日志的步骤。
上述的硬盘装置损坏监测方法,其中该损坏状态信息包括存在读写故障、S.M.A.R.T.功能报告的各项性能指针超标或者磁道损坏。
上述的硬盘装置损坏监测方法,还包括根据该检测步骤的一检测结果发出一报警信息的步骤。
本发明的另一个目的在于提供一种硬盘装置损坏监测系统,应用以执行于一服务器上,该伺服器具有可连接多个硬盘装置的一插槽装置,该系统包括一中断响应单元,设置连接于该插槽装置中,该中断响应单元包括一指示单元,系用以指示该插槽装置的硬盘状态;一处理模块,系用以根据读取该指示单元的内容判断该插槽装置上是否存在有硬盘装置;及一检测模块,用以对当前存在的硬盘装置进行检测,其中该检测模块首先对该当前存在的硬盘装置执行打开(open)操作,然后可选择执行以下三种操作1.对该当前存在的硬盘装置发送输入输出(IO)调用指令;2.读取并解析该当前存在的硬盘装置的自动检测分析及报告技术(S.M.A.R.T.)相关信息;及3.截获该服务器的一系统日志中的硬盘读写错误信息。
上述的硬盘装置损坏监测系统,其中该检测模块在遍历该当前存在的硬盘装置之后,创建一“状态良好的硬盘列表”,并根据所述三种操作对该“状态良好的硬盘列表”进行修改,将存在至少一种损坏状态的当前存在硬盘装置从该“状态良好的硬盘列表”中删除。
上述的硬盘装置损坏监测系统,其中该系统更包括一存储单元,系用以存储记录该“状态良好的硬盘列表”所删除的当前硬盘装置的损坏状态信息的一系统日志。
上述的硬盘装置损坏监测系统,其中该损坏状态信息包括存在读写故障、自动检测分析及报告技术(S.M.A.R.T.)功能报告的各项性能指针超标或者磁道损坏。
上述的硬盘装置损坏监测系统,其中该中断响应单元还包括一发光控制单元,系用以根据该检测模块的一检测结果控制发出一报警信息。
上述的硬盘装置损坏监测系统,其中该发光控制单元为一发光二极管(LED)输出控制寄存器。
上述的硬盘装置损坏监测系统,其中该指示单元为一读写寄存器。
上述的硬盘装置损坏监测系统,其中该中断响应单元为一GPIO芯片。
有关本发明的特征与实施方式,配合图示作详细说明如下。


图1为本发明的硬盘装置损坏监测方法中的部分步骤流程图;图2为本发明的硬盘装置损坏监测方法中的剩余部分步骤流程图;图3为本发明的硬盘装置损坏监测系统的架构图;图4为本发明的硬盘装置损坏监测系统的通用输入/输出芯片(GPIO)的引脚定义图;及图5为本发明的硬盘装置损坏监测系统的发光二极管(LED)的报警信息说明图。
其中,附图标记10 背板
12插槽装置14硬盘装置16检测模块18处理模块20中断响应单元22读写寄存器24发光控制单元26发光二极管(LED)30存储单元步骤101指示该插槽装置的硬盘状态步骤102读取该硬盘状态判断该插槽装置上是否存在有硬盘装置步骤103启动检测程序对当前插槽上存在的硬盘装置进行检测步骤104遍历系统可辨识的硬盘装置创建“状态良好的硬盘列表”步骤105对列表中的各个硬盘装置执行打开(open)操作步骤106对该当前存在的硬盘装置发送IO调用指令步骤107读取并解析当前存在硬盘装置的自动检测分析及报告技术(S.M.A.R.T.)相关信息步骤108截获服务器系统日志中的硬盘读写错误信息步骤109打开(open)操作失败时发出报警信息步骤110将存在至少一种损坏状态的当前存在硬盘装置从该“状态良好的硬盘列表”中删除步骤111记录该“状态良好的硬盘列表”所删除的当前硬盘装置的损坏状态信息至该系统日志步骤112询问是否已完成对所有的硬盘监测具体实施方式
如图1所示,该图为本发明的硬盘装置损坏监测方法中的部分步骤流程图。本发明的硬盘装置损坏监测方法可根据用户需要设定为开机自动运行,以设定的时间间隔调用该监测方法,或者用户选择手动启动该监测方法,从而实现对服务器的硬盘装置进行自动监测。不论以何种方式启动本发明的硬盘装置损坏监测方法,如图所示,首先是给出指示该插槽装置的硬盘状态的指示步骤(步骤101),透过读取硬盘存在状态寄存器(Disk Exist Status Register)判断插槽装置上是否存在有硬盘装置(步骤102)。如果插槽装置上不存在硬盘,则结束;否则,启动检测程序对当前插槽上存在的硬盘装置进行检测(步骤103)。在检测时,首先可以透过遍历系统可辨识的硬盘装置,创建“状态良好的硬盘列表”(步骤104)。该图中以符号A表示本发明的硬盘装置损坏监测方法的后续步骤。
如图2所示,该图为本发明的硬盘装置损坏监测方法中的剩余部分步骤流程图。图中符号A表示本发明的硬盘装置损坏监测方法的前述步骤。如图所示,对列表中的各个硬盘装置执行打开(open)操作(步骤105),如果打开(open)操作失败,则发出报警信息(步骤109),并将对应该操作的硬盘装置从“状态良好的硬盘装置列表”中删除(110)。在打开(open)操作成功后,选择执行以下三种操作执行设备I/O控制操作,对当前存在的硬盘装置发送IO调用指令(步骤106);或者读取当前存在硬盘装置的自动检测分析及报告技术(S.M.A.R.T.)相关信息并进行解析(步骤107);或者截获服务器系统日志中的硬盘读写错误信息(步骤108)。如果执行上述三种操作均发现当前硬盘装置无故障,则硬盘装置为良好状态;否则转到发出一报警信息(步骤109)。需要说明的是,上述三种操作的执行顺序是可选择的,并不局限于该附图所示的执行顺序。在步骤110中,根据所述三种操作对“状态良好的硬盘列表”进行修改,将存在至少一种损坏状态的当前存在硬盘装置从“状态良好的硬盘列表”中删除,然后记录“状态良好的硬盘列表”所删除的当前硬盘装置的损坏状态信息至系统日志(步骤111)。接着询问是否已完成对所有的硬盘监测(步骤112),如果还存在未监测的硬盘装置,则返回到步骤105,继续执行监测操作,直至完成对所有硬盘装置的监测。
如图3所示,该图为本发明的硬盘装置损坏监测系统的构架图。如图所示,本发明的硬盘装置损坏监测系统包括一中断响应单元20,例如通用输入/输出芯片(GPIO),置于背板10中,并与插槽装置12连接,通用输入/输出芯片(GPIO)包括一读写寄存器22,系用以指示插槽装置的硬盘状态当插槽装置12的一插槽上连接有硬盘装置14时,硬盘装置14上的插入指示管脚将通用输入/输出芯片(GPIO)上的读写寄存器22的响应位置位,没有连接时复位。下面结合图4对读写寄存器22工作原理进行说明。图4为本发明的硬盘装置损坏监测系统的通用输入/输出芯片(GPIO)的引脚定义图。这里选用的插槽装置的插槽个数为6个,通用输入/输出(GPIO)采用83601芯片,但应当了解本发明并不限于该实施例。其中HD#x Present表示插槽x当前硬盘装置存在(x1,2,......6),1表示存在;HD#x Fail表示插槽x当前硬盘存在且损坏(x1,2,......6),1表示损坏;(n/a)字符串表示没有功能定义;Index对应读写寄存器引脚索引号;R/W表示对影引脚寄存器为读/写状态。
本发明的硬盘装置损坏监测系统还包括处理模块18,系用以读取读写寄存器22的内容,从而判断插槽装置12上是否存在有硬盘装置14。当插槽装置12上连接有硬盘装置14时,HD#x Present为1,处理模块18从读写寄存器22读取该内容,并通知检测模块16。检测模块16将根据接收到信息以对当前存在的硬盘装置14进行检测,检测模块首先对当前存在的硬盘装置14执行打开(open)操作,然后可选择执行以下三种操作1.对该当前存在的硬盘装置发送输入/输出(IO)调用指令;2.读取并解析该当前存在的硬盘装置的自动检测分析及报告技术(S.M.A.R.T.)相关信息;或者3.截获该服务器的系统日志中的硬盘读写错误信息,从而执行对当前存在硬盘装置的监测。其中检测模块在遍历该当前存在的硬盘装置之后,将创建一“状态良好的硬盘列表”,并根据所述三种操作对“状态良好的硬盘列表”进行修改,将存在至少一种损坏状态的当前存在硬盘装置从“状态良好的硬盘列表”中删除。其中本发明的硬盘装置损坏监测系统更包括一存储单元30,系用以存储记录“状态良好的硬盘列表”所删除的当前硬盘装置的损坏状态信息的系统日志。其中损坏状态信息包括存在读写故障、自动检测分析及报告技术(S.M.A.R.T.)功能报告的各项性能指针超标或者磁道损坏,分别对应检测模块所执行的三种操作的检测结果。
此外,本发明的中断响应单元(通用输入/输出芯片(GPIO))20还包括一发光控制单元24,例如发光二极管(LED)输出控制寄存器,用以根据检测模块的检测结果控制发光二极管(LED)26发出一报警信息。其中检测模块16对一当前存在硬盘14完成检测操作后,将一检测结果发送给处理模块18,处理模块18则将该检测信息送入发光二极管(LED)输出控制寄存器24,从而驱动发光二极管(LED)26点灯。其中每块硬盘装置的报警信息可由两个发光二极管(LED)26指示(具体请参考图5)。
如图所示,图5为本发明的硬盘装置损坏监测系统的发光二极管(LED)的报警信息说明图。如图所示,发光二极管A 26a发出红色光,发光二极管B发出绿色光。当发光二极管A 26a为打开状态时,表示当前检测硬盘装置损坏;当发光二极管A为关闭状态且发光二极管B 26b为打开状态时表示当前检测硬盘装置为良好状态;当发光二极管B 26b为关闭状态时表示当前插槽中没有硬盘装置;当发光二极管B 26b为闪烁状态时表示正在访问硬盘。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
权利要求
1.一种硬盘装置损坏监测方法,应用以执行于一服务器上,该伺服器具有可连接多个硬盘装置的一插槽装置,其特征在于,该方法包含下列步骤指示该插槽装置的硬盘状态;读取该硬盘状态判断该插槽装置上是否存在有硬盘装置;及对当前存在硬盘装置进行检测,对该当前存在的硬盘装置执行打开操作,更包含下列步骤对该当前存在的硬盘装置发送输入/输出调用指令;读取并解析该当前存在的硬盘装置的自动检测分析及报告技术相关信息;及截获该服务器的一系统日志中的硬盘读写错误信息。
2.根据权利要求1所述的硬盘装置损坏监测方法,其特征在于,还包括下列步骤在遍历该当前存在的硬盘装置之后,创建一“状态良好的硬盘列表”;及根据所述三种操作对该“状态良好的硬盘列表”进行修改,将存在至少一种损坏状态的当前存在硬盘装置从该“状态良好的硬盘列表”中删除。
3.根据权利要求2所述的硬盘装置损坏监测方法,其特征在于,更包括记录该“状态良好的硬盘列表”所删除的当前硬盘装置的损坏状态信息至该系统日志的步骤。
4.根据权利要求3所述的硬盘装置损坏监测方法,其特征在于,该损坏状态信息包括存在读写故障、功能报告的各项性能指针超标或者磁道损坏。
5.根据权利要求1所述的硬盘装置损坏监测方法,其特征在于,还包括根据该检测步骤的一检测结果发出一报警信息的步骤。
6.一种硬盘装置损坏监测系统,应用以执行于一服务器上,该伺服器具有可连接多个硬盘装置的一插槽装置,其特征在于,该系统包括一中断响应单元,设置连接于该插槽装置中,该中断响应单元包括一指示单元,系用以指示该插槽装置的硬盘状态;一处理模块,系用以根据读取该指示单元的内容判断该插槽装置上是否存在有硬盘装置;及一检测模块,用以对当前存在的硬盘装置进行检测,其中该检测模块首先对该当前存在的硬盘装置执行打开操作,然后可选择执行以下三种操作(a)对该当前存在的硬盘装置发送输入输出调用指令;(b)读取并解析该当前存在的硬盘装置的自动检测分析及报告技术相关信息;及(c)截获该服务器的一系统日志中的硬盘读写错误信息。
7.根据权利要求6所述的硬盘装置损坏监测系统,其特征在于,该检测模块在遍历该当前存在的硬盘装置之后,创建一“状态良好的硬盘列表”,并根据所述三种操作对该“状态良好的硬盘列表”进行修改,将存在至少一种损坏状态的当前存在硬盘装置从该“状态良好的硬盘列表”中删除。
8.根据权利要求7所述的硬盘装置损坏监测系统,其特征在于,该系统更包括一存储单元,系用以存储记录该“状态良好的硬盘列表”所删除的当前硬盘装置的的损坏状态信息的一系统日志。
9.根据权利要求8所述的硬盘装置损坏监测系统,其特征在于,该损坏状态信息包括存在读写故障、自动检测分析及报告技术功能报告的各项性能指针超标或者磁道损坏。
10.根据权利要求6所述的硬盘装置损坏监测系统,其特征在于,该中断响应单元还包括一发光控制单元,系用以根据该检测模块的一检测结果控制发出一报警信息。
11.根据权利要求10所述的硬盘装置损坏监测系统,其特征在于,该发光控制单元为一发光二极管输出控制寄存器。
12.根据权利要求6所述的硬盘装置损坏监测系统,其特征在于,该指示单元为一读写寄存器。
13.根据权利要求6至12中任一项所述的硬盘装置损坏监测系统,其特征在于,该中断响应单元为一GPIO芯片。
全文摘要
本发明涉及一种硬盘装置损坏监测方法及系统,应用以执行于一伺服器上,伺服器具有可连接多个硬盘装置的插槽装置。本发明的硬盘装置损坏监测方法及系统不需对指定硬盘的寄存器或盘面扇区进行全面的读写,因此提高了硬盘检测的效率。而且透过结合硬体设备,并在检测到损坏硬盘之后及时给出报警资讯,更可以实现监测的自动化。此外,透过将关于硬盘损失状态的信息记录到系统日志中,从而可谓损坏硬盘的故障来源及后期维修提供参考资讯。
文档编号G11B20/18GK1896963SQ20051008275
公开日2007年1月17日 申请日期2005年7月11日 优先权日2005年7月11日
发明者王震, 刘杰, 陈玄同, 刘文涵 申请人:英业达股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1