一种实时监控硬盘在线状态的方法及装置与流程

文档序号:14426617阅读:389来源:国知局

本发明涉及服务器测试领域,具体的说是一种实时监控硬盘在线状态的方法及装置。



背景技术:

随着服务器行业的快速发展,越来越多的客户开始偏向于购买大批量的服务器作为自己的核心应用。所以除了对服务器的稳定性、可靠性也提出了更高的要求。而服务器能否保持正常的运转,已经成为了客户应用能否稳定运行的前提。

在客户端时,常出现掉盘的现象,导致服务器出现问题,不仅给客户造成巨大的损失,也会影响客户的用户体验。因此如何在研发测试早期发现硬盘的潜在问题,并分析与解决,会有效降低浪潮服务器的硬盘故障率,提高服务器产品的品质。

服务器测试过程中的rv测试,主要目的是验证服务器在不同风扇转速下硬盘是否能保证高质量读写,测试条件为分别在10%、30%、50%、70%、100%风扇转速下,分别对硬盘进行读写测试,并读取硬盘iops值。在之前rv测试中,只是依据硬盘iops值来判断服务器是否通过测试,对于硬盘的其它参数及状态,则缺少相应的监测。



技术实现要素:

为了解决上述问题,提供了一种实时监控硬盘在线状态的方法及装置,在rv测试中可以实时读取硬盘信息,实现硬盘状态的实时监控,有效降低硬盘故障率。

本发明实施例提供了一种实时监控硬盘在线状态的方法,所述的方法包括:

s1:在服务器系统下,利用硬盘在线状态抓取工具读取硬盘标准信息;

s2:运行硬盘读写测试软件,执行rv测试;

s3:利用硬盘在线状态抓取工具获取实时硬盘信息并与步骤s1中的硬盘标准信息比对。

进一步的,所述的方法还包括:

s4:记录与硬盘标准信息不一致的硬盘信息并形成测试文件。

进一步的,步骤s1的具体实现过程为:

s11:将硬盘在线状态抓取工具复制到服务器系统下;

s12:读取服务器系统下硬盘的盘符;

s13:运行硬盘在线状态抓取工具读取硬盘信息;

s14:解析读取的硬盘信息并保存为硬盘标准信息。

进一步的,所述的硬盘标准信息包括硬盘电压值、硬盘温度值、硬盘内部rv振动值。

进一步的,所述的硬盘在线状态抓取工具为nspur_cdf。

进一步的,所述的硬盘读写测试软件为iometer软件。

本发明实施例还提供了一种实时监控硬盘在线状态的装置,所述的装置包括:

硬盘读写测试单元,用于执行rv测试;

硬盘信息采集单元,用于在执行rv测试之前读取硬盘标准信息,并在rv测试执行过程中实时读取硬盘信息;

信息比对单元,用于比对硬盘标准信息和实时读取的硬盘信息。

进一步的,所述的装置还包括:

记录单元,用于将比对结果不一致的信息形成文件并保存到服务器系统下。

发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:

1、在rv测试中可以实时读取硬盘内部rv振动值、硬盘电压和硬盘温度值,来综合判断硬盘的状态,发现硬盘的潜在问题,可以有效的降低硬盘故障率。

2、记录与硬盘标准信息不一致的硬盘信息并形成测试文件,可以提供详细的实时状态数据,便于后续分析和设计。

附图说明

图1是本发明实施例1的方法流程图;

图2是本发明实施例1的装置原理图;

图3是本发明实施例2的方法流程图;

图4是本发明实施例2的装置原理图。

具体实施方式

为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。

实施例1

如图1所示,本发明实施例1提供了一种实时监控硬盘在线状态的方法,所述的方法包括:

s1:在服务器系统下,利用硬盘在线状态抓取工具读取硬盘标准信息。

步骤s1的具体实现过程为:

s11:将硬盘在线状态抓取工具复制到服务器系统下,其中,硬盘在线状态抓取工具选用inspur_cdf。

s12:使用命令lsscsi来读取服务器系统下硬盘的盘符。

s13:运行硬盘在线状态抓取工具读取硬盘信息,读取的硬盘信息包括:

1)硬盘电压值,如smart_minimum_5v等;

2)硬盘温度值,如smart_minimumtemperature等;

3)硬盘内部rv振动值:smart_rv_absolute_mean。

硬盘的内部rv振动值、硬盘电压和硬盘温度值都是造成硬盘故障的关键指标,通过在测试中监控这些参数,有助于分析硬盘的失效问题。

s14:解析读取的硬盘信息并保存为硬盘标准信息。在解析过程中,除了硬盘的内部rv振动值、硬盘电压和硬盘温度值等用于判断硬盘状态的信息,还包括一些其它信息,可以采集到的信息类型如下:

1)serialnumber:硬盘序列号;

2)modelnumber:硬盘型号编号;

3)firmware_rev:固件版本;

4)interface_type:接口类型(分sas和sata);

5)power_on_hours:硬盘已经运行时间;

6)smart_minimum_5v/12v:硬盘5v/12v电压读取的最小值;

7)smart_rv_absolute_mean:硬盘内部rv振动值;

8)smart_minimumtemperature:硬盘温度值。

s2:在主机windows下运行iometer软件来进行rv测试,rv测试的原理为:分别在10%、30%、50%、70%、100%风扇转速下,分别对硬盘进行读写测试,并读取硬盘iops值。

s3:利用硬盘在线状态抓取工具获取实时硬盘信息并与步骤s1中的硬盘标准信息比对。主要是通过运行inspur_cdf工具,来实时读取硬盘信息,包括硬盘电压,硬盘温度,硬盘内部rv振动值,来判断硬盘状态是否ok,将有问题的硬盘及时定位并分析。

如图2所示,本发明实施例还提供了一种实时监控硬盘在线状态的装置,所述的装置包括:硬盘读写测试单元,用于执行rv测试;硬盘信息采集单元,用于在执行rv测试之前读取硬盘标准信息,并在rv测试执行过程中实时读取硬盘信息;信息比对单元,用于比对硬盘标准信息和实时读取的硬盘信息。

实施例2

如图3所示,本发明实施例2提供了一种实时监控硬盘在线状态的方法,所述的方法包括:

s1:在服务器系统下,利用硬盘在线状态抓取工具读取硬盘标准信息。

步骤s1的具体实现过程为:

s11:将硬盘在线状态抓取工具复制到服务器系统下,其中,硬盘在线状态抓取工具选用inspur_cdf。

s12:使用命令lsscsi来读取服务器系统下硬盘的盘符。

s13:运行硬盘在线状态抓取工具读取硬盘信息,读取的硬盘信息包括:

1)硬盘电压值,如smart_minimum_5v等;

2)硬盘温度值,如smart_minimumtemperature等;

3)硬盘内部rv振动值:smart_rv_absolute_mean。

硬盘的内部rv振动值、硬盘电压和硬盘温度值都是造成硬盘故障的关键指标,通过在测试中监控这些参数,有助于分析硬盘的失效问题。

s14:解析读取的硬盘信息并保存为硬盘标准信息。在解析过程中,除了硬盘的内部rv振动值、硬盘电压和硬盘温度值等用于判断硬盘状态的信息,还包括一些其它信息,可以采集到的信息类型如下:

1)serialnumber:硬盘序列号;

2)modelnumber:硬盘型号编号;

3)firmware_rev:固件版本;

4)interface_type:接口类型(分sas和sata);

5)power_on_hours:硬盘已经运行时间;

6)smart_minimum_5v/12v:硬盘5v/12v电压读取的最小值;

7)smart_rv_absolute_mean:硬盘内部rv振动值;

8)smart_minimumtemperature:硬盘温度值。

s2:在主机windows下运行iometer软件来进行rv测试,rv测试的原理为:分别在10%、30%、50%、70%、100%风扇转速下,分别对硬盘进行读写测试,并读取硬盘iops值。

s3:利用硬盘在线状态抓取工具获取实时硬盘信息并与步骤s1中的硬盘标准信息比对。主要是通过运行inspur_cdf工具,来实时读取硬盘信息,包括硬盘电压,硬盘温度,硬盘内部rv振动值,来判断硬盘状态是否ok,将有问题的硬盘及时定位并分析。

s4:记录与硬盘标准信息不一致的硬盘信息并形成测试文件。该过程通过比对数据,确定名称一致但是数据不一致的硬盘信息,并形成记录的系统文档,比如log文档。

如图4所示,本发明实施例还提供了一种实时监控硬盘在线状态的装置,所述的装置包括:硬盘读写测试单元,用于执行rv测试;硬盘信息采集单元,用于在执行rv测试之前读取硬盘标准信息,并在rv测试执行过程中实时读取硬盘信息;信息比对单元,用于比对硬盘标准信息和实时读取的硬盘信息;记录单元,用于将比对结果不一致的信息形成文件并保存到服务器系统下。

尽管说明书及附图和实施例对本发明创造已进行了详细的说明,但是,本领域技术人员应当理解,仍然可以对本发明创造进行修改或者等同替换;而一切不脱离本发明创造的精神和范围的技术方案及其改进,其均涵盖在本发明创造专利的保护范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1