硬盘故障处理方法、装置及分布式系统与流程

文档序号:20766894发布日期:2020-05-15 19:04阅读:140来源:国知局
硬盘故障处理方法、装置及分布式系统与流程

本发明涉及硬盘修复领域,具体而言,涉及一种硬盘故障处理方法、装置及分布式系统。



背景技术:

现有技术中在发现故障盘时,往往通过人工的方式删除或修复故障盘,存在操作步骤过多,替换繁琐的问题。

针对上述的问题,目前尚未提出有效的解决方案。



技术实现要素:

本发明实施例提供了一种硬盘故障处理方法、装置及分布式系统,以至少解决由于硬盘出现故障时,删除或修复故障盘造成的操作步骤过多,替换繁琐的的技术问题。

根据本发明实施例的一个方面,提供了一种硬盘故障处理方法,包括:在人机交互界面中展示分布式存储系统中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;在更换指令的触发下,展示存储节点上的可用硬盘列表;响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘。

可选地,接收用户输入的更换指令,包括:检测人机交互界面中指定控件的触发指令;在检测到触发指令时,基于触发指令生成更换指令。

可选地,展示存储节点上的可用硬盘列表,包括:获取存储节点中的备用硬盘标识,将备用硬盘标识对应的硬盘作为第一候选硬盘;获取存储节点中已用硬盘的负载状态,基于已用硬盘的负载状态确定第二候选硬盘;将第一候选硬盘和第二候选硬盘存储至可用硬盘列表,并展示可用硬盘列表。

可选地,使能目标硬盘,包括:将目标硬盘对应的指示信息发送至分布式存储系统中的计算节点,该指示信息用于指示目标硬盘已经被使能。

可选地,将目标硬盘对应的指示信息发送至分布式存储系统中的计算节点之后,方法还包括:计算节点向目标硬盘发送查询请求;并接收依据查询请求查询得到的目标硬盘的卷标信息;为卷标信息对应的磁盘分配路径配置信息。

可选地,路径配置信息包括:为每个卷标信息对应的磁盘分配至少两个访问路径。

可选地,目标硬盘对应的指示信息发送至分布式存储系统中的计算节点之后,方法还包括:计算节点确定目标硬盘的属性信息;计算节点确定计算节点基于属性信息调整计算节点的数据同步速率。

根据本发明实施例的另一方面,还提供了一种硬盘故障处理装置,包括:第一展示模块,用于在人机交互界面中展示分布式存储系统中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;接收模块,用于在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;第二展示模块,用于在更换指令的触发下,展示存储节点上的可用硬盘列表;使能模块,用于响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘。

根据本发明实施例的另一方面,还提供了一种分布式系统,其特征在于,包括:存储节点、计算节点和管理服务器,其中,存储节点用于存储数据;计算节点,用于从存储节点中调取数据;管理服务器,用于在人机交互界面中展示分布式存储系统中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;在更换指令的触发下,展示存储节点上的可用硬盘列表;响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘。

根据本发明实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行以上所述的硬盘故障处理方法。

在本发明实施例中,采用在人机交互界面中展示分布式存储系统中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;在更换指令的触发下,展示存储节点上的可用硬盘列表;响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘的方式,通过人工交互界面收发指令的方式,达到了更换故障盘的目的,从而实现了自动删除或修复故障盘的技术效果,进而解决了由于硬盘出现故障时,删除或修复故障盘造成的操作步骤过多,替换繁琐的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本申请实施例的一种硬盘故障处理方法的流程示意图;

图2是根据本申请实施例的一种硬盘故障处理装置的结构示意图;

图3是根据本申请实施例的一种分布式系统的框架示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本发明实施例,提供了一种硬盘故障处理方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的硬盘故障处理方法,如图1所示,该方法包括如下步骤:

步骤s102,在人机交互界面中展示分布式存储系统中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;

步骤s104,在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;

步骤s106,在更换指令的触发下,展示存储节点上的可用硬盘列表;

步骤s108,响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘。

上述的硬盘故障处理方法中,首先,在人机交互界面中展示分布式存储系统中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态,其次,在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘,然后,在更换指令的触发下,展示存储节点上的可用硬盘列表,最后,响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘。该处理方法通过人工交互界面收发指令的方式,达到了更换故障盘的目的,从而实现了自动删除或修复故障盘的技术效果,进而解决了由于硬盘出现故障时,删除或修复故障盘造成的操作步骤过多,替换繁琐的技术问题。

需要说明的是,人机交互界面中可以展示分布式存储系统每个节点中所有硬盘的状态,还可以展示硬盘标识和硬盘标识对应的硬盘状态。

为了更加方便地更换故障盘,使更换故障盘的操作更加简单,本申请的一些实施例中,可以提供一键切换的功能,例如:检测人机交互界面中指定控件的触发指令;在检测到触发指令时,基于触发指令生成更换指令。具体地,在检测到指定控件被首次触发时,生成更换指令;在检测到在预定时间段内(例如3s内)再次被点击时,则取消更换。

本申请一种可选的实施例中,展示存储节点上的可用硬盘列表,包括:获取存储节点中的备用硬盘标识,将备用硬盘标识对应的硬盘作为第一候选硬盘;获取存储节点中已用硬盘的负载状态,基于已用硬盘的负载状态确定第二候选硬盘;将第一候选硬盘和第二候选硬盘存储至可用硬盘列表,并展示可用硬盘列表。这两种类型的硬盘都可以用来替换存在故障的硬盘,更有利于用户进行多种选择,也充分利用了硬盘资源。

备用硬盘和基于负载状态确定的第二候选硬盘,都可以用来替换存在故障的硬盘,需要说明的是,在具体地应用中,两种候选硬盘可以结合使用,其中,备用硬盘为系统中预先设置的备份硬盘。

本申请的一些实施例中,使能目标硬盘,包括:将目标硬盘对应的指示信息发送至分布式存储系统中的计算节点,该指示信息用于指示目标硬盘已经被使能。

本申请一种可选的实施例中,目标硬盘对应的指示信息发送至分布式存储系统中的计算节点之后,计算节点向目标硬盘发送查询请求;并接收依据查询请求查询得到的目标硬盘的卷标信息;为卷标信息对应的磁盘分配路径配置信息。

本申请的一些实施例中,路径配置信息包括:为每个卷标信息对应的磁盘分配至少两个访问路径。

为了进一步保证在使用候选硬盘更换故障硬盘后,系统可以平稳、良好地运行,本申请的一种可选的实施例中,将目标硬盘对应的指示信息发送至分布式存储系统中的计算节点之后,计算节点确定目标硬盘的属性信息;计算节点确定计算节点基于属性信息调整计算节点的数据同步速率。

需要说明的是,目标硬盘的属性信息包括硬盘的存储容量、支持的访问速度等。

本申请的实施例中,还提供了一种硬盘故障处理装置,该处理装置可以执行本申请的故障处理方法,如图2所示,该硬盘故障处理装置包括:

第一展示模块20,用于在人机交互界面中展示分布式存储系统中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;

第一接收模块22,用于在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;

第二展示模块24,用于在更换指令的触发下,展示存储节点上的可用硬盘列表;

使能模块26,用于响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘。

上述的硬盘故障处理装置中,首先,第一展示模块用于在人机交互界面中展示分布式存储系统中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态,其次,第一接收模块用于在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘,然后,第二展示模块用于在更换指令的触发下,展示存储节点上的可用硬盘列表,最后,使能模块用于响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘。该处理装置通过人工交互界面收发指令的方式,达到了更换故障盘的目的,从而实现了自动删除或修复故障盘的技术效果,进而解决了由于硬盘出现故障时,删除或修复故障盘造成的操作步骤过多,替换繁琐的技术问题。

需要说明的是,人机交互界面中可以展示分布式存储系统每个节点中所有硬盘的状态,还可以展示硬盘标识和硬盘标识对应的硬盘状态。

为了更加方便地更换故障盘,使更换故障盘的操作更加简单,本申请的一些实施例中,第一接收模块包括检测子模块和生成子模块,检测子模块用于检测人机交互界面中指定控件的触发指令;生成子模块用于在检测到触发指令时,基于触发指令生成更换指令。具体地,在检测到指定控件被首次触发时,生成更换指令;在检测到在预定时间段内(例如3s内)再次被点击时,则取消更换。

本申请一种可选的实施例中,第二展示模块包括获取子模块、确定子模块和展示子模块,获取子模块用于获取存储节点中的备用硬盘标识,将备用硬盘标识对应的硬盘作为第一候选硬盘;确定子模块用于获取存储节点中已用硬盘的负载状态,基于已用硬盘的负载状态确定第二候选硬盘;展示子模块用于将第一候选硬盘和第二候选硬盘存储至可用硬盘列表,并展示可用硬盘列表。这两种类型的硬盘都可以用来替换存在故障的硬盘,更有利于用户进行多种选择,也充分利用了硬盘资源。

备用硬盘和基于负载状态确定的第二候选硬盘,都可以用来替换存在故障的硬盘,需要说明的是,在具体地应用中,两种候选硬盘可以结合使用,其中,备用硬盘为系统中预先设置的备份硬盘。

本申请的一些实施例中,使能模块包括发送子模块,发送子模块用于将目标硬盘对应的指示信息发送至分布式存储系统中的计算节点,该指示信息用于指示目标硬盘已经被使能。

本申请一种可选的实施例中,该装置还包括发送模块、第二接受模块、分配模块,发送子模块将目标硬盘对应的指示信息发送至分布式存储系统中的计算节点之后,发送模块用于计算节点向目标硬盘发送查询请求;第二接受模块用于接收依据查询请求查询得到的目标硬盘的卷标信息;分配模块用于为卷标信息对应的磁盘分配路径配置信息。

本申请的一些实施例中,路径配置信息包括:为每个卷标信息对应的磁盘分配至少两个访问路径。

为了进一步保证在使用候选硬盘更换故障硬盘后,系统可以平稳、良好地运行,本申请的一种可选的实施例中,该装置还包括确定模块和调整模块,发送子模块将目标硬盘对应的指示信息发送至分布式存储系统中的计算节点之后,确定模块用于计算节点确定目标硬盘的属性信息;调整模块用于计算节点确定计算节点基于属性信息调整计算节点的数据同步速率。

需要说明的是,目标硬盘的属性信息包括硬盘的存储容量、支持的访问速度等。

本申请的实施例中,还提供了一种分布式系统,如图3所示,该分布式系统包括:存储节点、计算节点和管理服务器。

存储节点30,用于存储数据;

计算节点32,用于从存储节点中调取数据;

管理服务器34,用于在人机交互界面中展示分布式存储系统中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;在更换指令的触发下,展示存储节点上的可用硬盘列表;响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘。

具体地,存储节点包括元数据存储模块(mds):元数据存储模块使用etcd分布式键值对存储系统,它用于存放服务器的配置信息。etcd是一个开源的、分布式的键值对数据存储系统,提供共享配置、服务的注册和发现。由多个节点相互通信构成整体对外服务,每个节点都存储节点完整的数据,包括软件相关和硬件相关数据。etcd数据存储系统通过raft协议保证每个节点维护的数据是一致的;数据上报模块(hms):数据上报模块的agent运行在每台需被采集数据的服务器上,它支持linux及windows等操作系统。数据上报模块接收硬件扫描模块发现的数据,并将数据存放在数据存储模块(mds)。数据上报模块只能看见自己提交的数据,无法看见其他节点的数据。hms采集的硬件数据包括硬盘的信息,如温度,寿命(ssd专属参数),坏块数量,预损坏信息。hms同时采集硬盘的性能数据,如iops,mbps,io延迟,磁盘负载。通过结合软硬件信息,可综合得出硬盘的状态,为一键换盘提供数据支撑。

具体地,计算节点包括自动化操作模块(aom):自动化操作模块运行在数据库一体机的计算节点,它用于主动发现存储节点替换后新分配的卷。当新的卷被替换后,处于计算节点的aom模块可以通过接口自动查询到存放在元数据存储模块(mds)里的卷的变更信息。当通过对比发现卷是新增的,aom模块自动对这些卷设置多路径配置文件,发现新的多路径设备;存储数据重平衡模块(drm):新盘更换后,存储自动化将新盘加入存储池,数据重新平衡至新增的盘。数据重新平衡可通过参数控制数据同步数据,既可加速同步进度,以保证数据安全,也可降低速度,减少数据同步对现有业务的负面影响。

具体地,管理服务器包括web操作模块(webm):通过web操作直接更换硬盘。当出现故障盘后,在web里会出现对于硬盘损坏的状态提示,同时在右侧出现换盘的按钮。维护人员点击一键换盘,根据向导,选择更换后的磁盘,后台自动进行相关操作。此操作整体简化了故障盘处理,降低了运维成本。

本申请的实施例中,还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行以上所述的硬盘故障处理方法。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1