一种存储节点管理系统及方法与流程

文档序号:15979147发布日期:2018-11-17 00:07阅读:128来源:国知局

本发明涉及存储系统领域,特别涉及一种存储节点管理系统及方法。

背景技术

随着大数据和云计算的迅速发展,单一的存储节点已经远远不能满足大数据的存储需求,多节点存储系统城大数据和云计算的重要存储设备,在多节点存储系统中对多个节点进行统一高效的管理成为存储系统的重要功能,多节点可以提高存储系统的冗余性,确保高性能的负载均衡,提高数据流量的并行性,提高存储系统的访问效率,多节点管理也继而成为存储系统必须实现的一大功能特色,在多节点管理中,节点的内部管理和同步策略是多节点管理的重要功能。

现有技术中,每个节点直接相互连接,节点之间同步信息需要占用节点自身的资源,致使节点的全部处理能力不能集中在存储处理上,降低了节点的存储工作效率。

因此,需要一种能够提高节点存储工作效率的方法。



技术实现要素:

有鉴于此,本发明的目的在于提供一种存储节点管理系统及方法,提高节点的存储工作效率,避免了节点的运算资源的浪费。其具体方案如下:

一种存储节点管理系统,包括存储多控中央控制器和多个节点,每个节点均包括基板管理控制器;每个节点内的基板管理控制器均分别与所述存储多控中央控制器相连;

所述存储多控中央控制器,用于从每个节点的内的基板管理控制器中获取每个节点的硬件信息。

可选的,每个节点均包括与基板管理控制器相连的控制器模块,每个节点内的控制器模块均分别与所述存储多控中央控制器相连;

所述存储多控中央控制器,用于从控制器模块中获取时钟信息;按照预设的时间间隔将目标时钟信息同步至每个控制器模块中;

控制器模块,用于从同一节点内的基板管理控制器中获取时钟信息;接收所述目标时钟信息,将所述目标时钟信息同步至基板管理控制器中。

可选的,所述存储多控中央控制器,包括:

故障判断模块,用于利用预设的状态条件和每个节点的硬件信息判断每个节点是否发生故障;

日志生成模块,用于当所述故障判断模块判定发生故障,则利用故障节点的硬件信息和时钟信息生成故障日志。

可选的,所述存储多控中央控制器,包括:

任务再分配模块,用于当所述故障判断模块判定发生故障,则断开与故障节点的连接,利用故障节点的状态信息中的任务信息,将故障节点的任务信息分配至满足预设的分配条件的节点中。

可选的,所述存储多控中央控制器,包括:

报警模块,用于当所述故障判断模块判定发生故障,则生成报警信息,利用所述报警信息控制报警器报警。

可选的,还包括分别与所述存储多控中央控制器和每个节点相连的备用存储多控中央控制器;

所述备用存储多控中央控制器,用于接收所述存储多控中央控制器发送的每个节点的硬件信息和状态信息;当所述存储多控中央控制器故障,代替所述存储多控中央控制器管理每个节点。

本发明还公开了一种存储节点管理方法,应用于存储多控中央控制器,包括:

直接从每个节点的内的基板管理控制器中获取每个节点的硬件信息。

可选的,还包括:

按照预设的时间间隔将目标时钟信息同步至每个控制器模块中,以令所述目标时钟信息作为同一时钟信息。

可选的,还包括:

按照预设的时间间隔将目标时钟信息同步至每个控制器模块中,以令所述目标时钟信息作为同一时钟信息。

可选的,还包括:

判断是否满足预设的备份条件;

如果是,则将每个节点的硬件信息和状态信息,备份至备用存储多控中央控制器中。

本发明中,存储节点管理系统,包括存储多控中央控制器和多个节点,每个节点均包括基板管理控制器;每个节点内的基板管理控制器均分别与存储多控中央控制器相连;存储多控中央控制器,用于从每个节点的内的基板管理控制器中获取每个节点的硬件信息;本发明在多节点存储系统中增设与每个节点内的基板管理控制器均分别连接的存储多控中央控制器,存储多控中央控制器直接从节点内的基板管理控制器获取节点的硬件信息,无需占用节点的运算资源,令节点的运算资源能够更多的使用在存储上,进而提高了节点的存储工作效率,避免了节点的运算资源的浪费。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种存储节点管理系统结构示意图;

图2为本发明实施例提供的另一种存储节点管理系统结构示意图;

图3为本发明实施例提供的一种存储节点管理方法流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例公开了一种存储节点管理系统,参见图1所示,该系统包括存储多控中央控制器1和多个节点2,每个节点2均包括基板管理控制器3;每个节点2内的基板管理控制器3均分别与存储多控中央控制器1相连;

存储多控中央控制器1,用于从每个节点2的内的基板管理控制器3中获取每个节点2的硬件信息。

需要说明的是,节点2内的基板管理控制器3可以通过ipmi端口与节点2内各硬件连接,从而得到节点2的硬件信息,无需消耗节点2的运算资源。

具体的,通过在多节点2存储系统中增设存储多空中央控制器(cmc),并将每个节点2内的基板管理控制器3均分别与存储多控中央控制器1相连,以使存储多空中央控制器能够与每个节点2内的基板管理控制器3直接通讯,从而令存储多控中央控制器1能够从每个节点2的内的基板管理控制器3中直接获取每个节点2的硬件信息,而无需通过每个节点2的内的控制器节点2获取硬件信息,即无需节点2内的操作系统再花费运算资源获取节点2的硬件信息并记录,实现了存储多空中央控制器在不花费节点2内的运算能力下获取到节点2的硬件信息,节省了节点2的运算资源,进而提高了节点2的存储能力和工作效率。

可以理解的是,存储多控中央控制器1在获取到每个节点2的硬件信息后,用户可以通过用户终端查询从存储多控中央控制器1中查看到每个节点2的硬件信息,实现对每个节点2的硬件状态的监控,一旦节点2出现故障,能够快速的从硬件信息中排查出故障节点2。

可见,本发明实施例在多节点2存储系统中增设与每个节点2内的基板管理控制器3均分别连接的存储多控中央控制器1,存储多控中央控制器1直接从节点2内的基板管理控制器3获取节点2的硬件信息,无需占用节点2的运算资源,令节点2的运算资源能够更多的使用在存储上,进而提高了节点2的存储工作效率,避免了节点2的运算资源的浪费。

本发明实施例公开了一种具体的存储节点管理系统,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:

本发明实施例中,参见图2所示,每个节点2均包括与基板管理控制器3相连的控制器模块5,每个节点2内的控制器模块5均分别与存储多控中央控制器1相连;

存储多控中央控制器1,用于从控制器模块5中获取时钟信息;按照预设的时间间隔将目标时钟信息同步至每个控制器模块5中;

控制器模块5,用于从同一节点2内的基板管理控制器3中获取时钟信息;接收目标时钟信息,将目标时钟信息同步至基板管理控制器3中。

具体的,存储多控中央控制器不仅能够获取节点的硬件信息,还能够通过节点的控制器模块从基板管理控制器中获取节点当前的时钟信息,同时,存储多控中央控制器还能够将自身的目标时钟信息同步至每个控制器模块中保证每个节点的时钟信息同步,目标时钟信息可以为存储多控中央控制器从目标节点中获取的时钟信息。

进一步的,存储多控中央控制器,可以包括故障判断模块和日志生成模块;

故障判断模块,用于利用预设的状态条件和每个节点的硬件信息判断每个节点是否发生故障。

具体的,通过预先设定状态条件可以相应的判断每个节点的硬件信息是否正常,如果不正常,则表明节点故障,例如,节点包括提示灯1和提示灯2,这个常情况下提示灯1亮,提示灯2灭,当发生故障则灯2亮,灯1灭,状态条件可以设定为提示灯1亮,提示灯2灭,通过检测提示灯的电压或电流等信号可以得知提示灯是否亮或灭,当硬件信息中记载提示灯1灭,提示灯2亮,则表明该节点发生故障。

可以理解的是,硬件信息中包括多种节点的硬件状态,状态条件中也相应的包括每种硬件状态的判断标准,因此,可以判断出节点具体是那部分硬件发生故障。

日志生成模块,用于当故障判断模块判定发生故障,则利用故障节点的硬件信息和时钟信息生成故障日志。

具体的,为便于用户进行故障排查和监控,一旦故障判断模块判定发生故障,则利用故障节点的硬件信息和时钟信息生成记录故障发生时间和具体故障位置的故障日志,提高用户的故障排查效率。

进一步的,存储多控中央控制器,还可以包括任务再分配模块;

任务再分配模块,用于当故障判断模块判定发生故障,则断开与故障节点的连接,利用故障节点的状态信息中的任务信息,将故障节点的任务信息分配至满足预设的分配条件的节点中。

具体的,当节点发生故障,则存储多控中央控制器将断开与故障节点的连接,防止新的任务发送至故障节点中,由于故障节点当前可能存在正在运行的任务,因此,任务再分配模块需要利用故障节点的状态信息,从中得到故障节点故障时的任务信息,并将任务信息分配至满足预设的分配条件的节点中,以令其余节点继续执行故障节点未完成的任务。

其中,分配条件可以为负载最低的节点,即将任务信息分配至多节点中负载最低的节点中,也可以为指定的目标节点,将任务信息分配至多节点中预先设定的目标节点中。

进一步的,存储多控中央控制器,还可以包括报警模块;

报警模块,用于当故障判断模块判定发生故障,则生成报警信息,利用报警信息控制报警器报警。

需要说明的是,为实现冗余控制,保证多节点存储系统的稳定运行,参见图2所示,存储节点管理系统,还包括分别与存储多控中央控制器1和每个节点2相连的备用存储多控中央控制器4存储多控中央控制器1;

备用存储多控中央控制器4存储多控中央控制器1,用于接收存储多控中央控制器1发送的每个节点2的硬件信息和状态信息;当存储多控中央控制器1故障,代替存储多控中央控制器1管理每个节点2。

可以理解的是,由于备用存储多控中央控制器与存储多控中央控制器的数据同步,因此,备用存储多控中央控制器工作后,能够实现故障前的存储多控中央控制器的全部工作,不会出现数据丢失等情况;可以存在多个备用存储多控中央控制器,备用存储多控中央控制器与存储多控中央控制器之间可以通过心跳链的形式连接。

需要说明的是,每当节点任务更新时,存储多控中央控制器可以同步每个节点的任务信息,即存储多控中央控制器获取每个节点的任务信息,并可以将各项数据同步至备用存储多控中央控制器中,同时,每当节点故障时,存储多控中央控制器可以将各项数据同步至备用存储多控中央控制器中,或存储多控中央控制器可以定时将各项数据同步至备用存储多控中央控制器中。

相应的,本发明实施例还公开了一种存储节点管理方法,参见图3所示,应用于存储多控中央控制器,该方法包括:

s1:直接从每个节点的内的基板管理控制器中获取每个节点的硬件信息。

可见,本发明实施例直接从节点内的基板管理控制器获取节点的硬件信息,无需占用节点的运算资源,令节点的运算资源能够更多的使用在存储上,进而提高了节点的存储工作效率,避免了节点的运算资源的浪费。

具体的,还包括:

s2:按照预设的时间间隔将目标时钟信息同步至每个控制器模块中,以令目标时钟信息作为同一时钟信息。

具体的,上述按照预设的时间间隔将目标时钟信息同步至每个控制器模块中的过程,包括:

s21:从目标节点中的控制器模块中获取目标时钟信息;

s22:按照时间间隔将目标时钟信息同步至每个控制器模块中,得到同一时钟信息。

其中,同一时钟信息即为当前统一的时钟信息。

具体的,还包括:

s3:判断是否满足预设的备份条件;

s4:如果是,则将每个节点的硬件信息和状态信息,备份至备用存储多控中央控制器中。

具体的,备份条件可以包括每当节点任务更新时,可以将每个节点的硬件信息和状态信息备份至备用存储多控中央控制器中,同时,每当节点故障时,可以将硬件信息和状态信息备份至备用存储多控中央控制器中,或可以定时将硬件信息和状态信息备份至备用存储多控中央控制器中。

进一步的,还包括:

s5:利用预设的状态条件和每个节点的硬件信息判断每个节点是否发生故障;

s6:如果是,则利用故障节点的硬件信息和同一时钟信息生成故障日志。

进一步的,当节点发生故障后,还包括:

s7:断开与故障节点的连接,利用故障节点的状态信息中的任务信息,将故障节点的任务信息分配至满足预设的分配条件的节点中。

进一步的,当节点发生故障后,还包括:

s8:生成报警信息,利用报警信息控制报警器报警。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

以上对本发明所提供的一种存储节点管理系统及方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1