一种双机集群的节点热替换方法_2

文档序号:9865364阅读:来源:国知局
响磁盘正常1/0的情况下,预留出一部分用于存储配置信息的空间;
[0046]步骤二:为提高系统的高可用性及存储效率,采用触发+轮询的方式,当用户做出改变设备信息的操作时,采用异步工作模式,本实施例采用事件驱动模式,将设备的配置信息压缩成包,轮询遍历每一块磁盘,将设备信息保存在步骤一预留出来的空间中;
[0047]节点的恢复方法:
[0048]步骤一:登入健康节点的管理界面,输入待恢复节点的IP通信地址,点击恢复节点。
[0049]步骤二:后台脚本开始轮询每一块磁盘,通过改良RAID创建业务逻辑预留空间的算法,获取出我们之前预存的头区域配置信息。
[0050]步骤三:找出跟自己设备名不同的另一个节点的位置信息。
[0051]步骤四:根据步骤三获取的节点位置信息,读取出节点的配置信息,比较该块磁盘上的sequence与目前最大sequence值,若大于最大sequence值读取出该块盘上的配置信息,更新最大sequence值,转步骤五,反之去下块磁盘工作。
[0052]步骤五:根据步骤四读取出的设备配置信息,获取信息包的MD5值,检验与步骤三中获取的MD5值是否相等,若相等则保存该份配置信息到临时路径下,如果原路径有信息,则全部覆盖。
[0053]步骤六:按照步骤5轮询完所有磁盘后,此时保持在临时路径下的即为坏掉节点的配置信息。远程复制到需要恢复的节点,即具有IP地址的节点,片刻后损坏的节点就恢复工作。
[0054]下面以由24块磁盘组成的共享磁盘的双机集群为例对上述过程进行详细说明。
[0055]当节点产生更改设备信息的操作时,一方面更新本机系统盘上更改次数计数sequence,一方面在指定路径下将标志信息位更改为1(代表已更改配置信息)。系统后台的服务每隔一定时间,如一分钟,会轮询检查一次标志位,当值为I时,执行配置信息保存操作。
[0056]执行配置信息保存操作时,首先从第一块盘开始遍历,按照创建RAID时预留的存储空间地址,开始保存工作。首先获取当前设备模式,当设备模式为双机模式时,获取两个节点的设备名,按照图1所示的存储结构,依次保存入两个节点的位置信息,更新头区域配置信息。根据自己节点的位置,往里写入自己的配置数据。当为单机存储模式时,按照图2所示的存储结构,更新model属性值为单机模式,写入自己的设备名和位置信息,更新配置数据。完成所有磁盘的保存操作后,将标志信息位更新为O。
[0057]设备运行过程中,当出现某一节点系统盘或者别的部件出现问题,导致该节点配置信息丢失时,就需要执行节点热替换操作,具体操作过程如下:更换掉节点,连接到后端存储,在替换节点上设置出一个可以通信的IP。在另一端的节点,输入需要热替换的IP地址,执行如下恢复工作:
[0058]遍历所有存有配置信息的盘,从各块磁盘的头区域配置信息中,获取一个跟自身不一样的节点设备名,读取他的位置地址信息。
[0059]根据前面获取的位置地址,读取配置数据元数据,从中获取到sequence和MD5等属性。
[0000]跟当前的最大sequence值进行比较,如果大于等于最大sequence时,读出配置数据data,获取该data的MD5值,如果跟从配置元数据meta中读出的MD5相等时,更新当前最大sequence值,将配置数据data保存到指定路线下。
[0061]轮询完所有盘之后,就获取到了损坏节点的配置数据data。
[0062]将data解压后远程复制到需要恢复节点的配置信息路径下,重启这个需要恢复的故障节点,即完成了热节点替换工作。
[0063]目前,该方法已经成功应用于本公司的双机集群系统,获得了用户的高度认可。
[0064]综上,本发明方法考虑到当下数据1量剧增,设备系统盘容易出现故障的问题,采用head+配置信息冗余存储模式,有效解决了设备出现故障时在不中断业务的情况下恢复节点的问题,保证了系统的高可用性,大数据时代,数据是核心竞争力,存储设备最重要的职责就是保护好数据的完整性,该发明的设计初衷就在此处,更安全,更能防止不可预知因素。
[0065]以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进,或者对其中部分技术特征进行等同替换,这些改进和替换也应视为本发明的一部分。
【主权项】
1.一种双机集群的节点热替换方法,其特征在于:包括配置信息存储方法和节点恢复方法,配置信息存储方法包括以下内容: 改良RAID创建存储池时的策略,在不影响磁盘正常I/O的情况下,预留出一部分用于存储配置信息的空间; 当节点的配置发生改变时,将节点的配置信息压缩成配置包,并根据该配置包以及节点工作模式获取相关配置信息后存储于配置信息存储空间; 节点恢复方法包括以下内容: 从上述配置信息存储空间获取待替换节点的配置信息,将配置信息解压缩后拷贝到替换的节点即可恢复待替换节点的工作。2.根据权利要求1所述的一种双机集群的节点热替换方法,其特征在于:所述配置信息采用head+组织模式,即由头区域和数据区域两部分组成,头区域包括存储模式model以及配置信息存储位置索引posit1n;数据区域包括节点的配置数据,配置数据由元数据meta和配置包data组成,meta中包括data的大小size、完整性校验值print以及存储计数sequence,具体说明如下: model:用于标识节点的工作模式,不同的工作模式带来存储模式的不同,其值为单机模式和双机模式之一; posit1n:用于标识节点配置数据的保存地址,采用节点名称=配置数据起始位置的表示方式;当model为单机模式时,只有I个posit1n,当model为双机模式时,有2个posit1n,不同的posit1n之间使用预设的分隔符分隔;size:用于标识data的大小; print:用于对data的完整性进行校验,其值根据data利用校验算法获取; sequence:用于标识节点配置信息更改次数。3.根据权利要求2所述的一种双机集群的节点热替换方法,其特征在于: 所述存储配置采用轮询方式将配置信息存储于存储池的所有磁盘中,由此在进行所述节点恢复时获取配置信息过程如下: 首先设置配置计数初值为O,然后进行以下步骤: 步骤一:遍历所有磁盘获取当前磁盘的配置头数据,直到没有磁盘可供读取,输出data; 步骤二:根据待恢复节点名称得到配置数据的存储位置; 步骤三:根据存储位置读取meta数据,并解析出size、print以及sequence ; 步骤四:如果sequence大于配置计数,根据size、meta大小以及存储位置读取data;否贝IJ,转步骤一读取下一个磁盘的配置头数据; 步骤五:采用与存储时一致的校验算法计算data的校验值; 步骤六:如果校验值与print相同,保存当前data,转步骤一读取下一个磁盘的配置头数据;否则,转步骤一读取下一个磁盘的配置头数据。4.根据权利要求3所述的一种双机集群的节点热替换方法,其特征在于:所述当节点的配置发生改变时,将节点的配置信息压缩成配置包,并根据该配置包以及节点工作模式获取相关配置信息后存储于配置信息存储空间,为了提高配置改变的效率,采用异步工作模式,即改变配置以及存储配置分开进行的方式,二者间采用事件驱动。
【专利摘要】本发明涉及一种节点热替换方法,属于计算机存储技术领域。本发明包括:给处于IO状态的磁盘保留出一部分空间;按监控策略,周期性监控,获取设备配置属性;用轮询遍历的方式,让设备的配置信息保存在每一块磁盘上,减少因单块磁盘故障造成设备信息丢失的损失;保存的信息采用HEAD+方式组织,保证设备在双机和单机工作模式下都能完整的保存设备配置信息。与传统技术相比,本发明实现了节点的热替换,有效保证了系统的高可用性,极大的降低了设备出现故障无法恢复的窘迫状况,大数据时代,数据是核心竞争力,存储设备最重要的职责就是保护好数据的完整性,该发明的设计初衷就在此处,更安全,更能防止不可预知因素。
【IPC分类】G06F11/16
【公开号】CN105630639
【申请号】CN201510993669
【发明人】王道邦, 扬威, 周泽湘, 沈晶, 罗华, 潘兴旺, 李艳国, 张恒, 段舒文, 于召鑫
【申请人】北京同有飞骥科技股份有限公司
【公开日】2016年6月1日
【申请日】2015年12月25日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1