一种磁盘阵列系统中磁盘故障处理和数据重构方法

文档序号:6573432阅读:303来源:国知局
专利名称:一种磁盘阵列系统中磁盘故障处理和数据重构方法
技术领域
本发明涉及数据存储领域,特别涉及磁盘阵列系统中磁盘故障处理和数据重构 的方法。
背景技术
磁盘阵列(RAID,简称Redundant Array of Independent Disks)是一种把多块独 立的硬盘(物理硬盘)按不同的方式组合起来形成一个硬盘组(逻辑硬盘),从而提 供比单个硬盘更高的存储性能和提供数据备份的技术。RAID技术作为一种成熟的 技术广泛应用于磁盘阵列系统中。磁盘阵列按照独立硬盘组成磁盘阵列的不同方式 分成不同的RAID级别(RAID Levels)。现有技术中已拥有了从RAID 0到RAID 6 七种基本的RAI:D级别。不同的RAI:D级别代表着不同的存储性能、数据安全性、 存储成本以及算法复杂度和数据冗余度。
在大多数的RAID级别中,当磁盘阵列中的磁盘失效时,RAID系统可以通过 冗余的数据或者编码重构故障磁盘,从而保证了数据的完整性,提高数据的可用性。 但是,对于一个具有冗余能力的RAID系统,其在数据重构的过程中存在较大的风 险与不足。
以实际应用中较为常见的RAID5为例,RAID5是-种存储性能、数据安全和 存储成本i;顾的存储解决方樂。RAIDS不对磁盘中存储的数据进行备份,而是把数 据和相对应的奇偶校验信息存储到组成RAI:D5的各个磁盘上,并且奇偶校验信息和 相对应的数据分别存储于不同的磁盘....t:。当RAID5的一个磁盘数据发生损坏后,利 用剩.F的数据和相应的奇偶校验信息去恢复被损坏的数据。RAID5在重构数据的过 程中,通常在检测到磁盘发生读写故障后,会立即将故障磁盘设置为"故障"状态, 并且将其剔出阵列,同时加入一块新的冗余数据盘,然后通过冗余的编码信息将故 障磁盘中的数据信息重构到冗余数据盘中。由于RAID5本身的冗余编码信息有限, 采用上述的数据重构方法极易导致阵列崩溃,数据丢失。因此,RAID5的数据重构 过程具有高风险的缺陷。RAID6是另一种常见的存储解决方案。在RAID6中,数据和校验码都是被分 成数据块,然后分别存储到磁盘阵列的各个硬盘匕与RAID5相比,RAID6还加 入了一个独立的校验磁盘,它把分布在各个磁盘上的校验码都备份在一起,这样 RAID6磁盘阵列就允许多个磁盘同吋出现故障。但RAID6重构数据的过程与RAID5 相类似,也会将发生故障的磁盘设为"故障"状态,并剔出阵列。基于RAID6本身 所具有的冗余编码信息丰富的特点,应用现有的数据重构方法会延长数据重构时间, 因此需要高性能处理器或者特殊硬件的支持,RAID6的数据重构过程具有低性能的 缺陷。
鉴于现有的数据重构方法在磁盘阵列系统中的应用存在上述的不足,迫切需要 一种新的方法。

发明内容
本发明的目的是克服现有磁盘阵列在数据重构过程中风险高、性能低的缺陷, 从而提供一种低风险、高效率的磁盘阵列故障处理和数据重构方法。
为了实现上述目的,本发明提供了一种磁盘阵列系统中磁盘故障处理方法和数
据重构方法,按照以下步骤顺序执行
步骤l)、磁盘阵列中的磁盘发生读写故障;
步骤2)、在故障磁盘中定位故障数据块,保留故障磁盘上的剩余正确数据,并 査找故障信息表,判断发生故障的数据块所在条带是否已经存在其他故障数据块, 若存在,执行下一步,否则,执行步骤4);
步骤3)、磁盘阵列系统的信息完整性被破坏,将磁盘阵列系统设置为"只读模
式",禁止用户执行写操作,对磁盘的故障处理操作结束;
步骤4)、将故障数据块的位置信息记录到故障信息表中;
步骤5)、判断磁盘阵列系统中是否存在冗余数据盘,若不存在,执行下一步, 否则,执行步骤7);
步骤6)、进入"降级"运行模式,结束操作; 步骤7)、对故障数据块迸行数据重构,恢复故障数据。 上述技术方案中,所述的步骤7)包括以下步骤-
步骤7-l)、判断发生故障的磁盘是否是磁盘阵列中的工作盘,如果是,执行步 骤7-3),否则,执行下一步;
步骤7-2)、工作盘所绑定的从盘发生故障,为发生故障的从盘所对应的主盘再分配一个冗余数据盘,构建一主多从的主从盘结构,然后执行下一步,如果无法为 主盘分配新的从盘,则磁盘阵列系统进入"降级"运行模式;
步骤7-3)、将工作盘的故障数据块的信息加入到故障信息表中;
步骤7-4)、判断发生故障的工作盘是否建立了主从盘关系,若已建立,执行步 骤7-6),否则,执行下一步;
步骤7-5)、为发生故障的工作盘寻找一个冗余数据盘,将发生故障的工作盘作 为主盘,所述的冗余数据盘作为从盘,建立主从盘结构;
步骤7-6)、将主盘上的故障数据信息映射到从盘的相应位置;
步骤7-7)、启动数据重构操作;
步骤7-8)、执行数据重构的循环操作,记录数据迁移点的位置信息,并判断对
当前磁盘的数据重构操作是否结束,若没有,执行下一步,否则,执行步骤7-14);
步骤7-9)、判断当前数据是否是有效数据,若是,执行下一步,否则,执行步 骤7-ll);
步骤7-10)、采用数据迁移技术将主盘数据重构到从盘上,重新执行步骤7-8);
步骤7-11)、判断当前数据是否为新发生的故障数据,若是,执行下一步,否 则,执行步骤7-14);
步骤7-12)、采用冗余编码技术恢复故障数据,并写入从盘,重新执行步骤7-8);
步骤7-13)、判断当前数据是否为已经迁移的数据,对于已经迁移的数据无需 再次迁移,重新执行步骤7-8);
步骤7-14)、数据重构操作完毕,将发生故障的工作盘设置成"故障"状态, 剔除出磁盘阵列,并将从盘升级为主盘,解除发生故障的工作盘与冗余数据盘间的 主从关系。
所述的磁盘阵列系统在数据迁移过程中,允许对发生数据迁移的磁盘进行访问, 当用户读写数据时,若用户读写数据点落在数据迁移点之前,则直接对从盘进行操 作;若用户读写数据点落在数据迁移点之后,则直接对主盘进行操作;若用户读写 数据点落在数据迁移点之上,那么通过该数据块的锁机制来保证从盘数据与主盘数 据的一致性或者从盘数据新于主盘数据;若用户读写数据点落在故障数据块上,磁 盘存在主从盘关系,则将对主盘故障数据块的访问转换成对从盘映射数据块的操作, 若不存在主从盘关系,则通过冗余编码信息对故障数据块进行操作。
所述的磁盘阵列系统在做读写访问时,如果被访问的数据块在故障信息表内, 则访问从盘映射数据,或对其他磁盘相同位置的信息做冗余编码计算;如果被访问 的数据块不在故障信息表内,则直接访问原有数据块。在所述的步骤7-2)中,所述的一主多从的主从盘结构中,多个从盘补充主盘 成为一个完好的磁盘。
在所述的步骤7-5)中,所述的主从盘结构中,所述的从盘补充主盘成为一个 完好的磁盘。
在所述的步骤7-6)中,所述的映射是将发生故障位置的数据块通过其它磁盘 的冗余编码恢复到从盘,并将发生故障数据块的位置信息记录到故障信息表。
在所述的步骤7-7)中,在启动数据重构操作时,若磁盘阵列系统中存在多个 故障磁盘数据重构操作,则并行执行数据重构操作或按照优先级关系串行执行。
在所述的步骤7-8)中,所述的数据迁移点的位置信息作为每个磁盘的元数据 信息被不断刷新保存到磁盘。
本发明的优点在于
1、 本发明将磁盘故障做局部化处理,保留故障磁盘上的正确数据,提高了磁盘 阵列系统的容错能力;
2、 本发明在数据重构过程中采用了主从盘结构、故障信息表和数据迁移技术, 不仅加快了数据重构速度,而且大大降低了数据重构风险,提高了磁盘阵列系统的 可用性。


图1为本发明的磁盘阵列系统中磁盘故障处理和数据重构方法的流程图; 图2为本发明的磁盘阵列系统中磁盘故障处理和数据重构方法中数据重构的流 程图3为本发明数据重构过程中,故障数据映射与主从盘关系建立示意图; 图4为数据迁移过程中,不同读写请求处理方法示意图; 图5为本发明在数据重构过程中,多盘读写故障而保证数据完整性的示意图; 图6是本发明数据重构结束操作示意图。
具体实施例方式
下面结合附图和具体实施方式
对本发明作进一步详细描述
本发明的故障处理和数据重构方法的基本思想是当磁盘数据发生故障后,先 将主盘上发生故障位置的数据块复制到从盘,再将发生故障主盘上的所有数据块从 前到后,依次迁移到从盘,完成一次恢复过程。与现有技术相比,本发明不将磁盘的局部损坏视为整个磁盘的损坏,当检测到工作盘发生故障后,不将工作盘设置为 "故障"状态,也不将发生故障的工作盘从磁盘阵列中剔除,而是把发生故障的磁 盘继续保留在磁盘阵列中作为有效磁盘使用,这样做一方面能够提升数据重构的性 能,另一方面也能够降低重构过程中其它磁盘发生故障所带来的风险。在以下的实 施例中,以RAID级别的磁盘阵列系统为例,对本发明的方法做进一步说明。
如图1所示,本发明的磁盘阵列系统中磁盘故障处理和数据重构方法包括以下 步骤
步骤IO、磁盘阵列系统中的磁盘发生读写故障;
步骤20、在故障磁盘中定位故障数据块,保留故障磁盘上的剩余正确数据,并 查找故障信息表,判断发生故障的数据块所在条带是否已经存在其他故障数据块, 若存在,执行下一步,否则,执行步骤40;
本领域的普通技术人员都知道,磁盘阵列系统中,不同磁盘上相同条带的数据 块间具有联系,且一个数据块中保存有同一条带其他数据块的冗余数据。因此,如
果同一条带中同一时间内只有一个故障数据块,则故障数据块可通过其他数据块上 的冗余数据进行恢复,但如果同一条带在同一时间内有两个以上的故障数据块,则 会破坏磁盘阵列系统的信息完整性。根据发生故障的磁盘数据块的不同情况,需要 做不同的操作。
在现有技术中,如果一个磁盘发生故障,会将整个磁盘视为故障,不再使用故 障磁盘上的任何数据。但通过本步骤可见,本发明将故障做局部化处理,只舍弃故 障磁盘上的故障数据块,保留正确数据块,允许对正确数据块进行读写操作。
步骤30、磁盘阵列系统的信息完整性被破坏,将磁盘阵列系统设置为"只读模 式",禁止用户执行写操作,对磁盘的故障处理操作结束;
步骤40、将故障数据块的位置信息记录到故障信息表中;
磁盘阵列的故障信息表主要包括两部分的内容, 一是磁盘阵列中发生故障的数 据块所在的位置,二是如果要进行重构操作,故障信息表还应当包括关于主从盘关 系的信息。在本步骤中,需要将故障数据块的位置信息添加到故障信息表中,而关
于主从盘关系的信息则在后续的步骤73中实现。
步骤50、判断磁盘阵列系统中是否存在冗余数据盘,若不存在,执行下一步,
否则,执行步骤70;
步骤60、进入"降级"运行模式;
在正常情况下,磁盘阵列系统具有冗余信息,通过对冗余信息的编码可实现对
信息的保护,例如在RAID5结构中用N+l块磁盘存储N块盘的信息,当一块磁盘发生故障时,通过其他磁盘中所保存的冗余信息可恢复故障盘中的信息。但如果磁 盘发生故障时,没有备份盘可以替换或替换过程没有完成,则其余N块盘虽然可以 通过冗余编码提供完整的信息,但这时磁盘阵列处于无冗余状态,数据安全低,而 且整体性能变差,这种情况就是本步骤中所述的"降级"模式。 步骤70、对故障数据块进行数据重构,恢复故障数据。从步骤10到步骤60,可视为对磁盘阵列系统中的磁盘故障进行处理的过程,而本步骤则实现了故障数据块的数据重构,对故障数据块进行数据重构是一个较为复杂的操作,如图2所示,其具体实现如下步骤71、判断发生故障的磁盘是否是磁盘阵列中的工作盘,如果是,执行步骤 73,否则,执行下一步;步骤72、工作盘所绑定的从盘发生故障,为发生故障的从盘所对应的主盘再寻找一个冗余数据盘,构建一个一主多从的主从盘结构,如果无法为主盘分配新的从 盘,则磁盘阵列系统进入"降级"运行模式。在本步骤中,发生故障的从盘在恢复过程中并不放弃,但在恢复过程完成后,只保留没有故障的从盘,并用没有故障的从盘替代主盘。步骤73、将工作盘的故障数据块的信息加入到故障信息表中。在本步骤中,主 要是将关于主从盘关系的信息添加到故障信息表中。步骤74、判断发生故障的工作盘是否建立了主从盘关系,若已建立,执行步骤 76,否则,执行下一步;步骤75、为发生故障的工作盘寻找一个冗余数据盘,将发生故障的工作盘作为 主盘,所找到的冗余数据盘作为从盘,建立主从盘结构,从盘补充主盘构成完好磁 盘,如果无法为发生故障的工作盘分配一个冗余数据盘作为从盘,则磁盘阵列系统 进入"降级"运行模式。步骤76、将主盘上的故障数据信息映射到从盘的相应位置。在本步骤中,映射 有两个含义,第一,发生故障位置的数据块立即通过其他多个盘的冗余编码恢复到 从盘,并将这个信息记录到故障信息表;第二,以后对故障位置数据块进行的访问, 将直接访问从盘,直接访问从盘比用冗余编码访问多个盘的速度快。如图3所示,在一个包含有四个工作盘和一个冗余数据盘的磁盘阵列中,分别 用A、 B、 C、 D表示各个工作盘,假设标记为D的工作盘发生读写故障,根据上述 步骤为D盘查找冗余数据盘作为它的从盘,然后将D盘上的故障数据块的位置信息 存入故障信息表,并将故障数据块映射到从盘上。步骤77、启动数据重构操作,若磁盘阵列系统中存在多个故障磁盘数据重构操作,则可以并行执行数据重构操作,也可以按照一定的优先级关系串行执行;在本实施例中,可按照优先级关系串行执行数据重构过程,如果有故障磁盘正在做数据重构操作,则其它故障磁盘的重构操作需要等待。步骤78、执行数据重构的循环操作,记录数据迁移点的位置信息,并判断对当前磁盘的数据重构操作是否结束,若没有,执行下一步,否则,执行步骤714。在本步骤中,所述的数据迁移点是指数据重构过程中,当前需要重构的数据块的位置。数据迁移点的位置会随着数据迁移的过程而不断改变。步骤79、判断当前数据是否是有效数据,若是,执行下一步,否则,执行步骤711。步骤710、采用数据迁移技术将主盘数据重构到从盘上,重新执行步骤78。步骤711、判断当前数据是否为新发生的故障数据,若是,执行下一步,否则, 执行步骤714。在步骤76中,实现了主盘上的故障数据信息向从盘的映射,但在数 据恢复过程中,主盘可能会产生新的故障数据块,因此,在本步骤中,还要对当前 数据是否为故障数据进行判断,并在后续操作中对故障数据做相应的处理。步骤712、采用冗余编码技术恢复故障数据,并写入从盘,重新执行步骤78;步骤713、已经迁移的数据无需再次迁移,重新执行步骤78;步骤714、数据重构操作完毕,将发生故障的工作盘剔除出磁盘阵列,并将从 盘升级为主盘,解除发生故障的工作盘与冗余数据盘间的主从关系。在磁盘故障处理和数据重构过程中,都可对故障数据块进行访问,以保障服务 的连续性和数据的完整性。在步骤78中,通过记录数据迁移点位置的方法保证了在 服务连续性的前提下不影响数据的完整性。如图4所示,在数据重构过程中,当记 录数据迁移点位置后,用户访问数据迁移盘存在如下情况,本发明采取了相应处理 方法保证了数据完整性1、 用户访问数据落在数据迁移点之前,即用户所访问的数据位于数据重构操作完毕的区域内对于这种情况, 一律将用户的请求映射到从盘,用户对主盘的数据读写操作都转换成对从盘的操作。2、 用户访问数据落在数据迁移点之上本发明中规定,对于同一数据块不能存在多种操作,只能有一种操作,因此,可以采用锁机制来保证该数据块在迁移操作 过程中,用户无法对其进行读写,从而保证在用户和数据迁移操作对一个数据块竞 争的过程中,从盘数据新于主盘数据或者两者保持一致。3、 用户访问数据落在故障数据块上在访问主盘数据时,查找故障信息表,如果能够找到访问数据块的信息,那么被访问的数据块为故障数据块。此时,如果存 在主从盘关系,那么对主盘故障数据块的访问转换成对从盘映射数据块的操作。如 果不存在主从盘关系,那么通过冗余编码信息对故障数据块进行操作。4、用户访问数据落在数据迁移点之后,即用户所访问的数据还没有进行数据重 构操作如果用户访问数据落在数据迁移点之后,数据读写操作可以直接对主盘进 行,然后通过后继的数据迁移保证数据的完整性。在这种情况下,如果用户读写数 据块发生故障,那么同样将其加入故障信息表,并将恢复的故障数据块映射到从盘 对应位置。数据迁移点位置信息记录在磁盘阵列的元数据信息中。这样,当发生诸如断电、 网络故障等意外情况时,还能保存最近迁移点位置信息。通过保存的迁移点位置信 息可以继续磁盘数据重构操作,提高了效率。在步骤60、步骤72和步骤75中,磁盘阵列系统都进入"降级"模式,在降级 模式下,仍然可以对故障磁盘进行访问。在对故障磁盘进行访问时,如果访问的数 据块是故障数据块,则通过冗余编码完成访问,如果访问的是故障盘中的正常数据 块,则直接访问原有信息。采用本发明的方法,可以降低数据重构和降级状态所带来的数据丢失风险。在 采用本发明方法的磁盘阵列中,不同磁盘上不同位置的数据块发生故障不会破坏磁 盘阵列的数据完整性,只有不同磁盘上相同位置的数据块同时发生故障,且故障数 据高于阵列的冗余数量时,才会破坏阵列数据的完整性。如图4所示,仍以本实施 例中所采用的RAID级别的磁盘阵列系统为例,在具有四个工作盘和一个冗余盘的 磁盘阵列系统中,即使有多个工作盘发生故障,磁盘阵列依然可以保持数据的完整 性。在图5中,数字标号分别表示故障磁盘数据块的索引号。4号故障数据块位于 A盘上,3号故障数据块位于B盘上,2号故障数据块位于C盘上,l号故障数据 块位于D盘上。由于4号和1号数据块在同一条带,因此,只要满足这两个数据块 不在同一时间内发生故障,那么阵列的数据完整性能够得到保证,即使每个磁盘都 拥有故障数据块,但是数据依然安然无恙。由于数据块的容量远远小于磁盘的容量, 多个磁盘相同位置的数据块同时发生故障(如1, 4号数据块同时发生故障)的概率 远远小于多个磁盘同时发生故障(如A中任意一个数据块发生故障同时D中任何一个数据块发生故障)的概率。因此,与传统数据重构方法相比,本发明具有极大优 势。如图6所示,当主盘数据全部重构到对应从盘之后,该故障磁盘的数据重构完 毕。重构完毕的从盘数据可以与主盘保持一致,也可以新于主盘中的数据。重构完 毕后,故障磁盘被设置为"故障状态",并且将其从磁盘阵列中剔除。此时,带有有 效数据的从盘升级为主盘,成为阵列一员,主从盘关系自然解除。最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管 参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明 的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均 应涵盖在本发明的权利要求范围当中。
权利要求
1. 一种磁盘阵列系统中磁盘故障处理方法和数据重构方法,按照以下步骤顺序执行步骤1)、磁盘阵列中的磁盘发生读写故障;步骤2)、在故障磁盘中定位故障数据块,保留故障磁盘上的剩余正确数据,并查找故障信息表,判断发生故障的数据块所在条带是否已经存在其他故障数据块,若存在,执行下一步,否则,执行步骤4);步骤3)、磁盘阵列系统的信息完整性被破坏,将磁盘阵列系统设置为“只读模式”,禁止用户执行写操作,对磁盘的故障处理操作结束;步骤4)、将故障数据块的位置信息记录到故障信息表中;步骤5)、判断磁盘阵列系统中是否存在冗余数据盘,若不存在,执行下一步,否则,执行步骤7);步骤6)、进入“降级”运行模式,结束操作;步骤7)、对故障数据块进行数据重构,恢复故障数据。
2、 根据权利要求1所述的磁盘阵列系统中磁盘故障处理方法和数据重构方法, 其特征在于,所述的步骤7)包括以下步骤步骤7-l)、判断发生故障的磁盘是否是磁盘阵列中的工作盘,如果是,执行步骤7-3),否则,执行下一步;步骤7-2)、工作盘所绑定的从盘发生故障,为发生故障的从盘所对应的主盘再分配一个冗余数据盘,构建一主多从的主从盘结构,然后执行下一步,如果无法为主盘分配新的从盘,则磁盘阵列系统进入"降级"运行模式;步骤7-3)、将工作盘的故障数据块的信息加入到故障信息表中;步骤7-4)、判断发生故障的工作盘是否建立了主从盘关系,若已建立,执行步 骤7-6),否则,执行下一步;步骤7-5)、为发生故障的工作盘寻找一个冗余数据盘,将发生故障的工作盘作 为主盘,所述的冗余数据盘作为从盘,建立主从盘结构;步骤7-6)、将主盘上的故障数据信息映射到从盘的相应位置;步骤7-7)、启动数据重构操作;步骤7-8)、执行数据重构的循环操作,记录数据迁移点的位置信息,并判断对当前磁盘的数据重构操作是否结束,若没有,执行下一步,否则,执行步骤7-14);步骤7-9)、判断当前数据是否是有效数据,若是,执行下一步,否则,执行步 骤7-ll);步骤7-10)、采用数据迁移技术将主盘数据重构到从盘上,重新执行步骤7-8); 步骤7-11)、判断当前数据是否为新发生的故障数据,若是,执行下一步,否则,执行步骤7-14);步骤7-12)、采用冗余编码技术恢复故障数据,并写入从盘,重新执行步骤7-8);步骤7-13)、判断当前数据是否为已经迁移的数据,对于已经迁移的数据无需 再次迁移,重新执行步骤7-8);步骤7-14)、数据重构操作完毕,将发生故障的工作盘设置成"故障"状态, 剔除出磁盘阵列,并将从盘升级为主盘,解除发生故障的工作盘与冗余数据盘间的 主从关系。
3、 根据权利要求2所述的磁盘阵列系统中磁盘故障处理方法和数据重构方法, 其特征在于,所述的磁盘阵列系统在数据迁移过程中,允许对发生数据迁移的磁盘 进行访问,当用户读写数据时,若用户读写数据点落在数据迁移点之前,则直接对 从盘进行操作;若用户读写数据点落在数据迁移点之后,则直接对主盘进行操作; 若用户读写数据点落在数据迁移点之上,那么通过该数据块的锁机制来保证从盘数 据与主盘数据的一致性或者从盘数据新于主盘数据;若用户读写数据点落在故障数 据块上,磁盘存在主从盘关系,则将对主盘故障数据块的访问转换成对从盘映射数 据块的操作,若不存在主从盘关系,则通过冗余编码信息对故障数据块进行操作。
4、 根据权利要求2所述的磁盘阵列系统中磁盘故障处理方法和数据重构方法, 其特征在于,磁盘阵列系统在做读写访问时,如果被访问的数据块在故障信息表内, 则访问从盘映射数据,或对其他磁盘相同位置的信息做冗余编码计算;如果被访问 的数据块不在故障信息表内,则直接访问原有数据块。
5、 根据权利要求2所述的磁盘阵列系统中磁盘故障处理方法和数据重构方法, 其特征在于,在所述的步骤7-2)中,所述的一主多从的主从盘结构中,多个从盘 补充主盘成为一个完好的磁盘。
6、 根据权利要求2所述的磁盘阵列系统中磁盘故障处理和数据重构方法,其特 征在于,在所述的步骤7-5)中,所述的主从盘结构中,所述的从盘补充主盘成为 一个完好的磁盘。
7、 根据权利要求2所述的磁盘阵列系统中磁盘故障处理和数据重构方法,其特 征在于,在所述的步骤7-6)中,所述的映射是将发生故障位置的数据块通过其它 磁盘的冗余编码恢复到从盘,并将发生故障数据块的位置信息记录到故障信息表。
8、 根据权利要求2所述的磁盘阵列系统中磁盘故障处理和数据重构方法,其特 征在于,在所述的步骤7-7)中,在启动数据重构操作时,若磁盘阵列系统中存在 多个故障磁盘数据重构操作,则并行执行数据重构操作或按照优先级关系串行执行。
9、 根据权利要求2所述的磁盘阵列系统中磁盘故障处理和数据重构方法,其特 征在于,在所述的步骤7-8)中,所述的数据迁移点的位置信息作为每个磁盘的元 数据信息被不断刷新保存到磁盘。
全文摘要
本发明公开了一种磁盘阵列系统中磁盘故障处理方法和数据重构方法,包括磁盘阵列中的磁盘发生读写故障;定位故障数据块,保留故障磁盘上的剩余正确数据,并查找故障信息表,判断发生故障的数据块所在条带是否已经存在其他故障数据块,若存在,将磁盘阵列系统设置为“只读模式”,禁止用户执行写操作;否则,将故障数据块的位置信息记录到故障信息表中;然后判断磁盘阵列系统中是否存在冗余数据盘,若不存在,进入“降级”运行模式;否则,对故障数据块进行数据重构,恢复故障数据。
文档编号G06F11/34GK101276302SQ20071006493
公开日2008年10月1日 申请日期2007年3月29日 优先权日2007年3月29日
发明者吴忠杰, 李一鸣, 纪海涛, 韩晓明, 马一力 申请人:中国科学院计算技术研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1