获取灾难后系统持续数据保护的性能信息的方法及装置的制作方法

文档序号:6436034阅读:136来源:国知局
专利名称:获取灾难后系统持续数据保护的性能信息的方法及装置的制作方法
技术领域
本发明涉及容灾系统,尤其涉及获取灾难后系统持续数据保护(⑶P,Continuous Data Protection)的性能信息的方法及装置。
背景技术
数据的恢复时间目标(RTO,Recovery Time 0bjective),主要指的是业务系统所能容忍的业务停止服务的最长时间,也就是业务系统从灾难发生后启动恢复到恢复正常服务功能的过程所需要的最短时间周期,是描述CDP性能的一项相关信息。例如,假设业务系统在时间点tl启动恢复,并在时间点t2完成恢复,那么RTO的值就等于tl-tl。容灾系统的RTO的值越小,代表其数据恢复能力越强。此外,描述CDP性能的信息还包括经灾难恢复后数据恢复的一致性或有效性。目前,国际上通用的容灾系统的评审标准为aiare78,包括如下内容(1)数据备份/恢复的范围;(2)灾难恢复计划的状态;(3)业务中心与容灾中心之间的传输距离;(4)业务中心与容灾中心之间如何相互连接;(5)数据是如何在业务中心和容灾中心之间传输的;(6)当灾难发生时允许丢失的数据量;(7)如何保证更新的数据及时更新在容灾中心;(8)容灾中心从灾难后启动恢复至完成恢复进程的能力。上述SiarWS只是建立⑶P等容灾系统的一种评审标准,对于如何设计自动获得用于这些容灾系统的各项性能数据,从而评估容灾系统的灾难恢复能力,则是一个尚未解决而急需解决的问题。

发明内容
本发明所要解决的技术问题是提供一种获取灾难后系统数据保护的性能信息的方法及装置,能够自动获得用于容灾系统的性能数据。为了解决上述技术问题,本发明提供了一种获取灾难后系统持续数据保护的性能信息的方法,包括通过在系统持续数据保护中注入的监测守护模块监测系统中的恢复事件;根据监测的恢复事件获取持续数据保护的性能信息。进一步地,通过在持续数据保护中注入的监测守护模块监测系统中的恢复事件, 具体包括在持续数据保护中注入监测守护模块;通过该监测守护模块监测系统输入输出数据流监测恢复事件,包括监测开始恢复事件和结束恢复事件。
进一步地,通过监测守护模块监测系统输入输出数据流监测开始恢复事件和所述结束恢复事件,具体包括监测系统中主机设备输入输出总线层的数据流和/或主机设备内设备驱动层的数据流;当监测到主机设备输入输出总线层和/或块设备驱动层有大量数据流在移动,则判断发生开始恢复事件,并记录发生该开始恢复事件的第一时间;当监测到主机设备输入输出总线层和/或块设备驱动层的大量数据流的移动停止,则判断发生结束恢复事件,并记录发生该结束恢复事件的第二时间。进一步地,根据监测的恢复事件获取持续数据保护的性能信息,具体包括根据第二时间和第一时间的差,计算恢复时间目标,作为持续数据保护的性能信息之一获取。进一步地,根据监测的恢复事件获取持续数据保护的性能信息,还包括比较灾难发生前备份的数据和恢复后的数据,根据比较结果分析容灾系统恢复能力,作为持续数据保护的性能信息之一获取。进一步地,该方法还包括记录和/或显示持续数据保护的性能信息。为了解决上述技术问题,本发明提供了一种获取灾难后系统持续数据保护的性能信息的装置,包括相互连接的监测守护模块、恢复性能测试模块,其中监测守护模块,用于注入到系统持续数据保护中监测恢复事件;恢复性能测试模块,用于根据监测的恢复事件获知持续数据保护的性能信息。进一步地,监测守护模块通过监测系统输入输出数据流来监测恢复事件,包括监测开始恢复事件和结束恢复事件,并将监测到发生开始恢复事件的第一时间和发生结束恢复事件的第二时间输出给恢复性能测试模块;恢复性能测试模块根据输入的第二时间和第一时间之差计算恢复时间目标,作为持续数据保护的性能信息之一获取。进一步地,监测守护模块通过监测到系统内主机设备输入输出总线层和/或主机设备内块设备驱动层有大量数据流在移动,则判断发生开始恢复事件;通过监测到主机设备输入输出总线层和/或块设备驱动层大量数据流的移动停止,则判断发生结束恢复事件。进一步地,该装置还包括与所述恢复性能测试模块连接数据获取模块,其中恢复性能测试模块在计算恢复时间目标后,向数据获取模块输出数据获取命令; 将该数据获取模块返回的灾难发生前备份的数据和恢复后的数据进行比较,根据比较结果分析系统的容灾恢复能力;数据获取模块,用于根据输入的数据获取命令,将分别获取的灾难发生前备份的数据和恢复后的数据返回给恢复性能测试模块。进一步地,该装置还包括与所述恢复性能测试模块连接的恢复性能记录模块,其中恢复性能测试模块将计算出的所述恢复时间目标、比较结果及分析结论中一种或多种信息作为持续数据保护的性能信息输出给恢复性能记录模块;恢复性能记录模块,用于记录和/或显示输入的持续数据保护的性能信息。本发明通过在现有的⑶P中注入监测守护模块,来监测到⑶P内部动态输入输出 (10, Input Output)的流动、流量的变化等事件的发生,从而获取到⑶P的RTO及其它性能信息,并找到影响系统恢复的瓶颈。


图1为本发明的获取系统持续数据保护的性能信息的方法实施例的流程图;图2为图1所示方法实施例的具体应用实例流程图;图3为本发明的获取系统持续数据保护的性能信息的装置实施例的结构框图。
具体实施例方式以下结合附图和优选实施例对本发明的技术方案进行详细地阐述。应该理解,以下例举的实施例仅用于说明和解释本发明,而不构成对本发明技术方案的限制。本发明的获取灾难后系统持续数据保护的性能信息的方法实施例,其流程如图1 所示,包括如下步骤110 通过在⑶P中注入的监测守护模块监测系统中的恢复事件;在此方法实施例中,恢复事件通过监测系统输入输出(IO)数据流监测。系统IO 数据流包括主机设备(作为服务端的服务器设备/作为客户端的计算机设备)IO总线层和主机设备内块设备驱动层的数据流。为了提高监测的精确度,系统IO数据流可通过对主机设备IO总线上数据流监测, 也可以通过对块设备驱动层的数据流监测。其中,对主机设备IO总线上数据流监测,例如通过对主机设备插入的网卡(NIC,Network Interface Cord)上相关总线的数据流量进行监测。通过对多个层次的IO流监测的分析和对比,自适应地找到最佳监测方式。120 根据监测的恢复事件获知⑶P的性能信息;监测的恢复事件至少包括开始恢复事件和结束恢复事件。其中,开始恢复事件主要通过发现主机设备IO总线层和块设备驱动层有大量数据流在移动监测到;结束恢复事件主要通过发现系统IO总线层和块设备驱动层大量数据流的移动停止监测到。130:比较灾难发生前和恢复后的数据,并根据比较结果分析系统数据恢复能力。如图2所示,是图1所示的方法实施例的一个具体应用实例的流程,包括如下步骤210 在⑶P中注入监测守护模块;在⑶P中注入的监测守护模块,例如一个监测守护进程。220 通过监测守护模块监测主机设备IO总线层的数据流和/或设备驱动层的数据流;230 判断是否有开始恢复事件发生,是则执行步骤M0,否则执行步骤250 ;在此,通过监测到主机设备IO总线层和/或块设备驱动层有大量数据流在移动, 来判断有开始恢复事件发生。
240 记录发生开始恢复事件的时间;250 判断是否有结束恢复事件发生,是则执行步骤沈0,否则返回步骤220执行;在此,通过监测到主机设备IO总线层和/或块设备驱动层大量数据流的移动停止,来判断有结束恢复事件发生。260 记录发生结束恢复事件的时间,并计算RTO ;其中,RTO =发生结束恢复事件的时间-发生开始恢复事件的时间。270:比较灾难发生前备份的数据和恢复后的数据,根据比较结果分析容灾系统恢复能力;本发明可通过消息摘要算法(Message Digest Algorithm MD5)或其它方式对灾难发生前和恢复后的数据进行比较,如果比较结果为一致,则确定数据恢复有效且一致性好,如果比较结果为不一致,则确定数据恢复失败。280 将计算出的RT0、比较结果以及分析结论作为⑶P性能信息记录在日志中,结束流程。还可以定时地将记录的上述⑶P性能信息显示出来。例如通过图表的形式显示 RTO随时间发展的态势,即图表的横坐标是时间,纵坐标是RTO数值。以上所有监测信息均以日志的形式进行记录、备份和归档,并可以对RTO的数值进行分析和比较来找到相关的技术瓶颈。此外,分析结论可用图表的形式呈现。本发明针对上述方法实施例,相应地还提供了获取灾难后系统持续数据保护的性能信息的装置实施例,其结构如图3所示,包括相互连接的监测守护模块310、恢复性能测试模块320,其中监测守护模块310,用于注入到系统的持续数据保护中监测恢复事件;恢复性能测试模块320,用于根据监测的恢复事件获知CDP性能信息。在上述装置实施例中,监测守护模块310通过监测系统输入输出(IO)数据流来监测恢复事件,包括监测开始恢复事件和结束恢复事件,并将监测发生开始恢复数据事件的第一时间和发生结束恢复数据事件的第二时间输出给恢复性能测试模块320 ;恢复性能测试模块320根据输入的第二时间和第一时间之差计算获取⑶P的RTO
fn息ο在上述装置实施例中,监测守护模块310通过监测到主机设备IO总线层和/或块设备驱动层有大量数据流在移动,则判断发生开始恢复事件;通过监测到主机设备IO总线层和/或块设备驱动层大量数据流的移动停止,则判断发生结束恢复事件。在上述装置实施例中,还包括与恢复性能测试模块320连接数据获取模块330,其中恢复性能测试模块320在计算获取RTO信息后,向数据获取模块330输出数据获取命令;将数据获取模块330返回的灾难发生前备份的数据和恢复后的数据进行比较,根据比较结果分析系统的容灾恢复能力;数据获取模块330,用于根据输入的数据获取命令,将分别获取的灾难发生前备份的数据和恢复后的数据返回给恢复性能测试模块320。
在上述装置实施例中,恢复性能测试模块320在数据的比较结果为一致时,确定数据恢复有效且一致性好且容灾能力符合规定;在数据的比较结果为不一致时,则确定数据恢复失败且容灾能力不符合规定。在上述装置实施例中,还包括与恢复性能测试模块320连接的恢复性能记录模块 340,其中恢复性能测试模块320将计算出的RT0、比较结果及分析结论一种或多种信息作为CDP性能信息输出给恢复性能记录模块340 ;恢复性能记录模块340,用于记录和/或显示输入的⑶P性能信息。本发明通过注入事件自动测试⑶P的RTO及其它⑶P性能信息的方法及装置,能够有效地找到系统影响数据恢复的瓶颈。本发明通过注入的监测守护模块监测系统中的数据恢复事件,不影响CDP的相关性能;该监测守护模块主要是对IO总线数据流进行分析和监测,并不占用CDP的资源,因此不会因为监测到相关事件的发生而影响CDP的性能。对于本领域的专业人员来说,在了解了本发明内容和原理后,能够在不背离本发明的原理和范围的情况下,根据本发明的方法进行形式和细节上的各种修正和改变,但是这些基于本发明的修正和改变仍在本发明的权利要求保护范围之内。
权利要求
1.一种获取灾难后系统持续数据保护的性能信息的方法,其特征在于,包括通过在所述系统持续数据保护中注入的监测守护模块监测系统中的恢复事件;根据监测的所述恢复事件获取所述持续数据保护的性能信息。
2.按照权利要求1所述的方法,其特征在于,通过在所述持续数据保护中注入的监测守护模块监测系统中的恢复事件,具体包括在所述持续数据保护中注入所述监测守护模块;通过所述监测守护模块监测所述系统输入输出数据流监测所述恢复事件,包括监测开始恢复事件和结束恢复事件。
3.按照权利要求2所述的方法,其特征在于,通过所述监测守护模块监测所述系统输入输出数据流监测所述开始恢复事件和所述结束恢复事件,具体包括监测所述系统中主机设备输入输出总线层的数据流和/或所述主机设备内设备驱动层的数据流;当监测到所述主机设备输入输出总线层和/或所述块设备驱动层有大量数据流在移动,则判断发生所述开始恢复事件,并记录发生该开始恢复事件的第一时间;当监测到所述主机设备输入输出总线层和/或所述块设备驱动层的大量数据流的移动停止,则判断发生所述结束恢复事件,并记录发生该结束恢复事件的第二时间。
4.按照权利要求3所述的方法,其特征在于,根据监测的所述恢复事件获取所述持续数据保护的性能信息,具体包括根据第二时间和第一时间的差,计算恢复时间目标,作为所述持续数据保护的性能信息之一获取。
5.按照权利要求4所述的方法,其特征在于,根据监测的所述恢复事件获取所述持续数据保护的性能信息,还包括比较灾难发生前备份的数据和恢复后的数据,根据比较结果分析容灾系统恢复能力, 作为所述持续数据保护的性能信息之一获取。
6.按照权利要求5所述的方法,其特征在于,还包括记录和/或显示所述持续数据保护的性能信息。
7.一种获取灾难后系统持续数据保护的性能信息的装置,其特征在于,包括相互连接的监测守护模块、恢复性能测试模块,其中监测守护模块,用于注入到所述系统持续数据保护中监测恢复事件;恢复性能测试模块,用于根据监测的所述恢复事件获知所述持续数据保护的性能信息。
8.按照权利要求7所述的装置,其特征在于,所述监测守护模块通过监测系统输入输出数据流来监测所述恢复事件,包括监测开始恢复事件和结束恢复事件,并将监测到发生所述开始恢复事件的第一时间和发生所述结束恢复事件的第二时间输出给所述恢复性能测试模块;所述恢复性能测试模块根据输入的第二时间和第一时间之差计算恢复时间目标,作为所述持续数据保护的性能信息之一获取。
9.按照权利要求8所述的装置,其特征在于,所述监测守护模块通过监测到所述系统内主机设备输入输出总线层和/或所述主机设备内块设备驱动层有大量数据流在移动,则判断发生所述开始恢复事件;通过监测到所述主机设备输入输出总线层和/或所述块设备驱动层大量数据流的移动停止,则判断发生所述结束恢复事件。
10.按照权利要求8或9所述的装置,其特征在于,还包括与所述恢复性能测试模块连接数据获取模块,其中所述恢复性能测试模块在计算所述恢复时间目标后,向数据获取模块输出数据获取命令;将该数据获取模块返回的灾难发生前备份的数据和恢复后的数据进行比较,根据比较结果分析系统的容灾恢复能力;数据获取模块,用于根据输入的数据获取命令,将分别获取的灾难发生前备份的数据和恢复后的数据返回给所述恢复性能测试模块。
11.按照权利要求10所述的装置,其特征在于,还包括与所述恢复性能测试模块连接的恢复性能记录模块,其中所述恢复性能测试模块将计算出的所述恢复时间目标、比较结果及分析结论中一种或多种信息作为所述持续数据保护的性能信息输出给恢复性能记录模块;恢复性能记录模块,用于记录和/或显示输入的所述持续数据保护的性能信息。
全文摘要
本发明披露了获取灾难后系统持续数据保护的性能信息的方法及装置,其中方法包括通过在系统持续数据保护中注入的监测守护模块监测系统中的恢复事件;根据监测的恢复事件获取持续数据保护的性能信息。本发明通过在现有的CDP中注入监测守护模块,来监测到CDP内部动态输入输出的流动、流量的变化等事件的发生,从而自动测试CDP的RTO及其它性能信息,并找到影响系统恢复的瓶颈。
文档编号G06F11/14GK102508739SQ20111032207
公开日2012年6月20日 申请日期2011年10月20日 优先权日2011年10月20日
发明者张志 申请人:浪潮(北京)电子信息产业有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1