信息系统数据一致性检测方法

文档序号:6555139阅读:204来源:国知局
专利名称:信息系统数据一致性检测方法
技术领域
本发明提出了一种信息系统数据一致性检测方法,属于信息安全领域。
背景技术
在信息系统中,为保证商业连续,数据备份非常重要,数据一致性检测可以检测源数据与备份数据是否处于一致状态,因此,数据一致性检测在信息系统中起到十分重要的作用。目前比较成熟的数据一致性检测方法有借助备份软件的日志、完全磁盘数据比较等来确保源数据和备份数据是处于一致的状态,其中借助备份软件的日志的方法与备份软件相关,在进行数据一致性检测时依赖于备份软件的日志,而完全磁盘数据比较的方法存在的问题是比较的数据量大、网络的负载大、数据一致性检测的速度低下。
本发明提出了一种通用的数据一致性检测方法,具有如下特点1)检测速度快、网络流量少、对网络的带宽要求低;2)该方法可基于廉价的Internet,降低了系统的成本;3)数据的检测是基于数据块进行操作的,对应用透明。
该方法可以广泛用于网络信息系统中确认源数据和备份数据是否处于一致的状态,其中源数据和备份数据可以是文件数据、数据库数据、磁盘数据等等,本发明具有广阔的应用前景。

发明内容
本发明提出了一种信息系统数据一致性检测方法,该方法通过对备份数据与源数据进行差异性检测,确认源数据和备份数据是否处于一致的状态,其中源数据和备份数据在物理上的位置不受限,可分处于异地,源数据和备份数据可以是文件数据、数据库数据、磁盘数据等。
该方法首先对源数据和备份数据进行同样的数据分块,分块后源数据和备份数据分别得到各自的数据块集。在对源数据和备份数据进行数据分块时,采取的分块方法一致,所以源数据分块后得到的数据块和备份数据分块后得到的数据块是一一对应的,即源数据的各个数据块在备份数据中有唯一个数据块与之对应。其次,对源数据的各数据块和备份数据的各数据块分别求摘要值;然后,对源数据的各个数据块的摘要值分别和备份数据相对应的数据块的摘要值进行比较,若源数据的数据块的摘要值和备份数据与之对应的数据块的摘要值相同,则认为该数据块的数据在源数据和备份数据是一致的,否则,则认为该数据块的数据在源数据和备份数据是不一致的;当对所有数据块的数据一致性检测完成后,源数据和备份数据的一致性检测工作也就完成了。


图1是体系架构图。
图2是数据分块的步骤。
图3是数据块摘要值计算的步骤。
图4是差异数据一致性检测的步骤。
具体实施例方式
以下结合附图详细说明本发明的具体方法。
图1是体系架构图。
图1是本发明的体系架构,其中源数据和备份数据在物理上的位置不受限,可分处于异地。数据一致性检测主要由数据分块、数据块摘要值计算和差异数据一致性检测等三个步骤的结合来实现。其中数据分块步骤对源数据和备份数据进行数据分块,建立各自的数据块集;数据块摘要值计算步骤对源数据和备份数据的各数据块进行摘要值计算;差异数据一致性检测步骤对源端数据块的摘要值和备份端相应数据块的摘要值进行比较,实现对数据块的数据一致性检测。
具体地,本发明提出的信息系统数据一致性检测方法的步骤包括以下步骤1)数据分块的步骤;2)数据块摘要值计算的步骤;3)差异数据一致性检测的步骤。
图2是数据分块的步骤。
图2给出了对一个数据进行数据分块的示例。图中数据是由数据单元组成,各数据单元大小相同,若数据的最后一个数据单元的大小小于其它数据单元的大小,则用空白补齐最后一个数据单元使它的大小和其它数据单元的大小一致。数据块由逻辑上连续的一个或多个数据单元组成,各数据块的大小可以不同。这样数据即可以看成是由数据单元组成,也可以看成是由数据块组成。
数据分块步骤如下1)源数据分块步骤对源数据进行分块,具体步骤如下
①定义数据单元的大小将数据划分为定长大小的数据单元,若数据的最后一个数据单元的大小小于定义数据单元的大小,则用空白补齐最后一个数据单元使它的大小为定义数据单元的大小;②定义数据块的大小规定数据块的大小,即包含的数据单元数,各数据块的大小可以不同;③计算数据块的数目计算构成整个数据的数据块的数目。
2)备份数据分块步骤对备份数据进行分块,具体步骤如下①定义数据单元的大小将数据划分为定长大小的数据单元,若数据的最后一个数据单元的大小小于定义数据单元的大小,则用空白补齐最后一个数据单元使它的大小为定义数据单元的大小;②定义数据块的大小规定数据块的大小,即包含的数据单元数,各数据块的大小可以不同;③计算数据块的数目计算构成整个数据的数据块的数目。
通过以上步骤,对源数据和备份数据进行一样的数据分块策略,即源数据和备份数据在分块时数据单元的大小、数据块的数目、各数据块的大小都分别相同,分块后得到源数据和备份数据的数据块集合。
图3数据块摘要值计算的步骤。
图3给出了数据块摘要值计算的示例。图中数据块由m个数据单元组成,H为摘要计算函数,如MD5、SHA-1等,每个数据单元有一个摘要值,图中通过累积计算各个数据单元的摘要值得出数据块的摘要值,图中h为图示的数据块的摘要值。
数据块摘要值计算的步骤如下1)数据块摘要计算初始化初始化有关变量,令数据块的摘要值h=空,数据单元的编号i=1;2)计算当前数据单元的摘要值h′h′=H(di),其中H为摘要函数,di是当前数据块的第i块数据单元;
3)累积计算当前数据块摘要值h=H(h⊙h′);其中⊙表示字符串的连接运算,=i+1;若i不大于当前数据块的大小,则转2),否则h即为当前数据块的摘要值。
图4是差异数据一致性检测的步骤。
图4给出了差异数据一致性检测的步骤,如图所示,首先进行差异数据一致性检测初始化工作,其次分别求得源数据和备份数据相对应数据块的摘要值,然后比较数据块的摘要值,若两端数据块的摘要值相同,则认为源数据的该数据块的数据和备份数据的相应数据块的数据处于一致的状态,若数据块的摘要值不同,则认为源数据的该数据块的数据和备份数据的相应数据块的数据处于不一致的状态,重复以上的步骤直到完成源数据和备份数据的所有数据块的差异性检测。
具体地,差异数据一致性检测的步骤如下1)差异数据一致性检测初始化初始化有关变量,令数据块的编号i=1;2)计算源数据端相应数据块的摘要值调用数据块摘要值计算的步骤计算源数据端第i块数据块的摘要值h;3)计算备份数据端相应数据块的摘要值调用数据块摘要值计算的步骤计算备份数据端第i块数据块的摘要值h′;4)数据块一致性检测若h=h′,则当前数据块在源数据端和备份数据端处于一致的状态,否则,当前数据块在源数据端和备份数据端处于不一致的状态;5)循环检测下一数据块的差异i=i+1;若i不大于数据块的总数,则转2),否则结束检测工作。
权利要求
1.一种信息系统数据一致性检测方法,其特征在于包括以下步骤数据分块的步骤;数据块摘要值计算的步骤;差异数据一致性检测的步骤;其中数据分块的步骤包括以下步骤源数据分块的步骤;备份数据分块的步骤;数据块摘要值计算的步骤包括以下步骤数据块摘要计算初始化的步骤;计算当前数据单元的摘要值的步骤;累积计算当前数据块摘要值的步骤;差异数据一致性检测的步骤包括以下步骤差异数据一致性检测初始化的步骤;计算源数据端相应数据块的摘要值的步骤;计算备份数据端相应数据块的摘要值的步骤;数据块一致性检测的步骤;循环检测下一数据块的差异的步骤。
2.权利要求1所述的一种信息系统数据一致性检测方法,其特征在于数据分块的步骤中,源数据分块的步骤和备份数据分块的步骤包括以下步骤定义数据单元的大小的步骤;定义数据块的大小的步骤;计算数据块的数目的步骤。
全文摘要
本发明提出了一种信息系统数据一致性检测方法,属于信息安全领域。本发明通过对备份数据与源数据进行差异性检测,确认源数据和备份数据是否处于一致的状态,其中源数据和备份数据在物理上的位置不受限,可分处于异地,源数据和备份数据可以是文件数据、数据库数据、磁盘数据等等。本发明具有检测速度快、对网络的带宽要求低、对应用层透明等特点,可广泛应用于网络信息系统数据备份的一致性检测,具有广阔的应用前景。
文档编号G06F17/30GK1818878SQ20061002045
公开日2006年8月16日 申请日期2006年3月10日 优先权日2006年3月10日
发明者李涛 申请人:四川大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1