一种分层数据复制的大数据一致性维护方法

文档序号:6621869阅读:136来源:国知局
一种分层数据复制的大数据一致性维护方法
【专利摘要】本发明公开了一种分层数据复制的大数据一致性维护方法,基于索引的复制控制方法,所述方法将数据备份和索引信息分别存储,服务器被分为备份数据中心和索引数据中心,分别存储数据的备份与备份的位置信息。针对大数据一致性维护的实现,本发明提出一种基于索引的复制控制算法,将数据备份和备份的位置,即索引信息分别存储,使算法适合大规模数据读写操作,且代价较低。
【专利说明】一种分层数据复制的大数据一致性维护方法

【技术领域】
[0001]本发明涉及一种分层数据复制的大数据一致性维护方法,属于计算机大数据管理领域。

【背景技术】
[0002]数据一致性通常指关联数据之间的逻辑关系是否正确和完整。而数据存储的一致性模型则可以认为是存储系统和数据使用者之间的一种约定。如果使用者遵循这种约定,则可以得到系统所承诺的访问结果。
[0003]常用的一致性模型有:
a、严格一致性(linearizability, strict/atomic Consistency):读出的数据始终为最近写入的数据。这种一致性只有全局时钟存在时才有可能,在分布式网络环境不可能实现。
[0004]b、顺序一致性(sequential consistency):所有使用者以同样的顺序看到对同一数据的操作,但是该顺序不一定是实时的。
[0005]C、因果一致性(causal consistency):只有存在因果关系的写操作才要求所有使用者以相同的次序看到,对于无因果关系的写入则并行进行,无次序保证。因果一致性可以看做对顺序一致性性能的一种优化,但在实现时必须建立与维护因果依赖图,是相当困难的。
[0006]d、管道一致性(PRAM/FIFO consistency):在因果一致性模型上的进一步弱化,要求由某一个使用者完成的写操作可以被其他所有的使用者按照顺序的感知到,而从不同使用者中来的写操作则无需保证顺序,就像一个一个的管道一样。相对来说比较容易实现。
[0007]e、弱一致性(weak consistency):只要求对共享数据结构的访问保证顺序一致性。对于同步变量的操作具有顺序一致性,是全局可见的,且只有当没有写操作等待处理时才可进行,以保证对于临界区域的访问顺序进行。在同步时点,所有使用者可以看到相同的数据。
[0008]f、释放一致性(release consistency):弱一致性无法区分使用者是要进入临界区还是要出临界区,释放一致性使用两个不同的操作语句进行了区分。需要写入时使用者acquire该对象,写完后release, acquire-release之间形成了一个临界区,提供释放一致性也就意味着当release操作发生后,所有使用者应该可以看到该操作。
[0009]g、最终一致性(eventual consistency):当没有新更新的情况下,更新最终会通过网络传播到所有副本点,所有副本点最终会一致,也就是说使用者在最终某个时间点前的中间过程中无法保证看到的是新写入的数据。可以采用最终一致性模型有一个关键要求:读出陈旧数据是可以接受的。
[0010]h、delta consistency:系统会在delta时间内达到一致。这段时间内会存在一个不一致的窗口,该窗口可能是因为log shipping的过程导致。数据一致性(DatabaseConsistency)是指事务执行的结果必须是使数据从一个一致性状态变到另一个一致性状态。
[0011]保证数据一致性是指当事务完成时,必须使所有数据都具有一致的状态。在关系型数据中,所有的规则必须应用到事务的修改上,以便维护所有数据的完整性。
[0012]读一致性也是数据一致性的一个重要方面,对一个表中的某些数据进行了更新操作,但是还没有进行提交,这时另外一个用户读取表中数据,就出现了读一致性的问题。


【发明内容】

[0013]本发明要解决的技术问题是:一种分层数据复制的大数据一致性维护方法。
[0014]本发明所采用的技术方案为:
一种分层数据复制的大数据一致性维护方法,基于索引的复制控制方法,所述方法将数据备份和备份的位置(即:索引)信息分别存储,服务器被分为备份数据中心和索引数据中心,分别存储数据的备份与备份的位置信息。
[0015]为了提高检索速度,将索引拷贝为两个,分别为读和写操作提供检索服务。
[0016]两个索引队列间隔一定时间后进行通信以便保持一致性,加入日志表用于记录执行过的写操作,定时更新两列索引加入时间戳,当数据可靠值相同时,根据时间戳读取数据。
[0017]本发明的有益效果为:针对大数据一致性维护的实现,本发明提出一种基于索引的复制控制算法,将数据备份和备份的位置,即索引信息分别存储,使算法适合大规模数据读写操作,且代价较低。

【专利附图】

【附图说明】
[0018]图1为本发明大数据一致性维护方法的示意图。

【具体实施方式】
[0019]下面通过附图,结合【具体实施方式】对本发明进一步说明:
实施例1:
一种分层数据复制的大数据一致性维护方法,基于索引的复制控制方法,所述方法将数据备份和备份的位置(即:索引)信息分别存储,服务器被分为备份数据中心和索引数据中心,分别存储数据的备份与备份的位置信息。
[0020]实施例2:
在实施I的基础上,为了提高检索速度,将索引拷贝为两个,分别为读和写操作提供检索服务。
[0021]实施例3:
在实施例2的基础上,两个索引队列间隔一定时间后进行通信以便保持一致性,加入日志表用于记录执行过的写操作,定时更新两列索引加入时间戳,当数据可靠值相同时,根据时间戳读取数据。
【权利要求】
1.一种分层数据复制的大数据一致性维护方法,其特征在于:所述方法将数据备份和索引信息分别存储,服务器被分为备份数据中心和索引数据中心,分别存储数据的备份与备份的位置信息。
2.根据权利要求1所述的一种分层数据复制的大数据一致性维护方法,其特征在于:将索引拷贝为两个,分别为读和写操作提供检索服务。
3.根据权利要求2所述的一种分层数据复制的大数据一致性维护方法,其特征在于:两个索引队列间隔一定时间后进行通信以便保持一致性,加入日志表用于记录执行过的写操作,定时更新两列索引加入时间戳,当数据可靠值相同时,根据时间戳读取数据。
【文档编号】G06F17/30GK104133886SQ201410367869
【公开日】2014年11月5日 申请日期:2014年7月30日 优先权日:2014年7月30日
【发明者】戴鸿君, 于治楼 申请人:浪潮集团有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1