一种重复数据删除方法、装置及系统的制作方法

文档序号:6551076阅读:167来源:国知局
一种重复数据删除方法、装置及系统的制作方法
【专利摘要】本发明适用于数据库【技术领域】,提供了一种重复数据删除方法、装置及系统,包括:内存数据库在缓存区中,缓存待写入外部存储器的数据页;在将缓存中的数据页写入所述外部存储器时,调取所述数据页;根据SHA安全散列算法,对调取到的所述数据页中的数据进行压缩映射,生成所述数据页对应的指纹值;在预置的指纹索引表中,查找是否存在所述指纹值;若在预置的指纹索引表中存在所述指纹值时,判断所述数据页为冗余页,不将所述数据页写入所述外部存储器中的数据文件,将所述数据页对应的指纹值写入所述外部存储器中的备份信息文件。本发有益效果在于两方面,一方面,节省了外部存储器的存储空间;另一方面,提高了内存数据库备份当前数据的效率。
【专利说明】一种重复数据删除方法、装置及系统

【技术领域】
[0001]本发明属于数据库【技术领域】,尤其涉及一种重复数据删除方法、装置及系统。

【背景技术】
[0002]内存数据库是一类将数据库中的数据完全放在内存中的新型数据库,由于所有的操作均在内存中完成,因此,相比传统基于内存的数据库,内存数据库在性能方面具有不可比拟的巨大优势,十分适合对于性能要求极高的应用场合。与此同时,内存数据库通过持续数据保护,定期自动将当前数据备份至外部存储器,以避免出现断电等故障会造成内存中的数据丢失的情况。由于内存数据库需要向外界提供极高的访问性能,因此内存数据库备份当前数据必须在极短的时间内完成。
[0003]然而,现有内存数据库通过持续数据保护,会将当前数据中的重复数据备份至外部存储器,而当前数据中的重复数据是内存数据库不需要备份的,备份重复数据既浪费了外部存储器的存储空间,又降低了内存数据库备份当前数据的效率,使得内存数据库备份当前数据无法在极短的时间内完成。若内存数据库对当前数据中重复数据进行删除,则需要通过遍历当前数据的方式,以判断某个当前数据中是否存在重复数据,但在内存数据库中,只会显示当前数据各个数据块的名称、创建日期等,内存数据库无法通过这些信息,准确判断当前数据是否存在重复数据,导致备份重复数据浪费了外部存储器的存储空间,降低内存数据库备份当前数据的效率。


【发明内容】

[0004]本发明实施例的目的在于提供一种重复数据删除方法,旨在解决现有的内存数据库在持续数据保护时,会将当前数据中的重复数据备份至外部存储器,导致备份重复数据浪费了外部存储器的存储空间,降低了内存数据库备份当前数据的效率,使得内存数据库备份当前数据无法在极短的时间内完成的问题。
[0005]本发明实施例是这样实现的,一种重复数据删除方法,包括:
[0006]内存数据库在缓存区中,缓存待写入外部存储器的数据页;
[0007]在将缓存中的数据页写入所述外部存储器时,调取所述数据页;
[0008]根据SHA安全散列算法,对调取到的所述数据页中的数据进行压缩映射,生成所述数据页对应的指纹值;
[0009]在预置的指纹索引表中,查找是否存在所述指纹值;
[0010]若在预置的指纹索引表中存在所述指纹值时,判断所述数据页为冗余页,不将所述数据页写入所述外部存储器中的数据文件,将所述数据页对应的指纹值写入所述外部存储器中的备份信息文件;
[0011]其中,所述数据文件中保存了所述内存数据库的数据页;
[0012]其中,所述备份信息文件中保存了本次备份所述数据页对应的指纹值;
[0013]其中,所述指纹值在所述备份信息文件中,按照所述数据页在写入外部存储器时的顺序排列;
[0014]其中,所述指纹索引表中包括已写入所述数据文件的数据页对应的指纹值,以及已写入所述数据文件的数据页对应的指纹值,在所述数据文件中的数据页偏移量。
[0015]本发明实施例的另一目的在于提供一种重复数据删除装置,包括:
[0016]缓存单元,用于在缓存区中,缓存待写入外部存储器的数据页;
[0017]调取单元,用于在将缓存中的数据页写入所述外部存储器时,调取所述数据页;
[0018]生成单元,用于根据SHA安全散列算法,对调取到的所述数据页中的数据进行压缩映射,生成所述数据页对应的指纹值;
[0019]查找单元,用于在预置的指纹索引表中,查找是否存在所述指纹值;
[0020]第一写入单元,用于若在预置的指纹索引表中存在所述指纹值时,判断所述数据页为冗余页,不将所述数据页写入所述外部存储器中的数据文件,将所述数据页对应的指纹值写入所述外部存储器中的备份信息文件;
[0021]其中,所述数据文件中保存了所述内存数据库的数据页;
[0022]其中,所述备份信息文件中保存了本次备份所述数据页对应的指纹值;
[0023]其中,所述指纹值在所述备份信息文件中,按照所述数据页在写入外部存储器时的顺序排列;
[0024]其中,所述指纹索引表中包括已写入所述数据文件的数据页对应的指纹值,以及已写入所述数据文件的数据页对应的指纹值,在所述数据文件中的数据页偏移量。
[0025]在本发明实施例中,若在预置的指纹索引表中存在指纹值,判断数据页为冗余页,不将数据页写入所述外部存储器中的数据文件,解决了内存数据库在持续数据保护时,会将当前数据中的重复数据备份至外部存储器,导致备份重复数据浪费了外部存储器的存储空间,降低了内存数据库备份当前数据的效率的问题。其有益效果在于两方面,一方面,节省了外部存储器的存储空间;另一方面,提高了内存数据库备份当前数据的效率。

【专利附图】

【附图说明】
[0026]图1是本发明实施例提供的重复数据删除方法的实现流程图;
[0027]图2是本实施例提供的三个备份点的数据文件较佳的样例图;
[0028]图3是本发明实施例提供的重复数据删除在实际应用中较佳的备份流程图;
[0029]图4是本发明实施例提供的重复数据删除在实际应用中较佳的恢复流程图;
[0030]图5是本发明实施例提供的重复数据删除装置的结构框图;
[0031]图6是一种重复数据删除系统网络结构图。

【具体实施方式】
[0032]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0033]实施例一
[0034]参考图1,图1是本发明实施例提供的一种重复数据删除方法的实现流程图,详述如下:
[0035]在步骤SlOl中,内存数据库在缓存区中,缓存待写入外部存储器的数据页;
[0036]其中,外部存储器包括但不限于磁盘、软盘,硬盘或光盘。
[0037]其中,待写入外部存储器的数据页,也就是备份至外部存储器的当前数据的数据页。
[0038]其中所述内存数据库在缓存区中,缓存待写入外部存储器的数据页,具体为:
[0039]所述内存数据库在缓存区中,缓存待写入外部存储器的数据页,同时将外界的数据请求事件存放在一个缓存队列中,以停止处理外界的数据请求事件。
[0040]其中,内存数据库停止处理外界的数据请求事件,保证数据库中的数据是一致的,提闻了备份的稳定性。
[0041]在步骤S102中,在将缓存中的数据页写入所述外部存储器时,调取所述数据页;
[0042]其中,检测将缓存中的数据页写入外部存储器的事件,当检测到将缓存中的数据页写入外部存储器的事件,根据写入顺序调取数据页。
[0043]在步骤S103中,根据SHA安全散列算法,对调取到的所述数据页中的数据进行压缩映射,生成所述数据页对应的指纹值;
[0044]其中,可以采用现有的任意一种安全散列算法对调取到的所述数据页中的数据进行压缩映射,生成数据页对应的指纹值。
[0045]例如,通过SHA-1hash函数,对调取到的所述数据页中的数据进行压缩映射,生成数据页对应的指纹值。
[0046]在步骤S104中,在预置的指纹索引表中,查找是否存在所述指纹值;
[0047]其中,所述指纹索引表中包括已写入所述数据文件的数据页对应的指纹值,以及已写入所述数据文件的数据页对应的指纹值,在所述数据文件中的数据页偏移量。
[0048]其中,在预置的指纹索引表中,查找是否存在待写入外部存储器的数据页的指纹值,以判断待写入外部存储器的数据页是否与已写入数据文件的数据页重复。
[0049]在步骤S105中,若在预置的指纹索引表中存在所述指纹值时,判断所述数据页为冗余页,不将所述数据页写入所述外部存储器中的数据文件,将所述数据页对应的指纹值写入所述外部存储器中的备份信息文件;
[0050]其中,所述数据文件中保存了所述内存数据库的数据页;
[0051]其包括多个备份点,每一次备份,生成一个备份点。
[0052]参考图2,图2是本实施例提供的三个备份点的数据文件较佳的样例图。
[0053]其中,所述备份信息文件中保存了本次备份所述数据页对应的指纹值;
[0054]其中,所述指纹值在所述备份信息文件中,按照所述数据页在写入外部存储器时的顺序排列。
[0055]其中,冗余页是指重复的数据页。
[0056]其中,若在预置的指纹索引表中存在所述指纹值时,表示待写入外部存储器的数据页对应的指纹值与已写入所述数据文件的数据页对应的指纹值重复,由于指纹值与数据页相对应,因此可判断出待写入外部存储器的数据页与已写入数据文件的数据页重复,判断待写入外部存储器的数据页为冗余页,不写入所述外部存储器中的数据文件,将所述数据页对应的指纹值写入所述外部存储器中的备份信息文件。
[0057]在本实施例中,若在预置的指纹索引表中存在指纹值,判断数据页为冗余页,不将数据页写入所述外部存储器中的数据文件,解决了内存数据库在持续数据保护时,会将当前数据中的重复数据备份至外部存储器,导致备份重复数据浪费了外部存储器的存储空间,降低了内存数据库备份当前数据的效率的问题。其有益效果在于两方面,一方面,节省了外部存储器的存储空间;另一方面,提高了内存数据库备份当前数据的效率。
[0058]实施例二
[0059]本实施例主要描述了若在预置的指纹索引表中不存在所述指纹值时的实施过程,详述如下:
[0060]在预置的指纹索引表中,查找是否存在所述指纹值之后,还包括:
[0061]若在预置的指纹索引表中不存在所述指纹值时,判断所述数据页不为冗余页,将所述数据页写入所述数据文件;
[0062]获取所述数据页在所述数据文件中的数据页偏移量;
[0063]将所述数据页对应的指纹值以及所述数据页在所述数据文件中的数据页偏移量写入指纹索引表中,并将所述数据页对应的指纹值写入内存备份信息文件。
[0064]其中,若在预置的指纹索引表中不存在所述指纹值,表示待写入外部存储器的数据页对应的指纹值与已写入所述数据文件的数据页对应的指纹值不重复,由于指纹值与数据页相对应,因此可判断出待写入外部存储器的数据页与已写入数据文件的数据页不重复。将待写入外部存储器的数据页对应的指纹值以及待写入外部存储器的数据页在所述数据文件中的数据页偏移量写入指纹索引表中,并将待写入外部存储器的数据页对应的指纹值写入内存备份信息文件。
[0065]在本实施例中,将待写入外部存储器的数据页对应的指纹值写入内存备份信息文件,便于后续通过内存备份信息文件,恢复备份前的内存数据库。
[0066]实施例三
[0067]本实施例主要描述了还原内存数据库中的数据页的实施过程,详述如下:
[0068]接收选择的备份点;
[0069]根据接收到的备份点读取所述备份信息文件,在所述备份信息文件中,逐个读取所述指纹值;
[0070]每读取一条所述指纹值,通过所述指纹值,在所述指纹索引表中,查找与所述指纹值对应的数据页偏移量;
[0071]根据所述数据页偏移量和数据页大小,在所述数据文件中读取所述数据页中的数据,并将读取到的数据加载到内存中,以还原所述内存数据库中的数据页。
[0072]在本实施例中,重复以上过程,直到完成还原,之后内存数据库中的数据恢复到了备份点的数据状态。
[0073]实施例四
[0074]本实施例主要描述了本发明在实际应用中的较佳的实施过程,详述如下:
[0075]内存数据库备份当前数据,以B+树的形式将当前数据写入外部存储器中的数据文件。内存数据库会将当前数据的数据页写入缓存中,内存数据库的缓存中保存着完整的内存数据库数据。重复数据删除在第一阶段执行,在将缓存中的数据页写入外部存储器时,首先通过SHA-1hash函数来计算数据页的指纹值,根据该指纹值通过查找指纹索引表来判断当前数据页是否为冗余数据页,指纹索引表中保存了已经写入数据文件的所有数据页对应的指纹值以及其对应的在数据文件中的数据页偏移量。
[0076]如果指纹在索引表中查找到,则说明该数据页为冗余数据页,将该数据页对应的指纹值写入备份信息文件中。
[0077]如果在指纹索引表中未查找到指纹值,则将当前数据页写入数据文件中,同时,将当前数据页对应的指纹值以及当前数据页在数据文件中的数据页偏移量写入指纹索引表中。最后,写入当前数据页对应的指纹值到备份信息文件中。
[0078]实施例五
[0079]本实施例主要描述了在实际应用中执行本发明的较佳的实施过程,详述如下:
[0080]读取系统时间和配置的执行时限,判断执行时限是否到达;
[0081]在所述执行时限到达时,执行所述内存数据库在缓存区中,缓存待写入外部存储器的数据页的步骤。
[0082]其中,内存数据库的备份指令可以是用户主动输入的更新启动命令触发,也可以是系统根据配置的执行时限,在执行时限到时自动触发。
[0083]在本实施例中,用户可以预先配置内存数据库的执行时限,例如配置为每半时、每小时、每日、每周或者每10天更新一次等,内存数据库监测执行时限,在执行时限到时,自动执行所述内存数据库在缓存区中,缓存待写入外部存储器的数据页的步骤。
[0084]实施例六
[0085]参考图3,图3是本发明实施例提供的重复数据删除在实际应用中较佳的备份流程图,详述如下:
[0086]S301,获取当前缓存中的数据页;
[0087]S302,计算 SHA — I 指纹值;
[0088]S303,查找指纹索引表;
[0089]S304,当前的指纹是否存在,是执行SS07,否则执行S305 ;
[0090]S305,将当前数据页写入数据文件中;
[0091]S306,将数据页对应指纹值写入指纹索引表中;
[0092]S307,将指纹值写入备份信息文件中。
[0093]实施例七
[0094]参考图4,图4是本发明实施例提供的重复数据删除在实际应用中较佳的恢复流程图,详述如下:
[0095]S401,读取备份信息文件;
[0096]S402,备信信息文件是否结束,是则执行S403,否则结束;
[0097]S403,获取一条指纹值;
[0098]S404,查找指纹值索引表;
[0099]S405,获取当前页偏移量;
[0100]S306,在数据文件中读取数据页;
[0101]实施例八
[0102]参照图5,图5是本发明实施例提供的一种重复数据删除装置的结构框图,该装置可以运行于具备内存的各种服务器。为了便于说明,仅示出了与本实施例相关的部分。
[0103]该重复数据删除装置,包括:
[0104]缓存单元,用于在缓存区中,缓存待写入外部存储器的数据页;
[0105]调取单元,用于在将缓存中的数据页写入所述外部存储器时,调取所述数据页;
[0106]生成单元,用于根据SHA安全散列算法,对调取到的所述数据页中的数据进行压缩映射,生成所述数据页对应的指纹值;
[0107]查找单元,用于在预置的指纹索引表中,查找是否存在所述指纹值;
[0108]第一写入单元,用于若在预置的指纹索引表中存在所述指纹值时,判断所述数据页为冗余页,不将所述数据页写入所述外部存储器中的数据文件,将所述数据页对应的指纹值写入所述外部存储器中的备份信息文件;
[0109]其中,所述数据文件中保存了所述内存数据库的数据页;
[0110]其中,所述备份信息文件中保存了本次备份所述数据页对应的指纹值;
[0111]其中,所述指纹值在所述备份信息文件中,按照所述数据页在写入外部存储器时的顺序排列;
[0112]其中,所述指纹索引表中包括已写入所述数据文件的数据页对应的指纹值,以及已写入所述数据文件的数据页对应的指纹值,在所述数据文件中的数据页偏移量。
[0113]进一步地,在该重复数据删除装置中,还包括:
[0114]第二写入单元,用于若在预置的指纹索引表中不存在所述指纹值时,判断所述数据页不为冗余页,将所述数据页写入所述数据文件;
[0115]获取单元,用于获取所述数据页在所述数据文件中的数据页偏移量;
[0116]第三写入单元,用于将所述数据页对应的指纹值以及所述数据页在所述数据文件中的数据页偏移量写入指纹索引表中,并将所述数据页对应的指纹值写入内存备份信息文件。
[0117]进一步地,在该重复数据删除装置中,还包括:
[0118]接收单元,用于接收选择的备份点;
[0119]读取备份信息文件单元,用于根据接收到的备份点读取所述备份信息文件,在所述备份信息文件中,逐个读取所述指纹值;
[0120]查找单元,用于每读取一条所述指纹值,通过所述指纹值,在所述指纹索引表中,查找与所述指纹值对应的数据页偏移量;
[0121]还原单元,用于根据所述数据页偏移量和数据页大小,在所述数据文件中读取所述数据页中的数据,并将读取到的数据加载到内存中,以还原所述内存数据库中的数据页。
[0122]进一步地,在该重复数据删除装置中,所述缓存单元,具体用于所述在缓存区中,缓存待写入外部存储器的数据页,同时将外界的数据请求事件存放在一个缓存队列中,以停止处理外界的数据请求事件。
[0123]进一步地,在该重复数据删除装置中,还包括:
[0124]判断单元,用于读取系统时间和配置的执行时限,判断执行时限是否到达;
[0125]执行单元,用于在所述执行时限到达时,执行所述内存数据库在缓存区中,缓存待写入外部存储器的数据页的步骤。
[0126]本发明实施例提供的重复数据删除装置可以应用在前述对应的方法实施例中,详情参见上述实施例的描述,在此不再赘述。
[0127]参考图6,图6是一种重复数据删除系统网络结构图,重复数据删除系统包括:重复数据删除装置和外部存储器,重复数据删除装置和外部存储器之间相连接。
[0128]重复数据删除装置内置于内部存储器中。
[0129]其中,外部存储器存放备份信息文件以及数据文件,重复数据删除装置用于在缓存区中,缓存待写入外部存储器的数据页,所述数据页包括数据页1、数据页2、数据页3、数据页4。
[0130]在将缓存中的数据页写入所述外部存储器时,调取数据页,根据SHA安全散列算法,对调取到的所述数据页中的数据进行压缩映射,生成所述数据页对应的指纹值,用于在预置的指纹索引表中,查找是否存在所述指纹值,若在预置的指纹索引表中存在所述指纹值时,判断所述数据页为冗余页,不将所述数据页写入所述外部存储器中的数据文件,将所述数据页对应的指纹值写入所述外部存储器中的备份信息文件。
[0131]其中,指纹索引表中包括已写入所述数据文件的数据页对应的指纹值,以及已写入所述数据文件的数据页对应的指纹值,在所述数据文件中的数据页偏移量。
[0132]例如,指纹索引表包括指纹1、与指纹I相对应的数据页偏移量(简称:偏移量1),指纹索引表包括指纹2、与指纹2相对应的数据页偏移量(简称:偏移量2)。
[0133]通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0134]以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何熟悉本【技术领域】的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
【权利要求】
1.一种重复数据删除方法,其特征在于,包括: 内存数据库在缓存区中,缓存待写入外部存储器的数据页; 在将缓存中的数据页写入所述外部存储器时,调取所述数据页; 根据SHA安全散列算法,对调取到的所述数据页中的数据进行压缩映射,生成所述数据页对应的指纹值; 在预置的指纹索引表中,查找是否存在所述指纹值; 若在预置的指纹索引表中存在所述指纹值时,判断所述数据页为冗余页,不将所述数据页写入所述外部存储器中的数据文件,将所述数据页对应的指纹值写入所述外部存储器中的备份信息文件; 其中,所述数据文件中保存了所述内存数据库的数据页; 其中,所述备份信息文件中保存了本次备份所述数据页对应的指纹值; 其中,所述指纹值在所述备份信息文件中,按照所述数据页在写入外部存储器时的顺序排列; 其中,所述指纹索引表中包括已写入所述数据文件的数据页对应的指纹值,以及已写入所述数据文件的数据页对应的指纹值,在所述数据文件中的数据页偏移量。
2.根据权利要求1所 述的重复数据删除方法,其特征在于,在预置的指纹索引表中,查找是否存在所述指纹值之后,还包括: 若在预置的指纹索引表中不存在所述指纹值时,判断所述数据页不为冗余页,将所述数据页写入所述数据文件; 获取所述数据页在所述数据文件中的数据页偏移量; 将所述数据页对应的指纹值以及所述数据页在所述数据文件中的数据页偏移量写入指纹索引表中,并将所述数据页对应的指纹值写入内存备份信息文件。
3.根据权利要求1或2所述的重复数据删除方法,其特征在于,还包括: 接收选择的备份点; 根据接收到的备份点读取所述备份信息文件,在所述备份信息文件中,逐个读取所述指纹值; 每读取一条所述指纹值,通过所述指纹值,在所述指纹索引表中,查找与所述指纹值对应的数据页偏移量; 根据所述数据页偏移量和数据页大小,在所述数据文件中读取所述数据页中的数据,并将读取到的数据加载到内存中,以还原所述内存数据库中的数据页。
4.根据权利要求1所述的重复数据删除方法,其特征在于,所述内存数据库在缓存区中,缓存待写入外部存储器的数据页,具体为: 所述内存数据库在缓存区中,缓存待写入外部存储器的数据页,同时将外界的数据请求事件存放在一个缓存队列中,以停止处理外界的数据请求事件。
5.根据权利要求1所述的重复数据删除方法,其特征在于,还包括: 读取系统时间和配置的执行时限,判断执行时限是否到达; 在所述执行时限到达时,执行所述内存数据库在缓存区中,缓存待写入外部存储器的数据页的步骤。
6.一种重复数据删除装置,其特征在于,包括:缓存单元,用于在缓存区中,缓存待写入外部存储器的数据页; 调取单元,用于在将缓存中的数据页写入所述外部存储器时,调取所述数据页; 生成单元,用于根据SHA安全散列算法,对调取到的所述数据页中的数据进行压缩映射,生成所述数据页对应的指纹值; 查找单元,用于在预置的指纹索引表中,查找是否存在所述指纹值; 第一写入单元,用于若在预置的指纹索引表中存在所述指纹值时,判断所述数据页为冗余页,不将所述数据页写入所述外部存储器中的数据文件,将所述数据页对应的指纹值写入所述外部存储器中的备份信息文件; 其中,所述数据文件中保存了所述内存数据库的数据页; 其中,所述备份信息文件中保存了本次备份所述数据页对应的指纹值; 其中,所述指纹值 在所述备份信息文件中,按照所述数据页在写入外部存储器时的顺序排列; 其中,所述指纹索引表中包括已写入所述数据文件的数据页对应的指纹值,以及已写入所述数据文件的数据页对应的指纹值,在所述数据文件中的数据页偏移量。
7.根据权利要求6所述的重复数据删除装置,其特征在于,还包括: 第二写入单元,用于若在预置的指纹索引表中不存在所述指纹值时,判断所述数据页不为冗余页,将所述数据页写入所述数据文件; 获取单元,用于获取所述数据页在所述数据文件中的数据页偏移量; 第三写入单元,用于将所述数据页对应的指纹值以及所述数据页在所述数据文件中的数据页偏移量写入指纹索引表中,并将所述数据页对应的指纹值写入内存备份信息文件。
8.根据权利要求6或7所述的重复数据删除装置,其特征在于,还包括: 接收单元,用于接收选择的备份点; 读取备份信息文件单元,用于根据接收到的备份点读取所述备份信息文件,在所述备份信息文件中,逐个读取所述指纹值; 查找单元,用于每读取一条所述指纹值,通过所述指纹值,在所述指纹索引表中,查找与所述指纹值对应的数据页偏移量; 还原单元,用于根据所述数据页偏移量和数据页大小,在所述数据文件中读取所述数据页中的数据,并将读取到的数据加载到内存中,以还原所述内存数据库中的数据页。
9.根据权利要求8所述的重复数据删除装置,其特征在于,所述缓存单元,具体用于所述在缓存区中,缓存待写入外部存储器的数据页,同时将外界的数据请求事件存放在一个缓存队列中,以停止处理外界的数据请求事件。
10.一种重复数据删除系统,其特征在于,包括权利要求6至9任意一项权利要求所述的重复数据删除装置以及外部存储器,所述重复数据删除装置与所述外部存储器相连接。
【文档编号】G06F17/30GK104077380SQ201410295300
【公开日】2014年10月1日 申请日期:2014年6月26日 优先权日:2014年6月26日
【发明者】王寅峰 申请人:深圳信息职业技术学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1