评估数据缩减率的方法、装置及系统、存储介质与流程

文档序号:28318497发布日期:2022-01-04 20:54阅读:117来源:国知局
1.本技术涉及存储
技术领域
:,特别涉及一种评估数据缩减率的方法、装置及系统、存储介质。
背景技术
::2.数据缩减(datareduction)技术是存储系统中必不可少的关键技术,其通过重复数据删除处理(也即是删除重复的数据块,对于相同的数据块仅存储一份)、压缩处理等方式减小数据规模,实现降低存储开销,提高存储系统的利用率的目的。数据缩减率表征数据能够被缩减的程度,数据缩减率的评估在存储系统的容量预测、存储系统扩容以及数据迁移等场景中具有重要意义。3.目前,在评估数据缩减率时,首先,对存储系统存储的原始数据进行抽样得到多个样本数据块;然后,对于该多个样本数据块中的每个样本数据块,计算该样本数据块的强指纹(fingerprint,fp)以及对该样本数据块进行自压缩(也即是对该样本数据块本身进行压缩),将该样本数据块的强fp和该样本数据块的自压缩率记录至fp表(table)中;接着,根据fp表中记录的该多个样本数据块,该多个样本数据块的强fp以及该多个样本数据块的自压缩率建立评估模型;最后,使用该评估模型评估原始数据的缩减率。4.但是,目前评估数据缩减率的方案仅能够适用于基于自压缩的存储系统,难以适用于基于delta压缩等差分压缩的存储系统。技术实现要素:5.本技术提供了一种评估数据缩减率的方法、装置及系统、存储介质,能够适用于基于差分压缩的存储系统,例如,基于delta压缩的存储系统。本技术的技术方案如下:6.第一方面,提供了一种评估数据缩减率的方法,该方法包括:获取目标样本数据,该目标样本数据是原始数据的子集;对该目标样本数据进行差分压缩,得到差分压缩后的样本数据;根据该目标样本数据的数据量和该差分压缩后的样本数据的数据量,确定该目标样本数据的差分压缩收益;根据该差分压缩收益确定该原始数据的缩减率。7.本技术提供的技术方案,由于可以根据对目标样本数据进行差分压缩的差分压缩收益确定原始数据的缩减率,因此该技术方案能够适用于基于差分压缩的存储系统。8.可选地,该目标样本数据是经过自压缩处理得到的数据,该方法还包括:确定该目标样本数据的自压缩率;根据该目标样本数据的差分压缩收益确定该原始数据的缩减率具体包括:根据该差分压缩收益和该自压缩率确定该原始数据的缩减率。9.本技术提供的技术方案,由于可以根据目标样本数据的自压缩率和目标样本数据的差分压缩收益确定原始数据的缩减率,因此根据目标样本数据评估的原始数据的缩减率更接近于该原始数据的实际缩减率。并且,由于评估的过程中考虑了目标样本数据的自压缩率,因此该技术方案能够适用于基于自压缩的存储系统,从而该技术方案能够实现与目前的评估数据缩减率的技术方案的兼容。10.可选地,该目标样本数据是经过重复数据删除处理得到的数据,该方法还包括:确定该目标样本数据的重删率;根据该目标样本数据的差分压缩收益确定该原始数据的缩减率具体包括:根据该差分压缩收益和该重删率确定该原始数据的缩减率。11.本技术提供的技术方案,由于可以根据目标样本数据的重删率和目标样本数据的差分压缩收益确定原始数据的缩减率,因此根据目标样本数据评估的原始数据的缩减率更接近于该原始数据的实际缩减率。12.可选地,该目标样本数据是经过重复数据删除处理以及自压缩处理得到的数据,该方法还包括:确定该目标样本数据的自压缩率;根据该目标样本数据的差分压缩收益确定该原始数据的缩减率具体包括:根据该差分压缩收益,该重删率以及该自压缩率确定该原始数据的缩减率。13.本技术提供的技术方案,由于可以根据目标样本数据的重删率、目标样本数据的自压缩率以及目标样本数据的差分压缩收益确定原始数据的缩减率,因此根据目标样本数据评估的原始数据的缩减率更接近于该原始数据的实际缩减率。并且,由于评估的过程中考虑了目标样本数据的自压缩率,因此该技术方案能够适用于基于自压缩的存储系统,从而该技术方案能够实现与目前的评估数据缩减率的技术方案的兼容。14.可选地,目标样本数据包括多个样本数据块,该多个样本数据块的强哈希值各不相等。15.可选地,该目标样本数据中的样本数据块的数量大于或等于预设数量。16.本技术提供的技术方案,由于目标样本数据中的样本数据块的数量大于或等于预设数量,因此能够保证根据该目标样本数据评估到的原始数据的缩减率更接近于该原始数据的实际缩减率,提高评估的准确性。17.可选地,该差分压缩为delta压缩。18.第二方面,提供了一种评估数据缩减率的装置,该评估数据缩减率的装置包括用于执行如第一方面或第一方面的任一可选方式所提供的评估数据缩减率的方法的各个模块。19.可选地,原始数据存储在存储系统的存储设备中,该存储系统包括处理器和存储设备,该评估数据缩减率的装置是该处理器。20.可选地,原始数据存储在存储系统的存储设备中,该存储系统包括处理器、评估芯片和存储设备,该评估数据缩减率的装置是该评估芯片。21.可选地,原始数据存储在存储系统的存储设备中,该评估数据缩减率的装置是该存储系统外部的评估设备。22.第三方面,提供了一种评估数据缩减率的装置,包括处理器和存储器,该存储器中存储有程序,该处理器用于调用该存储器中存储的程序,使得该评估数据缩减率的装置执行如第一方面或第一方面的任一可选方式所提供的评估数据缩减率的方法。23.第四方面,提供了一种评估数据缩减率的系统,该评估数据缩减率的系统为存储系统,该存储系统包括处理器和存储设备,该处理器包括如第二方面所提供的评估数据缩减率的装置。24.第五方面,提供了一种评估数据缩减率的系统,该评估数据缩减率的系统为存储系统,该存储系统包括处理器、评估芯片和存储设备,该评估芯片包括如第二方面所提供的评估数据缩减率的装置。25.第六方面,提供了一种评估数据缩减率的系统,该评估数据缩减率的系统包括存储系统和位于该存储系统外部的评估设备,该评估设备包括如第二方面或第三方面所提供的评估数据缩减率的装置。26.第七方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当该计算机程序在计算机上运行时,使得该计算机执行如第一方面或第一方面的任一可选方式所提供的评估数据缩减率的方法。27.第八方面,提供了一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得该计算机执行如第一方面或第一方面的任一可选方式所提供的评估数据缩减率的方法。28.第九方面,提供了一种芯片,该芯片包括可编程逻辑电路和/或程序指令,当该芯片运行时用于实现如第一方面或第一方面的任一可能实现方式所提供的评估数据缩减率的方法。29.本技术提供的技术方案带来的有益效果是:30.本技术提供的技术方案,首先获取作为原始数据的子集的目标样本数据,然后对该目标样本数据进行差分压缩得到差分压缩后的样本数据,之后根据该目标样本数据的数据量和该差分压缩后的样本数据的数据量确定该目标样本数据的差分压缩收益,最后根据该差分压缩收益确定原始数据的缩减率。由于根据对目标样本数据的差分压缩收益确定原始数据的缩减率,因此该技术方案能够适用于基于差分压缩的存储系统,例如,基于delta压缩的存储系统。附图说明31.图1是本技术实施例涉及的一种实施环境的示意图;32.图2是本技术实施例涉及的另一种实施环境的示意图;33.图3是本技术实施例涉及的再一种实施环境的示意图;34.图4是本技术实施例提供的一种评估数据缩减率的方法的流程图;35.图5是本技术实施例提供的另一种评估数据缩减率的方法的流程图;36.图6是本技术实施例提供的再一种评估数据缩减率的方法的流程图;37.图7是本技术实施例提供的又一种评估数据缩减率的方法的流程图;38.图8是本技术实施例提供的又一种评估数据缩减率的方法的流程图;39.图9是本技术实施例提供的又一种评估数据缩减率的方法的流程图;40.图10是本技术实施例提供的一种评估数据缩减率的装置的逻辑结构示意图;41.图11是本技术实施例提供的另一种评估数据缩减率的装置的逻辑结构示意图;42.图12是本技术实施例提供的一种评估数据缩减率的装置的硬件结构示意图。具体实施方式43.为使本技术的原理、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。44.数据缩减技术通过重复数据删除处理、压缩处理等方式减小数据规模。随着数据integratedcircuit,asic)和现场可编程门阵列(field-programmablegatearray,fpga)等。该评估芯片是一个可编程的电子部件,用于对数据进行计算处理等,本技术实施例中评估芯片可以是数据处理单元(dataprocessingunit,dpu),dpu具有cpu的通用性和可编程性,但更具有专用性,可以在网络数据包,存储请求或分析请求上高效运行。dpu通过较大程度的并行性(需要处理大量请求)与cpu区别开来。可选的,这里的dpu也可以替换成图形处理单元(graphicsprocessingunit,gpu)、嵌入式神经网络处理器(neural-networkprocessingunits,npu)等处理芯片。dpu用于提供针对内存池的数据卸载服务,例如地址索引或地址查询功能,分区功能以及对数据进行过滤、扫描等操作。如果由评估芯片实施评估操作,则绕过了cpu和操作系统,压薄了软件栈,减少了cpu调度的影响。存储系统外部的评估设备可以是,例如但不限于:主机、终端、服务器或虚拟机等各种类型的设备,该终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、多媒体播放器、电子阅读器或可穿戴式设备等。52.其中,上述存储系统可以是阵列设备或者服务器的内部系统,存储设备可以是阵列设备或者服务器中的存储空间或存储介质,例如,该存储设备可以是一个磁盘、存储器、硬盘、光盘、主机逻辑单元号(logicalunitnumber,lun)或主机卷等,存储器可以是易失性存储器或非易失性存储器,例如存储器可以是随机存取存储器(randomaccessmemory,ram)、只读存储器(read-onlymemory,rom)、非易失性ram(non-volatileram,nvram)、可编程rom(programmablerom,prom)、可擦除prom(erasableprom,eprom)、电可擦除prom(electricallyerasableprom,eeprom)、闪存、光存储器和寄存器等,本技术实施例对此不做限定。53.示例地,请参考图1,其示出了本技术实施例涉及的一种实施环境的示意图,该实施环境提供一种评估数据缩减率的系统,该评估数据缩减率的系统是存储系统00,该存储系统00包括处理器001和多个存储设备,该处理器001与该多个存储设备连接,该图1以该多个存储设备包括存储设备002~005(也即是存储设备002、存储设备003、存储设备004和存储设备005)为例说明。可以由处理器001评估存储设备002~005中存储的原始数据的缩减率。54.再示例地,请参考图2,其示出了本技术实施例涉及的另一种实施环境的示意图,该实施环境提供一种评估数据缩减率的系统,该评估数据缩减率的系统是存储系统01,该存储系统01包括处理器011,评估芯片012和多个存储设备,处理器011分别与评估芯片012以及该多个存储设备连接,该图2以该多个存储设备包括存储设备013~016(也即是存储设备013、存储设备014、存储设备015和存储设备016)为例说明。可以由评估芯片012评估存储设备013~016中存储的原始数据的缩减率。可选地,评估芯片012通过处理器011从存储设备013~016中存储的原始数据中获取样本数据,并根据样本数据评估该原始数据的缩减率。或者,评估芯片012可以直接与存储设备013~016连接,而无需通过处理器011与存储设备013~016连接,这样评估芯片012可以绕过处理器011直接从存储设备013~016中存储的原始数据中获取样本数据,并根据样本数据评估该原始数据的缩减率,本技术实施例对此不做限定,图2以评估芯片012通过处理器011从存储设备013~016中获取样本数据为例说明。55.又示例地,请参考图3,其示出了本技术实施例涉及的再一种实施环境的示意图,该实施环境提供一种评估数据缩减率的系统,该评估数据缩减率的系统包括存储系统02以及位于该存储系统02外部的评估设备03,该存储系统02包括处理器021和多个存储设备,该处理器001与该多个存储设备连接,该评估设备03与该处理器021连接,该图3以该多个存储设备包括存储设备022~025(也即是存储设备022、存储设备023、存储设备024和存储设备025)为例说明。如图3所示,可以由该评估设备03评估存储设备022~025中存储的原始数据的缩减率。可选地,评估设备03可以通过处理器021从存储设备022~025中存储的原始数据中获取样本数据,并根据样本数据评估该原始数据的缩减率。56.需要指出的是,图1至图3所示实施环境仅用于举例,并非用于限制本技术实施例的技术方案,在实现过程中,评估数据缩减率的系统还可能包括其他设备,并且可以根据需要来配置存储系统中存储设备的数量以及连接关系。例如,图3所示的存储系统02中可以包括评估芯片。又例如,如图3所示的评估数据缩减率的系统可以包括多个存储系统,由评估设备03评估该多个存储系统中的存储设备存储的原始数据的缩减率,本技术实施例对此不做限定。57.以上是对本技术实施环境的介绍,下面介绍本技术评估数据缩减率的方法。58.本技术实施例提供的评估数据缩减率的方法可以应用于图1至图3所示实施环境,该评估数据缩减率的方法可以由评估数据缩减率的装置来执行,如前所述容易理解,该评估数据缩减率的装置可以是存储系统中的处理器,存储系统中的评估芯片或者是存储系统外部的评估设备。该评估数据缩减率的装置可以获取目标样本数据(目标样本数据是原始数据的子集),对该目标样本数据进行差分压缩后确定该目标样本数据的差分压缩收益,根据该目标样本数据的差分压缩收益确定原始数据的缩减率。由于该评估数据缩减率的装置根据从原始数据中获取的目标样本数据的差分压缩收益确定该原始数据的缩减率,因此该评估数据缩减率的方法能够适用于基于差分压缩的存储系统,例如,基于delta压缩的存储系统。59.在本技术实施例中,评估数据缩减率的装置可以根据目标样本数据的差分压缩收益确定原始数据的缩减率;或者,目标样本数据是经过自压缩处理得到的数据,评估数据缩减率的装置可以根据该目标样本数据的差分压缩收益和该目标样本数据的自压缩率确定原始数据的缩减率;或者,目标样本数据是经过重复数据删除处理得到的数据,评估数据缩减率的装置可以根据该目标样本数据的差分压缩收益和该目标样本数据的重删率确定原始数据的缩减率;或者,目标样本数据是经过重复数据删除处理以及自压缩处理得到的数据,评估数据缩减率的装置可以根据该目标样本数据的差分压缩收益、该目标样本数据的重删率以及该目标样本数据的自压缩率确定原始数据的缩减率。根据评估数据缩减率的装置确定原始数据的缩减率的方式的不同,下面分四个实施例介绍本技术的评估数据缩减率的方法。60.请参考图4,其示出了本技术实施例提供的一种评估数据缩减率的方法的流程图。该图4以评估数据缩减率的装置根据目标样本数据的差分压缩收益确定原始数据的缩减率为例说明。参见图4,该方法可以包括如下几个步骤:61.步骤401、获取目标样本数据,该目标样本数据是原始数据的子集。62.在该图4所示实施例中,该目标样本数据可以是评估数据缩减率的装置对原始数据进行抽样得到的原始样本数据,也可以是评估数据缩减率的装置在对原始数据进行抽样得到原始样本数据后对该原始样本数据进行重复数据删除处理得到的数据,还可以是评估数据缩减率的装置在对原始数据进行抽样得到原始样本数据后对该原始样本数据进行重复数据删除处理以及自压缩处理得到的数据。本实施例以该目标样本数据是评估数据缩减率的装置对原始数据进行抽样得到的原始样本数据为例说明,则评估数据缩减率的装置可以对原始数据进行抽样得到目标样本数据,不难理解,该目标样本数据是该原始数据的子集,该目标样本数据可以包括多个样本数据块,在本技术实施例中,该目标样本数据中的样本数据块的数量大于或等于预设数量,以便于评估数据缩减率的装置根据该目标样本数据评估到的原始数据的缩减率更接近于该原始数据的实际缩减率,提高评估的准确性。63.可选地,评估数据缩减率的装置对原始数据进行抽样得到目标样本数据可以包括:评估数据缩减率的装置基于抽样策略对该原始数据进行抽样得到抽样数据,根据该抽样数据中的各个数据块的弱哈希值对该抽样数据进行抽样,将根据该抽样数据中的各个数据块的弱哈希值抽样得到的数据确定为目标样本数据。可选地,评估数据缩减率的装置采用全量读抽样策略对原始数据进行抽样得到抽样数据(采用全量读抽样策略抽样得到的抽样数据也即是所有的原始数据),或者,评估数据缩减率的装置按照百分比对原始数据进行抽样得到抽样数据,例如抽取原始数据的20%(百分之二十)作为抽样数据。64.可选地,评估数据缩减率的装置根据抽样数据中的各个数据块的弱哈希值对该抽样数据进行抽样可以包括:评估数据缩减率的装置计算该抽样数据中的各个数据块的弱哈希值,将该抽样数据中弱哈希值处于抽样弱哈希值区间的数据块确定为样本数据块,从而可以确定出多个样本数据块,评估数据缩减率的装置将该多个样本数据块确定为目标样本数据。其中,目标样本数据中的样本数据块的数量可以是抽样数据中的数据块的数量的1/500(五百分之一)。可选地,该弱哈希值是相似指纹(similarfingerprint,sfp),sfp又称弱指纹,sfp可以用于表征两个数据块是否局部相同(也即是两个数据块中是否存在部分数据相同),若两个数据块的sfp相等,则表明该两个数据块局部相同,若两个数据块相同(也即是该两个数据块中的所有数据均相同),则该两个数据块的sfp必然相同。65.可选地,该抽样弱哈希值区间是评估数据缩减率的装置中预先配置好的,或者,该抽样弱哈希值区间是评估数据缩减率的装置根据抽样数据的弱哈希值分布确定的,本技术实施例对此不做限定。示例地,该抽样弱哈希值区间是评估数据缩减率的装置根据抽样数据的弱哈希值分布确定的,评估数据缩减率的装置计算出抽样数据中的各个数据块的弱哈希值后,根据该抽样数据的弱哈希值分布将该抽样数据的弱哈希值划分为至少一个弱哈希值区间,通过随机数函数生成一个随机数,将该随机数所处的弱哈希值区间确定为抽样弱哈希值区间。本技术实施例中,评估数据缩减率的装置通过根据随机数确定抽样弱哈希值区间,可以保证确定的抽样弱哈希值区间的随机性,避免在对抽样数据的抽样比例较低的情况下,由于抽样得到的目标样本数据中的样本数据块分布不均对评估结果的影响。66.需要指出的是,在本技术实施例中,原始数据存储在存储系统的存储设备(例如图1所示的存储设备002~005,图2所示的存储设备013~016或者图3所示的存储设备022~025)中,该评估数据缩减率的装置可以是该存储系统中的处理器,该存储系统中的评估芯片,或者是该存储系统外部的评估设备。如果该评估数据缩减率的装置是存储系统中的处理器,由于存储系统中的处理器可以直接访问该存储系统中的存储设备,因此该评估数据缩减率的装置可以直接对存储设备存储的原始数据进行抽样;如果该评估数据缩减率的装置是存储系统中的评估芯片或者是存储系统外部的评估设备,该评估数据缩减率的装置可以通过该存储系统中的处理器对该存储系统中的存储设备存储的原始数据进行抽样;可选地,如果该评估数据缩减率的装置是存储系统中的评估芯片,该评估芯片也可以直接访问该存储系统中的存储设备,因此该评估数据缩减率的装置可以直接对存储设备存储的原始数据进行抽样,本技术实施例对此不做限定。67.步骤402、对该目标样本数据进行差分压缩,得到差分压缩后的样本数据。68.可选地,该差分压缩可以是delta压缩。delta压缩是一种广泛应用的压缩技术,delta压缩的原理是:从待压缩数据中选取一个数据块作为参考数据块,一个数据块作为目标数据块,该目标数据块的部分数据与该参考数据块的全部数据相同,对该参考数据块以及该目标数据块中与该参考数据块不同的部分分别进行自压缩。其中,自压缩是指对数据本身进行压缩,对该参考数据块以及该目标数据块中与该参考数据块不同的部分分别进行自压缩也即是,对该参考数据块本身进行压缩,并对该目标数据块中与该参考数据块不同的部分本身进行压缩。69.可选地,对该目标样本数据进行差分压缩得到差分压缩后的样本数据,包括:评估数据缩减率的装置从该目标样本数据包括的多个样本数据块中确定至少一个参考数据块以及与每个参考数据块对应的至少一个目标数据块;对于该至少一个参考数据块中的每个参考数据块以及与该参考数据块对应的目标数据块,对该参考数据块以及与该参考数据块对应的每个目标数据块中与该参考数据块不同的部分分别进行自压缩。对于不存在对应目标数据块的参考数据块,评估数据缩减率的装置可以对该参考数据块进行自压缩。评估数据缩减率的装置按照此压缩方式对目标样本数据进行差分压缩后得到的数据即为差分压缩后的样本数据。70.可选地,评估数据缩减率的装置根据该目标样本数据中的多个样本数据块的弱哈希值,将该多个样本数据块中弱哈希值相等的样本数据块划分为一组得到至少一个样本组,对于该至少一个样本组中的每个样本组,将该样本组中的一个样本数据块确定为参考数据块,其他样本数据块确定为该参考数据块对应的目标数据块。在本技术实施例中,为了保证缩减率评估的准确性,每个样本数据块可以具有多个(例如1到3个)弱哈希值,这就导致一个样本数据块可能被分到多个样本组中参与差分压缩,为了避免一个样本数据块被分到多个样本组中参与差分压缩,本技术实施例中限定一个样本数据块仅能够被分到一个样本组中(例如按照该样本数据块的其中一个弱哈希值对该样本数据块分组);或者,一个样本数据块可以被分到多个样本组中,但是在遍历该多个样本组进行差分压缩的过程中,如果确定某个样本数据块已经参与过差分压缩,则不在对该样本数据块进行差分压缩,通过此方式对样本数据进行修正,保证计算出的差分压缩收益的准确性。71.示例地,目标样本数据a包括样本数据块a1~a6(也即是样本数据块a1、样本数据块a2、样本数据块a3、样本数据块a4、样本数据块a5和样本数据块a6),评估数据缩减率的装置从该样本数据块a1~a6中确定的参考数据块分别为样本数据块a1(为了便于描述称为参考数据块a1)、样本数据块a3(为了便于描述称为参考数据块a3)和样本数据块a6(为了便于描述称为参考数据块a6),与参考数据块a1对应的目标数据块为样本数据块a2(为了便于描述称为目标数据块a2),与参考数据块a3对应的目标数据块为样本数据块a4(为了便于描述称为目标数据块a4)和样本数据块a5(为了便于描述称为目标数据块a5),该目标样本数据a中不存在与参考数据块a6对应的目标数据块。评估数据缩减率的装置可以对参考数据块a1以及目标数据块a2中与该参考数据块a1不同的部分△da21(也即是deltada21,表示目标数据块a2中与参考数据块a1不同的部分)分别进行自压缩得到差分压缩后的数据a1'和△da21',对参考数据块a3、目标数据块a4中与该参考数据块a3不同的部分△da43(也即是deltada43,表示目标数据块a4中与参考数据块a3不同的部分)以及目标数据块a5中与该参考数据块a3不同的部分△da53(也即是deltada53,表示目标数据块a5中与参考数据块a3不同的部分)分别进行自压缩得到差分压缩后的数据a3'、△da43'和△da53',对参考数据块a6进行自压缩得到压缩后的数据a6',所以,评估数据缩减率的装置对目标样本数据a进行差分压缩得到的差分压缩后的样本数据a'包括:a1'、△da21'、a3'、△da43'、△da53'和a6'。72.步骤403、根据该目标样本数据的数据量和该差分压缩后的样本数据的数据量,确定该目标样本数据的差分压缩收益。73.如前所述容易理解,该目标样本数据也即是差分压缩前的样本数据。可选地,评估数据缩减率的装置确定该目标样本数据的数据量和该差分压缩后的样本数据的数据量,并确定该目标样本数据的数据量与该差分压缩后的样本数据的数据量的比值,根据该目标样本数据的数据量与该差分压缩后的样本数据的数据量的比值,确定该目标样本数据的差分压缩收益。可选地,评估数据缩减率的装置将该目标样本数据的数据量与该差分压缩后的样本数据的数据量的比值确定为该目标样本数据的差分压缩收益。示例地,目标样本数据的差分压缩收益为cp=v_d_bef/v_d_aft,cp表示目标样本数据的差分压缩收益,v_d_bef表示目标样本数据的数据量,v_d_aft表示差分压缩后的样本数据的数据量,符号“/”表示除号。74.示例地,目标样本数据a的差分压缩收益为:cp=v_d_bef/v_d_aft=(a1+a2+a3+a4+a5+a6)/(a1'+△da21'+a3'+△da43'+△da53'+a6'),在该式中,符号“/”表示除号,符号“+”表示加号,a1表示差分压缩前样本数据块a1的数据量,a1'表示差分压缩后样本数据块a1的数据量,△da21'表示目标数据块a2中与参考数据块a1不同的部分压缩后的数据量,其他以此类推。75.步骤404、根据该目标样本数据的差分压缩收益确定该原始数据的缩减率。76.可选地,评估数据缩减率的装置将该目标样本数据的差分压缩收益确定该原始数据的缩减率;或者,评估数据缩减率的装置可以维护差分压缩收益与数据缩减率的映射关系,评估数据缩减率的装置根据该目标样本数据的差分压缩收益与该映射关系,确定该原始数据的缩减率,本技术实施例对此不做限定。77.综上所述,本技术实施例提供的评估数据缩减率的方法,由于获取作为原始数据的子集的目标样本数据后,对该目标样本数据进行差分压缩,并确定该目标样本数据的差分压缩收益,根据该目标样本数据的差分压缩收益确定原始数据的缩减率,因此该评估数据缩减率的方法能够适用于基于差分压缩的存储系统,例如基于delta压缩的存储系统。并且,由于在差分压缩的过程中对样本数据进行了修正,对样本数据进行了修正可以起到对差分压缩收益关联修正的效果,使得确定的差分压缩收益更准确,保证基于该差分压缩收益评估出的缩减率的准确性。78.本技术实施例提供的评估数据缩减率的方法,由于目标样本数据是原始数据的子集,相比于原始数据,该目标样本数据的数据量较少,因此仅需少量的内存资源和计算资源就可以评估原始数据的缩减率,有助于降低评估数据缩减率的过程对内存资源以及计算资源的消耗。79.请参考图5,其示出了本技术实施例提供的另一种评估数据缩减率的方法的流程图。该图5以评估数据缩减率的装置根据目标样本数据的差分压缩收益和该目标样本数据的自压缩率确定原始数据的缩减率为例说明。参见图5,该方法可以包括如下几个步骤:80.步骤501、获取目标样本数据,该目标样本数据是原始数据的子集,该目标样本数据是经过自压缩处理得到的数据。81.可选地,评估数据缩减率的装置对原始数据进行抽样,将抽样得到的数据确定为原始样本数据,对该原始样本数据进行自压缩得到自压缩后的样本数据,将该自压缩后的样本数据确定为目标样本数据,不难理解,该目标样本数据是原始数据的子集,该目标样本数据包括多个样本数据块。其中,自压缩是指:对待处理数据中的每个数据块分别进行压缩,也即是对每个数据块各自进行压缩,对各个数据块的压缩过程相互独立。在本技术实施例中,该目标样本数据是对原始样本数据进行自压缩处理得到的数据,该目标样本数据中的样本数据块的数量等于该原始样本数据中的样本数据块的数量。可选地,该目标样本数据中的样本数据块的数量大于或等于预设数量,以便于评估数据缩减率的装置根据该目标样本数据评估到的原始数据的缩减率更接近于该原始数据的实际缩减率,提高评估的准确性。由于自压缩处理过程中对样本数据块进行了压缩,因此在本技术实施例中,可以将自压缩后的样本数据(在该图5所示实施例中该自压缩后的样本数据也即是目标样本数据)中的样本数据块称为自压缩数据块,下文中描述的自压缩数据块即指的是目标样本数据中的样本数据块。82.可选地,评估数据缩减率的装置对原始数据进行抽样得到原始样本数据可以包括:评估数据缩减率的装置基于抽样策略对原始数据进行抽样得到抽样数据,根据该抽样数据中的各个数据块的弱哈希值对该抽样数据进行抽样,将根据该抽样数据中的各个数据块的弱哈希值抽样得到的数据确定为原始样本数据。可选地,评估数据缩减率的装置采用全量读抽样策略对原始数据进行抽样得到抽样数据,或者,评估数据缩减率的装置按照百分比对原始数据进行抽样得到抽样数据,例如抽取原始数据的20%作为抽样数据。83.可选地,评估数据缩减率的装置根据抽样数据中的各个数据块的弱哈希值对该抽样数据进行抽样可以包括:评估数据缩减率的装置计算该抽样数据中的各个数据块的弱哈希值,将该抽样数据中弱哈希值处于抽样弱哈希值区间的数据块确定为样本数据块,从而可以确定出多个样本数据块,评估数据缩减率的装置将该多个样本数据块确定为原始样本数据。与图4所示实施例同理,该弱哈希值是sfp,该抽样弱哈希值区间是评估数据缩减率的装置中预先配置好的,或者,该抽样弱哈希值区间是评估数据缩减率的装置根据抽样数据的弱哈希值分布确定的。本技术实施例中,评估数据缩减率的装置通过根据随机数确定抽样弱哈希值区间,可以保证确定的抽样弱哈希值区间的随机性,避免在对抽样数据的抽样比例较低的情况下,由于抽样得到的原始样本数据中的样本数据块分布不均对评估结果的影响。84.可选地,评估数据缩减率的装置对原始样本数据中的每个样本数据块分别进行压缩,以实现对该原始样本数据的自压缩。示例地,原始样本数据包括样本数据块y1~y6,评估数据缩减率的装置对该原始样本数据进行自压缩得到的自压缩后的样本数据(在该图5所示实施例中也即是目标样本数据)y包括:自压缩数据块y1”~y6”(也即是自压缩数据块y1”、自压缩数据块y2”、自压缩数据块y3”、自压缩数据块y5”和自压缩数据块y6”),自压缩数据块y1”~y6”是对样本数据块y1~y6进行自压缩得到的样本数据块。85.需要指出的是,与图4所示实施例同理,如果该评估数据缩减率的装置是存储系统中的处理器,该评估数据缩减率的装置可以直接对存储设备存储的原始数据进行抽样;如果该评估数据缩减率的装置是存储系统中的评估芯片或者是存储系统外部的评估设备,该评估数据缩减率的装置可以通过该存储系统中的处理器对该存储系统中的存储设备存储的原始数据进行抽样;可选地,如果该评估数据缩减率的装置是存储系统中的评估芯片,该评估数据缩减率的装置可以直接对存储设备存储的原始数据进行抽样,本技术实施例对此不做限定。86.步骤502、确定该目标样本数据的自压缩率。87.可选地,评估数据缩减率的装置确定自压缩前的样本数据的数据量和自压缩后的样本数据的数据量,根据该自压缩前的样本数据的数据量和该自压缩后的样本数据的数据量确定目标样本数据的自压缩率。在该图5所示实施例中,自压缩前的样本数据也即是原始样本数据,自压缩后的样本数据也即是目标样本数据,因此该步骤502也即是,评估数据缩减率的装置根据原始样本数据的数据量和目标样本数据的数据量确定该目标样本数据的自压缩率。88.可选地,评估数据缩减率的装置确定原始样本数据的数据量与目标样本数据的数据量的比值,根据该原始样本数据的数据量与该目标样本数据的数据量的比值,确定该目标样本数据的自压缩率。可选地,评估数据缩减率的装置将该原始样本数据的数据量与该目标样本数据的数据量的比值确定为该目标样本数据的自压缩率。示例地,目标样本数据的自压缩率为rs=v_s_bef/v_s_aft,rs表示目标样本数据的自压缩率,v_s_bef表示自压缩前的样本数据的数据量(在本例中也即是原始样本数据的数据量),v_r_aft表示自压缩后的样本数据的数据量(在本例中也即是目标样本数据的数据量),符号“/”表示除号。89.示例地,目标样本数据y的自压缩收益为:rs=v_s_bef/v_s_aft=(y1+y2+y3+y4+y5+y6)/(y1”+y2”+y3”+y4”+y5”+y6”),在该式中,符号“/”表示除号,符号“+”表示加号,y1表示样本数据块y1的数据量,y1”表示自压缩数据块y1”的数据量,自压缩数据块y1”是对样本数据块y1进行自压缩得到的样本数据块,其他以此类推。90.步骤503、对该目标样本数据进行差分压缩,得到差分压缩后的样本数据。91.可选地,该差分压缩可以是delta压缩。对该目标样本数据进行差分压缩得到差分压缩后的样本数据,包括:评估数据缩减率的装置从该目标样本数据包括的多个自压缩数据块中确定至少一个参考数据块以及与每个参考数据块对应的至少一个目标数据块;对于该至少一个参考数据块中的每个参考数据块以及与该参考数据块对应的目标数据块,对该参考数据块以及与该参考数据块对应的每个目标数据块中与该参考数据块不同的部分分别进行自压缩。可选地,对于不存在对应目标数据块的参考数据块,评估数据缩减率的装置可以对该参考数据块进行自压缩。评估数据缩减率的装置按照此压缩方式对目标样本数据进行差分压缩后得到的数据即为差分压缩后的样本数据。92.可选地,评估数据缩减率的装置根据目标样本数据中的多个自压缩数据块的弱哈希值,将该多个自压缩数据块中弱哈希值相等的自压缩数据块划分为一组得到至少一个样本组,对于该至少一个样本组中的每个样本组,将该样本组中的一个自压缩数据块确定为参考数据块,其他自压缩数据块确定为该参考数据块对应的目标数据块。在本技术实施例中,为了保证缩减率评估的准确性,每个自压缩数据块可以具有多个弱哈希值,这就导致一个自压缩数据块可能被分到多个样本组中参与差分压缩,为了避免一个自压缩数据块被分到多个样本组中参与差分压缩,本技术实施例中限定一个自压缩数据块仅能够被分到一个样本组中;或者,一个自压缩数据块可以被分到多个样本组中,但是在遍历该多个样本组进行差分压缩的过程中,如果确定某个自压缩数据块已经参与过差分压缩,则不在对该自压缩数据块进行差分压缩。通过此方式对样本数据进行修正,保证计算出的差分压缩收益的准确性。其中,自压缩数据块的弱哈希值与该自压缩数据块对应的自压缩前的样本数据块的弱哈希值相等。93.示例地,目标样本数据y包括自压缩数据块y1”~y6”,评估数据缩减率的装置从该自压缩数据块y1”~y6”中确定的参考数据块分别为自压缩数据块y1”(为了便于描述称为参考数据块y1”)、自压缩数据块y3”(为了便于描述称为参考数据块y3”)和自压缩数据块y6”(为了便于描述称为参考数据块y6”),与参考数据块y1”对应的目标数据块为样本数据块y2”(为了便于描述称为目标数据块y2”),与参考数据块y3”对应的目标数据块为样本数据块y4”(为了便于描述称为目标数据块y4”)和样本数据块y5”(为了便于描述称为目标数据块y5”),该目标样本数据y中不存在与参考数据块y6”对应的目标数据块。评估数据缩减率的装置可以对参考数据块y1”以及目标数据块y2”中与该参考数据块y1”不同的部分△dy21”(也即是deltady21”,表示目标数据块y2”中与参考数据块y1”不同的部分)分别进行自压缩得到差分压缩后的数据y1'和△dy21',对参考数据块y3”、目标数据块y4”中与该参考数据块y3”不同的部分△dy43”(也即是deltady43”,表示目标数据块y4”中与参考数据块y3”不同的部分)以及目标数据块y5”中与该参考数据块y3”不同的部分△dy53”(也即是deltady53”,表示目标数据块y5”中与参考数据块y3”不同的部分)分别进行自压缩得到差分压缩后的数据y3'、△dy43'和△dy53',对参考数据块y6”进行自压缩得到压缩后的数据y6',所以,评估数据缩减率的装置对目标样本数据y进行差分压缩得到的差分压缩后的样本数据y'包括:y1'、△dy21'、y3'、△dy43'、△dy53'和y6'。94.步骤504、根据该目标样本数据的数据量和该差分压缩后的样本数据的数据量,确定该目标样本数据的差分压缩收益。95.如前所述容易理解,该目标样本数据也即是差分压缩前的样本数据。可选地,评估数据缩减率的装置确定该目标样本数据的数据量和该差分压缩后的样本数据的数据量,并确定该目标样本数据的数据量与该差分压缩后的样本数据的数据量的比值,根据该目标样本数据的数据量与该差分压缩后的样本数据的数据量的比值,确定该目标样本数据的差分压缩收益。可选地,评估数据缩减率的装置将该目标样本数据的数据量与该差分压缩后的样本数据的数据量的比值确定为该目标样本数据的差分压缩收益。示例地,目标样本数据的差分压缩收益为cp=v_d_bef/v_d_aft,cp表示目标样本数据的差分压缩收益,v_d_bef表示目标样本数据的数据量,v_d_aft表示差分压缩后的样本数据的数据量,符号“/”表示除号。96.示例地,目标样本数据y的差分压缩收益为:cp=v_d_bef/v_d_aft=(y1”+y2”+y3”+y4”+y5”+y6”)/(y1'+△dy21'+y3'+△dy43'+△dy53'+y6'),在该式中,符号“/”表示除号,符号“+”表示加号,y1”表示差分压缩前的自压缩数据块y1”(也即是参考数据块y1”)的数据量,y1'表示差分压缩后的自压缩数据块y1”的数据量,△dy21'表示目标数据块y2”中与参考数据块y1”不同的部分压缩后的数据量,其他以此类推。97.步骤505、根据该目标样本数据的差分压缩收益和该目标样本数据的自压缩率确定该原始数据的缩减率。98.可选地,评估数据缩减率的装置将该目标样本数据的差分压缩收益和该目标样本数据的自压缩率的乘积确定为该原始数据的缩减率;或者,评估数据缩减率的装置可以维护差分压缩收益、自压缩率以及数据缩减率这三者的映射关系,评估数据缩减率的装置根据该目标样本数据的差分压缩收益、该目标样本数据的自压缩率以及该映射关系,确定该原始数据的缩减率,本技术实施例对此不做限定。99.示例地,本技术实施例以评估数据缩减率的装置将该目标样本数据的差分压缩收益和该目标样本数据的自压缩率的乘积确定为该原始数据的缩减率为例说明,则原始数据的缩减率可以是:rr=rs×cp,rr表示原始数据的缩减率,rs表示该目标样本数据的自压缩率,cp表示该目标样本数据的差分压缩收益,符号“×”表示乘号。100.综上所述,本技术实施例提供的评估数据缩减率的方法,由于获取作为原始数据的子集的目标样本数据后,对该目标样本数据进行差分压缩,并确定该目标样本数据的差分压缩收益,根据该目标样本数据的差分压缩收益确定原始数据的缩减率,因此该评估数据缩减率的方法能够适用于基于差分压缩的存储系统,例如基于delta压缩的存储系统。并且,由于在差分压缩的过程中对样本数据进行了修正,对样本数据进行了修正可以起到对差分压缩收益关联修正的效果,使得确定的差分压缩收益更准确,保证基于该差分压缩收益评估出的缩减率的准确性。101.本技术实施例提供的评估数据缩减率的方法,在确定原始数据的缩减率时,还考虑到目标样本数据的自压缩率,因此该评估数据缩减率的方法能够适用于基于自压缩的存储系统。也即是,该评估数据缩减率的方法能够同时适用于基于delta压缩和自压缩的存储系统,能够实现与目前的评估数据缩减率的技术方案的兼容。并且,由于目标样本数据是原始数据的子集,相比于原始数据,该目标样本数据的数据量较少,因此仅需少量的内存资源和计算资源就可以评估原始数据的缩减率,有助于降低评估数据缩减率的过程对内存资源以及计算资源的消耗。102.请参考图6,其示出了本技术实施例提供的另一种评估数据缩减率的方法的流程图。该图6以评估数据缩减率的装置根据目标样本数据的差分压缩收益和该目标样本数据的重删率确定原始数据的缩减率为例说明。参见图6,该方法可以包括如下几个步骤:103.步骤601、获取目标样本数据,该目标样本数据是原始数据的子集,该目标样本数据是经过重复数据删除处理得到的数据。104.可选地,评估数据缩减率的装置对原始数据进行抽样,将抽样得到的数据确定为原始样本数据,对该原始样本数据进行重复数据删除得到重复数据删除后的样本数据(也即是进行重复数据删除后保留的数据),将该重复数据删除后的样本数据确定为目标样本数据,不难理解,该目标样本数据是原始数据的子集,该目标样本数据包括多个样本数据块。其中,重复数据删除是指:对于待处理数据中重复的数据块仅保留一份,将该重复的数据块中除该一份数据块之外的数据块删除。本领域技术人员容易理解,重复数据删除后的数据中不存在相同的数据块,该重复数据删除后的数据中的数据块的数量不大于重复数据删除前的数据中的数据块的数量。在本技术实施例中,该目标样本数据是对原始样本数据进行重复数据删除处理得到的数据,该目标样本数据中的样本数据块的数量不大于该原始样本数据中的样本数据块的数量。可选地,该目标样本数据中的样本数据块的数量大于或等于预设数量,以便于评估数据缩减率的装置根据该目标样本数据评估到的原始数据的缩减率更接近于该原始数据的实际缩减率,提高评估的准确性。105.可选地,评估数据缩减率的装置对原始数据进行抽样得到原始样本数据可以包括:评估数据缩减率的装置基于抽样策略对该原始数据进行抽样得到抽样数据,根据该抽样数据中的各个数据块的弱哈希值对该抽样数据进行抽样,将根据该抽样数据中的各个数据块的弱哈希值抽样得到的数据确定为原始样本数据。可选地,评估数据缩减率的装置采用全量读抽样策略对原始数据进行抽样得到抽样数据,或者,评估数据缩减率的装置按照百分比对原始数据进行抽样得到抽样数据,例如抽取原始数据的20%作为抽样数据。106.可选地,评估数据缩减率的装置根据抽样数据中的各个数据块的弱哈希值对该抽样数据进行抽样可以包括:评估数据缩减率的装置计算该抽样数据中的各个数据块的弱哈希值,将该抽样数据中弱哈希值处于抽样弱哈希值区间的数据块确定为样本数据块,从而可以确定出多个样本数据块,评估数据缩减率的装置将该多个样本数据块确定为原始样本数据。与图4所示实施例同理,该弱哈希值是sfp,该抽样弱哈希值区间是评估数据缩减率的装置中预先配置好的,或者,该抽样弱哈希值区间是评估数据缩减率的装置根据抽样数据的弱哈希值分布确定的。本技术实施例中,评估数据缩减率的装置通过根据随机数确定抽样弱哈希值区间,可以保证确定的抽样弱哈希值区间的随机性,避免在对抽样数据的抽样比例较低的情况下,由于抽样得到的原始样本数据中的样本数据块分布不均对评估结果的影响。107.可选地,评估数据缩减率的装置可以根据该原始样本数据中的样本数据块的强哈希值对该原始样本数据进行重复数据删除,得到重复数据删除后的样本数据。示例地,评估数据缩减率的装置对原始样本数据进行重复数据删除得到重复数据删除后的样本数据包括:评估数据缩减率的装置计算原始样本数据中的各个样本数据块的强哈希值,将该原始样本数据中强哈希值相等的样本数据块确定为重复的样本数据块,将该重复的样本数据块仅保留一份,将该重复的样本数据块中除该一份样本数据块之外的样本数据块删除,将保留下来的样本数据块确定为重复数据删除后的样本数据。可选地,该强哈希值是指纹(fingerprint,fp),fp可以用于表征两个数据块是否相同,若两个数据块的fp相等,则表明该两个数据块相同,若两个数据块的fp不相等,则表明该两个数据块不同。108.示例地,原始样本数据包括样本数据块b1~b8(也即是样本数据块b1、样本数据块b2、样本数据块b3、样本数据块b4、样本数据块b5、样本数据块b6、样本数据块b7和样本数据块b8),样本数据块b1的强哈希值与样本数据块b7的强哈希值相等,样本数据块b5的强哈希值与样本数据块b8的强哈希值相等,则对于样本数据块b1和样本数据块b7,评估数据缩减率的装置仅保留一份,假设评估数据缩减率的装置保留的是样本数据块b1,则评估数据缩减率的装置删除样本数据块b7,同理,评估数据缩减率的装置可以保留样本数据块b5,删除样本数据块b8,则评估数据缩减率的装置对该原始样本数据进行重复数据删除得到的重复数据删除后的样本数据(在本例中该重复数据删除后的样本数据也即是目标样本数据)b包括样本数据块b1~b6。109.需要指出的是,与图4所示实施例同理,如果该评估数据缩减率的装置是存储系统中的处理器,该评估数据缩减率的装置可以直接对存储设备存储的原始数据进行抽样;如果该评估数据缩减率的装置是存储系统中的评估芯片或者是存储系统外部的评估设备,该评估数据缩减率的装置可以通过该存储系统中的处理器对该存储系统中的存储设备存储的原始数据进行抽样;可选地,如果该评估数据缩减率的装置是存储系统中的评估芯片,该评估数据缩减率的装置可以直接对存储设备存储的原始数据进行抽样,本技术实施例对此不做限定。110.步骤602、确定该目标样本数据的重删率。111.可选地,评估数据缩减率的装置确定重复数据删除前的样本数据的数据量和重复数据删除后的样本数据的数据量,根据重复数据删除前的样本数据的数据量和重复数据删除处理的样本数据的数据量确定该目标样本数据的重删率。在该图6所示实施例中,重复数据删除前的样本数据也即是原始样本数据,重复数据删除后的样本数据也即是目标样本数据,因此该步骤602也即是,评估数据缩减率的装置根据原始样本数据的数据量和目标样本数据的数据量确定该目标样本数据的重删率。112.可选地,评估数据缩减率的装置确定原始样本数据的数据量与目标样本数据的数据量的比值,根据该原始样本数据的数据量与该目标样本数据的数据量的比值,确定该目标样本数据的重删率。可选地,评估数据缩减率的装置将该原始样本数据的数据量与该目标样本数据的数据量的比值确定为该目标样本数据的重删率。示例地,目标样本数据的重删率为rd=v_r_bef/v_r_aft,rd表示目标样本数据的重删率,v_r_bef表示重复数据删除前的样本数据的数据量(在本例中也即是原始样本数据的数据量),v_r_aft表示重复数据删除后的样本数据的数据量(在本例中也即是目标样本数据的数据量),符号“/”表示除号。113.示例地,目标样本数据b的重删率为:rd=v_r_bef/v_r_aft=(b1+b2+b3+b4+b5+b6+b7+b8)/(b1+b2+b3+b4+b5+b6),在该式中,符号“/”表示除号,符号“+”加号,b1表示样本数据块b1的数据量,b2表示样本数据块b2的数据量,其他以此类推。114.步骤603、对该目标样本数据进行差分压缩,得到差分压缩后的样本数据。115.可选地,该差分压缩可以是delta压缩。对该目标样本数据进行差分压缩得到差分压缩后的样本数据,包括:评估数据缩减率的装置从该目标样本数据包括的多个样本数据块中确定至少一个参考数据块以及与每个参考数据块对应的至少一个目标数据块;对于该至少一个参考数据块中的每个参考数据块以及与该参考数据块对应的目标数据块,对该参考数据块以及与该参考数据块对应的每个目标数据块中与该参考数据块不同的部分分别进行自压缩。可选地,对于不存在对应目标数据块的参考数据块,评估数据缩减率的装置可以对该参考数据块进行自压缩。评估数据缩减率的装置按照此压缩方式对目标样本数据进行差分压缩后得到的数据即为差分压缩后的样本数据。116.可选地,评估数据缩减率的装置根据该目标样本数据中的多个样本数据块的弱哈希值,将该多个样本数据块中弱哈希值相等的样本数据块划分为一组得到至少一个样本组,对于该至少一个样本组中的每个样本组,将该样本组中的一个样本数据块确定为参考数据块,其他样本数据块确定为该参考数据块对应的目标数据块。在本技术实施例中,为了保证缩减率评估的准确性,每个样本数据块可以具有多个弱哈希值,这就导致一个样本数据块可能被分到多个样本组中参与差分压缩,为了避免一个样本数据块被分到多个样本组中参与差分压缩,本技术实施例中限定一个样本数据块仅能够被分到一个样本组中;或者,一个样本数据块可以被分到多个样本组中,但是在遍历该多个样本组进行差分压缩的过程中,如果确定某个样本数据块已经参与过差分压缩,则不在对该样本数据块进行差分压缩。通过此方式对样本数据进行修正,保证计算出的差分压缩收益的准确性。117.示例地,目标样本数据b包括样本数据块b1~b6,评估数据缩减率的装置从该样本数据块b1~b6中确定的参考数据块分别为样本数据块b1(为了便于描述称为参考数据块b1)、样本数据块b3(为了便于描述称为参考数据块b3)和样本数据块b6(为了便于描述称为参考数据块b6),与参考数据块b1对应的目标数据块为样本数据块b2(为了便于描述称为目标数据块b2),与参考数据块b3对应的目标数据块为样本数据块b4(为了便于描述称为目标数据块b4)和样本数据块b5(为了便于描述称为目标数据块b5),该目标样本数据b中不存在与参考数据块b6对应的目标数据块。评估数据缩减率的装置可以对参考数据块b1以及目标数据块b2中与该参考数据块b1不同的部分△db21(也即是deltadb21,表示目标数据块b2中与参考数据块b1不同的部分)分别进行自压缩得到差分压缩后的数据b1'和△db21',对参考数据块b3、目标数据块b4中与该参考数据块b3不同的部分△db43(也即是deltadb43,表示目标数据块b4中与参考数据块b3不同的部分)以及目标数据块b5中与该参考数据块b3不同的部分△db53(也即是deltadb53,表示目标数据块b5中与参考数据块b3不同的部分)分别进行自压缩得到差分压缩后的数据b3'、△db43'和△db53',对参考数据块b6进行自压缩得到压缩后的数据b6',所以,评估数据缩减率的装置对目标样本数据b进行差分压缩得到的差分压缩后的样本数据b'包括:b1'、△db21'、b3'、△db43'、△db53'和b6'。118.步骤604、根据该目标样本数据的数据量和该差分压缩后的样本数据的数据量,确定该目标样本数据的差分压缩收益。119.如前所述容易理解,该目标样本数据也即是差分压缩前的样本数据。可选地,评估数据缩减率的装置确定该目标样本数据的数据量和该差分压缩后的样本数据的数据量,并确定该目标样本数据的数据量与该差分压缩后的样本数据的数据量的比值,根据该目标样本数据的数据量与该差分压缩后的样本数据的数据量的比值,确定该目标样本数据的差分压缩收益。可选地,评估数据缩减率的装置将该目标样本数据的数据量与该差分压缩后的样本数据的数据量的比值确定为该目标样本数据的差分压缩收益。示例地,目标样本数据的差分压缩收益为cp=v_d_bef/v_d_aft,cp表示目标样本数据的差分压缩收益,v_d_bef表示目标样本数据的数据量,v_d_aft表示差分压缩后的样本数据的数据量,符号“/”表示除号。120.示例地,目标样本数据b的差分压缩收益为:cp=v_d_bef/v_d_aft=(b1+b2+b3+b4+b5+b6)/(b1'+△db21'+b3'+△db43'+△db53'+b6'),其中,符号“/”表示除号,符号“+”表示加号,b1表示差分压缩前样本数据块b1的数据量,b1'表示差分压缩后样本数据块b1的数据量,△db21'表示目标数据块b2中与参考数据块b1不同的部分压缩后的数据量,其他以此类推。121.步骤605、根据该目标样本数据的差分压缩收益和该目标样本数据的重删率确定该原始数据的缩减率。122.可选地,评估数据缩减率的装置将该目标样本数据的差分压缩收益和该目标样本数据的重删率的乘积确定为该原始数据的缩减率;或者,评估数据缩减率的装置可以维护差分压缩收益、重删率以及数据缩减率这三者的映射关系,评估数据缩减率的装置根据该目标样本数据的差分压缩收益、该目标样本数据的重删率以及该映射关系,确定该原始数据的缩减率,本技术实施例对此不做限定。123.示例地,本技术实施例以评估数据缩减率的装置将该目标样本数据的差分压缩收益和该目标样本数据的重删率的乘积确定为该原始数据的缩减率为例说明,则原始数据的缩减率可以是:rr=rd×cp,rr表示原始数据的缩减率,rd表示目标样本数据的重删率,cp表示该目标样本数据的差分压缩收益,符号“×”表示乘号。124.综上所述,本技术实施例提供的评估数据缩减率的方法,由于获取作为原始数据的子集的目标样本数据后,对该目标样本数据进行差分压缩,并确定该目标样本数据的差分压缩收益,根据该目标样本数据的差分压缩收益确定原始数据的缩减率,因此该评估数据缩减率的方法能够适用于基于差分压缩的存储系统,例如基于delta压缩的存储系统。并且,由于在差分压缩的过程中对样本数据进行了修正,对样本数据进行了修正可以起到对差分压缩收益关联修正的效果,使得确定的差分压缩收益更准确,保证基于该差分压缩收益评估出的缩减率的准确性。125.本技术实施例提供的评估数据缩减率的方法,由于目标样本数据是原始数据的子集,相比于原始数据,该目标样本数据的数据量较少,因此仅需少量的内存资源和计算资源就可以评估原始数据的缩减率,有助于降低评估数据缩减率的过程对内存资源以及计算资源的消耗。126.请参考图7,其示出了本技术实施例提供的再一种评估数据缩减率的方法的流程图。该图7以评估数据缩减率的装置根据目标样本数据的差分压缩收益、该目标样本数据的重删率以及该目标样本数据的自压缩率确定原始数据的缩减率为例说明。参见图7,该方法可以包括如下几个步骤:127.步骤701、获取目标样本数据,该目标样本数据是原始数据的子集,该目标样本数据是经过重复数据删除处理以及自压缩处理得到的数据。128.可选地,评估数据缩减率的装置对原始数据进行抽样,将抽样得到的数据确定为原始样本数据,对该原始样本数据进行重复数据删除处理以及自压缩处理,将经过重复数据删除处理以及自压缩处理后的样本数据确定为目标样本数据,不难理解,该目标样本数据是原始数据的子集,该目标样本数据包括多个样本数据块。其中,重复数据删除是指:对于待处理数据中重复的数据块仅保留一份,将该重复的数据块中除该一份数据块之外的数据块删除。自压缩是指:对待处理数据中的每个数据块分别进行压缩,也即是对每个数据块各自进行压缩,对各个数据块的压缩过程相互独立。在本技术实施例中,该目标样本数据是对原始样本数据进行重复数据删除处理以及自压缩处理得到的数据,该目标样本数据中的样本数据块的数量不大于该原始样本数据中的样本数据块的数量。可选地,该目标样本数据中的样本数据块的数量大于或等于预设数量,以便于评估数据缩减率的装置根据该目标样本数据评估到的原始数据的缩减率更接近于该原始数据的实际缩减率,提高评估的准确性。129.可选地,评估数据缩减率的装置可以对原始样本数据依次进行重复数据删除处理和自压缩处理(也即是先对原始样本数据进行重复数据删除,然后对重复数据删除后的样本数据进行自压缩),得到经过重复数据删除处理以及自压缩处理后的样本数据,或者,评估数据缩减率的装置可以对原始样本数据依次进行自压缩处理和重复数据删除处理(也即是先对原始样本数据进行自压缩处理,然后对自压缩后的样本数据进行重复数据删除处理),得到经过重复数据删除处理以及自压缩处理后的样本数据,本技术实施例对此不做限定。本领域技术人员容易理解,如果对原始样本数据依次进行自压缩处理和重复数据删除处理,在重复数据删除处理的过程中可能有部分自压缩的数据块会被删除,这部分数据块的自压缩过程可以实际上是不必要进行的,因此相比于对原始样本数据依次进行自压缩处理和重复数据删除处理,对原始样本数据依次进行重复数据删除处理和自压缩处理可以降低计算量。本技术实施例以评估数据缩减率的装置对原始样本数据依次进行重复数据删除处理和自压缩处理为例说明,则评估数据缩减率的装置获取目标样本数据具体可以包括:从原始数据中获取原始样本数据,该原始样本数据包括多个样本数据块;根据该原始样本数据中的多个样本数据块的强哈希值对该原始样本数据进行重复数据删除,得到重复数据删除后的样本数据,该重复数据删除后的样本数据包括多个样本数据块,强哈希值相等的样本数据块相同,该重复数据删除后的样本数据中的多个样本数据块的所述强哈希值各不相等;对该重复数据删除后的样本数据进行自压缩,得到目标样本数据。本领域技术人员容易理解,由于先对原始样本数据进行重复数据删除,然后对重复数据删除后的样本数据进行自压缩,而重复数据删除处理过程中仅仅是改变样本数据块的数量,并未对样本数据块本身进行处理,自压缩处理过程中对样本数据块进行了压缩,因此重复数据删除后的样本数据中的样本数据块的数量与自压缩后的样本数据(在图7所示实施例中该自压缩后的样本数据也即是目标样本数据)的样本数据块的数量相等,本技术实施例为了区分重复数据删除后的样本数据中的样本数据块与自压缩后的样本数据(也即是目标样本数据)中的样本数据块,将自压缩后的样本数据中的样本数据块称为自压缩数据块,下文中描述的自压缩数据块即指的是目标样本数据中的样本数据块。130.可选地,评估数据缩减率的装置从原始数据中获取原始样本数据可以包括:评估数据缩减率的装置基于抽样策略对原始数据进行抽样得到抽样数据,根据该抽样数据中的各个数据块的弱哈希值对该抽样数据进行抽样,将根据该抽样数据中的各个数据块的弱哈希值抽样得到的数据确定为原始样本数据。可选地,评估数据缩减率的装置采用全量读抽样策略对原始数据进行抽样得到抽样数据,或者,评估数据缩减率的装置按照百分比对原始数据进行抽样得到抽样数据,例如抽取原始数据的20%作为抽样数据。131.可选地,评估数据缩减率的装置根据抽样数据中的各个数据块的弱哈希值对该抽样数据进行抽样可以包括:评估数据缩减率的装置计算该抽样数据中的各个数据块的弱哈希值,将该抽样数据中弱哈希值处于抽样弱哈希值区间的数据块确定为样本数据块,从而可以确定出多个样本数据块,评估数据缩减率的装置将该多个样本数据块确定为原始样本数据。与图4所示实施例同理,该弱哈希值是sfp,该抽样弱哈希值区间是评估数据缩减率的装置中预先配置好的,或者,该抽样弱哈希值区间是评估数据缩减率的装置根据抽样数据的弱哈希值分布确定的。本技术实施例中,评估数据缩减率的装置通过根据随机数确定抽样弱哈希值区间,可以保证确定的抽样弱哈希值区间的随机性,避免在对抽样数据的抽样比例较低的情况下,由于抽样得到的原始样本数据中的样本数据块分布不均对评估结果的影响。132.可选地,评估数据缩减率的装置根据原始样本数据中的样本数据块的强哈希值对该原始样本数据进行重复数据删除,得到重复数据删除后的样本数据。示例地,评估数据缩减率的装置对原始样本数据进行重复数据删除得到重复数据删除后的样本数据包括:评估数据缩减率的装置计算原始样本数据中的各个样本数据块的强哈希值,将该原始样本数据中强哈希值相等的样本数据块确定为重复的样本数据块,将该重复的样本数据块仅保留一份,将该重复的样本数据块中除该一份样本数据块之外的样本数据块删除,将保留下来的样本数据块确定为重复数据删除后的样本数据。可选地,该强哈希值是指纹fp。示例地,原始样本数据包括样本数据块g1~g8(也即是样本数据块g1、样本数据块g2、样本数据块g3、样本数据块g4、样本数据块g5、样本数据块g6、样本数据块g7和样本数据块g8),样本数据块g1的强哈希值与样本数据块g7的强哈希值相等,样本数据块g5的强哈希值与样本数据块g8的强哈希值相等,则评估数据缩减率的装置对该原始样本数据进行重复数据删除得到的重复数据删除后的样本数据包括样本数据块g1~g6。133.可选地,评估数据缩减率的装置对重复数据删除后的样本数据中的每个样本数据块分别进行压缩,以实现对该重复数据删除后的样本数据的自压缩。示例地,重复数据删除后的样本数据包括样本数据块g1~g6,评估数据缩减率的装置对该重复数据删除后的样本数据进行自压缩得到的自压缩后的样本数据(也即是经过重复数据删除处理以及自压缩处理后的样本数据,在该图7所示实施例中也即是目标样本数据)g包括:自压缩数据块g1”~g6”(也即是自压缩数据块g1”、自压缩数据块g2”、自压缩数据块g3”、自压缩数据块g5”和自压缩数据块g6”),自压缩数据块g1”~g6”是对样本数据块g1~g6进行自压缩得到的样本数据块。134.需要指出的是,与图4所示实施例同理,如果该评估数据缩减率的装置是存储系统中的处理器,该评估数据缩减率的装置可以直接对存储设备存储的原始数据进行抽样;如果该评估数据缩减率的装置是存储系统中的评估芯片或者是存储系统外部的评估设备,该评估数据缩减率的装置可以通过该存储系统中的处理器对该存储系统中的存储设备存储的原始数据进行抽样;可选地,如果该评估数据缩减率的装置是存储系统中的评估芯片,该评估数据缩减率的装置可以直接对存储设备存储的原始数据进行抽样,本技术实施例对此不做限定。135.步骤702、确定该目标样本数据的重删率。136.可选地,评估数据缩减率的装置确定重复数据删除前的样本数据的数据量和重复数据删除后的样本数据的数据量,根据重复数据删除前的样本数据的数据量和重复数据删除后的样本数据的数据量确定该目标样本数据的重删率。在该图7所示实施例中,重复数据删除前的样本数据也即是原始样本数据,因此该步骤702也即是,评估数据缩减率的装置根据原始样本数据的数据量和重复数据删除后的样本数据的数据量确定该目标样本数据的重删率。137.可选地,评估数据缩减率的装置确定原始样本数据的数据量与重复数据删除后的样本数据的数据量的比值,根据该原始样本数据的数据量与该重复数据删除后的样本数据的数据量的比值,确定该目标样本数据的重删率。可选地,评估数据缩减率的装置将该原始样本数据的数据量与该重复数据删除后的样本数据的数据量的比值确定为该目标样本数据的重删率。示例地,目标样本数据的重删率为rd=v_r_bef/v_r_aft,rd表示该目标样本数据的重删率,v_r_bef表示重复数据删除前的样本数据的数据量(在本例中也即是原始样本数据的数据量),v_r_aft表示重复数据删除后的样本数据的数据量,符号“/”表示除号。138.示例地,目标样本数据g的重删率为:rd=v_r_bef/v_r_aft=(g1+g2+g3+g4+g5+g6+g7+g8)/(g1+g2+g3+g4+g5+g6),在该式中,符号“/”表示除号,符号“+”表示加号,g1表示样本数据块g1的数据量,g2表示样本数据块g2的数据量,其他以此类推。139.步骤703、确定该目标样本数据的自压缩率。140.可选地,评估数据缩减率的装置确定自压缩前的样本数据的数据量和自压缩后的样本数据的数据量,根据该自压缩前的样本数据的数据量和该自压缩后的样本数据的数据量确定目标样本数据的重删率。在该图7所示实施例中,该自压缩前的样本数据也即是重复数据删除后的样本数据,该自压缩后的样本数据也即是经过重复数据删除处理和自压缩处理得到的目标样本数据,因此该步骤703也即是,评估数据缩减率的装置根据自压缩前的样本数据的数据量和目标样本数据的数据量确定该目标样本数据的自压缩率。141.可选地,评估数据缩减率的装置确定自压缩前的样本数据的数据量与目标样本数据的数据量的比值,根据该自压缩前的样本数据的数据量与该目标样本数据的数据量的比值,确定该目标样本数据的自压缩率。可选地,评估数据缩减率的装置将该自压缩前的样本数据的数据量与该目标样本数据的数据量的比值确定为该目标样本数据的自压缩率。示例地,目标样本数据的自压缩率为rs=v_s_bef/v_s_aft,rs表示目标样本数据的自压缩率,v_s_bef表示自压缩前的样本数据的数据量(在本例中也即是重复数据删除后的样本数据的数据量),v_r_aft表示自压缩后的样本数据的数据量(在本例中也即是目标样本数据的数据量),符号“/”表示除号。142.示例地,目标样本数据g的自压缩收益为:rs=v_s_bef/v_s_aft=(g1+g2+g3+g4+g5+g6)/(g1”+g2”+g3”+g4”+g5”+g6”),在该式中,符号“/”表示除号,符号“+”表示加号,g1表示样本数据块g1的数据量,g1”表示自压缩数据块g1”的数据量,自压缩数据块g1”是对样本数据块g1进行自压缩得到的样本数据块,其他以此类推。143.步骤704、对该目标样本数据进行差分压缩,得到差分压缩后的样本数据。144.可选地,该差分压缩可以是delta压缩。在该图7所示实施例中,对该目标样本数据进行差分压缩得到差分压缩后的样本数据,包括:评估数据缩减率的装置从该目标样本数据包括的多个自压缩数据块中确定至少一个参考数据块以及与每个参考数据块对应的至少一个目标数据块;对于该至少一个参考数据块中的每个参考数据块以及与该参考数据块对应的目标数据块,对该参考数据块以及与该参考数据块对应的每个目标数据块中与该参考数据块不同的部分分别进行自压缩。可选地,对于不存在对应目标数据块的参考数据块,评估数据缩减率的装置可以对该参考数据块进行自压缩。评估数据缩减率的装置按照此压缩方式对目标样本数据进行差分压缩后得到的数据即为差分压缩后的样本数据。145.可选地,评估数据缩减率的装置根据目标样本数据中的多个自压缩数据块的弱哈希值,将该多个自压缩数据块中弱哈希值相等的自压缩数据块划分为一组得到至少一个样本组,对于该至少一个样本组中的每个样本组,将该样本组中的一个自压缩数据块确定为参考数据块,其他自压缩数据块确定为该参考数据块对应的目标数据块。在本技术实施例中,为了保证缩减率评估的准确性,每个自压缩数据块可以具有多个弱哈希值,这就导致一个自压缩数据块可能被分到多个样本组中参与差分压缩,为了避免一个自压缩数据块被分到多个样本组中参与差分压缩,本技术实施例中限定一个自压缩数据块仅能够被分到一个样本组中;或者,一个自压缩数据块可以被分到多个样本组中,但是在遍历该多个样本组进行差分压缩的过程中,如果确定某个自压缩数据块已经参与过差分压缩,则不在对该自压缩数据块进行差分压缩。通过此方式对样本数据进行修正,保证计算出的差分压缩收益的准确性。其中,自压缩数据块的弱哈希值与该自压缩数据块对应的自压缩前的样本数据块的弱哈希值相等。146.示例地,目标样本数据g包括自压缩数据块g1”~g6”,评估数据缩减率的装置从该自压缩数据块g1”~g6”中确定的参考数据块分别为自压缩数据块g1”(为了便于描述称为参考数据块g1”)、自压缩数据块g3”(为了便于描述称为参考数据块g3”)和自压缩数据块g6”(为了便于描述称为参考数据块g6”),与参考数据块g1”对应的目标数据块为样本数据块g2”(为了便于描述称为目标数据块g2”),与参考数据块g3”对应的目标数据块为样本数据块g4”(为了便于描述称为目标数据块g4”)和样本数据块g5”(为了便于描述称为目标数据块g5”),该目标样本数据g中不存在与参考数据块g6”对应的目标数据块。评估数据缩减率的装置可以对参考数据块g1”以及目标数据块g2”中与该参考数据块g1”不同的部分△dg21”(也即是deltadg21”,表示目标数据块g2”中与参考数据块g1”不同的部分)分别进行自压缩得到差分压缩后的数据g1'和△dg21',对参考数据块g3”、目标数据块g4”中与该参考数据块g3”不同的部分△dg43”(也即是deltadg43”,表示目标数据块g4”中与参考数据块g3”不同的部分)以及目标数据块g5”中与该参考数据块g3”不同的部分△dg53”(也即是deltadg53”,表示目标数据块g5”中与参考数据块g3”不同的部分)分别进行自压缩得到差分压缩后的数据g3'、△dg43'和△dg53',对参考数据块g6”进行自压缩得到压缩后的数据g6',所以,评估数据缩减率的装置对目标样本数据g进行差分压缩得到的差分压缩后的样本数据g'包括:g1'、△dg21'、g3'、△dg43'、△dg53'和g6'。147.步骤705、根据该目标样本数据的数据量和该差分压缩后的样本数据的数据量,确定该目标样本数据的差分压缩收益。148.如前所述容易理解,该目标样本数据也即是差分压缩前的样本数据。可选地,评估数据缩减率的装置确定该目标样本数据的数据量和该差分压缩后的样本数据的数据量,并确定该目标样本数据的数据量与该差分压缩后的样本数据的数据量的比值,根据该目标样本数据的数据量与该差分压缩后的样本数据的数据量的比值,确定该目标样本数据的差分压缩收益。可选地,评估数据缩减率的装置将该目标样本数据的数据量与该差分压缩后的样本数据的数据量的比值确定为该目标样本数据的差分压缩收益。示例地,目标样本数据的差分压缩收益为cp=v_d_bef/v_d_aft,cp表示目标样本数据的差分压缩收益,v_d_bef表示目标样本数据的数据量,v_d_aft表示差分压缩后的样本数据的数据量,符号“/”表示除号。149.示例地,目标样本数据g的差分压缩收益为:cp=v_d_bef/v_d_aft=(g1”+g2”+g3”+g4”+g5”+g6”)/(g1'+△dg21'+g3'+△dg43'+△dg53'+g6'),在该式中,符号“/”表示除号,符号“+”表示加号,g1”表示差分压缩前的自压缩数据块g1”(也即是参考数据块g1”)的数据量,g1'表示差分压缩后的自压缩数据块g1”的数据量,△dg21'表示目标数据块g2”中与参考数据块g1”不同的部分压缩后的数据量,其他以此类推。150.步骤706、根据该目标样本数据的差分压缩收益、该目标样本数据的重删率以及该目标样本数据的自压缩率确定该原始数据的缩减率。151.可选地,评估数据缩减率的装置将该目标样本数据的差分压缩收益、该目标样本数据的重删率以及该目标样本数据的自压缩率的乘积确定为该原始数据的缩减率;或者,评估数据缩减率的装置可以维护差分压缩收益、重删率、自压缩率以及数据缩减率这四者的映射关系,评估数据缩减率的装置根据该目标样本数据的差分压缩收益、该目标样本数据的重删率、该目标样本数据的自压缩率以及该映射关系,确定该原始数据的缩减率,本技术实施例对此不做限定。152.示例地,本技术实施例以评估数据缩减率的装置将该目标样本数据的差分压缩收益、该目标样本数据的重删率以及该目标样本数据的自压缩率的乘积确定为该原始数据的缩减率为例说明,则原始数据的缩减率可以是:rr=rd×rs×cp,rr表示原始数据的缩减率,rd表示目标样本数据的重删率,rs表示该目标样本数据的自压缩率,cp表示该目标样本数据的差分压缩收益,符号“×”表示乘号。153.综上所述,本技术实施例提供的评估数据缩减率的方法,由于获取作为原始数据的子集的目标样本数据后,对该目标样本数据进行差分压缩,并确定该目标样本数据的差分压缩收益,根据该目标样本数据的差分压缩收益确定原始数据的缩减率,因此该评估数据缩减率的方法能够适用于基于差分压缩的存储系统,例如基于delta压缩的存储系统。并且,由于在差分压缩的过程中对样本数据进行了修正,对样本数据进行了修正可以起到对差分压缩收益关联修正的效果,使得确定的差分压缩收益更准确,保证基于该差分压缩收益评估出的缩减率的准确性。154.本技术实施例提供的评估数据缩减率的方法,在确定原始数据的缩减率时,还考虑到目标样本数据的自压缩率,因此该评估数据缩减率的方法能够适用于基于自压缩的存储系统。也即是,该评估数据缩减率的方法能够同时适用于基于delta压缩和自压缩的存储系统,能够实现与目前的评估数据缩减率的技术方案的兼容。并且,由于目标样本数据是原始数据的子集,相比于原始数据,该目标样本数据的数据量较少,因此仅需少量的内存资源和计算资源就可以评估原始数据的缩减率,有助于降低评估数据缩减率的过程对内存资源以及计算资源的消耗。155.下面以两个具体示例来介绍图7所示实施例的评估数据缩减率的方法,在该两个具体示例中,以强哈希值为fp,弱哈希值为sfp为例说明。156.示例地,请参考图8,其示出了本技术实施例提供的又一种评估数据缩减率的方法的流程图,参见图8,该评估数据缩减率的方法包括如下几个步骤:157.步骤801、对原始数据进行抽样得到抽样数据,该抽样数据包括m个数据块,m≥1,且m为整数。158.可选地,评估数据缩减率的装置采用全量读抽样策略对原始数据进行抽样得到抽样数据,也即是,评估数据缩减率的装置将所有的原始数据作为抽样数据。示例地,评估数据缩减率的装置从存储设备中读取原始数据,将读取到的所有原始数据作为抽样数据。159.步骤802、计算该抽样数据中的各个数据块的fp和sfp。160.可选地,对于抽样数据中的每个数据块,评估数据缩减率的装置采用强哈希算法计算该数据块的fp,采用弱哈希算法计算该数据块的sfp,从而得到该抽样数据中的各个数据块的fp和sfp。可选地,每个数据块可以具有多个sfp,对于抽样数据中的每个数据块,评估数据缩减率的装置采用多种不同的弱哈希算法计算该数据块的sfp,得到该数据块的多个sfp。161.步骤803、根据该抽样数据中的数据块的sfp,对该抽样数据进行抽样得到原始样本数据,该原始样本数据包括n个样本数据块,m≥n≥1,且n为整数。162.可选地,评估数据缩减率的装置根据该抽样数据中的数据块的sfp,将该抽样数据中sfp处于抽样sfp区间的数据块确定为样本数据块,从而确定出n个样本数据块,将该n个样本数据块确定为目标样本数据。示例地,n=m/500,也即是,目标样本数据中的样本数据块的数量是抽样数据中的数据块的数量的1/500。163.示例地,该抽样sfp区间是评估数据缩减率的装置根据抽样数据的sfp分布确定的,评估数据缩减率的装置计算出抽样数据中的各个数据块的sfp后,根据该抽样数据的sfp分布将该抽样数据的sfp划分为至少一个sfp区间,通过随机数函数生成一个随机数,将该随机数所处的sfp区间确定为抽样sfp区间。164.步骤804、对该原始样本数据进行重复数据删除得到重复数据删除后的样本数据,该重复数据删除后的样本数据包括k个样本数据块,n≥k≥1,且k为整数。165.可选地,评估数据缩减率的装置将该原始样本数据中fp相等的样本数据块确定为重复的样本数据块,将该重复的样本数据块仅保留一份,将该重复的样本数据块中除该一份样本数据块之外的样本数据块删除,将保留下来的样本数据块确定为重复数据删除后的样本数据,该重复数据删除后的样本数据包括k个样本数据块。166.示例地,原始样本数据包括样本数据块e1~e5(也即是数据块e1、数据块e2、数据块e3、数据块e4、数据块e5),样本数据块e1的fp与样本数据块e4的fp相等,样本数据块e3的fp与样本数据块e5的fp相等,则评估数据缩减率的装置对该原始样本数据进行重复数据删除得到的重复数据删除后的样本数据包括样本数据块e1~e3。167.步骤805、对该重复数据删除后的样本数据进行自压缩得到目标样本数据,该目标样本数据包括k个自压缩数据块。168.可选地,评估数据缩减率的装置对该重复数据删除后的样本数据中的每个样本数据块分别进行压缩得到目标样本数据,该目标样本数据包括k个自压缩数据块,该k个自压缩数据块与该重复数据删除后的样本数据中的k个样本数据块一一对应,每个自压缩数据块是对相应的样本数据块进行自压缩得到的。169.示例地,重复数据删除后的样本数据包括样本数据块e1~e3,评估数据缩减率的装置对该重复数据删除后的样本数据进行自压缩得到的目标样本数据e包括:自压缩数据块e1”~e3”(也即是自压缩数据块e1”、自压缩数据块e2”、自压缩数据块e3”),自压缩数据块e1”~e3”是对样本数据块e1~e3进行自压缩得到的。170.步骤806、计算该k个自压缩数据块中的各个自压缩数据块的自压缩率。171.可选地,对于该k个自压缩数据块中每个自压缩数据块,评估数据缩减率的装置将该自压缩数据块对应的样本数据块(也即是压缩前的该数据块)的数据量与该自压缩数据块的数据量的比值确定为计算该自压缩数据块的自压缩率。172.示例地,自压缩数据块e1”的自压缩率为e1/e1”,自压缩数据块e2”的自压缩率为e2/e2”,自压缩数据块e3”的自压缩率为e3/e3”。在e1/e1”中,e1”表示自压缩数据块e1”的数据量,e1表示样本数据块e1(也即是自压缩数据块e1”对应的样本数据块)的数据量,符号“/”表示除号,在e2/e2”中,e2”表示自压缩数据块e2”的数据量,e2表示样本数据块e2(也即是自压缩数据块e2”对应的样本数据块)的数据量,符号“/”表示除号,在e3/e3”中,e3”表示自压缩数据块e3”的数据量,e3表示样本数据块e3(也即是自压缩数据块e3”对应的样本数据块)的数据量,符号“/”表示除号。173.步骤807、将该k个自压缩数据块的fp以及该k个自压缩数据块的自压缩率记录至fp表中。174.其中,每个自压缩数据块的fp与该自压缩数据块对应的样本数据块的fp相等,fp相等的自压缩数据块的自压缩率相等。该fp表用于记录fp、自压缩率以及引用计数的对应关系,该引用计数用于表征该目标样本数据中的同一fp的自压缩数据块的数量。175.示例地,将该k个自压缩数据块的fp以及该k个自压缩数据块的自压缩率记录至fp表后,该fp表可以如下表1所示:176.表1177.fp自压缩率引用计数fp1rs1cfp1fp2rs2cfp2fp3rs3cfp3178.如表1所示,rs1表示fp为fp1的自压缩数据块的自压缩率,cfp1表示目标样本数据中fp为fp1的自压缩数据块的数量,rs2表示fp为fp2的自压缩数据块的自压缩率,cfp2表示目标样本数据中fp为fp2的自压缩数据块的数量,rs3表示fp为fp3的自压缩数据块的自压缩率,cfp3表示目标样本数据中fp为fp3的自压缩数据块的数量。示例地,结合步骤806,fp1、fp2、fp3可以依次表示自压缩数据块e1”、自压缩数据块e2”、自压缩数据块e3”的fp,rs1、rs2、rs3可以依次表示自压缩数据块e1”、自压缩数据块e2”、自压缩数据块e3”的自压缩率,则rs1=e1/e1”,rs2=e2/e2”,rs3=e3/e3”。179.本领域技术人员容易理解,在将该k个自压缩数据块的fp以及该k个自压缩数据块的自压缩率记录至fp表之前,fp表可以为空表,该fp表中不存在fp、自压缩率以及引用计数的具体信息,仅存在表头,在该步骤807中,将fp、自压缩率以及引用计数记录至fp表中得到如表1所示的fp表。在本技术实施例中,由于在步骤804中对原始样本数据进行重复数据删除时,将fp相等的样本数据块确定为重复的样本数据块,将该重复的样本数据块仅保留一份,因此步骤805中的k个自压缩数据块的fp各不相等,从而该表1所示的fp表中记录的引用计数均可以是1,也即是cfp1、cfp2和cfp3均是1,本技术实施例对此不做限定。180.步骤808、计算该目标样本数据的重删率以及该目标样本数据的自压缩率。181.可选地,评估数据缩减率的装置确定重复数据删除前的样本数据(也即是原始样本数据)的数据量与重复数据删除后的样本数据的数据量,将重复数据删除前的样本数据的数据量与重复数据删除后的样本数据的数据量的比值确定为该目标样本数据的重删率。示例地,重复数据删除前的样本数据包括样本数据块e1~e5,重复数据删除后的样本数据包括样本数据块e1~e3,目标样本数据e的重删率为rd=v_r_bef/v_r_aft=(e1+e2+e3+e4+e5)/(e1+e2+e3),在该式中,符号“/”表示除号,符号“+”加号,e1表示样本数据块e1的数据量,e2表示样本数据块e2的数据量,其他以此类推。182.可选地,评估数据缩减率的装置基于fp表中记录的fp的数量以及每个fp对应的自压缩率,确定该目标样本数据的自压缩率。示例地,该fp表中记录的每个自压缩率是一个自压缩数据块的自压缩率,每个自压缩数据块的自压缩率是一个分数值,该分数值的分子是自压缩前的样本数据块(也即是该自压缩数据块对应的样本数据块)的数据量,分母是自压缩后的样本数据块(也即是该自压缩数据块)的数据量,评估数据缩减率的装置将该fp表中记录的各个自压缩率的分子之和作为自压缩前的样本数据的数据量,将该fp表中记录的各个自压缩率的分母之和作为自压缩后的样本数据的数据量,将该自压缩前的样本数据的数据量与该自压缩后的样本数据的数据量的比值确定为该目标样本数据的自压缩率。示例地,如表1所示并结合步骤806,目标样本数据e的自压缩率为:rs=v_s_bef/v_s_aft=(e1+e2+e3)/(e1”+e2”+e3”),在该式中,符号“/”表示除号,符号“+”表示加号,e1表示样本数据块e1的数据量,e1”表示自压缩数据块e1”的数据量,自压缩数据块e1”是对样本数据块e1进行自压缩得到的,其他以此类推。183.步骤809、将该k个自压缩数据块的sfp,该k个自压缩数据块的地址以及该k个自压缩数据块中的各个自压缩数据块的数据量记录至sfp表中。184.其中,每个自压缩数据块的sfp与该自压缩数据块对应的样本数据块的sfp相等,该sfp表用于记录sfp、自压缩数据块的地址以及自压缩数据块的数据量的对应关系,该自压缩数据块的地址可以是该自压缩数据块的逻辑区块地址(logicalblockaddress,lba),在本技术实施例中,该自压缩数据块的地址与该自压缩数据块对应的样本数据块的地址可以相同。185.示例地,将该k个自压缩数据块的sfp,该k个自压缩数据块的地址以及该k个自压缩数据块中的各个自压缩数据块的数据量记录至sfp表中后,该sfp表可以如下表2所示:186.表2[0187][0188][0189]如表2所示,x1表示地址为lba1的自压缩数据块的数据量,地址为lba1的自压缩数据块具有两个sfp,该两个sfp分别为sfp1和sfp2,x2表示地址为lba2的自压缩数据块的数据量,地址为lba2的自压缩数据块的sfp为sfp2,x3表示地址为lba3的自压缩数据块的数据量,地址为lba3的自压缩数据块的sfp为sfp1。示例地,结合步骤806,lba1表示自压缩数据块e1”的地址,x1表示自压缩数据块e1”的数据量,自压缩数据块e1”的sfp为sfp1和sfp2,lba2表示自压缩数据块e2”的地址,x2表示自压缩数据块e2”的数据量,自压缩数据块e2”的sfp为sfp2,lba3表示自压缩数据块e3”的地址,x3表示自压缩数据块e3”的数据量,自压缩数据块e3”的sfp为sfp1。[0190]本领域技术人员容易理解,在将自压缩数据块的sfp,自压缩数据块的地址以及自压缩数据块的数据量记录至sfp表之前,sfp表可以为空表,该sfp表中不存在sfp、自压缩数据块的地址以及自压缩数据块的数据量的具体信息,仅存在表头,在该步骤809中,将该k个自压缩数据块的sfp,该k个自压缩数据块的地址以及该k个自压缩数据块中的各个自压缩数据块的数据量记录至sfp表中得到如表2所示的sfp表。[0191]步骤810、基于该sfp表对该目标样本数据进行差分压缩,得到差分压缩后的样本数据。[0192]可选地,该差分压缩可以是delta压缩。可选地,评估数据缩减率的装置遍历该sfp表,根据该sfp表中记录的目标样本数据中的k个自压缩数据块的sfp,将该k个自压缩数据块中sfp相等的样本数据块划分为一组得到至少一个样本组,对于该至少一个样本组中的每个样本组,将该样本组中的一个样本数据块确定为参考数据块,其他样本数据块确定为该参考数据块对应的目标数据块,从而评估数据缩减率的装置可以从该目标样本数据中的k个自压缩数据块中确定出至少一个参考数据块以及与每个参考数据块对应的至少一个目标数据块,每个参考数据块的全部数据与该参考数据块对应的目标数据块的部分数据相同;之后,对于该至少一个参考数据块中的每个参考数据块以及与该参考数据块对应的目标数据块,评估数据缩减率的装置对该参考数据块以及与该参考数据块对应的每个目标数据块中与该参考数据块不同的部分分别进行自压缩,以实现对该目标样本数据的差分压缩。[0193]在本技术实施例中,每个自压缩数据块可以具有多个sfp,为了避免一个自压缩数据块被分到多个样本组中参与差分压缩,本技术实施例中限定一个自压缩数据块仅能够被分到一个样本组中;或者,一个自压缩数据块可以被分到多个样本组中,但是在遍历该多个样本组进行差分压缩的过程中,如果确定某个自压缩数据块已经参与过差分压缩,则不在对该自压缩数据块进行差分压缩。[0194]示例地,以表2中的lba1表示自压缩数据块e1”的地址,lba2表示自压缩数据块e2”的地址,lba3表示自压缩数据块e3”的地址为例说明。评估数据缩减率的装置遍历如表2所示的sfp表,确定自压缩数据块e1”的sfp分别为sfp1和sfp2,自压缩数据块e1”的其中一个sfp与自压缩数据块e3”的sfp相等,另一个sfp与自压缩数据块e2”的sfp相等。那么,评估数据缩减率的装置对目标样本数据e(包括自压缩数据块e1”、自压缩数据块e2”和自压缩数据块e3”)进行自压缩可以包括以下两种可能的实现方式:[0195]在一种可能的实现方式中,评估数据缩减率的装置根据表2记录的sfp,将自压缩数据块e1”、自压缩数据块e2”和自压缩数据块e3”分组得到两个样本组,该两个样本组分别为:样本组1【自压缩数据块e1”,自压缩数据块e3”】,样本组2【自压缩数据块e2”】,假设样本组1中自压缩数据块e1”为参考数据块,自压缩数据块e3”是该参考数据块对应的目标数据块,则评估数据缩减率的装置对自压缩数据块e1”以及自压缩数据块e3”中与自压缩数据块e1”不同的部分△de31”分别进行自压缩得到差分压缩后的数据e1'和△de31',对自压缩数据块e2”进行压缩得到压缩后的数据e2',所以,评估数据缩减率的装置对目标样本数据e进行差分压缩得到的差分压缩后的样本数据e'包括:e1'、△de31'和e2'。或者,该两个样本组分别为:样本组1【自压缩数据块e1”,自压缩数据块e2”】,样本组2【自压缩数据块e3”】,假设样本组1中自压缩数据块e1”为参考数据块,自压缩数据块e2”是该参考数据块对应的目标数据块,则评估数据缩减率的装置对自压缩数据块e1”以及自压缩数据块e2”中与自压缩数据块e1”不同的部分△de21”分别进行自压缩得到差分压缩后的数据e1'和△de21',对自压缩数据块e3”进行压缩得到压缩后的数据e3',所以,评估数据缩减率的装置对目标样本数据e进行差分压缩得到的差分压缩后的样本数据e'包括:e1'、△de21'和e3'。[0196]在另一种可能的实现方式中,评估数据缩减率的装置根据表2记录的sfp,将自压缩数据块e1”、自压缩数据块e2”和自压缩数据块e3”分组得到两个样本组,该两个样本组分别为:样本组1【自压缩数据块e1”,自压缩数据块e2”】,样本组2【自压缩数据块e1”,自压缩数据块e3”】,假设评估数据缩减率的装置首先遍历到的是样本组1,样本组1中自压缩数据块e1”为参考数据块,自压缩数据块e2”是该参考数据块对应的目标数据块,则评估数据缩减率的装置对自压缩数据块e1”以及自压缩数据块e2”中与自压缩数据块e1”不同的部分△de21”分别进行自压缩得到差分压缩后的数据e1'和△de21',当评估数据缩减率的装置遍历到样本组2时,发现该样本组2中的自压缩数据块e1”已经参与过差分压缩,因此评估数据缩减率的装置仅对自压缩数据块e3”进行压缩得到压缩后的数据e3',而不对自压缩数据块e1”进行差分压缩,所以,评估数据缩减率的装置对目标样本数据e进行差分压缩得到的差分压缩后的样本数据e'包括:e1'、△de21'和e3'。[0197]在本技术实施例中,限定一个样本数据块仅能够被分到一个样本组中;或者,一个样本数据块可以被分到多个样本组中,但是在遍历该多个样本组进行差分压缩的过程中,如果确定某个样本数据块已经参与过差分压缩,则不在对该样本数据块进行差分压缩,通过此方式对样本数据进行修正,保证计算出的差分压缩收益的准确性。[0198]步骤811、计算该目标样本数据的差分压缩收益。[0199]可选地,评估数据缩减率的装置确定该目标样本数据(也即是差分压缩前的样本数据)的数据量和差分压缩后的样本数据的数据量,将该目标样本数据的数据量与该差分压缩后的样本数据的数据量的比值确定为该目标样本数据的差分压缩收益。[0200]示例地,以对目标样本数据e进行差分压缩得到的差分压缩后的样本数据e'包括:e1'、△de21'和e3'为例,目标样本数据e的差分压缩收益为:cp=v_d_bef/v_d_aft=(e1”+e2”+e3”)/(e1'+△de21'+e3'),在该式中,符号“/”表示除号,符号“+”表示加号,e1”表示差分压缩前的自压缩数据块e1”的数据量,e1'表示差分压缩后的自压缩数据块e1”的数据量,△de21'表示自压缩数据块e2”中与自压缩数据块e1”不同的部分压缩后的数据量。[0201]步骤812、根据该目标样本数据的重删率、该目标样本数据的自压缩率以及该目标样本数据的差分压缩收益,确定原始数据的缩减率。[0202]可选地,评估数据缩减率的装置将该目标样本数据的差分压缩收益、该目标样本数据的重删率以及该目标样本数据的自压缩率的乘积确定为该原始数据的缩减率。[0203]示例地,该目标样本数据e的重删率为rd=v_r_bef/v_r_aft=(e1+e2+e3+e4+e5)/(e1+e2+e3),自压缩率为:rs=v_s_bef/v_s_aft=(e1+e2+e3)/(e1”+e2”+e3”),差分压缩收益为:cp=v_d_bef/v_d_aft=(e1”+e2”+e3”)/(e1'+△de21'+g3'),则原始数据的缩减率为:rr=rd×rs×cp=[(e1+e2+e3+e4+e5)/(e1+e2+e3)]×[(e1+e2+e3)/(e1”+e2”+e3”)]×[(e1”+e2”+e3”)/(e1'+△de21'+g3')]=(e1+e2+e3+e4+e5)/(e1'+△de21'+g3')。[0204]示例地,请参考图9,其示出了本技术实施例提供的又一种评估数据缩减率的方法的流程图,参见图9,该评估数据缩减率的方法包括如下几个步骤:[0205]步骤901、按照抽样步长对原始数据进行第j次抽样,将第1至第j次抽样得到的所有数据确定为第j抽样数据,该第j抽样数据包括mj个数据块,mj≥1,j≥1,且mj和j为整数。[0206]可选地,评估数据缩减率的装置根据原始数据的fp或者lba,按照抽样步长对该原始数据进行抽样。示例地,该抽样步长可以是1%a,a表示该原始数据的数据量。[0207]示例地,评估数据缩减率的装置按照该抽样步长对原始数据进行第1次抽样得到的抽样数据的数据量为1%a,第1次抽样得到的抽样数据为第一抽样数据,因此第一抽样数据的数据量为1%a;评估数据缩减率的装置按照该抽样步长对该原始数据进行第2次抽样得到的抽样数据的数据量为1%a,第1次抽样和第2次抽样得到的所有抽样数据的数据量为2%a,第1次抽样和第2次抽样得到的所有数据为第二抽样数据,因此第二抽样数据的数据量为2%a,同理,第三抽样数据的数据量为3%a,第四抽样数据的数据量为4%a,第五抽样数据的数据量为5%a,以此类推。[0208]步骤902、计算该第j抽样数据中的各个数据块的fp和sfp。[0209]上述步骤902的实现过程可以参考前述前述步骤802,本技术实施例在此不再赘述。[0210]步骤903、根据该第j抽样数据中的数据块的sfp,对该第j抽样数据进行抽样得到第j原始样本数据,该第j原始样本数据包括nj个样本数据块,mj≥nj≥1,且nj为整数。[0211]示例地,评估数据缩减率的装置根据该第j抽样数据中的数据块的sfp,采用全量读抽样策略对该第j抽样数据进行抽样得到第j原始样本数据。也即是,评估数据缩减率的装置将第j抽样数据中的所有数据块确定为样本数据块,因此mj=nj。[0212]步骤904、对该第j原始样本数据进行重复数据删除得到重复数据删除后的样本数据,该重复数据删除后的样本数据包括kj个样本数据块,nj≥kj≥1,且k1为整数。[0213]步骤905、对该重复数据删除后的样本数据进行自压缩得到第j目标样本数据,该第j目标样本数据包括kj个自压缩数据块。[0214]上述步骤904至步骤905的实现过程可以参考前述前述步骤804至步骤805,本技术实施例在此不再赘述。[0215]步骤906、将该kj个自压缩数据块的sfp,该kj个自压缩数据块的地址以及该kj个自压缩数据块中的各个自压缩数据块的数据量记录至sfp表中。[0216]步骤907、基于该sfp表对该第j目标样本数据进行差分压缩,得到差分压缩后的样本数据。[0217]步骤908、计算该第j目标样本数据的差分压缩收益。[0218]上述步骤906至步骤908的实现过程可以参考前述前述步骤809至步骤811,本技术实施例在此不再赘述。[0219]步骤909、检测该第j抽样数据是否达到原始数据的预定比例。如果该第j抽样数据达到原始数据的预定比例,执行步骤910至步骤912;如果该第j抽样数据未达到原始数据的预定比例,更新j=j+1,以j=j+1执行步骤901至步骤909,并在第j+1抽样数据达到原始数据的预定比例时执行步骤910至步骤912。[0220]可选地,评估数据缩减率的装置确定第j抽样数据的数据量以及原始数据的数据量,检测该第j抽样数据的数据量是否达到该原始数据的数据量的预定比例。示例地,该预定比例是20%,评估数据缩减率的装置检测第j抽样数据的数据量是否等于20%a。[0221]步骤910、对计算出的j个差分压缩收益进行曲线拟合,确定最终的差分压缩收益。[0222]评估数据缩减率的装置每按照抽样步长对原始数据进行一次抽样,通过类似前述步骤901至步骤908的方法计算得到一个差分压缩收益,因此在第j抽样数据达到原始数据的预定比例时,评估数据缩减率的装置一共计算得到j个差分压缩收益,该j个差分压缩收益中的每个差分压缩收益对应一个抽样数据量,每个差分压缩收益对应的抽样数据量为评估数据缩减率的装置计算该差分压缩收益时所采用的抽样数据的数据量。例如,基于步骤901的描述,评估数据缩减率的装置第1次计算到的差分压缩收益cp1对应的抽样数据量(也即是第一抽样数据的数据量)为1%a,第2次计算到的差分压缩收益cp2对应的抽样数据量(也即是第二抽样数据的数据量)为2%a,第3次计算到的差分压缩收益cp3对应的抽样数据量(也即是第二抽样数据的数据量)为3%a,以此类推。[0223]评估数据缩减率的装置可以根据该j个差分压缩收益,以及该j个差分压缩收益对应的抽样数据量,对该j个差分压缩收益进行曲线拟合,确定出差分压缩收益的收益曲线,该收益曲线用于表征差分压缩收益与抽样数据量的关联关系,示例地,将该收益曲线映射到二维坐标系中,该二维坐标系的横轴可以表示抽样数据量,纵轴可以表示差分压缩收益。评估数据缩减率的装置得到该收益曲线后,将该收益曲线上与a对应的差分压缩收益确定为最终的差分压缩收益,a表示原始数据的数据量,该收益曲线上与a对应的差分压缩收益可以认为是通过曲线拟合的方式确定出的原始数据的差分压缩收益。[0224]步骤911、计算该第j目标样本数据的重删率以及该第j目标样本数据的自压缩率。[0225]该步骤911的实现过程可以参考前述步骤806至步骤808,本技术实施例在此不再赘述。[0226]步骤912、根据该第j目标样本数据的重删率、该第j目标样本数据的自压缩率以及该最终的差分压缩收益,确定原始数据的缩减率。[0227]可选地,评估数据缩减率的装置将该目标样本数据的差分压缩收益、该目标样本数据的重删率以及该最终的差分压缩收益的乘积确定为该原始数据的缩减率。[0228]以上是对本技术评估数据缩减率的方法的介绍,下面结合介绍本技术评估数据缩减率的装置。该评估数据缩减率的装置可以用于执行本技术的方法实施例。对于本技术装置实施例中未披露的细节,请参照本技术方法实施例。[0229]请参考图10,其示出了本技术实施例提供的一种评估数据缩减率的装置1000的逻辑结构示意图。参见图10,该评估数据缩减率的装置1000可以包括但不限于:[0230]获取模块1010,用于获取目标样本数据,该目标样本数据是原始数据的子集;[0231]压缩模块1020,用于对该目标样本数据进行差分压缩,得到差分压缩后的样本数据;[0232]第一确定模块1030,用于根据该目标样本数据的数据量和该差分压缩后的样本数据的数据量,确定该目标样本数据的差分压缩收益;[0233]第二确定模块1040,用于根据该差分压缩收益确定该原始数据的缩减率。[0234]综上所述,本技术实施例提供的评估数据缩减率的装置,由于获取作为原始数据的子集的目标样本数据后,对该目标样本数据进行差分压缩,并确定该目标样本数据的差分压缩收益,根据该目标样本数据的差分压缩收益确定原始数据的缩减率,因此该评估数据缩减率的装置能够适用于基于差分压缩的存储系统,例如基于delta压缩的存储系统。并且,由于目标样本数据是原始数据的子集,相比于原始数据,该目标样本数据的数据量较少,因此仅需少量的内存资源和计算资源就可以评估原始数据的缩减率,有助于降低评估数据缩减率的过程对内存资源以及计算资源的消耗。[0235]可选地,该目标样本数据是经过自压缩处理得到的数据,请参考图11,其示出了本技术实施例提供的另一种评估数据缩减率的装置1000的逻辑结构示意图,参见图11,在图10的基础上,该评估数据缩减率的装置1000还包括:[0236]第三确定模块1050,用于确定该目标样本数据的自压缩率;[0237]第二确定模块1040具体用于:根据该差分压缩收益和该自压缩率确定所述原始数据的缩减率。[0238]可选地,该目标样本数据是经过重复数据删除处理得到的数据,请继续参考图11,该评估数据缩减率的装置1000还包括:[0239]第四确定模块1060,用于确定该目标样本数据的重删率;[0240]第二确定模块1040具体用于:根据该差分压缩收益和该重删率确定该原始数据的缩减率。[0241]可选地,该目标样本数据是经过重复数据删除处理以及自压缩得到的数据,请继续参考图11,该评估数据缩减率的装置1000还包括:[0242]第三确定模块1050,用于确定该目标样本数据的自压缩率;[0243]第二确定模块1040具体用于:根据该差分压缩收益,该重删率以及该自压缩率确定该原始数据的缩减率。[0244]可选地,该目标样本数据包括多个样本数据块,该多个样本数据块的强哈希值各不相等。[0245]可选地,该目标样本数据中的样本数据块的数量大于或等于预设数量。[0246]可选地,该差分压缩为delta压缩。[0247]可选地,在一种可能的实现方式中,原始数据存储在存储系统的存储设备中,该存储系统包括处理器和存储设备,该评估数据缩减率的装置1000是该处理器。[0248]可选地,在另一种可能的实现方式中,原始数据存储在存储系统的存储设备中,该存储系统包括处理器、评估芯片和存储设备,该评估数据缩减率的装置1000是该评估芯片。[0249]可选地,在再一种可能的实现方式中,原始数据存储在存储系统的存储设备中,该评估数据缩减率的装置1000是该存储系统外部的评估设备。[0250]综上所述,本技术实施例提供的评估数据缩减率的装置,由于获取作为原始数据的子集的目标样本数据后,对该目标样本数据进行差分压缩,并确定该目标样本数据的差分压缩收益,根据该目标样本数据的差分压缩收益确定原始数据的缩减率,因此该评估数据缩减率的装置能够适用于基于差分压缩的存储系统,例如基于delta压缩的存储系统。由于在确定原始数据的缩减率时,还考虑到目标样本数据的自压缩率,因此该评估数据缩减率的装置能够适用于基于自压缩的存储系统。也即是,本技术实施例提供的评估数据缩减率的装置,能够同时适用于基于delta压缩和自压缩的存储系统,能够实现与目前的评估数据缩减率的技术方案的兼容。并且,由于目标样本数据是原始数据的子集,相比于原始数据,该目标样本数据的数据量较少,因此仅需少量的内存资源和计算资源就可以评估原始数据的缩减率,有助于降低评估数据缩减率的过程对内存资源以及计算资源的消耗。[0251]如前所述容易理解,本技术实施例提供的评估数据缩减率的装置可以是存储系统内部的处理器或者评估芯片,也可以是存储系统外部的评估设备。[0252]示例地,当该评估数据缩减率的装置是存储系统内部的处理器时,该评估数据缩减率的装置可以是cpu、dsp、asic或fpga等。当该评估数据缩减率的装置是存储系统内部的评估芯片时,该评估数据缩减率的装置可以是dpu、gpu或npu等处理芯片。[0253]示例地,当该评估数据缩减率的装置是存储系统外部的评估设备时,该评估数据缩减率的装置的硬件结构示意图可以如图12所示。参见图12,该评估数据缩减率的装置1200包括处理器1202、存储器1204、通信接口1206和总线1208,处理器1202、存储器1204和通信接口1206通过总线1208彼此通信连接。本领域技术人员应当明白,图12所示的处理器1202、存储器1204和通信接口1206之间的连接方式仅仅是示例性的,在实现过程中,处理器1202、存储器1204和通信接口1206也可以采用除了总线1208之外的其他连接方式彼此通信连接。[0254]其中,存储器1204可以用于存储程序,存储器1204中存储的程序可以包括指令12042和数据12044。在本技术实施例中,存储器1204可以是各种类型的存储介质,例如ram、rom、nvram、prom、eprom、eeprom、闪存、光存储器和寄存器等。并且,该存储器1204可以包括磁盘、硬盘和/或内存。[0255]其中,处理器1202可以是通用处理器,通用处理器可以是通过读取并执行存储器(例如存储器1204)中存储的指令(例如指令12042)来执行特定步骤和/或操作的处理器,通用处理器在执行上述步骤和/或操作的过程中可能用到存储在存储器(例如存储器1204)中的数据(例如数据12044)。通用处理器可以是,例如但不限于cpu。此外,处理器1202也可以是专用处理器,专用处理器可以是专门设计的用于执行特定步骤和/或操作的处理器,该专用处理器可以是,例如但不限于dsp、asic和fpga等。此外,处理器1202还可以是多个处理器的组合,例如多核处理器。处理器1202可以包括一个或多个电路,以执行上述实施例提供的评估数据缩减率的方法的全部或部分步骤。[0256]其中,通信接口1206可以包括网络接口、输入/输出(input/output,i/o)接口、物理接口和逻辑接口等用于实现评估数据缩减率的装置1200内部的器件互连的接口,以及用于实现评估数据缩减率的装置1200与其他设备(例如存储系统中的处理器或评估芯片)互连的接口。物理接口可以是千兆的以太接口(gigabitethernet,ge),其可以用于实现评估数据缩减率的装置1200与其他设备互连,逻辑接口是评估数据缩减率的装置1200内部的接口,其可以用于实现评估数据缩减率的装置1200内部的器件互连。容易理解,通信接口1206可以用于评估数据缩减率的装置1200与其他设备通信,例如,如图3所示,通信接口1206用于评估设备03(也即是评估数据缩减率的装置1200)与存储系统02中的处理器021通信。[0257]其中,总线1208可以是任何类型的,用于实现处理器1202、存储器1204和通信接口1206互连的通信总线,例如系统总线。[0258]上述器件可以分别设置在彼此独立的芯片上,也可以至少部分的或者全部的设置在同一块芯片上。将各个器件独立设置在不同的芯片上,还是整合设置在一个或者多个芯片上,往往取决于产品设计的需要。本技术实施例对上述器件的具体实现形式不做限定。[0259]图12所示的评估数据缩减率的装置1200仅仅是示例性的,在实现过程中,评估数据缩减率的装置1200还可以包括其他组件,本文不再一一列举。该图12所示的评估数据缩减率的装置1200可以通过执行上述实施例提供的评估数据缩减率的方法的全部或部分步骤来评估数据缩减率。[0260]本技术实施例提供的一种评估数据缩减率的系统,该评估数据缩减率的系统可以为存储系统,该存储系统包括处理器和存储设备,该处理器为如图10或图11所示的评估数据缩减率的装置。或者,该存储系统包括处理器、评估芯片和存储设备,该评估芯片为如图10或图11所示的评估数据缩减率的装置。或者,该评估数据缩减率的系统包括存储系统和位于该存储系统外部的评估设备,该评估设备包括如图10至图12任一所示的评估数据缩减率的装置。[0261]本技术实施例提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,当该计算机程序在计算机上运行时,使得该计算机执行上述实施例提供的评估数据缩减率的方法的全部或部分步骤。[0262]本技术实施例提供了一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得该计算机执行上述实施例提供的评估数据缩减率的方法的全部或部分步骤。[0263]本技术实施例提供了一种芯片,该芯片包括可编程逻辑电路和/或程序指令,当该芯片运行时用于实现上述实施例提供的评估数据缩减率的方法的全部或部分步骤。[0264]在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机的可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者包含一个或多个可用介质集成的服务器、数据中心等数据存储装置。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质,或者半导体介质(例如固态硬盘)等。[0265]在本技术中,术语“第一”、“第二”和“第三”等类似用词仅用于描述目的,而不能理解为指示或暗示相对重要性。术语“至少一种”指一种或多种,多种指两种或两种以上,除非另有明确的限定。术语“至少两个”指两个或两个以上,除非另有明确的限定。术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。[0266]本技术实施例提供的方法实施例和装置实施例等不同类型的实施例均可以相互参考,本技术实施例对此不做限定。本技术实施例提供的方法实施例操作的先后顺序能够进行适当调整,操作也能够根据情况进行响应增减,任何熟悉本
技术领域
:的技术人员在本技术揭露的技术范围内,可轻易想到变化的方法,都应涵盖在本技术的保护范围之内,因此不再赘述。[0267]在本技术提供的相应实施例中,应该理解到,所揭露的装置等可以通过其它的构成方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。[0268]作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元描述的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络设备(例如终端设备)上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。[0269]以上所述,仅为本技术的示例性实施例,但本技术的保护范围并不局限于此,任何熟悉本
技术领域
:的技术人员在本技术揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1