云存储系统中分层存储的数据热度计算方法和装置的制造方法

文档序号:9371853阅读:495来源:国知局
云存储系统中分层存储的数据热度计算方法和装置的制造方法
【技术领域】
[0001]本发明涉及云存储技术领域,尤其涉及一种云存储系统中分层存储的数据热度计算方法和装置。
【背景技术】
[0002]随着云存储技术的快速发展,存储系统的高并行性、高可靠性和高性价比变得越来越重要。分层存储系统是基于不同存储设备的物理特性,将不同性能、不同可靠性和不同价格的存储设备组合在一起构成的存储系统,用多层存储介质来存放访问热度不同的数据,将高性能高成本的存储设备空间分配给高热度的数据,低热度的数据则迀移到低性能低成本的存储设备中,进而释放高性能高成本的存储空间,使得存储系统的成本接近于低成本的存储设备,而存储系统的整体性能倾向于高性能的存储设备。
[0003]目前,现有技术虽然提出了一些分层存储系统,但其数据迀移策略中的热度值统计或是基于最近访问次数,或者仅考虑历史访问频度。例如,SANBoost系统使用SSD设备和磁盘构成两层存储系统,并引入一个迀移阈值以减少数据迀移量,热度值统计是基于最近访问次数,只有用户访问达到一定次数后才进行数据迀移。又如,基于存储空间的高低水位法,热度值统计是基于历史访问频度,根据磁盘的使用情况进行数据迀移。
[0004]虽然上述两种数据迀移策略具有最大利用磁盘空间的优点,但其热度值统计存在不合理之处。例如,对于基于最近访问次数的热度值统计,没有考虑对象访问一次后可能长久不会被访问的情况,对于基于历史访问频度的热度值统计,没有考虑该历史多次访问可能是很久之前访问过多次的情况。因此,现有热度值统计在有些应用场景下是不准确的。

【发明内容】

[0005]为了解决上述技术问题,本发明提供一种云存储系统中分层存储的数据热度计算方法和装置,以克服现有热度值统计在有些应用场景下不准确的技术缺陷。
[0006]为了达到本发明目的,本发明提供了一种云存储系统中分层存储的数据热度计算方法,系统运行中,按照时间顺序依次建立若干个命中集合,并在每个命中集合的生命周期内,在命中集合中记录每个对象操作的对象标识;所述方法包括:
[0007]选定一预迀移对象;
[0008]确定当前时刻所在的命中集合,记为命中集合N ;
[0009]根据命中集合N和预设的命中集合历史数M,确定统计集合,所述统计集合为:命中集合N、命中集合N-1、命中集合N-2、……、命中集合N-M;
[0010]判断所述预迀移对象在所述统计集合的每个命中集合中是否有对象标识,有则设置命中集合的命中值D = I,没有则设置命中集合的命中值D = O ;
[0011]根据各个命中集合的命中值D和预设的各个命中集合的权重值Q,计算所述预迀移对象的数据热度值R,
[0012]R = DnX Qn+Dn ! X Qn !+Dn 2 X Qn 2+......+Dn mX Qn mo
[0013]进一步地,所述命中集合的生命周期是预先设置的时间区间;在命中集合中记录对象操作的对象标识时,每个命中集合中同一个对象的对象标识只记录一次。
[0014]进一步地,所述命中集合历史数M用于表示本次计算数据热度值所考虑的时间跨度和时间程度,所述统计集合表示本次计算数据热度值所基于的命中集合。
[0015]进一步地,所述命中集合的权重值Q用于表示命中集合的热度,不同的命中集合具有不同的权重值。
[0016]进一步地,各个命中集合的权重值采用权重值衰减比例的方式设置,即以当前命中集合为基点,各个命中集合的权重值由近及远按照设定的衰减比例进行衰减。
[0017]为了达到本发明目的,本发明还提供了一种云存储系统中分层存储的数据热度计算装置,包括:
[0018]命中集合模块,用于在系统运行中,按照时间顺序依次建立若干个命中集合,并在每个命中集合的生命周期内,在命中集合中记录对象操作的对象标识;
[0019]统计集合模块,用于确定当前时刻所在的命中集合,记为命中集合N,并根据命中集合N和预设的命中集合历史数M,确定统计集合,所述统计集合为:命中集合N、命中集合N-1、命中集合N-2、……、命中集合N-M;
[0020]判断模块,用于判断所述预迀移对象在所述统计集合的每个命中集合中是否有对象标识,有则设置命中集合的命中值D = I,没有则设置命中集合的命中值D = O ;
[0021]计算模块,用于根据各个命中集合的命中值D和预设的各个命中集合的权重值Q,计算所述预迀移对象的数据热度值R,
[0022]R = DnX Qn+Dn ! X Qn !+Dn 2 X Qn 2+......+Dn mX Qn mo
[0023]进一步地,所述命中集合的生命周期是预先设置的时间区间;在命中集合中记录对象操作的对象标识时,每个命中集合中同一个对象的对象标识只记录一次。
[0024]进一步地,所述命中集合历史数M用于表示本次计算数据热度值所考虑的时间跨度和时间程度,所述统计集合表示本次计算数据热度值所基于的命中集合。
[0025]进一步地,所述命中集合的权重值Q用于表示命中集合的热度,不同的命中集合具有不同的权重值。
[0026]进一步地,各个命中集合的权重值采用权重值衰减比例的方式设置,即以当前命中集合为基点,各个命中集合的权重值由近及远按照设定的衰减比例进行衰减。
[0027]本发明提供了一种云存储系统中分层存储的数据热度计算方法和装置,通过设置命中集合和命中集合的权重值,使获得的数据热度值综合考虑了对象的操作时间和对象的操作频率。先利用建立的若干个命中集合,分别记录不同时间区间内的对象操作,建立起对象操作时间与命中集合、对象操作频率与命中集合的对应关系,然后通过设置反映命中集合热度的命中集合的权重值,因而建立起对象操作时间与热度、对象操作频率与热度的对应关系。进一步地,通过设置命中集合历史数来限定计算数据热度值考虑历史命中集合的数量和远近程度,根据最近的操作时间和操作频率来计算数据热度值,使获得的数据热度值更加准确,克服了现有热度值统计在有些应用场景下不准确的技术缺陷。
[0028]本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
【附图说明】
[0029]附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
[0030]图1为本发明命中集合的示意图;
[0031]图2为本发明云存储系统中分层存储的数据热度计算方法的流程图。
【具体实施方式】
[0032]为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
[0033]在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0034]系统运行中,按照时间顺序依次建立若干个命中集合,并在每个命中集合的生命周期T内,在命中集合中记录对象操作的对象标识,且每个命中集合中同一个对象的对
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1