热点数据确定方法、设备及装置与流程

文档序号:12462623阅读:172来源:国知局
本发明涉及数据存储
技术领域
,特别涉及一种热点数据确定方法,用于执行该热点数据确定方法的管理设备及装置。
背景技术
:在存储系统中,被频繁访问的数据被称为热点数据,而确定存储系统中的热点数据,对于存储系统中的许多功能都有着重要的影响。比如,在支持缓存机制的存储系统中,可以将热点数据存放在读写速度较快的缓存单元中,以达到降低存储系统的访问时延,提高每秒进行读写操作的次数(inputoutputoperationspersecond,IOPS)的效果。在现有技术中,存储系统可以通过一个数据段相邻两次被访问的时间间隔来确定该数据段中的数据是否为热点数据。比如,存储系统预先设置一个固定的时间间隔阈值,当一个数据段最近两次被访问的时间间隔小于该时间间隔阈值时,可以确定该数据段中的数据为热点数据。在存储系统中,不同时间段的读写业务可能不同,对应的读写特征也可能不同,而现有技术中通过固定的时间间隔阈值来确定热点数据的方法,会导致不同时间段内确定的热点数据的数量偏差比较大,从而对依赖热点数据确定的相关功能产生负面影响。比如,以将热点数据存放在缓存单元中为例,当确定出的热点数据的数量较少时,缓存单元的空间利用率较低,而当确定出的热点数据的数量较多时,则可能会导致缓存单元的空间不足。技术实现要素:本申请提供了一种热点数据确定方法,以提升热点数据的判断精度。第一方面,本申请提供了一种热点数据确定方法,包括:获取历史数据访问记录,所述历史数据访问记录用于指示存储设备中的各个数据段各自的相邻两次被访问的时间间隔;根据所述各个数据段各自的相邻两次被访问的时间间隔确定时间间隔阈值;对于所述各个数据段中的每一个数据段,当所述数据段的相邻两次被访问的时间间隔与所述时间间隔阈值满足预设条件时,将所述数据段中的数据确定为热点数据;其中,所述预设条件包括:所述数据段最近一次被访问的时间距离上一次被访问的时间之间的间隔小于所述时间间隔阈值;或者,所述数据段最近N次被访问的时间距离各自对应的上一次被访问的时间之间的间隔的平均值小于所述时间间隔阈值。本申请所示的方案,按照存储设备中的各个数据段各自的相邻两次被访问的时间间隔来确定时间间隔阈值,能够尽可能的缩小不同时间段内确定的热点数据的数量偏差,提高热点数据确定的准确性,避免对依赖热点数据确定的相关功能产生负面影响,从而达到提高存储系统的系统性能的效果。可选的,所述根据所述各个数据段各自的相邻两次被访问的时间间隔确定时间间隔阈值,包括:对所述各个数据段各自的相邻两次被访问的时间间隔进行统计,获得时间间隔统计信息,所述时间间隔统计信息中包含预先设置的若干个时间间隔区间以及所述若干个时间间隔区间各自对应的访问次数,所述访问次数是所述各个数据段被访问的时间距离各自的上一次被访问的时间之间的间隔处于对应的时间间隔区间内的被访问的次数;根据所述时间间隔统计信息确定所述若干个时间间隔区间中的临界区间,所述临界区间以及对应的时间间隔小于所述临界区间的时间间隔的各个时间间隔区间的访问次数之和占总访问次数的比例大于或者等于第一比例阈值,且所述临界区间以及对应的时间间隔大于所述临界区间的时间间隔的各个时间间隔区间的访问次数之和占总访问次数的比例大于或者等于所述第一比例阈值;根据所述临界区间对应的时间间隔确定所述时间间隔阈值。本方案提供一种根据历次访问时距离上一次访问相同数据段的时间间隔的分区情况来确定时间间隔阈值的方法。可选的,所述对所述各个数据段各自的相邻两次被访问的时间间隔进行统计,获得时间间隔统计信息,包括:每接收到一次访问操作时,获取所述访问操作发生时的第一时间点以及所述访问操作对应的数据段上一次被访问时的第二时间点;计算所述第一时间点和所述第二时间点之间的时间间隔;将所述第一时间点和所述第二时间点之间的时间间隔所在的时间间隔区间的访问次数加一。可选的,所述确定所述若干个时间间隔区间中的临界区间,包括:按照所述若干个时间间隔区间对应的时间间隔从小到大的顺序,将所述若干个时间间隔区间各自对应的访问次数依次进行叠加;每次叠加后,检测已叠加的访问次数之和占总访问次数的比例是否大于或者等于所述第一比例阈值;若所述已叠加的访问次数之和大于或者等于所述第一比例阈值,则将最后一次叠加的访问次数对应的时间间隔区间确定为所述临界区间。可选的,所述根据所述临界区间对应的时间间隔确定所述时间间隔阈值,包括:将所述临界区间的中间值确定为所述时间间隔阈值;将所述临界区间的最小值确定为所述时间间隔阈值;或者,将所述临界区间的最大值确定为所述时间间隔阈值。可选的,所述根据所述时间间隔统计信息确定所述若干个时间间隔区间中的临界区间之前,还包括:检测所述若干个时间间隔区间中的目标区间对应的访问次数占总访问次数的比例是否大于第二比例阈值;若所述目标区间对应的访问次数占总访问次数的比例大于所述第二比例阈值,则对所述若干个时间间隔区间中,包含所述目标区间在内的全部或者部分时间间隔区间的范围进行调整,以缩小所述目标区间的区间范围;重新统计范围调整后的各个时间间隔区间各自对应的访问次数。该可选方案提供了一种对时间间隔区间的边界进行动态调整的方法,避免访问次数过多的集中在一个时间间隔区间中,达到保证时间间隔阈值的精确性的效果。可选的,所述对所述若干个时间间隔区间中,包含所述目标区间在内的全部或者部分时间间隔区间的范围进行调整,包括:当所述目标区间是所述若干个时间间隔区间中对应时间间隔最小的区间时,将所述若干个时间间隔区间各自的上下限的数值减半;当所述目标区间是所述若干个时间间隔区间中对应时间间隔最大的区间时,将所述若干个时间间隔区间各自的上下限的数值加倍。可选的,在根据所述时间间隔统计信息确定所述若干个时间间隔区间中的临界区间之前,还包括:获取所述存储设备中的磁盘的剩余容量;根据所述磁盘的剩余容量确定所述第一比例阈值。该可选方案提供了一种根据磁盘的剩余容量动态调整第一比例阈值的方法,从而实现通过磁盘的剩余容量间接调整时间间隔阈值。第二方面,本申请实施例提供了一种管理设备,该管理设备包括:处理器和存储器;存储器用于存储软件程序,该处理器被配置为执行存储器中存储的软件程序;该处理器通过执行上述软件程序来实现上述第一方面或第一方面的任意一种可选方案所提供的热点数据确定方法。第三方面,本申请实施例提供了一种热点数据确定装置,该热点数据确定装置包括至少一个单元,该至少一个单元用于实现上述第一方面或第一方面的任意一种可选方案所提供的热点数据确定方法。第四方面,本申请实施例还提供了一种计算机可读介质,该计算机可读介质存储有用于实现第一方面或第一方面的任意一种可选方案所提供的热点数据确定方法的指令。该计算机可读介质包括但不限于快闪存储器、硬盘(英文:harddiskdrive,缩写:HDD)或固态硬盘(英文:solidstatedrive,缩写:SSD)。第五方面,本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括指令,当该计算机程序产品被计算机执行时,该计算机执行上述第一方面或第一方面的任意一种可选方案所提供的热点数据确定方法。该计算机程序产品可以为一个软件安装包。附图说明为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本发明所涉及的一种存储系统的架构图;图2是本发明一个示例性实施例提供的管理设备的结构示意图;图3本发明一个示例性实施例提供的热点数据确定方法的流程图;图4是图3所示实施例涉及的一种确定时间间隔阈值的方法的流程图;图5是本发明一个示例性实施例提供的热点数据确定装置的框图。具体实施方式为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。应当理解的是,在本文中提及的“若干个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。图1是本发明所涉及的一种存储系统的架构图。该存储系统包括以下设备:至少一个存储设备110、管理设备120以及至少一个主机设备130。其中,存储设备110可以包括磁盘110a和缓存单元110b,其中,磁盘的存储容量大,读写速度较低,而缓存单元的存储容量较小,但是读写速度较高。具体的,在一种可能的实现方式中,磁盘可以是硬盘(harddiskdrive,HDD),缓存单元可以是固态硬盘(solidstatedrives,SSD)或者其它高速存储单元。其中,管理设备120用于对至少一个存储设备110的读写进行管理,具体的,其可以是一台通用计算机或者工作站,或者,也可以是单台服务器、服务器集群或者云计算中心等。主机设备130是对存储设备110中的数据进行访问的设备,其可以是实体主机,或者,也可以是虚拟主机。存储设备110和管理设备120之间通过数据接口相连,比如,可以通过小型计算机系统接口(SmallComputerSystemInterface,SCSI)。管理设备120与主机设备130之间通过有线或者无线网络相连接。在本发明所示的实施例中,管理设备120可以统计获取各个主机设备130对存储设备110中的各个数据段进行访问时的历史访问记录,该历史数据访问记录可以指示各个数据段各自的相邻两次被访问的时间间隔,管理设备在确定存储设备110中的热点数据时,可以根据各个数据段各自的相邻两次被访问的时间间隔确定时间间隔阈值,对于各个数据段中的每一个数据段,当数据段的相邻两次被访问的时间间隔与时间间隔阈值满足预设条件时,可以将该数据段中的数据确定为热点数据。即在本方案中,管理设备120可以根据存储设备110中各个数据段实际被访问的情况动态确定时间间隔阈值,并依据动态确定的时间间隔阈值来确定存储设备110中的热点数据,相比于按照固定的时间间隔阈值来确定热点数据的方法,本方案能够尽可能的缩小不同时间段内确定的热点数据的数量偏差,提高热点数据确定的准确性,避免对依赖热点数据确定的相关功能产生负面影响,从而达到提高存储系统的系统性能的效果。图2是本发明一个示例性实施例提供的管理设备20的结构示意图,该管理设备20可以实现为图1所示的网络环境中的管理设备120。如图2所示,该管理设备20可以包括:处理器21以及通信接口24。处理器21可以包括一个或者一个以上处理单元,该处理单元可以是中央处理单元(英文:centralprocessingunit,CPU)或者网络处理器(英文:networkprocessor,NP)等。通信接口24可以包括数据接口和网络接口。其中,数据接口用于连接存储设备,而网络接口则用于连接主机设备。具体的,该网络接口可以包括有线网络接口,比如以太网接口或者光纤接口,或者,网络接口也可以包括无线网络接口,比如无线局域网接口或者蜂窝移动网络接口。管理设备20通过该网络接口24与各个主机设备进行通信。可选的,该网络设备20还可以包括存储器23,处理器21可以用总线与存储器23和通信接口24相连。存储器23可用于存储软件程序23a,该软件程序23a可以由处理器21执行。此外,该存储器23中还可以存储各类业务数据或者用户数据。可选的,该软件程序23a可以包括记录获取模块、阈值确定模块以及数据确定模块;其中,记录获取模块可以用于执行图3所示实施例中有关获取历史数据访问记录的步骤;阈值确定模块可以用于执行图3所示实施例中有关确定时间间隔阈值的步骤;数据确定模块可以用于执行图3所示实施例中有关确定热点数据的步骤。可选地,该网络设备20还可以包括输出设备25以及输入设备27。输出设备25和输入设备27与处理器21相连。输出设备25可以是用于显示信息的显示器、播放声音的功放设备或者打印机等,输出设备25还可以包括输出控制器,用以提供输出到显示屏、功放设备或者打印机。输入设备27可以是用于用户输入信息的诸如鼠标、键盘、电子触控笔或者触控面板之类的设备,输入设备27还可以包括输出控制器以用于接收和处理来自鼠标、键盘、电子触控笔或者触控面板等设备的输入。请参考图3,其示出了本发明一个示例性实施例提供的热点数据确定方法的流程图。该方法可以用于图1所示的管理设备中。以存储设备110由磁盘和缓存单元组成,并将存储设备110中的热点数据存储至缓存单元为例,如图3所示,该热点数据确定方法可以包括:步骤301,获取历史数据访问记录,该历史数据访问记录用于指示各个数据段各自的相邻两次被访问的时间间隔。在本发明实施例中,存储系统支持缓存机制,即当接收到主机的访问存储设备中的数据段的操作时,首先从存储设备的缓存单元中查询该数据段,若缓存单元中未查询到该数据段,则再从存储设备的磁盘中查询该数据段。主机设备每次访问存储设备中的数据段时,管理设备可以获得一条数据访问记录,该数据访问记录中可以包含访问的数据段的标识以及本次访问操作发生的时间点,通过该数据访问记录中包含的数据段的标识,可以查询出该数据段上一次被访问的时间点,本次访问操作发生的时间点以及上一次被访问的时间点之间的间隔即为该数据段最近的相邻两次被访问的时间间隔。或者,在另一种可能的实现方式中,上述数据访问记录中也可以直接包含对应的数据段最近的相邻两次被访问的时间间隔。在存储系统提供数据访问服务的过程中,管理设备可以将主机设备对存储设备中的各个数据段的每一次访问时对应的数据访问记录保存为历史数据访问记录。可选的,管理设备在保存历史数据访问记录时,可以只保存最近一段时间内的数据访问记录,比如,保存最近一天或最近一小时内的数据访问记录。步骤302,根据该各个数据段各自的相邻两次被访问的时间间隔确定时间间隔阈值。在本发明实施例中,管理设备可以预先设置若干个时间间隔区间,并根据历史数据访问记录所指示的,各个数据段各自的相邻两次被访问的时间间隔,来统计距离上一次访问同一个数据段的时间间隔处于各个时间间隔区间内的访问次数,并根据统计结果来确定时间间隔阈值。具体的,请参考图4,其示出了本发明实施例涉及的一种确定时间间隔阈值的方法的流程图。如图4所示,该方法可以包括如下步骤:步骤41,对该各个数据段各自的相邻两次被访问的时间间隔进行统计,获得时间间隔统计信息。其中,该时间间隔统计信息中包含预先设置的若干个时间间隔区间以及该若干个时间间隔区间各自对应的访问次数,该访问次数是该各个数据段被访问的时间距离各自的上一次被访问的时间之间的间隔处于对应的时间间隔区间内的被访问的次数。具体的,管理设备对各个数据段各自的相邻两次被访问的时间间隔进行统计时,每接收到一次访问操作,即获取该访问操作发生时的第一时间点以及该访问操作对应的数据段上一次被访问时的第二时间点,并计算该第一时间点和该第二时间点之间的时间间隔,并将该第一时间点和该第二时间点之间的时间间隔所在的时间间隔区间的访问次数加一。可选的,管理设备还可以将该数据段上一次被访问时的时间点由该第二时间点更新为该第一时间点。可选的,上述若干个时间间隔区间可以是从0开始划分,且首尾相接的若干个时间间隔区间,比如,以0至无穷大的时域划分为5个时间间隔区间为例,该5个时间间隔区间可以为(0,1]、(1,2]、(2,4]、(4,8]以及(8,+∞)。每接收到一次对存储设备中的数据段的访问操作时,管理设备首先判断是否存在该数据段上一次被访问的数据访问记录,若是,则获取该数据段上一次被访问的数据访问记录中的第二时间点,计算本次操作发生时的第一时间点与该第二时间点之间的时间间隔,并将该时间间隔所在的时间间隔区间对应的访问次数加一,并将该数据段上一次被访问的时间点设置为第一时间点;若不存在该数据段上一次被访问的数据访问记录,则建立该数据段对应的数据访问记录,并将该数据段上一次被访问的时间点设置为第一时间点。具体的,假设存储设备中的各个数据段的地址分别为SEG_0、SEG_1、……、SEG_i、SEG_i+1、……、SEG_N。在2s时间点,接收到访问SEG_i中的数据段的访问请求,管理设备未查询到对SEG_i中的数据段的访问记录,此时,管理设备建立对SEG_i中的数据段的访问记录,并将SEG_i中的数据段上一次被访问的时间点设置为2s,其中,设置后访问记录如表1所示:地址上一次被访问时间SEG_i2s表1在5s时间点,再次接收到访问SEG_i中的数据段的访问请求,管理设备查询到对SEG_i中的数据段的访问记录,获取其上一次被访问时间为2s,并计算出本次访问与上一次访问之间的时间间隔为3s,则管理设备将时间间隔区间(2,4]对应的访问次数加一,此时的时间间隔统计信息可以如表2所示:区间档位时间间隔区间访问次数1(0,1]02(1,2]03(2,4]14(4,8]05(8,+∞)0表2同时,管理设备还对SEG_i中的数据段对应的上一次被访问时间进行更新,更新后的上一次被访问时间如表3所示:地址上一次被访问时间SEG_i5s表3在10s时间点,接收到访问SEG_i+1中的数据段的访问请求,管理设备未查询到对SEG_i+1中的数据段的访问记录,此时,管理设备建立对SEG_i+1中的数据段的访问记录,并将SEG_i+1中的数据段上一次被访问的时间点设置为10s,其中,设置后访问记录如表4所示:地址上一次被访问时间SEG_i5sSEG_i+110s表4在20s时间点,再次接收到访问SEG_i+1中的数据段的访问请求,管理设备查询到对SEG_i+1中的数据段的访问记录,获取其上一次被访问时间为10s,并计算出本次访问与上一次访问之间的时间间隔为10s,则管理设备将时间间隔区间(8,+∞)对应的访问次数加一,此时的时间间隔统计信息可以如表5所示:表5同时,管理设备还对SEG_i+1中的数据段对应的上一次被访问时间进行更新,更新后的上一次被访问时间如表6所示:地址上一次被访问时间SEG_i5sSEG_i+120s表6以此类推,管理设备基于对存储设备中每一个数据段每一次被访问的请求进行访问次数累计,以实时更新时间间隔统计信息,以便后续根据各个时间间隔区间各自对应的访问次数来确定时间阈值。可选的,为了保证时间间隔阈值的精确性,需要避免访问次数过多的集中在一个时间间隔区间中。比如,在本发明所示的方案中,在确定时间间隔阈值之前,管理设备可以检测该若干个时间间隔区间中的目标区间对应的访问次数占总访问次数的比例是否大于第二比例阈值,若该目标区间对应的访问次数占总访问次数的比例大于该第二比例阈值,则对该若干个时间间隔区间中,包含该目标区间在内的全部或者部分时间间隔区间的范围进行调整,以缩小该目标区间的区间范围,并重新统计范围调整后的各个时间间隔区间各自对应的访问次数;其中,上述总访问次数可以是若干个时间间隔区间各自对应的访问次数之和。在一种可能的实现方式中,管理设备可以只根据若干个时间间隔区间中对应时间间隔最小或最大的区间对应的访问次数确定对各个时间间隔区间的范围进行调整。具体的,当该目标区间是该若干个时间间隔区间中对应时间间隔最小的区间时,管理设备可以将该若干个时间间隔区间各自的上下限的数值减半,当该目标区间是该若干个时间间隔区间中对应时间间隔最大的区间时,管理设备将该若干个时间间隔区间各自的上下限的数值加倍。比如,假设第二比例阈值为50%,若干个时间间隔区间各自对应的访问次数如表7所示:区间档位时间间隔区间访问次数1(0,1]502(1,2]5003(2,4]2004(4,8]1005(8,+∞)1000表7如表7所示,各个时间间隔区间各自对应的访问次数之和为1850,其中,若干个时间间隔区间中对应时间间隔最大的区间,即区间(8,+∞),对应的访问次数为1000,其占总访问次数的比例为1000/1850≈54%,大于50%,因此,管理设备将各个时间间隔区间各自的上下限的数值加倍,并重新统计调整后的各个时间间隔区间的访问次数,比如,范围调整后的各个时间间隔区间各自对应的访问次数如表8所示:区间档位时间间隔区间访问次数1(0,2]5502(2,4]2003(4,8]1004(8,16]6005(16,+∞)400表8如表8所示,调整范围后的各个时间间隔区间中,任意一个时间间隔区间对应的访问次数占总访问次数的比例都不大于50%。可选的,若调整范围后的各个时间间隔区间中,对应时间间隔最大的区间(即表8中最后一个时间间隔区间)对应的访问次数占总访问次数的比例依然大于50%,则继续将各个时间间隔区间各自的上下限的数值加倍,直至对应时间间隔最大的区间对应的访问次数占总访问次数的比例不大于50%。类似的,若干个时间间隔区间中时间间隔最小的区间对应的访问次数占总访问次数的比例大于第二比例阈值,则管理设备将各个时间间隔区间各自的上下限的数值减半,并重新统计调整后的各个时间间隔区间的访问次数,直至对应时间间隔最小的区间的访问次数占总访问次数的比例不大于第二比例阈值。可选的,在另一种可能的实现方式中,管理设备也可以只针对目标区间进行范围调整,比如,管理设备可以将目标区间划分成两个或两个以上新的区间,并统计该两个或者两个以上新的区间各自对应的访问次数,若该两个或者两个以上新的区间中的一个新的区间的访问次数占总访问次数的比例依然大于第二比例阈值,则继续将该新的区间的划分为两个或者两个以上新的区间,直至任意一个区间对应的访问次数占总访问次数的比例都不大于第二比例阈值。比如,以表7为例,区间(8,+∞),对应的访问次数为1000,其占总访问次数的比例为1000/1850≈54%,大于50%,则管理设备可以保持其它各个时间间隔区间不变,将区间(8,+∞)划分为(8,16]以及(16,+∞),并统计区间(8,16]以及(16,+∞)这两个区间各自对应的访问次数。步骤42,根据该时间间隔统计信息确定该若干个时间间隔区间中的临界区间。其中,该临界区间以及对应的时间间隔小于该临界区间的时间间隔的各个时间间隔区间的访问次数之和占总访问次数的比例大于或者等于第一比例阈值,且该临界区间以及对应的时间间隔大于该临界区间的时间间隔的各个时间间隔区间的访问次数之和占总访问次数的比例大于或者等于该第一比例阈值。在一种可能的实现方式中,管理设备可以按照该若干个时间间隔区间对应的时间间隔从小到大的顺序,将该若干个时间间隔区间各自对应的访问次数依次进行叠加,每次叠加后,检测已叠加的访问次数之和占总访问次数的比例是否大于或者等于该第一比例阈值,若该已叠加的访问次数之和大于或者等于该第一比例阈值,则将最后一次叠加的访问次数对应的时间间隔区间确定为该临界区间。比如,假设第一比例阈值为50%,以表8为例,管理设备可以从时间间隔区间1开始,从上到下依次将各个时间间隔区间对应的访问次数进行叠加,其中,将时间间隔区间1和时间间隔区间2各自对应的访问次数叠加后获得访问次数为750,占总访问次数的比例小于50%,则继续将时间间隔区间3对应的访问次数进行叠加,获得的叠加后的访问次数为850,占总访问次数的比例依然小于50%,继续将时间间隔区间4对应的访问次数进行叠加,获得的叠加后的访问次数为1450,占总访问次数的比例大于50%,此时,可以将时间间隔区间4确定为临界区间。可选的,在实际应用中,管理设备也可以按照该若干个时间间隔区间对应的时间间隔从大到小的顺序,将该若干个时间间隔区间各自对应的访问次数依次进行叠加,每次叠加后,检测已叠加的访问次数之和占总访问次数的比例是否大于或者等于该第一比例阈值,若该已叠加的访问次数之和大于或者等于该第一比例阈值,则将最后一次叠加的访问次数对应的时间间隔区间确定为该临界区间。比如,假设第一比例阈值为50%,以表8为例,管理设备可以从时间间隔区间5开始,从下到上依次将各个时间间隔区间对应的访问次数进行叠加,其中,将时间间隔区间5和时间间隔区间4各自对应的访问次数叠加后获得访问次数为1000,占总访问次数的比例大于50%,此时,可以将时间间隔区间4确定为临界区间。可选的,在此之前,获取存储设备中的磁盘的剩余容量;根据该磁盘的剩余容量确定该第一比例阈值。其中,上述第一比例阈值可以由存储系统的管理人员自行设置,或者,由开发人员预先设置,或者,也可以根据实际的存储情况动态调整。其中,在动态调整第一比例阈值时,管理设备可以获取存储设备中的磁盘的剩余容量,并根据该磁盘的剩余容量来确定该第一比例阈值。步骤43,根据该临界区间对应的时间间隔确定该时间间隔阈值。将该临界区间的中间值确定为该时间间隔阈值;或者,将该临界区间的最小值确定为该时间间隔阈值;或者,将该临界区间的最大值确定为该时间间隔阈值。比如,以表8为例,假设临界区间为表8中的区间(8,16]为临界区间,则管理设备可以设置该区间的中间值,即12(单位为s)为时间间隔阈值,或者,也可以设置8或16为时间间隔阈值。步骤303,对于该各个数据段中的每一个数据段,当该数据段的相邻两次被访问的时间间隔与该时间间隔阈值满足预设条件时,将该数据段中的数据确定为热点数据。其中,该预设条件包括:该数据段最近一次被访问的时间距离上一次被访问的时间之间的间隔小于该时间间隔阈值;或者,该数据段最近N次被访问的时间距离各自对应的上一次被访问的时间之间的间隔的平均值小于该时间间隔阈值。步骤304,将该数据段中的数据存放至缓存单元。在本发明实施例中,管理设备可以将存储设备中的热点数据存放至该存储设备的缓存单元,并将缓存单元中的非热点数据存放至该存储设备的磁盘中。综上所述,本发明实施例所示的方法,按照存储设备中的各个数据段各自的相邻两次被访问的时间间隔来确定时间间隔阈值,能够尽可能的缩小不同时间段内确定的热点数据的数量偏差,提高热点数据确定的准确性,避免对依赖热点数据确定的相关功能产生负面影响,从而达到提高存储系统的系统性能的效果。另外,本发明实施例所示的方法,还对时间间隔区间的边界进行动态调整,避免访问次数过多的集中在一个时间间隔区间中,达到保证时间间隔阈值的精确性的效果。请参考图5,其示出了本发明一个实施例提供的热点数据确定装置的框图。该装置可以通过硬件或者软硬结合的方式实现为图1所示网络环境的管理设备120的部分或者全部,用以执行如图3中由管理络设备所执行的全部或者部分步骤。该装置可以包括:记录获取单元501、阈值确定单元502以及数据确定单元503;在本实施例中,该装置是以功能单元的形式来呈现。这里的“单元”可以指现场可编程门阵列(Field-ProgrammableGateArray,FPGA)电路,复杂可编程逻辑器件(ComplexProgrammableLogicDevice,CPLD)电路,特定应用集成电路(application-specificintegratedcircuit,ASIC),电路,执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。其中,记录获取单元501可以用于执行如图3所示的实施例中的步骤301;阈值确定单元502可以用于执行如图3所示的实施例中的步骤302(包括步骤41、步骤42、步骤43以及其它相关步骤);数据确定单元503可以用于执行如图3所示的实施例中的步骤303。本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1