一种基于万有引力搜索模型的副本替换方法

文档序号:6508837阅读:373来源:国知局
一种基于万有引力搜索模型的副本替换方法
【专利摘要】本发明公开了一种基于万有引力搜索模型的副本替换方法:步骤1:获得最近T时间段内文件的副本文件被访问记录;步骤2:获得文件所在节点与副本文件所在节点之间最大网络带宽及副本文件访问时间;步骤3:当存储节点的文件被访问后,得到新的副本文件,判断该节点上是否至少有一个副本文件,是则执行步骤4,否则执行步骤5;步骤4:计算该文件的所有副本文件的替换价值,判断新的副本文件的大小是否小于替换价值最小的副本文件与该存储节点的剩余存储空间之和,是则替换价值最小的副本文件;步骤5:判断该存储节点的剩余存储空间是否大于新的副本文件的大小,存储将新的副本文件。该方法能够提高系统副本管理能力,优化网络存储系统整体性能。
【专利说明】一种基于万有引力搜索模型的副本替换方法
【技术领域】
[0001]本发明涉及ー种副本替换方法,具体是ー种基于万有引力搜索模型的副本替换方法。
【背景技术】
[0002]在海量网络存储系统中,由于存储节点多而杂,而且存储网络存在异构性,使得各个存储节点在性能和可靠性上不尽相同,系统需要合理的管理这些节点,协调它们的工作,尽量使用大量价格低廉的存储设备按一定的规则组合成一个可靠性较强、可用性较高的存储系统,因此需要创建文件副本。
[0003]副本管理技术是海量网络存储系统中保证数据可用性和可靠性的重要技术,其用于避免由于个别存储节点的网络故障或机器故障等不可预知的情况而造成文件的不可访问或丢失。因此,从理论上分析文件副本越多,则系统和文件的可用性及可靠性就越高;但是,副本的数量即副本冗余度的増加会消耗更多的系统资源如存储空间,并且随着副本数量的増加,为了更新副本,保持副本的一致性,也将会占用一定的网络资源,势必会加重网络带宽的负担。因此,副本管理过程要权衡上述两方面。副本数量的管理是在适当的时间、合适的节点创建或删除对应的副本,可明显地提高数据文件的访问速度以及降低网络资源的消耗和系统的负载均衡。海量网络存储系统中,副本选择策略可提高系统的响应时间、降低网络的时间延迟和带宽消耗,从而提高数据文件的访问速度。
[0004]副本替换是副本管理技术中的ー种手段,由于文件副本数量的增加,不但占用了存储节点中的大量存储空间,而且加大了系统对副本管理和维护的开销,因此必须要适当地进行副本替换。副本替换的好坏会对存储系统的性能产生直接的影响。副本替换一般有以下两种情况:(I)创建副本之初,如果存储节点上没有足够的空间来存储,新的副本文件,这时需要存储系统调用副本替换策略,删除旧的文件副本;(2)需要定期进行副本替换来实现对系统中文件副本进行更新,旧版本的文件副本需要删除。
[0005]当存储节点中剩余的存储空间不足以存储新副本的时候,如何选择ー个新的副本来替换旧的副本?传统的副本替换方法通常采用操作系统的页面置换算法的操作方式。传统的副本替换方法一般只适应于単一网络存储环境下,其无法适应海量信息网络存储环境(系统),对数据文件的读取速度较慢,且常常陷入局部最优值,无法在海量存储整体环境中找到最优的替换的副本文件。这是由于以下几个原因:1)海量存储环境中的存储节点更多,存储节点覆盖范围更广;2)存储的副本文件不仅仅放在单ー网络系统中,而可能分布在不同的网络系统中,因此具有更高的动态性;3)文件访问时延、网络带宽和硬件的配置等。
[0006]因此,研究一种能够有效降低文件访问时间的副本替换方法,对于提高系统副本管理能力,达到优化系统的整体性能是十分有必要的。
[0007]Esmat Rashedi和H.Nezamabadrpour等人于2009年提出一种源于对物理学中的牛顿万有引力定律进行模拟的优化捜索技术,即引力捜索算法(GSA),它与粒子群算法相似,是ー种元启发式算法,它通过群体中各粒子之间的万有引力相互作用产生的群体智能指导优化捜索,以达到节约网络资源,提高系统服务性能的目的。万有引力是自然界4种基础的カ之一,粒子在万有引力的作用下相互之间不断地靠近,在自然界中,每ー个里粒子都会和其他的所有粒子相互吸引,对于两个相互分离的粒子,它们相互之间的万有引力是没有间隔和延迟的。

【发明内容】

[0008]针对目前海量存储中因用户数量、数据类型以及网络环境复杂而引起对数据文件的读取速度较慢,导致系统整体服务性能降低、浪费部分网络资源的问题,本发明的目的在于,提供一种基于万有引力捜索模型的副本替换算法(GMRA),该方法根据海量网络存储的副本替换的特点及万有引力捜索算法的特性而提出,实现对数据文件读取请求快速响应。本发明在海量网络存储环境下,采用万有引力捜索模型有效地对系统进行负载均衡,降低文件访问时间,降低网络带宽的消耗和数据访问的延迟,使用本发明的方法能够提高副本管理能力,达到优化海量信息网络存储系统的整体性能的目的。
[0009]为了实现上述任务,本发明采用如下的技术方案予以解决:
[0010]一种基于万有引力捜索模型的副本替换方法,具体包括如下步骤:
[0011]步骤1:获得最近T时间段内文件f的所有副本文件も的被访问记录,并将访问记录存储在多维关系索引表中;每条访问记录包括:最近T时间段内副本文件も被访问次数t、副本文件も所在节点位置、副本文件も的大小Si ;
[0012]步骤2:根据多维关系索引表中的索引地址,找到步骤I中文件f的所有副本文件各自所在的节点,井分别获得文件f所在节点与它的每个副本文件所在节点之间的最大网络带宽Bi及每个副本文件的访问时间Tvt ;
[0013]步骤3:当某存储节点上的某文件f被访问后,得到该文件f的新的副本文件,此处的访问是指用户对文件的写操作。
[0014]如果在文件f被访问前,该存储节点上存有文件f的至少ー个副本文件,执行步骤
4;否则执行步骤5 ;
[0015]步骤4:判断步骤3得到的新的副本文件的大小是否大于原有的所有副本文件与该存储节点的剩余存储空间之和,如果是,则将新的副本文件删除;否则,利用式3分别计算该文件f?的所有副本文件的替换价值,并按照替换价值将副本文件升序排列;此时,判断新的副本文件的大小是否小于替换价值最小的副本文件与该存储节点的剩余存储空间之和,是则用新的副本文件替换替换价值最小的副本文件,否则,比较新的副本文件的大小是否小于替换价值最小的两个副本文件与该存储节点的剩余存储空间之和,是则用新的副本文件替换该替换价值最小的两个副本文件,否则增加副本文件的个数继续判断并删除原有的副本文件,直到将新的副本文件存入该存储节点;
[0016]
【权利要求】
1.一种基于万有引力捜索模型的副本替换方法,其特征在于,具体包括如下步骤: 步骤1:获得最近T时间段内文件f的所有副本文件も的被访问记录,并将访问记录存储在多维关系索引表中;每条访问记录包括:最近T时间段内副本文件も被访问次数t、副本文件も所在节点位置、副本文件も的大小Si ; 步骤2:根据多维关系索引表中的索引地址,找到步骤I中文件f的所有副本文件各自所在的节点,井分别获得文件f?所在节点与它的每个副本文件所在节点之间的最大网络带宽Bi及每个副本文件的访问时间Tvt ; 步骤3:当某存储节点上的某文件f被访问后,得到该文件f的新的副本文件,此处的访问是指用户对文件的写操作。 如果在文件f被访问前,该存储节点上存有文件f的至少ー个副本文件,执行步骤4 ;否则执行步骤5 ; 步骤4:判断步骤3得到的新的副本文件的大小是否大于原有的所有副本文件与该存储节点的剩余存储空间之和,如果是,则将新的副本文件删除;否则,利用式3分别计算该文件f?的所有副本文件的替换价值,并按照替换价值将副本文件升序排列;此时,判断新的副本文件的大小是否小于替换价值最小的副本文件与该存储节点的剩余存储空间之和,是则用新的副本文件替换替换价值最小的副本文件,否则,比较新的副本文件的大小是否小于替换价值最小的两个副本文件与该存储节点的剩余存储空间之和,是则用新的副本文件替换该替换价值最小的两个副本文件,否则增加副本文件的个数继续判断并删除原有的副本文件,直到将新的副本文件存入该存储节点
2.如权利要求1所述的基于万有引力捜索模型的副本替换方法,其特征在于,所述步骤4中,所述引力常数Gtl=0.02。
【文档编号】G06F17/30GK103455579SQ201310374827
【公开日】2013年12月18日 申请日期:2013年8月26日 优先权日:2013年8月26日
【发明者】边根庆, 邵必林, 卢才武, 张维琪, 张志霞, 叶娜, 李智杰, 龚培娇, 权西瑞, 赵华龙 申请人:西安建筑科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1