一种ndn缓存中基于请求频率的实时数据替换方法

文档序号:10578184阅读:361来源:国知局
一种ndn缓存中基于请求频率的实时数据替换方法
【专利摘要】本发明公开了一种NDN缓存中基于请求频率的实时数据替换方法,当节点收到数据时,它首先会判断该数据在缓存中是否存在,如果数据已经存在,那么重新计算该数据的WFRRP权重值,并按照权重值更新缓存列表,不作其它处理;如果数据在缓存中不存在,那么会先判断缓存中剩余空间是否足够缓存该数据,如果空间足够,那么计算出该数据权重值,并直接缓存该数据;如果缓存空间不够,那么在计算得到该数据权重值后,判断其值是否大于缓存中其它数据的权重值,如果大于缓存中数据的权重值,那么替换出缓存中权重值最小的数据;如果新到的数据小于缓存中所有数据的权重值,那么对该数据不作缓存处理。本发明提出的WFRRP策略能够很好的提高整个网络的性能。
【专利说明】
-种NDN缓存中基于请求频率的实时数据替换方法
技术领域
[0001 ]本发明设及一种NDN缓存中基于请求频率的实时数据替换方法。
【背景技术】
[0002] 自互联网(Internet)从1968年诞生W来,经过40多年的发展,传统的基于TCP/IP 的互联网架构在给世界带来巨大变化的同时,也暴露出越来越多的缺陷(如:安全性、可扩 展性、移动性等)。为了更好地发展互联网,各国研究人员提出了越来越多的网络体系架构。 诸多新近提出的网络架构被分为"演进式"与"革命式","演进式"主张在现有网络主体结构 不变的情况下,W "打补下"的方式对网络进行完善,P2P (Peer to Peer)与CDN( Content Delivery化twork)就是此类架构的主要代表;"革命式"主张 W全新的方式从新设计一种 新型的网络架构。信息中屯、网络(Information Centric化tworking,ICN)就是"革命式"主 要代表。作为ICN的主要代表之一的NDN(Named化化Networking)得到了相关领域研究者 们的追捧,NDN中每个节点都具有内容存储库(Content Store,CS),用于缓存经过节点的数 据。但是,与巨大的数据量相比,NDN节点的缓存空间十分有限。因此,数据替换策略的好坏 便成为了影响NDN整体性能的关键。
[0003] NDN中常用的数据替换策略有最近最少使用策略化east Recently Used,LRU)与 最不经常使用策略(Xeast Rrequently Used,LFU)。
[0004] LRU数据替换策略每次将最近到达的数据存储在缓存的最底部,当需要替换数据 时就首先替换顶部数据,LRU方案能够很好的反应数据的实时性。
[0005] LFU数据替换策略,某数据被请求一次就将其对应的请求频率加一,当需要替换缓 存中的数据时,首先替换请求频率最小的数据,LFU策略能够很好的反应数据的流行度。
[0006] Wang和畑en等人都提出了自己优化的缓存策略,通过对数据的请求代价进行统 计,从而得出相应的数据替换策略。
[0007] 运些命名数据网络NDN中网络缓存方案在特定的条件下,都获得了较好的缓存性 能。
[000引虽然LRU能够很好的反应数据的实时性,但LRU策略不能够很好反应数据的流行 度。LFU策略虽然能够很好的反应数据的流行度,但存在数据请求频率过时累加的缺陷,不 能够很好地利用已有的数据请求信息对数据进行实时的管理。Wang和化en等人提出了相应 的其他数据替换策略,但是运些数据替换策略都只是单一的考虑数据的请求代价,而没有 结合数据的请求流行度,并且都不具有实时性,不能够很好的反应数据在网络中当前的状 况。
[0009] 由于传统的LFU数据替换策略是的静态特性,不能够实时的反应数据的情况,然 而,请求频率又是衡量一个数据是否流行的重要因子。
[0010] 在LFU中数据的权重值依靠数据的请求频率的累加得到,运种方式简单易行,但是 由于简单的频率累加导致的LFU策略不能够实时的反应出数据当前的流行情况,如:在很短 一段时间内某数据得到了大量的请求后,但在其后的很长一段时间内该数据都没被再次请 求,然而,由于先前的大量请求该数据拥有较大的权重值,因此,该数据一直占据宝贵的缓 存空间,而当前流行的数据却不能够被缓存。所W,一种能够实时反应数据当前流行度的简 单数据替换策略十分有必要。
[0011]众所周知,数据接下来的流行度是不可知的,只能够通过数据W往的请求情况对 其进行预测,同样,越靠近当前的请求信息对预测数据接下来的流行情况往往越重要。因 此,WFRRP策略W数据到达节点的时刻为当前时刻,分别取与当前时刻最接近的S个时间段 作为数据请求频率统计时间段,由于不同时间段所得到的频率统计信息对数据接下来的流 行度预测起到的意义不同,因此,分别按照统计时间段距离当前时刻的远近分配不同的权 重比,越靠近当前时刻的统计频率所占权重值越大,反之越小。同时,由于数据在不同的时 刻的请求频率往往存在很大差异,然而,某些数据可能在整个请求过程中都较为平稳,如果 运类数据又拥有较大的请求频率,那么,对该类数据进行缓存将大大提高整个NDN网络的性 能。
[0012] 本发明中;
[0013] WFRRP是Weighted Frequen巧 based Real-time Data R邱Iacement 化Iixy的简 称。
[0014] NDN是Named Date 化twork的简称。
[0015] LRU是Least Recently Used的简称。
[0016] LFU是Least Frequently Used的简称。

【发明内容】

[0017] 本发明所要解决的技术问题是,针对现有技术不足,提供一种NDN缓存中基于请求 频率的实时数据替换方法。
[0018] 为解决上述技术问题,本发明所采用的技术方案是:一种NDN缓存中基于请求频率 的实时数据替换方法,该方法主要实现过程为:当节点收到数据时,节点首先判断该数据在 缓存中是否存在,如果数据已经存在,那么重新计算该数据的WFRRP权重值,并按照WFRRP权 重值更新缓存列表;如果数据在缓存中不存在,那么节点先判断缓存中剩余空间是否足够 缓存该数据,如果空间足够,那么计算出该数据WFRRP权重值,并直接缓存该数据;如果缓存 空间不够,那么在计算得到该数据WFRRP权重值后,判断该WFRRP权重值是否大于缓存中其 它数据的WFRRP权重值,如果大于缓存中其它数据的WFRRP权重值,那么替换出缓存中WFRRP 权重值最小的数据;如果新到的数据的WFRRP权重值小于缓存中所有数据的WFRRP权重值, 那么对该数据不作缓存处理。
[0019] WFRRP权重值的具体计算过程包括:
[0020] 1)当数据包到达节点时,设数据包到达的时刻为t时刻,分别取t~t-At,t-At ~t-2At,t-2At~t-3AtS个时间段,设运S个时间段为丫 1、丫 2、丫 3,然后,分别统 计在运=个时间段里数据包的请求频率为n、f2、巧,时间段丫 1离数据包当前到达时刻最 近,因此,fl对数据包当前的流行度状况判断影响最大,其次为时间段丫 2内数据包的请求 频率f2对数据包当前的流行度状况判断影响较大,时间段T 3的统计请求频率巧对该数据 包当前状况的预测影响度相对于前两个时间段而言最小;At可W取2s;
[0021] 2)根据不同时间段统计数据对当前数据包的请求状况影响不同,分别为n、f2、巧 取不同的权重值,其中f I CA扔舌估I f 9 frft扔舌估为a2,f 3的权重值为a3,得当前数据包 在当前时刻的权重值为W ,得到=个时间段内当前数据包请求
频率的平均值E为:
[0022] 3)根据WW及E得到当前数据包在丫 1、丫 2、丫 3S个时间段内,请求频率的均方差
[0023] 4)将当前数据包在丫 1、丫 2、丫 3S个时间段之外的历史请求情况作为数据权重值 的影响因子之一,通过一个衰减因子降低权重值的权重影响度,所述衰减因子的值为化,L 表示除丫 1、丫 2、丫 3=个时间段W外数据包的请求频率,〇<0<1;
[0024] 5)根据当前数据包当前所在节点到该数据包原始服务器节点的距离化Pdata,当前 网络中客户端到达服务器最大的距离Max_hop得
[0025] 6)根得到数据最终的权重值的表达式 H征; 根据权重值Wn的表达式对数据包进行数据替换操作。
[0026] 与现有技术相比,本发明所具有的有益效果为:本发明根据不同时段数据请求频 率对数据接下来的流行度带来的影响不同,分别赋予不同时间段内请求频率不同的权重 值,从而得到更为实时的数据流行度度量。同时,本发明还结合了请求平稳性因子与数据请 求代价因子,从而能够使请求较为平稳并且距离原始服务器较远的数据能够得到更好的存 储。通过实验证明,本发明提出的WFRRP策略能够很好的提高整个网络的性能。
【附图说明】
[0027] 图1为本发明节点缓存容量对平均命中率的影响;
[002引图2为本发明节点缓存容量对平均时延的影响;
[0029] 图3为本发明节点缓存容量对平均跳数的影响;
[0030] 图4为本发明Zipf参数a对平均命中率的影响;
[0031 ]图5为本发明Zipf参数a对平均时延的影响;
[0032] 图6为本发明Zipf参数a对平均跳数的影响。
【具体实施方式】
[0033] 为了更好的对WFRRP策略进行描述,现将相应的实施方式给出如下:
[0034] 定义1.均方差:均方差为方差的算术平方根,反映组内个体间的离散程度。一个较 大的均方差,代表大部分数值和其平均值之间差异较大;一个较小的均方差,代表运些数值 较接近平均值。假设有一组数值Xl,x2,x3,. . .,xN,其平均值为ii,那么,该组值得均方差表 达式如式(1)所示:
[0035]
(I)
[0036] 当某数据到达某一NDN节点时,需要得到该数据此时的权重值大小,然后,根据得 到的权重值大小将数据缓存在CS队列中相应的位置。首先,当数据包到达时,设数据包到达 的时刻为t时刻,分别取t~~t-2At,t-2At~t-3AtS个时间段,设运 =个时间段为丫 1、丫 2、丫 3。然后,分别统计在运=个时间段里该数据的请求频率(请求次 数)为n、f2、巧,分析可知,时间段丫 1离数据当前到达时刻最近,因此,fl对数据当前的流 行度状况判断影响最大,其次为时间段丫 2内数据的请求情况f2,时间段Y 3的统计f3对该 数据包当前状况的预测影响度相对于前两个时间段而言则最小。根据不同时间段统计数据 对当前数据包的请求状况影响不同,分别为n、f2、巧取不同的权重值,其中n的权重值为a l,f2的权重值为a2,f3的权重值为a3。根据W上分析能够得当前数据包在当前时刻的权重 值如式祈志?
[0037]
(2)
[0038] 为了得到当前数据在运=个时间段内的平稳度,首先得到=个时间段内该数据请 求频率的平均值如式(3)所示:
[0039]
(3)
[0040] 由式(2)与式(3)可W得到当前数据包在丫 1、丫 2、丫 3S个时间段内,请求频率的 均方差如式(4)所示:
[0041 ]
(4):
[0042] 为了使请求较为平稳且请求频率较大的数据得到更好的存储,WFRRP策略通过不 同时间段同一数据的请求频率均方差值得到该数据的请求平稳情况(在丫 1、丫 2、丫 3 =个 时间段内),同时,虽然本发明主要考虑与当前最接近的=个时间段内数据的请求情况,但 是,数据在运=个时间段W外的数据请求频率往往也能在一定程度上反应数据的情况,所 W,为了使数据权重值更为合理,WFRRP策略将数据的历史请求情况也作为数据权重值的影 响因子之一,但由于运一部分值不够"新",本发明将通过一个衰减因子降低其权重影响度。 因此,得到新的数据权重度量如式(5)所示:
口)
[0043]
[0044] 其中,C小于0,L表示除丫 1、丫 2、丫 3S个时间段W外数据的请求频率,〇<0<1(文中 嫩0.1)。
[0045] 通过式(5)可W看出当数据拥有较大的数据请求频率,并且当数据在丫 1、丫 2、丫 3 =个不同时间段内的请求频率较为稳定时,该数据拥有较大的数据权重值,运也与本发明 的初衷相符。同时,由于NDN节点具有对数据缓存的功能,因此,往往希望节点能够对某些远 离原始服务器的数据进行缓存,因为该类数据请求如果在NDN网内节点(路由器节点)不能 被满足,那么,其数据包将经过较长时间的传递才能够返回到相应的客户端节点,从而在浪 费网络的同时还大大降低了用户请求数据的满意度。因此,本发明将常量C的取值如式(6) 所示:
[0046]
(6)
[0047] 其中,Hopdata为当前数据当前所在节点到该数据原始服务器节点的距离,Max_ hop表示当前网络中客户端到达服务器最大的距离。因此,C满足式(5)的要求,同时也很好 的将远离原始服务器的数据进行了存储。
[004引 由式化)与式(6)可得数据最终的权電表试式化式(7)所示:
[0049]
(7)
[0050] 由式(7)可知,本发明提出的WFRRP策略能够对流行度较高,并且请求相对平稳的 数据进行缓存,同时为了减少数据的请求代价,WFRRP策略对原始服务器节点较远的数据提 供了相对较强的缓存能力。
[0051] W下用实验数据来证明本技术的优点。实验平台为基于NS-3的ndnSIM仿真平台进 行仿真。为了体现数本发明所提出的WFRRP策略的可扩展性,本发明使用BR 口 E拓扑生成器 产生的随机拓扑(random topo 1 Ogy, RT)进行仿真,拓扑具体信息如表1所示。在试验中设每 个数据大小相同(1024邸),内容请求服从Zipf分布。节点请求到达服从泊松分布,同时,NDN 中的每个节点的缓存空间大小一致。
[i _
[0化3]表1拓扑仿真信息
[0054]本发明是对NDN中的数据替换策略进行研究,由于本发明所提出策略主要是基于 数据请求频率的,因此,为了更好地反应WFRRP策略的优越性,本发明让WFRRP策略与LRJ进 行了对比,LFU策略不仅仅是传统的替换策略之一,在NDN中LFU的性能也得到了充分的肯 定。同时,为了更充分的说明WFRRP的优越性,本发明还使WFRRP策略与NDN中默认的LRU策略 与FIFO策略进行了比较分析。
[0化日]实验结果:
[0056] 1:缓存大小对策略的影响
[0057] 在NDN中节点缓存空间的大小对整个网络的性能是至关重要的,缓存越大能够存 储的数据量就越多,使网络中数据的多样性增加,从而将使整个网络的请求命中率增加并 减少数据的请求跳数与时延。本发明,分别取节点缓存容量为10~100之间的10个位置作为 实验点,其中数据请求服从泊松分布(0 = 0.8),通过增加节点缓存数据的容量来观察对 WFRRP策略的影响。
[005引由图1可得,随着节点缓存容量的增加,四个策略的平均命中率都得到了较大的增 长。由图可得本发明提出的WFRRP策略较其他S种策略而言能够有更大的平均命中率,与 Fifo或Lru相比本发明提出的WFRRP策略平均命中率得到了10%左右的提升。与Lfu相比也 得到了 1%左右的提升。
[0059] 由图2可得,随着节点缓存容量的增加,四种策略请求数据的时延都明显呈下降趋 势,本发明提出的WFRRP策略请求数据的平均时延明显小于其他S种策略。在节点缓存容量 为50时,WFRRP策略与Fifo相比平均请求时延少0.0 lS左右。
[0060] 由图3可得,随着节点缓存容量的增加,请求数据的平均跳数与请求时延及其相 似,都呈下降趋势。当节点的缓存容量达到100时WFRRP策略的数据平均请求跳数只有2.2跳 左右。与其他S种策略相比有较为明显的提高。
[0061 ] 2: Zipf参数a对策略的影响
[0062] 在NDN中数据服从齐普夫分布是一件公认的事实,为了充分考察本发明提出的 WFRRP策略的性能,分别选择a范围从0.2~0.8的8个点作为采样点,其中,节点的缓存容量 为固定值100。
[0063] 由图4可得,由于Zipf参数越大,数据请求越集中,所W请求命中率随着Zipf参数 的增加明显提高。从图中可W看出,本发明提出的WFRRP策略性能上优于其他S种数据替换 策略。与Fifo相比平均命中率提高了进10个百分点。
[0064] 由图5可得,随着Zipf参数的增加,四种策略的数据请求时延都明显下降,当Zipf 参数为0.卵寸本发明提出的WFRRP策略时延只有0.018S左右,与其他几种策略相比都有一定 的减小,从而提高用户的数据请求体验。
[0065] 图6为Zi时参数与数据请求平均跳数的关系,从图中可W看出,随着Zi时参数的不 断增加,平均跳数明显减少。而且本发明提出的策略与其他=种策略相比也有较为明显的 优势。
[0066] 本发明根据不同时段数据请求频率对数据接下来的流行度带来的影响不同,分别 赋予不同时间段内请求频率不同的权重值,从而得到更为实时的数据流行度度量。同时,本 发明还结合了请求平稳性因子与数据请求代价因子,从而能够使请求较为平稳并且距离原 始服务器较远的数据能够得到更好的存储。通过实验证明,本发明提出的WFRRP策略能够很 好的提高整个网络的性能。
【主权项】
1. 一种NDN缓存中基于请求频率的实时数据替换方法,其特征在于,该方法主要实现过 程为:当节点收到数据时,节点首先判断该数据在缓存中是否存在,如果数据已经存在,那 么重新计算该数据的WFRRP权重值,并按照WFRRP权重值更新缓存列表;如果数据在缓存中 不存在,那么节点先判断缓存中剩余空间是否足够缓存该数据,如果空间足够,那么计算出 该数据WFRRP权重值,并直接缓存该数据;如果缓存空间不够,那么在计算得到该数据WFRRP 权重值后,判断该WFRRP权重值是否大于缓存中其它数据的WFRRP权重值,如果大于缓存中 其它数据的WFRRP权重值,那么替换出缓存中WFRRP权重值最小的数据;如果新到的数据的 WFRRP权重值小于缓存中所有数据的WFRRP权重值,那么对该数据不作缓存处理。2. 根据权利要求1所述的NDN缓存中基于请求频率的实时数据替换方法,其特征在于, WFRRP权重值的具体计算过程包括: 1) 当数据包到达节点时,设数据包到达的时刻为t时刻,分别取t~~ t-2At,t-2At~t-3AtS个时间段,设运Ξ个时间段为丫 1、丫 2、丫 3,然后,分别统计 在运Ξ个时间段里数据包的请求频率为n、f2、巧,时间段丫 1离数据包当前到达时刻最近, 因此,Π 对数据包当前的流行度状况判断影响最大,其次为时间段丫 2内数据包的请求频率 f2对数据包当前的流行度状况判断影响较大,时间段丫 3的统计请求频率巧对该数据包当 前状况的预测影响度相对于前两个时间段而言最小; 2) 根据不同时间段统计数据对当前数据包的请求状况影响不同,分别为n、f2、巧取不 同的权重值,其中η的权重值为al,f2的权重值为a2,f3的权重值为α3,得当前数据包在当 前时刻的权重值为W:得到Ξ个时间段内当前数据包请求频率 的平均值Ε为:3) 根据WW及Ε得到当前数据包在丫 1、丫 2、丫 3Ξ个时间段内,请求频率的均方差Sdata:4) 将当前数据包在丫 1、丫 2、丫 3Ξ个时间段之外的历史请求情况作为数据包权重值的 影响因子之一,通过一个衰减因子降低权重值的权重影响度,所述衰减因子的值为化,L表 示除丫 1、丫 2、丫 3Ξ个时间段W外数据包的请求频率,0<β<1; 5) 根据当前数据包当前所在节点到该数据包原始服务器节点的距离化Pdata,当前网络 中客户端到达服务器最大的距离Max_hop得到常量C的值6) 根得到数据最终的权重值Wn的表达式: L」 根据权重值Wn的表达式对数据包进行数据替换操作。
【文档编号】G06F12/12GK105939385SQ201610456634
【公开日】2016年9月14日
【申请日】2016年6月22日
【发明人】胡玉鹏, 廖优, 皮玲, 高子文, 王利超
【申请人】湖南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1