流媒体代理缓存替换方法及装置的制造方法

文档序号:8500060阅读:625来源:国知局
流媒体代理缓存替换方法及装置的制造方法
【技术领域】
[0001] 本发明设及通信技术,具体的讲是一种流媒体代理缓存替换方法及装置。
【背景技术】
[0002] 随着Internet技术的发展和普遍应用,多种形式的多媒体服务正蓬勃的发展起 来。越来越多的视频、声音、图像、动画等多媒体信息已经成为人们生活的一部分。但是由 于流媒体具有实时性、高带宽、数据量大等特点,现有的网络设备常常不能满足流媒体的需 求,使得服务器负载过大成为流媒体得W广泛应用的最主要受限因素,网络拥塞现象也愈 演愈烈,网络资源和流媒体广泛应用之间的矛盾日益严重。
[0003] 为了解决上述问题,提高广域网内流媒体数据的传输性能,在流媒体内容分发系 统中引入了代理缓存服务器。将代理服务器设置在靠近用户的网络边缘,并将最有用的流 媒体数据缓存到代理服务器上,当用户请求的流媒体数据不在缓存中时,则由远端的原始 流媒体服务器直接提供。但由于代理服务器上缓存的容量有限,缓存中的数据是用户最可 能被读取的一部分,随着用户需求的动态变化,缓存中的数据也必须相应变化W使缓存达 到最高效率。因此,缓存替换算法要解决的主要问题是应缓存哪些流媒体对象W及当缓存 已满时新进入的对象应替换哪些对象,要保证代理服务器能充分发挥其作用,必须要缓存 那些最有用的流媒体对象,使得缓存中的所有流媒体对象的利用价值之和最大,因此,缓存 替换方法的好坏直接决定代理服务器的性能。
[0004] 流行度(popularity)是影响流媒体代理缓存性能的最主要因素,它反映了流媒 体文件在某一时段被用户请求的概率。由于流行度具有时间变化的特性,因此一个流媒体 文件在未来的流行度是难W精确预知的,只能根据其过去的情况进行估计。现有技术的研 究缓存替换算法中,基于流行度预测的方法大部分只根据历史点击率进行计算,如果一段 时间后该流媒体文件不再流行了,但其历史点击率依然很高,因此在代理缓存中缓存较长 时间才会被置换,造成系统资源利用率极低。流行度预测是一个十分具有挑战性的研究课 题,如何获取流媒体流行度的最主要影响因素并基于此预测未来的流行度是需要考虑的问 题之一。
[0005] 另一方面,用户更关屯、的是流媒体质量好坏W及启动延迟的长短对其观看流媒体 的影响。目前缓存替换算法都是W提高代理服务器的命中率为目标,现有技术中,该些优化 目标只是间接地衡量了代理服务器性能,没有直接反映代理服务器的设计要求。现有技术 的缓存替换算法难W满足流媒体服务器的要求。因此如何在考虑命中率的同时将流媒体质 量、启动延迟等因素考虑在内,则不仅能满足设计人员对于代理服务器性能的要求,也能满 足用户对流媒体质量的要求。
[0006] 现有技术的代理缓存替换算法通常都是根据某个标准去替换缓存副本的,主要包 括:基于访问时间间隔的替换算法,基于访问次数的替换算法,基于文件大小的替换算法W 及基于预测的替换算法。
[0007] 基于访问时间间隔的代理缓存替换算法的代表是最近最少使用算法LRU(Least RecentlyUsed,最近最少使用算法)。LRU算法把代理缓存中最近最少被访问的文件 替换出缓存,该种算法利用了用户访问请求的时间局部性原理,即如果最近访问了某 个文件,该文件在不久的将来可能被再次访问。根据LRU算法派生出了很多改进的 替换算法,如LRU-MIN(LeastRecently化ed-Min,最近最少-最小文件个数使用算 法)、LRU-T虹eshold(LeastRecentlyUsed-I'虹eshold,最近最少-阔值使用算法)和 LRU-K(LeastRecently化ed-K,最近最少-倒数第K次访问使用算法)算法。其中LRU-MIN 算法力图使被替换的文件个数最小,LRU-T虹eshold算法设置一个阔值,不对长度大于该 个阔值的文件进行缓存替换,LRU-K算法淘汰距离倒数第K次被访问时间最远的流媒体文 件。基于访问时间间隔的替换算法只考虑了时间局部性,忽略了文件的大小和获取文件的 延迟,如果某个被移入缓存的文件很大,就有可能需要将多个小的文件替换出缓存,该样会 严重影响命中率性能。
[000引基于访问次数的替换算法的典型代表是最少频率使用算法L即(Least化equency Used,最少频率使用算法)。L即算法实现对每个文件设置一个计数器,记录该文件被访 问的次数,选择代理缓存空间中被访问次数最少的文件替换。LFU-aging算法(Least 化equen巧Used-aging,最少频率-文件衰老策略使用算法)是在LFU算法的基础上加入 了衰老策略而形成的一种改进算法,它同时考虑了流媒体对象的访问次数和流媒体文件驻 留在缓存中的时间长短。基于访问次数的替换算法实现较简单,只需要对每个文件设置一 个计数器,算法的缺点是没有考虑文件的长度、获取文件的访问延迟和访问时间长短的影 响。某些文件由于曾经被访问的次数和其他文件相比较大,即使该些文件不再被访问,替换 操作发生时将不再将它换出,从而一直占用缓存空间,造成"缓存污染",导致缓存效率极其 低下。
[0009] 基于文件大小的替换算法的典型代表是SIZE算法(基于文件大小的替换算法)。 SIZE算法实现当缓存剩余空间不够时,缓存中最大的文件被替换出缓存,W便容纳更多的 小文件。替换的原则可基于文件大小的精确SIZE值也可基于Log(SIZ巧值。如果具有相 同的文件大小精确值或者Log(SIZ巧值,将最近最少使用的流媒体文件进行替换。基于 Log(SIZ巧算法对文件大小求对数值,减小了文件长度的区别,增加了长度小的文件被替换 出的机会。基于文件大小的替换算法服从Zipf-Uke(幕律分布模型)分布,但在缓存空 间中可能存在无数的小文档稳定的不会再被访问,造成缓存空间的浪费和影响命中率的提 局。
[0010] 基于预测的替换算法通常根据历史访问记录进行分析,预测未来的访问趋势,并 根据预测值对文件进行比较,将未来预测值大的流媒体对象保留在缓存中,而将未来一段 时间不会被访问的对象淘汰出缓存,从而提高代理缓存的命中率,使系统达到更好的性能。 常见的该类算法都是基于流行度进行预测的,有回归预测算法、马尔科夫模型预测算法和 基于路径的预测算法等。基于预测的替换算法考虑了文件长度、访问频率和其它因素,并将 该些因素作为流媒体文件替换的依据,因此替换的效果较好,复杂度较低,可W明显提高代 理缓存的命中率。但由于影响预测模型的因素很多,目前该类算法并没有给出一个成熟的 方案获取最主要的影响因素。同时该类算法都是W提高命中率为目标,缺乏考虑流媒体质 量和启动延迟的影响,不能满足用户对流媒体质量的要求。

【发明内容】

[0011] 本发明利用流媒体代理缓存服务器的属性数据、流媒体文件自身的属性数据及社 交行为数据,结合流媒体质量因子和启动延迟因子,提供了一种流媒体代理缓存替换方法, 方法包括:
[0012] 利用主成分分析法从影响流媒体文件流行度的属性数据中选取主成分属性数 据;
[0013] 根据所述主成分属性数据和多元线性回归方法确定流媒体对象的流行度预测值, 所述的流媒体对象包括代理服务器中已缓存的流媒体和待替换进所述代理服务器的流媒 体;
[0014] 根据流媒体对象的视频峰值信噪比,流媒体对象从原始服务器到代理服务器的延 迟时间W及所述流行度预测值确定流媒体对象的综合价值;
[0015] 根据所述流媒体对象的综合价值和代理服务器的缓存空间进行缓存替换。
[0016] 同时,本发明还提供一种流媒体代理缓存替换装置,装置包括:
[0017] 主成分属性数据选取模块,用于利用主成分分析法从影响流媒体文件流行度的属 性数据中选取主成分属性数据;
[0018] 流行度预测值确定模块,用于根据所述主成分属性数据和多元线性回归方法确定 流媒体对象的流行度预测值,所述的流媒体对象包括代理服务器中已缓存的流媒体和待替 换进所述代理服务器的流媒体;
[0019] 综合价值确定模块,用于根据流媒体对象的视频峰值信噪比,流媒体对象从原始 服务器到代理服务器的延迟时间W及所述流行度预测值确定流媒体对象的综合价值;
[0020] 缓存模块,用于根据所述流媒体对象的综合价值和代理服务器的缓存空间进行缓 存替换。
[0021] 本发明针对现有技术中缺乏确定影响流媒体流行度最主要因素及用户对于接收 端视频质量的关注超过缓存命中率的缺陷,给出一种流媒体代理缓存替换方法及装置,充 分利用流媒体代理缓存服务器属性数据、流媒体文件自身属性数据和社交行为属性数据, 抽象出获取流媒体流行度的最主要影响因素的方法,并根据主成分预测未来的流行度,并 且能够很自然地融合流媒体质量因子和启动延迟因子来计算文件的综合价值,将流媒体文 件综合价值作为代理缓存的替换原则,W提高缓存命中率的同时提高用户接收端流媒体质 量。本发
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1