一种基于用户行为的网络内容加速方法

文档序号:7823816阅读:263来源:国知局
一种基于用户行为的网络内容加速方法
【专利摘要】本发明公开了一种基于用户行为的网络内容加速方法,其基本原理是把用户将来某个时间段要访问的内容预取到家庭网关的缓存空间,则用户消费这部分内容时不用等待,具有很好的用户体验。该方法由安装于家庭网关的内容管理代理和一个用户行为预测中心组成。内容管理代理搜集用户行为信息,发送给用户行为预测中心;内容管理代理根据预测报告预取网络内容缓存于家庭网关的本地存储,并重定向用户的内容消费请求到本地缓存。用户行为预测中心基于用户的历史行为预测用户将来某个时间段可能消费的网络内容,并返回预测结果给相应的内容管理代理。本发明能够有效解决用户消费高分辨率视频的缓冲时间过长问题;同时,本发明可以降低内容服务器的压力。
【专利说明】-种基于用户行为的网络内容加速方法

【技术领域】
[0001] 本发明属于互联网内容分发领域,更为具体地讲,设及一种面向接入网的基于用 户行为的网络内容加速方法。

【背景技术】
[0002] 随着用户消费高清视频等大容量网络内容需求的增加,高效的内容分发技术成为 一个迫切需求。目前的网络接入条件无法有效满足高清视频消费,不论是网络接入带宽还 是服务器的服务能力都可能成为瓶颈,导致了视频流缓冲时间长,播放时断时续,用户体验 极差。目前,相关的内容加速技术主要包括;Web caching,基于P2P(?ee;r to Peer)的内容 分发,专用的CDN(Content Delivery Network)等,下面具体描述该些技术。
[000引 Web caching是加速网络内容的技术之一,主要面向web内容,如HTML文档等。 Web Caching作用于浏览器和服务器之间,当它收到客户端发往Web服务器的请求之后,先 要检查一下请求的内容是否在缓存中,如果在,就将存储在本地的Web信息提供给用户,而 不必从源服务器去获取;如果用户请求的内容没有存储在缓存中,代理服务器就将用户的 请求转发给到相应的Web服务器。Web服务器响应用户请求传送给用户的页面会先到达代 理服务器。代理服务器会将页面存放在本地的缓存中,然后再把它转发给相应的Web客户 端。由于缓存中的网络内容可能用于服务随后的请求,加快了用户获取网络内容的速度,同 时减少了对网络带宽的占用。由上可见,Web caching的基本思想是重用已经获取的网络 内容,该种内容加速技术适用于重用率比较高应用(如网页),但是对于仅一次性访问的内 容(如视频)来说,Web caching是无能为力的。
[0004] 对于P2P内容分发技术来说,由于系统中每个节点既是服务的请求者又是服务的 提供者,节点在使用服务的同时也提供了服务,提高了整个系统的服务能力。P2P系统的 用户越多,其聚集的带宽也就越大,因此具有很好的可扩展性,特别适合直播类的流媒体服 务。P2P系统的服务能力取决于每个节点贡献的服务能力,然后对于接入网而言,其上行带 宽普遍小于下行带宽,因此P2P系统不适合接入网的应用场景。另一方面,P2P系统在节点 越多的情况下表现得越好,因此不适合非流行内容的分发。
[0005] 内容分发网络(Content Delivery Network, CDN)是由专口公司提供的内容加速 服务,其基本思想是将客户(如某个网站)要分发的内容部署在网络边缘的复本服务器上, 当用户访问网站的内容时,系统会自动把客户重定向到离用户最近的复本服务器,从而降 低用户访问网络内容的时延。由于CDN在全球或者很大的范围部署了较多的服务器,因此 可W测量较大范围网络的状况,把用户的请求重定向到服务质量最好的服务器,从而具有 较好的效果。本质上来说,CDN将内容前推到更接近用户,提高了内容服务的能力,在一定 程度上改善了内容分发的性能。CDN的效果取决于其部署的服务器的网络位置,通常需要较 多的服务器才能满足用户需求。就目前的网络接入状况而言,接入网络可能成为瓶颈,即使 服务器的服务能力再大也无法有效实现高清流媒体播放。另外,CDN的部署需要大量资金 投入,因此使用成本也是一个需要考虑的因素。
[0006] 鉴于CDN和P2P各自的优缺点,将P2P融入CDN的技术也被广泛研究。CDN将网 络内容前推到更接近用户,P2P技术能够有效聚集节点的服务能力(比如网络带宽、存储和 计算能力),两者结合能够有效解决CDN服务器服务能力的问题,但是面临接入网的带宽限 审IJ,也是无法解决大容量数据传输问题。而且,该里的P2P应用同样受限于节点的上行带宽 远低于下行带宽的限制,其效果也是有限的。


【发明内容】

[0007] 本发明的目的是;用户消费大容量网络内容(如高清视频等)的需求日益增加, 然而目前的网络接入状况通常无法满足用户需求,表现为高清视频播放的缓存时间过长, 播放时断时续等问题,用户体验极差;另外,在信息过载的互联网时代,用户常常W大海撰 针的方式去互联网捜索自己感兴趣的影片,造成大量的时间浪费,用户体验极差。本发明 用于解决上述问题,提出了基于用户行为的内容加速方法,根据用户的网络行为,建模用 户的网络内容偏好,预测用户会在将来某个时间段消费某个网络内容,预取部分内容部署 到距离用户最近的家庭网关(或者机顶盒、移动终端),能够极大改善用户体验,提高网 络资源的利用率。本发明基于用户行为的网络内容加速方法,包括两个组成部分;内容管 理代理(Content Management Agent, CMA)和用户行为预测中屯、炬ehavior Prediction Center, BPC)。内容管理代理运行于家庭网关(或者机顶盒、移动终端),用于提取用户的网 络内容消费行为,发送给用户行为预测中屯、,接收预测中屯、的预测报告,然后根据预测报告 代理用户预取网络内容,重定向用户的网络内容访问请求到本地缓存的数据。用户行为预 测中屯、,通过爬虫等手段从互联网获取"账户一网络内容"评分信息,构建"用户一物品"评 分矩阵,该部分数据相当于训练集;同时,预测中屯、爬取网页信息、与"物品"相关的文本信 息,建模网页内容、"物品"等的主题模型,W备预测用户的消费行为之用。预测中屯、接收内 容管理代理发送的用户行为信息,基于前面的训练集和网络内容的主题模型计算用户在将 来某个时间段可能消费的网络内容并返回该报表信息。
[000引 内容管理代理的运行步骤如下:
[0009] S1 ;启动家庭网关,用户通过家庭网关接入互联网进行网页浏览、观看流媒体视频 等。
[0010] S2;家庭网关内部署内容管理代理,该代理分析经过家庭网关的流量,提取用户所 访问的网络内容的统一资源定位器扣化),形成<t,hash化化)〉序列,其中hash扣化)表示 U化对应的哈希值,而t表示访问该U化的时间戳。并将该序列周期性地发送给用户行为预 测中屯、。
[0011] S3 ;当用户初次使用此系统时,内容管理代理会弹出网页请求用户对一些网络内 容(比如:网页、电影等)打分,并将此信息发送给用户行为预测中屯、,W便预测中屯、建模用 户的初始偏好。
[0012] S4;内容管理代理周期性从用户行为预测中屯、获取预测报表,得知用户在将来某 个时间段会W较高概率消费某些网络内容,内容管理代理从内容提供商预取相应内容的起 始部分缓存到本地存储,缓存内容的播放时间应大于基于现有网络状况准备好后续播放数 据的时间。同时,内容管理代理需要管理缓存空间,淘汰无用数据。
[001引 S5;用户访问网络内容时,内容管理代理弹出推荐内容给用户,引导用户的内容消 费行为;无论推荐命中与否,内容管理代理都重定向用户的内容访问请求到本地缓存,并代 理用户下载后续数据。用户观看完某个内容后,系统弹出网页,请求用户给对应物品一个评 分。此过程对用户来说是透明的。
[0014] 用户行为预测中屯、的运行步骤如下:
[0015] S1 ;中屯、通过爬取互联网公开数据,获得"物品"相关信息,提取其中的"用户账 户一网络内容"评分信息,融合该些信息构建"用户一物品"评分矩阵,该评分矩阵的数据作 为训练集并且一直处于更新中。同时,中屯、从"物品"的相关信息(如简介、评论等)中提取 与物品相关的文本信息,W此作为描述对应物品的文本信息,然后利用主题分析算法(如 LDA算法)提取其中的主题,该个主题集合构成对应"物品"的主题模型。预测中屯、也爬取 网页信息,构建网页的主题模型为〈hash化化),T〉,其中hash扣化)是网页对应U化的哈希 值,而T是该网页内容的主题集合。
[0016] S2;接收来自内容管理代理的用户内容访问信息,累计的用户内容评分信息,构建 与S1中的评分矩阵的列对齐的评分向量B,并将B加入到评分矩阵,通过矩阵补全算法可 W预测出用户未评分"物品"的评分,选择前N个作为候选集。另一方面,累计用户在过去 d天的网页访问元组<t,hash扣化)〉序列,基于S1所得的网页主题模型〈hash扣RL),T〉,建 模用户在过去d天的主题集合。该里d的取值可W是1,2, 3等,如果d取1时获得的结果 较少,则d取2,依此类推。然后采用相似度度量(如cosine相似度)计算用户的主题模型 和物品的主题模型,其中排列前H的作为最终的预测结果。该里H的取值主要基于缓存空 间的大小,如果缓存空间较大,则可W取较大的H。然后返回分析报告给相应的内容管理代 理。
[0017] 本发明利用家庭网关用户的稳定性及家庭网关常开的特征,基于用户的内容消费 行为趋势,预取用户将要消费的网络内容到家庭网关本地缓存,将内容分发推进到距离用 户最近的家庭网关。其明显有益效果包括:
[0018] (1)极大地缩短网络内容缓冲时延。基于准确的用户行为预测,能够提前将用户要 消费的网络内容缓存于家庭网关,用户访问该部分内容时,基本无时延,后续内容可W在播 放已缓存内容时补充上来。
[0019] (2)充分利用接入网的空闲带宽。家庭网关的接入带宽存在较多的空闲时间(比 如用户上班时间、睡觉时间等),而内容预取通常安排在该样的空闲时段,因此充分利用了 该部分空闲带宽。
[0020] (3)避免用户大范围捜寻消费内容。在信息过载的时代,用户往往不知道消费哪个 网络内容,基于本发明的用户行为预测,能够W高概率命中用户的消费愿望,提高用户的体 验。
[0021] (4)缓解内容服务器的压力,降低内容服务商的基础设施投资。用户的内容消费行 为具有一定的规律性,因此内容服务器的工作压力也是具有一定的规律性。在用户请求高 峰期时,内容服务器的工作压力大,而其它时候却相对空闲。基于本发明的内容预取技术, 用户的内容请求分散到不同时段,该样就能相对均匀地把内容服务器的工作压力分散到不 同时段,因此内容服务商不需要投过多资源到基础设施来满足最高峰的内容请求。

【专利附图】

【附图说明】
[0022] 图1是本发明基于用户行为的网络内容加速方法的工作流程示意图;
[0023] 图2内容管理代理工作流程图;
[0024] 图3用户行为预测中屯、工作流程图。

【具体实施方式】
[0025] 下面结合附图对本发明的【具体实施方式】进行描述,W便本领域的技术人员更好地 理解本发明。需要特别提醒注意的是,在W下的描述中,当已知功能和设计的详细描述也许 会淡化本发明的主要内容时,该些描述在该里将被忽略。
[0026] 实施例
[0027] 图1是本发明基于用户行为的网络内容加速方法的工作流程示意图。如图1所示, 基于本发明所构建的系统主要包括两个组成部分;内容管理代理和用户行为预测中屯、。内 容管理代理基于用户行为预取网络内容缓存于家庭网关W备用户消费网络内容的需要;用 户行为预测中屯、收集网络数据构建用户行为预测训练集并根据用户请求进行用户行为预 巧。。下面对具体的实施步骤进行详细说明。
[002引 S101 ;训练数据及相关数据收集
[0029] 用户行为预测需基于特定的训练数据集,即大量的"用户一物品"评分信息;同时, 为了提高预测的准确性,还需要其它关于用户行为的数据。本方法提出了推荐算法与主题 匹配相结合的用户行为预测方法,因此需要推荐算法所需的训练数据集和主题相关数据。 推荐算法所需的训练数据即"用户一物品"评分数据通常散布于不同的网站(如化utube、 tudou等),因此需要使用爬虫的网络工具爬取并组织成可用的"用户一物品"评分矩阵。同 时,由于互联网上的"物品"持续变化(比如,新增和淘汰),该个训练集也需要持续更新。用 户行为预测中,还需要"物品"的主题模型和网页内容的主题模型。为了建立"物品"的主题 模型,需要与"物品"关联的文本信息。数据捜集过程中,本方法同时收集与"物品"相关联的 文本信息,如;简介、评论等等,合并为一个文档,采用主题提取算法(如;LDA)提取对应"物 品"的主题集合。为了建模用户的主题模型,本方法还需要爬取网页,构建〈hash扣化),T〉 二元组,其中hash扣化)为网页对应U化的哈希值(通过此值与用户访问的网页相关联), 而T为对应网页内容的主题集合。
[0030] S102 ;用户行为信息收集
[0031] 用户的网络内容消费行为预测需要训练集,同时也需要用户的历史偏好,因此需 要用户行为信息收集功能。用户行为在各独立的网站可W分别收集,但是该些信息相对独 立,局限于具体的网站。本发明采用网络流量分析来提取用户行为,即在家庭网关部署内容 管理代理,该程序分析网络流量,提取用户的内容消费行为信息,包括两方面信息。
[0032] 首先,用户对网络内容的评分。初次使用时,也就是如果内容管理代理没有关于用 户行为的任何数据时,内容管理代理会W弹出网页形式请求用户对一些"物品"(如视频内 容)进行评分。采用该种方式可W获得用户的一些初始偏好,W便预测算法可W启动。在 用户消费了某个网络内容后,内容管理代理也会请求用户对该内容进行评分,W此来获得 较准确的用户行为。该些信息在用户行为预测中屯、构成用户对"物品"的评分向量。
[0033] 第二,用户所感兴趣的主题。通过分析网络流量,内容代理可W提取用户所浏览网 页的U化,构建二元组<t,hash化化)〉,其中t是消费对应U化的时间戳,而hash扣化)是该 u化对应的哈希值,该元组序列周期性发送给预测中屯、,构成用户的主题偏好集合。
[0034] S103 ;用户消费趋势预测请求
[0035] 内容管理代理在预取内容时需要知道取什么内容,但是由于内容管理代理所在的 平台通常功能较弱,不适合做大量运算,因此预测过程由预测中屯、完成,内容管理代理向用 户行为预测中屯、发起预测请求。
[0036] S104 ;用户消费趋势预测报告
[0037] 用户行为预测中屯、返回形成的用户消费趋势预测报告,即预测评分中前H个物 品。该里的H需根据具体的缓存空间大小和用户的接入网络带宽来确定。
[0038] S105 ;网络内容预取缓存
[0039] 内容管理代理根据所接收到的用户消费趋势预测报告,预取该些用户最感兴趣的 内容到家庭网关本地缓存,W备用户消费之用。
[0040] 图2是内容管理代理工作流程图。如图2所示,内容管理代理包含=个相对独立 的功能模块,每个功能模块的工作流程细节说明如下。
[0041] S201 ;判断用户是否首次使用系统
[0042] 用户启动家庭网关,内容管理代理自动启动运行,内容管理代理检测是否保存有 用户的历史行为信息?如果没有,则认为是首次使用此系统;否则认为不是首次使用系统。
[0043] S202 ;获取初始"用户一物品"评分
[0044] 如果是首次使用系统,需要获取用户的初始行为信息,W便系统能够良好工作。系 统向用户终端弹出网页,请求用户对给出的内容打分,比如:系统通过网页列出一些经典的 电影,请求用户给该些内容给一个评分,如果用户没有看过,则给0分。通过该种方式,可W 获得用户的初始历史行为。
[0045] S203 ;分离网络内容访问流量
[0046] 本方法主要关注网络内容的加速,因此需要分离出对访问网络内容的流量,W便 建立用户的行为模型。该里的网络内容,主要包括网页和流媒体,该些内容主要通过http 协议承载,因此该里分离出ht化协议流量。如果其它种类协议也广泛用于流媒体分发,本 方法也可W进一步分离出该类协议的流量。
[0047] S204 ;判断是否为网页内容
[0048] 网页内容和流媒体内容在建模用户行为方面所起作用是不一致的,因此本方法需 要分类该两种流量,W便分别处理。
[0049] S205 ;提取网页内容的U化
[0化日]如果对应的网络内容是网页,则提取该网页对应的U化,形成二元组 <t,hash扣化)〉,其中t是访问该U化的时间,hash化化)是该U化对应的哈希值,该里的哈 希函数可W选择sha-2。
[005U S206 ;构造<t,hash(U化)〉序列,周期性发送给中屯、
[005引累积二元组<t,hash扣化)〉,形成一个序列,周期性发送给行为预测中心W便建 立对应此家庭网关的用户行为模型。其中,根据用户访问网页内容的频繁程度,周期可W从 1天到一周。用户访问网络内容越频繁,二元组<t,hash扣化)〉序列的发送周期就越短,W 便及时反映用户行为。
[0化3] S207 ;提取内容访问请求U化
[0054] 如果用户访问的内容不是网页,则认为是流媒体内容,该里需要提取流媒体内容 访问请求的U化。
[0化5] S208 ;重定向访问请求到本地
[0化6] 内容管理代理重定向内容访问请求到本地,如果本地已经缓存相应的内容,则提 供相应内容,否则认为缓存对应的内容量为0。无论本地是否缓存相应内容,在提供内容服 务的同时,都需要运行S209。在缓存命中的情况下,用户能够获得更好的体验。
[0057] S209 ;代理用户下载剩余内容
[0化引内容管理代理把剩余的内容下载到本地,W供用户消费。
[0059] S210 ;获取用户内容消费后的评分
[0060] 用户消费完某个内容后,内容管理代理弹出网页,请求用户对该内容评分,用户也 可W评价该内容。用户提交后,该种用户产生的内容被发送给用户行为预测中屯、,作为用户 行为的一部分,也可W汇聚到用户行为预测的训练集中。
[0061] S211 ;周期性探测网络是否空闲
[0062] 为了不影响用户正常的网络使用,内容预取等操作被作为最低优先级,因此该类 内容预取操作通常在网络空闲时进行。内容管理代理探测网络是否有其它应用流量,一旦 网络存在较大空闲带宽,则进行预取操作。
[0063] S212 ;用户行为预测请求
[0064] 内容管理代理进行内容预取时,需要确定要预取的内容,而该内容通常是取决于 用户的内容消费趋势,因此内容管理代理需要向用户行为预测中屯、发起用户行为预测请 求。
[00化]S213 ;接收用户行为预测报告
[0066] 用户行为预测中屯、完成用户的内容消费行为预测后,向内容管理代理返回预测报 告,因此内容管理代理需要接收用户行为预测报告。
[0067] S214 ;预取网络内容并缓存
[0068] 根据用户行为预测报告,内容管理代理预取相应的内容到本地缓存。预取内容时, 首先考虑用户最可能消费的内容,具体预取多少内容,取决于缓存空间的容量和用户的网 络接入带宽。
[0069] 图3是用户行为预测中屯、的工作流程图。如图3所示,用户行为预测中屯、包含两个 相对独立的模块,其一是持续更新用户行为预测训练集,另一个是用户内容消费行为预测。 具体的工作步骤详细描述如下。
[0070] S301 ;爬取并解析与物品相关的信息
[0071] 利用网络爬虫爬取并解析互联网上的公开数据,如视频网站(you化be、化dou 等)、购物网站、点评网站(如大众点评网、豆瓣等)等,获得"用户一物品"评分信息。该里W 视频网站为例,用户Ui如果对物品I 1给分为R 1,则该个评分信息表示为=元组<Ui,I。Ri〉, 评分的取值范围为0?5,该也是目前主流的评分方式。
[007引同时,本方法从爬取的信息中提取与物品相关的文本信息,比如对视频的评价、介 绍、与视频相关联的标签等,该些信息构成对物品的文本描述。基于对该些文本信息的分析 (如采用LDA算法),可W建立与对应物品相关联的主题模型。
[0073] S302 ;构建"用户一物品"评分矩阵
[0074] 综合来自不同网站的"用户一物品"评分信息,系统构建统一的"用户一物品"评 分矩阵,该矩阵作为预测用户行为的训练集。首先,系统统计物品集合I = Ul,12, ...,I。} 和用户集合U=扣l,U2,...,Um}。然后,WI为列,U为行构造一个评分矩阵M。如果某个用 户没有对某个物品评分,则矩阵中对应的元素的值为0。示例如下:
[0075]

【权利要求】
1. 一种基于用户行为的网络内容加速方法,其特征在于,该方法由两部分构成,其一为 运行于家庭网关的内容管理代理,另一个是以集中方式运行的用户行为预测中心。
2. 根据权利要求1所述的基于用户行为的网络内容加速方法,其特征在于,所述用户 行为预测中心包括以下步骤: 5101 :用户行为预测中心从公开的互联网信息搜集用于用户行为预测的数据,包括"用 户一物品"评分信息、网页的主题模型、"物品"的主题模型。 S104:-旦用户发起消费趋势预测请求,预测中心根据S101所搜集的数据和S102的用 户历史行为数据,预测用户在未来的一段时间可能消费的网络内容,并返回该报表给相应 的内容管理代理。
3. 根据权利要求2所述的用户行为预测中心,其特征在于,所述步骤S101中的预测中 心数据搜集方法: 通过网络爬虫爬取公开的互联网数据,包括:①"用户一物品"评分信息,用于构建"用 户一物品"评分矩阵。②"物品"的相关文本信息,包括对"物品"的简介、评价等,合并所有 关于某个特定"物品"的文本信息构成一个文档,并通过主题提取算法(如LDA等)构建该 "物品"的主题模型,形成〈I,T>二元组。其中I是"物品"的标识(可以是编号或者名称), T是对应"物品"的主题集合。③爬取网页,构建〈hash (URL),T>二元组。其中,hash (URL) 是网页对应URL的哈希值(哈希函数可以是sha-2等),T为对应网页的主题的集合。 由于互联网上的"物品"持续变化(比如,新增和淘汰),上述数据处于持续更新中。
4. 根据权利要求2所述的用户行为预测中心,其特征在于,所述步骤S104中的用户消 费趋势预测方法: 用户消费趋势预测采用组合方法进行。首先,通过推荐算法来预测用户对某个"物品" 的评分,获得用户评分最高的"物品"列表。这里采用矩阵补全的推荐算法,用户对"物品"的 历史评分通过内容管理代理获取,因此可以形成一个与预测中心相同炜度的向量,其中没 有评分的"物品",其评分设置为0。把用户的历史评分向量加入的评分矩阵中,通过矩阵补 全算法(如非负矩阵因子分解)预测出用户对未评分"物品"的评分。从而,可以获得评分 最高的的前N个物品,这些物品作为候选集合。然后,提取用户最近d(d取值1,2, 3,...)天 所访问的网页的主题模型,和候选集合中的"物品"的主题模型进行相似度度量(如cosine 相似度度量),取得排名最高的前H个作为预测结果。d的值从1开始,如果预测的结果过 少,则增加 d的值。H的取值和缓存空间的容量有关,如果缓存空间较大,则可以缓存较多 "物品"。
5. 根据权利要求1所述的基于用户行为的网络内容加速方法,其特征在于,所述内容 管理代理包括以下步骤: 5102 :内容管理代理程序通过流量分析获得用户的内容访问行为信息,这些信息包括 用户所访问网页的URL和对应时间,用户所访问的视频内容名称、评分信息和时间。内容管 理代理周期性发送这些信息到预测中心以备用户内容消费行为预测之用。 5103 :在预取内容之前,内容管理代理需要知道预取的内容是什么?内容管理代理请 求预测中心预测用户的内容消费趋势。 S105 :基于预测中心返回的内容消费趋势,内容管理代理预取相应网络内容并缓存于 本地。 S106 :内容管理代理监控用户的内容访问请求,重定向用户的内容访问请求到本地缓 存的内容,并代理用户下载剩余内容。
6. 根据权利要求5所述的内容管理代理,其特征在于,所述步骤S102中的用户行为数 据搜集方法: 内容管理代理监控用户的网络内容访问流量,提取用户网络内容访问的特征。初次使 用,内容管理代理会弹出网页请求用户对一些"物品"进行打分,这些信息作为用户初始的 历史行为,以便作为预测系统的输入之一。如果用户访问视频内容,则内容代理重定向用户 的请求到本地缓存,并代理用户下载剩余内容,在用户观看完一个视频后,内容管理代理会 请求用户给一个评分,作为用户历史行为的一部分。如果用户访问网页,则内容管理代理生 成二元组<t,hash (URL)〉,其中t是访问对应网页的时间,hash (URL)是网页对应URL的哈 希值(哈希函数可以是sha-2等)。内容管理代理周期性发送上述信息到预测中心,后者把 这些信息作为用户的历史行为。
7. 根据权利要求5所述的内容管理代理,其特征在于,所述步骤S103中的用户内容消 费趋势预测方法: 内容管理代理的功能相对较弱,不适合做大规模数据处理,因此内容管理代理请求预 测中心进行用户消费行为预测。
8. 根据权利要求5所述的内容管理代理,其特征在于,所述步骤S105中的网络内容预 取方法: 基于预测中心的预测报告,内容管理代理在网络空闲时(比如晚上、上班时间等)预取 用户可能消费的网络内容的一部分缓存于本地缓存空间。首先,预取并缓存用户最可能消 费的网络内容;然后是消费可能性第二的网络内容,依此类推,直到缓存空间不足为止。预 取的网络内容的一部分取决于网络的平均带宽,如果余下的内容可以在现有网络带宽的条 件下,在P分钟内下载完毕,则预取内容的播放时间需要大于P分钟。如果某个预取的内容 在缓存空间超过给定的时间也没有得到访问,则预测没有命中,淘汰该内容,释放其所占的 存储空间。
9. 根据权利要求5所述的内容管理代理,其特征在于,所述步骤S106中的用户内容访 问控制方法: 内容管理代理监控用户的内容访问请求,如果是视频内容访问,则重定向用户的访问 请求到本地,通过本地缓存的内容来服务用户,并代理用户下载余下部分内容。即使本地缓 存没有命中,该过程同样执行。在内容消费结束后,请求用户对相应内容给一个评分,以便 将来进一步提升用户体验。
【文档编号】H04L29/08GK104486350SQ201410814693
【公开日】2015年4月1日 申请日期:2014年12月24日 优先权日:2014年12月24日
【发明者】罗绪成, 刘梦娟, 陈伟, 汤四见, 赵鹏, 李伟铭 申请人:电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1