对用户的内容访问进行优化的设备和方法

文档序号:7941828阅读:153来源:国知局
专利名称:对用户的内容访问进行优化的设备和方法
技术领域
本发明涉及内容分发服务,例如视频点播(VOD)服务。在本文中,“内容分发服务”的一种含义是允许客户端通过通信网络下载由服务提 供商提供的内容的服务。
背景技术
如本领域技术人员所知的,向连接至因特网的用户提供诸如VOD服务等内容分发 服务的传统构架是客户端-服务器构架,其中用户(客户端)从由服务提供商管理并连接 至通信网络的服务器下载所需内容。最近,已经研发了基于对等(P2P)方法的解决方案。在第一代对等解决方案中,用 户只被授权临时性地存储内容,这些内容是他们下载以供他们自己使用的。因此,用户只能 从当前消费相同内容的其他用户或从内容服务器下载感兴趣的内容。在最近几年,已经提出了功能更强大的对等架构。在该架构中,用户可以积极主动 地下载他们当前不感兴趣、但是可能在未来服务于其他感兴趣的用户的内容。该架构旨在 减少为达到目标服务质量所需的基础设施(服务器)资源的量,并因此降低基础设施部署 的总成本。例如,可以在下面两种特定情况下使用该最近的架构。在“开放因特网”情况下(或开放的不受控环境中),用户经由它们的与因特网连 接的个人计算机(或者更一般的,通信设备),彼此交互并且与基础设施服务器交互。因此, 可以容易地在用户个人电脑(或设备)的硬盘上进行由用户自己管理的内容的主动存储。在“边际设备网络”情况下,彼此交互的组件是位于用户房屋建筑中的家庭网关 (通过DSL或缆线连接)或机顶盒(STB)。在这种情况下,所有边际设备可以由用户所签订 的因特网服务提供商(ISP)来控制。因此,可以在这些边际设备的硬盘上进行内容的主动 存储。为获得提及的最近P2P架构的全部益处,关键是对于那些内容要主动存储以及在 哪里存储,作出充分的决定。K. Suh等人的文章〃 Push-to-Peer Video-on-Demand system design and evaluation “ , IEEE Journal in Selected Areas in Communications, DeCember2007中已经明显地考虑了该问题。在该文章中,提出了两种策略,即“全条带化” 和“基于编码的”放置策略。这些策略达到了优异的性能,但是这仅仅在对于每个内容存储 相同量的数据的情况下以及在对于用户偏好无信息可用的情况下。现有技术文献WO 2007/080345 (Thomson Licensing)公开了一种多媒体内容传递 方法和系统。该现有PCT专利申请中公开的方法包括 第一步骤,包括从内容服务器向第一客户端设备,以“推”模式部分地下载多媒体 内容,以及 第二步骤,包括从第二客户端设备,经由“对等”机制,以“拉”模式下载所述多媒 体内容的遗失元素。

发明内容
本发明的目的是改进上述情况。为此目的,本发明提供了一种针对网络设备的控制设备,该网络设备与通信网络 连接,能够存储内容的用户通信设备耦合至该通信网络,所述控制设备包括-第一分析装置,用于至少根据用户信息,确定集合中内容的各自流行度,并用于 至少根据所确定的内容流行度,确定该集合的每个内容的复制版本的数目,-以及/或者第二分析装置,用于根据内容评级,确定用户的内容偏好,以及-计算装置,用于根据所确定的内容复制版本数目和/或所确定的用户的内容偏 好,确定用于存储每个内容的复制版本的位置,以优化用户对这些内容的访问。根据本发明的控制设备可以包括分离地或组合地考虑的附加特征,值得注意的 是-第一分析装置可以用于根据在信息组中选择的用户信息来确定集合中内容的各 自流行度,其中该信息组包括如下至少一个过去用户对内容的使用,预测的用户对内容的 使用,以及关于先前访问的内容的用户评价;第一分析装置可以配置为接收用户报告,该用户报告包括与过去用户对内容的使 用和/或用户对先前访问的内容的评价有关的用户信息;-第一分析装置也可以用于根据关于网络拓扑的附加信息,确定集合中内容的各 自流行度,网络拓扑信息可以至少包括关于用户通信设备的通信容量和存储容量的信息;-第一分析装置可以用于根据所确定的内容流行度,针对集合中的每个内容,确定 预期来自用户的并发内容请求的数目,并用于根据所确定的并发内容请求的数目以及用户 通信设备的通信容量和存储容量,确定将内容划分到选定数目的组中;第一分析装置可以用于确定将内容划分到三个组中,第一组包括内容的复制版本 必须存储到至少一个选定用户组中每个用户的通信设备中的内容,第二组包括内容的复制 版本必须存储到至少一个选定用户组中一个用户的通信设备中的内容,并且第三组包括内 容的复制版本必须存储到至少一个选定网络设备中的内容。_在变体中,第一分析装置可以用于根据用户通信设备的通信容量和存储容量、以 及针对集合的每个内容的预期来自用户的并发内容请求的数目的均值和方差,确定将内容 划分到可变数目的组中;-第二分析装置可以用于根据用户内容评级,确定将用户划分成聚类,针对每个聚 类确定用户偏好模型,根据所确定的用户偏好模型,确定每个聚类的每个用可能感兴趣的 内容;第二分析装置可以用于通过向用户内容评级应用最大似然方法,来确定每个聚类 的用户偏好模型;第二分析装置可以用于将每个聚类的每个用户偏好模型确定到统计模型类中 (例如,所谓的“树结构马尔可夫随机场”);-计算装置可以用于针对至少一些用户,产生对要存储的内容进行信号通知的推 荐,并用于向网络设备要求将这些推荐发送给相应用户的通信设备;
-计算装置可以用于向网络设备要求发送每个内容在所确定的相应位置处的复制 版本。本发明还提供了一种针对通信网络的网络设备,能够存储内容的用户的通信设备 耦合至该通信网络,所述网络设备包括如上所述的控制设备。本发明还提供了一种用于优化用户对内容的访问的方法,其中用户包括耦合至通 信网络的通信设备,所述方法包括步骤-至少根据用户信息,确定集合中内容的各自流行度,并至少根据所确定的内容流 行度,确定该集合的每个内容的复制版本的数目,以及/或者-根据内容评级,确定用户的内容偏好,以及_根据所确定的内容复制版本数目和/或所确定的用户的内容偏好,确定用于存 储每个内容的复制版本的位置。


当阅读详细的说明书、附录和附图时,本发明的其他特征和优点显而易见,其中该 唯一图示意地示出了包括根据本发明的控制设备的实施例示例的控制设备,其与通信网络 连接,内容服务器和用户通信设备也耦合至该通信网络。
具体实施例方式附图不仅用于完整描述本发明,还在需要时对本发明的限定作出贡献。本发明旨在提供一种用于优化用户对内容的访问的控制设备及关联的方法,用户 配备有耦合至通信网络CN的通信设备CE。在以下描述中,考虑内容是可以通过至少一个DSL(或光纤或缆线)通信网络CN 传输至与因特网连接的用户通信设备CE的视频(或电影)。但是本发明不限于该应用。确 实,本发明涉及任何类型的数字内容,特别是音频(或音乐)文件和数据文件。此外,用户通信设备CE可以是任何类型的,只要一方面它们包括或耦合至用于存 储内容的存储器装置MM,并且另一方面它们能够以对等(P2P)模式彼此之间建立通信。因 此,用户通信设备CE可以是固定的个人计算机、膝上计算机、内容接收机(例如,位于用户 房屋建筑中的家庭网关或机顶盒(STB))、移动或蜂窝电话、或个人数字助理(PDA),只要其 包括通信调制解调器(或任何等同的通信装置)。因此,用户通信设备CE连接至的通信网络 CN可以是任何类型的(固定或无线),只要其能够提供内容分发服务,例如视频点播(VOD) 服务。在以下描述中,考虑用户通信设备CE是作为内容提供商的客户端的用户家庭网 关,内容提供商包括耦合至通信网络CN的至少一个内容服务商CTS。如唯一图中示意性示出的,根据本发明的控制设备D至少包括计算模块CM、以及 第一分析模块Al、以及/或者第二分析模块A2。换言之,控制设备D包括计算模块CM、第一 分析模块Al以及第二分析模块A2,或者包括计算模块CM以及第一分析模块,或者包括计算 模块CM以及第二分析模块A2。如非限制性示例中示出的,控制设备D可以局部化(localized)到连接至(耦合 至)通信网络CN的网络设备CS中,例如控制服务器中。但是,该控制设备D也可以耦合至网络设备CS。此外,控制设备D优选地至少部分地由软件模块构成。但是控制设备D也可以由 电子电路或硬件模块、或者硬件和软件模块的组合(在这种情况下,控制设备D也包括允许 硬件和软件模块之间进行相互作用的软件接口)构成。在控制设备D排他地由软件模块构 成的情况下,控制设备D可以存储网络设备的存储器中或者在例如CD-ROM等任何计算机软 件产品中,该计算机软件产品可以由网络设备读取。在以下描述中,考虑控制设备D专用于对只“属于”一个内容提供商的单个内容集 合的访问进行优化。但是控制设备D可以专用于对属于若干内容提供商的若干内容集合的 访问进行优化。(控制设备D的)第一分析模块Al特别地用于至少根据用户信息,确定集合中内 容的各自流行度。这里,“用户信息”的一种含义是指定义了内容与用户之间的关系的信息。因此,用 户信息可以是过去用户对内容的使用、关于先前访问的内容的用户评价、或者预测的用户 对内容的使用。重要的是,要注意用户自己可以通过报告将用户信息的至少一些提供给控制设备 D(或其控制服务器CS)。例如,用户报告可以包括与过去的内容使用和/或先前访问的内容 的评价有关的用户信息。这种用户报告可以由用户(通信)设备CE自发地(例如周期性 地)或者应控制设备D的请求,传输给控制设备D (或其控制服务器CS)。但是,用户信息的 至少一些也可以由服务提供商提供,可能是在对该服务提供商在其自己的网络设备附近和 /或在任何其他网络访问提供商附近已收集的关于其客户端的内容消费的数据进行分析之 后提供。该最终的用户信息可以是预测的用户对内容的使用,这可以是由内容提供商在将 内容交与用户处理之前基于附加信息而确定的。此外,重要的是,要注意第一分析模块Al可以不仅根据用户信息、还根据附加信 息,来确定内容流行度,该附加信息例如是关于网络拓扑的,例如是用户设备CE的通信容
量和存储容量。当第一分析模块Al已经确定了集合的内容流行度时,第一分析模块Al至少根据 其自己确定的内容流行度,针对集合中每个内容确定复制版本的数目。为此目的,例如,第一分析模块Al可以首先通过考虑其自己确定的内容流行度, 针对集合中每个内容,确定预期来自用户的并发内容请求的数目。然后,第一分析模块Al 可以根据所确定的并发内容请求的数目以及根据用户设备CE的通信容量和存储容量,确 定将这些内容划分到选定数目的组中。在该第一种方法中,可以执行将内容划分到三个组中。第一组可以专用于“热”内 容。第一组包括如下内容这些内容的复制版本必须被存储到至少一个选定用户组中每个 用户的设备CE中。第二组可以专用于“温”内容。第二组包括如下内容这些内容的复制 版本必须被存储到至少一个选定用户组中一个用户的设备CE中。第三组可以专用于“冷” 内容。第三组包括如下内容这些内容的复制版本不需要被存储到用户区域中,因此存储到 例如内容服务器CTS等至少一个选定网络设备中,并且至少对于第一次访问,这些内容只 能在该至少一个选定网络设备附近获得。当对于每个内容预测的并发请求的数目精确时,上述第一种方法是优化的。当并不是这种情况时,第一分析模块Al必须执行第二种方法。例如,第一分析模块Al可以根据 用户设备CE的通信容量和存储容量、以及根据针对每个内容的预期来自用户的并发内容 请求的数目的均值和方差,确定将内容划分到可变数目的组中。附录1中描述了上述两种方法实施方式的更加详细的示例。(控制设备D的)第二分析模块A2用于根据内容评级,确定用户的内容偏好。这 些内容评级代表对于每个先前访问的内容的用户评价,可以由用户设备CE(自发性地(例 如周期性地)或应控制设备D的请求)或者由服务提供商将这些内容评级传输给控制设备 D (或其控制服务器CS)。为确定用户内容偏好,第二分析模块A2例如可以首先根据用户内容评级,确定将 用户划分到聚类中。为此目的,例如,第二分析模块A2可以基于所收集的用户内容评级,创建“冲突 图”,其中,通过“冲突边”将给予相同内容明显不同的评级的两个用户链接起来。然后,对 该图进行处理,以将用户划分到不相交的聚类中,这些聚类用于捕获不同的用户简档。可以通过基于对冲突图的谱特征(特征值和关联的特征矢量)的提取,更精确地 是基于对与该冲突图关联的所谓拉普拉斯矩阵的提取,使用新颖的“谱聚类”算法来进行上 述聚类。当已确定了聚类之后,例如,第二分析模块A2可以针对每个聚类确定用户偏好的 模型。例如,上述对每个聚类的用户偏好模型的确定可以基于将最大似然方法应用于用 户内容评级。在某种意义上,这是特定的统计模型类的最似然模型。例如,可以将每个用户 偏好模型选择到所谓的“树结构马尔可夫随机场类”中。一旦确定了给定聚类的模型,例如,第二分析模块A2可以使用该模型来确定其每 个用户最可能感兴趣的内容。附录2中给出了上述用于确定用户内容偏好的方法的更多细节。(控制设备D的)计算模块CM用于根据(由第一分析模块Al确定的)内容复制 版本数目和/或(由第二分析模块A2确定的)用户内容偏好,确定用于存储每个内容的复 制版本的位置。该确定旨在将把给定内容存储在期望评价该内容的用户的设备CE中的次 数最大化,并因此旨在优化用户对内容的访问。重要的是,要注意当计算模块CM已经确定了每个内容复制版本的每个存储位置 时,计算模块CM优选地配置为针对至少一些用户,产生对要存储的内容进行信号通知的推 荐。在这种情况下,计算模块CM也配置为通过通信网络CN向网络设备CS要求将这些推荐 传输给相应用户的设备CE。然后,用户设备CE可以通过从(推荐中指定的)至少另一用户设备CE或者从(推 荐中指定的)至少一个内容服务器CTS,下载内容,来遵循其专用的内容推荐。可能地,该下 载要经过用户的授权。但是,计算模块CM也可以配置为向网络设备CS要求在每个内容的复制版本的相 应位置处传输复制版本。换言之,可以自动进行内容复制版本传输,而不需要通知用户设备 CE。但是,令人感兴趣的是将(至少一些内容的)这种自动传输与对于用户的显式推荐结合起来,其中该显式推荐用于对已“主动”(自动)存储在设备CE的存储器中的内容进 行信号通知。本发明还可以从用于优化用户对内容的访问的方法方面来考虑,其中用户包括耦 合至通信网络CN的通信设备CE。该方法可以通过诸如上述参照唯一附图描述的设备等设备D来实施。因此,下面 仅给出该方法的主要特征。根据本发明的方法包括以下主要步骤-至少根据用户信息,确定集合中内容的各自流行度,并至少根据所确定的内容流 行度,确定该集合的每个内容的复制版本的数目,-以及/或者根据内容评级,确定用户的内容偏好,-以及根据所确定的内容复制版本数目和/或所确定的用户的内容偏好,确定用 于存储每个内容的复制版本的位置。本发明不限于上述方法和控制设备的实施例,其仅作为示例,本发明涵盖本领域 技术人员认为在所附权利要求范围内的任何备选实施例。附录1I-假设和沣释考虑包括一种旨在允许用户访问F个不同内容(例如电影)(f = 1到F)的系统, 该系统包括P个对等节点(或用户设备CE)、以及I个基础设施节点或内容分发节点(CDN) (或内容服务器CTS)。假设电影f持续Tf秒,并以某一固定比率Bf被编码。假设持续时间 和编码率与电影无关。因此,分别由T和B指示持续时间和编码率。每个对等节点(CS)向系统提供大小为M的存储空间以及上行带宽容量BP。每个 基础设施节点(CTS)提供上行带宽容量B”此外,假设每个基础设施节点(CTS)具有足够 的存储容量来保持所有F个电影的拷贝。专用于电影f的存储量由Mf指示。假设^与对等端(用户)无关。这是由如下场 景激发的对于哪个对等节点(CS)查看F个内容(电影)之一的可能性更大,没有任何可 用的知识。在这种情况下,考虑如下闪速群拥(flash-crowd)场景对于所有f = 1,...., F,发起对电影f的Nf个并行查看(或请求)。II-结果II. 1-在第一种方法中,S卩,当Nf个并行内容请求是预先已知的并且按照降序排列 (Nf^Nf+l)时,存储器的优化使用包括将电影划分到三个组中流行度最高电影(f ^f1), 流行度中等电影(f e {fi+l,...,^}),以及流行度最低电影(f >f2)。将流行度最高电影 完整地高速缓存,即,对于所有f ^ f” Mf = BT0最小化地高速缓冲流行度中等电影,即, Mf = (BT)/P, f e {f1+l,...,f2}。最后,根本不高速缓存流行度最低电影,即,Mf = 0, f > f2。确定数目4和&,使得每个对等端的存储器使用精确为M,并且使得可以从其他对等节 点(CS),使用其专用上行带宽BP,来提供流行度中等电影。对于并发查看的总数Σ fNf= ε P(其对应于并发地使用系统的一小部分ε对等 节点(CS)),当所有Nf个内容流行度相等时,对CDN节点带宽方面的要求是最大的。在这种 情况下,可以显示出CDN节点带宽的总要求(近似)为 因此,在这种保守场景中,可以显示出系统自足(即不依赖于⑶N节点支持)的充 分条件在于 在更加现实的流行度模型下,假设对于某些正参数fQ和α,存在ParetO-Zipf分 布 ~ (f+fQr,可以显示出系统自足的条件是
(nV"a当α 较大时 在上述不等式中,值fl确定如下 这定性地捕获了由于倾斜的流行度分布而得到的储存。II. 2-在第二种方法中,S卩,当Nf个内容请求不是预先已知的,而是每个内容请求
是利用已知的期望值和方差,由随机变量定义的时,可以显示出优化的内容划分不再由固
定地划分到不同流行度的三个组中来确定。而是,优化的存储器设置Mf现在是请求的随机
参数的函数,可以定义如下 其中,a和b是不依赖于电影f的两个正参数。这与第一种方法(Nf个内容请求是 完全已知的)显著不同,在第一种方法中,需要对任何电影进行完整的或最小化的高速缓 存。这里,高速缓存的最优量可以随电影的流行度的平均流行度以及由Q2f反映的流行度 的无常性而持续改变。附录2假设η个用户的集合U e U以及m个项目(内容)的集合i e I。每个用户u向 一些项目i给出范围在1到k之间的分数(或评级)。基于该评级信息,希望推测未来的用 户偏好。更具体地,希望回答如下例如如下问题“在所有用户的先前评级已知的情况下,用 户u将向项目i分配哪个评级(或分数)? ”。由Mu(i)指示该评级(或分数)的真实值。I-用于定义可变数目的不相交聚类的fe术以下描述了用于将用户U分离到不相交聚类中的技术。过去已经研发了依赖 于适合矩阵的谱特性的若干方法。本发明技术的最接近技术是的R. B. Boppana技术,在 "Eigenvalues and Graph Bisection :AnAverage_case Analysis,,,Proc. FOCS 1987,pages 280-285中有所描述。假设给定了冲突矩阵Α。假设矩阵A是对称的,假设每一个条目非负的,并且 被解译为在当前“协同滤波”情况下两个用户i和j之间对内容评级的不一致的度量。对角 线条目Aii全部等于0。例如,如果对于某一阈值T,两个用户对至少T个不同项目(电影) 给出不同评级,则可以将Aij设定为1。备选地,Aij可以是在用户i和j都进行了评级的电影集合上对用户i和j给出的不同评级部分进行计数,在这种情况下,可以Aij采用0和1 之间的任何值。目的是要将索引集合划分成聚类,以使大多数冲突在来自不同聚类的索引之间。 在这种情况下,考虑冲突矩阵A的拉普拉斯算子L,定义如下
Σλ“=』,Lu =<ο
-Aj “右 j.众所周知,拉普拉斯矩阵L是非负定的,因为对于任何矢量χ/^-Σ^^' -^)2
Kj
都成立。令P1S P2...彡Pih指示拉普拉斯矩阵L的K-I个最大特征值,令Z(I),..., z(K-l)指示规格化正交的关联的特征矢量。为了将索引集合分成K个不同的聚类,提出了 以下称为“谱聚类”的算法1 向每一个索引 η = 1,···,Ν关联对应的(K-I)维矢量 ζη:= (ζη(1)Znft^), 该(K-I)维矢量Zn包括特征矢量Z (1),...,Z (K-I)的相应坐标。2 对于某个适合的Μ,从{1,...,Ν}中随机、均勻地挑选M个索引η(1),...,η(Μ)。3 重复4:在所有M个索引中,标识出达到最小欧式距离I |ζηω-ζη(」)| I的两个索引n(i), n(j),5:去除n(j)并将M置为M-l,6:直到M = K为止。7:现在,剩余的K个索引,即n(l),...,n(K),用作聚类代表。向达到{| zn(i)-zn| i = 1. . .,K}中最小值的代表分配任何其他索引η。现在显示出,在特定统计假设下,该算法成功地恢复了某种隐藏的聚类结构。 即,考虑“种植划分”模型,该模型是上述Boppana的文献以及A. Condon等人的文献 "Algorithms for Graph Partitioningon the Planted Partition Model,,,Proc. 3rd Int. Workshop on Approx. Algorithms for Comb. Opt. Prob. iRANDOM-APPROX^ 中考虑的模型 的广义化。该种植划分模型如下。将索引划分到K个不同的聚类(^...,Ck中。假设冲突值 Au是随机的,具有W,l]中的值,并且在所有索引对(i,j),i < j上都是独立的。此外,假 设对于所有i < j,这些变量验证了如下
对于某聚类Ct,fJeCt, W~\q, /和/属于不同聚类 ’ρ指定聚类内平均冲突,q指定聚类间平均冲突,典型的是q > P。在这种情况下,存在如下定理考虑根据上述种植划分模型分布的冲突 矩阵A。假设聚类数目K是固定的,索引的初始数目N较大,并且对于某些固定的 正参数α k,聚类大小Ck验证了 |Ck| α kN,以使mink α k > O。假设参数ρ和 令候选聚类代表的初始数目M是固定的。则利用概率I-K (I-Hiink α k)M-0⑴,上述 算法将索引划分到原始聚类中,除了最多O(N)个错误归类的索引之外。 采用概率方法,其中假设存在与项目{X1;...,Xm}关联的m个随机变量的集合,这 些随机变量遍布评级空间R*= {1,...,k}并描述了真实的用户偏好。对于每个用户u,考虑 评级矢量!^ = (Γιω,... ,rffl(u))形式的评级。该评级矢量可以看作所有项目X = (X1,..., Xm) P( ·)的多变量规律的采样。假设用户通过对该规律进行采样来对项目(电影)评 级。在该阶段,重要的是要注意,观察到的评级矢量不完整。因此,本发明方法的一个 目的在于,预测遗失的用户评价。作为工作区,选择在评级空间中引入额外状态未观察状 态O。评级空间变为R = R*U {0}。由H(u)指示用户u进行评级的项目的集合H(u)= U e I:ri(u) >0}。因此,H(u)可以看作用户u的历史。要解决的问题形式如下对于某个用户U,在给定不完整评级矢量&的情况下,必 须找出未观察项目i得到分数(或评级)1 e R *的概率。该概率表示如下 现在,为Mu⑴给出所提议的预测仗(O的形式。考虑< ,+是ο ui的估计,随机变量 I采用 < 作为其概率分布函数。则,期望值[ξ]可以看作用户u赋予项目i的分数(评 级)的预测。该估计器最小化二次误差函数(或RMSE)。使用观察到的评级矢量,构建对PKi = 1]进行估计的经验概率,其中1 e R, 以及构建对P[Xi = Ii和Xj = Ij]进行估计的联合概率民(Wy),其中L 1. e R0注意,考 虑到尚未被评级的项目i的概率。如果现在执行诸如所谓的Chow-Liu算法等算法,评级矢量Ir1,. . . ,rj作为输入, 则得到最佳树规律估计T。接着,必须对于某个用户U和某个未评级的项目i,找到众 (/)。使用 =//」来指示
I中A的互补,使用vA来指示(Vi) i e A,设定 但是,民,.描述了在空间R上的概率分布。因此,需要去除空间R的未观察 状态并找到民,_。这可以通过考虑“避免” O的随机变量来容易地实现。换言之,找到 这是定义式,的自然方法,因为式,·具有表达式(1)的形式。为给出本发明方法的完 整描述,以下给出计算表达式(2)的高效方法。
需要在排除感兴趣的项目i的情况下,针对用户U未观察的项目集合,对树规律 进行边际化。为此,从树的外围开始。如果未观察项目j是T中的叶子,则在T的公式
(V)C^K(V))⑷中,
veV该未观察项目j仅出现在一个因子^^(νω)=^21^1^中,其中η (ν)指
1Tt(J)^x"(j) ^
示树T中节点V的父辈。因此,可以相对于 容易地整合Τ。由于边际联合规律的一致性
特性?;化)=^^、;^)电,Vv (5),得到的边际规律{Χω}具有与公式⑷相同的形式,
区别仅在于,用对应于修剪后的树T_{j}的依赖性函数替代了依赖性函数π (·)。通过重 复这种修建过程,留下了子树,子树包括由属于H(U)的项目集合“包围”的项目i。该子树 虽然显示了特定情况,但是由于该子树的“内部”(即,非叶子的节点)包含未观察的项目, 因此也可以包括经评级的项目。一旦得到了该树,继续实际的边际化变得很难。对以一般 性的公式(4),解析方法看起来不可行。因此,使用新技术以不同的方式来处理该问题。该新技术相当直接简明。因为希望找到Ti|H(u) (l|rH(u)(u)),因此基于已评级的项目, 对T中项目的边际和成对联合规律进行调节,以迭代过程,每次一个已评级的项目。在每个 步骤,将该“调节”传播通过树。但是,因为马尔科夫特性,不需要将该过程应用到整个树。 只需要对包括感兴趣的项目i的子树应用该过程,该子树具有已评级的项目作为叶子,并 且其“内部”不包括任何已评级的项目。对该子树进行特征化的另一方法是,从已评级的项目(必须是叶子)到感兴趣的 项目i的任何路径不包括任何其他的已评级项目。找到该子树并不困难。必须简单地进行 树搜索,从对应于i的节点开始,只要遇到已评级节点,就停止搜索该树。令T *表示该子树。 在该过程的结尾,精确地找到了所搜索的条件概率。可以对该算法进行略微改进,例如消除 从f开始的最长链上的所有未观察节点,而不是单个节点。但是,最差情况的复杂度大体上 保持相同项目数目中的二次项以及分数(或评级)数目中的线性。该相同过程也可以用于计算T *的叶子Xf的边际规律。因为在每次迭代中找到相对于再多一个的叶子的条件规律,所以写下T(Xf)= Tfi (x fi) Tf 2 I f 1 (Xf2 I Xf 1) · · · Tf φ |fi,· . .,f φ—1 (XfΦ I Xx fl. . ,f φ-1/ 是有意义的,其中φ = |F|。将T(Xf) 初始化为1,并且在主循环中,通过乘以当前叶子的当前规律,保持对T(Xf)进行更新。因此,可以对于每个用户聚类,确定用户偏好的概率模型(根据I中描述的技术来 确定)。
权利要求
一种针对网络设备(CS)的控制设备(D),该网络设备(CS)与通信网络连接,能够存储内容的用户通信设备(CE)耦合至该通信网络,所述控制设备(D)包括i)第一分析装置(A1),用于至少根据用户信息,确定集合中内容的各自流行度,并用于至少根据所确定的内容流行度,确定该集合的每个内容的复制版本的数目,ii)以及/或者第二分析装置(A2),用于根据内容评级,确定用户的内容偏好,以及iii)计算装置(CM),用于根据所确定的内容复制版本数目和/或所确定的用户的内容偏好,确定用于存储每个内容的复制版本的位置,以优化所述用户对这些内容的访问。
2.根据权利要求1所述的控制设备,其中,所述第一分析装置(Al)用于根据在信息组 中选择的用户信息来确定集合中内容的各自流行度,其中该信息组包括如下信息中的至少 一个过去用户对内容的使用,预测的用户对内容的使用,以及关于先前访问的内容的用户 评价;
3.根据权利要求2所述的控制设备,其中,控制设备被配置为接收用户报告,该用户报 告包括与过去用户对内容的使用和/或用户对先前访问的内容的评价有关的用户信息。
4.根据权利要求1到3之一所述的控制设备,其中,所述第一分析装置(Al)还用于根 据关于网络拓扑的附加信息,确定集合中内容的各自流行度。
5.根据权利要求4所述的控制设备,其中,所述网络拓扑信息至少包括关于所述用户 通信设备(CE)的通信容量和存储容量的信息。
6.根据权利要求1到5之一所述的控制设备,其中,所述第一分析装置(Al)用于根据 所确定的内容流行度,针对集合中的每个内容,确定预期来自用户的并发内容请求的数目, 并用于根据所确定的并发内容请求的数目以及所述用户通信设备(CE)的通信容量和存储 容量,确定将所述内容划分到选定数目的组中。
7.根据权利要求6所述的控制设备,其中,所述第一分析装置(Al)用于确定将所述内 容划分到三个组中,第一组包括内容的复制版本必须被存储到至少一个选定用户组中每个 用户的通信设备(CE)中的内容,第二组包括内容的复制版本必须被存储到至少一个选定 用户组中一个用户的通信设备(CE)中的内容,并且第三组包括内容的复制版本必须被存 储到至少一个选定网络设备(CTS)中的内容。
8.根据权利要求1到5之一所述的控制设备,其中,所述第一分析装置(Al)用于根据 所述用户通信设备(CE)的通信容量和存储容量、以及针对所述集合的每个所述内容的预 期来自所述用户的并发内容请求的数目的均值和方差,确定将所述内容划分到可变数目的 组中。
9.根据权利要求1到8之一所述的控制设备,其中,所述第二分析装置(A2)用于根据 所述用户内容评级,确定将所述用户划分成聚类,针对每个聚类确定用户偏好模型,根据所 确定的用户偏好模型,确定每个聚类的每个用户可能感兴趣的内容。
10.根据权利要求9所述的控制设备,其中,所述第二分析装置(A2)用于通过向所述用 户内容评级应用最大似然方法,来确定每个聚类的所述用户偏好模型;
11.根据权利要求10所述的控制设备,其中,所述第二分析装置(A2)用于将每个聚类 的每个用户偏好模型确定到统计模型类中。
12.根据权利要求11所述的控制设备,其中,所述统计模型类被称为“树结构马尔可夫 随机场”。
13.根据权利要求1到12之一所述的控制设备,其中,所述计算装置(CM)用于针对至 少一些用户,产生对要存储的内容进行信号通知的推荐,并用于向网络设备(CS)要求将所 述推荐传输给相应用户的通信设备(CE)。
14.根据权利要求1到13之一所述的控制设备,其中,所述计算装置(CM)用于向网络 设备(CS)要求传输每个内容在所确定的相应位置处的复制版本。
15.一种针对通信网络的网络设备(CS),能够存储内容的用户的通信设备耦合至该通 信网络,所述网络设备(CS)包括根据前述权利要求之一所述的控制设备(D)。
16.一种用于优化用户对内容的访问的方法,其中用户包括耦合至通信网络的通信设 备(CE),所述方法包括步骤-至少根据用户信息,确定集合中内容的各自流行度,并至少根据所确定的内容流行 度,确定该集合的每个内容的复制版本的数目,-以及/或者根据内容评级,确定用户的内容偏好,以及_根据所确定的内容复制版本数目和/或所确定的用户的内容偏好,确定用于存储每 个内容的复制版本的位置。
全文摘要
控制设备(D)属于网络设备(CS),该网络设备(CS)与通信网络连接,能够存储内容的用户通信设备(CE)耦合至该通信网络。控制设备(D)包括i)第一分析装置(A1),用于至少根据用户信息,确定集合中内容的各自流行度,并用于至少根据所确定的内容流行度,确定该集合的每个内容的复制版本的数目,以及/或者ii)第二分析装置(A2),用于根据内容评级,确定用户的内容偏好,以及iii)计算装置(CM),用于根据所确定的内容复制版本数目和/或所确定的用户的内容偏好,确定用于存储每个内容的复制版本的位置,以优化所述用户对这些内容的访问。
文档编号H04L12/18GK101897184SQ200880120162
公开日2010年11月24日 申请日期2008年12月9日 优先权日2007年12月11日
发明者丹-克里斯蒂安·特莫则, 克里斯托弗·迪奥, 劳伦特·马苏勒 申请人:汤姆森许可贸易公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1