用于对用户兴趣简档的隐私保护聚集的方法和装置的制造方法_2

文档序号:8288270阅读:来源:国知局
22] 进一步地,现今在终端用户经由高速通信支持而通过虚拟社交网络来相互连接 时,终端用户不断地向广泛类别的应用分享着私人和个人信息,诸如StumbleUpon' GoogleNews?、Foursquare' Facebook' Yahoo/?、以及twitter?。尽管所透露的 敏感个人信息的性质取决于应用的类型,诸如对于基于位置的服务(LBS)而言是位置并且 对于统一资源定位符(URL)推荐器系统而言是浏览历史,但是将这些应用注入在线社交网 络(OSN)的包罗万象的框架中(其中OSN正开始充当用于供应推荐服务的"一站式商店") 正使得用户的个人信息比以前任何时候都更加危险。
[0023] 近来,已经提议了在保留隐私的同时仍然执行数据分析应用并提供个性化服务 (诸如推荐服务)、个性化内容、个性化搜索/查询、社交网络、数据挖掘、以及其他有关服务 的不同方法。
[0024] 这种已有的方法之一涉及使用基于同态加密的策略来聚集兴趣简档。在这样的方 法中,使用加密技术(诸如同态加密)来加密用户的兴趣简档,以便向用户提供隐私性。这 样的加密技术使得能够执行协议基元操作(诸如加法和乘法),以便使用分布式计算设定 来聚集兴趣简档。使用分布式计算设定允许对终端用户的用户设备的静态集合执行多个阶 段的协议基元操作。例如,Kmeans聚集算法可以被实施在使用了同态加密技术的隐私保留 方法中。尽管使用同态加密的技术促进了向终端用户提供隐私性,但是这样的技术通常是 资源密集的并且执行起来是复杂的。进一步地,对终端用户的用户设备的静态集合执行多 阶段的协议基元操作,限制了这样的技术在动态环境中的应用,动态环境诸如在线门户,其 中终端用户的集合随着终端用户不断地加入和离开这些在线门户而动态地改变。
[0025] 进一步地,某些方法提供了集中式解决方案,其中被配置为聚集兴趣简档的集中 式中介(intermediaries)不被终端用户所信任。在这样的情形中,每个终端用户使用基于 随机投影的方法(诸如加密)来初始地预处理兴趣简档,以在被传达给集中式中介之前获 得经投影的兴趣简档。典型地通过使用以集中式中介不可得到的随机投影函数来变换兴趣 简档,以获得经投影的兴趣简档,因此确保终端用户的数据的隐私性。然而,这些随机投影 函数在正意图成为共同集群的一部分的终端用户之间进行共享,以确保所有类似的兴趣简 档被变换为类似的经投影的兴趣简档,以便促进高效和正确的聚集。然而,在终端用户之间 共享这些随机投影函数可能使得随机投影函数的泄漏成为可能,因为恶意的终端用户可能 将随机投影函数提供给集中式中介,以便从经投影的兴趣简档获得原始兴趣简档。
[0026] 用于保护私人信息的另一种技术是使用具有代理节点的流言代表 (gossip-on-behalf)方法,该代理节点被配置为代表终端用户来传输兴趣简档。这样的技 术涉及使用经加密的两跳通信而通过中介节点来将终端用户的用户简档传输给代理节点, 以便对代理节点隐藏终端用户身份。然而,与代理节点共享完整的兴趣简档可能会促进关 联性(Iinkability)攻击,因为这些代理节点可能通过分析一段时间上的兴趣简档来识别 终端用户。
[0027] 根据本主题的一种实施方式,描述了用于在聚集终端用户的兴趣简档时确保隐私 性以便向终端用户的个人信息提供隐私性的系统和方法。如之前所描述的,这些系统和方 法能够被实施在能够根据被定义用于通信的各种不同标准来与网络进行通信的各种处理 和通信设备中。进一步地,本文所描述的系统和方法可以通过经由不同手段提供的有线网 络或者无线网络来进行连接。
[0028] 如本文所描述的系统和方法,在一方面,通过向每个终端用户和他们的私人信息 提供匿名性而不限制对应用的使用,向终端用户的私人信息提供了真实保护,并且在另一 方面,也向终端用户提供了如下的能力:利用包括瘦客户端的任何计算设备,诸如具有有限 计算能力的移动设备,来接收个性化服务或者使用要求了根据用户的私人数据的相似度的 用户聚集的任何其他应用或服务。在一个实施例中,隐私保护网络包括与用于相互通信或 者与分布式服务器(诸如一个或多个聚合器节点)进行通信的用户设备相关联的多个终端 用户。
[0029] 根据本主题的一个实施例,为了向终端用户提供个性化内容和推荐服务,创建了 具有类似兴趣简档的终端用户的集群。为了该目的,终端用户中的每个终端用户的用户设 备基于简档数据来初始地生成终端用户的兴趣简档,该简档数据诸如终端用户的个人选择 和偏好。例如,用户设备可以获得如下的列表:由终端用户所访问的所有URL、由终端用户 所搜索或观看的所有视频、由终端用户所收听和搜索的音乐、以及与由终端用户所探寻的 其他类似兴趣领域有关的数据。
[0030] 在一个实施例中,这些兴趣简档随后可以被分段为多个兴趣简档分段,并且每个 分段对应于特定的兴趣领域。兴趣领域的示例包括,但不限于:情境偏好,诸如职业兴趣、休 闲偏好、和宗教偏好,以及兴趣的范围,诸如音乐、舞蹈、电子购物、和社交联网。这些兴趣简 档分段随后可以被处理以用于聚集为各种兴趣组。在另一实施例中,兴趣简档作为整体可 以被处理以用于聚集为各种兴趣组。
[0031] 这些兴趣简档分段随后被变换为被称为语义表示的紧凑且语义密集的表示。 作为示例而不是限制,这些兴趣简档分段的语义表示包括:基于标签的表示、基于本体 (ontology)概念的表示、以及基于主题的表示。例如,与社交联网站点"xyz.com"的URL相 对应的兴趣简档可以被变换为语义表示"社交联网站点"。
[0032] 为了该目的,用户设备可以通过匿名通信信道与语义元数据数据库进行交互,语 义元数据数据库具有语义术语的列表或词典,语义术语可以被用于将兴趣简档分段变换为 对应的语义表示。在一个实施例中,用户设备可以将兴趣简档分段提供给语义元数据数据 库,语义元数据数据库可以识别与这些兴趣简档分段中的每个兴趣简档分段相对应的语义 术语,以将这些兴趣简档分段变换为对应的语义表示。在另一实施例中,用户设备可以从语 义元数据数据库获得语义术语的列表,并且然后识别与兴趣简档分段相匹配的语义术语以 获得对应的语义表示。在又另一实施例中,用户设备它自身可以包括元数据,该元数据具有 从由终端用户所浏览的网页提取的语义术语。在所述实施例中,用户设备被配置为相互共 享语义术语的词汇表,从而由不同用户设备生成的语义表示是使用相同术语来表达的并且 因此是可比较的。
[0033] 可以向如此获得的语义表示指配一个集群标识符来识别终端用户能够被关联至 其的兴趣组。可以使用局部敏感散列(LSH)的技术来指配集群标识符。LSH技术涉及,使用 语义表示和由随机值定义的散列函数的集合,诸如在每个用户设备处生成的共同的随机矢 量序列,来将语义表示中的每个语义表示转换为对应的散列码,即集群标识符。在用户设备 处指配集群标识符促进了提供隐私保护,因为没有与远程节点共享兴趣简档。进一步地,使 用LSH技术帮助增加了对用户简档的聚集中的效率,因为现在能够通过匹配散列码来容易 地执行该聚集。此外,使用语义元数据数据库帮助减少了错误否定和错误肯定的发生,因此 增加了聚集的效率。因此,通过LSH技术来执行聚集结合通过生成语义表示的简档变换,促 进了提供具有聚集中的减少的错误的隐私保护。
[0034] 如此获得的集群标识符可以被用于将用户设备聚集为一个或多个集群,即与集群 标识符相对应的兴趣组。进一步地,通过通信信道,例如匿名的通信信道,集群标识符被提 供给一个或多个远程节点,例如,中央聚合器、兴趣组聚合器、以及另一用户设备。
[0035] 在一种实施方式中,可以取决于用户设备针对其而可能被使用的基于推荐的服务 的应用或者类型,来选择与用户设备进行通信的远程节点。例如,在协同过滤应用的情况 中,远程节点可以是中央聚合器,并且每个中央聚合器对应于至少一个集群,即兴趣组,诸 如电影、舞蹈、电子购物、社交联网站点、或者它们的组合。用户设备因此可以将集群标识符 中的每个集群标识符连同用户的兴趣简档一起提供给对应的中央聚合器,以使得中央聚合 器能够在它们的对应兴趣组中的兴趣组的兴趣领域之后,识别最高排名(即首位排名)的 兴趣组。例如,对与"音乐"有关的兴趣组负责的中央聚合器可以接收具有对应集群标识符 的所有用户设备的兴趣简档。中央聚合器随后可以分析这些用户简档,来识别其他兴趣领 域或者由于例如存在于多数(比如90% )终端用户的兴趣简档中而是高排名的兴趣。例 如,中央聚合器可以将"舞蹈"识别为最高排名的兴趣,并且因此可以从负责兴趣领域"舞 蹈"的中央聚合器获得与舞蹈相对应的推荐。中央聚合器因此可以将与音乐以及舞蹈有关 的内容和推荐提供给存在于与集群"音乐"相对应的集群中的所有用户设备。中央聚合器 因此可以提供不仅与用户的兴趣有关而且与兴趣组中的高排名的新兴趣或项目有关的内 容和推荐。在另一实施例中,可以用充当负责一个兴趣组的中央聚合器的每个用户设备来 代替中央聚合器。
[0036] 类似地,在基于内容的推荐应用的情况中,远程节点可以是兴趣组聚合器,并且每 个兴趣组聚合器对应于至少一个集群,即兴趣组,诸如电影、舞蹈、电子购物、社交联网站 点。用户设备在这样的情况中被配置为将集群标识符和语义表示传输给与集群标识符相对 应的兴趣组聚合器,兴趣组聚合器可以基于该集群标识符来提供与该集群标识符相对应的 内容。
[0037] 进一步地,在涉及端到端通信的应用中,远程节点可以是其他用户设备。在这样的 应用中,用户设备可以使用集群标识符来识别具有类似集群标识符的其他用户设备,以便 于使得能够使用匿名通信信道在用户设备之间进行聊天和交换数据。使用匿名通信信道帮 助确保其他用户或者远程节点不能识别传输集群标识符的终端用户,因为集群标识符和其 他数据是使用形成这些匿名通信信道的各种中介节点来发送的。
[0038] 本主题的系统和方法因此通过在用户设备处将集群标识符指配给兴趣简档,来促 进向终端用户提供隐私性。使用LSH技术在用户设备处将集群标识符指配给兴趣简档,使 得能够在远程节点处聚集类似的用户而无需远程节点接入终端用户的兴趣简档,因此向终 端用户提供隐私保护。进一步地,使用LSH技术结合生成语义描述帮助确保隐私被保护并 且聚
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1