基于路网中位置敏感度和热度的位置隐私保护方法

文档序号:9399766阅读:616来源:国知局
基于路网中位置敏感度和热度的位置隐私保护方法
【技术领域】
[0001] 本发明涉及位置隐私保护的研究领域,特别涉及一种基于路网中位置敏感度和热 度的位置隐私保护方法。
【背景技术】
[0002] 位置隐私保护的2个主要技术分别是K-匿名和区域覆盖(location cloaking)。 K-匿名技术已经广泛被应用于各类数据隐私保护中,主要是通过引入K-I个与目标相同或 相似的数据项,使攻击者无法猜测哪个才是真正要保护的目标项。可见,用户信息泄露的概 率将降低到1/K,K值越大,安全度越高。区域覆盖技术则是通过把用户的所在精确位置点 模糊成一个小区域,使攻击者无法确定目标用户的准确位置。如今,K-匿名和区域覆盖技 术经常一起用于保护位置隐私。目前的主要攻击有单点位置攻击和连续位置攻击:
[0003] 对位置隐私保护的研究始于单点位置攻击,该情况仅仅考虑如何在用户发送LBS 请求的这一时刻保护用户位置隐私。对此,Chow等人提出K-共享区域模型,即,一个覆盖区 域(cloaking region)不仅仅只是包括至少K个用户就行,还要求其中至少有K个用户都提 出了相同或相似的查询。此外,Gedik等人对K-匿名技术进行了拓展,提出了 Clique-Cloak 算法,实现了个性化需求。它把寻找最大用户覆盖集问题转换为在约束图中寻求一定条件 下的最大团问题(Maximum Clique Problem, MCP)。Mokbel等人还提出了另外一种算法来 生成所需的覆盖区域,称为Quad-tree-like算法。此外,Ghinita等人引入希尔伯特曲线 (Hilbert curve)来近似模拟2个查询之间的空间接近程度。Bamba等人同时采用K-匿名 和L-多样性算法来产生覆盖区域。即使有许多针对单点位置攻击的保护算法,但是,攻击 者仍可以通过组合多个单点位置查询,推测出用户的位置信息,这是单点位置保护算法的 最大缺陷。
[0004] 连续位置攻击是当前位置隐私保护领域研究的重点,也是本方案致力于解决的 问题。如图1所示,若攻击者获知用户在U t1+1时刻分别提出一个查询请求,其所对应的 覆盖区域分别是Rtl和R tl+1。而且攻击者还知道用户在这片区域内的最大可能移动速度 为v_,则他可轻易推测出该时间段内用户的最大活动区域为R a = ν_*α1+1-^,从而推 断用户的准确位置其实只是位于Ra和Rti+Ι的重叠区域(即图1阴影区域)。显然, 这相当于变相缩小了覆盖区域的大小,在最坏的情况下,如果重叠区域小到只是一个位置 点,用户的确切位置将彻底暴露。这就是连续查询面临的攻击,称为连续位置攻击。针对 连续位置攻击,Cheng等人提出了分别基于时间和空间的两种方法,分别是patching和 delaying。第一种方法patching,通过放大的当前覆盖区域,使得它的最大活动区域尽可 能地包含下一时刻的覆盖区域。即通过适当扩大Rti,进而使得Rti+l GRn。第二种方 法delaying,通过延长作用时间(ti+1-ti)来间接扩大最大活动区域,以满足安全要求。 然后许等人提出了一个多项式时间复杂度的技术来处理这个问题。许等人提出了两个基 于两个不同作用目标的覆盖算法:MaxAccu_Cloak和MinComm_Cloak。潘等人提出了一种 新的基于团的增量覆盖算法,叫ICliqueCloak,同时这也是本方案旨在拓展和改进的算 法。另外,攻击者可能将用户的多个位置或区域信息按时序排列,从而得到用户的轨迹信 息。因此,Kido等人[kido2005anonymous]通过添加一组假轨迹来混淆攻击者。牛等人 [niu2014achieving]结合位置的查询概率等边信息来仔细选取虚拟假位置作为扰乱因素。 You等人[you2007protecting]提出了 2种假轨迹的生成模型,分别是随机生成和旋转生成 法。Palanisamy 等人[palanisamy201 Imobimix]提出了一个 MobiMix 模型,它设定一个相 对隔离的小区域,在该区域中攻击者无法跟踪到用户的任何操作,用户在进入该区域后可 以自由改变或与别人交换自己的ID,由此打破了用户位置信息的连续性,攻击者轻易获取 用户的轨迹信息。
[0005] 道路网络(简称"路网")与欧氏空间不同,它基于真实的道路街景,带有更多的 信息与约束。例如,行人或车辆必须沿着道路行走或驾驶,不能随意穿行;而且整个地图信 息是对外开放的,所有人都可以知道周边有哪些建筑物,哪些机构、店面等。因此,路网在研 究过程中常被抽象为一个带权的图。一般情况下,路网常被建模为一个加权图G= (V,E, W(e))的,其中该V是节点的集合,E是边集。权重W(E)常表示为从一个节点到另一个节点 的花销,例如时间。然而,仅有这些是不够的。王和柳引入了"段"的概念,把路网唯一地划 分为一系列的段,并把用户的覆盖区域(例如是一个矩形)用一组段表示,从而将一个二维 的矩形替换为一维的段的集合。此外,Yigitoglu等人提出了一个对路网的改进模型,称为 带注释的城市网络(Annotated city network),它把地图上的地点按类型归类,并对每种 类型赋予一个带有值的标签(例如热度),以此来描述每种地点类型。本方案也将使用标签 来对每种地点类型进行标识。已有的算法仅考虑一个标签:地点热度,或者把热度和该地点 的敏感度混为一谈。但我们指出,这两个参数是不一样的。例如:饭店热度高,而敏感度低; 私人倶乐部热度低,而敏感度高;医院热度高,敏感度也高。其实我们重点要关注的是热度 高敏感度也高的地方,其次是热度低敏感度高的地方。有所针对才能更高效地进行隐私保 护。因此,在路网下(攻击者拥有地图信息),当用户在某个覆盖区域的逗留时间过长,攻击 者可推断用户在覆盖区域的某个位置逗留过,根据该覆盖区域所涉及的地点的热度和敏感 度,攻击者可以推测用户想要隐藏的敏感位置信息。

【发明内容】

[0006] 本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于路网中位置敏 感度和热度的位置隐私保护方法,综合考虑位置的热度和敏感度的相关关系,防止攻击者 根据用户在覆盖区域的逗留时间推测出用户在该区域曾经逗留的敏感位置。
[0007] 为了达到上述目的,本发明采用以下技术方案:
[0008] 基于路网中位置敏感度和热度的位置隐私保护方法,包括下述步骤:
[0009] S1、在移动用户和服务提供商之间引入可信的代理服务器,所述代理服务器称为 匿名服务器;
[0010] S2、匿名服务器接收到一个基于用户自己确切地点位置的查询,同时考虑位置的 热度和敏感度的对覆盖区域的影响,从而生成一个合适的具有更高隐私保护程度的覆盖区 域,发送给服务提供商;
[0011] S3、服务提供商根据匿名服务器发来的基于模糊信息的查询返回一个候选结果数 据集,匿名服务器根据自己知道的用户确切信息对结果数据集进行过滤,返回最贴切的结 果给用户。
[0012] 作为优选的,步骤SI中,还包括构建路网模型,用一个无向带权连通图G= (V,E, w(e),pt,〈sen, pop〉)表示路网,其中V是节点的集合,E是边集,权重w(e)为非负数,表示 从边e的一个顶点到另一个顶点的距离,计算经过这条边所花费的时间,从而得到走遍整 个覆盖区域的最大花费时间。
[0013] 作为优选的,对地图上的各个地点按类型pt归类,并对每种类型设置各自的热度 和敏感度,用一对二元组〈sen, pop〉表示,sen和pop介于0到1之间,其中,sen可由用户 自定义,pop根据系统数据设置,按地点类型把地点分类,并赋予不同的热度和敏感度。
[0014] 作为优选的,步骤S2中,同时考虑位置的热度和敏感度的对覆盖区域的影响,从 而生成一个合适的具有更高隐私保护程度的覆盖区域;包括下述步骤:
[0015] S21、首先定义攻击者,任何拥有以下信息的人都可能是一个潜在的攻击者:
[0016] ①地图 map 以及相应的抽象图 G = (V,E,w (e),pt,〈sen, pop〉)
[0017] ②一系列历史上连续的覆盖区域:Kt1, CR1), (t2, CR2),……,U11JR11M
[0018] ③用户可能的最大移动速度Vnax;
[0019] S22、定义覆盖区域,指定一个包含用户确切地点位置,至少包括k个用户且面积 大于Amin的矩形区域为覆盖区域,所述Amin为用户自己设置的最小覆盖区域面积,其中 Amin和k都可由用户自定义,Amin和k分别表示覆盖区域的最小面积大小和该区域的匿名 化指数,同时,还应满足以下2个条件:
[0020] ① Amin不能太小,否则可能指向某个具体的地点;
[0021] ②CR不能引起连续位置攻击,使得攻击者可能从一系列连续的的覆盖区域CR推 敲出用户的历史以及当前位置。
[0022] 作为优选的,覆盖区域CR在路网条件下还需要满足另一条件:
[0023]
[0024] 其中,δ为用户自定义的参数,δ值越大,隐私程度越高。在这里,当覆盖区域CR 不满足上面的不等式时,我们建议通过平移和旋转调整CR的位置,这样既不改变CR大小, 也使其尽量满足隐私要求。平移时可遵循一定的规则,如每次沿一定的角度,平移一定的距 离,直到满足条件或超过循环次数。
[0025] 本发明与现有技术相比,具有如下优点和有益效果:
[0026] 1、本发明的算法RCliqueCloak与算法ICliqueCloak对比,可以发现在路网中,当 匿名因子K取相同值时,本发明的算法更优,如图4所示。因为算法ICliqueCloak是基于 欧几里得平面的,不考虑覆盖区域可能包含的不同地点类型的属性和敏感度等因素,但在 现实生活中,这是必须要考虑的。
[0027] 2、在正确配置各个参数以及应当考虑的地图信息后,本发明的方法的性能表现更 加好,图5展示了隐私系数δ与平均成功率和平均保护水平的关系。可以看出,随着隐私系 数S从0.2到0.8增长,本发明的平均保护水平先缓慢上升,到达最高点0.55,然后下降。 但平均成功率一开始维持在90%以上的
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1