一种群智感知中基于k-匿名的位置及数据隐私保护方法与流程

文档序号:16630268发布日期:2019-01-16 06:30阅读:308来源:国知局
一种群智感知中基于k-匿名的位置及数据隐私保护方法与流程

本发明涉及位置隐私保护和数据聚合研究领域,特别是涉及一种群智感知中基于k-匿名的位置及数据隐私保护方法。



背景技术:

物联网发展到今天,对感知计算的需求越来越强烈,而随着无线通信和传感器技术以及无线移动终端设备的爆炸式普及,市场上的手机和平板电脑等智能设备集成了越来越多的传感器,拥有越来越强大的计算和感知能力。在这样的背景下,群智感知计算成为学者们研究的核心是必然的。移动设备收集的内容上传到服务器,服务器为了不同的目的处理后发布这些用户提供的数据。收集到的数据具有细粒度、精度高等特点,这将很大提高我们对人类行为及其环境的了解,对许多研究领域都很有帮助。尽管无线通信和传感器技术的发展给群智感知应用提供更多的功能,但是隐私问题是影响群智感知应用发展的主要原因之一。

对于群智感知中位置隐私保护问题,国内外研究者提出了很多解决方案。gruteserm等人最早将k-匿名引入位置隐私保护中。其基本思想是把用户和至少k-1个其他用户混合在一起构成一个匿名区域,将匿名区域代替原本用户位置发送请求,使用户被分辨的几率降为1/k。hul等人提出了群智感知中用户位置隐私保护问题的解决方案。每个用户被认为是社交网络中的一个节点,用户通过在网络上表示为边缘的友情链接来连接。通常,每个用户通过将他/她获取的数据上传到服务器来提供感知数据。而他们不是直接将数据上传到服务器,而是设计一种hp3算法,数据被发送给用户的一个完全可信伙伴,而伙伴选择另一个伙伴将数据传送到下一跳,直到发送到服务器。这种方法虽然解决了用户位置隐私问题,但是用户的伙伴必须是完全可信的。这样往往是不可取的。murshedm等人提出一种基于子集编码的匿名化方案,可以使用k-匿名来保证用户位置隐私,同时可以向应用服务器提供无损的完整数据。感知数据通过一系列随机长度的伙伴进行转发,然后发送给服务器。由于链的长度是随机的,所以不可能猜到感知数据的发起者。同样这里的伙伴是完全可信的。gaos等人提出了一种在某些群智感知应用中保护用户的位置和轨迹隐私的方法,同时满足具有高质量的服务。他考虑保护用户位置是选择周围附近的伙伴,但是若是用户伙伴与用户之间的位置很近,或者用户伙伴存在恶意攻击者,也容易造成攻击者得到用户的位置信息。

群智感知中关于数据聚合方面的研究相对较少。如何高效的聚集感知数据的同时保证参与者的隐私安全问题已经成为目前研究的热点。tiany等人提出了一种隐私保护方案,该方案允许应用服务器在不知道参与者身份和轨迹的情况下为社交感知任务提供最佳的信息质量。感知数据被加密后,以扰动的方式与参与者链一起传输,以保证整个数据上传的用户隐私。每个参与者将他/她自己的加密数据以及从他/她的孩子节点接收到的数据上传到他/她的父节点,最后,应用服务器收到来自最高参与者的全部数据。该方案虽然保证了用户位置和数据隐私问题,但是多次的加解密过程增加了系统的能耗。shij等人提出了一种新颖的以人为中心的城市传感系统中保护隐私数据的解决方案。该方案基于数据切片和混合的概念,可以支持广泛的统计加性和非加性聚合函数,并具有准确的聚合结果。但是该方案多次的数据切片以及聚合,增加了数据丢失以及数据聚合带来的能耗问题。onishih等人使用dtn收集数据,并提出了一种新的数据收集方法,通过将数据的位置和时间信息分散到接收器中来降低功耗和节点所需要的存储空间。但是该方案只适用于在传输和存储次数少的情况下可以取得较高的成功率。wangcj等人提出了一个叫做单向网络协议的匿名数据收集模型。该模型利用对等网络去协助匿名数据传输从而保护发送者的身份。但是实际的数据有效负载不是通过对等体发送的。对于数据包,通过删除发件人信息并通过直接路径传输到服务器。虽然数据不像以前的一些解决方案那样复制到多个对等端,减少了能耗。但是需要一个完全可信的网关去屏蔽用户的身份。

以上部分简单的介绍了群智感知中位置隐私保护和数据聚合的研究现状,对其分析,可以总结为,k-匿名技术是实现位置隐私保护的一种有效手段,而现有的群智感知中位置隐私保护方法不能保证k个用户中其他用户是完全可信的伙伴,如果伙伴被俘获,联合服务器进行攻击的话,将对用户的隐私造成很大的威胁。另外,现有的数据聚合中的数据迭代时过多的加解密,影响了系统的能耗问题。



技术实现要素:

本发明的目的在于克服现有技术的不足,提供一种群智感知中基于k-匿名的位置及数据隐私保护方法,目的是能够充分利用不可信伙伴构造等价类,提高系统的实用性,保证用户的位置隐私安全。用户感知数据通过在等价类中迭代,解决了用户感知数据所有权的问题。同时能够抵御不可信伙伴和服务器之间共谋攻击带来的隐私泄露的威胁。

为了实现上述目的,本发明采用的技术方案为:一种群智感知中基于k-匿名的位置及数据隐私保护方法,包括如下步骤,

(1)、构造等价类:等价类是由n个用户构成的一个组,每个用户都有感知数据和将数据直接上传给服务器的功能,在等价类中所有的用户都独立,互相不信任;

(2)、进行数据迭代:在等价类中随机选择一个用户作为第一个,用户以随机的形式判断自己是否上传感知数据,如果判断上传,则连同自己感知的数据和接收的传来的数据一起随机的传给下一个用户;如果判断不上传,则仅仅把传过来的数据传给下一个随机选择的用户,下一个随机选择的用户重复判断自己是否上传感知数据,进而完成数据的迭代,直到等价类中的用户全部参加活动,数据上传到服务器。

在步骤(1)中,利用所述构造等价的方法:首先,不暴露任何用户位置隐私的前提下,匿名计算出想要参加活动的所有用户的质心,对所有用户公开质心,质心位置为把获取的所有参与者位置的经度和纬度分别各自求和,然后分别除以参与者个数,得到平均经度、平均纬度,以平均经度、平均纬度所确定的位置为质心的位置;然后,每个用户计算自己与质心位置的距离;最后,比较距离和系统给定阀值的大小,若小于给定阀值,则表明自己加入到等价类,若大于给定阀值,则表明自己不参与活动。

在步骤(2)中,数据迭代包括:

在等价类中随机的选择一个用户作为第一个用户,然后通过用户数据迭代步骤进行迭代:

用户数据迭代步骤:该用户以随机的形式判断自己是否上传感知数据,从“1”和“0”中随机选择判断,如果是“1”则表明自己上传感知数据,那么再随机的选择下一个用户,判断下一个用户是否已经参加过该活动,如果没有则把传来的数据和自己感知数据一同传给下一个用户,如果已经参加过该活动,则该用户再重新随机的选择下一个用户;如果是“0”则表明自己不上传感知数据,那么再随机的选择下一个用户,判断下一个用户是否已经参加过该活动,如果没有则直接将传过来的数据传给下一个用户,如果已经参加过该活动,那么再随机选择下一个用户;

用户重复用户数据迭代步骤,直到等价类中全部用户都参加了该活动,然后把数据传送给服务器。

用户以随机的形式判断自己是否上传感知数据为用户以抛硬币的形式随机判断是否上传数据,硬币的两个面分别对应“1”和“0”。

质心的计算包括下面的步骤计算出位置的总和:

i.初始化:ri∈zq,

其中,zq表示环z/qz,g1为和协议的乘法组生成器,g1为和协议的乘法组,q是大素数。我们假设所有的参与者都被安排在一个圈子里进行计算。圈子可以根据任何顺序形成,这与我们计算的安全性无关,并且没有进一步的讨论。

每个参与者pi随机选择一个秘密整数ri∈zq,然后计算一个公开的参数最后每个参与者pi分享和前参与者(pi-1)与后参与者(pi+1)。

经过一轮的计算,参与者pi计算数字

并且ri作为每个参与者的一个秘密随机数保存下来。

ii.加密:

参与者首先计算(1+xi·p)和(1+yi·p),这个的p是和上面的q相同长度大素数。然后分别乘以秘密参数去得到密文:

ci=(1+xi·p)·rimodp2

di=(1+yi·p)·rimodp2

这里xi∈zp,yi∈zp是参与者的私人数据,即每个参与者的坐标的经度和纬度。然后,参与者广播这个密文,如图3:

iii.求和:

每个参与者接受到其他参与者的密文后,以下面的步骤计算:

然后,参与者计算去得到最终的然后除以参与者的个数,最终得到质心位置那么这个质心对所有的参与者公开。

本发明中应用服务器得到了等价类中部分用户的感知数据,如图片等。本发明采用基于k-匿名的位置隐私保护方法,在不暴露个人位置的前提下,匿名的构造拥有n个用户的等价类,从而保护了用户的个人位置。在等价类中进行数据迭代,确保了应用服务器不知道感知数据的提供者,保证了用户数据的所有权隐私。本发明中我们假设,应用服务器能够俘获的恶意用户是少数的,所以当应用服务器和恶意用户进行勾结时,也不能够得到感知数据对应的提供者,从而可以抵御共谋攻击。

附图说明

下面对本发明说明书各幅附图表达的内容及图中的标记作简要说明:

图1是本发明中群智感知中基于k-匿名的位置及数据隐私保护方法的流程示意图;

图2是本发明中群智感知基本框架图;

图3是本发明中质心计算图;

图4是本发明中数据迭代图。

具体实施方式

下面对照附图,通过对最优实施例的描述,对本发明的具体实施方式作进一步详细的说明。

群智感知系统:如图2所示,一种使用大量移动终端感知数据的大型数据采集系统,群智感知系统是由处于云端的群智感知应用服务器和一批移动终端用户组成。

参与者:加入到等价类中的用户,是群智感知系统最终的参与者。

应用服务器:获得参与者的感知数据而不暴露参与者位置和数据隐私的服务器。

本发明所述一种群智感知中基于k-匿名的位置及数据隐私保护方法,执行流程如图1所示,步骤如下:

(1)构造等价类:等价类是由n个用户构成的一个组,每个用户都有感知数据和将数据直接上传给服务器的功能,在等价类中所有的用户都独立,互相不信任;

(2)进行数据迭代:在等价类中随机选着一个用户作为第一个,用户以抛硬币的形式判断自己是否上传感知数据,如果上传则连同自己感知的数据和传过来的数据一起随机的传给下一个用户,如果不上传则仅仅把传过来的数据传给下一个随机选着的用户。以此类推,直到等价类中的用户全部参加活动,数据上传到服务器;

步骤(1)中,利用所述构造等价的具体过程:首先,不暴露任何用户位置隐私的前提下,匿名计算出想要参加活动的所有用户的质心,对所有用户公开质心。然后,每个用户计算自己与质心位置的距离。最后,比较距离和系统给定阀值的大小,若小于给定阀值,则表明自己加入到等价类,若大于给定阀值,则表明自己不参与活动。至此,等价类已经构造完成,等价类中的所有用户互相没有任何联系。

步骤(1)中,如图3所示,质心的计算为:我们用下面的步骤计算出位置的总和:初始化、加密、求和。

i.初始化:ri∈zq,

我们假设所有的参与者都被安排在一个圈子里进行计算。圈子可以根据任何顺序形成,这与我们计算的安全性无关,并且没有进一步的讨论。

每个参与者pi随机选择一个秘密整数ri∈zq,然后计算一个公开的参数最后每个参与者pi分享和前参与者(pi-1)与后参与者(pi+1)。

经过一轮的计算,参与者pi计算数字

并且作为一个秘密随机数保存下来。

ii.加密:

参与者首先计算(1+xi·p)和(1+yi·p),然后分别乘以秘密参数去得到密文:

ci=(1+xi·p)·rimodp2

di=(1+yi·p)·rimodp2

这里xi∈zp,yi∈zp是参与者的私人数据,即每个参与者的坐标的经度和纬度。然后,参与者广播这个密文,如图3:

iii.求和:

每个参与者接受到其他参与者的密文后,以下面的步骤计算:

然后,参与者计算得到最终的然后除以参与者的个数,最终得到质心位置那么这个质心对所有的参与者公开。

步骤(2)中,利用所述数据迭代的具体过程如图4所示:首先等价类已经在步骤(1)中构造完成,在等价类中每个用户都具有直接上服务器上传数据(图4红色虚线)和感知数据的能力。然后,在等价类中随机的选择一个用户作为第一个用户(图4中p(n-1)),该用户以抛硬币的形式判断自己是否上传感知数据,如果硬币显示是“1”则表明自己上传感知数据,那么再随机的选择下一个用户,判断下一个用户是否已经参加过该活动,如果没有则把传来的数据和自己感知数据一同传给下一个用户,如果已经参加过该活动,则该用户再重新随机的选择下一个用户;如果硬币显示是“花”则表明自己不上传感知数据,那么再随机的选择下一个用户,判断下一个用户是否已经参加过该活动,如果没有则直接将传过来的数据传给下一个用户,如果已经参加过该活动,那么再随机选择下一个用户。以此类推,直到等价类中全部用户都参加了该活动,把所有感知数据上传到应用服务器。

显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,均在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1