一种空间众包中隐私保护的任务分配方法与流程

文档序号:16308039发布日期:2018-12-19 05:09阅读:330来源:国知局
一种空间众包中隐私保护的任务分配方法与流程

本发明涉及空间众包、时空数据处理和移动计算领域,特别涉及空间众包中隐私保护的任务分配方法。

背景技术

近年来,一种通过整合网络平台劳动力来求解计算机很难单独完成的工作问题的新模式――众包(crowdsourcing)得到了工业界和学术界的广泛关注。所谓众包,通常是指“一种把过去由专职员工执行的工作任务通过公开的web平台,以自愿的形式外包给非特定的解决方案提供者群体来完成的分布式问题求解模式”。作为“群体智慧”的体现,众包有着广大的应用场景和市场。例如,早期的众包平台通常指“问答系统”平台,如开源自由免费的百科全书编辑平台维基百科

(wikipedia),依靠互联网大众共同编辑百科全书为人们提供一个获取知识的途径;再例如百度知道,通过悬赏积分让有经验的互联网用户回答专业问题,分享他们的知识。之后,随着任务的复杂化和数据的多样化,新一代“在线众包平台”――大型在线工作招募和任务分配管理平台诞生了,例如亚马逊土耳其机器人(amazonmechanicalturk)和猪八戒网都是通过招募互联网劳动力完成一些稍微复杂的任务并支付相应的报酬。这些任务不再于局限于问题回答和知识分享,而开始遍布于各个细分领域,如数据标注、物品取送等。

另一方面,随着移动互联网技术的蓬勃发展和gps便携设备的计算能力的提高,一种基于地理位置的众包形式应运而生,这就是空间众包(spatialcrowdsourcing)。一个典型的空间众包系统由空间众包平台、空间任务请求者和众包工人三部分组成。平台会根据一定的策略(如最近距离优先)将请求者发布的空间任务分配给工人,工人需要移动到指定的任务地点完成相应任务并获得报酬。空间众包作为传统众包概念在时空领域的延伸,利用了工人的移动性和便携设备的多功能性,在社会服务、智能交通等领域都发挥着卓越的作用。例如滴滴出行、uber等专车服务和美团外卖、饿了吗等外卖服务,均是采用空间众包模式提供服务。再例如,百度地图、waze等导航类服务通过收集和分析大量用户携带的移动设备传感器感知并上传的数据,可以精准地提供实时路况信息。特别地,随着“互联网+”时代共享经济模式的流行,空间众包将会在人们日常生活中扮演越来越重要的角色。

然而,空间众包在为日常生活带来便利的同时,也不可避免地带来了隐私泄露的问题。为了全局最优效果,空间众包平台会根据用户提交的位置信息来进行任务分配,而用户的位置信息隐含了用户的身份、家庭住址和生活习惯等敏感信息。这些敏感信息被不完全可信的平台或恶意攻击者获得后,往往会导致不可预料的后果。因此,如何在保护用户隐私的前提下,为空间众包平台提供可靠的数据,帮其生成全局最优的任务分配方案,已经成为当前空间众包研究领域的热点问题之一。

经调研发现,围绕如何保护工人位置隐私,相关的研究主要可以分为三类模型:基于差分隐私技术的隐私保护模型、基于空间匿名技术的隐私保护模型和基于同态加密技术的隐私保护模型。

第一类,基于差分隐私技术的隐私保护模型。该模型的原理是,通过在原始数据上添加随机噪声来干扰敏感的隐私数据,在保证原始数据中敏感数据不泄露的同时,依然保持原始数据的统计学特征,以便于分析人员进行数据分析和挖掘。然而该模型需求一个实际不存在可信第三方,导致其可用性下降。

第二类,基于空间匿名技术的隐私保护模型。该模型将某个工人的位置点扩展为一个匿名区域,从而将每个工人位置隐藏在其他k-1个工人之中。然而,该模型不能对抗背景知识攻击,安全性不够。

第三类,基于同态加密技术的隐私保护模型。在该模型中,空间众包平台会生成同态加密算法的公钥和私钥,工人使用公钥将自身位置数据加密后发送给半可信第三方,随后平台在收到任务请求者发布的任务后,会与半可信第三方进行交互,在密文域上计算出任务分配方案。显然,同态加密会带来大量的计算开销。

从以上分析可以看出,现有的隐私保护模型主要是受限于半可信第三方、安全性和计算开销三点。



技术实现要素:

本发明主要解决的技术问题是提供一种空间众包中隐私保护的任务分配方法,使用基于匿名的数据收集协议来保证工人位置数据的安全性,使用基于反向拍卖的任务分配算法来保证工人的诚实性,是基于半可信的模型,有着高安全性、高效性的优点,在空间众包领域有着极其光明的应用前景。

为解决上述技术问题,本发明采用的一个技术方案是:提供了一种空间众包中隐私保护的任务分配方法,涉及三方实体,包括空间众包平台、代理商和工人,使用基于匿名的数据收集协议,将用户数据安全地发送给空间众包平台;使用基于反向拍卖的任务分配算法来帮助空间众包平台生成任务分配和奖励报酬方案,并且保证用户的诚实性,包括以下具体步骤:

(1)基于匿名的数据收集协议

(1.1)密钥生成和分发

首先,代理商独立生成n个随机字符串,随后,代理商对所有工人的标识符序列进行随机置换得到位置序列,最后,代理商将密钥对分别发送给每个工人;

(1.2)数据计算与加密

每个工人根据自身位置和任务位置的距离,计算出前往执行任务所需的旅行开销,该旅行开销与距离成正比,且为工人的私密数据,工人使用接收到的密钥对来生成一系列加密密钥,再使用这些加密密钥加密其密文数据,最后将密文数据发送给空间众包平台;

(1.3)数据解密与分析

空间众包平台只需要对密文数据进行简单的异或操作,就能得到置换过的明文数据,对明文数据进行分析后,平台可以得出最终的任务分配方案;

(1.4)不经意传输

空间众包平台和代理商一起执行不经意传输协议,不经意传输协议一方面确保空间众包平台只知晓被选中工人的id,而不知其他工人id;另一方面确保代理商对空间众包平台选择的工人不知情;

(2)基于反向拍卖的任务分配算法

(2.1)获胜报价选择算法

将所有任务报价按照边界差值来排序,以一种贪心的方式选择出获胜报价;

(2.2)报酬决定算法

按照贪心策略为每一个获胜报价计算出其相应的报酬;

(3)得出最终的任务分配和报酬方案

空间众包平台使用如上所述的基于反向拍卖的任务分配算法得出最终的任务分配和报酬方案。

在本发明一个较佳实施例中,所述的空间众包、代理商和工人均采用基于半诚实的安全模型。

在本发明一个较佳实施例中,所述的空间众包平台承担着发布任务、接收众包工人数据、生成任务分配方案、生成工人奖励方案、反馈任务执行结果的职责。

在本发明一个较佳实施例中,所述的空间众包平台在生成任务分配方案时,着眼于最大化某目标函数,其中,最大化某目标函数包括最大化总分配任务数量、最大化正确分配的任务数量、最大化任务预算开销之差和最大化任务接受度。

在本发明一个较佳实施例中,所述的代理商是引入的半诚实第三方云服务,通过提供辅助的密码学服务帮助平台和工人进行隐私保护的任务分配。

在本发明一个较佳实施例中,所述的密码学服务包括密钥生成和分发。

在本发明一个较佳实施例中,所述的工人指的是携带移动设备的用户,是空间众包系统的主要参与者。

在本发明一个较佳实施例中,所述的工人基本属性包括位置、上线/下线时间、负荷。

在本发明一个较佳实施例中,所述的基于匿名的数据收集协议是基于位异或同态密码系统和不经意传输协议,仅使用位异或操作对数据进行加解密。

在本发明一个较佳实施例中,所述的基于反向拍卖的任务分配算法是一种贪心算法来求近似解,以较小的时空开销,计算出十分接近于精确解的结果。

本发明的有益效果是:本发明的空间众包中隐私保护的任务分配方法,使用基于匿名的数据收集协议来保证工人位置数据的安全性,使用基于反向拍卖的任务分配算法来保证工人的诚实性,是基于半可信的模型,有着高安全性、高效性的优点,在空间众包领域有着极其光明的应用前景。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:

图1是本发明空间众包中隐私保护的任务分配方法一较佳实施例的流程图;

图2是本发明空间众包中隐私保护的任务分配方法中基于匿名的数据收集协议的样例示意图。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

如图1-2所示,本发明实施例包括:

本发明提供了一种空间众包中隐私保护的任务分配方法,通过使用基于匿名的数据收集协议来保证工人位置隐私的安全性,使用基于反向拍卖的任务分配算法来保证工人的诚实性。该方法基于半可信的第三方,安全性高,时空效率高,在空间众包领域有着广泛的应用,市场前景十分光明。

(1)基于匿名的数据收集协议

算法1:基于匿名的数据收集协议

输入:工人数量n,数据位长l

输出:任务分配方案ta

1代理商;

2生成n个随机字符串{s|si∈{0,1}l}(i=0,...,n-1);

3对工人标识符序列i进行随机置换得到位置序列pos;

4分发密钥给工人wi;

5工人wi;

6计算出每个任务的旅行开销,并表示为l比特的二进制串mi;

7从伪随机函数族中选择两个伪随机函数

8计算得到n个l比特的随机字符串(j=1,...,n);

9分别使用加密其真实数据mi和使用(j≠posi)来加密虚拟数据{0}l

10将这n个加密数据依次拼接起来生成一个nl比特的字符串ci,并发送给平台;

11平台;

12计算得到原始明文数据的拼接结果;

13将拼接结果分解为n份明文数据,使用基于反向拍卖的任务分配算法产生方案;

14与代理商执行不经意传输协议,获取被选择工人标识符id,得到最终任务分配方案ta。

根据算法1,整个协议由三方协作完成。具体来说,可以分为四个步骤:

(1.1)密钥生成和分发

首先,代理商独立生成n个随机字符串{s|si∈{0,1}l}(i=0,...,n-1)。随后,代理商对所有工人的标识符序列i进行随机置换得到位置序列pos。最后,代理商将密钥对分别发送给每个工人wi。

(1.2)数据计算与加密

每个工人根据自身位置和任务位置的距离,计算出前往执行任务所需的旅行开销。该旅行开销与距离成正比,并可以用1比特的二进制串mi表示。每个工人wi从伪随机函数族中选择两个伪随机函数然后通过计算得到n个1比特的随机字符串。随手,工人wi分别使用加密真实数据,使用(j≠posi)来来加密虚拟数据{0}l

最后,工人wi将这n个加密数据依次拼接成密文数据ci发送给空间众包平台。

(1.3)数据解密与分析

空间众包平台只需要对密文数据进行简单的异或操作,就能得到置换过的明文数据:

随后,在对明文数据进行分析后,平台可以得出最终的任务分配方案。

(1.4)不经意传输

然而,由于空间众包平台接收到的明文数据是随机置换过的,其不能知晓被选择工人的真实id,而代理商拥有工人id随机置换的对应关系。所以,空间众包平台需要和代理商一起执行不经意传输协议。该协议一方面可以确保空间众包平台只知晓被选中工人的id,而不知其他工人id;另一方面可以确保代理商对空间众包平台选择的工人不知情。

为了使得该协议更加清楚明了,使用了一个简单的例子来图示说明。如图2所示,有三个工人的旅行开销分别为710=01112,1110=10112和310=00112。另外,其posi位置索引分别为2,3和1。每个工人使用伪随机函数,产生随机字符串(j=1,2,3)用于加密其真实(或虚拟)数据,得到密文数据发送给平台。平台将3份密文数据进行位异或解密,并分割成3份明文数据,分别是3个工人提交的旅行开销。经过分析该明文数据,平台需要将任务分配给第1个位置的工人。为了得到该工人的id,平台和代理商进行一次3选1的不经意传输协议,从而知晓该用户的id为3,最终完成任务分配。

(2)基于反向拍卖的任务分配算法

在隐私保护模型中,工人将发送旅行开销而不是其私密的位置信息给平台,供其生成任务分配方案。显然,数据的真实性将极大地影响任务分配方案的性能。因为工人都是不同的个体,可以认为是理性又自私的。换句话说,一方面,在缺少足够的奖励激励时,工人是不会参与到空间众包系统中的,显示出理性的一面;另一方面,每个工人都会尽可能去最大化其本身的收益,显示出自私的一面。因此,我们需要设计一种诚实的激励机制,来促使工人诚实地提供旅行开销来参与到空间众包系统中来。

拍卖理论对于激励机制的设计是一种很好的理论工具。其中反向拍卖是一种自上而下的竞价,以最低价成交的拍卖方式。具体来说,可以将平台看作拍卖方,将任务看作拍卖物品,将想要执行任务的工人看作竞拍者,将工人提供的旅行开销看作报价。平台将这些报价作为输入,选择一些报价作为获胜报价(即产生了任务分配方案),并且决定相应的报酬。将拍卖理论应用于任务分配问题中,设计了一种基于反向拍卖的任务分配算法,该算法主要包含两个关键部分:获胜报价选择算法和报酬决定算法。

(2.1)获胜报价选择算法

算法2:获胜报价选择算法

输入:任务集合t,工人集合w,报价集合b

输出:获胜报价集合s,报价获胜指示器x

首先,获胜报价选择问题目标函数和服从条件如下:

最大化:

服从于:

或者

由于获胜报价选择问题是一个np-hard问题,难以高效地求得最优解。另外,经过分析,发现优化目标是满足次模性质的。基于该性质,设计了一种近似算法。根据算法2,该算法将所有任务报价按照边界差值来排序,以一种贪心的方式选择出获胜报价。

给定一个选定的报价集合s,报价的边界值为在此排序中,第k+1轮的报价恰好使得当前总收益在集合b\sk上最大,其中sk是第k轮迭代出的获胜报价集合,而s0=φ。因此,边界差值的排序恰好反应了社会收益函数的次模性质。

(2.2)报酬决定算法

算法3:报酬决定算法

输入:报价集合b,获胜报价集合s

输出:报酬集合p

为了保证拍卖算法的诚实性,需要保证每个获胜报价将被支付的报酬是临界值。设计的报酬决定算法就是按照贪心策略为每一个获胜报价计算出其相应的报酬。

根据算法3,对于每个获胜报价将集合中的报价也按照边界差值排序。对于该次序中每一个位置m,我们计算可以被选中代替第m个位置的报价所能达到的最大值。该过程会一直进行,直至达到最后一个边界差值大于0的位置m。此时,我们将报酬设为这个m个报价的最大值。

(3)得出最终的任务分配和报酬方案

空间众包平台使用如上所述的基于反向拍卖的任务分配算法,可以得出最终的任务分配和报酬方案。

本发明空间众包中隐私保护的任务分配方法所使用到的符号标识符汇总表:

整个模型涉及三方实体:

a、空间众包平台

空间众包平台作为空间众包系统中的核心所在,承担着发布任务、接收众包工人数据、生成任务分配方案、生成工人奖励方案、反馈任务执行结果等职责。空间众包平台在生成任务分配方案时,通常是着眼于最大化某目标函数,例如最大化总分配任务数量、最大化正确分配的任务数量、最大化任务预算开销之差、最大化任务接受度等。

b、代理商

代理商是引入的半诚实第三方云服务,它通过提供一些辅助的密码学服务,如密钥生成和分发等,来帮助平台和工人进行隐私保护的任务分配。

c、工人

工人指的是携带移动设备(如手机)的用户,是空间众包系统的主要参与者。其主要有位置、上线/下线时间、负荷等基本属性。

优选地,整个方法都是基于半可信的安全模型,即每个参与方一方面能够完全按照协议要求完成自己相应的职责,另一方面也会试图去推断其他参与方的隐私数据。半诚实模型在实际生活中是十分合理的,因为每个参与方都愿意遵守众包系统的执行协议,并从中获益。

优选地,步骤(1)中的所述的旅行开销数据不再由空间众包平台根据工人位置计算,而是由工人自己计算并发送给空间众包平台。这一转变带来了四点好处:①将工人位置泛化为距离任务点一定距离的圆周上,一定程度上保护了工人位置隐私②考虑了工人的意愿问题③考虑了工人的多样性问题④降低了空间众包平台的计算量。

优选地,步骤(1)中的基于匿名的数据收集协议,是基于一种位异或同态密码系统和不经意传输协议。该协议仅使用位异或操作对数据进行加解密,避免了同态加密、对称加密、不对称加密中的耗时操作,显著提高了时空效率。

优选地,步骤(2)中任务分配问题是一个np-hard问题,使用一种贪心算法来求近似解,可以以较小的时空开销,计算出十分接近于精确解的结果。

本发明一种空间众包中隐私保护的任务分配方法的有益效果是:

一、基于半可信的安全模型,可用性更好;

二、引入旅行开销概念,更好反应了工人的意愿和多样性;

三、基于匿名的数据收集协议,结合了位异或同态密码和不经意传输协议,以很小的时空开销,完成了数据的加解密,运行效率极高,且安全性也有保障;

四、基于反向拍卖的任务分配算法,保证了工人的诚实性。

综上所述,本发明的空间众包中隐私保护的任务分配方法,使用基于匿名的数据收集协议来保证工人位置数据的安全性,使用基于反向拍卖的任务分配算法来保证工人的诚实性,具体来说,基于匿名的数据收集协议是基于半可信模型,使用位异或同态密码和不经意传输协议,能够以很小的计算开销完成数据加解密;基于反向拍卖的任务分配算法是使用贪心策略,在保证工人诚实性的前提下,生成任务分配和报酬方案,有着高安全性、高效性的优点,在空间众包领域有着极其光明的应用前景。

以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1