一种隐私信息处置方法、装置及系统与流程

文档序号:17235162发布日期:2019-03-30 08:19阅读:156来源:国知局
一种隐私信息处置方法、装置及系统与流程

本发明实施例涉及但不限于信息技术领域,尤指一种隐私信息处置方法、装置及系统。



背景技术:

随着信息技术和网络技术持续、快速发展,相关应用广泛普及和个性化服务不断演进,大型的互联网公司在提供服务的过程中积累了海量数据,这些数据频繁跨境、跨系统、跨生态圈交互已成为常态,造成了隐私信息在不同信息系统中有意或者无意存留,而被积累的数据中包含了大量用户隐私信息。使得用户在享受工作、生活、学习等方面的便利的同时,其数据在数据收集、共享、存储、分析等过程中面临泄漏风险,严重地威胁了用户的隐私安全。

信息技术在提供便捷的服务时,服务提供商在不断的获取着用户的隐私信息。在服务提供商强大的计算、存储、处理能力下,看似非敏感的用户信息会被加以利用,最终分析得到敏感的隐私,严重地威胁了用户的隐私安全。例如,用户在查询身边特殊类疾病的医院,则会被推测该人患有某类特殊性疾病,一旦该信息暴露可能导致该用户被歧视或者特殊非道德的对待。



技术实现要素:

本发明实施例提供了一种隐私信息处置方法、装置及系统,能够提高提高用户的隐私安全。

本发明实施例提供了一种隐私信息处置方法,包括以下步骤至少之一:

构建第一请求信息的第一隐私信息向量和对应的第一隐私属性向量;

根据第一请求信息的应用场景和第一隐私属性向量选择第一隐私信息向量的隐私保护算法;

采用所述隐私保护算法对第一请求信息的第一隐私信息向量进行隐私保护处理得到第二隐私信息向量;根据第二隐私信息向量构建第二请求信息;其中,第二请求信息请求的内容范围大于或等于第一请求信息请求的内容范围。

在本发明实施例中,该方法还包括:

接收到所述第二请求信息请求的内容;

从所述第二请求信息请求的内容中筛选出所述第一请求信息请求的内容。

在本发明实施例中,所述构建第一隐私属性向量包括:

根据所述第一请求信息的应用场景确定所述第一隐私信息向量的隐私信息分量的重要程度;

根据第一隐私信息向量的隐私信息分量的重要程度确定对应的第一隐私属性向量的隐私属性分量。

在本发明实施例中,所述根据第一请求信息的应用场景确定第一隐私信息向量的隐私信息分量的重要程度包括:

在预先设置的应用场景、隐私信息分量和重要程度之间的第一对应关系中,查找所述第一请求信息的应用场景、所述第一隐私信息向量的隐私信息分量对应的重要程度。

在本发明实施例中,所述根据第一隐私信息向量的隐私信息分量的重要程度确定对应的第一隐私属性向量的隐私属性分量包括:

在预先设置的隐私信息分量的重要程度和隐私属性分量的隐私保护程度之间的第二对应关系中,查找所述第一隐私信息向量的隐私信息分量的重要程度对应的隐私属性分量的隐私保护程度。

在本发明实施例中,所述根据第一请求信息的应用场景和第一隐私属性向量选择第一隐私信息向量的隐私保护算法包括:

在预先设置的应用场景、隐私属性分量和隐私保护算法之间的第三对应关系中,查找所述第一请求信息的应用场景和所述第一隐私信息向量的隐私信息分量对应的所述第一隐私属性向量的隐私属性分量对应的隐私保护算法;

从查找到的隐私保护算法中选择复杂度与设备能力相匹配,且安全效能分析结果满足预设条件的隐私保护算法作为所述第一隐私信息向量的隐私信息分量的隐私保护算法;

所述采用所述隐私保护算法对第一请求信息的第一隐私信息向量进行隐私保护处理得到第二隐私信息向量包括:

采用所述第一隐私信息向量的隐私信息分量的隐私保护算法对所述第一隐私信息向量的隐私信息分量进行隐私保护处理得到所述第二隐私信息向量的隐私信息分量。

在本发明实施例中,所述根据第二隐私信息向量构建第二请求信息包括:

将所述第二隐私信息向量的隐私信息分量所指示的部分或全部范围对应的隐私信息重新组合得到所述第二请求信息;

或者,将所述第二隐私信息向量的隐私信息分量所指示的部分或全部范围对应的隐私信息和所述第一请求信息中的非隐私信息重新组合得到所述第二请求信息。

本发明实施例提出了一种隐私信息处置装置,包括以下模块至少之一:

构建模块,用于构建第一请求信息的第一隐私信息向量和对应的第一隐私属性向量;

隐私保护算法选择模块,用于根据第一请求信息的应用场景和第一隐私属性向量选择第一隐私信息向量的隐私保护算法;

隐私保护处理模块,用于采用所述隐私保护算法对第一请求信息的第一隐私信息向量进行隐私保护处理得到第二隐私信息向量;根据第二隐私信息向量构建第二请求信息;其中,第二请求信息请求的内容范围大于或等于第一请求信息请求的内容范围。

本发明实施例提出了一种隐私信息处置装置,包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令被所述处理器执行时,实现上述任一种隐私信息处置方法的至少之一步骤。

本发明实施例提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种隐私信息处置方法的至少之一步骤。

本发明实施例提出了一种隐私信息处置系统,包括:

构建模块,用于构建第一请求信息的第一隐私信息向量和对应的第一隐私属性向量;

隐私保护算法选择模块,用于根据第一请求信息的应用场景和第一隐私属性向量选择第一隐私信息向量的隐私保护算法;

隐私保护处理模块,用于采用所述隐私保护算法对第一请求信息的第一隐私信息向量进行隐私保护处理得到第二隐私信息向量;根据第二隐私信息向量构建第二请求信息;其中,第二请求信息请求的内容范围大于或等于第一请求信息请求的内容范围;

其中,所述构建模块、隐私保护算法选择模块和隐私保护处理模块设置在不同的设备中。

本发明实施例包括以下步骤至少之一:构建第一请求信息的第一隐私信息向量和第一隐私属性向量,确定第一隐私信息向量和第一隐私属性向量之间的关联关系;根据第一隐私属性向量和关联关系选择至少一个隐私保护算法;采用所述隐私保护算法对第一请求信息的第一隐私信息向量进行隐私保护处理得到第二隐私信息向量;根据第二隐私信息向量构建第二请求信息;其中,第二请求信息请求的内容范围大于或等于第一请求信息请求的内容范围。本发明实施例基于第一请求信息构建第二请求信息,第二请求信息请求的内容范围大于或等于第一请求信息请求的内容范围,对用户请求的内容进行隐私保护,从而提高了用户的隐私安全。

首先,根据应用场景和隐私信息的不同,实现对隐私属性感知的隐私保护方法;其次,本发明实施例考虑到了隐私信息和隐私属性的关联关系,合理的选取了隐私保护算法,对用户的隐私信息进行了保护;再次,本发明实施例根据用户的第一信息请求进行隐私保护操作,生成经过隐私处理后的第二请求信息,保证第二信息请求发送给服务提供商时不会泄露用户的隐私信息同时用户可以享用相应的服务;最后,在实现隐私保护的方法中,全方位的考虑到应用场景、隐私信息、隐私属性、用户的设备能力以及所选择该类算法复杂度和安全性能是否达到预设值,实现细粒度的隐私保护方法,全方位的保护用户的隐私信息。

本发明实施例的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例而了解。本发明实施例的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明实施例技术方案的进一步理解,并且构成说明书的一部分,与本发明实施例的实施例一起用于解释本发明实施例的技术方案,并不构成对本发明实施例技术方案的限制。

图1为本发明一个实施例提出的隐私信息处置方法的流程图;

图2为本发明另一个实施例提出的隐私信息处置装置的结构组成示意图。

具体实施方式

下文中将结合附图对本发明实施例进行详细说明。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互任意组合。

在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

参见图1,本发明一个实施例提出了一种隐私信息处置方法,包括以下步骤至少之一:

步骤100、构建第一请求信息的第一隐私信息向量和对应的第一隐私属性向量。

在本发明实施例中,第一请求信息包含了用于获取用户请求的内容的信息。例如,用户想要获取当前位置周围的餐馆,则第一请求信息包含当前位置信息、第一预设范围和餐馆,用户请求的内容包括以当前位置为中心的第一预设范围内的餐馆。

在本发明实施例中,第一隐私信息向量是指由至少一个隐私信息分量构成的向量,隐私信息分量是指符号化的隐私信息中信息量的、不可分割的、彼此不相交的原子信息。

其中,隐私信息是指满足以下至少之一条件的个人信息:

信息生成者不愿他人知道;

他人不便知道;

信息生成者只愿在本人认可的人群范围内且本人认可的传播方式传播。

其中,隐私信息包括请求信息中的至少之一,即例如,上述用户想要获取当前位置周围的餐馆的例子中,隐私信息包括以下至少之一:当前位置信息、第一预设范围和餐馆。

其中,符号化原子信息是用字母或数学符号来代表原子信息。例如,将当前位置信息符号化为loc。

其中,原子信息是信息的最小单位。原子信息类型包括但不限于以下至少之一:文本、音频、视频、图像。

在本发明实施例中,第一隐私属性向量是由至少一个隐私属性分量构成的向量,隐私属性分量是指符号化的隐私属性。

其中,隐私属性分量是指对下标与隐私属性分量相同的隐私信息分量的保护程度。

在本发明实施例中,第一隐私属性向量实现了对隐私信息的保护程度进行量化和抽象,因不同的隐私信息和不同的应用场景,所需要的隐私保护程度不同,故而第一隐私属性向量是对应用场景和隐私信息的权衡。

在本发明实施例中,构建第一隐私属性向量包括:

根据第一请求信息的应用场景确定第一隐私信息向量的隐私信息分量的重要程度;

根据第一隐私信息向量的隐私信息分量的重要程度确定对应的第一隐私属性向量的隐私属性分量。

其中,隐私信息分量的重要程度越高,对应的第一隐私属性向量中的隐私属性分量的隐私保护程度越高,隐私信息分量的重要程度越低,对应的第一隐私属性向量中的隐私属性分量的隐私保护程度越低。

其中,根据第一请求信息的应用场景确定第一隐私信息向量的隐私信息分量的重要程度包括:

在预先设置的应用场景、隐私信息分量和重要程度之间的第一对应关系中,查找第一请求信息的应用场景、第一隐私信息向量的隐私信息分量对应的重要程度。

其中,不同应用场景的同一隐私信息分量的重要程度可能相同,也可能不同。例如,在支付场景中,隐私信息分量的重要程度为:直接信息>间接信息>其他信息。

其中,直接信息包括但不限于包括:用户的身份证号码、账号和密码、姓名、职业、住址。

其中,间接信息包括但不限于包括:停留地的位置信息、查询内容、点赞的次数、购买过的商品。

其中,根据第一隐私信息向量的隐私信息分量的重要程度确定对应的第一隐私属性向量的隐私属性分量包括:

在预先设置的隐私信息分量的重要程度和隐私属性分量的隐私保护程度之间的第二对应关系中,查找第一隐私信息向量的隐私信息分量的重要程度对应的隐私属性分量的隐私保护程度。

例如,如果隐私信息分量为用户的账户密码,说明重要程度较高,则关联隐私保护程度高的隐私属性分量;如果隐私信息分量的为某个菜品的评价,说明重要程度较低,则关联隐私保护程度低的隐私属性分量。

其中,隐私属性分量的数值的取值范围为[1,x],1表示隐私属性最低,随着数值的增加隐私属性逐渐增加,即x(如10)表示隐私属性最高。当隐私属性较低时,表示隐私保护程度较低,反之,当隐私属性较高时,表示隐私保护程度较高。隐私属性分量所构成的隐私属性向量是隐私保护算法选取过程中的一项参考信息。

步骤101、根据第一请求信息的应用场景和第一隐私属性向量选择第一隐私信息向量的隐私保护算法。

在本发明实施例中,根据第一请求信息的应用场景和第一隐私属性向量选择第一隐私信息向量的隐私保护算法包括:

根据以下信息选择第一隐私信息向量的隐私保护算法:

第一请求信息的应用场景、第一隐私属性向量、设备能力、隐私保护算法的复杂度、隐私保护算法的安全效能分析结果。

其中,选择第一隐私信息向量的隐私保护算法包括:

在预先设置的应用场景、隐私属性分量和隐私保护算法之间的第三对应关系中,查找第一请求信息的应用场景和第一隐私信息向量的隐私信息分量对应的第一隐私属性向量的隐私属性分量对应的隐私保护算法;

从查找到的隐私保护算法中选择复杂度与设备能力相匹配,且安全效能分析结果满足预设条件的隐私保护算法作为第一隐私信息向量的隐私信息分量的隐私保护算法。

其中,预设条件是安全效能分析中每一个分析项的衡量标准,衡量该分析项是否达到预设的要求,该要求为一个取值范围,如果安全效能分析的值属于预设的取值范围内,则说明该隐私保护算法可用;如果安全效能分析的值属于预设的取值范围外,则说明该隐私保护算法不可用。

其中,隐私保护算法的复杂度与设备能力相匹配,指的是该设备具有运行该隐私保护算法的能力,如果设备能力的评估值高于设定的阈值,则匹配较高复杂度的隐私保护算法,如果设备能力的评估值低于或等于设定的阈值,则匹配较低的隐私保护算法。

例如,在支付场景中,第一隐私属性向量值高,设备的处理能力强,通信能力优,则选择基于加密的隐私保护算法。

其中,应用场景包括但不限于以下任一种:共享场景、查询场景、支付场景。上述应用场景的隐私保护程度的排序为:支付场景>共享场景>查询场景。

其中,隐私保护算法包括但不限于以下任一种:基于加密的隐私保护算法、基于扰乱的隐私保护算法、基于混淆的隐私保护算法、基于模糊的隐私保护算法。

上述隐私保护算法的隐私保护程度排序为:基于加密的隐私保护算法>基于扰乱的隐私保护算法>基于混淆的隐私保护算法>基于模糊的隐私保护算法。

其中,设备能力包括但不限于:存储能力、处理能力、通信能力(信号强度)、电量、联网接入模式(移动蜂窝网络和wi-fi)。上述设备能力的排序为:处理能力>通信能力>联网接入模式>电量>存储能力。设备能力的评估值根据上述内容进行加权赋值,通过权值求和与阈值进行比较。

其中,联网接入模式直接关乎到用户的通信开销,故而在移动蜂窝网络的情况下,选择通信开销较小的隐私保护算法,在wi-fi情况下则不需重点考虑隐私保护算法的通信开销。同理,在设备具有高存储、强处理、强信号和高电量的性能时,则注重保护隐私信息,旨在提供最安全的隐私保护。

例如,重要程度较高的隐私信息分量,且对计算、通信和存储有足够能力的设备,则分配基于加密的隐私保护算法;重要程度较低的隐私信息分量,且对计算、通信和存储能力有限的设备,则分配基于模糊的隐私保护算法。

在本发明实施例中,隐私保护算法的复杂度包括但不限于:时间复杂度、空间复杂度和通信开销。

其中,时间复杂度为执行时间,是从用户发起请求直到隐私保护算法输出保护后数据结束所消耗的时间;

空间复杂度为存储空间,是在整个计算和处理的过程中是占据的存储空间的大小;

通信开销则是从隐私保护算法输出的数据大小来决定通信开销。

在本发明实施例中,隐私保护算法的安全效能分析结果包括但不限于以下任一个:

概率、信息熵、期望、方差。

其中,概率是指隐私信息被暴露的概率。概率值越高,表示隐私信息被保护的程度越低,安全效能越低;概率值越低,表示隐私信息被保护的程度越高,安全效能越高。

例如,在基于位置服务场景中,概率的获取可以通过设置接入点采集该位置的访问量,或者从现有的第三方获取,如通过谷歌地图的应用程序编程接口(api,applicationprogramminginterface)来获取位置的访问量。假设获取到某个地图的访问量为m,在该地图中位置loci的访问量为mi,则该位置loci的概率qi为:

其中,信息熵是指隐私信息的不确定性。信息熵值越大,表示隐私信息的不确定性越高,则表示安全效能越高;信息熵值越小,表示隐私信息的不确定性越低,则表示安全效能越低。信息熵是通过信息熵的定义获得,即:

其中,h为信息熵,pi为隐私信息si的概率,n为隐私信息的数量。

其中,期望是指隐私信息所达到的隐私保护期望值。期望值越大,表示隐私信息的保护程度越高,安全效能越高;期望值越低,表示隐私信息的保护程度越低,安全效能越低。期望是通过其定义获得,即:

其中,pi为隐私信息si的概率,xi为隐私信息si对应的隐私信息向量。

其中,方差是指隐私信息之间的偏离程度。方差越大,表示隐私信息之间的偏离程度越大,隐私信息之间的关联度就越低,隐私信息被保护的程度就越高,安全效能越高;方差越小,表示隐私信息之间的偏离程度越小,隐私信息之间的关联度就越高,隐私信息被保护的程度就越低,安全效能越低。方差是通过其定义获得,即:

d=e{x-e(x)2}

其中,x为对应的隐私信息向量,e为期望。

步骤102、采用所述隐私保护算法对第一请求信息的第一隐私信息向量进行隐私保护处理得到第二隐私信息向量;根据第二隐私信息向量构建第二请求信息;其中,第二请求信息请求的内容范围大于或等于第一请求信息请求的内容范围。

在本发明实施例中,采用选择的隐私保护算法对第一隐私信息向量进行隐私保护处理得到第二隐私信息向量包括:

采用所述第一隐私信息向量的隐私信息分量的隐私保护算法对所述第一隐私信息向量的隐私信息分量进行隐私保护处理得到所述第二隐私信息向量的隐私信息分量。

其中,隐私保护算法包括以下至少之一:加密、扰乱、混淆、模糊。

其中,加密是指对隐私信息分量进行加密处理。例如,用户查询账户信息,请求信息包括账户和密码。那么,可以通过加密算法对用户的隐私信息分量进行加密保护。

其中,扰乱是指在隐私信息分量中添加噪声,从而干扰隐私信息的暴露。例如,对位置信息采用差分扰乱方法进行扰乱处理,即将位置信息添加平面拉普拉斯噪声,使得攻击者无法通过得到的信息分析得到用户的真实位置信息。

其中,混淆是指添加虚假的隐私信息分量,让攻击者无法辨别哪一个隐私信息分量为用户真实的隐私信息。例如,用户请求附近的餐馆,则请求信息包括当前位置信息、第一预设范围和餐馆,用户请求的内容包括以当前位置为中心的第一预设范围内的餐馆。那么,可以生成多个虚假的位置信息来实现混淆操作。

其中,模糊是指对隐私信息分量进行模糊化处理,即扩大隐私信息分量所指示的范围。例如,用户请求十字路口附近的公交站,则请求信息包括十字路口的位置信息、第一预设范围和公交站,用户请求的内容包括以十字路口的位置为中心的第一预设范围内的公交站。那么,可以对十字路口的位置信息进行模糊处理,即将十字路口的位置扩大为一个区域,从而实现模糊化保护。

在本发明实施例中,根据第二隐私信息向量构建第二请求信息包括:将第二隐私信息向量的隐私信息分量所指示的部分或全部范围对应的隐私信息重新组合得到第二请求信息;

或者,将第二隐私信息向量的隐私信息分量所指示的部分或全部范围对应的隐私信息和第一请求信息中的非隐私信息重新组合得到第二请求信息。

第二请求信息可以是一个,也可以是两个或两个以上。

在本发明另一个实施例中,该方法还包括:

接收到所述第二请求信息请求的内容;从所述第二请求信息请求的内容中筛选出所述第一请求信息请求的内容。

也就是说,在接收到第二请求信息请求的内容时,可以将第二请求信息请求的内容呈现给用户,由用户选择有用的内容;或者,从第二请求信息请求的内容中筛选出第一请求信息请求的内容,将第一请求信息请求的内容呈现给用户。

其中,筛选的过程只需要根据第一请求信息请求的内容和第二请求信息请求的内容进行匹配,所匹配得到的内容即呈献给用户的内容。例如,用户第一请求信息请求的内容为100米以内的餐馆,第二请求信息请求的内容为500米以内的餐馆,只需匹配第一请求信息中100米的请求范围,将100米以内的餐馆进行呈现,而100米以外至500米的信息将不予呈现。

本发明实施例基于第一请求信息构建第二请求信息,第二请求信息请求的内容范围大于第一请求信息请求的内容范围,对用户请求的内容进行隐私保护,从而提高了用户的隐私安全。

下面通过具体示例对本发明实施例的隐私信息保护方法进行详细的说明,所举的例子不用于限定本发明实施例的隐私信息保护方法的保护范围。

示例1

本示例中,第一终端向第一服务器请求数据,该方法包括:

步骤200、构建第一查询请求的第一隐私信息向量和对应的第一隐私属性向量。

本步骤中,第一查询请求包含了用户查询数据所需要的信息。例如,监管部门作为用户需要请求企业的相关数据信息来对该企业进行监管,为了避免企业对数据进行篡改,然而监管部门并不想要企业知道要查询的具体数据是什么,则监管部门需要对第一查询请求进行隐私保护。其中,第一隐私信息向量i=<id,time,type>,其中id为用户身份,time为时间戳,type为查询的数据类型,用来表示这个数据是什么(例如表示数据是成本价,销售额,环保指标等)。

本步骤中,隐私属性是指对隐私信息的保护程度,第一隐私属性向量为a=<0,0,9>,9对应较高的隐私保护程度,因为用户向第一服务器发送的第一查询请求不能让第一服务器提前获知,从而发送给第一服务器的第一查询请求中的type对应的隐私保护程度为9;其中0表示对用户的身份和时间戳不进行保护。

其中,可以根据第一服务器的数据集中已有的数据类型的隐私重要程度为每个数据类型分配权重,最后通过分配的权重概率性作为对应的type的隐私保护程度,第一服务器数据集的数据类型是公开的。例如,两项数据,第一项权重是2,第二项权重是1,那输出第一项概率就是三分之二,第二项概率就是三分之一。

步骤201、根据第一查询请求的应用场景和第一隐私属性向量选择第一隐私信息向量的隐私保护算法。

本步骤中,根据以下信息选择第一隐私信息向量的隐私保护算法:

第一查询请求的应用场景、第一隐私属性向量、设备能力、隐私保护算法的复杂度、隐私保护算法的安全效能分析结果。

其中,应用场景为数据查询场景,用户选择的隐私保护算法为基于差分的隐私保护算法,即使用差分隐私保护算法对第一隐私信息分量进行隐私保护处理。

其中,第一隐私属性向量中隐私保护程度9对应dp。

其中,dp为标准差分隐私(differentialprivacy)。标准差分隐私是指在给定查询请求的条件下,对于任意一对相邻数据集,攻击者都无法从差分隐私算法输出的结果中推断出数据的来源。

其中,相邻数据集是指定义域相同,除了一个元素不同,其他元素都相同的一对任意数据集。

其中,定义域是指数据集中每一类数据的取值范围。

本步骤中,终端设备能力是指终端设备的存储能力,处理能力,通信能力。

其中,存储能力是指终端设备对查询请求、经过差分处理后的查询请求的存储能力。

其中,处理能力是指终端设备根据隐私保护算法生成差分处理后的查询请求的计算能力。

其中,通信能力是指终端设备发送经过差分处理后的查询请求给服务器的能力。

本步骤中,隐私保护算法的复杂度是指隐私保护算法的时间复杂度,空间复杂度,传输开销。

其中,时间复杂度是指隐私保护算法运行的时间开销。

其中,空间复杂度是指隐私保护算法运行的空间开销。

其中,传输开销是指用户上传给服务器的加噪后的隐私数据的大小。

本步骤中,安全效能分析结果主要以概率表示,通过计算被差分隐私算法保护的用户数据在一对相邻数据集上得到的扰动结果相同的概率来衡量隐私保护程度,具体形式如下:

其中d1和d2是指一对相邻数据集,s是指差分隐私算法输出值域的任意子集,m是指差分隐私算法保护。

步骤202、采用所述隐私保护算法对第一查询请求的第一隐私信息向量进行隐私保护处理得到第二隐私信息向量;根据第二隐私信息向量构建第二查询请求;其中,第二查询请求查询的内容范围大于或等于第一查询请求查询的内容范围。

本步骤中,第二隐私信息向量是指第一隐私向量i经过用户差分隐私处理后得到的隐私信息向量i'。

其中,第二隐私信息向量的数据的查询请求范围大于第一隐私信息向量的查询请求范围。

上述步骤200~202可以在第一终端中执行,也可以在至少一个第二终端或第二服务器中执行,也可以在第一终端和至少一个第二终端或第二服务器中执行。

示例2

该方法包括:

步骤300、构建第一请求信息的第一隐私信息向量和对应的第一隐私属性向量。

本步骤中,第一请求信息是指单次发送的信息共享的请求信息。

本步骤中,隐私信息包括:用户身份、时间戳、位置信息、查询内容。那么,第一隐私信息向量i=<id,t,loc,que>;其中,id为用户身份,t为时间戳,loc为位置信息,que为查询内容。

本步骤中,隐私属性是指对隐私信息的保护程度,即第一隐私属性向量a=<0,0,3,4>。其中0表示对用户的身份和时间戳不进行保护,因为在本实例中假设用户使用是昵称和实时请求。

步骤301、根据第一请求信息的应用场景和第一隐私属性向量选择第一隐私信息向量的隐私保护算法。

本步骤中,根据以下信息选择第一隐私信息向量的隐私保护算法:

第一请求信息的应用场景、第一隐私属性向量、设备能力、隐私保护算法的复杂度、隐私保护算法的安全效能分析结果。

根据第一属性向量a=<0,0,3,4>,其中数值3和4系统推荐选择基于混淆的隐私保护算法,故而选择k匿名的隐私保护算法来保护用户的位置隐私,l多样性的隐私保护算法来保护用户的查询内容隐私。

k匿名和l多样性的隐私保护算法属于基于混淆的隐私保护算法,即根据隐私信息向量中的位置信息的概率,在位置地图中选择具有相同概率的位置信息作为匿名化位置信息,得到k-1个虚假的位置信息和l-1个虚假的查询内容。

其中,位置信息的概率可以通过两种方法获得,第一种设置接入点,定期采集位置上的发送信息的数目,第二种是通过谷歌地图的应用程序编程接口(api,applicationprogramminginterface)可以直接从第三方获取该位置信息发送的数目。通过以上任意一种方法得到该区域在一段时间内的信息发送数目,通过比值计算得到所需位置信息的概率,地图中位置loci的概率计算如下:

其中,m为获取到某个地图的信息发送数目,在该地图中位置loci的信息发送数目为mi。

本步骤中,隐私保护算法的复杂度是指隐私保护算法的时间复杂度、空间复杂度、通信开销,安全效能分析结果是指隐私度量。

其中,时间复杂度是指隐私保护算法运行的执行时间。

其中,空间复杂度是指隐私保护算法运行的存储空间。

其中,通信开销是经过隐私保护算法后生成的k-1个虚假位置信息,l-1个虚假的查询内容信息和用户真实的位置信息、查询内容总体的信息大小。其中,隐私度量选取基于信息熵实现安全效能分析。其中,位置信息的熵值计算:

其中pi为位置loci的查询概率。因为选取的k-1个虚假的位置信息和用户真实的位置信息具有相同的概率,根据熵值的计算公式得到熵值最大(信息熵的特性),从而说明信息的不确定性最高,隐私保护效能最佳。

查询内容的熵值计算:

其中qi为查询内容quei的查询概率。因为选取的l-1个虚假的查询内容和用户真实的查询内容具有相同的概率,根据熵值的计算公式得到熵值最大(信息熵的特性),从而说明信息的不确定性最高,隐私保护效能最佳。

步骤302、采用所述隐私保护算法对第一请求信息的第一隐私信息向量进行隐私保护处理得到第二隐私信息向量;根据第二隐私信息向量构建第二请求信息;其中,第二请求信息请求的内容范围大于第一请求信息请求的内容范围。

上述步骤300~303可以在第一终端中执行,也可以在至少一个第二终端或第二服务器中执行,也可以在第一终端和至少一个第二终端或第二服务器中执行。

参见图2,本发明另一个实施例提出了一种隐私信息处理装置,包括以下模块至少之一:

构建模块201,用于构建第一请求信息的第一隐私信息向量和对应的第一隐私属性向量;

隐私保护算法选择模块202,用于根据第一请求信息的应用场景和第一隐私属性向量选择第一隐私信息向量的隐私保护算法;

隐私保护处理模块203,用于采用所述隐私保护算法对第一请求信息的第一隐私信息向量进行隐私保护处理得到第二隐私信息向量;根据第二隐私信息向量构建第二请求信息;其中,第二请求信息请求的内容范围大于或等于第一请求信息请求的内容范围。

上述构建模块201、隐私保护算法选择模块202和隐私保护处理模块203可以设置在不同的设备中,也可以设置在同一设备中。

在本发明实施例中,第一请求信息包含了用于获取用户请求的内容的信息。例如,用户想要获取当前位置周围的餐馆,则第一请求信息包含当前位置信息、第一预设范围和餐馆,用户请求的内容包括以当前位置为中心的第一预设范围内的餐馆。

在本发明实施例中,第一隐私信息向量是指由至少一个隐私信息分量构成的向量,隐私信息分量是指符号化的隐私信息中信息量的、不可分割的、彼此不相交的原子信息。

其中,隐私信息是指满足以下至少之一条件的个人信息:

信息生成者不愿他人知道;

他人不便知道;

信息生成者只愿在本人认可的人群范围内且本人认可的传播方式传播。

其中,隐私信息包括请求信息中的至少之一,即例如,上述用户想要获取当前位置周围的餐馆的例子中,隐私信息包括以下至少之一:当前位置信息、第一预设范围和餐馆。

其中,符号化原子信息是用字母或数学符号来代表原子信息。例如,将当前位置信息符号化为loc。

其中,原子信息是信息的最小单位。原子信息类型包括但不限于以下至少之一:文本、音频、视频、图像。

在本发明实施例中,第一隐私属性向量是由至少一个隐私属性分量构成的向量,隐私属性分量是指符号化的隐私属性。

其中,隐私属性分量是指下标与隐私属性分量相同的隐私信息分量的保护程度。

在本发明实施例中,第一隐私属性向量实现了对隐私信息的保护程度进行量化和抽象,因不同的隐私信息和不同的应用场景,所需要的隐私保护程度不同,故而第一隐私属性向量是对应用场景和隐私信息的权衡。

在本发明实施例中,构建模块201具体用于采用以下方式实现构建第一隐私属性向量:

根据第一请求信息的应用场景确定第一隐私信息向量的隐私信息分量的重要程度;

根据第一隐私信息向量的隐私信息分量的重要程度确定对应的第一隐私属性向量的隐私属性分量。

其中,隐私信息分量的重要程度越高,对应的第一隐私属性向量中的隐私属性分量的隐私保护程度越高,隐私信息分量的重要程度越低,对应的第一隐私属性向量中的隐私属性分量的隐私保护程度越低。

其中,构建模块201具体用于采用以下方式实现根据第一请求信息的应用场景确定第一隐私信息向量的隐私信息分量的重要程度:

在预先设置的应用场景、隐私信息分量和重要程度之间的第一对应关系中,查找第一请求信息的应用场景、第一隐私信息向量的隐私信息分量对应的重要程度。

其中,不同应用场景的同一隐私信息分量的重要程度可能相同,也可能不同。例如,在支付场景中,隐私信息分量的重要程度为:直接信息>间接信息>其他信息。

其中,直接信息包括但不限于包括:用户的身份证号码、账号和密码、姓名、职业、住址。

其中,间接信息包括但不限于包括:停留地的位置信息、查询内容、点赞的次数、购买过的商品。

其中,构建模块201具体用于采用以下方式实现根据第一隐私信息向量的隐私信息分量的重要程度确定对应的第一隐私属性向量的隐私属性分量:

在预先设置的隐私信息分量的重要程度和隐私属性分量的隐私保护程度之间的第二对应关系中,查找第一隐私信息向量的隐私信息分量的重要程度对应的隐私属性分量的隐私保护程度。

例如,如果隐私信息分量为用户的账户密码,说明重要程度较高,则关联隐私保护程度高的隐私属性分量;如果隐私信息分量的为某个菜品的评价,说明重要程度较低,则关联隐私保护程度低的隐私属性分量。

其中,隐私属性分量的数值的取值范围为[1,x],1表示隐私属性最低,随着数值的增加隐私属性逐渐增加,即x(如10)表示隐私属性最高。当隐私属性较低时,表示隐私保护程度较低,反之,当隐私属性较高时,表示隐私保护程度较高。隐私属性分量所构成的隐私属性向量是隐私保护算法选取过程中的一项参考信息。

在本发明实施例中,隐私保护算法选择模块202具体用于:

在预先设置的应用场景、隐私属性分量和隐私保护算法之间的第三对应关系中,查找第一请求信息的应用场景和第一隐私信息向量的隐私信息分量对应的第一隐私属性向量的隐私属性分量对应的隐私保护算法;

从查找到的隐私保护算法中选择复杂度与设备能力相匹配,且安全效能分析结果满足预设条件的隐私保护算法作为第一隐私信息向量的隐私信息分量的隐私保护算法。

其中,预设条件是安全效能分析中每一个分析项的衡量标准,衡量该分析项是否达到预设的要求,该要求为一个取值范围,如果安全效能分析的值属于预设的取值范围内,则说明该隐私保护算法可用;如果安全效能分析的值属于预设的取值范围外,则说明该隐私保护算法不可用。

其中,隐私保护算法的复杂度与设备能力相匹配,指的是该设备具有运行该隐私保护算法的能力,如果设备能力的评估值高于设定的阈值,则匹配较高复杂度的隐私保护算法,如果设备能力的评估值低于或等于设定的阈值,则匹配较低的隐私保护算法。

例如,在支付场景中,第一隐私属性向量值高,设备的处理能力强,通信能力优,则选择基于加密的隐私保护算法。

其中,应用场景包括但不限于以下任一种:共享场景、查询场景、支付场景。上述应用场景的隐私保护程度的排序为:支付场景>共享场景>查询场景。

其中,隐私保护算法包括但不限于以下任一种:基于加密的隐私保护算法、基于扰乱的隐私保护算法、基于混淆的隐私保护算法、基于模糊的隐私保护算法。

上述隐私保护算法的隐私保护程度排序为:基于加密的隐私保护算法>基于扰乱的隐私保护算法>基于混淆的隐私保护算法>基于模糊的隐私保护算法。

其中,设备能力包括但不限于:存储能力、处理能力、通信能力(信号强度)、电量、联网接入模式(移动蜂窝网络和wi-fi)。上述设备能力的排序为:处理能力>通信能力>联网接入模式>电量>存储能力。设备能力的评估值根据上述内容进行加权赋值,通过权值求和与阈值进行比较。

其中,联网接入模式直接关乎到用户的通信开销,故而在移动蜂窝网络的情况下,选择通信开销较小的隐私保护算法,在wi-fi情况下则不需重点考虑隐私保护算法的通信开销。同理,在设备具有高存储、强处理、强信号和高电量的性能时,则注重保护隐私信息,旨在提供最安全的隐私保护。

例如,重要程度较高的隐私信息分量,且对计算、通信和存储有足够能力的设备,则分配基于加密的隐私保护算法;重要程度较低的隐私信息分量,且对计算、通信和存储能力有限的设备,则分配基于模糊的隐私保护算法。

在本发明实施例中,隐私保护算法的复杂度包括但不限于:时间复杂度、空间复杂度和通信开销。

其中,时间复杂度为执行时间,是从用户发起请求直到隐私保护算法输出保护后数据结束所消耗的时间;

空间复杂度为存储空间,是在整个计算和处理的过程中是占据的存储空间的大小;

通信开销则是从隐私保护算法输出的数据大小来决定通信开销。

在本发明实施例中,隐私保护算法的安全效能分析结果包括但不限于以下任一个:

概率、信息熵、期望、方差。

其中,概率是指隐私信息被暴露的概率。概率值越高,表示隐私信息被保护的程度越低,安全效能越低;概率值越低,表示隐私信息被保护的程度越高,安全效能越高。

例如,在基于位置服务场景中,概率的获取可以通过设置接入点采集该位置的访问量,或者从现有的第三方获取,如通过谷歌地图的应用程序编程接口(api,applicationprogramminginterface)来获取位置的访问量。假设获取到某个地图的访问量为m,在该地图中位置loci的访问量为mi,则该位置loci的概率qi为:

其中,信息熵是指隐私信息的不确定性。信息熵值越大,表示隐私信息的不确定性越高,则表示安全效能越高;信息熵值越小,表示隐私信息的不确定性越低,则表示安全效能越低。信息熵是通过信息熵的定义获得,即:

其中,h为信息熵,pi为隐私信息si的概率,n为隐私信息的数量。

其中,期望是指隐私信息所达到的隐私保护期望值。期望值越大,表示隐私信息的保护程度越高,安全效能越高;期望值越低,表示隐私信息的保护程度越低,安全效能越低。期望是通过其定义获得,即:

其中,pi为隐私信息si的概率,xi为隐私信息si对应的隐私信息向量。

其中,方差是指隐私信息之间的偏离程度。方差越大,表示隐私信息之间的偏离程度越大,隐私信息之间的关联度就越低,隐私信息被保护的程度就越高,安全效能越高;方差越小,表示隐私信息之间的偏离程度越小,隐私信息之间的关联度就越高,隐私信息被保护的程度就越低,安全效能越低。方差是通过其定义获得,即:

d=e{x-e(x)2}

其中,x为对应的隐私信息向量,e为期望。

在本发明实施例中,隐私保护处理模块203具体用于采用以下方式实现采用选择的隐私保护算法对第一隐私信息向量进行隐私保护处理得到第二隐私信息向量:

采用所述第一隐私信息向量的隐私信息分量的隐私保护算法对所述第一隐私信息向量的隐私信息分量进行隐私保护处理得到所述第二隐私信息向量的隐私信息分量。

其中,隐私保护算法包括以下至少之一:模糊、扰乱、混淆、加密。

其中,模糊是指对隐私信息分量进行模糊化处理,即扩大隐私信息分量所指示的范围。例如,用户请求十字路口附近的公交站,则请求信息包括十字路口的位置信息、第一预设范围和公交站,用户请求的内容包括以十字路口的位置为中心的第一预设范围内的公交站。那么,可以对十字路口的位置信息进行模糊处理,即将十字路口的位置扩大为一个区域,从而实现模糊化保护。

其中,扰乱是指在隐私信息分量中添加噪声,从而干扰隐私信息的暴露。例如,对位置信息采用差分扰乱方法进行扰乱处理,即将位置信息添加平面拉普拉斯噪声,使得攻击者无法通过得到的信息分析得到用户的真实位置信息。

其中,混淆是指添加虚假的隐私信息分量,让攻击者无法辨别哪一个隐私信息分量为用户真实的隐私信息。例如,用户请求附近的餐馆,则请求信息包括当前位置信息、第一预设范围和餐馆,用户请求的内容包括以当前位置为中心的第一预设范围内的餐馆。那么,可以生成多个虚假的位置信息来实现混淆操作。

其中,加密是指对隐私信息分量进行加密处理。例如,用户查询账户信息,请求信息包括账户和密码。那么,可以通过加密算法对用户的隐私信息分量进行加密保护。

在本发明实施例中,隐私保护处理模块203具体用于采用以下方式实现根据第二隐私信息向量构建第二请求信息:

将第二隐私信息向量的隐私信息分量所指示的部分或全部范围对应的隐私信息重新组合得到第二请求信息;

或者,将第二隐私信息向量的隐私信息分量所指示的部分或全部范围对应的隐私信息和第一请求信息中的非隐私信息重新组合得到第二请求信息。

第二请求信息可以是一个,也可以是两个或两个以上。

在本发明另一个实施例中,隐私保护处理模块203还用于:

接收到所述第二请求信息请求的内容;从所述第二请求信息请求的内容中筛选出所述第一请求信息请求的内容。

也就是说,在接收到第二请求信息请求的内容时,可以将第二请求信息请求的内容呈现给用户,由用户选择有用的内容;或者,从第二请求信息请求的内容中筛选出第一请求信息请求的内容,将第一请求信息请求的内容呈现给用户。

其中,筛选的过程只需要根据第一请求信息请求的内容和第二请求信息请求的内容进行匹配,所匹配得到的内容即呈献给用户的内容。例如,用户第一请求信息请求的内容为100米以内的餐馆,第二请求信息请求的内容为500米以内的餐馆,只需匹配第一请求信息中100米的请求范围,将100米以内的餐馆进行呈现,而100米以外至500米的信息将不予呈现。

本发明实施例基于第一请求信息构建第二请求信息,第二请求信息请求的内容范围大于第一请求信息请求的内容范围,对用户请求的内容进行隐私保护,从而提高了用户的隐私安全。

本发明另一个实施例提出了一种隐私信息处置装置,包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令被所述处理器执行时,实现上述任一种隐私信息处置方法的至少之一步骤。

本发明另一个实施例提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种隐私信息处置方法的至少之一步骤。

参见图2,本发明另一个实施例提出了一种隐私信息处置系统,包括:

构建模块201,用于构建第一请求信息的第一隐私信息向量和对应的第一隐私属性向量;

隐私保护算法选择模块202,用于根据第一请求信息的应用场景和第一隐私属性向量选择第一隐私信息向量的隐私保护算法;

隐私保护处理模块203,用于采用所述隐私保护算法对第一请求信息的第一隐私信息向量进行隐私保护处理得到第二隐私信息向量;根据第二隐私信息向量构建第二请求信息;其中,第二请求信息请求的内容范围大于或等于第一请求信息请求的内容范围;

其中,所述构建模块201、隐私保护算法选择模块202和隐私保护处理模块203设置在不同的设备中。

在本发明实施例中,第一请求信息包含了用于获取用户请求的内容的信息。例如,用户想要获取当前位置周围的餐馆,则第一请求信息包含当前位置信息、第一预设范围和餐馆,用户请求的内容包括以当前位置为中心的第一预设范围内的餐馆。

在本发明实施例中,第一隐私信息向量是指由至少一个隐私信息分量构成的向量,隐私信息分量是指符号化的隐私信息中信息量的、不可分割的、彼此不相交的原子信息。

其中,隐私信息是指满足以下至少之一条件的个人信息:

信息生成者不愿他人知道;

他人不便知道;

信息生成者只愿在本人认可的人群范围内且本人认可的传播方式传播。

其中,隐私信息包括请求信息中的至少之一,即例如,上述用户想要获取当前位置周围的餐馆的例子中,隐私信息包括以下至少之一:当前位置信息、第一预设范围和餐馆。

其中,符号化原子信息是用字母或数学符号来代表原子信息。例如,将当前位置信息符号化为loc。

其中,原子信息是信息的最小单位。原子信息类型包括但不限于以下至少之一:文本、音频、视频、图像。

在本发明实施例中,第一隐私属性向量是由至少一个隐私属性分量构成的向量,隐私属性分量是指符号化的隐私属性。

其中,隐私属性分量是指下标与隐私属性分量相同的隐私信息分量的保护程度。

在本发明实施例中,第一隐私属性向量实现了对隐私信息的保护程度进行量化和抽象,因不同的隐私信息和不同的应用场景,所需要的隐私保护程度不同,故而第一隐私属性向量是对应用场景和隐私信息的权衡。

在本发明实施例中,构建模块201具体用于采用以下方式实现构建第一隐私属性向量:

根据第一请求信息的应用场景确定第一隐私信息向量的隐私信息分量的重要程度;

根据第一隐私信息向量的隐私信息分量的重要程度确定对应的第一隐私属性向量的隐私属性分量。

其中,隐私信息分量的重要程度越高,对应的第一隐私属性向量中的隐私属性分量的隐私保护程度越高,隐私信息分量的重要程度越低,对应的第一隐私属性向量中的隐私属性分量的隐私保护程度越低。

其中,构建模块201具体用于采用以下方式实现根据第一请求信息的应用场景确定第一隐私信息向量的隐私信息分量的重要程度:

在预先设置的应用场景、隐私信息分量和重要程度之间的第一对应关系中,查找第一请求信息的应用场景、第一隐私信息向量的隐私信息分量对应的重要程度。

其中,不同应用场景的同一隐私信息分量的重要程度可能相同,也可能不同。例如,在支付场景中,隐私信息分量的重要程度为:直接信息>间接信息>其他信息。

其中,直接信息包括但不限于包括:用户的身份证号码、账号和密码、姓名、职业、住址。

其中,间接信息包括但不限于包括:停留地的位置信息、查询内容、点赞的次数、购买过的商品。

其中,构建模块201具体用于采用以下方式实现根据第一隐私信息向量的隐私信息分量的重要程度确定对应的第一隐私属性向量的隐私属性分量:

在预先设置的隐私信息分量的重要程度和隐私属性分量的隐私保护程度之间的第二对应关系中,查找第一隐私信息向量的隐私信息分量的重要程度对应的隐私属性分量的隐私保护程度。

例如,如果隐私信息分量为用户的账户密码,说明重要程度较高,则关联隐私保护程度高的隐私属性分量;如果隐私信息分量的为某个菜品的评价,说明重要程度较低,则关联隐私保护程度低的隐私属性分量。

其中,隐私属性分量的数值的取值范围为[1,x],1表示隐私属性最低,随着数值的增加隐私属性逐渐增加,即x(如10)表示隐私属性最高。当隐私属性较低时,表示隐私保护程度较低,反之,当隐私属性较高时,表示隐私保护程度较高。隐私属性分量所构成的隐私属性向量是隐私保护算法选取过程中的一项参考信息。

在本发明实施例中,隐私保护算法选择模块202具体用于:

根据以下信息选择第一隐私信息向量的隐私保护算法:

第一请求信息的应用场景、第一隐私属性向量、设备能力、隐私保护算法的复杂度、隐私保护算法的安全效能分析结果。

在本发明实施例中,隐私保护算法选择模块202具体用于:

在预先设置的应用场景、隐私属性分量和隐私保护算法之间的第三对应关系中,查找第一请求信息的应用场景和第一隐私信息向量的隐私信息分量对应的第一隐私属性向量的隐私属性分量对应的隐私保护算法;

从查找到的隐私保护算法中选择复杂度与设备能力相匹配,且安全效能分析结果满足预设条件的隐私保护算法作为第一隐私信息向量的隐私信息分量的隐私保护算法。

其中,预设条件是安全效能分析中每一个分析项的衡量标准,衡量该分析项是否达到预设的要求,该要求为一个取值范围,如果安全效能分析的值属于预设的取值范围内,则说明该隐私保护算法可用;如果安全效能分析的值属于预设的取值范围外,则说明该隐私保护算法不可用。

其中,隐私保护算法的复杂度与设备能力相匹配,指的是该设备具有运行该隐私保护算法的能力,如果设备能力的评估值高于设定的阈值,则匹配较高复杂度的隐私保护算法,如果设备能力的评估值低于或等于设定的阈值,则匹配较低的隐私保护算法。

例如,在支付场景中,第一隐私属性向量值高,设备的处理能力强,通信能力优,则选择基于加密的隐私保护算法。

其中,应用场景包括但不限于以下任一种:共享场景、查询场景、支付场景。上述应用场景的隐私保护程度的排序为:支付场景>共享场景>查询场景<。

其中,隐私保护算法包括但不限于以下任一种:基于加密的隐私保护算法、基于扰乱的隐私保护算法、基于混淆的隐私保护算法、基于模糊的隐私保护算法。

上述隐私保护算法的隐私保护程度排序为:基于加密的隐私保护算法>基于扰乱的隐私保护算法>基于混淆的隐私保护算法>基于模糊的隐私保护算法。

其中,设备能力包括但不限于:存储能力、处理能力、通信能力(信号强度)、电量、联网接入模式(移动蜂窝网络和wi-fi)。上述设备能力的隐私保护程度排序为:处理能力>通信能力>联网接入模式>电量>存储能力。设备能力的评估值根据上述内容进行加权赋值,通过权值求和与阈值进行比较。

其中,联网接入模式直接关乎到用户的通信开销,故而在移动蜂窝网络的情况下,选择通信开销较小的隐私保护算法,在wi-fi情况下则不需重点考虑隐私保护算法的通信开销。同理,在设备具有高存储、强处理、强信号和高电量的性能时,则注重保护隐私信息,旨在提供最安全的隐私保护。

例如,重要程度较高的隐私信息分量,且对计算、通信和存储有足够能力的设备,则分配基于加密的隐私保护算法;重要程度较低的隐私信息分量,且对计算、通信和存储能力有限的设备,则分配基于模糊的隐私保护算法。

在本发明实施例中,隐私保护算法的复杂度包括但不限于:时间复杂度、空间复杂度和通信开销。

其中,时间复杂度为执行时间,是从用户发起请求直到隐私保护算法输出保护后数据结束所消耗的时间;

空间复杂度为存储空间,是在整个计算和处理的过程中是占据的存储空间的大小;

通信开销则是从隐私保护算法输出的数据大小来决定通信开销。

在本发明实施例中,隐私保护算法的安全效能分析结果包括但不限于以下任一个:

概率、信息熵、期望、方差。

其中,概率是指隐私信息被暴露的概率。概率值越高,表示隐私信息被保护的程度越低,安全效能越低;概率值越低,表示隐私信息被保护的程度越高,安全效能越高。

例如,在基于位置服务场景中,概率的获取可以通过设置接入点采集该位置的访问量,或者从现有的第三方获取,如通过谷歌地图的应用程序编程接口(api,applicationprogramminginterface)来获取位置的访问量。假设获取到某个地图的访问量为m,在该地图中位置loci的访问量为mi,则该位置loci的概率qi为:

其中,信息熵是指隐私信息的不确定性。信息熵值越大,表示隐私信息的不确定性越高,则表示安全效能越高;信息熵值越小,表示隐私信息的不确定性越低,则表示安全效能越低。信息熵是通过信息熵的定义获得,即:

其中,h为信息熵,pi为隐私信息si的概率,n为隐私信息的数量。

其中,期望是指隐私信息所达到的隐私保护期望值。期望值越大,表示隐私信息的保护程度越高,安全效能越高;期望值越低,表示隐私信息的保护程度越低,安全效能越低。期望是通过其定义获得,即:

其中,pi为隐私信息si的概率,xi为隐私信息si对应的隐私信息向量。

其中,方差是指隐私信息之间的偏离程度。方差越大,表示隐私信息之间的偏离程度越大,隐私信息之间的关联度就越低,隐私信息被保护的程度就越高,安全效能越高;方差越小,表示隐私信息之间的偏离程度越小,隐私信息之间的关联度就越高,隐私信息被保护的程度就越低,安全效能越低。方差是通过其定义获得,即:

d=e{x-e(x)2}

其中,x为对应的隐私信息向量,e为期望。

在本发明实施例中,隐私保护处理模块203具体用于采用以下方式实现采用选择的隐私保护算法对第一隐私信息向量进行隐私保护处理得到第二隐私信息向量:

采用所述第一隐私信息向量的隐私信息分量的隐私保护算法对所述第一隐私信息向量的隐私信息分量进行隐私保护处理得到所述第二隐私信息向量的隐私信息分量。

其中,隐私保护算法包括以下至少之一:模糊、扰乱、混淆、加密。

其中,模糊是指对隐私信息分量进行模糊化处理,即扩大隐私信息分量所指示的范围。例如,用户请求十字路口附近的公交站,则请求信息包括十字路口的位置信息、第一预设范围和公交站,用户请求的内容包括以十字路口的位置为中心的第一预设范围内的公交站。那么,可以对十字路口的位置信息进行模糊化处理,即将十字路口的位置扩大为一个区域,从而实现模糊化保护。

其中,扰乱是指在隐私信息分量中添加噪声,从而干扰隐私信息的暴露。例如,对位置信息采用差分扰乱方法进行扰乱处理,即将位置信息添加平面拉普拉斯噪声,使得攻击者无法通过得到的信息分析得到用户的真实位置信息。

其中,混淆是指添加虚假的隐私信息分量,让攻击者无法辨别哪一个隐私信息分量为用户真实的隐私信息。例如,用户请求附近的餐馆,则请求信息包括当前位置信息、第一预设范围和餐馆,用户请求的内容包括以当前位置为中心的第一预设范围内的餐馆。那么,可以生成多个虚假的位置信息来实现混淆操作。

其中,加密是指对隐私信息分量进行加密处理。例如,用户查询账户信息,请求信息包括账户和密码。那么,可以通过加密算法对用户的隐私信息分量进行加密保护。

在本发明实施例中,隐私保护处理模块203具体用于采用以下方式实现根据第二隐私信息向量构建第二请求信息:

将第二隐私信息向量的隐私信息分量所指示的部分或全部范围对应的隐私信息重新组合得到第二请求信息;

或者,将第二隐私信息向量的隐私信息分量所指示的部分或全部范围对应的隐私信息和第一请求信息中的非隐私信息重新组合得到第二请求信息。

第二请求信息可以是一个,也可以是两个或两个以上。

在本发明另一个实施例中,隐私保护处理模块203还用于:

接收到所述第二请求信息请求的内容;从所述第二请求信息请求的内容中筛选出所述第一请求信息请求的内容。

也就是说,在接收到第二请求信息请求的内容时,可以将第二请求信息请求的内容呈现给用户,由用户选择有用的内容;或者,从第二请求信息请求的内容中筛选出第一请求信息请求的内容,将第一请求信息请求的内容呈现给用户。

其中,筛选的过程只需要根据第一请求信息请求的内容和第二请求信息请求的内容进行匹配,所匹配得到的内容即呈献给用户的内容。例如,用户第一请求信息请求的内容为100米以内的餐馆,第二请求信息请求的内容为500米以内的餐馆,只需匹配第一请求信息中100米的请求范围,将100米以内的餐馆进行呈现,而100米以外至500米的信息将不予呈现。

本发明实施例基于第一请求信息构建第二请求信息,第二请求信息请求的内容范围大于第一请求信息请求的内容范围,对用户请求的内容进行隐私保护,从而提高了用户的隐私安全。

本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

虽然本发明实施例所揭露的实施方式如上,但所述的内容仅为便于理解本发明实施例而采用的实施方式,并非用以限定本发明实施例。任何本发明实施例所属领域内的技术人员,在不脱离本发明实施例所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明实施例的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1