隐私保护的空间关键字查询方法

文档序号:8412527阅读:240来源:国知局
隐私保护的空间关键字查询方法
【技术领域】
[0001] 本发明涉及数据处理技术领域,具体而言,涉及一种隐私保护的空间关键字查询 方法。
【背景技术】
[0002] 随着基于位置的服务(Location-based Services,LBS)在移动互联网中的广泛应 用,近年来空间关键字查询服务也在工业界和学术界引起了越来越多的关注。已知一个空 间文本对象的集合,如兴趣点的集合(Points of Interest,P0I),和基于用户位置以及用 户查询关键字的查询请求,通过Top-k空间关键字查询得到同时在空间距离和文本相似度 两方面最相关的k个对象。这样的查询服务现已被广泛应用于Google Map和Foursquare 等互联网服务中。为了实现更好的可用性以及节省开销的目的,越来越多的数据拥有者倾 向于将他们的数据服务外包到云计算环境中,这种数据服务包括他们的数据、索引以及查 询算法等。例如,大众点评网和去哪网可以将其top-k空间关键字查询服务外包到亚马逊 EC2的云中,从而减少他们服务的维护成本。
[0003] 然而,直接将这些服务外包到云中可能会引起严重的隐私问题。一方面,空间文本 数据库本身可能包含私人的数据,这些数据中的位置信息以及文本描述信息不能被任何的 第三方获得,包括云计算环境的提供商。同时,收集这些数据需要大量的人力和财力资源, 因此,这些数据对于其拥有者的竞争对手来说可以认为是一种商业机密,需要防止这些数 据被其竞争对手所窃取。另一方面,如果空间关键字查询中用户的位置信息以及其查询的 关键字信息被不可信任的第三方非法获取,用户的出行习惯和查询兴趣就可能被潜在的攻 击者所分析和利用。因此,研宄外包环境中,空间关键字查询的隐私保护技术有着重要的意 义。
[0004] 关于上述问题的现有技术主要集中在空间查询或文本查询的隐私保护技术,然而 由于空间关键字查询中同时利用了文本的相关度和空间距离两方面的因素来进行剪枝和 查询,这些已有的隐私保护技术不能够直接用来解决空间关键字查询中的隐私保护问题。

【发明内容】

[0005] 本发明所要解决的技术问题是,如何高效地完成空间关键字top-k查询,同时保 证隐私不被泄露。
[0006] 为此目的,本发明提出了一种隐私保护的空间关键字查询方法,包括:S1,根据预 存储数据建立空间文本数据库索引;S2,将索引中的最小外包矩形的坐标和文本信息转化 为矩形的数据向量E.v,将索引中的数据点转化为数据点的数据向量O.v,对矩形的数据向 量进行加密得到加密的矩形的数据向量
[0007]
【主权项】
1. 一种隐私保护的空间关键字查询方法,其特征在于,包括: S1,根据预存储的数据建立空间文本数据库索引; 52, 将索引中的最小外包矩形的坐标和文本信息转化为矩形的数据向量E.v,将索引中 的数据点的坐标和文本信息转化为数据点的数据向量〇. v,对矩形的数据向量进行加密得 到加密的矩形的数据向量 K^={MfE,.v,M^E\v}, 对数据点的数据向量进行加密得到加密的数据点的数据向量 0^ = {M;0,.v,M^0,r.v}, 其中,和为作为密钥的可逆随机矩阵,E' .V和E" .V为E.V分裂得到的两 个向量,〇' .V和〇" .V为〇. V分裂得到的两个向量; 53, 记录发出查询指令的源位置的坐标以及查询关键字,计算源位置与最小外包矩形 的相对位置关系,根据相对位置生成查询空间向量Q i. lv,其中,I < i < 9,根据查询关键字 生成查询文本向量Q. tv,对查询文本向量和查询空间向量进行整合和扩展得到查询向量 Qi. V = ( a Qi. Iv I (I- a ) Q. tv I (I- α )), 其中,α为查询空间向量和查询文本向量的权重平衡因子,对查询向量进行加密得到 = [V/,这义M2I I S 0丨,其中,Q' i. V和(Ti. V为Qi. V分裂得到的两个向量; 54, 计算最小外包矩形在优先队列中的键值 3Ρ{Ε^,〇Λ? = Μ]Ε\V · Μ, '(2' ·ν + MlE".v · M2 .v , 以及数据点在优先队列中的键值 SP(〇v^) = M(〇'.v-M;lQ\.ν + Μ:0".ν·Μ~_^\.ν, 55, 根据最小外包矩形在优先队列中的键值和数据点在优先队列中的键值,优先队列 对最小外包矩形和数据点进行排序和输出,以查询满足用户查询指令的数据点。
2. 根据权利要求1所述的隐私保护的空间关键字查询方法,其特征在于,所述步骤S2 包括: S21,将索引中的最小外包矩形的坐标和文本权重信息转化为矩形文本向量Ε. tv,将索 引中的数据点的文本权重信息转化为数据文本向量〇. tv ; S22,获取最小外包矩形的矩形坐标信息(X' min,y' min,X' max,y' max),其中,最小外包矩 形的四条边分别与预设平面直角坐标系中的X轴或y轴平行,x'min和X' _为矩形四个顶 点在X轴上的投影坐标,y'min和y' _为矩形四个顶点在y轴上的投影坐标,X' min与y' min 和y'max组合,χ' max与y' min和y' max组合形成矩形的四个顶点坐标,以及数据点的坐标信息 (X',y',0,0),χ'为数据点在X轴上的投影坐标,y'为数据点在y轴上的投影坐标,对矩 形坐标信息增加辅助位后将其转换为矩形空间向量 们1 尤",乂i J I , ,1 I 尤X,乂L,ι), 将数据点的坐标信息增加辅助位后将其转换为数据点的空间向量 0·1ν=(χ' ,x' 2,l|y' ,y' 2,l|0,0,0|0,0,0); 523, 将矩形文本向量和矩形空间向量合并得到矩形的数据向量E.v = (E. lv|E. tv 11),将数据点的文本向量和空间向量合并得到数据点的数据向量0. V = (0.1 v I 0. tv 11); 524, 将矩形合并向量E. V随机分解为两个向量E ^ . V和E ". v,每个向 量分别左乘一个作为密钥的预设可逆矩阵Mf和Mf,得到加密矩形向量 £.v = .V,Mff.vj.,将数据合并向量随机分解为两个向量〇' .V和 〇" .v,每个向量分别左乘一个可逆随机矩阵Mf和Mf,得到加密数据向量 巧二{MW.T'MW。
3. 根据权利要求1所述的隐私保护的空间关键字查询方法,其特征在于,还包括: S6,针对最小外包矩形的每条边,以其为对称轴随机生成一对辅助对称点作为锚,锚的 坐标为(Xi, y),将其扩展为向量Ani= (X i, Yi, -0. S(Xfyi)2),其中1彡i彡5, i = 1表示 最小外包矩形内部的销,i = 2表示最小外包矩形左侧的销,i = 3表示最小外包矩形上方 的销,i = 4表示最小外包矩形右侧的销,i = 5表示最小外包矩形下方的销,对Ani加密得 到= {mf 丨,An' JP An" i为An汾解得到的两个向量,wf和W·[为作 为密钥的预设的可逆矩阵,针对查询源位置(X,,yq),为其设置辅助向量Q. a = (Xi,yi,1),对
9.&加密得到$ = {/^10^,所2_10〃.^,9'.&和〇".&为(^分解得到的两个矩阵, 7% 1和m2_1为作为密钥的预设的可逆矩阵,根据公式 PD(An{, Ani,Q.a) = (m[ An[ -m[ An.) · m~{Q'.a + (m1, An"-m'2 An^) · m^Q".a, where 2<i<5 的计算结果返回代码,若计算结果为正数,则返回代码h= 1,否则返回代码0,根据H =h21 h31 h41 h5确定源位置与最小外包矩形的相对位置关系。
4. 根据权利要求3所述的隐私保护的空间关键字查询方法,其特征在于,所述步骤S6 包括:根据最小外包矩形四条边所在直线将平面划分为九个区域,根据源位置所在区域生 成源位置的查询空间向量Q i. lv,当源位置处于最小外包矩形内部时,其到最小外包矩形 的距离为0,当源位置处于最小外包矩形的左上角、右上角、左下角、右下角时,将其到最小 外包矩形最近顶点的距离作为其到最小外包矩形的距离,当源位置位于最小外包矩形的左 侦I上部、右侧、下部时,将其到最近的边的距离作为其到最小外包矩形的距离,根据源位置 所处区域判断其对应查询空间向量中参与运算的坐标,并将不参与运算的坐标置为0,得到 Q Iv = (-Ix1q, I, X;210,0,010,0,010,0,0) Q2 Jv = (-2x;, I,X;2 !0,0,0|0,0,0| -2 V;, I, v;2)
W9.丄 V - VWj Wj W I Wj Wj W I Wj Wj W I Wj Wj KJJ , 其中,Q1. lv、Q2. lv、Q3. lv、Q4. lv、Q5. lv、Q6. lv、Q7. lv、Q8. lv、Q9. Iv 分别表示源位置位 于最小外包矩形的左侧、左上角、上部、右上角、右侧、右下角、下部、左下角和内部时对应查 询空间向量, 根据查询关键字生成查询文本向量Q. tv = {qi,q2, . . .,qj,其中,当查询指令中包含 第i个关键字,Qi= -1,否则Qi= 〇,对查询文本向量和查询空间向量进行整合和扩展得到 查询向量 Qi. V = ( a Qi. Iv I (I- a ) Q. tv I (I- α )), 对查询向量进行加密得到p =彳AZ111 S / ?Ξ 9!。
5. 根据权利要求4所述的隐私保护的空间关键字查询方法,其特征在于,所述步骤S6 还包括: 根据H = h21 h31 h41 h5为九个区域中的每个区域分别设置标识,并建立查询向量与标识 的对应关系列表,在计算得到H后,根据对应关系列表获取相应的查询向量。
6. 根据权利要求1所述的隐私保护的空间关键字查询方法,其特征在于,在云服务器 中计算计算最小外包矩形在优先队列中的键值以及数据点在优先队列中的键值,并将满足 用户查询指令的数据点返回至用户终端。
7. 根据权利要求1所述的隐私保护的空间关键字查询方法,其特征在于,所述索引为 IR-tree 索引。
【专利摘要】本发明涉及一种隐私保护的空间关键字查询方法包括:建立空间文本数据库索引;对索引中最小外包矩形和数据点的空间坐标和文本权重进行统一加密;在密文情况下判断查询源位置与最小外包矩形的位置关系;根据位置关系的不同情况,利用查询源位置的坐标构造相应的查询请求;计算最小外包矩形在优先队列中的键值以及数据点在优先队列中的键值;根据上述键值,优先队列对最小外包矩形和数据点进行排序,并输出满足用户查询请求的前k个数据点。本发明通过对索引中的位置信息和文本描述进行统一加密处理,构建安全的查询索引,并设计基于安全索引的空间关键字查询算法以实现保护隐私的高效的空间关键字查询。
【IPC分类】G06F21-60, G06F17-30
【公开号】CN104731860
【申请号】CN201510058254
【发明人】苏森, 程祥, 滕一平, 王玉龙, 徐鹏, 双锴, 张忠宝
【申请人】北京邮电大学
【公开日】2015年6月24日
【申请日】2015年2月4日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1