一种实时移动空间关键字近似Top-k查询方法

文档序号:6582669阅读:396来源:国知局
专利名称:一种实时移动空间关键字近似Top-k查询方法
技术领域
本发明属于数据库技术领域,具体涉及一种实时移动空间关键字近似Top-k查询方法。
二.
背景技术
无线通信及移动计算技术的发展激发了越来越多的移动通信业务,移动对象的连续查询是近年来移动对象数据库领域的研究热点。空间关键字查询处理方法将查询对象的位置与关键字集合作为参数,返回相匹配的信息。在很多实际应用中,人们并不需要精确的Top-k查询结果,并且不同的用户具有不同的查询精度要求。因此,研究多精度或任意精度的移动空间Top-k查询处理方法是十分有必要的,已有的方法很难确保未来任意时刻结果的正确性。为此该发明研究当查询位置持续移动时具有任意精度的空间关键字近似Top-k查询问题。现有的相关研究主要分成两类(I)移动查询移动对象查询是空间数据库领域的重要问题,根据不同的应用需求,产生了很多带限制条件的以及具有复杂语义的查询。目前该领域研究的热点主要是移动k近邻查询和道路网中移动对象的k近邻查询。连续k近邻查询是指从提交查询时刻开始,不断地给出随着查询位置或者移动对象位置信息变化的k近邻查询结果。Hseuh等进一步假设客户端具有一定的计算能力,通过维护位置信息表来减少更新。Mouratidis M等研究了道路网中的移动对象多用户k近邻查询问题,通过利用空间网络的相关属性和移动对象运动受限这一性质,减少连续查询的重复计算。目前典型的道路网中移动对象连续k近邻查询处理方法有IMA/GMA算法和ER2CkNN算法。IMA/GMA算法从查询所在的位置开始,遍历周围的边及其上的移动对象,根据到移动对象的网络距离不断地更新查询结果集。IMA/GMA算法的不足(1)当数据频繁更新时,绝大多数查询都需要重计算,性能急剧下降;(2)当道路网规模较大,时,其基本的网络扩张算法性能下降。ER2CkNN算法提出了预计算思想,能够快速计算给定两点的最短路径,还采用了欧氏距离限制的思想,即快速找到候选结果集,而后利用欧氏范围查询不断对结果集精炼得到最终结果。其不足之处为当移动对象数据频繁更新时,性能急剧下降。国防科大的赵亮等针对移动对象的多用户连续K近邻查询处理问题,结合多核多线程技术,提出了一种基于两阶段多用户连续K近邻查询处理框架和移动对象内存网格索引结构的K近邻查询处理算法。该算法的优点是充分结合了多线程和cache优化技术,在性能上有较大提高。该算法的缺陷是引入了查询缓冲区和移动对象缓冲区机制,增加了空间消耗。现有的研究其算法不够灵活,无法适应现实应用中不同用户具有不同精度要求问题。(2)近似查询由于设备误差、隐私保护以及通信限制等,数据的不确定性在空间数据库领域广泛存在。使得很多研究工作致力于近似数据管理技术。在近似查询方面的研究中,主要研究热点为(1)不同应用环境的近似查询方法研究;(2)带有概率保证的近似查询方法研究及近似度误差界分析。RONALD F等基于TA算法的思想,提出Θ -近似Top-k查询处理问题。算法返回满足用户精度要求的近似结果,其中Θ为相对误差界。ARAI B等提出了带有概率保证的近似Top-k查询算法。在P2P环境下,SEBASTIAN M等提出了一种带有固定概率保证的近似Top-k查询结果;然而当k值调整时这种方法不够灵活,尤其当k值较大时往往需要重新设置阈值。LIU Y等提出了一种传感器网络中的近似查询算法,它可以为用户递增地精炼事前收集的近似数据,使得误差任意小。现有研究没有提出对无效空间对象进行剪枝的方法,较难适应高速移动空间对象查询问题。与本发明最接近的现有技术是D. Wu等学者基于安全区域理论,提出了两种动态计算安全区域的方法,确保在动态安全区域内获取到正确结果,并且利用剪切规则降低了客户端和服务器端之间的通信开销。该现有技术没有考虑用户要求多样化的问题,并且其剪切规则基础是空间对象间的权重支配关系,该种方法灵活性差,各个数据对象之间的支配关系要逐一判断,效率较低。

发明内容
本发明的目的在于提供一种实时移动空间关键字近似Top-k查询方法,以解决实时变速移动空间关键字查询面临“查询位置持续变动”及“用户对查询精度要求趋于多样化”的难题。为了解决以上技术问题,本发明采用以下技术方案。一种实时移动空间关键字近似Top-k查询方法,其特征在于包括以下步骤Stepl查询点q发送查询关键字、ε,δ给服务器,服务器执行剪枝方法,获得候选集合CR;St印2设t-Ι时刻,将CR中的数据对象随机划分成L个子域,记录每个子域中对象数量Hij,根据ε,δ及(A)确定样本容量|S|,服务器随机产生|S|_k个I L之间的自然
数,记为^,…,丫^…对任意^ (l^i^ S1-k),PK H)=丨,其中I彡j彡L,
n- k
对任意j (I彡j彡L),服务器计算产生的随机数中等于j的个数并记为Sp并根据历史信息计算阈值ξ,即( = ,,,,,1丄,,,,,亡十士i,,::1:,,’其中,ζ H表示抽样后返回该时刻的查询结果,
//(I + ε)
·并向Zj子域发送(m」·,Sj, ζ ), I彡j彡L ;Step3当子域Zj接收到服务器发送的(mj,Sj, ζ )时,该子域向服务器发送t_l时刻按降序排列的数据及对应对象ID,每个子域计算^仏彡^/上…^入^中大于等于^^的个数,并向服务器传送数据信息;St印4服务器接收各子域数据后,输出该时刻前k个最大值及其对应的数据对象。若查询q关键字已经修改,转Stepl,若收到可用数据继续执行。以上步骤中所述剪枝方法是基于多核子蕴含方法,也称集合蕴含方法,具体过程如下初始化数据集合A+,A-, A°,如果e是一个对象且e不属于集合{V},初始化阈值τ ;(1)当w(e)>w(/),并满足性质一时,将对象e插入到数据集合A+中;并重新修改阈值r min{ τ,borUC;v*,, e)};(2)当w(e)〈w(/),若满足性质二、规则一、规则二,将e插入到集合A_ ;(3 )如果w (e) =w (v*),若满足规则三、规则四,将e插入到集合A° ;(4)否则,读取e的孩子结点,在孩子结点的每个入口结点e’,将e’为根的子树中,取出以集合/与点e’的最小边界矩形蕴含的点出堆,最后返回候选集合CR。所述的性质一、性质二、规则一、规则二、规则三和规则四如下
性质一设3Ve水且] c,若存在未被访问的对象V. e DS+,则v+不影响整体空间Ω ;性质二 设BvkjicWvn n=多,若存在未被访问对象¥_ e DS_,则v-不影响整体空间Ω ;规则一设存在对象v_ e 05_,若3#乂-且满足<^-,^[~^,则V-可安全剪枝;规则二 若存在对象v_ e DS^3V1e 且满^丄,则对象v-可安全剪枝;规则三存在一个对象Vtl e DS0,若3v'e J+,且满足丄的,'。3 C{v*Kl ,则V。可安全剪枝;规则四设存在一个对象Vtl e DS°,若3vkj°,且满足则v°可安全剪枝。方法中涉及的符号注释(l)h :子域内对象与服务器的核子连通距离;(2) DS :数据对象集合;(3)L:数据集合被分成的子域个数;(4)令G为候选集的标号集合,即G={1,2,…,η}。(5) t时刻候选集合中的感知数据集合记为Dt,Dt = {d⑴,d(2),…,d(n)},其中d(i)表示标号为i的数据对象中的数据,记为Cli ;(6) q:查询点;(7) CR:候选集合;(8) Hij :每个子域中的对象数量;(9) I S|:样本容量;(IO)j 的 ε 近似频率 prJ(i,) =,(Il)Zj :第 j 个子域;(12) Sj :服务器计算产生的随机数中等于j的个数;(13) ζ :根据历史信息计算的阈值;(14) ζ 1 1 :表不抽样后返回该时刻的Top-k结果;(15) MSgtj':表不t-1时刻Zj子域向服务器传送的信息量(16)^^(^); Pd(I1)的估计值。本发明的剪枝方法中用到的基础理论为多核子蕴含方法,也称集合蕴含方法,下面给出具体相关定义和例子。定义I核子连通距离在二维空间u中,存在一个集合DS,设点e属于DS,满足(I)e的权重为w(e) ; (2)e的坐标为(ex,ey )。空间u中的任意一点z与点e的核子连通距离定
义为心(e,z) = ^{,其中一表示点z与点e之间的距离。w(e) I ez I
定义2评分函数设函数(V. ψ)表示查询点q与数据对象V的信息关联度,为了评价查询的匹配程度,设定评分函数
权利要求
1.一种实时移动空间关键字近似Τορ-k查询方法,其特征在于包括以下步骤Stepl查询点q发送查询关键字、ε,δ给服务器,服务器执行剪枝方法,获得候选集合CR ;Step2设t-Ι时刻,将CR中的数据对象随机划分成L个子域,记录每个子域中对象数量%,根据ε, δ及确定样本容量|S|,服务器随机产生|S|_k个I L之间的自然数,记为 对任意^ (I≤i≤S|-k),
2.如权利要求1所述的一种实时移动空间关键字近似Top-k查询方法,其特征在于所述剪枝方法是基于多核子蕴含方法,具体步骤如下初始化数据集合A+,A-, A°,如果e是一个对象且e不属于集合{V},初始化阈值τ — οο ;(1)当w(e)>w(0,并满足性质一时,将对象e插入到数据集合A+中;并重新修改阈值 r Hiiin{ τ ,bordmax(C{v*j,e)};(2)当w(e)〈w(y),若满足性质二、规则一、规则二,将e插入到集合A_;(3)如果w(e) =w (V*),若满足规则三、规则四,将e插入到集合A° ;(4)否则,读取e的孩子结点,在孩子结点的每个入口结点e,,将e’为根的子树中,取出以集合/与点e’的最小边界矩形蕴含的点出堆,最后返回候选集合CR。
3.如权利要求2所述的一种实时移动空间关键字近似Top-k查询方法,其特征在于所述的性质一、性质二、规则一、规则二、规则三和规则四如下性质一设3作2+且(^卜+ ^ c,若存在未被访问的对象V+ e DS+,则V+不影响整体空间Ω ;性质二 设3Ve ^+且匕的^ c{v*]y = Φ,若存在未被访问对象v_ e DS^则v_不影响整体空间Ω ;规则一设存在对象V— e DS_,若3vk f,则v_可安全剪枝;规则二 若存在对象V— e DS_,3v,e J0且满足cWvnη丄V.= Φ,则对象v_可安全剪枝; 规则三存在一个对象Vtl eW+ .,且满足Avn,& 2 ,则V(l可安全剪枝;规则四设存在一个对象Vtl e DS0,若3Ve A0 ,且满足1,则v°可安全剪枝。
全文摘要
本发明公开了一种实时移动空间关键字近似Top-k查询方法,是一种基于集合蕴含方法进行空间对象剪枝的近似Top-k查询方法,首先将空间数据对象按照剪切规则进行处理,将大量与结果不相关的数据对象剪枝,并将剩余的对象作为下一步运算的总体,然后将这一总体区域化,按照抽样方法进行处理,最终按照用户的精度要求获取适合查询的结果。本发明能够在不计算出所有查询结果的情况下,根据用户的需要提前返回用户需要的查询结果,避免了冗余操作,提高了检索的效率和质量,可应用于实时移动空间关键字查询领域。
文档编号G06F17/30GK103020319SQ20131001108
公开日2013年4月3日 申请日期2013年1月11日 优先权日2013年1月11日
发明者邹志文, 寇爱军, 陈继明 申请人:江苏大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1