一种应用于无线传感网络的分布式相似性查询方法

文档序号:9815127阅读:426来源:国知局
一种应用于无线传感网络的分布式相似性查询方法
【技术领域】
[0001] 本发明设及一种应用于无线传感网络的分布式相似性查询方法,属于无线传感网 络下的相似查询技术领域。
【背景技术】
[0002] 无线传感网络(Wireless Sensor化twork,WSN)是当前在国际上备受关注、设及 多学科高度交叉、知识高度集成的前沿热点研究领域,被认为是21世纪最重要的技术之一。 WSN系统通常包括传感器节点、汇聚节点和管理节点,大量传感器节点随机部署在监测区 域,通过自组织的方式形成网络,负责收集监测区域的数据;汇聚节点收集传感节点的数 据,经过数据整合,提交给管理节点;用户可W通过管理节点对传感器网络进行配置管理、 发布监测任务W及收集监测数据。WS州尋逻辑上的信息世界和客观上的物理世界融合在一 起,它在工业、农业、交通、军事、安全、医疗、空间探测等众多领域都有着广泛的应用。
[0003] 由于WSN的传感节点通常由电池供电,可用能量有限,因此能耗是WSN的一个重要 问题,特别是在相似数据查询时,匹配所有节点的数据将消耗大量能量,缩短网络的生命周 期。
[0004] 局部敏感哈希(^Locality Sensitive Hashing,LSH)是最近非常流行的一种相似 性捜索算法,因其不错的捜索效率W及较强的高维适应性而被广泛应用于各个领域。其基 本思想是通过一组特殊的哈希函数,对数据进行哈希,使距离近的点冲突的概率远大于距 离远的点冲突的概率;在查询时,使用相同的函数,将查询点哈希到桶中,选取桶中数据作 为候选点进行距离判断,最终确定相似数据。
[0005] 传统L甜技术的主要问题是为了保证足够的召回率和精确率通常需要数W百计的 哈希表,运就给索引的存储带来很大的压力,庞大的哈希表占用过多的内存,在海量文件系 统中,L甜的应用遇到瓶颈。

【发明内容】

[0006] 针对上述技术问题,本发明所要解决的技术问题是提供一种应用于无线传感网络 的分布式相似性查询方法,解决了无线传感网络的能耗问题,W及数据相似性查询的效率 问题。
[0007] 本发明为了解决上述技术问题采用W下技术方案:本发明设计了一种应用于无线 传感网络的分布式相似性查询方法,针对无线传感网络中各个数据项进行L组K维局部敏感 哈希映射,构建各个数据项分别所映射的L组K维局部敏感哈希指纹值,即一个数据项对应L 组局部敏感哈希指纹值集合,各组局部敏感哈希指纹值集合分别包括K维局部敏感哈希指 纹值,L和K为预设整数值;所述分布式相似性查询方法包括如下步骤:
[000引步骤OOl.针对查询数据项Vsi),获得其进行L组K维局部敏感哈希映射时,各组各维 按预设切割宽度W进行分割取整前的映射值尤U 进入步骤002;其中,1 = 1、…、L,k =1、…、K,Ai,k和Bi,k为无线传感网络中各数据项进行L组K维局部敏感哈希映射时,各组各 维所对应的随即参数,且无线传感网络中各个数据项之间所对应各组各维的Al,k和Bi,k彼此 对应相同,Al,k为查询数据项V翰)对应第1组第k维局部敏感哈希映射时,与查询数据项V窗旬维 数相同,且每一维服从P稳态分布的随机高维向量;Bi,k为查询数据项V窗旬对应第1组第k维局 部敏感哈希映射时,属于[O,W]之间的随机数;
[0009] 步骤002.根据查询数据项进行L组K维局部敏感哈希映射时,各组各维按预设 切割宽度W进行分割取整前的映射值/,U 获得查询数据项V翰)进行L组K维局部敏感 哈希映射后,各组局部敏感哈希指纹值集合中各维局部敏感哈希指纹值A进入 步骤003;
[0010] 步骤003.将无线传感网络中的所有数据项作为待对比数据项,分别针对各个待对 比数据项,将待对比数据项各组局部敏感哈希指纹值集合中各维局部敏感哈希指纹值,分 别与查询数据项V翰)对应各组局部敏感哈希指纹值集合中对应维局部敏感哈希指纹值进行 相减,获得对应差值^,4,[;> .??. * .,:进入步骤004;其中,1綱fct= 1窗旬,1綱fct= 1、…、L,1窗旬=1、…、 L,為,《&,*表示待对比数据项第1概K组局部敏感哈希指纹值集合中第k维局部敏感哈希 指纹值,与查询数据项V齒自第1翰)组局部敏感哈希指纹值集合中第k维局部敏感哈希指纹值 的相减结果;
[0011] 步骤004.针对所有差值\^&,*,判断是否存在绝对值大于1的4 I. *,是则 定义该/胃*所对应待对比数据项第1衙批组局部敏感哈希指纹值集合与查询数据项 V窗旬第1翰)组局部敏感哈希指纹值集合之间的组相似性权重A,,,/胃,,=0,并进入步骤005;否 则进入步骤006;
[0012] 步骤005.针对所有待对比数据项的局部敏感哈希指纹值集合中剩余局部敏感哈 希指纹值集合,判断是否存在所对应所有差值巧的绝对值均不大于1的局部敏感哈 希指纹值集合,是则进入步骤006;否则进入步骤008;
[0013] 步骤006.分别针对所对应所有差值巧Z胃*的绝对值均不大于1的各组局部敏 感哈希指纹值集合,根据其对应的巧,获得為胃所对应的各个待对比数据项 第1概K组局部敏感哈希指纹值集合,按如下公式:
[0015] 获得為》,", A所对应待对比数据项第1椒批组局部敏感哈希指纹值集合中第k维 局部敏感哈希指纹值,与查询数据项V翰)第1查组局部敏感哈希指纹值集合中第k维局部敏 感哈希指纹值的单位相似性权重ti),然后进入步骤007;
[0016] 步骤007 .针对所对应所有差值\,,&,*的绝对值均不大于1的各组局部敏感哈 希指纹值集合,根据如下公式:
[0018] 获得其对应C', . *所对应待对比数据项第1概K组局部敏感哈希指纹值集合与 查询数据项第1登ft组局部敏感哈希指纹值集合的组相似性权重%,并进入步骤 008;其中,A为预设常数;
[0019] 步骤008.分别针对无线传感网络中各个待对比数据项,将待对比数据项所有L组 局部敏感哈希指纹值集合,分别相对于查询数据项V齒自对应各组局部敏感哈希指纹值集合 的组相似性权重相加,获得该待对比数据项相对于查询数据项V翰)的相似性权重, 并进入步骤009;
[0020] 步骤009.针对无线传感网络中各个待对比数据项相对于查询数据项V窗旬的相似性 权重,筛选获得大于预设相似性权重阔值的相似性权重所对应的待对比数据项,作为候选 数据项,并进入步骤010;
[0021] 步骤010.根据查询数据项V窗自进行局部敏感哈希映射前的数据,W及各个候选数 据项进行局部敏感哈希映射前的数据,分别计算各个候选数据项和查询数据项Vsa之间的 欧式距离,然后筛选获得大于预设欧式距离阔值的欧式距离所对应的候选数据项,即查询 数据项V翰)的相似性查询结果。
[0022] 作为本发明的一种优选技术方案:所述针对无线传感网络中各个数据项采用基于 P稳态局部敏感哈希映射方法,进行L组K维局部敏感哈希映射,构建各个数据项分别所映射 的L组K维局部敏感哈希指纹值。
[0023] 作为本发明的一种优选技术方案:所述针对无线传感网络中各个数据项进行L组K 维局部敏感哈希映射,构建各个数据项分别所映射的L组K维局部敏感哈希指纹值,包括如 下步骤:
[0024] 步骤aOl.针对无线传感网络中的数据项,随机获得其进行L组K维局部敏感哈希映 射时,所对应各组各维的Al,k、Bi,k,且无线传感网络中各个数据项之间所对应各组各维的 Al,谢Bi,k彼此对应相同,并进入步骤a02;其中,Al,功数据项对应第1组第k维局部敏感哈希 映射时,与该数据项维数相同,且每一维服从P稳态分布的随机高维向量;Bi,k为数据项对应 第1组第k维局部敏感哈希映射时,属于[0,W]之间的随机数;
[0025] 步骤a02.根据无线传感网络中各个数据项分别所对应各组各维的Al,k、Bi,k,按如 下公式:
[0027] 获得无线传感网络中各个数据项分别所对应各组各维局部敏感哈希指纹值 (^),即一个数据项对应L组局部敏感哈希指纹值集合,各组局部敏感哈希指纹值集合 分别包括K维局部敏感哈希指纹值;其中,V表示无线传感网络中的数据项。
[0028] 作为本发明的一种优选技术方案:所述步骤OOl中,针对查询数据项V査询,按如下公 式:
[0029] A,心户查词)=年^飾+如
[0030] 获得其进行L组K维局部敏感哈希映射时,各组各维按预设切割宽度W进行分割取 整前的映射值充
[0031] 作为本发明的一种优选技术方案:所述步骤002中,根据查询数据项Vs旬进行L组K 维局部敏感哈希映射时,各组各维按预设切割宽度W进行分割取整前的映射值 /4。,3。(^5),按如下公式:
[0033] 获得查询数据项V翰)进行L组K维局部敏感哈希映射后,各组局部敏感哈希指纹值 集合中各维的局部敏感哈希指纹值*
[0034] 本发明所述一种应用于无线传感网络的分布式相似性查询方法采用W上技术方 案与现有技术相比,具有W下技术效果:本发明设计的一种应用于无线传感网络的分布式 相似性查询方法,针对无线传感网络中传感节
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1