一种多媒体对象的相似检索方法及装置的制造方法

文档序号:10725184阅读:378来源:国知局
一种多媒体对象的相似检索方法及装置的制造方法
【专利摘要】本发明公开了一种多媒体对象的相似检索方法及装置,通过对多媒体对象进行特征提取,获取多媒体对象的d维特征向量,对d维特征向量进行降维处理,提取待检索多媒体对象的d维特征向量,并通过iDistance算法,将待检索多媒体对象的d维特征向量映射为一维键值及数据空间中的查询点q,根据查询点q、查询空间及距离度量,修剪掉不需查询的Partition分区及不需查询的数据点,在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维键值及查询点与对所述查询空间内的数据点进行查询,以查询待检索多媒体对象的d维特征向量。本发明减少无效的I/O查询,并以三角剪枝的方式降低计算开销,进而提高查询效率。
【专利说明】
一种多媒体对象的相似检索方法及装置
技术领域
[0001] 本发明涉及相似性检索领域,尤其涉及一种多媒体对象的相似检索方法及装置。
【背景技术】
[0002] 现如今许多数据处理应用需要处理结构更为松散甚至无结构的数据。很多实际应 用更是需要处理基于样本的检索,例如基于内容的图像检索等。而这些应用都可以归结到 相似性检索的范畴,尤其在多媒体应用中,基于多媒体数据的内容进行相似搜索的技术,也 变得越来越重要。
[0003] 为了提升多媒体相似性检索的处理效率,通常针对多媒体对象的高维特征建立高 维索引。多年来,研究者们已经设计和开发了很多高维索引技术用于组织视频、图像、音频 等多媒体数据的特征向量,以提升检索性能。由于"维度灾难"的存在,当数据量很大,维度 很高时,提升多媒体检索任务的性能仍然是一项艰巨的工作,现有技术中的高维索引技术, 当数据规模较大,维度较高时,I/O开销及计算开销均会变大,降低了索引查询的性能。

【发明内容】

[0004] 本发明提供一种多媒体对象的相似检索方法及装置,解决现有技术中高维索引技 术当数据规模较大,维度较高时,I/O开销及计算开销均会变大,降低了索引查询的性能的 技术问题。
[0005] 本发明的目的是通过以下技术方案实现的:
[0006] -种多媒体对象的相似检索方法,包括:
[0007] 通过对多媒体对象进行特征提取,获取多媒体对象的d维特征向量;
[0008] 将d维特征向量的数据空间划分为Μ个区域,通过iDi stance算法,将d维特征向量 映射为一维键值,并通过一维索引结构存储所述一维键值及所述d维特征向量,以获得查询 数据库,其中,所述数据空间中包括d维特征向量对应的数据点;
[0009] 提取待检索多媒体对象的d维特征向量,并通过iDistance算法,将待检索多媒体 对象的d维特征向量映射为一维键值及数据空间中的查询点q;
[0010] 根据查询点q、查询空间及距离度量,修剪掉不需查询的Partition分区及不需查 询的数据点;
[0011] 在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维 键值,对所述查询空间内的数据点进行查询,以查询待检索多媒体对象的d维特征向量。
[0012] 前述的多媒体对象的相似检索方法,所述特征提取包括SIFT特征提取、HARRIS特 征提取和SUSAN特征提取。
[0013] 前述的多媒体对象的相似检索方法,所述将d维特征向量划分为Μ个区域,通过 iDi stance算法,将d维特征向量映射为一维键值,并通过一维索引结构存储所述一维键值 及所述d维特征向量,以获得查询数据库,包括:
[0014] 将多个d维特征向量的数据空间划分为m个分区P0、P1、…、Pm-l;
[0015] 为每个分区选定参照点Q0、Ql、'"、Qm-l;
[0016 ]根据d维特征向量对应的数据点p到参照点Q i的距离,将d维特征向量映射为一维 键值,其中,一维键值7 = 1\〇+虹8以?,01),0彡1彡!11-1,(3为弹性系数,(^8以?,01)为(1维特 征向量对应的数据点P到参照点Q i的距离;
[0017] 采用映射后的一维键值y建立B+_tree的索引结构,以存储所述一维键值y及所述d 维特征向量。
[0018] 前述的多媒体对象的相似检索方法,所述根据查询点q、查询空间及距离度量,修 剪掉不需查询的Part i t ion分区及不需查询的数据点的步骤,包括:
[0019 ]将所述查询点q与查询半径r所形成的超球扩展成超立方体;
[0020] 判断每个Par t ition是否与所述超立方体相交;
[0021 ] 当所述Partition与所述超立方体不相交时,修剪掉不需查询的所述Partition, 并扩大查询半径r,重新进行修剪判断,直至KNN检索结束;
[0022]当KNN检索结束后,对未修剪的Partition中的数据点p增加数据点到数据空间中 心的距离虹81:(。,〇61^61'),判断所述查询点9到数据空间中心的距离(1丨81:(9,〇61^61')及查 询半径r,是否满足dist(p,center Xr+dist(q,center ),当不满足时,修剪掉数据点P。 [0023]前述的多媒体对象的相似检索方法,在经过修剪后的数据点中,确定包含于所述 查询空间内的数据点,根据所述一维键值,对所述查询空间内的数据点进行查询,以查询待 检索多媒体对象的d维特征向量的步骤,包括:
[0024]当第一种情况时,根据查询范围,向B+_Tree树的叶子节点两边进行遍历,查询待 检索多媒体对象的d维特征向量对应的数据点p,其中,所述第一种情况为当前Partition包 含查询点q;
[0025]当第二种情况时,根据查询范围及Part it ion的半径,向B+-Tree树的叶子节点内 部进行遍历,其中,所述第二种情况为查询点q在当前Partition外,且所述查询点q与查询 半径r所形成的超球与Partition相交。
[0026] -种多媒体对象的相似检索装置,包括:
[0027] 特征向量提取模块,用于通过对多媒体对象进行特征提取,获取多媒体对象的d维 特征向量;
[0028] 降维模块,用于将d维特征向量的数据空间划分为Μ个区域,通过iDistance算法, 将d维特征向量映射为一维键值,并通过一维索引结构存储所述一维键值及所述d维特征向 量,以获得查询数据库,其中,所述数据空间中包括d维特征向量对应的数据点;
[0029]映射模块,用于提取待检索多媒体对象的d维特征向量,并通过iDistance算法,将 待检索多媒体对象的d维特征向量映射为一维键值及数据空间中的查询点q;
[0030]剪枝模块,用于根据查询点q、查询空间及距离度量,修剪掉不需查询的Partition 分区及不需查询的数据点;
[0031 ]查询模块,用于在经过修剪后的数据点中,确定包含于所述查询空间内的数据点, 根据所述一维键值,对所述查询空间内的数据点进行查询,以查询待检索多媒体对象的d维 特征向量。
[0032]前述的多媒体对象的相似检索装置,所述降维模块包括:
[0033]分区单元,用于将多个d维特征向量的数据空间划分为m个分区Ρ0、Ρ1、···、Ρπι-1;
[0034]映射单元,用于为每个分区选定参照点QO、Q1、…、Qm-1,根据d维特征向量对应的 数据点P到参照点Qi的距离,将d维特征向量映射为一维键值,其中,一维键值y = i X c+dist (p,Qi),0彡i彡m-1,c为弹性系数,dist(p,Qi)为d维特征向量对应的数据点p到参照点Qi的 距离;
[0035]索引单元,用于采用映射后的一维键值y建立B+-tree的索引结构,以存储所述一 维键值y及所述d维特征向量。
[0036] 前述的多媒体对象的相似检索装置,所述剪枝模块包括:
[0037] 变换单元,用于将所述查询点q与查询半径r所形成的超球扩展成超立方体;
[0038]判断单元,用于判断每个Partition是否与所述超立方体相交;
[0039]第一修剪单元,用于当所述Partition与所述超立方体不相交时,修剪掉不需查询 的所述Part i t ion,并扩大查询半径r,重新进行修剪判断,直至KNN检索结束;
[0040] 第二修剪单元,用于当KNN检索结束后,对未修剪的Partition中的数据点p增加数 据点到数据空间中心的距离d i s t (p,c e n t e r),判断所述查询点q到数据空间中心的距离 dist(q,center)及查询半径r,是否满足dist(p,centerXr+dist(q,center),当不满足 时,修剪掉数据点P。
[0041] 前述的多媒体对象的相似检索装置,所述查询模块包括:
[0042] 查询执行单元,用于在经过修剪后的数据点中,确定包含于所述查询空间内的数 据点,根据所述一维键值及查询点q与当前par t i t i on的情况,对所述查询空间内的数据点 进行查询,其中,查询点q与当前partition的情况包括第一种情况和第二种情况;
[0043]第一遍历单元,用于当第一种情况时,根据查询范围,向B+_Tree树的叶子节点两 边进行遍历,查询待检索多媒体对象的d维特征向量对应的数据点p,其中,所述第一种情况 为当前Partition包含查询点q;
[0044] 第二遍历单元,用于当第二种情况时,根据查询范围及Partition的半径,向B+-Tree树的叶子节点内部进行遍历,其中,所述第二种情况为查询点q在当前Partition外,且 所述查询点q与查询半径r所形成的超球与Partition相交。
[0045] 本发明的技术效果为:
[0046] 通过优化1/0开销的分区剪枝PP算法,剪掉无效的分区,减少无效的1/0查询,提高 查询效率;通过优化计算开销的基于三角不等式的剪枝LP算法,筛除一部分数据点,以三角 剪枝的方式降低计算开销,进而提高查询效率。
【附图说明】
[0047] 图1为本发明实施例提供的一种多媒体对象的相似检索方法的流程图;
[0048]图2为本发明实施例提供的kNN检索遍历策略三种情况的示意图;
[0049] 图3为本发明实施例中基于PP算法的剪枝示意图;
[0050] 图4为本发明实施例提供的一种多媒体对象的相似检索装置的结构示意图。
【具体实施方式】
[0051] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实 施方式对本发明作进一步详细的说明。
[0052]如图1所示,为本发明实施例中的一种多媒体对象的相似检索方法,包括:
[0053]步骤101、通过对多媒体对象进行特征提取,获取多媒体对象的d维特征向量;
[0054]其中,特征提取是相似性检索的基础之一。其通过特定的算法,提取重要的特征, 并结合特征提取函数F,将其映射到d维空间,目的在于将多媒体对象转化为特征向量,所述 特征提取包括SIFT特征提取、HARRIS特征提取和SUSAN特征提取。
[0055] 步骤102、对d维特征向量进行降维处理;
[0056] 其中,将d维特征向量的数据空间划分为Μ个区域,通过iDistance算法,将d维特征 向量映射为一维键值,并通过一维索引结构存储所述一维键值及所述d维特征向量,以获得 查询数据库,其中,所述数据空间中包括d维特征向量对应的数据点;
[0057] 其中,步骤102还可以包括:
[0058] 步骤102-1、将多个d维特征向量的数据空间划分为m个分区Ρ0、Ρ1、···、Ρπι-1;
[0059] 步骤102-2、为每个分区选定参照点Q0、Ql、'"、Qm-l;
[0060 ] 步骤10 2 - 3、根据d维特征向量对应的数据点p到参照点Q i的距离,将d维特征向量 映射为一维键值,其中,一维键值7 = 1\〇+虹8以?,〇1),0<1$111-1,(3为弹性系数,(^8以?, Q i)为d维特征向量对应的数据点p到参照点Q i的距离;
[0061]其中,c不小于▲,d = dist(p,Qi)。
[0062]步骤102-4、采用映射后的一维键值y建立B+_tree的索引结构,以存储所述一维键 值y及所述d维特征向量。
[0063] 步骤103、提取待检索多媒体对象的d维特征向量,并通过iDistance算法,将待检 索多媒体对象的d维特征向量映射为一维键值及数据空间中的查询点q;
[0064] 其中,步骤103的具体映射方式与步骤102相同。
[0065] 步骤104、根据查询点q、查询空间及距离度量,修剪掉不需查询的Partition分区 及不需查询的数据点;
[0066] 其中,步骤104还可以包括:
[0067] 步骤104-1、将所述查询点q与查询半径r所形成的超球扩展成超立方体;
[0068] 步骤104-2、判断每个Par t i t i on是否与所述超立方体相交;
[0069] 步骤104-3、当所述Partition与所述超立方体不相交时,修剪掉不需查询的所述 Partition,并扩大查询半径r,重新进行修剪判断,直至KNN检索结束;
[0070] 其中,基于iDistance的kNN检索与传统的kNN检索策略一致,首先选定初始查询半 径进行查询,再逐渐扩大半径,直到k个查询对象都被找到,其查询停止的标记为:k个对象 内最远对象离查询点的距离不大于查询半径。因每个区域内点的键值在每个页上是顺序存 储的,对于查询点q,映射到B+_Tree后,根据查询范围与查询约束,向叶子结点的两边遍历。 这种技术的优势是,当查询半径逐渐增大时,同个区域内可以通过这种方式递归查询。对于 每个区域如何选择kNN检索遍历策略,包括如下情况:
[0071] 三种情况:
[0072] 第一种情况(Situationl):当前区域包含查询点q,双向遍历(Outward and Inward);
[0073] 第二种情况(Situation〗):查询点q在当前区域外,但是所形成的超球与区域相 交,向内遍历(Inward);
[0074]第三种情况(Situation3):查询点q在当前区域外,其所形成的超球与区域不相 交,该区域不需遍历。
[0075]如图2为kNN检索遍历策略三种情况的示意图,其中,给定三个分区划分P1、P2、P3, 对于查询点q,Pl需要双向遍历、P2需要内向遍历,P3不需要遍历。
[0076]如图3所示,查询点q与查询半径r所形成的圆扩展成正方形,不难看出正方形与P2 不存在交叉,即满足PP算法中的剪枝情况,不必对原本需要查询的page进行查询,减少了一 部分I/O的开销。
[0077] 步骤104-4、当KNN检索结束后,对未修剪的Partition中的数据点p增加数据点到 数据空间中心的距离dist(p,center),判断所述查询点q到数据空间中心的距离dist(q, center)及查询半径r,是否满足dist(p,centerXr+dist(q,center),当不满足时,修剪掉 数据点P。
[0078] 其中,为每个叶子节点增加了一个属性,该属性记录该点到数据空间中心的距离。 剪枝算法通过该点到与中心点的距离、该点到参考点的距离、查询半径作为参数,以三角剪 枝的达到降低计算开销的目的,进而提高查询效率
[0079] 为数据空间内的全部数据点增加一个属性字段(包括查询点q),记录该点到DS中 心center的距离。例如采用欧氏距离作为度量标准,p为DS内某个与查询区域相交的page中 的的数据点,则存在以下三角不等式规则,可作为剪枝依据:
[0080] dist(p,q)_dist(q,centerXdist(p,centerXdist(p,q)+dist(q,center); [0081 ]当规定查询点q的查询半径r时,对于q查询半径内的所有候选点p,必须满足:dist (p,center) <r+dist(q,center),否则,page内的点将被筛除,以减少I/O开销。
[0082]步骤105、在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据 所述一维键值及查询点与对所述查询空间内的数据点进行查询,以查询待检索多媒体对象 的d维特征向量。
[0083] 其中,步骤105还可以包括:
[0084] 步骤105-1、在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根 据所述一维键值及查询点q与当前part it ion的情况,对所述查询空间内的数据点进行查 询,其中,查询点q与当前partition的情况包括第一种情况和第二种情况;
[0085] 步骤105-2、当第一种情况时,根据查询范围,向B+_Tree树的叶子节点两边进行遍 历,查询待检索多媒体对象的d维特征向量对应的数据点p,其中,所述第一种情况为当前 Part it ion包含查询点q;
[0086] 步骤105-3、当第二种情况时,根据查询范围及Partition的半径,向B+-Tree树的 叶子节点内部进行遍历,其中,所述第二种情况为查询点q在当前Partition外,且所述查询 点q与查询半径r所形成的超球与Partition相交。
[0087]本发明实施例提出的一种多媒体对象的相似检索方法,通过同时优化1/0开销和 计算的高维索引技术AP-iDi stance (Advanced pruning iDi stance)开销。在判断是否遍历 当前part it ion之前,先判断该查询范围所扩展而成的超立方体是否与当前part it ion相 交,以减少无效的1/0查询,提高查询效率;并在遍历每个page中数据点之前,通过三角剪枝 的方法筛除一部分数据点。该方案为每个叶子结点增加了一个属性,该属性记录该点到数 据空间中心的距离。剪枝算法通过该点到与中心点的距离、该点到参考点的距离、查询半径 作为参数,以三角剪枝的达到降低计算开销的目的,进而提高查询效率。
[0088] 本发明实施例还提供一种多媒体对象的相似检索装置,如图4,包括:
[0089] 特征向量提取模块410,用于通过对多媒体对象进行特征提取,获取多媒体对象的 d维特征向量;
[0090] 降维模块420,用于将d维特征向量的数据空间划分为Μ个区域,通过iDistance算 法,将d维特征向量映射为一维键值,并通过一维索引结构存储所述一维键值及所述d维特 征向量,以获得查询数据库,其中,所述数据空间中包括d维特征向量对应的数据点;
[0091 ]映射模块430,用于提取待检索多媒体对象的d维特征向量,并通过iDistance算 法,将待检索多媒体对象的d维特征向量映射为一维键值及数据空间中的查询点q;
[0092]剪枝模块440,用于根据查询点q、查询空间及距离度量,修剪掉不需查询的 Partition分区及不需查询的数据点;
[0093]查询模块450,用于在经过修剪后的数据点中,确定包含于所述查询空间内的数据 点,根据所述一维键值,对所述查询空间内的数据点进行查询,以查询待检索多媒体对象的 d维特征向量。
[0094]其中,所述降维模块420包括:
[0095]分区单元421,用于将多个d维特征向量的数据空间划分为m个分区Ρ0、Ρ1、···、Ρπι-1;
[0096]映射单元422,用于为每个分区选定参照点〇0、〇1、'"、〇111-1,根据(1维特征向量对应 的数据点Ρ到参照点Qi的距离,将d维特征向量映射为一维键值,其中,一维键值y = iXc+ dist(p,Qi),(Xi彡m-1,c为弹性系数,(1181:(口,(>);〇为(1维特征向量对应的数据点口到参照点 Qi的距离;
[0097]索引单元423,用于采用映射后的一维键值y建立B+-tree的索引结构,以存储所述 一维键值y及所述d维特征向量。
[0098]所述剪枝模块440包括:
[0099]变换单元441,用于将所述查询点q与查询半径r所形成的超球扩展成超立方体; [0?00]判断单元442,用于判断每个Partition是否与所述超立方体相交;
[0101] 第一修剪单元443,用于当所述Partition与所述超立方体不相交时,修剪掉不需 查询的所述Partition,并扩大查询半径r,重新进行修剪判断,直至KNN检索结束;
[0102] 第二修剪单元444,用于当KNN检索结束后,对未修剪的Partition中的数据点ρ增 加数据点到数据空间中心的距离dist(p,center ),判断所述查询点q到数据空间中心的距 离dist(q,center)及查询半径r,是否满足dist(p,centerXr+dist(q,center),当不满足 时,修剪掉数据点Ρ。
[0103] 所述查询模块450包括:
[0104] 查询执行单元451,用于在经过修剪后的数据点中,确定包含于所述查询空间内的 数据点,根据所述一维键值及查询点q与当前parti t ion的情况,对所述查询空间内的数据 点进行查询,其中,查询点q与当前partition的情况包括第一种情况和第二种情况;
[0105] 第一遍历单元452,用于当第一种情况时,根据查询范围,向B+_Tree树的叶子节点 两边进行遍历,查询待检索多媒体对象的d维特征向量对应的数据点ρ,其中,所述第一种情 况为当前Partition包含查询点q;
[0106] 第二遍历单元453,用于当第二种情况时,根据查询范围及Partition的半径,向B +-Tree树的叶子节点内部进行遍历,其中,所述第二种情况为查询点q在当前Partition外, 且所述查询点q与查询半径r所形成的超球与Partition相交。
[0107]通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助 软件加必需的硬件平台的方式来实现,当然也可以全部通过硬件来实施,但很多情况下前 者是更佳的实施方式。基于这样的理解,本发明的技术方案对【背景技术】做出贡献的全部或 者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如 R0M/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务 器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
[0108]以上对本发明进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方 式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对 于本领域的一般技术人员,依据本发明的思想,在【具体实施方式】及应用范围上均会有改变 之处,综上所述,本说明书内容不应理解为对本发明的限制。
【主权项】
1. 一种多媒体对象的相似检索方法,其特征在于,包括: 通过对多媒体对象进行特征提取,获取多媒体对象的d维特征向量; 将d维特征向量的数据空间划分为Μ个区域,通过iDi stance算法,将d维特征向量映射 为一维键值,并通过一维索引结构存储所述一维键值及所述d维特征向量,以获得查询数据 库,其中,所述数据空间中包括d维特征向量对应的数据点; 提取待检索多媒体对象的d维特征向量,并通过iDistance算法,将待检索多媒体对象 的d维特征向量映射为一维键值及数据空间中的查询点q; 根据查询点q、查询空间及距离度量,修剪掉不需查询的Partition分区及不需查询的 数据点; 在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维键值, 对所述查询空间内的数据点进行查询,以查询待检索多媒体对象的d维特征向量。2. 根据权利要求1所述的多媒体对象的相似检索方法,其特征在于,所述特征提取包括 SIFT特征提取、HARRIS特征提取和SUSAN特征提取。3. 根据权利要求2所述的多媒体对象的相似检索方法,其特征在于,所述将d维特征向 量划分为Μ个区域,通过iDistance算法,将d维特征向量映射为一维键值,并通过一维索引 结构存储所述一维键值及所述d维特征向量,以获得查询数据库,包括: 将多个d维特征向量的数据空间划分为m个分区P0、P1、…、Pm-1; 为每个分区选定参照点Q 〇、Q1、…、Qm-1; 根据d维特征向量对应的数据点p到参照点Qi的距离,将d维特征向量映射为一维键值, 其中,一维键值y=i Xc+dist(p,Qi),c为弹性系数,dist(p,Qi)为d维特征向量 对应的数据点P到参照点Q i的距离; 采用映射后的一维键值y建立B+_tree的索引结构,以存储所述一维键值y及所述d维特 征向量。4. 根据权利要求3所述的多媒体对象的相似检索方法,其特征在于,所述根据查询点q、 查询空间及距离度量,修剪掉不需查询的Partition分区及不需查询的数据点的步骤,包 括: 将所述查询点q与查询半径r所形成的超球扩展成超立方体; 判断每个Partition是否与所述超立方体相交; 当所述Part it ion与所述超立方体不相交时,修剪掉不需查询的所述Part it ion,并扩 大查询半径r,重新进行修剪判断,直至KNN检索结束; 当KNN检索结束后,对未修剪的Partition中的数据点p增加数据点到数据空间中心的 距离(1丨81:化,〇61^61'),判断所述查询点9到数据空间中心的距离(1丨81:(9,〇61^61')及查询半 径r,是否满足dist(p,center Xr+dist(q,center ),当不满足时,修剪掉数据点P。5. 根据权利要求4所述的多媒体对象的相似检索方法,其特征在于,在经过修剪后的数 据点中,确定包含于所述查询空间内的数据点,根据所述一维键值,对所述查询空间内的数 据点进行查询,以查询待检索多媒体对象的d维特征向量的步骤,包括: 在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据所述一维键值 及查询点q与当前part i tion的情况,对所述查询空间内的数据点进行查询,其中,查询点q 与当前partition的情况包括第一种情况和第二种情况; 当第一种情况时,根据查询范围,向B+-Tree树的叶子节点两边进行遍历,查询待检索 多媒体对象的d维特征向量对应的数据点p,其中,所述第一种情况为当前Partition包含查 询点q; 当第二种情况时,根据查询范围及Part it ion的半径,向B+-Tree树的叶子节点内部进 行遍历,其中,所述第二种情况为查询点q在当前Partition外,且所述查询点q与查询半径r 所形成的超球与Partition相交。6. -种多媒体对象的相似检索装置,其特征在于,包括: 特征向量提取模块,用于通过对多媒体对象进行特征提取,获取多媒体对象的d维特征 向量; 降维模块,用于将d维特征向量的数据空间划分为Μ个区域,通过iDistance算法,将d维 特征向量映射为一维键值,并通过一维索引结构存储所述一维键值及所述d维特征向量,以 获得查询数据库,其中,所述数据空间中包括d维特征向量对应的数据点; 映射模块,用于提取待检索多媒体对象的d维特征向量,并通过iDistance算法,将待检 索多媒体对象的d维特征向量映射为一维键值及数据空间中的查询点q; 剪枝模块,用于根据查询点q、查询空间及距离度量,修剪掉不需查询的Partition分区 及不需查询的数据点; 查询模块,用于在经过修剪后的数据点中,确定包含于所述查询空间内的数据点,根据 所述一维键值,对所述查询空间内的数据点进行查询,以查询待检索多媒体对象的d维特征 向量。7. 根据权利要求6所述的多媒体对象的相似检索装置,其特征在于,所述降维模块包 括: 分区单元,用于将多个d维特征向量的数据空间划分为m个分区Ρ0、Ρ1、···、Ρπι-1; 映射单元,用于为每个分区选定参照点Q〇、Q1、…、Qm-1,根据d维特征向量对应的数据 点P到参照点Qi的距离,将d维特征向量映射为一维键值,其中,一维键值y = i X c+dist(p, 01),0<^111-1,(3为弹性系数,(^8以?池)为(1维特征向量对应的数据点?到参照点如的距 离; 索引单元,用于采用映射后的一维键值y建立B+-tree的索引结构,以存储所述一维键 值y及所述d维特征向量。8. 根据权利要求7所述的多媒体对象的相似检索装置,其特征在于,所述剪枝模块包 括: 变换单元,用于将所述查询点q与查询半径r所形成的超球扩展成超立方体; 判断单元,用于判断每个Partition是否与所述超立方体相交; 第一修剪单元,用于当所述Partition与所述超立方体不相交时,修剪掉不需查询的所 述Partition,并扩大查询半径r,重新进行修剪判断,直至KNN检索结束; 第二修剪单元,用于当KNN检索结束后,对未修剪的Par t i t i on中的数据点p增加数据点 到数据空间中心的距离dist(p,center),判断所述查询点q到数据空间中心的距离dist(q, center)及查询半径r,是否满足dist(p,centerXr+dist(q,center),当不满足时,修剪掉 数据点P。9. 根据权利要求8所述的多媒体对象的相似检索装置,其特征在于,所述查询模块包 括: 查询执行单元,用于在经过修剪后的数据点中,确定包含于所述查询空间内的数据点, 根据所述一维键值及查询点q与当前partition的情况,对所述查询空间内的数据点进行查 询,其中,查询点q与当前partition的情况包括第一种情况和第二种情况; 第一遍历单元,用于当第一种情况时,根据查询范围,向B+_Tree树的叶子节点两边进 行遍历,查询待检索多媒体对象的d维特征向量对应的数据点p,其中,所述第一种情况为当 前Part it ion包含查询点q; 第二遍历单元,用于当第二种情况时,根据查询范围及Partition的半径,向B+-Tree树 的叶子节点内部进行遍历,其中,所述第二种情况为查询点q在当前Partition外,且所述查 询点q与查询半径r所形成的超球与Partition相交。
【文档编号】G06F17/30GK106096065SQ201610613829
【公开日】2016年11月9日
【申请日】2016年7月29日 公开号201610613829.8, CN 106096065 A, CN 106096065A, CN 201610613829, CN-A-106096065, CN106096065 A, CN106096065A, CN201610613829, CN201610613829.8
【发明人】李晖, 陈梅
【申请人】贵州大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1