一种面向位置识别的图像相似度检测方法

文档序号:9667781阅读:526来源:国知局
一种面向位置识别的图像相似度检测方法
【技术领域】
[0001] 本发明涉及一种面向位置识别的图像相似度检测方法,属于图像识别技术领域。
【背景技术】
[0002] 图像相似度检测是土相匹配、图像检索、模式识别中的核心环节,在 SLAM(SimultaneousLocalizationsandMapping)应用中,需要进行闭合环路检测,就是 通过首尾图像的相似度检测判断是否为同一场景来完成;零位,在机器人自主导航定位中, 当机器人第二次来到某一环境中,机器人需要确定自己在环境中的位置,然而在室内、高达 建筑物周围、低下洞穴等一些特殊场景中定位设备无法使用时,就需要使用机器人内部传 感确定位置,此时可以利用图像相似度检测的方法找出与机器人第一次到达该环境时的同 一场景进行定位。
[0003] 计算两幅图像的相似度的关键是为图像构建一个可以描述图像本质特征的向量 或者矩阵。总的来说,构建像描述向量的方法可以分为两类:一种方法是将图像作为一个 整体进行描述,例如图像颜色直方图,图像聚合向量以及GIST。图像直方图可以看作是图 像的全局特征,由于其易于窃诘获取和理解,因此广泛的应用描述图像。但是图像直方图并 未考虑像素之间的空间位置关系,不同的图像可能有相似的直方图。另外,用直方图描述图 像缺乏鲁棒性,当图像的分辨率、环境光照发生变化、场景中部分物体消失或者新物体出现 时,图像直方图也会发生明显的变化。
[0004] 第二种方法是采用局部特征描述图像,例如SIFT(ScaleInvariantFeature Transform),SURF(Speed_UpRobustFeature),描述图像中若干包含特征点的图像块,进 而达到描述图像的目的。典型的方法是采用B〇W(bag-〇fwords)模型,将图像的所有特征 点描述向量向词汇表做投影,最终为图像构建一个反映图像包含词汇情况的描述向量。 BoW模型在图像识别分类、目标识别记忆基于图像内容的图像检索(CBIR(C〇ntent-baSed imageretrieval))任务中都取得了 很好的效果。FAB_MAP(FastAppearanceBased Mapping)是一项位置识别和地图构建的技术,广泛的应用于闭合环路检测问题,其中BoW 模型用于为测试视频的每一帧构建描述向量。首先提取测试视频所有帧上的特征点,计算 每一个特征点描述向量;采用K-means方法对提取的所有特征向量进行聚类构建词汇表; 将每一帧上的特征点向词汇表上做投影为每一帧构建描述向量。这种采用BoW模型构建图 像帧描述向量的方法一般会消耗大量的时间和内存,用于构建词汇表的特征数目有时会过 于庞大,使得采用K-means进行聚类的过程难以完成。

【发明内容】

[0005] 本发明的目的是提供一种面向位置识别的图像相似度检测方法,以解决目前图像 相似度检测鲁棒性低、计算量大的问题。
[0006] 本发明为解决上述技术问题提供了一种面向位置识别的图像相似度检测方法,该 检测方法包括以下步骤:
[0007] 1)对待检测的原始图像进行超像素分割,得到超像素块;
[0008] 2)利用卷积神经网络模型生成待检测原始图像的特征图,将每个超像素块映射到 每层的特征图上计算每个超像素块的描述向量;
[0009] 3)将待检测原始图像进行划分成均匀的图像块,根据图像块包含的超像素块计算 每个图像块描述向量;
[0010] 4)利用得到的每个图像块描述向量计算待检测两幅图像中对应图像块之间的相 似度,各对应图像块相似度的均值即为图像之间相似度。
[0011] 所述步骤2)每个超像素块描述向量的计算过程如下:
[0012] A.将卷机神经网络模型作用于原始图像生成若干中间层,选取Μ个输出层中的所 有特征图作为待检测原始图像的特征图,并将其调整至原始图像大小;
[0013] Β.计算原始图像上每一个超像素块在每一个底层卷积输出层特征图上对应区域 中所有像素的信息熵,为每个超像素块产生维数为底层卷积输出层特征图个数的描述向 量;
[0014] C.计算原始图像上每一个超像素块在每一个较高卷积输出层特征图上对应区域 中所有像素的平均值,为每个超像素块产生维数为较高卷积输出层特征图个数的描述向 量;
[0015] D.综合步骤Β和C中得到的描述向量即为每个超像素块描述向量。
[0016] 所述步骤Β中对应区域中所有像素的信息熵Η为:
[0017]
[0018] Pi=η;/total
[0019] 其中Pi为每个bins发生的概率,bins为统计区域中像素最大值与最小值之间等 间隔划分的像素区间,&为统计区域中落在每个bins中的像素个数,tatal为区域像素总 数。
[0020] 所述步骤3)中每个图像块描述向量为:
[0021]
[0022] 其中num为图像块中包含的超像素块数目,weight为第i块超像素的权重, .v/'_c/<;wr,为第i块超像素的描述向量。
[0023] 所述每个超像素块的权重weight为:
[0024]
[0025] 其中sp_num为超像素块在图像块区域中包含的像素个数,total_num为图像块区 域中的像素总数。
[0026] 所述步骤4)中各图像块之间相似度pat_simi为:
[0027]
[0028] 其中为图像块1的归一化的描述向量,为图像块2的归一化 的描述向量。
[0029] 所述步骤1)是采用线性迭代聚类的方法进行超像素分割。
[0030] 所述图像块像素度计算时可将图像包含的图像块描述向量组成描述矩阵,用第一 幅图像的描述矩阵与第二幅图像描述矩阵的转置点乘,得到相似矩阵S,其中S的第i行第 j列的元素S、,表述第一幅图像上第i个图像块与第二幅图像上第j个图像块之间的相似 度,S中每个对角线元素即为对应图像块的相似度。
[0031] 本发明的有益效果是:本发明首先对图像进行超像素分割,结合CNN模型生成图 像的特征图,并计算每个超像素块的描述向量;然后将待检测图像划分成均匀的图像块,根 据图像块包含的超像素块计算每个图像块描述向量,构成图像的描述矩阵;利用得到的每 个图像块描述向量计算待检测两幅图像中对应图像块之间的相似度,各对应图像块相似度 的均值即为本发明所求的两幅图像之间相似度。本发明具有较高的鲁棒性,且计算量小,易 实现,即使同一场景内容发生了变化,都能够有效准确的识别,同时还能够及时准确的从序 列影像中找到最相似图像。
【附图说明】
[0032]图1是超像素块描述向量的计算流程图;
[0033] 图2-a是实验例1中来自同一场景的1#图像;
[0034] 图2-b是实验例1中来自同一场景的2#图像;
[0035] 图2-c是实验例1中来自同一场景图像对的相似矩阵示意图;
[0036] 图3-a是实验例1中来自不同场景的1#图像;
[0037] 图3-b是实验例1中来自不同场景的2#图像;
[0038] 图3-c是实验例1中来自不同场景图像对的相似矩阵示意图;
[0039] 图4是实验例2中所选取的测试图像;
[0040]图5是实验例2利用本发明所找到的最相似的一帧图像;
[0041] 图6是实验例2中得到相似度曲线。
【具体实施方式】
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1