一种基于多区域交叉权值的图像卷积特征的生成方法与流程

文档序号:13446370阅读:752来源:国知局
一种基于多区域交叉权值的图像卷积特征的生成方法与流程

本发明涉及图像检索技术领域,具体涉及一种基于多区域交叉权值的图像卷积特征的生成方法。



背景技术:

随着移动互联网的飞速发展和智能设备的广泛普及,用户每天都会上传下载海量的图像。一方面,越来越多的图像丰富了互联网上的图像资源,给人们带来了各种便利;另一方面,随着图像资源的爆炸式增长,也给人们带来了很多问题,用户难以有效地在海量的数据中准确地找到自己真正需要的信息。如何有效地组织、表达及检索图像,以便于用户可以从大量的图像数据中高效、快速地找到图像数据。

基于内容的图像检索(content-basedimageretrieval,cbir)是由katot在1992年提出的。在过去的几年中,cbir系统主要利用图像的视觉内容提取出图像的包括sift、surf、hog和gist等特征,将其存入图像特征库。当用户输入查询图像进行检索时,提取待查询图像的特征向量,将此特征向量与特征库进行相似度计算,从而得到检索结果。因此,cbir中最核心的就是图像的特征表示,优秀的特征表示可以提供更高的检索准确率。

最近几年,由于深度学习的发展,卷积神经网络(cnn)在计算机视觉领域取得了重要进展,利用深度学习的网络特征进行图像的特征表示成为了一种主流方向。然而目前cnn特征描述符在“以图搜图”应用场景下存在准确率低的不足。



技术实现要素:

本发明所要解决的是目前cnn特征描述符在“以图搜图”应用场景下准确率低的问题,提供一种基于多区域交叉权值的图像卷积特征的生成方法,使得特征更紧凑、更具有区分性和鲁棒性。

为解决上述问题,本发明是通过以下技术方案实现的:

一种基于多区域交叉权值的图像卷积特征的生成方法,包括如下步骤:

步骤1、选择任意一种用于分类后的卷积神经网络模型,在网络中截断分类的步骤即全连接层,保证网络模型对图像尺寸不具有约束;

步骤2、将原始图像输入到卷积神经网络模型中,提取原始图像的特征图x;

步骤3、从横截面角度汇聚特征图,将特征图由三维特征图x压缩成二维特征图m;并在特征图m上利用该特征图的均值模糊地标记出目标的大致位置,得到关于特征图m的掩码图mask;

步骤4、将特征图m减去其均值得到新的特征图并将新的特征图与掩码图mask经过加权后,生成关于特征图m的空间权重图sal;

步骤5、对于特征图m,在每个尺度上进行均匀采样,实现特征图m的区域划分;

步骤6、根据空间权重图sal,计算区域空间权重sali、区域权重wi和通道权重channelj;

步骤7、根据区域空间权重sali、区域权重wi和通道权重channelj,交叉聚合特征图x,生成新的图像特征表示;

上述i∈[1,n],n表示划分区域的总数,j∈[1,k],k表示通道的总数。

上述步骤3中,掩码图mask为:

式中,m(x,y)表示特征图m的位置点,mask(x,y)表示掩码图mask的位置点,表示特征图m的均值。

上述步骤4中,空间权重图sal为:

式中,sal(x,y)表示空间权重图sal的位置点,表示新的特征图的位置点,表示新的特征图。

上述步骤5中,在每个尺度l上均匀采样宽度为2min(w,h)/(l+1)的区域,其中w表示原始图像的宽度,h表示原始图像的高度,l表示尺度。

上述步骤5中,在采样每个尺度的区域时,允许连续区域之间有一定比率的重叠。

上述步骤6中,第i个区域的区域空间权重sali为:

sali={sal(x,y)}

式中,sal(x,y)表示空间权重图sal的位置点,(x,y)属于第i个区域的位置点,i∈[1,n],n表示划分区域的总数。

上述步骤6中,第i个区域的区域权重wi为:

wi=max(a(x,y))

式中,a(x,y)表示空间权重图sal的位置点的归一化值,(x,y)属于第i个区域的位置点,i∈[1,n],n表示区域的总数。

上述步骤6中,第j个通道的通道权重channelj为:

式中,nonzeroj表示每个通道中非零的数目,nzsum表示所有通道的非零数目总和,j∈[1,k],k表示通道的总数。

上述步骤7中,生成新的图像特征表示为:

式中,fi,j=sali·channelj·x(x,y);wi表示第i个区域的区域权重,sali表示第i个区域的区域空间权重,channelj表示第j个通道的通道权重,x(x,y)表示特征图x的位置点,(x,y)属于第i个区域的位置点,i∈[1,n],n表示划分区域的总数,j∈[1,k],k表示通道的总数。

与现有技术相比,本发明利用不经过任何微调的cnn网络模型,使用目标模糊标记结合空间权重来进行加权操作,再引入多区域与交叉加权策略生成图像特征表示rcrow。与现有技术相比,本发明生成的图像特征表示,在应用于检索任务表现出明显优势,较好地突出图片目标区域,同时抑制了背景噪声区域,将该图像描述符应用于图像检索,能够提高检索准确率,达到精确检索的目的。

附图说明

图1为一种基于多区域交叉权值的图像卷积特征的生成方法的流程图。

图2为特征图的转换示意图。

图3为不同尺度(l=1、2、3)在特征图上采样不同区域示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实例,并参照附图,对本发明进一步详细说明。

一种基于多区域交叉权值的图像卷积特征的生成方法,如图1所示,具体包括如下步骤:

步骤1:选择任意一种用于分类后的卷积神经网络模型,在网络中截断分类的步骤(即全连接层),保证网络模型对图像尺寸不具有约束。

对于cnn模型的选择,可以是任意预训练过的模型,不需要在检索数据集上做任何微调处理。对于cnn模型本身,需要去除相关的全连接层,以保证图片以原先尺寸输入到cnn网络中。

在传统的深度卷积神经网络模型中,把最终获得的k个特征图从三维张量拉成一个一维的长向量,并用这个长向量代表原始图像进行运算,比如将该长向量作为特征输入一个分类器,进行图像搜索等等。但一般一维长向量维度会很高,因此可对原始特征图进行聚合操作,缩减维度并保证原始向量的区分性。

步骤2:将原始图像输入到卷积神经网络模型中,选取最后一层卷积或池化层,提取特征图其中k为通道数目、w*h为输入特征图的空间分辨率。

本实施例中选择vgg模型作为卷积神经网络模型,选择pool5层的激活响应作为cnn特征,其中k=512、w和h与输入图像大小相关。

步骤3:对于特征图x,从横截面角度汇聚特征图,将原先特征图转变二维特征图m。在二维特征图上利用减去图像均值的方法模糊地标记出目标的位置,并通过二值图像最大联通区域划分方式优化目标的位置,记作mask,突出了目标位置和降低周围背景和噪声区域的影响。如图2所示。

提取出的特征图x为三维张量,目前已有的图像检索方法主要从两种角度聚合编码特征表示:如图2所示,沿虚线切割特征图,将k个2d的特征图x={xj},j=1,2…,k,表示为k维特征向量;或者沿纵轴方向切割,表示为w*h个k维向量。两种角度虽然都有效的压缩了图像特征向量的维度,但均未考虑到特征图中噪音或者背景区域的影响,本发明采用对特征图进行空间加权策略,区分目标区域和噪声区域。从横截面角度汇聚特征图,将原先特征图转变二维特征图对m中所有位置的激活响应求取平均值作为阈值模糊决定哪些空间位置上对应于目标:激活响应高于的位置(i,j)表示目标可能出现的位置,计算关于m的掩码图:

在特征图m上利用减去图像均值的方法模糊地标记出目标的位置后,并通过二值图像最大联通区域划分方式优化目标的位置,突出了目标位置和降低周围背景和噪声区域的影响。

步骤4:mask模糊标记出目标区域后,将特征图m减去其均值得到一个存在负数、零和正数的新的特征图mask模糊标记出目标区域后,简单的将图像目标区域外的区域标记为0值,很显然的丢弃了场景信息。为了进一步增加图像特征表示的区分能力,将新的特征图与mask经过相应的加权方式生成关于特征图m的空间权重图sal。

其中

步骤5:给定特征图,如图3所示,在每个尺度l上均匀采样宽度为2min(w,h)/(l+1)的区域,同时采样每个尺度的区域时允许连续区域之间有大约40%的重叠。对于划分后的正方形区域ri∈[1,w]×[1,h],其中若划分出n个区域,则区域共有n个,i∈[1,n]。

本实施例中显示了l=1,2,3时,分别采用了三种大小的窗口滑动特征图,并且在后续多区域中默认使用了尺度l=3的情况。

步骤6:计算多区域下的空间权重sali,在步骤4中计算出了整个特征图的空间权重图sal,根据区域划分直接在sal中划分出每个区域的sali:

sali={sal(x,y)}

其中sal(x,y)为空间权重图sal的位置点,(x,y)属于第i个区域的位置点,{·}表示选取关于区域的一个点的集合。

步骤7:计算多区域下的区域权重wi,本发明用一个简单有效的显著性算法,即将步骤3中的sal作为显著图a,然后将显著图a进行最大归一化,使得每个元素p具有一个范围,ap∈[0,1]。在显著图a上定义相同的区域,对于每个区域计算出权重wi:

wi=max(ap)

步骤8:计算每个通道的通道权重channelj。对多区域下的特征图x,统计每个通道中非零的数目nonzeroj,其中j∈[1,k]。计算所有通道的非零数目总和nzsum,计算通道权重:

步骤9:根据三种权重,交叉聚合特征图xl,生成新的图像特征表示rcrow。

式中,fi,j=sali·channelj·x(x,y);wi表示第i个区域的区域权重,sali表示第i个区域的区域空间权重,channelj表示第j个通道的通道权重,x(x,y)表示特征图x的位置点,(x,y)属于第i个区域的位置点,i∈[1,n],n表示划分区域的总数,j∈[1,k],k表示通道的总数。

采用上述方法获得图像特征表示后,输入待查询图像q,与数据库中特征描述符通过计算余弦相似度进行排序,选择距离较小的输出为相似图像即可完成图像检索。

本发明对将原始图像输入具有n层卷积(即n个区域)和池化的卷积神经网络后所获得的k个特征图(即k个通道)进行处理,其中n、k均为整数并且n≥1、k≥1,其处理方法包括:在k个特征图中模糊地标记出目标位置,利用得到的目标位置和深度卷积特征计算空间权重图;计算k个特征图在不同尺度下的区域大小,分别计算不同区域下的空间权重、通道权重和区域权重;针对每个区域利用交叉权重进行聚合操作,并将多个区域的特征向量相加,得到图像的k维特征表示。本发明依据是一般图片中的物体都在中心区域的特点,在深度卷积特征上预先估计目标的位置,通过多区域交叉权值的方法生成图像特征表示。生成的特征表示应用于图像检索领域,提高了检索准确率,达到精确检索的目的。

需要说明的是,尽管以上本发明所述的实施例是说明性的,但这并非是对本发明的限制,因此本发明并不局限于上述具体实施方式中。在不脱离本发明原理的情况下,凡是本领域技术人员在本发明的启示下获得的其它实施方式,均视为在本发明的保护之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1