一种基于类不可知前景挖掘的图像弱监督目标检测方法

文档序号：30269984发布日期：2022-06-02 07:49阅读：来源：国知局

技术特征：
1.一种基于类不可知前景挖掘的图像弱监督目标检测方法，其特征在于，包括：基于待进行目标检测的图像通过卷积神经网络cnn生成前景注意力图；基于所述前景注意力图计算每个候选框的前景相对置信度frc，根据各个候选框的frc筛选出前景候选框；基于所述前景候选框构建实例空间图，基于数据集的标签构建标签语义图，对所述实例空间图和所述标签语义图进行图匹配，根据图匹配结果为每个前景候选框进行分类；根据各个前景候选框的分类结果生成伪监督框，将伪监督框与伪监督框的空间近邻框进行合并得到伪实例标签，将该伪实例标签作为所述待进行目标检测的图像的目标检测结果。2.根据权利要求1所述的方法，其特征在于，所述的基于待进行目标检测的图像通过卷积神经网络cnn生成前景注意力图，包括：给定一幅待进行目标检测的图像i∈r
h
×
w
，其中h和w分别代表图像的高和宽，和候选框集p∈r
n
×4，其中n代表候选框的数量，把图像输入卷积神经网络cnn，得到图像的特征f∈r
h
×
w
×
c
，其中h,w,c分别代表特征图的高、宽和通道数；将图像特征f沿着cnn的通道方向相加，得到特征注意力图f
mask
∈r
h
×
w
，将特征注意力图f
mask
还原到图像的尺寸，得到图像注意力图mask∈r
h
×
w
，再经过标准化处理把图像注意力图mask的值转换到(0,1)，得到正则化后注意力图mask
normed
∈r
h
×
w
，其中标准化过程如公式(1)所示：mask是一个二维的矩阵，其中min()是取最小值的函数，max是取最大值的函数；计算正则化后注意力图mask
normed
的像素均值，将正则化后注意力图mask
normed
中像素值大于像素均值的区域确定为前景注意力图mask
fore
，小于像素均值的区域确定为背景部分。3.根据权利要求2所述的方法，其特征在于，所述的基于所述前景注意力图计算每个候选框的前景相对置信度frc，根据各个候选框的frc筛选出前景候选框，包括：给定一个候选框p＝x0，y0，x1，y1，该候选框区域内，先计算前景注意力图的像素值之和，再除以候选框的面积，得到该候选框p的前景相对置信度frc；选定frc在均值之上的设定数量个候选框，作为前景候选框p
fore
∈r
m
×4，其中m是前景候选框的数量。4.根据权利要求3所述的方法，其特征在于，所述的基于所述前景候选框构建实例空间图，基于数据集的标签构建标签语义图，对所述实例空间图和所述标签语义图进行图匹配，根据图匹配结果为每个前景候选框进行分类，包括：把前景候选框的特征f作为图的节点v
o
，前景候选框之间的特征拼接作为边的属性，如公式(3)所示，构建实例空间图g
o
；对数据集的语义进行词嵌入，得到每个类别的语义特征向量w，将语义特征向量作为标
签语义图的节点v
l
，相邻节点的特征拼接作为边的属性，如公式(4)所示，构建标签语义图g
l
；f，w分别代表候选框和类别标签的特征向量，[x,y]指拼接函数,将向量x和y拼接，v代表节点，e代表边；把实例空间图g
o
的每个实例与标签语义图g
l
的每个类别连接，构成实例-标签匹配图g
a
，将实例-标签匹配图中两个节点的拼接作为边的属性；将所述实例-标签匹配图输入到两层图卷积网络，对实例-标签匹配图的边属性做预测，边的预测值代表该实例属于该类别的概率，选取实例空间图中每个实例预测分数最大的边，则该边对应的类别节点为该实例的类别，该实例与所有类别节点的边的预测分数作为该实例的分类预测。5.根据权利要求4所述的方法，其特征在于，所述的根据各个前景候选框的分类结果生成伪监督框，将伪监督框与伪监督框的空间近邻框进行合并得到伪实例标签，将该伪实例标签作为所述待进行目标检测的图像的目标检测结果，包括：根据各个前景候选框的分类结果生成伪监督框，将伪监督框与伪监督框的空间近邻框进行合并得到伪实例标签，将该伪实例标签作为上述待进行目标检测的图像的目标检测结果；选择基础网络中分类分数最高的候选框p
top-score
作为伪监督信息，为每个前景候选框进行分类后，选择每个类别下分数大于该类别均值的前景候选框p
fore
也作为伪监督信息，则伪监督框p
pseudo
＝{p
top-score
，p
fore
}；再选择伪监督框p
pseudo
的空间近邻框p
pseudo-neighbor
，把空间近邻框p
pseudo-neighbor
与伪监督框p
pseudo
合并，将合并结果作为伪实例标签，将该伪实例标签作为所述待进行目标检测的图像的目标检测结果。

技术总结
本发明提供了一种基于类不可知前景挖掘的图像弱监督目标检测方法。该方法包括：基于待进行目标检测的图像通过CNN生成前景注意力图；基于前景注意力图计算每个候选框的前景相对置信度FRC，根据各个候选框的FRC筛选出前景候选框；基于前景候选框构建实例空间图，基于数据集的标签构建标签语义图，对实例空间图和标签语义图进行图匹配，根据图匹配结果为每个前景候选框进行分类；根据各个前景候选框的分类结果生成伪监督框，将伪监督框与伪监督框的空间近邻框进行合并得到伪实例标签，将该伪实例标签作为待进行目标检测的图像的目标检测结果。本发明把定位和分类任务分离，从而实现的定位与分类性能的双向提升，有效地提升图像的弱监督目标检测性能。的弱监督目标检测性能。的弱监督目标检测性能。

技术研发人员：李浥东韩瑜珊曹原周汉王涛金一徐群群
受保护的技术使用者：北京交通大学
技术研发日：2022.02.10
技术公布日：2022/6/1

完整全部详细技术资料下载

当前第2页1 2