一种基于深度卷积神经网络的目标分类及姿态检测方法与流程

文档序号：11922162阅读：来源：国知局

技术特征：

1.一种基于深度卷积神经网络的目标分类及姿态检测方法，其特征在于包括以下步骤：

a)制作样本集，包括训练集和测试集，每张样本图像可包含多个目标，每个目标用六个参数(l,x,y,h,w,θ)进行表示，l代表该目标的标签，x和y代表目标中心在图像中的横纵坐标，h和w代表目标真值窗口的高和宽，θ表示目标相对于基准轴的姿态角；

b)候选窗口生成过程，在整幅图像上以一定步长均匀生成候选窗口，窗口采用不同尺寸和不同姿态角的矩形框；

c)深度特征提取过程，先将待检测的图像输入到预先训练的模型进行计算得到深度卷积特征图，将b)当中生成的候选窗口依据图像金字塔的机制映射到深度卷积特征图上面生成固定维度的特征向量；

d)子网络构建过程，在获得的卷积特征层的基础上，构建三个子网络分别用于识别目标种类、修正候选窗口位置和预测目标姿态角，对于网络中新添加的层，采用Xavier初始化方法建立参数；

e)训练样本的生成过程，样本中不仅包含图像，还包含候选窗口的正负样本，正负样本依据候选窗口与真值窗口的重叠比例(IOU)进行划分，使样本集中正负样本比例接近于1:1；

f)网络训练过程，通过批量随机梯度下降法对网络参数进行调整，每次训练需至少输入一幅图像，保证正样本数量的前提下随机抽取负样本，在训练起始阶段通过较大学习率对参数进行更新，在网络输出误差减小缓慢时减小学习率；

g)目标标注步骤，输入一幅待检测图像，利用训练完成的网络进行计算，得到候选窗口的类别、位置偏移量、姿态角和分数，设定阈值排除分数较低的窗口，通过极大值抑制方法保留分数较高的窗口作为最终检测结果，利用具备姿态角的矩形窗口框选目标位置。

2.根据权利要求1所述的方法，其特征在于，步骤a中所述姿态角通过对目标构成点阵做最小面积包围矩形得到，该包围矩形长轴方向与基准轴之间的夹角即为姿态角。

3.根据权利要求1所述的方法，其特征在于，步骤b中所述候选窗口通过对传统检测中使用的正立矩形框进行旋转得到，旋转中心为在图像上以一定步长均匀分布的参考点。

4.根据权利要求1所述的方法，其特征在于，步骤f中所述训练方法包括：

采用批量梯度下降对网络参数进行迭代更新，网络的代价函数由多项构成，公式为

式中，W和b为网络需要调整的参数；N表示单次批量随机梯度下降采用的样本数量；J₁为分类误差项，代表候选窗口的分类误差，l_i'为预测标签，l_i为目标真实标签；J₂为位置误差项，表示候选窗口与真值窗口的位置偏差，p_i'是由网络输出的对候选窗口位置的修正量，p_i是真值相对于候选窗口的位置偏差量，1{·}为指示函数，当花括号内表述为真(样本为正样本)时等于1，否则等于0；J₃为角度误差项，用于计算候选窗口与真值窗口的角度误差，θ_i'为网络输出的目标姿态角对候选窗口角度的修正量，θ_i为目标真实姿态角与候选窗口角度的偏差量；λ和μ用来平衡三项之间的权重。

完整全部详细技术资料下载

当前第2页1 2 3