基于深度卷积和梯度旋转不变性的航拍图像目标检测方法与流程

文档序号:11951966阅读:来源:国知局

技术特征:

1.基于深度卷积和梯度旋转不变性的航拍图像目标检测方法,其特征在于,包括以下步骤:

(1)输入航拍图像,利用BING算法对目标进行粗定位,提取包含目标的感兴趣区域;

(2)将步骤(1)提取到的感兴趣区域输入AlexNet深度卷积网络进行分析,选取AlexNet深度卷积网络的Pooling5层为最佳角度不敏感特征,即AP特征;

(3)基于旋转梯度不变性,提取感兴趣区域的旋转梯度不变特征,即RGT特征;

(4)采用SFFS算法融合步骤(2)得到的AP特征和步骤(3)得到的RGT特征,生成AP-RGT特征;

(5)使用支持向量机对生成的AP-RGT特征进行训练分类,并在SVM分类器后进行非极大值抑制的过程,过滤错误的分类;建立优化问题,求解得到目标检测结果。

2.根据权利要求1所述基于深度卷积和梯度旋转不变性的航拍图像目标检测方法,其特征在于,步骤(1)的具体过程如下:

(a)使用模板[-1,0,+1]作用于航拍图像,计算出航拍图像的梯度值bk,l,并通过尺度变换将其归一化到8*8的尺度,得到归一化的梯度特征值Ng,其中,bk,l的下标k、l分别表示模板[-1,0,+1]的行和列;

(b)利用二进制估计算法,对梯度特征值Ng进行估计,获得BING特征:

<mrow> <msub> <mi>g</mi> <mi>l</mi> </msub> <mo>=</mo> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>N</mi> <mi>g</mi> </msub> </msubsup> <msup> <mn>2</mn> <mrow> <mn>8</mn> <mo>-</mo> <mi>k</mi> </mrow> </msup> <msub> <mi>b</mi> <mrow> <mi>k</mi> <mo>,</mo> <mi>l</mi> </mrow> </msub> <mo>;</mo> </mrow>

(c)将获得的BING特征输入到LinearSVM中进行训练,得到SVM分类器,作为第一级分类器,将得到的第一级分类器作用于训练样本所在的位置,得到待选目标框,通过非极大值抑制滤去错误的待选目标框,将剩下的待选目标框作为第二级分类器的训练样本,输入到LinearSVM中进行训练,得到第二级分类器;

(d)利用穷举法从航拍图像上得到的感兴趣区域的所有待选区域,将步骤(c)得到的级联分类器作用于各个待选区域,每一个待选区域通过线性模型w∈R64打分机制进行评分:sl=<w,gl>,得分sl最高的待选区域即为感兴趣区域,其中<w,gl>表示将线性模型w和BING特征gl作内积运算。

3.根据权利要求1所述基于深度卷积和梯度旋转不变性的航拍图像目标检测方法,其特征在于,步骤(3)的具体过程如下:

(A)设提取到的感兴趣区域图像为I(x,y),S(x,y)为其对应的离散图像:

<mrow> <mi>S</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>v</mi> <mo>=</mo> <mn>0</mn> </mrow> <mi>y</mi> </munderover> <munderover> <mo>&Sigma;</mo> <mrow> <mi>u</mi> <mo>=</mo> <mn>0</mn> </mrow> <mi>x</mi> </munderover> <mi>I</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>v</mi> <mo>)</mo> </mrow> </mrow>

计算离散图像的局部空间值:

∑(x,y,s)=S(x+s,y+s)+S(x-s-1,y-s-1)-S(x+s,y-s-1)-S(x-s-1,y+s)

上式中s表示某一尺度,(x,y)为感兴趣区域内的点;

为增加特征的尺度不变性并降低计算复杂度,利用金字塔尺度空间获取不同尺度下的局部空间值,再通过比较得到局部空间极值,局部空间极值对应的尺度即为给定尺度;

(B)采用可变核函数检测感兴趣区域,在检测过程中,对于同一个点采用两个不同大小的核函数,在步骤(A)获得的给定尺度s下,内部的核函数为2s+1,外部的核函数为4s+1,则滤波器响应:

F(x,y,s)=B(x,y,s)-B(x,y,2s)

上式中B(x,y,s)为区域规范化输出:

B(x,y,s)=(2s+1)-2∑(x,y,s)

上式中∑(x,y,s)为步骤(A)得到的局部空间极值,表示大小为2s+1的区域中所有像素和;

(C)在给定尺度下获取感兴趣特征点,以感兴趣特征点为圆心抽取直径为sp的统计块,处于统计块内的点的坐标表示:

<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>s</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>{</mo> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>v</mi> <mo>)</mo> </mrow> <mo>|</mo> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <mi>s</mi> <mo>*</mo> <mi>u</mi> <mo>-</mo> <mi>x</mi> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <mi>s</mi> <mo>*</mo> <mi>v</mi> <mo>-</mo> <mi>y</mi> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <mo>&le;</mo> <mfrac> <mrow> <mi>s</mi> <mi>p</mi> </mrow> <mn>2</mn> </mfrac> <mo>}</mo> </mrow>

上式中s*u,s*v分别对应为x,y在给定尺度s下的离散值;

(D)将统计块内的笛卡尔梯度方向作为该统计块的方向,计算统计块内的梯度值并归一化,得到RGT特征。

4.根据权利要求1所述基于深度卷积和梯度旋转不变性的航拍图像目标检测方法,其特征在于,步骤(4)的具体过程如下:

(Ⅰ)设AP-RGT特征的集合为Z,集合Z初始为空集,在AP特征集和RGT特征集的并集中选择一个子集t加入集合Z中,并使加入子集t后的集合Z的评价函数达到最优;

(Ⅱ)在集合Z中剔除子集z,并使剔除子集z后的集合Z的评价函数达到最优;

(Ⅲ)循环步骤(Ⅰ)-(Ⅱ),得到nrep个候选集合Z;

(Ⅳ)计算各候选集合Z的贝叶斯分类精度:

Jnrep(Z)=1-E[{ε(Z,Tr;Dr)}]

上式中,E(*)表示求期望,ε(Z,Tr;Dr)则表示贝叶斯分类错分率,Tr表示错分的集合,Dr表示训练集,r=1,2,…,nrep;

选择贝叶斯分类精度值最大对应的集合Z作为融合后的AP-RGT特征集。

5.根据权利要求1所述基于深度卷积和梯度旋转不变性的航拍图像目标检测方法,其特征在于:在步骤(5)中,分类函数为其中xi为输入,yi为输出,,xi yi∈Z,Z为步骤(4)得到的AP-RGT特征集,为当前特征距离分类平面的间隔,为设置的特征距离分类平面的最大间隔,b为偏移量,ω为需要求取的目标检测结果;将作为优化问题的目标函数,求得该问题的最优解即为最终的目标检测结果。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1