一种基于上下文约束的目标识别方法

文档序号:6383513阅读:222来源:国知局
专利名称:一种基于上下文约束的目标识别方法
技术领域
本发明属于遥感图像处理领域,更具体地,涉及一种基于上下文约束的目标识别方法。
背景技术
遥感图像的目标检测及识别以其重要的军事和民用价值,在近几年来得到了飞速发展。然而由于卫星遥感图像数据量大,利用人工逐一分析并提取感兴趣信息是一项艰苦且耗时的任务,这就迫切需要我们利用计算机辅助技术来对遥感图像进行分析。自动目标识别是其中一个重要且具有挑战性的研究方向。目前针对这一问题,研究方法主要是以提供目标模板或建立目标模型,在全图范围内进行搜索匹配为主,这类方法在图像较小时通常比较适用且效果良好,但是对于大尺度的遥感图像来说,其计算量大,速度慢。而对遥感图像进行场景分类则是一种十分有效地解决目标识别问题的方法。遥感图像存储了大量丰富的信息,图像结构复杂,既包括地形、植被、水纹等自然特征,有包括了建筑物和道路等这样的人工地物,为目标识别造成了一定的困难。此外,在目标识别任务中,我们可以发现,感兴趣目标往往依赖于特定的地物类型,因此,通过事先对遥感图像进行场景分类,可以为目标识别提供上下文信息,缩小感兴趣区域范围,提高识别效率和准确率。近年来,随着模式识别技术的发展,用于场景分类的新的理论和方法技术相继涌现。如神经网络和决策树的分类精度一般都高于最大似然法,然而它们都不是稳定的分类器;如将模糊理论引入神经网络的方法,可以通过构造遥感模糊分类模型,根据隶属度大小划分类别,但是关于隶属度函数的确定,至今没有成熟的理论和法则,往往需要专家经验,具有主观性,是模糊分类方法最大的缺点。

发明内容
针对现有技术的缺陷,本发明的目的在于提供一种基于上下文约束的目标识别方法,针对的目标为自然场景中的人造建筑物,通过对遥感图像进行基于mean-shift与改进LBP特征的快速场景分类,为目标识别提供有效的上下文约束信息,并根据目标在场景中与背景的空间位置依存关系,在特定场景区域内提取特征,识别感兴趣目标,提高目标识别效率和准确率。为实现上述目的,本发明提供了一种基于上下文约束的目标识别方法,包括以下步骤(I)接收遥感目标图像,利用RGB将其转化为灰度图像,并利用mean-shift方法对灰度图像进行区域分割,以生成初始分割图像(2)采用区域生长法对初始分割图像进行标记,使得输出结果中所有的点都是由1、中的某个值进行标记,该值表示该点所在连通域的序号,同一个连通域内使用相同的标记值,不同连通域使用不同的标记值,其中N表示输出连通域的个数;
(3)根据步骤(2)的标记结果采用改进LBP算法对灰度图像进行场景分类;(4)根据步骤(3)获得的场景类别标记图,采用基于场景上下文约束的方法计算感兴趣区域。(5)根据步骤(4)中的感兴趣区域结果,计算每个感兴趣区域框内的特征向量。(6)将上述步骤(5)中得到的特征向量输入到预先训练好的分类模型中,输出分类结果,识别目标。步骤(I)具体包括以下子步骤(1-1)对灰度图像进行mean-shift滤波,并存储滤波后灰度图像的所有η个像素点(Z1, Z2,. . . Zn)在d维空间的收敛点(y:,。,Z2,。,. . . Zn c),其中d为正整数;(1-2)选取像素点集合(Zl,z2,. . . Zn)中在空间域中小于阈值113且在频域中小于阈值&的m个像素点,生成一个联合域集合(C1, C2,. . . Cm),其中hs为正整数,表示在图像平滑时采用的空间域带宽大小,hr为正的浮点数类型,表示图像平滑时采用的值域带宽;(1-3)为η个像素点分别分配标记值(L1, L2, . . . Ln),对于η个像素点中的第i个像素点,须满足当Li等于(1,2…m)中的一个元素P时,有Zi e Cp ;(1-4)去除空间域上图像区域大小小于M的图像区域,并将其合并至相邻区域中,以形成N个连通域,N个连通域形成初始分割图像Iseg ;其中M值表示初始分割图像中每个区域的最小像素个数,且N < m ;(1-5)输出初 始分割图像Iseg及连通域个数N。步骤(2)具体包括以下子步骤(2-1)为初始分割图像Iseg建立二维标记矩阵MhXw,大小为hXw,初始化二维标记矩阵Mhxw中的每个元素为O,并初始化二维标记矩阵中的连通域标记号k = O,其中h表示初始分割图像Iseg的高度,w表示初始分割图像Iseg的宽度,且O < k彡N ;(2-2)对二维标记矩阵Mhxw进行逐行逐列扫描,以判断是否查找到一个零元素,其在矩阵M中的行列号分别为i和j,若查找到则表示在初始分割图像Iseg中存在有未标记的像素点,并进入步骤(2-3),否则继续扫描,当扫描到最后一个元素时,进入步骤(2-6);(2-3)设置 k=k+l,并设置 M(i,j) = k ;(2-4)在二维标记矩阵Mhxw中以(i,j)为中心点进行8邻域搜索,以判断是否查找到一个零元素,其在矩阵M中的行列号分别为X和y,如果有则进入步骤(2-5),否则继续搜索,若搜索结束,则返回步骤(2-2);(2-5)在初始分割图像Iseg中判断坐标为(X,y)的像素点的值是否和坐标为(i,j)的像素点的值相等,如果相等,则设置M(x,y) = k,返回步骤(2-4);(2-6)最终生成一个由I N中的值标记的二维矩阵M,M中每个元素(i,j)的值P表示在原灰度图像中像素点(i, j)属于第P个连通域Regionp,其中I < p < N。步骤(3)具体包括以下子步骤(3-1)以模板窗口的方式遍历灰度图像,以计算该窗口内的LBP值,即LBPu,v,其中U,V为该3X3窗口内中心像素点的位置,并计算全图中所有像素点的LBP值;(3-2)统计步骤(2)中获得的初始分割图像Iseg中每个连通域Regionp内的LBP直方图HistLBP,横坐标X为LBP值,范围为(Γ255,纵坐标为该局部区域内LBP = x出现的次数;
(3-3)对 LBP 直方图 HistLBP 进行归一化,使得
权利要求
1.一种基于上下文约束的目标识别方法,其特征在于,包括以下步骤 (1)接收遥感目标图像,利用RGB将其转化为灰度图像,并利用mean-shift方法对灰度图像进行区域分割,以生成初始分割图像 (2)采用区域生长法对初始分割图像进行标记,使得输出结果中所有的点都是由I N中的某个值进行标记,该值表示该点所在连通域的序号,同一个连通域内使用相同的标记值,不同连通域使用不同的标记值,其中N表示输出连通域的个数; (3)根据步骤(2)的标记结果采用改进LBP算法对灰度图像进行场景分类; (4)根据步骤(3)获得的场景类别标记图,采用基于场景上下文约束的方法计算感兴趣区域。
(5)根据步骤(4)中的感兴趣区域结果,计算每个感兴趣区域框内的特征向量。
(6)将上述步骤(5)中得到的特征向量输入到预先训练好的分类模型中,输出分类结果,识别目标。
2.根据权利要求1所述的目标识别方法,其特征在于,步骤(I)具体包括以下子步骤 (1-1)对灰度图像进行mean-shift滤波,并存储滤波后灰度图像的所有η个像素点(Z1, Z2, . . . ζη)在d维空间的收敛点(Y1,。,Z2,。,. . . zn;c),其中d为正整数; (1-2)选取像素点集合(Zl,z2,. . . zn)中在空间域中小于阈值匕且在频域中小于阈值hr的m个像素点,生成一个联合域集合(C1, C2,. . . Cm),其中hs为正整数,表示在图像平滑时采用的空间域带宽大小,hr为正的浮点数类型,表示图像平滑时采用的值域带宽; (1-3)为η个像素点分别分配标记值(L1, L2,. . . Ln),对于η个像素点中的第i个像素点,须满足当Li等于(1,2…m)中的一个元素P时,有Zi e Cp ; (1-4)去除空间域上图像区域大小小于M的图像区域,并将其合并至相邻区域中,以形成N个连通域,N个连通域形成初始分割图像Iseg ;其中M值表示初始分割图像中每个区域的最小像素个数,且NSm; (1-5)输出初始分割图像Iseg及连通域个数N。
3.根据权利要求1所述的目标识别方法,其特征在于,步骤(2)具体包括以下子步骤 (2-1)为初始分割图像Iseg建立二维标记矩阵MhXw,大小为hXw,初始化二维标记矩阵Mhxw中的每个元素为O,并初始化二维标记矩阵中的连通域标记号k = O,其中h表示初始分割图像Iseg的高度,w表示初始分割图像Iseg的宽度,且O < k彡N ; (2-2)对二维标记矩阵Mhxw进行逐行逐列扫描,以判断是否查找到一个零元素,其在矩阵M中的行列号分别为i和j,若查找到则表示在初始分割图像Iseg中存在有未标记的像素点,并进入步骤(2-3),否则继续扫描,当扫描到最后一个元素时,进入步骤(2-6); (2-3)设置 k=k+l,并设置 M(i,j) = k; (2-4)在二维标记矩阵Mhxw中以(i,j)为中心点进行8邻域搜索,以判断是否查找到一个零元素,其在矩阵M中的行列号分别为X和y,如果有则进入步骤(2-5),否则继续搜索,若搜索结束,则返回步骤(2-2); (2-5)在初始分割图像Iseg中判断坐标为(X,y)的像素点的值是否和坐标为(i,j)的像素点的值相等,如果相等,则设置M(x,y) = k,返回步骤(2-4); (2-6)最终生成一个由I N中的值标记的二维矩阵M,M中每个元素(i,j)的值P表示在原灰度图像中像素点(i, j)属于第P个连通域Regionp,其中I < p < N。
4.根据权利要求1所述的目标识别方法,其特征在于,步骤(3)具体包括以下子步骤 (3-1)以模板窗口的方式遍历灰度图像,以计算该窗口内的LBP值,即LBPu, v,其中U,V为该3X3窗口内中心像素点的位置,并计算全图中所有像素点的LBP值;(3-2)统计步骤(2)中获得的初始分割图像Iseg中每个连通域Regionp内的LBP直方图 HistLBP,横坐标X为LBP值,范围为(Γ255,纵坐标为该局部区域内LBP = x出现的次数;
5.根据权利要求1所述的目标识别方法,其特征在于,步骤(4)具体包括以下子步骤 (4-1)将待识别目标可能存在的场景类别区域作为前景区域,其他场景类别区域作为背景区域,分割步骤(3)中获得的标记图,将前景区域内的像素值使用灰度值255替换,背景区域的像素值采用灰度值O替换,获得二值

图1ltesh ;(4-2)对上述步骤(4-1)中的获得的二值图1ltesh进行预处理操作;具体为对二值图1i^sh中的255所在的局部区域进行先膨胀后腐蚀的操作,并获得新的二值图1ThMsh_MW ; (4-3)根据步骤(4-2)中得到的二值图1Thresh-MW,对原始灰度图像进行感兴趣区域计算;(4-4)根据二值图1ThMsh_nOT中灰度值为255的区域,在线特征图1lim对应区域内滑动一定的矩形框大小,以50个像素为步长,计算线段长度,统计每个矩形框内的线段密度分布。
6.根据权利要求1所述的目标识别方法,其特征在于,步骤(5)具体为,对步骤(5)中提取的感兴趣区域框,根据空间关系计算每个框内的线段特征,构成几何结构,并采用特征袋方式组合产生特征向量。
7.根据权利要求1所述的目标识别方法,其特征在于,步骤(6)具体为,以步骤(5)中的特征提取算法计算得到特征向量,并输入到SVM分类器中进行训练,生成分类模型,然后, 再将当前计算得到的特征向量输入到该分类模型中,计算得到目标类别。
全文摘要
本发明公开了一种基于上下文约束的目标识别方法,属于遥感图像处理领域,用于遥感图像场景分类及目标的检测识别。该方法首先对图像进行滤波处理,然后进行区域分割,将图像分割为多个连通域,并对每个连通域进行标记,其次,计算每个连通域的特征向量,并输入到事先训练好的分类器中进行场景分类计算,输出类别标记图,接着,在此基础上,根据需要识别的目标,在标记图上划定目标可能存在的局部区域范围,并对该局部区域进行预处理操作,在该区域内计算感兴趣区域,最后,提取特征,并输入到分类器中进行识别。本发明提供了一种快速、有效的场景分类方法,旨在为目标识别提供有效的上下文约束,提高识别效率和准确率。
文档编号G06K9/66GK103049763SQ201210524038
公开日2013年4月17日 申请日期2012年12月7日 优先权日2012年12月7日
发明者王岳环, 刘畅, 陈君灵, 王军, 宋萌萌, 颜小运 申请人:华中科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1