一种改进的基于稀疏表示的多目标检测方法

文档序号:10697783阅读:227来源:国知局
一种改进的基于稀疏表示的多目标检测方法
【专利摘要】本发明公开了一种改进的基于稀疏表示的多目标检测方法,首先提取训练样本的HOG特征,并采用K?SVD算法对其进行稀疏表示得过完备字典D;然后采用滑动窗口和多尺度策略遍历待检测图像,提取各图像子块的HOG特征,并基于过完备字典D进行稀疏表示;第三,利用重构误差的差异结合自适应阈值设定方法实现对多个目标的初步定位;最后,设计了一种窗口合并策略,对多个目标进行精确检测。本发明中提出的窗口合并策略,利用窗口中心位置及窗口尺寸,对多个目标定位窗口进行区分,使它们分别准确对应所属的目标;然后,利用重构误差,将同一目标对应的多个重叠定位窗口进行有效合并,保证了目标的鲁棒及精确性检测。
【专利说明】
-种改进的基于稀疏表示的多目标检测方法
技术领域
[0001] 本发明设及一种改进的基于稀疏表示的多目标检测方法,属于图像处理和计算机 视觉技术领域。
【背景技术】
[0002] 目标检测是计算机视觉领域一个重要的分支,广泛应用于视频监控、智能交通、医 疗诊断、军事侦察W及精确制导等诸多领域,对其研究具有重要的理论意义和应用价值。但 是,目标所处背景的复杂性和多样性使得传统的目标检测方法难W克服噪声干扰、背景杂 波、遮挡W及光照、视角、尺度和姿态变化等因素的影响。近年来,随着稀疏表示理论研究的 深入,研究人员发现稀疏表示理论可W有效应用于目标检测问题中,其对光照变化及噪声、 遮挡等具有较好的鲁棒性。但是,传统的基于稀疏表示的目标检测方法,通常依据经验设定 检测阔值,导致其不能很好地检测各种类型的图像,限制了其方法的适用性。另一方面,为 了避免漏检情况的发生,传统的基于稀疏表示的目标检测方法,通常采用滑动窗口和多尺 度策略对目标进行检测,导致图像中同一目标对应多个重叠定位窗口,而运些重叠定位窗 口却无法有效合并,最终导致目标检测精确性和鲁棒性下降。此外,当图像中存在多个待检 测目标时,传统的基于稀疏表示的目标检测方法也无法有效区分邻近目标,造成检测率不 局。

【发明内容】

[0003] 发明目的:为了克服上述缺陷,本发明提供了一种改进的基于稀疏表示的多目标 检测方法,与传统的基于稀疏表示的目标检测方法相比,它包含了一种新的窗口合并策略, 利用窗口中屯、位置及窗口尺寸,对多个目标定位窗口进行区分,使它们分别准确对应所属 的目标;然后,利用重构误差,将同一目标对应的多个重叠定位窗口进行有效合并,保证了 目标的鲁棒及精确性检测。
[0004] 技术方案:一种改进的基于稀疏表示的多目标检测方法,其具体步骤如下:
[0005] (1)样本训练阶段:
[0006] 第一步,输入m个训练样本图像,将尺寸归一化为row X column,构成训练样本图像 集。
[0007] 第二步,提取训练样本图像集的册G特征f 1,f2,…,fm。
[000引第立步,将训练样本图像集的册G特征fl,f2,…,fm用K-SVD算法训练,得到过完备 字典D。
[0009] (2)目标检测阶段:
[0010] 第一步,输入待检测图像I。
[0011] 第二步,采用滑动窗口和多尺度策略遍历待检测图像,得到多尺度(设有S个尺度) 的图像子块,将各图像子块尺寸归一化为row X CO lumn。
[0012 ]第Ξ步,提取各图像子块的册G特征gi,醉,…,gN。
[0013] 第四步,基于过完备字典D对待检测图像子块的HOG特征gi,g2,-',gN进行稀疏表 /J、- 〇
[0014] 第五步,计算待检测图像每个子块的重构误差Si(i = l,2,…,N)。
[001引第六步,基于重构误差51(1 = 1,2,。'斯的差异,采用自适应阔值设定的方法对多 个目标进行初步定位,得到多个目标定位窗口。
[0016] 第屯步,设计一种新的窗口合并策略,对多个目标定位窗口进行区分,使它们分别 准确对应所属的目标;然后,利用重构误差,将同一目标对应的多个重叠定位窗口进行有效 合并,最终得到多个目标的精确检测结果。
[0017] 其中,目标检测阶段第六步,提出的一种基于重构误差和自适应阔值设定的目标 初步定位方法,其具体步骤如下:
[001引第一步,提取重构误差Si ( i = 1,2,…,N)中的最大值Sbig和最小值Ssmall,按照权重 因子k分配权重,计算得到阔值τ。其中,权重因子k的取值是一个经验值。
[0019]第二步,将每个重构误差Si(i = l,2,…,N)与阔值τ进行比较,如果大于阔值τ,则 判定为背景;如果小于等于阔值τ,就判定检测到目标,然后将运些目标初步定位窗口的相 关信息,包括窗口中屯、位置坐标(xpj,ypj)、窗口尺寸(wpj,hpj)和重构误差Spj,保存在窗口信 息矩阵Mp(p=l,2,…,S)中。其中P表示该窗口对应第P个尺度,又称为窗口位于第P层。
[0020]更进一步地,目标检测阶段第屯步,提出的一种新的基于窗口合并策略的目标精 确检测方法的具体步骤如下:
[0021 ]第一步,针对每一个尺度P,利用窗口中屯、位置及窗口尺寸,对目标检测阶段第六 步得到的多个目标定位窗口进行区分,使它们分别准确对应所属的目标。
[0022] 第二步,在尺度P下,针对同一目标对应的多个重叠定位窗口,对其中屯、位置坐标 (xpj,ypj)依据重构误差Spj的大小,分配权重。其中,重构误差越小的窗口,分配给它的权重 越大。然后,基于权重,重新计算该目标的中屯、位置坐标(Xpi,ypi),达到重叠定位窗口合并 的目的。同时,按照权重,加权计算合并后窗口的重构误差Spi。最终,我们得到该尺度下同一 目标对应的合并后的定位窗口,该窗口的相关信息保存在窗口信息矩阵Mpi = (xpi,ypi,wpi, hplAl)中。其中,(Wpl,hpl)表示该窗口的尺寸,p表示该窗口位于第p层;1表示该窗口在第p 层的编号。
[0023] 第Ξ步,针对每一个尺度P,依次合并同一目标对应的多个重叠定位窗口,将合并 后窗口的相关信息保存在窗口信息矩阵Mpi(p = l,2,…,S;l = l,2,…,L)中。其中,L为第P层 内合并后窗口的个数,表示第P层共检测到L个目标。
[0024] 第四步,针对所有S个尺度,将同一目标对应的合并后的重叠定位窗口的信息矩阵 Mpi(p = l,2,…,S;l = l,2,…,L),依据误差大小,对其分配权重。其中,误差越小的窗口,分 配给它的权重越大。然后,基于权重,更新该目标的最终位置和尺寸,得到目标精确检测结 果Br=(Xr,yr,Wr,hr),(r=l,2,…,n)。其中,Xr,yr为最终合并后窗口的坐标值,Wr为最终合 并后窗口的宽度,hr为最终合并后窗口的高度,η为最终合并后窗口的个数,表示图像中共 检测到η个目标。
[0025] 本发明采用上述技术方案,具有W下有益效果:
[0026] (1)本发明采用滑动窗口和多尺度策略遍历待检测图像,有效解决图像中待检测 的多个目标大小不同的问题,提高了目标的检测率。
[0027] (2)本发明提出一种基于重构误差和自适应阔值设定的目标初步定位方法,对同 一目标提取多个重叠定位窗口。
[0028] (3)本发明设计了一种新的基于窗口合并策略的目标精确检测方法,先对每一个 尺度下的多个目标定位窗口进行区分,得到该尺度下同一目标对应的合并后的重叠定位窗 口,然后将所有尺度下同一目标对应的重叠定位窗口再次合并,得到目标精确检测结果。
[0029] 综上所述,本发明与传统的基于稀疏表示的目标检测方法相比,能够有效提高目 标检测的准确性和鲁棒性。
【附图说明】
[0030] 图1为本发明的整体算法流程图;
[0031 ]图2为基于窗口合并策略的目标精确检测算法流程图;
[0032] 图3为实施例目标检测结果图,其中,(a)为基于重构误差和自适应阔值设定的目 标初步定位结果图,(b)为基于窗口合并策略的目标精确检测结果图。
【具体实施方式】
[0033] 下面结合具体实施例,进一步阐明本发明,应理解运些实施例仅用于说明本发明 而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价 形式的修改均落于本申请所附权利要求所限定的范围。
[0034] 本发明提供了一种改进的基于稀疏表示的多目标检测方法,其流程如图1所示,下 面W含有多个行人目标的待检测图像为例,具体说明本发明的实施方式:
[0035] (1)样本训练阶段:
[0036] 第一步,输入924个训练样本图像,将尺寸归一化为32X32,构成训练样本图像集。
[0037] 第二步,提取训练样本图像集的HOG特征。若提取HOG特征时每8X8个像素组成一 个cell,每2 X 2个cell组成一个block,每个cell有9个特征(即9个梯度方向),则每个block 有4X9 = 36个特征。对归一化成32X32的训练样本图像,W8个像素为步长,将有4X4个 cell,即3X3 = 9个block。也就是说,每个图像子块将得到36X9 = 324个HOG特征,将其按列 展开成324 XI的列向量,则924个运样的列向量横向组合在一起,构成一个324X924维的矩 阵,即为训练样本图像集的册G特征向量集。
[003引第立步,将训练样本图像集的册G特征f 1,f 2,…,f 924用K-SVD算法训练,得到过完备 字典D。
[0039] (2)目标检测阶段:
[0040] 第一步,输入待检测图像I。
[0041] 第二步,采用滑动窗口和多尺度策略遍历待检测图像,得到多尺度(设有S个尺度) 的待检测图像子块,将各图像子块尺寸归一化成与训练样本图像相同的尺寸,如32X32。
[0042] 第立步,提取各图像子块的册G特征gi,g2,…,gN。
[0043] 第四步,基于过完备字典D对待检测图像子块的HOG特征gi,g2,-',gN进行稀疏表 /J、- 〇
[0044] 第五步,计算待检测图像每个子块的重构误差Si(i = l,2,…,N)。
[0045] 第六步,若待检测图像子块包含目标,则其重构误差较小;否则,重构误差较大。基 于重构误差Si(i = l,2,···,N)的运个差异,采用自适应阔值设定的方法对目标进行初步定 位,具体实现步骤如下:
[0046] (a)根据目标检测阶段第五步中得到的重构误差Si(i = l,2,…,N),选出其中的最 大值Sbig和最小值Ssmall,则阔值τ可由式(1)计算得到:
[0047]
(1)
[004引其中,权重因子k的取值是一个经验值,一般取作整数。
[0049] (b)将每个重构误差δl(i = l,2,…,N)与阔值τ进行比较,如果大于阔值τ,则判定 为背景;如果小于等于阔值τ,就判定检测到目标,然后将运些目标初步定位窗口的相关信 息,包括窗口中屯、位置坐标(xpj,ypj)、窗口尺寸(wp非Ρ如日重构误差δρ^,保存在窗口信息矩 阵Μρ (Ρ = 1,2,…,S)中,其中Ρ表示该窗口对应第Ρ个尺度,又称为窗口位于第Ρ层。
[0050] 第屯步,基于窗口合并策略的目标精确检测的流程如图2所示,具体步骤如下:
[0051 ] (a)根据目标检测阶段第六步得到目标初步定位窗口的信息(xpj,ypj,δρ^),其中, (Xpj,ypj)表不窗口的中心位置坐t不且(Xpj,ypj) ΕΜρ ,Μρ为窗口 f曰息矩阵,表不(Xpj,ypj)对应 第ρ个尺度为(Wp,hp)的窗口,即Wpf Wp,hpf hp,Sp功该窗口的重构误差。如图3(a)所示,图 中不同尺度大小的窗口,即表示不同层的窗口。
[0052] (b)对于第P层内的目标定位窗口,进行如下操作:
[OOM] ?设(Xpi,ypi,Spi)与(xpj,ypj,Spj)为第P层的目标定位窗口信息序列,若满足式 (2),则判定其检测到同一目标,并将其归到同一目标组Ai(l = l,2,…,qi),其中,1表示第P 层的目标组数,qi表示第P层共有qi个目标组,即第P层共检测到qi个目标。
[0056] ?将第P层内的目标定位窗口依次两两进行比较,并将满足式(2)的重叠定位窗口 归到同一目标组Ai中。
[0057] ?第P层内目标定位窗口两两比较结束后,将同一目标组Ai中的重叠定位窗口按 权重进行合并,则合并后窗口的坐标值可由下列表达式表示:
[0060] 其中,权重因子
z = l,2,…,nl,nl表示目标组Al中共包含nl个待 合并的重叠定位窗口。
[0061] ?目标组Ai中合并后的窗口的相关信息保存在窗口信息矩阵Mpi=(xpi,ypi,wpi, hpi,δρ?)中。其中,xpi,ypi为合并后窗口的坐标值,wpi即为Wp,hpi即为hp,δρ?为合并后窗口的 重构误差,由式(5)计算得到:
[0062]
(5)
[0063] (C)各层内的重叠定位窗口合并完成后,再进行各层之间重叠定位窗口的合并,具 体步骤如下:
[0064] 参设(Xpi,ypi , Wpi ,hpi , δρ?)与(Xqj , yqj , Wqj , hqj , Sqj )为不问层的目柄;走位窗口 f曰息序 列,若满足式(6),则判定其检测到同一目标,并将其归到同一个目标组Br(r=l,2,…,Q2), 其中,r表示目标组的个数,Q2表示共有Q2个目标组,即共检测到Q2个目标;
[0067] ?将不同层之间的目标定位窗口依次两两进行比较,并将满足式(6)的重叠定位 窗口归到同一目标组Br中;
[0068] ?不同层之间的目标定位窗口两两比较结束后,将同一目标组Br中的重叠定位窗 口按权重进行合并。则合并后窗口的坐标值和尺寸由下列表达式进行求解:
[0073] 其中,权重因子
,z = 1,2 ,…,Π2,η2表示该目标组Br中共包含Π2 个待合并的重叠定位窗口;
[0074] 针对目标组Br,合并后的窗口记为Br = (Xr,yr,Wr,hr),(r=l,2,…,η),其中,Xr,yr 为最终合并后窗口的坐标值,Wr为最终合并后窗口的宽度,hr为最终合并后窗口的高度,η为 最终合并后窗口的个数,表示图像中最终一共检测到了η个目标,如图3(b)所示。
【主权项】
1. 一种改进的基于稀疏表示的多目标检测方法,其特征在于,包括如下步骤: (1) 样本训练阶段: 第一步,输入m个训练样本图像,将尺寸归一化为row X column,构成训练样本图像集; 第二步,提取训练样本图像集的HOG特征f i,f2,…,fm; 第三步,将训练样本图像集的HOG特征心,5,'"上用1(-5¥0算法训练,得到过完备字典 D; (2) 目标检测阶段: 第一步,输入待检测图像I; 第二步,采用滑动窗口和多尺度策略遍历待检测图像,得到多尺度的图像子块,将各图 像子块尺寸归一化为row X column; 第三步,提取各图像子块的HOG特征gl,g2,…,gN; 第四步,基于过完备字典D对待检测图像子块的HOG特征gl,g2,…,gN进行稀疏表示; 第五步,计算待检测图像每个子块的重构误差^(1 = 1,2,…,N); 第六步,基于重构误差心(? = 1,2,···,Ν)的差异,采用自适应阈值设定的方法对多个目 标进行初步定位,得到多个目标定位窗口; 第七步,设计一种新的窗口合并策略,对多个目标定位窗口进行区分,使它们分别准确 对应所属的目标;然后,利用重构误差,将同一目标对应的多个重叠定位窗口进行有效合 并,最终得到多个目标的精确检测结果。2. 根据权利要求1所述的改进的基于稀疏表示的多目标检测方法,其特征在于,所述目 标检测阶段第六步提出了一种基于重构误差和自适应阈值设定的目标初步定位方法,其具 体步骤如下: 第一步,提取重构误差Si(i = 1,2,…,Ν)中的最大值Sbig和最小值Ssmall,按照权重因子k 分配权重,计算得到阈值τ;其中,权重因子k的取值是一个经验值。 第二步,将每个重构误差心(i = l,2,…,N)与阈值τ进行比较,如果大于阈值τ,则判定为 背景;如果小于等于阈值τ,就判定检测到目标,然后将这些目标初步定位窗口的相关信息, 包括窗口中心位置坐标()、窗口尺寸(,h w)和重构误差,保存在窗口信息矩阵仏 (ρ = 1,2,···,S)中,其中,ρ表示该窗口对应第ρ个尺度,又称为窗口位于第ρ层。3. 根据权利要求1所述的改进的基于稀疏表示的多目标检测方法,其特征在于,所述目 标检测阶段第七步设计了一种新的基于窗口合并策略的目标精确检测方法,其具体步骤如 下: 第一步,针对每一个尺度Ρ,利用窗口中心位置及窗口尺寸,对目标检测阶段第六步得 到的多个目标定位窗口进行区分,使它们分别准确对应所属的目标。 第二步,在尺度Ρ下,针对同一目标对应的多个重叠定位窗口,对其中心位置坐标(xPJ, yPJ)依据重构误差的大小,分配权重;其中,重构误差越小的窗口,分配给它的权重越大; 然后,基于权重,重新计算该目标的中心位置坐标(x Pi,yPi),达到重叠定位窗口合并的目 的;同时,按照权重,加权计算合并后窗口的重构误差S pl;最终,我们得到该尺度下同一目标 对应的合并后的定位窗口,该窗口的相关信息保存在窗口信息矩阵Mpl = (Xpl,ypl,wpl,hpl, δρ?)中;其中,(wPi,hPi)表不该窗口的尺寸,p表不该窗口位于第p层;1表不该窗口在第p层的 编号; 第三步,针对每一个尺度P,依次合并同一目标对应的多个重叠定位窗口,将合并后窗 口的相关信息保存在窗口信息矩阵ΜΡι(ρ=1,2,…,S;l = l,2,…,L)中。其中,L为第p层内合 并后窗口的个数,表示第P层共检测到L个目标。 第四步,针对所有S个尺度,将同一目标对应的合并后的重叠定位窗口的信息矩阵Mpl(p =1,2,…,S; 1 = 1,2,…,L),依据误差大小,对其分配权重;其中,误差越小的窗口,分配给 它的权重越大;然后,基于权重,更新该目标的最终位置和尺寸,得到目标精确检测结果B r = (xr,yr,wr,hr),(r=l,2,…,n)。其中,x r,yr为最终合并后窗口的坐标值,wr为最终合并后 窗口的宽度,hr为最终合并后窗口的高度,η为最终合并后窗口的个数,表示图像中共检测 至Ijn个目标。
【文档编号】G06K9/62GK106067041SQ201610393186
【公开日】2016年11月2日
【申请日】2016年6月3日 公开号201610393186.0, CN 106067041 A, CN 106067041A, CN 201610393186, CN-A-106067041, CN106067041 A, CN106067041A, CN201610393186, CN201610393186.0
【发明人】王鑫, 张佳祺, 周韵, 张春燕, 朱行成
【申请人】河海大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1