一种候选框搜索步长的获取方法及装置与流程

文档序号:11134617阅读:878来源:国知局
一种候选框搜索步长的获取方法及装置与制造工艺

本发明涉及计算机视觉及模式识别中的目标检测领域,尤其涉及一种候选框搜索步长的获取方法及装置。



背景技术:

随着计算机图像处理技术的迅速发展和广泛应用,对于目标检测技术的需求也逐渐上升。目标检测已经成为计算机视觉和模式识别领域的基本问题,而检测目标的候选框搜索步长的确定是目标识别分类的一项重要的前期工作。目前现有的生成目标候选框的方法一般是滑动窗搜索方式,滑动窗搜索方式在进行目标搜索时,候选框在整个扫描窗口以固定的长度步进。

在实现本发明过程中,发明人发现现有技术中至少存在如下问题:

按照现有的目标搜索方法,在对目标进行搜索的过程中,候选框在整个扫描窗口以固定的长度步进,在搜索目标个数不同的区域内都以固定的长度步进搜索可能会出现漏检,搜索结果不是全局最优的。



技术实现要素:

有鉴于此,本发明实施例提供了一种候选框搜索步长的获取方法及装置,可以根据搜索目标在区域内出现的频率和密度信息确定候选框搜索步长。

一方面,本发明实施例提供了一种候选框搜索步长的获取方法,所述方法包括:

获取待搜索图像;

获取所述待搜索图像中各个原始分区的图像信息以及各个原始分区各自对应的泊松分布函数;

根据每个原始分区的图像信息和泊松分布函数,确定每个原始分区的分区类型;

根据所述分区类型,确定在每个原始分区中的候选框搜索步长。

另一方面,本发明实施例提供了一种候选框搜索步长的获取装置,所述装置包括:

第一获取单元,用于获取待搜索图像;

第二获取单元,用于获取所述待搜索图像中各个原始分区的图像信息以及各个原始分区各自对应的泊松分布函数;

第一确定单元,用于根据每个原始分区的图像信息和泊松分布函数,确定每个原始分区的分区类型;

第二确定单元,用于根据所述分区类型,确定在每个原始分区中的候选框搜索步长。

本发明实施例提供的一种候选框搜索步长的获取方法及装置,通过分区建立泊松模型并不断学习更新得到的特定搜索目标的位置信息,可以调整每帧图像中每块区域的候选框搜索步长,约束目标候选框的数量,从而针对不同的区域对搜索目标进行检测。这种方法及装置提升了检测效果,可以获得较高的检出率。

【附图说明】

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。

图1是本发明实施例提供的一种候选框搜索步长的获取方法流程图;

图2是本发明实施例提供的另一种候选框搜索步长的获取方法流程图;

图3是本发明实施例提供的另一种候选框搜索步长的获取方法流程图;

图4是本发明实施例提供的另一种候选框搜索步长的获取方法流程图;

图5是本发明实施例提供的一种候选框搜索步长的获取装置的组成框图;

图6是本发明实施例提供的另一种候选框搜索步长的获取装置的组成框图;

图7是本发明实施例提供的另一种候选框搜索步长的获取装置的组成框图;

图8是本发明实施例提供的另一种候选框搜索步长的获取装置的组成框图。

【具体实施方式】

为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。

应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。

应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。

取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

本发明实施例提供了一种候选框搜索步长的获取方法,能够适用于包括静态监控视频、车载监控视频等场景中行人检测、车辆检测等目标检测过程中,如图1所示,所述方法包括:

101、获取待搜索图像。

其中,所述待搜索图像指的是目标检测过程中的所有待检测图像。

102、获取所述待搜索图像中各个原始分区的图像信息以及各个原始分区各自对应的泊松分布函数。

其中,需要说明的是,本发明实施例针对静态监控视频以及车载监控视频等场景监控,图像中搜索目标出现在某块区域的频率和分布密度服从泊松分布。

其中,所述各个原始分区指的是对检测区域进行分块后的各个区域。

其中,所述各个原始分区的图像信息包括搜索目标在每块区域出现的频率信息以及搜索目标分布的密度信息。

其中,所述搜索目标指的是目标检测过程中的待检测对象,比如人、车辆和物体等。

其中,所述泊松分布函数基于数学泊松模型建立的函数,适用于描述单位时间内随机事件发生的次数。

103、根据每个原始分区的图像信息和泊松分布函数,确定每个原始分区的分区类型。

其中,所述分区类型由原始分区中搜索目标个数的多少确定。

其中,所述搜索目标个数指的是单位时间内搜索目标分布的数量,与搜索目标出现的频率信息和分布的密度信息相关。

104、根据所述分区类型,确定在每个原始分区中的候选框搜索步长。

本发明实施例提供的一种候选框搜索步长的获取方法,通过分区建立泊松模型并不断学习更新得到的特定目标的位置信息,可以调整每帧图像中每块区域的候选框搜索步长,约束目标候选框的数量,从而针对不同的区域对目标进行检测。这种方法提升了检测效果,可以获得较高的检出率。

进一步来说,结合前述方法流程,在本发明实施例的另一种可能的实现方式中,针对步骤103根据每个原始分区的图像信息和泊松分布函数,确定每个原始分区的分区类型的实现提供了以下具体流程,如图2所示,包括:

201、根据每个原始分区的图像信息和泊松分布函数,确定每个原始分区中搜索目标的个数。

其中,所述泊松分布函数在连续分布时有两个参数,一个是时域上随机事件发生的频率,另一个是空间域上随机事件的分布密度,在本发明实施例中,所述时域上随机事件发生的频率指的是搜索目标在每个原始分区中出现的频率,所述空间域上随机事件的分布密度指的是搜索目标分布的密度。

其中,所述泊松分布函数在对搜索目标进行检测的过程中进行训练,在学习过程中动态获取搜索目标在每块区域出现的频率信息和搜索目标的分布密度信息。

其中,当对搜索目标进行检测时,对每一帧待搜索图像进行检测,泊松分布函数变为离散型分布,确定了时间,搜索目标的个数即是单位时间内搜索目标分布的密度。

202、当所述搜索目标的个数在第一阈值范围内时,则将搜索目标的个数在第一阈值范围内的原始分区的分区类型确定为目标稀疏分布区域。

其中,所述第一阈值范围指的搜索目标个数比较少的一个数目范围,记为[L,Lmin)。

其中,所述L为大于0的整数。

其中,所述Lmin为大于L的整数。

203、当所述搜索目标的个数在第二阈值范围内时,则将搜索目标的个数在第一阈值范围内的原始分区的分区类型确定为目标中等分布区域。

其中,所述第二阈值范围指的是搜索目标个数大于第一阈值范围的一个数目范围,记为[Lmin,Lmax]。

其中,所述Lmax为大于Lmin的整数。

204、当所述搜索目标的个数在第三阈值范围内时,则将搜索目标的个数在第一阈值范围内的原始分区的分区类型确定为目标密集分布区域。

其中,所述第三阈值范围指的是搜索目标个数大于第二阈值范围的一个数目范围,记为[Lmax,+∝)。

其中,当所述原始分区的搜索目标个数大于Lmin时,原始分区视为目标出现较多的区域。

其中,当所述原始分区的搜索目标个数小于L时,原始分区视为目标出现较少的区域。

其中,对于搜索目标出现较多的区域确定分区类型,对于搜索目标出现较少的区域直接根据搜索目标的个数确定候选框的搜索步长。

进一步来说,结合前述方法流程,在本发明实施例的另一种可能的实现方式提供了如何根据所述分区类型,确定在每个原始分区中的候选框搜索步长的具体步骤,针对步骤104的实现提供了以下具体流程,如图3所示,包括:

301、将所述分区类型为目标稀疏分布区域的原始分区中的候选框搜索步长设置为第一步长。

其中,所述第一步长可根据所述目标稀疏分布区域的搜索目标分布情况自行定义长短。

302、将所述分区类型为目标中等分布区域的原始分区中的候选框搜索步长设置为第二步长。

其中,所述第二步长可根据所述目标中等分布区域的搜索目标分布情况自行定义长短。

其中,所述第二步长小于所述第一步长。

303、将所述分区类型为目标密集分布区域的原始分区中的候选框搜索步长设置为第三步长。

其中,所述第三步长可根据所述目标密集分布区域的搜索目标分布情况自行定义长短。

其中,所述第三步长小于所述第二步长。

需要说明的是,当原始分区属于搜索目标出现较少的区域时,根据搜索目标出现的个数直接确定步长,所述步长不小于所述第一步长。

进一步来说,结合前述方法流程,本发明实施例提供了另一种可能的实现方式,如图4所示,在所述获取待搜索图像之前,还包括:

401、获取原始图像内的原始分区。

其中,所述原始图像指的是检测区域内的n帧图像。

其中,所述n是大于0的整数。

其中,所述原始分区根据检测区域大小和特征进行分块。

其中,所述原始分区数目越多时,函数越能准确的反应分区内目标出现的频率和分布密度信息,每个原始分区内部的统计分布可认为基本一致。

其中,所述原始分区的数目越多时,需要计算的数据越多,从计算方法的复杂程度和准确程度两方面考虑,所述原始分区的数目根据搜索区域的大小和特征来确定。

402、采集所述原始分区内搜索目标的出现频率和分布密度。

其中,所述采集所述原始分区内搜索目标的出现频率和分布密度指的是采集所述n帧图像各个原始分区搜索目标的出现频率和分布密度。

403、根据所述搜索目标的出现频率和密度,确定所述原始分区的泊松分布函数。

其中,所述泊松分布函数通过采集所述n帧图像内搜索目标的出现频率和密度信息进行参数估计得到初始值。

本发明实施例提供的一种候选框搜索步长的获取方法,通过分区建立泊松模型并不断学习更新得到的特定搜索目标的位置信息,可以调整每帧图像中每块区域的候选框搜索步长,约束目标候选框的数量,从而针对不同的区域对搜索目标进行检测。这种方法提升了检测效果,可以获得较高的检出率。

为了更好的理解本技术方案,本发明实施例提供了更加具体的实施方式,需要说明的本发明实施例适用但不限于以下实施方式。

步骤1、将检测区域分成12(3x4)块小区域,对前2400帧图像的每块区域建立行人的泊松位置并进行参数估计得到模型初始值,从而可以得到每块区域处泊松模型单位时间内行人出现的平均发生率初始值。

步骤2、训练泊松模型,在学习过程中动态获取行人在每块区域出现的频率信息以及行人分布的密度信息。

步骤21、根据建立的泊松模型的初始值利用梯度下降法学习更新得到行人在每帧图像中各个原始分区分布的密度信息。

步骤22、对于步骤21得到的各个位置区域行人分布的情况,针对实施例中场景,对于行人出现较多的分块区域:

当出现的行人个数为10个以内时,将该区域视作行人稀疏分布区域;

当出现的行人个数为10至30时,将该区域视作行人中等分布区域;

当出现行人的次数大于30时,将该区域视作行人密集分布区域。

步骤23、对于行人出现较少的分块区域,设置出现行人的次数阈值为8。

步骤3、根据泊松位置模型学习得到的行人在每帧图像分布的密度信息,在搜索目标不同分布密度集的区域设置候选框不同的搜索步长,控制整帧图像的候选框数目。

步骤31、对于搜索目标分布较多的区域设置步长如下:行人稀疏分布区域step=16,行人中等分布区域step=8,行人密集分布区域step=4。

步骤32、对于搜索目标分布较少的区域设置步长如下:对于出现行人的次数大于8的情况,步长step=16,反之,设置步长step=32。

本发明的实施例中,各区域设置的候选框的宽高比锁定为0.5,另外,对于各区域处不出现行人的情况,则不生成候选框。

本发明实施例提供的一种候选框搜索步长的获取方法,通过分区建立泊松模型并不断学习更新得到的特定搜索目标的位置信息,可以调整每帧图像中每块区域的候选框搜索步长,约束目标候选框的数量,从而针对不同的区域对搜索目标进行检测。这种方法提升了检测效果,可以获得较高的检出率。

本发明实施例提供了一种候选框搜索步长的获取装置,可用于实现前述各方法流程,其组成如图5所示,所述装置包括:

第一获取单元51,用于获取待搜索图像。

第二获取单元52,用于获取所述待搜索图像中各个原始分区的图像信息以及各个原始分区各自对应的泊松分布函数。

第一确定单元53,用于根据每个原始分区的图像信息和泊松分布函数,确定每个原始分区的分区类型。

第二确定单元54,用于根据所述分区类型,确定在每个原始分区中的候选框搜索步长。

可选的是,如图6所示,所述第一确定单元53包括:

第一确定模块531,用于根据每个原始分区的图像信息和泊松分布函数,确定每个原始分区中搜索目标的个数。

第二确定模块532,用于当所述搜索目标的个数在第一阈值范围内时,将搜索目标的个数在第一阈值范围内的原始分区的分区类型确定为目标稀疏分布区域。

第三确定模块533,用于当所述搜索目标的个数在第二阈值范围内时,将搜索目标的个数在第一阈值范围内的原始分区的分区类型确定为目标中等分布区域。

第四确定模块534,用于当所述搜索目标的个数在第三阈值范围内时,将搜索目标的个数在第一阈值范围内的原始分区的分区类型确定为目标密集分布区域。

可选的是,如图7所示,所述第二确定单元54包括:

第一设置模块541,用于将所述分区类型为目标稀疏分布区域的原始分区中的候选框搜索步长设置为第一步长。

第二设置模块542,用于将所述分区类型为目标中等分布区域的原始分区中的候选框搜索步长设置为第二步长。

第三设置模块543,用于将所述分区类型为目标密集分布区域的原始分区中的候选框搜索步长设置为第三步长。

可选的是,如图8所示,所述装置还包括:

第三获取单元55,用于获取原始图像内的原始分区。

采集单元56,用于采集所述原始分区内搜索目标的出现频率和分布密度。

第三确定单元57,用于根据所述搜索目标的出现频率和密度,确定所述原始分区的泊松分布函数。

本发明实施例提供的一种候选框搜索步长的获取装置,通过分区建立泊松模型并不断学习更新得到的特定搜索目标的位置信息,可以调整每帧图像中每块区域的候选框搜索步长,约束目标候选框的数量,从而针对不同的区域对搜索目标进行检测。这种装置提升了检测效果,可以获得较高的检出率。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1