一种目标检测方法及装置的制造方法

文档序号:8224164阅读:271来源:国知局
一种目标检测方法及装置的制造方法
【技术领域】
[0001] 本发明涉及图像及视频处理技术领域,尤其涉及一种目标检测方法及装置。
【背景技术】
[0002] 目前主流的行人检测方法较多采用峽间差、背景差、光流场计算、背景建模和神经 网络学习等来区分背景和行人,W实现检测和跟踪行人的目的。然而由于行人等运动目标 很容易受到光照变化、姿势、阴影和遮挡等的影响,因此大大降低该些方法的正确识别率。 此外,在复杂背景条件下现有的方法对多个行人目标的检测精度也较低,无法完全满足当 前安防监控和智能交通等领域的新要求。

【发明内容】

[0003] 本发明实施例提供一种目标检测方法及装置,用W解决现有的行人检测方法存的 多目标检测精度较低的问题。
[0004] 基于上述问题,本发明实施例提供的一种深度学习方法,包括:
[0005] -种目标检测方法,包括:
[0006] 确定待检测图像的至少一类特征向量;
[0007] 将确定的特征向量输入训练好的深度学习模型得到该深度学习模型的隐层节点 的状态值;
[0008] 将上述深度学习模型的最后一层隐层节点的状态值输入分类器;
[0009] 根据上述分类器的输出结果确定待检测图像包含目标的个数。
[0010] 较佳的,所述特征向量包括W下H类:
[0011] 第一类:图像的每个子块的几何形状特征向量;
[0012] 第二类:图像的每个子块的方向梯度直方图特征向量;
[0013] 第H类;图像的各子块两两之间的颜色自相似特征向量。
[0014] 较佳的,所述训练好的深度学习模型是通过对正负样本图像的至少一类特征向量 进行学习得到的。
[0015] 较佳的,所述训练好的深度学习模型是通过对正负样本图像的至少一类特征向量 进行学习得到的具体包括:
[0016] 确定正负样本图像的至少一类特征向量;
[0017] 初始化深度学习模型;
[0018] 利用确定的正负样本图像的至少一类特征向量预训练所述上述深度学习模型,得 到所述深度学习模型的预训练参数;
[0019] 在所述深度学习模型的预训练参数的基础上调整所述深度学习模型的参数。
[0020] 较佳的,利用方向滤波器组对图像的各子块进行滤波,得到图像的各子块的在相 应方向上的几何形状特征向量;所述方向滤波器组为高波滤波器组。
[0021] 较佳的,通过W下步骤确定图像的各子块两两之间的颜色自相似特征向量:
[0022] 将图像划分为N X M子块;
[0023] 分别计算每一子块的颜色直方图向量;
[0024] 利用L2范数确定NXM子块中两两子块间的颜色直方图向量的相似值;
[0025] 将确定的各相似值作为图像的子块间的颜色自相似特征向量。
[0026] 较佳的,所述深度学习模型为受限波尔兹曼机神经网络模型,所述分类器为软最 大化分类器。
[0027] -种目标检测装置,包括:
[0028] 特征向量确定单元,用于确定待检测图像的至少一类特征向量;
[0029] 状态值确定单元,用于将确定的特征向量输入训练好的深度学习模型得到该深度 学习模型的隐层节点的状态值;
[0030] 分类单元,用于将上述深度学习模型的最后一层隐层节点的状态值输入分类器;
[0031] 目标确定单元,用于根据上述分类器的输出结果确定待检测图像包含目标的个 数。
[0032] 较佳的,所述特征向量包括W下H类:
[003引第一类:图像的每个子块的几何形状特征向量;
[0034] 第二类:图像的每个子块的方向梯度直方图特征向量;
[003引第;类;图像的各子块两两之间的颜色自相似特征向量。
[0036] 较佳的,所述目标检测装置还包括:学习单元,用于通过对正负样本图像的至少一 类特征向量进行学习得到的所述训练好的深度学习模型。
[0037] 较佳的,所述学习单元,具体用于确定正负样本图像的至少一类特征向量;初始化 深度学习模型;利用确定的正负样本图像的至少一类特征向量预训练所述上述深度学习模 型,得到所述深度学习模型的预训练参数;在所述深度学习模型的预训练参数的基础上调 整所述深度学习模型的参数。
[0038] 较佳的,所述特征向量确定单元,具体用于利用方向滤波器组对图像的各子块进 行滤波,得到图像的各子块的在相应方向上的几何形状特征向量,所述方向滤波器组为高 波滤波器组。
[0039] 较佳的,所述特征向量确定单元,具体用于将图像划分为NXM子块;分别计算每 一子块的颜色直方图向量;利用L2范数确定NXM子块中两两子块间的颜色直方图向量的 相似值;将确定的各相似值作为图像的子块间的颜色自相似特征向量。
[0040] 在本发明实施例的方案中,将深度学习模型和分类器联合起来用在目标检测中, 将待检测图像的特征向量作为将深度学习模型的输入数据,进而得到深度学习模型的隐层 节点的状态值,最后将最后一层隐层节点的状态值作为分类器的输入,得到分类结果,能较 准确地确定待检测图像中包含目标的个数。
【附图说明】
[0041] 图1为本发明实施例提供的一种深度学习方法的流程图;
[0042] 图2为本发明实施例提供的在隐层数为3时的SRBM神经网络的结构示意图;
[0043] 图3为本发明实施例提供的一种目标检测方法的流程图;
[0044] 图4为本发明实施例提供的一种目标装置的结构示意图;
[0045] 图5为本发明实施例提供的另一种目标装置的结构示意图。
【具体实施方式】
[0046] 本发明实施例中将深度学习模型和分类器联合起来用在目标检测中,将待检测图 像的特征向量作为将深度学习模型的输入数据,进而得到深度学习模型的隐层节点的状态 值,最后将最后一层隐层节点的状态值作为分类器的输入,得到分类结果,能较准确地确定 待检测图像中包含的目标W及包含目标的个数。进一步地,本发明实施例中使用方向梯度 直方图特征向量、几何形状特征向量和颜色自相似特征向量中的部分或全部作为训练好的 输入深度学习模型的特征向量,该些特征向量提取出了目标中的低级特征和中级特征,经 过深度学习模型训练学习后得到表征目标在复杂背景、强噪声干扰和遮挡条件下的高级特 征,最终分类后确定待检测图像包含目标的个数,因此,很好的解决了光照剧烈变化和遮挡 等复杂条件和背景下的目标检测问题。
[0047] W下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的 优选实施例仅用于说明和解释本发明,并不用于限定本发明。并且在不冲突的情况下,本申 请中的实施例及实施例中的特征可W相互组合。
[0048] 下面结合附图,用具体实施例对本发明提供的方法及装置进行详细描述。
[0049] 本发明实施例提供的一种深度学习方法,如图1所示,具体包括W下步骤:
[0050] S101 ;确定正负样本图像的至少一类特征向量;
[0051] 其中,正样本图像选取包含完整目标,W及行人部分被遮挡的图像,负样本选取不 包含目标的背景区域图像;
[0052] 在目标为行人时,正样本图像选取包含完整行人,W及头,肩,上半身或下半身等 被遮挡的图像,负样本选取不包含行人的背景区域图像。
[0053] 其中,正样本图像(负样本图像)的特征向量包括W下H类:
[0054] 第一类:正样本图像(负样本图像)的每个子块的几何形状特征向量;
[005引第二类:正样本图像(负样本图像)的每个子块的方向梯度直方图化stogram of Oriented Gradient, HOG)特征向量;
[0056] 第H类;正样本图像(负样本图像)的各子块两两之间的颜色自相似(Color Self-Similarity, CS巧特征向量。
[0057] 其中,将正样本图像(负样本图像)按照设定的尺寸大小进行分割,即可得 到子块,例如:假设一正样本图像的大小为128(pixels)X128(pixels),设定尺寸为 32 (pixels) X 32 (pixels),则可将该 128 (pixels) X 128 (pixels)进行分割得到 16 个 32 (pixels) X 32 (pixels)的子块;
[0058] 需要说明的是,上述H类特征向量的确定中,每一类特征向量的使用的子块的尺 寸大小和数目可W相同也可W不相同,需要使用的尺寸大小和数目具体根据滤波器的尺寸 和特征向量的计算要求确定;
[0059] 具体的,针对几何形状特征向量可W利用W下方式确定:
[0060] 利用方向滤波器组对待检测图像的各子块进行滤波,得到待检测图像的各子块的 几何形状特征向量。
[0061] 上述方向滤波器组可W为小波滤波器或者高波佑油or)滤波器,考虑到G油or滤 波器具有优良局部尺度和方向选择性的滤波器来提取纹理信息,在本发明实施例中采用 G油or滤波器组作为方向滤波器组。
[0062] 针对样本图像的各子块两
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1