一种目标检测方法及装置的制造方法_2

文档序号:8224164阅读:来源:国知局
两之间的CSS特征向量,可W通过W下第一步至第四步 确定:
[006引第一步;将正样本图像(负样本图像)划分为NXM子块;
[0064] 第二步:分别计算每一子块的颜色直方图向量;
[0065] 第H步;利用L2范数确定NXM子块中两两子块间的颜色直方图向量的相似值;
[0066] 第四步;将确定的各相似值作为正样本图像(负样本图像)的子块间的颜色自相 似特征向量。
[0067] 针对册G特征向量;由于册G特征在目标检测中提取外形信息和运动信息的有效 性,本发明实施例选用HOG特征向量来获得低级的目标轮廓信息。
[0068] S102 ;初始化深度学习模型;
[0069] 在建立分组深度学习模型时,可W基于巧estricted Boltzmann machine, RBM) 限制玻尔兹曼机和基于自编码器等不同类型的学习单元进行架构设计。当前,W RBM为 基本模块的深度学习模型被认为是最有效的深度学习算法之一,基于该种良好的性质, 本发明实施例使用RBM为基本单元构建深度学习模型;分组限制玻尔兹曼机(Subgroup Restricted Boltzmann machine, SRBM)。
[0070] 具体的,初始化SRMB学习模型包括:
[0071] 设定该学习模型的神经网络有L层,每一层的节点数分别为N1、N2…化个,预训练 的次数为Ny,调整参数的次数为Nt,由网络层数和每层的节点数得到神经网络的结构,选取 [0, 1]之间的随机数作为神经网络节点之间的连接权值。
[0072] S103;利用确定的正负样本图像的至少一类特征向量预训练上述深度学习模型, 得到上述深度学习模型的预训练参数;
[0073] 具体的,在所选的深度学习单元为RBM时,对于可见层,节点对应于使用前述步骤 S101提取到的3类特征向量中的部分或全部的特征向量,然后训练可见层节点和第一隐层 节点之间的权值参数,共训练Ny次;然后再W第一隐层作为第二层SRBM的可见层,也训练 Ny次该两层之间节点的权值;按照此方法直到训练完所有的隐层,可得到了各层SRBM的权 值参数。
[0074] S104;在上述深度学习模型的预训练参数的基础上调整上述深度学习模型的参 数。
[0075] 具体的,在所选的深度学习单元为RBM时,W重建误差最小为准则,使用已有的对 比散度法(Contrastive Divergence, CD)进行迭代计算,在上述深度学习模型的预训练参 数的基础上反向传播调整整个L层级联SRBM的权值参数,该步骤执行Nt次,得到各层SRBM 的最终权值参数。
[0076] 下面W目标为行人且使用的特征向量为1)、2)和3)为例对上述学习方法进行进 一步地说明。
[0077] 针对将行人作为目标,用于实施的硬件环境是;计算机CPU为Intel Core 15,内 存为4GB。软件环境为;Matl油R201化和Windows?。利用网上公布的化Itech (加州理工 学院)数据库和ET监(苏黎世联邦理工学院)数据库进行实验。其中对化Itech数据集 测试时,选择50, 000个负样本和3, 000个正样本进行训练。对ET监数据集测试时,使用 50, 000个负样本和2, 000个正样本进行训练,正样本选取包含完整行人,W及头,肩,上半 身或下半身等被遮挡的图像,负样本选取不包含行人的背景图像。
[0078] 假设样本图像的格式为RGB格式时,上述S101确定各个特征向量具体包括W下步 骤A至步骤D :
[007引步骤A ;对选取的正负样本图像进行预处理;将输入的每峽RGB格式的图像分别转 换到YUV格式和HSV格式的颜色空间,并根据样本图像中行人区域的大小,设定检测窗口的 大小,(本发明实施例中设定的检测窗口的大小为高12化ixels和宽32pixels)。
[0080] 步骤B ;生成方向梯度直方图化istogram of oriented gradient, HOG)特征;由 于HOG特征在行人检测中提取外形信息和运动信息的有效性,本发明利用HOG特征来提取 低级的行人轮廓信息,步骤A产生的YUV图像数据利用HOG特征向量提取器,提取输入图像 的各个子块的HOG特征。
[0081] 具体的,把YUV格式的输入检测窗口划分成4 (pixels) X 4 (pixels)的子块,使用 高斯滤波器去除区域中的噪点后,计算每个像素点的梯度幅值和方向(见公式(1),统计梯 度方向值出现的频率得到直方图,作为每个子块的特征向量。
[0082]
【主权项】
1. 一种目标检测方法,其特征在于,包括: 确定待检测图像的至少一类特征向量; 将确定的特征向量输入训练好的深度学习模型得到该深度学习模型的隐层节点的状 态值; 将所述深度学习模型的最后一层隐层节点的状态值输入分类器; 根据所述分类器的输出结果确定待检测图像中包含目标的个数。
2. 如权利要求1所述的方法,其特征在于,所述特征向量包括W下H类: 第一类:图像的每个子块的几何形状特征向量; 第二类:图像的每个子块的方向梯度直方图特征向量; 第H类;图像的各子块两两之间的颜色自相似特征向量。
3. 如权利要求1或2所述的方法,其特征在于,所述训练好的深度学习模型是通过对正 负样本图像的至少一类特征向量进行学习得到的。
4. 如权利要求3所述的方法,其特征在于,所述训练好的深度学习模型是通过对正负 样本图像的至少一类特征向量进行学习得到的具体包括: 确定正负样本图像的至少一类特征向量; 初始化深度学习模型; 利用确定的正负样本图像的至少一类特征向量预训练所述上述深度学习模型,得到所 述深度学习模型的预训练参数; 在所述深度学习模型的预训练参数的基础上调整所述深度学习模型的参数。
5. 如权利要求2所述的方法,其特征在于,利用方向滤波器组对图像的各子块进行滤 波,得到图像的各子块的在相应方向上的几何形状特征向量;所述方向滤波器组为高波滤 波器组。
6. 如权利要求2所述的方法,其特征在于,通过W下步骤确定图像的各子块两两之间 的颜色自相似特征向量: 将图像划分为NXM子块; 分别计算每一子块的颜色直方图向量; 利用L2范数确定NXM子块中两两子块间的颜色直方图向量的相似值; 将确定的各相似值作为图像的子块间的颜色自相似特征向量。
7. 如权利要求1所述的方法,其特征在于,所述深度学习模型为受限波尔兹曼机神经 网络模型,所述分类器为软最大化分类器。
8. -种目标检测装置,其特征在于,包括: 特征向量确定单元,用于确定待检测图像的至少一类特征向量; 状态值确定单元,用于将确定的特征向量输入训练好的深度学习模型得到该深度学习 模型的隐层节点的状态值; 分类单元,用于将所述深度学习模型的最后一层隐层节点的状态值输入分类器; 目标确定单元,用于根据所述分类器的输出结果确定待检测图像包含目标的个数。
9. 如权利要求8所述的目标检测装置,其特征在于,所述特征向量包括W下H类: 第一类:图像的每个子块的几何形状特征向量; 第二类:图像的每个子块的方向梯度直方图特征向量; 第H类;图像的各子块两两之间的颜色自相似特征向量。
10. 如权利要求8或9所述的目标检测装置,其特征在于,所述目标检测装置还包括: 学习单元,用于通过对正负样本图像的至少一类特征向量进行学习得到的所述训练好的深 度学习模型。
11. 如权利要求10所述的目标检测装置,其特征在于,所述学习单元,具体用于确定正 负样本图像的至少一类特征向量;初始化深度学习模型;利用确定的正负样本图像的至少 一类特征向量预训练所述上述深度学习模型,得到所述深度学习模型的预训练参数;在所 述深度学习模型的预训练参数的基础上调整所述深度学习模型的参数。
12. 如权利要求9所述的目标检测装置,其特征在于,所述特征向量确定单元,具体用 于利用方向滤波器组对图像的各子块进行滤波,得到图像的各子块的在相应方向上的几何 形状特征向量,所述方向滤波器组为高波滤波器组。
13. 如权利要求9所述的目标检测装置,其特征在于,所述特征向量确定单元,具体用 于将图像划分为NXM子块;分别计算每一子块的颜色直方图向量;利用L,范数确定NXM 子块中两两子块间的颜色直方图向量的相似值;将确定的各相似值作为图像的子块间的颜 色自相似特征向量。
【专利摘要】本发明实施例提供了一种目标检测方法及装置,用以解决现有的行人检测方法存在的多目标检测精度较低的问题。该方法包括:确定待检测图像的至少一类特征向量;将确定的特征向量输入训练好的深度学习模型得到该深度学习模型的隐层节点的状态值;将所述深度学习模型的最后一层隐层节点的状态值输入分类器;根据所述分类器的输出结果确定待检测图像包含目标的个数。
【IPC分类】G06T7-00
【公开号】CN104537647
【申请号】CN201410771011
【发明人】贾惠柱, 陈瑞, 解晓东, 文湘鄂
【申请人】中安消技术有限公司, 北京大学
【公开日】2015年4月22日
【申请日】2014年12月12日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1