一种行人识别及定位方法与流程

文档序号:17373992发布日期:2019-04-12 23:05阅读:353来源:国知局
一种行人识别及定位方法与流程

本发明涉及计算机视觉以及智能进化算法两个领域,特别涉及一种基于hog-svm行人识别框架及多峰分布估计算法meda的识别及定位行人方法。



背景技术:

行人识别是目前计算机视觉的一个十分重要也非常富有挑战性的一个问题。近十年来,凭借着在智能机器人、智能驾驶、智能监控系统等领域起到越来越重要的作用,越来越多的科研者投入到行人识别的研究工作中。

总的来说,行人识别可以分成两个主要的研究方向。其一是提出新的行人特征描述符,行人特征描述符的作用是从图像中提取特征,将行人与其他物体区分开,目前流行的行人特征描述符有haarwavelet、learningshapelet、histogramoforientedgradient(hog)、self-similarityoncolorchannels(css)等,其中,凭借着对光照变化及行人动作的细微改变的鲁棒性,hog成为了目前最热门的行人特征描述符。其二是研究如何定位图像中的行人,即研究如何在一整幅图像找到其所有行人,目前最普遍使用的定位方法是利用滑动窗口去遍历整幅图像,输出所有包含行人的矩形区域。

基于上述两个研究方向,研究人员已经提出了许多可行的方法。其中最常见、最基本的行人识别方法是由dalal和triggs于2005年提出的hog-svm算法,dalal和triggs将他们提出的hog特征描述符与线性svm分类器相结合构成hog-svm行人识别框架,并利用滑动窗口定位行人,此框架能够很好地完成行人识别这一任务。虽然hog-svm在行人识别问题上能够取得较好的效果,但是hog-svm在检测率及检测速度上仍具有非常大的改善空间。

为了提高hog-svm的检测效率,研究人员已经为此进行了大量的工作。其中,watanabe等人利用co-hog,即“梯度对”,代替hog去描述行人的特征。此外,walk等人提出一种新的特征描述符——区域颜色的自相似性,作为hog的补充特征。以上工作都能很好地提高经典hog-svm算法的精度,但是随之也降低了算法的检测速度。

为了提高hog-svm的检测速度,zhu等人提出利用积分直方图来快速计算行人的hog特征,并且在adaboost的基础上构建级联的分类器,zhu等人的研究能很好地加速传统hog-svm的检测过程,但其训练时间也大大增加。为在不影响训练速度的前提下提高算法的检测速度,一部分研究人员将目光转移到元启发式算法上。

研究发现,传统hog-svm框架的很大一部分检测时间被花费在遍历整幅图像以定位图像中所有行人这一过程上,而此过程实质上可看作为一个搜索问题。针对检测过程中的搜索问题,最初an等人将其转换成一个三维搜索问题,并提出利用高斯粒子群优化算法(gaussianparticleswarmoptimization,gpso)去优化求解此问题(下文统称为hog-svm-gpso),an等人提出的算法显著地加快了经典hog-svm算法的检测速度,但与此同时,检测精确度也随之降低。为进一步提高元启发式算法结合hog-svm框架的效率,chen等人提出利用差分算法(differentialevolution,de)去优化hog-svm存在的搜索问题(下文统称为hog-svm-de),其算法不仅能够显著提高检测速度,同时也很好地保证了hog-svm的检测精度。以上的研究工作表明将hog-svm结合元启发式算法能够显著缩短行人识别的时间。但上述研究存在一个明显缺陷,即其算法一次只能识别图像里面的单个行人,这也意味着他们的算法不适用于同时识别多个行人的场景。为了解决这个问题,lin等人提出将hog-svm结合一种多峰优化算法nsde同时识别图像中的多个行人(下文统称为hog-svm-gpso)。lin提出的算法的确能够同时定位多个行人且能显著地缩短检测的时间,但与此同时,其算法的识别率较大幅度地下降。



技术实现要素:

本发明的主要目的在于克服现有技术的缺点与不足,提供一种行人识别及定位方法,此方法可得到更高的检测率及更低的错误率,且能显著地缩短hog-svm检测过程的时间。

本发明的目的通过以下的技术方案实现:一种行人识别及定位方法,包括训练阶段和检测阶段;

训练阶段具体包括以下步骤:

s1.1、制作正样本集和负样本集;

s1.2、从正负样本集里提取hog特征,构成特征向量;

s1.3、利用步骤s1.2中得到的特征向量训练线性svm分类器;

检测阶段具体包括以下步骤:

s2.1、编码:图像的矩形区域可用三维向量(x,y,z)表示,其中(x,y)是输入图像中的矩形区域左上角的横纵坐标,z是矩形区域相对于正负样本集尺寸的比例;种群个体的编码方式也为(x,y,z),即每个个体对应图像的一个矩形区域,同时,保证检测窗口不超出原始图片的范围;

s2.2、随机初始化第一代种群,给定种群大小np、行人检测阈值θ;

s2.3、聚类个体:利用niching策略(即小生境策略,一定意义上的分组策略)聚类种群中相似个体,将整个种群划分为若干个niches(小生境);

s2.4、分布估计及产生后代:待种群划分完成后,首先对每个niche进行分布估计,得到每个niche的均值和标准差,接下来根据所得到的分布结果运用高斯分布及柯西分布,产生下一代种群;

s2.5、个体筛选:在每个niche中,将新生成的个体逐个与该niche中与之最相似的个体进行比较,剔除二者适应度较低的个体;

s2.6、局部搜索:以一定的概率对每个niche中适应度最高的个体进行局部搜索;

s2.7、判断:如果满足结束条件则进入步骤s2.8,否则返回到步骤s2;

s2.8、个体筛选:将种群里满足阈值条件的个体提取出来组成一个新的集合,并移除集合中区分度较小的个体;

s2.9、根据步骤s2.8中的构成的集合中的个体携带的信息,标记出图中的包含行人的矩形区域;

s2.10、输出:输出标记有包含行人区域的图片。

优选地,所属步骤s1.1中,将行人从包含行人的图片集中裁剪出来,调整尺寸,构成正样本集;将不包含行人的区域裁剪出来、调整尺寸,构成负样本集。

优选的,所述步骤s2.2中,随机产生第一代种群的公式为:

其中,d表示维度,取1,2,3;xi是种群中的第i个个体;分别是第d维的最大值、最小值,其中三维的最小值皆为0;rand()随机生成在[0,1)内的实数。

优选的,所述步骤s2.3中的niching策略具体步骤为:

s2.3.1、随机在种群中挑选一个还没被选中的个体;

s2.3.2、从剩下的种群中挑选出ns-1个距离被选出的个体距离最近的个体,并将它们组成一个niche,ns表示niche大小;

s2.3.3、若所有个体皆已被划分完成,则niching策略结束,否则跳回步骤s2.3.1继续划分剩下的个体。

优选的,所述步骤s2.4产生下一代种群的具体方法为:

其中cj为第j个niche产生的后代,μj和δj是第j个niche的均值及标准差,rand()随机生成在[0,1)内的实数。

优选的,所述步骤s2.6只对当前niche适应度最高的个体进行局部搜索,即在通过迭代多次利用高斯分布生成新个体,每次将得到的新个体与当前最优的个体相比较,保留适应度更高的个体:

lcj=gaussian(nbj,σ),ifrand()<pi

其中lci为局部搜索产生的个体,nbi是第j个niche里最好的个体,σ是高斯分布的标准差,与mdea算法一致;另外pi是niche进行局部搜索的概率,根据meda算法,该概率可按照以下公式计算:

其中fi是nbi的适应度,fmax和fmin分别为由每个niche中的最优秀个体中组成的集合里面的最大适应度、最小适应度;另外,ξ是一个取值较小的正实数,以防止出现分母为0的情况。

优选的,所述步骤s2.8组成新的集合后,通过下述步骤移除集合中的相似个体:

s2.8.1、初始化一个新的集合o;

s2.8.2、根据个体的适应度从大到小对集合个体进行排序;

s2.8.3、挑选出集合里面适应度最高的个体,若该个体与新个体集合o中所有个体都不相似,则将其添加至o中并将其从原集合st移除;

s2.8、若已经遍历完所有个体则结束筛选算法,否则跳至步骤s2.8.3。

本发明与现有技术相比,具有如下优点和有益效果:

1、本发明利用目前最先进的多峰优化算法meda优化求解hog-svm存在的行人定位问题,显著加快经典hog-svm识别行人的速度。

2、本发明结合阈值与种群的进化结果来定位图像中包含行人的矩形区域,因此与经典hog-svm相比能取得更加准确的结果。

附图说明

图1为本发明训练阶段流程图。

图2为本发明检测阶段流程图。

图3为本发明移除相似性体策略流程图。

具体实施方式

为了更好的理解本发明的技术方案,下面结合附图详细描述本发明提供的实施例,但本发明的实施方式不限于此。

实施例

如图1-3所示,一种行人识别及定位方法,包括训练阶段和检测阶段;

训练阶段具体包括以下步骤:

s1.1、将行人从包含行人的图片集中裁剪出来,并将其尺寸调整为64×128像素大小(图片分辨率为72),构成正样本集;将不包含行人的区域裁剪出来,调整尺寸为64×128像素,构成负样本集;

s1.2、从正负样本集里提取hog特征,构成特征向量;

s1.3、利用步骤s1.2中得到的特征向量训练线性svm分类器。

此阶段的目的是从输入的正负样本中提取出相应的行人特征向量,以训练出能够鉴别行人的线性svm分类器。

检测阶段如图2所示,输入为任意一张图片,算法执行完后将标记输入图片中所有包含行人的区域。该阶段的原理是:利用已训练好的线性svm分类器结合多峰优化算法meda定位输出图片中的行人。本发明中,我们利用三维向量(x,y,z)代表输入图片的矩形区域,同时也代表进化算法里面的一个个体。其中(x,y)是图像中矩形区域的横纵坐标,z是矩形区域相对于样本区域(64×128像素)的比例,因此z也可被视为被检测矩形区域的大小。另外,在本发明中,检测阶段的参数设置如下:行人检测的阈值θ=-1,算法种群大小np=200,niche大小ns=5。

具体包括以下步骤:

s2.1、编码:输入图像的某一矩形区域及种群个体用三维向量(x,y,z)表示。其中为保证检测窗口小于输入图像,对于长、宽分别为w、h的图片,z的最大值为之间的最小值,即当z为最大值时意味着当前的检测对象为整幅输入图像。此外,为保证检测窗口不超出原始图片的范围,因此x、y的最大值此时应为w-z×64和h-z×128。

s2.2、随机初始化第一代种群,即按照以下公式随机产生初始种群:

其中xi是种群中的第i个个体,分别是第d维的最大值、最小值。其中三维的最小值皆为0,x、y的最大值为w-z×64和h-z×128。

s2.3、聚类个体:利用niching策略(小生境策略)聚类种群中相似个体,将种群划分为若干个niches(小生境)。根据meda算法里的描述,该niching策略可简单地被概述为如下步骤:

s2.3.1、随机在种群中挑选一个还没被选中的个体;

s2.3.2、从剩下的种群中挑选出ns-1个距离被选出的个体距离最近的个体,并将它们组成一个niche,ns表示niche大小;

s2.3.3、若所有个体皆已被划分完成,则niching策略结束,否则跳回步骤s2.3.1继续划分剩下的个体;

s2.4、分布估计及产生后代:待种群划分完成后,首先对每个niche进行分布估计,得到每个niche的均值和标准差,接下来根据所得到的分布结果运用高斯分布及柯西分布,产生下一代种群:

其中cj为第j个niche产生的后代,μj和δj是第j个niche的均值及标准差,rand()随机生成在[0,1)内的实数。

s2.5、个体筛选:在每个niche中,将新生成的个体逐个与该niche中与之最相似的个体进行比较,剔除二者适应度较低的个体,此举确保种群不会往更差的方向进化。

s2.6、局部搜索:以一定的概率对每个niche中适应度最高个体进行局部搜索,以提高种群的精度,局部搜索只对当前niche适应度最高个体进行操作,即在通过迭代多次利用高斯分布生成新个体,每次将得到的新个体与当前最优的个体相比较,保留适应度较高的个体:

lcj=gaussian(nbj,σ),ifrand()<pi

其中lci为局部搜索产生的个体,nbi是第j个niche里适应度最高的个体,σ是高斯分布的标准差,与mdea算法一致,在本发明中σ设为0。另外pi是niche进行局部搜索的概率,根据meda,该概率可按照以下公式计算:

其中fi是nbi的适应度,fmax和fmin分别为由每个niche中的最优秀个体中组成的集合里面的最大适应度、最小适应度。另外,ξ是一个取值很小的正实数,以防止出现分母为0的情况。

s2.7、判断:如果满足结束条件,即完成矩形区域的最大检测次数,则进入步骤s2.8,否则返回到步骤s2。

s2.8、个体筛选:将种群里适应度大于阈值的个体提取出来组成一个新的集合。当个体的适应度大于阈值,则可认为该个体代表的输入图片中的矩形区域包含着行人。因此,在本发明提出的算法中,我们更倾向于保留具有更高适应度的个体。在组成新集合之后,移除集合中重合度很高的个体:

s2.8.1、初始化一个新的集合o;

s2.8.2、根据个体的适应度从大到小对集合个体进行排序;

s2.8.3、挑选出集合里面适应度最高的个体,若该个体与新个体集合o中所有个体都不相似,则将其添加至o中并将其从原集合st移除;

s2.8、若已经遍历完所有个体则结束筛选算法,否则跳至步骤s2.8.3。

s2.9、根据步骤s2.8中的构成的集合中的个体携带的信息,也就是矩形区域的左上角坐标及矩形区域的大小,标记出图中的包含行人的矩形区域。

s2.10、输出:输出标记有包含行人区域的图片。

为验证我们发明的方法是可靠的和有效的,我们在一个广泛使用的行人识别数据库inria的45张高分辨率的测试图片上做了15次独立的对比实验,与经典hog-svm及lin提出的算法相比,发明的算法的检测率分别提高了6.32%及8.6%,错误率分别降低了17.04%、1.54%。与此同时,提出的算法检测时间与hog-svm相比平均减少了41.3%,与lin等人提出的算法相比稍慢了2.71%,但这是可以接受的,因为我们的算法在识别效果上显著优于lin等人提出的算法。从我们的实验结果可知,本发明利用目前最优秀的多峰优化算法meda去优化求解hog-svm里面的三维多峰优化问题,不仅能够提升经典hog-svm算法的检测率及降低其错误率,并能显著地缩短其识别的时间。因此,本发明在处理行人识别问题上是可行、有效的。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1