一种基于融合模型的人体姿态估计方法_2

文档序号:9911686阅读:来源:国知局
] 依据图模型方法,将单部件和二元打分之和作为衡量因素,图模型中所求L为各部 件的坐^1? ·
[0052]
[0053] 其中,li= {x,y}为部件i的像素位置,炉U,. 4.)是HOG特征向量,y(li_lj) = [dx,dx2, dy,dy2]T,i、j为相邻部件。
[0054] 根据公式(6),依次选取得分最高的前Μ个骨架点1*,作为候选集ΩΜ。
[0055] 2、基于表观形状模型的最佳姿态获取
[0056] 在获取候选集后,利用D-S融合理论将图像中的特征信息融合,求得最高信度值对 应各部位的位置,即最佳位置,获得人体姿态最佳结果。
[0057] 对于每个特征点,选择H0G特征和形状特征来描述每个特征点的特征,每种特征分 别对应不同的SVM分类器。如此,每个部位有两种信息源的质量函数融合,所以定义了特征 信息的判别信息源的全集为:
[0058]
(7)
[0059] 其中,Θ={-1,1}定义了全集类,{1}代表目标类,{-1}代表非目标类
[0060] 因此,对第η个特征点的特征信息所对应的质量函数nu(An)可定义为:
[0061]
[0062]其中,? = 1,2,δ为不确定度,xn为某个候选集所对应的第n个特征点的位置。
[0063]对于每个特征点的H0G特征而言,gn(xn)就是标准化SVM分类置信度,定义为:
[0064]
(9)
[0065] 其中,hn(xn)代表了 xj/f对应的H0G分类器hr^SVM预测函数
[0066] 而对于形状特征,gn(xn)是Xn所对应的形状特征的图像分割能量函数,定义为:
[0067]
[0068] 其中,加是特征点x的检测框中的像素点,τ是判别函数,N是四个相连邻域。一元项 c(pa)定义了一个单独的像素偏向于前景或背景的程度,二元项定义了邻域像素点一致度。
[0069] 为了评判一元项c(Pa),需要基于像素的前景/背景模型。对于被检测框,假设每个 像素都有一个前景的先验分布Pf g(a),用于前景/背景颜色直方图的的建立:
[0070] Pr(fg(a))= Σ3 Pfg(a) · x(im(a)=k) (11)
[0071] pr(fg(a))= 2a(l-pfg(a)) · T(im(a)=k) (12)
[0072] 上式中的im(a)代表了位置a的像素值的二进制码。用了 R、G、B三通道各8位表示, 所以理论上,k的索引的值域为1~83 = 512。实际上,每个检测窗中的像素值并达不到如此 之高。所以,一元项的负对数概率模型如下:
[0073] c(la= 1) = -log(Pr(fg(im(a)))) (13)
[0074] c(la = 0)=-log(Pr(bg(im(a)))) (14)
[0075] 前景先验概率Pfg(a)只隐含的出现在训练前景/背景颜色模型中,相应的, 1 - 为背景先验概率.若给出T张给定标定好的真实数据的训练图像lt,pfg(a)的最大 似然估计为样本平均,BP
[0076] Pl^a) (15)
[0077] 但是,在目前的数据集中并不存在这样的像素分割数据。所以,可以使用正训练集 的包围框位置,而得到一个粗糙的包围框的先验概率:
[0078] P/g(a) = ^(a e detection window)· (16)
[0079] 根据D-S融合理论,求得HOG特征对应质量函数m(A)和形状特征质量函数m2(A),最 终的联合质量函数M(A)=nu(A) em2(A)。所以,M(A)对应的的置信函数此1以)定义为:
[0080]
[0081]上式中,Bel(A,l)反映了假设A的置信度,所以Bel({l},l)就是假设1为所求最佳 位置对应的置信度。因此,用Bel ({1 },1)作为衡量每个部位的打分,即求得1所在位置时的 打分,当取得最高分值时表示1的置信度最高,就是所求的最佳姿态结果,即:
[0082] Γ=Μβχ Bel({l},l) (18)
[0083] 对上述模型进行了实验验证,并且取得了明显的效果。在实验中,选用PARSE全身 图像数据集,选取h-lM共14个骨架点,测试100帧静态图像数据,统计了均方根误差(RMS) 和最大误差(Max),其数值均以像素为单位。根据实验效果,上文所提到质量函数不确定度δ 设置为〇. 1,形状特征中二元项对应的的γ为常数,取〇. 4。
[0084]本发明与YANG等人提出的方法比较,从RMS和MAX两个标准上都取得了理想的提 升。其中,均方根误差RMS = 9.0288,YANG等人提出的方法最大误差平均值MAX = 113.2148提 高至85.9704。同时,设置错误阈值为10个像素点,统计了准确度,平均准确率为84%。
[0085]以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依 据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明 技术方案的保护范围。
【主权项】
1. 一种基于融合模型的人体姿态估计方法,其特征在于:包括以下步骤: (1) 以人体运动时的二维静态图像为输入数据,获取基于图模型的候选姿态; (2) 利用信度函数D-S融合模型将图像中的特征信息融合,求得最高信度值对应各部位 的位置,作为最佳位置,从而获得人体姿态最佳结果。2. 根据权利要求1所述的基于融合模型的人体姿态估计方法,其特征在于:所述步骤 (1) 中依据图模型方法,将单部件和二元打分之和作为衡量因素,图模型中所求L为各部件 的坐标位置;根据公式(6),依次选取得分最高的前Μ个骨架点1*,作为候选集Ω Μ其中,li = {x,y}为部件i的像素位置,供(人Λ)是HOG特征向量,y(li-lj) = [dx,dx2,dy, dy2]T,i、j为相邻部件。3. 根据权利要求2所述的基于融合模型的人体姿态估计方法,其特征在于:所述步骤 (2) 包括以下分步骤: (2.1) 计算单部分的HOG特征的质量函数; (2.2) 计算单部分的形状特征的质量函数; (2.3) 将步骤(2.1)和(2.2)的结果融合,取最大信度值作为最佳位置,从而获得人体姿 态最佳结果。4. 根据权利要求3所述的基于融合模型的人体姿态估计方法,其特征在于:所述步骤 (2.1) 中根据公式(9)计算单部分的HOG特征的质量函数:其中,hn(xn)代表了 对应的HOG分类器hWSVM预测函数。5. 根据权利要求4所述的基于融合模型的人体姿态估计方法,其特征在于:所述步骤 (2.2) 中根据公式(10)计算单部分的形状特征的质量函数:其中,P#特征点X的检测框中的像素点,τ是判别函数,N是四个相连邻域,一元项c(pa) 定义了一个单独的像素偏向于前景或背景的程度,二元项定义了邻域像素点一致度。6. 根据权利要求5所述的基于融合模型的人体姿态估计方法,其特征在于:所述步骤 (2.3) 中根据公式(17)、(18)计算最大信度值Bel(A,l)反映了假设A的置信度,Bel({l},l)是假设1为所求最佳位置对应的置信度: l*=Max Bel({l},1) (18) 〇
【专利摘要】本发明公开一种基于融合模型的人体姿态估计方法,其能够充分利用图像特征信息,能够将图像的HOG特征信息和形状特征信息融合,提高了传统图模型结构的人体姿态识别的准确率。包括以下步骤:(1)以人体运动时的二维静态图像为输入数据,获取基于图模型的候选姿态;(2)利用信度函数D-S融合模型将图像中的特征信息融合,求得最高信度值对应各部位的位置,作为最佳位置,从而获得人体姿态最佳结果。
【IPC分类】G06K9/62, G06K9/00
【公开号】CN105678321
【申请号】CN201511025900
【发明人】孔德慧, 朱碧焓, 王少帆, 尹宝才
【申请人】北京工业大学
【公开日】2016年6月15日
【申请日】2015年12月31日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1