一种基于融合模型的人体姿态估计方法_2

文档序号：9911686阅读：来源：国知局

] 依据图模型方法，将单部件和二元打分之和作为衡量因素，图模型中所求L为各部件的坐^1? ·
[0052]
[0053] 其中，li= {x，y}为部件i的像素位置，炉U，. 4.)是HOG特征向量，y(li_lj) = [dx，dx2， dy，dy2]T，i、j为相邻部件。
[0054] 根据公式(6)，依次选取得分最高的前Μ个骨架点1*，作为候选集ΩΜ。
[0055] 2、基于表观形状模型的最佳姿态获取
[0056] 在获取候选集后，利用D-S融合理论将图像中的特征信息融合，求得最高信度值对应各部位的位置，即最佳位置，获得人体姿态最佳结果。
[0057] 对于每个特征点，选择H0G特征和形状特征来描述每个特征点的特征，每种特征分别对应不同的SVM分类器。如此，每个部位有两种信息源的质量函数融合，所以定义了特征信息的判别信息源的全集为：
[0058]
(7)
[0059] 其中，Θ={-1，1}定义了全集类，{1}代表目标类，{-1}代表非目标类
[0060] 因此，对第η个特征点的特征信息所对应的质量函数nu(An)可定义为：
[0061]
[0062]其中，? = 1，2，δ为不确定度，xn为某个候选集所对应的第n个特征点的位置。
[0063]对于每个特征点的H0G特征而言，gn(xn)就是标准化SVM分类置信度，定义为：
[0064]
(9)
[0065] 其中，hn(xn)代表了 xj/f对应的H0G分类器hr^SVM预测函数
[0066] 而对于形状特征，gn(xn)是Xn所对应的形状特征的图像分割能量函数，定义为：
[0067]
[0068] 其中，加是特征点x的检测框中的像素点，τ是判别函数，N是四个相连邻域。一元项 c(pa)定义了一个单独的像素偏向于前景或背景的程度，二元项定义了邻域像素点一致度。
[0069] 为了评判一元项c(Pa)，需要基于像素的前景/背景模型。对于被检测框，假设每个像素都有一个前景的先验分布Pf g(a)，用于前景/背景颜色直方图的的建立：
[0070] Pr(fg(a))= Σ3 Pfg(a) · x(im(a)=k) (11)
[0071] pr(fg(a))= 2a(l-pfg(a)) · T(im(a)=k) (12)
[0072] 上式中的im(a)代表了位置a的像素值的二进制码。用了 R、G、B三通道各8位表示，所以理论上，k的索引的值域为1~83 = 512。实际上，每个检测窗中的像素值并达不到如此之高。所以，一元项的负对数概率模型如下：
[0073] c(la= 1) = -log(Pr(fg(im(a)))) (13)
[0074] c(la = 0)=-log(Pr(bg(im(a)))) (14)
[0075] 前景先验概率Pfg(a)只隐含的出现在训练前景/背景颜色模型中，相应的， 1 - 为背景先验概率.若给出T张给定标定好的真实数据的训练图像lt，pfg(a)的最大似然估计为样本平均，BP
[0076] Pl^a) (15)
[0077] 但是，在目前的数据集中并不存在这样的像素分割数据。所以，可以使用正训练集的包围框位置，而得到一个粗糙的包围框的先验概率：
[0078] P/g(a) = ^(a e detection window)· (16)
[0079] 根据D-S融合理论，求得HOG特征对应质量函数m(A)和形状特征质量函数m2(A)，最终的联合质量函数M(A)=nu(A) em2(A)。所以，M(A)对应的的置信函数此1以)定义为：
[0080]
[0081]上式中，Bel(A，l)反映了假设A的置信度，所以Bel({l}，l)就是假设1为所求最佳位置对应的置信度。因此，用Bel ({1 }，1)作为衡量每个部位的打分，即求得1所在位置时的打分，当取得最高分值时表示1的置信度最高，就是所求的最佳姿态结果，即：
[0082] Γ=Μβχ Bel({l},l) (18)
[0083] 对上述模型进行了实验验证，并且取得了明显的效果。在实验中，选用PARSE全身图像数据集，选取h-lM共14个骨架点，测试100帧静态图像数据，统计了均方根误差(RMS) 和最大误差(Max)，其数值均以像素为单位。根据实验效果，上文所提到质量函数不确定度δ 设置为〇. 1，形状特征中二元项对应的的γ为常数，取〇. 4。
[0084]本发明与YANG等人提出的方法比较，从RMS和MAX两个标准上都取得了理想的提升。其中，均方根误差RMS = 9.0288，YANG等人提出的方法最大误差平均值MAX = 113.2148提高至85.9704。同时，设置错误阈值为10个像素点，统计了准确度，平均准确率为84%。
[0085]以上所述，仅是本发明的较佳实施例，并非对本发明作任何形式上的限制，凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属本发明技术方案的保护范围。
【主权项】
1. 一种基于融合模型的人体姿态估计方法，其特征在于:包括以下步骤： (1) 以人体运动时的二维静态图像为输入数据，获取基于图模型的候选姿态； (2) 利用信度函数D-S融合模型将图像中的特征信息融合，求得最高信度值对应各部位的位置，作为最佳位置，从而获得人体姿态最佳结果。2. 根据权利要求1所述的基于融合模型的人体姿态估计方法，其特征在于：所述步骤 (1) 中依据图模型方法，将单部件和二元打分之和作为衡量因素，图模型中所求L为各部件的坐标位置;根据公式(6)，依次选取得分最高的前Μ个骨架点1*，作为候选集Ω Μ其中，li = {x，y}为部件i的像素位置，供(人Λ)是HOG特征向量，y(li-lj) = [dx，dx2，dy, dy2]T，i、j为相邻部件。3. 根据权利要求2所述的基于融合模型的人体姿态估计方法，其特征在于：所述步骤 (2) 包括以下分步骤： (2.1) 计算单部分的HOG特征的质量函数； (2.2) 计算单部分的形状特征的质量函数； (2.3) 将步骤(2.1)和(2.2)的结果融合，取最大信度值作为最佳位置，从而获得人体姿态最佳结果。4. 根据权利要求3所述的基于融合模型的人体姿态估计方法，其特征在于：所述步骤 (2.1) 中根据公式(9)计算单部分的HOG特征的质量函数：其中，hn(xn)代表了对应的HOG分类器hWSVM预测函数。5. 根据权利要求4所述的基于融合模型的人体姿态估计方法，其特征在于：所述步骤 (2.2) 中根据公式(10)计算单部分的形状特征的质量函数：其中，P#特征点X的检测框中的像素点，τ是判别函数，N是四个相连邻域，一元项c(pa) 定义了一个单独的像素偏向于前景或背景的程度，二元项定义了邻域像素点一致度。6. 根据权利要求5所述的基于融合模型的人体姿态估计方法，其特征在于：所述步骤 (2.3) 中根据公式(17)、（18)计算最大信度值Bel(A，l)反映了假设A的置信度，Bel({l}，l)是假设1为所求最佳位置对应的置信度： l*=Max Bel({l}，1) (18) 〇
【专利摘要】本发明公开一种基于融合模型的人体姿态估计方法，其能够充分利用图像特征信息，能够将图像的HOG特征信息和形状特征信息融合，提高了传统图模型结构的人体姿态识别的准确率。包括以下步骤：(1)以人体运动时的二维静态图像为输入数据，获取基于图模型的候选姿态；(2)利用信度函数D-S融合模型将图像中的特征信息融合，求得最高信度值对应各部位的位置，作为最佳位置，从而获得人体姿态最佳结果。
【IPC分类】G06K9/62, G06K9/00
【公开号】CN105678321
【申请号】CN201511025900
【发明人】孔德慧, 朱碧焓, 王少帆, 尹宝才
【申请人】北京工业大学
【公开日】2016年6月15日
【申请日】2015年12月31日

完整全部详细技术资料下载

当前第2页1 2