一种基于融合模型的人体姿态估计方法

文档序号:9911686阅读:473来源:国知局
一种基于融合模型的人体姿态估计方法
【技术领域】
[0001] 本发明属于计算机视觉和模式识别的技术领域,具体地涉及一种基于融合模型的 人体姿态估计方法。
【背景技术】
[0002] 人体姿态估计是通过对图像中各种特征进行分析,自动确定人体部位在图像中的 位置、方向和尺度的过程,是近年来一个热门的研究方向。在计算机视觉中,计算机只能处 理图像的底层信息,然后对其所包含的信息进行推断,从而得到最终结果。但是,人类在认 知的过程中并不遵循这一过程,而是依赖于概率、语言以及个人经验。因此,如何能跨域语 义鸿沟一直是计算机视觉所研究的重点。人体姿态估计的研究具有重要的理论意义,涉及 了计算机视觉多方面的知识。致使人体姿态估计成为重点研究方向的主要原因是电子设备 飞速的发展,以及所带来的巨大的市场。人体姿态估计的研究能够应用于视频监控、虚拟现 实、图像检索和人机交互等多方面。
[0003] 目前,面向二维图像的人体姿态估计方法中,基于PS模型的方法占有优势。PS模型 是以图形结构来表示部件之间的连接,将人体分为多个刚性部件(头、躯干、一对上臂,一对 下臂,一对大腿,一对小腿等),各部位用一个矩形框来定位表示;相邻两部件之间由关节点 相连。由此,人体姿态模型主要包分为树形和非树形两种类型,树形结构中人体姿态可表示 为L=(li, 12,…lio),如图la。如图lb所示,人体树形结构模型,以无向图表示为:
[0004] G=(V,E) (1)
[0005] 其中E为图中所有的边的集合,顶点集合V={Vl,V2,V3,..., Vn}中的各个元素分别 是对应人体刚性部位,若两个人体部位Vi和Vj相连,则存在边(Vi,Vj) eE。2009年Sam Johnson等人基于HOG和颜色特征的外观模型的似然度结果重叠作为新的外观模型,但是利 用多个特征时图像特征的融合方法过于简单,以至于并不能实现高效的融合。2011年Yang 等人提出了基于树形结构,以HOG作为图像的特征向量的人体姿态估计方法,该方法没有充 分利用图像中的信息,以致于手臂等部位检测准确率不高。基于以上等原因,寻求一种新的 融合理论能够有效地融合图像中的多种特征信息。

【发明内容】

[0006] 本发明的技术解决问题是:克服现有技术的不足,提供一种基于融合模型的人体 姿态估计方法,其能够充分利用图像特征信息,能够将图像的H0G特征信息和形状特征信息 融合,提高了传统图模型结构的人体姿态识别的准确率。
[0007] 本发明的技术解决方案是:这种基于融合模型的人体姿态估计方法,包括以下步 骤:
[0008] (1)以人体运动时的二维静态图像为输入数据,获取基于图模型的候选姿态;
[0009] (2)利用信度函数D-S融合模型将图像中的特征信息融合,求得最高信度值对应各 部位的位置,作为最佳位置,从而获得人体姿态最佳结果。
[0010] 本发明中将信度函数D-S融合模型用于人体姿态估计,建立图像中多种特征信息 的质量函数,对不同的质量函数进行融合,克服了贝叶斯公式的缺点,不必满足概率可加 性,允许不确定性和相互矛盾的存在,并且将这些信息保存在质量函数当中,所以能够充分 利用图像特征信息,能够将图像的H0G特征信息和形状特征信息融合,提高了传统图模型结 构的人体姿态识别的准确率。
【附图说明】
[0011] 图la示出了树形结构中的人体姿态。
[0012] 图lb是图la的人体树形结构模型。
[0013]图2是根据本发明的基于融合模型的人体姿态估计方法的流程图。
【具体实施方式】
[0014]本发明专注于静态图像的人体姿态估计方法的研究,将Dempster-Shafer融合理 论应用于二维人体姿态估计领域,提出了基于D-S融合理论的人体骨架点提取方法。D-S理 论是一种数据融合理论,能够结合不同信源的证据,提供了一种不确定性的决策过程。根据 D-S理论,引入以下术语:
[0015] ⑴质量函数:存在一组互斥的假设? = {0^02,···,ΘΝ},这组假设的全集有2N种可 能,定义为Ρ( Θ ): ?(?)={ 0,, m":,
[0016] { Θν}, i Θ 1, θ ? θ ι, 0,},-, Θ} ⑵
[0017] 其中,0定义了空集。对一个质量函数的概率,定义了一个映射:
[0018]
[0019] ⑵信度函数:给定一个质量函数m,反映了假设Α的信度,可定义为:
[0020]
(?
[0021]根据Dempster的正交融合理论规则,将不同信源融合定义为:
[0022]
[0023]
[0024] 其中,?是融合符号,mn是An在Ρ( Θ )中所对应的质量函数,K是衡量N个质量函数间 的冲突概率。当K = 0时,代表了 {nUVi中没有冲突;K=1时,代表了 {nUVi互相完全对立。K 的定义为:
[0025]
[0026] 如图2所示,这种基于融合模型的人体姿态估计方法,其特征在于:包括以下步骤:
[0027] (1)以人体运动时的二维静态图像为输入数据,获取基于图模型的候选姿态;
[0028] (2)利用信度函数D-S融合模型将图像中的特征信息融合,求得最高信度值对应各 部位的位置,作为最佳位置,从而获得人体姿态最佳结果。
[0029] 本发明中将信度函数D-S融合模型用于人体姿态估计,建立图像中多种特征信息 的质量函数,对不同的质量函数进行融合,克服了贝叶斯公式的缺点,不必满足概率可加 性,允许不确定性和相互矛盾的存在,并且将这些信息保存在质量函数当中,所以能够充分 利用图像特征信息,能够将图像的H0G特征信息和形状特征信息融合,提高了传统图模型结 构的人体姿态识别的准确率。
[0030] 优选地,所述步骤(1)中依据图模型方法,将单部件和二元打分之和作为衡量因 素,图模型中所求L为各部件的坐标位置;根据公式(6),依次选取得分最高的前Μ个骨架点 1*,作为候选集Ω Μ
[0031]
[0032] 其中,li= {x,y}为部件i的像素位置,供(尤i/:)是HOG特征向量,
[0033] y(li-lj) = [dx,dx2,dy,dy2]T,i、j为相邻部件。
[0034] 优选地,所述步骤(2)包括以下分步骤:
[0035] (2.1)计算单部分的H0G特征的质量函数;
[0036] (2.2)计算单部分的形状特征的质量函数;
[0037] (2.3)将步骤(2.1)和(2.2)的结果融合,取最大信度值作为最佳位置,从而获得人 体姿态最佳结果。
[0038] 优选地,所述步骤(2.1)中根据公式(9)计算单部分的H0G特征的质量函数:
[0039]
(的
[0040] 其中,hn(xn)代表了 xj/f对应的H0G分类器hr^SVM预测函数。
[0041] 优选地,所述步骤(2.2)中根据公式(10)计算单部分的形状特征的质量函数:
[0042]
(1〇)
[0043] 其中,加是特征点X的检测框中的像素点,τ是判别函数,N是四个相连邻域,一元项 c(pa)定义了一个单独的像素偏向于前景或背景的程度,二元项定义了邻域像素点一致度。
[0044] 优选地,所述步骤(2.3)中根据公式(17)、(18)计算最大信度值
[0045]
[0046] Bel(A,l)反映了假设A的置信度,Bel({l},l)是假设1为所求最佳位置对应的置信 度:
[0047] Γ=Μβχ Bel({l},l) (18)。
[0048] 以下对本发明进行更详细的说明。
[0049] 本发明以人体运动时的二维静态图像为输入数据,计算输出人体骨架点(16个)的 空间位置。本发明主要过程分为两步:1、基于图模型的候选姿态获取;2、基于表观形状模型 的最佳姿态获取,流程图如图2所示。
[0050] 1、基于图模型的候选姿态获取
[0051
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1