一种基于融合模型的人体姿态估计方法

文档序号：9911686阅读：473来源：国知局

一种基于融合模型的人体姿态估计方法
【技术领域】
[0001] 本发明属于计算机视觉和模式识别的技术领域，具体地涉及一种基于融合模型的人体姿态估计方法。
【背景技术】
[0002] 人体姿态估计是通过对图像中各种特征进行分析，自动确定人体部位在图像中的位置、方向和尺度的过程，是近年来一个热门的研究方向。在计算机视觉中，计算机只能处理图像的底层信息，然后对其所包含的信息进行推断，从而得到最终结果。但是，人类在认知的过程中并不遵循这一过程，而是依赖于概率、语言以及个人经验。因此，如何能跨域语义鸿沟一直是计算机视觉所研究的重点。人体姿态估计的研究具有重要的理论意义，涉及了计算机视觉多方面的知识。致使人体姿态估计成为重点研究方向的主要原因是电子设备飞速的发展，以及所带来的巨大的市场。人体姿态估计的研究能够应用于视频监控、虚拟现实、图像检索和人机交互等多方面。
[0003] 目前，面向二维图像的人体姿态估计方法中，基于PS模型的方法占有优势。PS模型是以图形结构来表示部件之间的连接，将人体分为多个刚性部件(头、躯干、一对上臂，一对下臂，一对大腿，一对小腿等），各部位用一个矩形框来定位表示;相邻两部件之间由关节点相连。由此，人体姿态模型主要包分为树形和非树形两种类型，树形结构中人体姿态可表示为L=(li, 12,…lio)，如图la。如图lb所示，人体树形结构模型，以无向图表示为：
[0004] G=(V，E) (1)
[0005] 其中E为图中所有的边的集合，顶点集合V={Vl，V2，V3，...， Vn}中的各个元素分别是对应人体刚性部位，若两个人体部位Vi和Vj相连，则存在边（Vi，Vj) eE。2009年Sam Johnson等人基于HOG和颜色特征的外观模型的似然度结果重叠作为新的外观模型，但是利用多个特征时图像特征的融合方法过于简单，以至于并不能实现高效的融合。2011年Yang 等人提出了基于树形结构，以HOG作为图像的特征向量的人体姿态估计方法，该方法没有充分利用图像中的信息，以致于手臂等部位检测准确率不高。基于以上等原因，寻求一种新的融合理论能够有效地融合图像中的多种特征信息。

【发明内容】

[0006] 本发明的技术解决问题是：克服现有技术的不足，提供一种基于融合模型的人体姿态估计方法，其能够充分利用图像特征信息，能够将图像的H0G特征信息和形状特征信息融合，提高了传统图模型结构的人体姿态识别的准确率。
[0007] 本发明的技术解决方案是:这种基于融合模型的人体姿态估计方法，包括以下步骤：
[0008] (1)以人体运动时的二维静态图像为输入数据，获取基于图模型的候选姿态；
[0009] (2)利用信度函数D-S融合模型将图像中的特征信息融合，求得最高信度值对应各部位的位置，作为最佳位置，从而获得人体姿态最佳结果。
[0010] 本发明中将信度函数D-S融合模型用于人体姿态估计，建立图像中多种特征信息的质量函数，对不同的质量函数进行融合，克服了贝叶斯公式的缺点，不必满足概率可加性，允许不确定性和相互矛盾的存在，并且将这些信息保存在质量函数当中，所以能够充分利用图像特征信息，能够将图像的H0G特征信息和形状特征信息融合，提高了传统图模型结构的人体姿态识别的准确率。
【附图说明】
[0011] 图la示出了树形结构中的人体姿态。
[0012] 图lb是图la的人体树形结构模型。
[0013]图2是根据本发明的基于融合模型的人体姿态估计方法的流程图。
【具体实施方式】
[0014]本发明专注于静态图像的人体姿态估计方法的研究，将Dempster-Shafer融合理论应用于二维人体姿态估计领域，提出了基于D-S融合理论的人体骨架点提取方法。D-S理论是一种数据融合理论，能够结合不同信源的证据，提供了一种不确定性的决策过程。根据 D-S理论，引入以下术语：
[0015] ⑴质量函数:存在一组互斥的假设? = {0^02，···，ΘΝ}，这组假设的全集有2N种可能，定义为Ρ( Θ ): ?(?)={ 0,, m":，
[0016] { Θν}, i Θ 1, θ ? θ ι, 0，},-, Θ} ⑵
[0017] 其中，0定义了空集。对一个质量函数的概率，定义了一个映射：
[0018]
[0019] ⑵信度函数:给定一个质量函数m，反映了假设Α的信度，可定义为：
[0020]
(?
[0021]根据Dempster的正交融合理论规则，将不同信源融合定义为：
[0022]
[0023]
[0024] 其中，?是融合符号，mn是An在Ρ( Θ )中所对应的质量函数，K是衡量N个质量函数间的冲突概率。当K = 0时，代表了 {nUVi中没有冲突;K=1时，代表了 {nUVi互相完全对立。K 的定义为：
[0025]
[0026] 如图2所示，这种基于融合模型的人体姿态估计方法，其特征在于:包括以下步骤：
[0027] (1)以人体运动时的二维静态图像为输入数据，获取基于图模型的候选姿态；
[0028] (2)利用信度函数D-S融合模型将图像中的特征信息融合，求得最高信度值对应各部位的位置，作为最佳位置，从而获得人体姿态最佳结果。
[0029] 本发明中将信度函数D-S融合模型用于人体姿态估计，建立图像中多种特征信息的质量函数，对不同的质量函数进行融合，克服了贝叶斯公式的缺点，不必满足概率可加性，允许不确定性和相互矛盾的存在，并且将这些信息保存在质量函数当中，所以能够充分利用图像特征信息，能够将图像的H0G特征信息和形状特征信息融合，提高了传统图模型结构的人体姿态识别的准确率。
[0030] 优选地，所述步骤（1)中依据图模型方法，将单部件和二元打分之和作为衡量因素，图模型中所求L为各部件的坐标位置;根据公式(6)，依次选取得分最高的前Μ个骨架点 1*，作为候选集Ω Μ
[0031]
[0032] 其中，li= {x，y}为部件i的像素位置，供(尤i/:)是HOG特征向量，
[0033] y(li-lj) = [dx，dx2，dy，dy2]T，i、j为相邻部件。
[0034] 优选地，所述步骤(2)包括以下分步骤：
[0035] (2.1)计算单部分的H0G特征的质量函数；
[0036] (2.2)计算单部分的形状特征的质量函数；
[0037] (2.3)将步骤(2.1)和(2.2)的结果融合，取最大信度值作为最佳位置，从而获得人体姿态最佳结果。
[0038] 优选地，所述步骤(2.1)中根据公式(9)计算单部分的H0G特征的质量函数：
[0039]
(的
[0040] 其中，hn(xn)代表了 xj/f对应的H0G分类器hr^SVM预测函数。
[0041] 优选地，所述步骤(2.2)中根据公式(10)计算单部分的形状特征的质量函数：
[0042]
(1〇)
[0043] 其中，加是特征点X的检测框中的像素点，τ是判别函数，N是四个相连邻域，一元项 c(pa)定义了一个单独的像素偏向于前景或背景的程度，二元项定义了邻域像素点一致度。
[0044] 优选地，所述步骤(2.3)中根据公式(17)、（18)计算最大信度值
[0045]
[0046] Bel(A，l)反映了假设A的置信度，Bel({l}，l)是假设1为所求最佳位置对应的置信度：
[0047] Γ=Μβχ Bel({l},l) (18)。
[0048] 以下对本发明进行更详细的说明。
[0049] 本发明以人体运动时的二维静态图像为输入数据，计算输出人体骨架点（16个)的空间位置。本发明主要过程分为两步：1、基于图模型的候选姿态获取;2、基于表观形状模型的最佳姿态获取，流程图如图2所示。
[0050] 1、基于图模型的候选姿态获取
[0051

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孔德慧;朱碧焓;王少帆;尹宝才;
技术所有人：北京工业大学;
我是此专利的发明人

上一篇：样本标注方法和装置的制造方法
上一篇：一种贝叶斯网络中基于矩阵分解的数据状态化方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。