基于人体姿态估计的健身动作识别方法、装置及相关设备

文档序号:33710878发布日期:2023-03-31 23:47阅读:55来源:国知局
基于人体姿态估计的健身动作识别方法、装置及相关设备

1.本发明涉及数据处理领域,尤其涉及一种基于人体姿态估计的健身动作识别方法、装置及相关设备。


背景技术:

2.随着生活经济水平的提高,人们的健康意识越来越强,越多越多的人在家也会利用闲暇时间进行锻炼身体,并且,居家健身只需要简单的运动器材,不受时间和地点的限制,有着参与门槛低的优点,越来越多的人通过手机、平板电脑等便携式设备参与“云健身”、直播健身等活动

3.尽管居家线上健身的参与门槛低,有益于保持身心健康,但是不正确的健身动作也可能会导致肌肉拉伤、关节错位等运动损伤,给健身参与者造成不可逆的伤害;再者,居家线上健身缺少专业健身教练的指导,健身者可能出现健身动作不正确、不标准、动作完成度不高导致无效锻炼等问题,现有方式中,主要通过智能手机、平板电脑或智能电视等设备进行健身活动,无法对健身动作的规范性进行监控,一定程度上可能出现上述运动风险出现。因此,如何确保民众在进行健身时,确保健身动作规范和健身的安全,成了一个亟待解决的难题。


技术实现要素:

4.本发明实施例提供一种基于人体姿态估计的健身动作识别方法、装置及相关设备,以提高健身动作规范性识别的精准程度。
5.为了解决上述技术问题,本技术实施例提供一种基于人体姿态估计的健身动作识别方法,包括:
6.获取视频流,并基于视频流提取人体关键点数据;
7.将所述人体关键点数据输入到训练好的健身动作分类网络中进行动作识别,得到动作分类结果,其中,所述动作分类结果包括至少一组识别动作数据和所述识别动作数据对应的类别,所述训练好的健身动作分类网络为多层神经网络mlp与长短时记忆神经网络lstm的叠加神经网络;
8.获取预设的标准健身动作字典,并针对每个所述识别动作数据,将所述识别动作数据与所述标准健身动作字典中对应类别的标准动作数据进行相似度计算,得到相似度值;
9.基于每组所述识别动作对应的相似度值,进行健身动作质量评估,得到质量评估结果。
10.可选地,所述基于视频流提取人体关键点数据包括:
11.采用目标检测算法,对所述视频流中的视频帧依次进行人体检测;
12.针对每个视频帧,若检测到人体,则采用人体姿态追踪算法,对检测到的人体进行姿态估计,得到预设区域和预设数量的人体关键点坐标,并将预设数量的人体关键点坐标
进行序列化处理,得到初始坐标序列;
13.对所述初始坐标序列进行居中化处理,得到目标坐标序列,并将所述目标坐标序列作为所述人体关键点数据。
14.可选地,所述预设区域和预设数量的人体关键点坐标包括臀部区域的两个坐标,所述对所述坐标序列进行居中化处理,得到目标坐标序列包括:
15.计算所述初始坐标序列中臀部区域的两个坐标的均值,作为人体的中心坐标;
16.针对所述初始坐标序列中的每个人体关键点坐标,将所述人体关键点坐标的坐标值均减去所述人体的中心坐标的坐标值,得到修正后的坐标值;
17.将所述修正后的坐标值构建的序列作为所述目标坐标序列。
18.可选地,所述将所述识别动作数据与所述标准健身动作字典中对应类别的标准动作数据进行相似度计算,得到相似度值,包括:
19.采用如下公式,计算相似度值cos(θ):
[0020][0021]
其中,为所述标准动作数据的第i个人体关键点的的坐标,为所述识别动作数据的第i个人体关键点的坐标。
[0022]
可选地,所述基于每组所述识别动作对应的相似度值,进行健身动作质量评估,得到质量评估结果包括:
[0023]
采用如下公式,对所述相似度值进行归一化,得到归一化:
[0024][0025]
其中,score为归一化分数;
[0026]
基于所述归一化分数确定质量评估结果。
[0027]
可选地,在将所述人体关键点数据输入到训练好的健身动作分类网络中进行动作识别,得到动作分类结果之后,所述基于人体姿态估计的健身动作识别方法还包括:
[0028]
获取所述动作分类结果中的类别对应的动作关注区域,作为目标区域,动作关注区域与类别之间预先设置有映射关系;
[0029]
针对所述类别对应的每个视频帧,根据所述视频帧中人体关键点数据,计算所述目标区域的关节角度;
[0030]
根据每个所述目标区域的关节角度,生成所述目标区域的可视化波动曲线,所述可视化波动曲线用以展示健身完成度。
[0031]
可选地,所述类别为深蹲动作类别,所述根据所述视频帧中人体关键点数据,计算所述目标区域的关节角度包括:
[0032]
识别视频帧中膝关节区域,作为目标区域;
[0033]
将所述目标区域范围内的人体关键点作为关节点,采用如下公式计算关节角度:
[0034][0035]
其中,angle为关节角度,p2p1表示关节点p2到关节点p1的向量,p2p3表示关节点p2到关节点p3的向量。
[0036]
为了解决上述技术问题,本技术实施例还提供一种基于人体姿态估计的健身动作识别装置,包括:
[0037]
数据提取模块,用于获取视频流,并基于视频流提取人体关键点数据;
[0038]
识别分类模块,用于将所述人体关键点数据输入到训练好的健身动作分类网络中进行动作识别,得到动作分类结果,其中,所述动作分类结果包括至少一组识别动作数据和所述识别动作数据对应的类别,所述训练好的健身动作分类网络为多层神经网络mlp与长短时记忆神经网络lstm的叠加神经网络;
[0039]
相似度计算模块,用于获取预设的标准健身动作字典,并针对每个所述识别动作数据,将所述识别动作数据与所述标准健身动作字典中对应类别的标准动作数据进行相似度计算,得到相似度值;
[0040]
质量评估模块,用于基于每组所述识别动作数据对应的相似度值,进行健身动作质量评估,得到质量评估结果。
[0041]
可选地,所述数据提取模块包括:
[0042]
目标检测单元,用于采用目标检测算法,对所述视频流中的视频帧依次进行人体检测;
[0043]
初始序列生成单元,用于针对每个视频帧,若检测到人体,则采用人体姿态追踪算法,对检测到的人体进行姿态估计,得到预设区域和预设数量的人体关键点坐标,并将预设数量的人体关键点坐标进行序列化处理,得到初始坐标序列;
[0044]
目标序列确定单元,用于对所述初始坐标序列进行居中化处理,得到目标坐标序列,并将所述目标坐标序列作为所述人体关键点数据。
[0045]
可选地,所述目标序列确定单元包括:
[0046]
中心坐标计算子单元,用于计算所述初始坐标序列中臀部区域的两个坐标的均值,作为人体的中心坐标;
[0047]
坐标值修正子单元,用于针对所述初始坐标序列中的每个人体关键点坐标,将所述人体关键点坐标的坐标值均减去所述人体的中心坐标的坐标值,得到修正后的坐标值;
[0048]
目标序列构建子单元,用于将所述修正后的坐标值构建的序列作为所述目标坐标序列。
[0049]
可选地,所述相似度计算模块包括:
[0050]
采用如下公式,计算相似度值cos(θ):
[0051][0052]
其中,为所述标准动作数据的第i个人体关键点的的坐标,为所述识别
动作数据的第i个人体关键点的坐标。
[0053]
可选地,所述质量评估模块包括:
[0054]
采用如下公式,对所述相似度值进行归一化,得到归一化:
[0055][0056]
其中,score为归一化分数;
[0057]
基于所述归一化分数确定质量评估结果。
[0058]
可选地,所述基于人体姿态估计的健身动作识别装置还包括:
[0059]
目标区域获取模块,用于获取所述动作分类结果中的类别对应的动作关注区域,作为目标区域,动作关注区域与类别之间预先设置有映射关系;
[0060]
角度计算模块,用于针对所述类别对应的每个视频帧,根据所述视频帧中人体关键点数据,计算所述目标区域的关节角度;
[0061]
波动可视化模块,用于根据每个所述目标区域的关节角度,生成所述目标区域的可视化波动曲线,所述可视化波动曲线用以展示健身完成度。
[0062]
可选地,所述类别为深蹲动作类别,所述根据所述视频帧中人体关键点数据,计算所述目标区域的关节角度所述角度计算模块包括:
[0063]
目标区域定位子单元,用于识别视频帧中膝关节区域,作为目标区域;
[0064]
关节角度计算子单元,用于将所述目标区域范围内的人体关键点作为关节点,采用如下公式计算关节角度:
[0065][0066]
其中,angle为关节角度,p2p1表示关节点p2到关节点p1的向量,p2p3表示关节点p2到关节点p3的向量。
[0067]
为了解决上述技术问题,本技术实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于人体姿态估计的健身动作识别方法的步骤。
[0068]
为了解决上述技术问题,本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于人体姿态估计的健身动作识别方法的步骤。
[0069]
本发明实施例提供的基于人体姿态估计的健身动作识别方法、装置、计算机设备及存储介质,通过获取视频流,并基于视频流提取人体关键点数据,进而将人体关键点数据输入到训练好的健身动作分类网络中进行动作识别,得到动作分类结果,其中,动作分类结果包括至少一组识别动作数据和识别动作数据对应的类别,训练好的健身动作分类网络为多层神经网络mlp与长短时记忆神经网络lstm的叠加神经网络;获取预设的标准健身动作字典,并针对每个识别动作数据,将识别动作数据与标准健身动作字典中对应类别的标准动作数据进行相似度计算,得到相似度值;基于每组识别动作数据对应的相似度值,进行健身动作质量评估,得到质量评估结果,实现快速将实时的健身动作与标准动作进行对比,提高健身动作规范性识别的精准程度。
附图说明
[0070]
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0071]
图1是本技术可以应用于其中的示例性系统架构图;
[0072]
图2是本技术的基于人体姿态估计的健身动作识别方法的一个实施例的流程图;
[0073]
图3是本技术一个采用改进的blazedark算法进行姿态识别的示意图;
[0074]
图4是根据本技术的基于人体姿态估计的健身动作识别装置的一个实施例的结构示意图;
[0075]
图5是根据本技术的计算机设备的一个实施例的结构示意图。
具体实施方式
[0076]
除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本技术;本技术的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本技术的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
[0077]
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0078]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0079]
请参阅图1,如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0080]
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。
[0081]
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、mp3播放器(moving picture experts group audio layer iii,动态影像专家压缩标准音频层面3)、mp4(moving picture experts group audio layer iv,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
[0082]
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
[0083]
需要说明的是,本技术实施例所提供的基于人体姿态估计的健身动作识别方法由服务器执行,相应地,基于人体姿态估计的健身动作识别装置设置于服务器中。
[0084]
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器,本技术实施例中的终端设备101、102、103具体可以对应的是实际生产中的应用系统。
[0085]
请参阅图2,图2示出本发明实施例提供的一种基于人体姿态估计的健身动作识别方法,以该方法应用在图1中的服务端为例进行说明,详述如下:
[0086]
s201:获取视频流,并基于视频流提取人体关键点数据。
[0087]
其中,视频流数据既可以是实时传输的实时视频流,也可以是保存的视频流数据,在视频流为实时视频流时,按照预设的时间间隔进行视频帧的提取,以减少数据量,确保后续及时对健身动作进行识别,预设的时间间隔可根据实际需要进行设定,例如0.5秒等。
[0088]
其中,人体关键点数据为预先设置好的人体各个区域的关键点对应的数据,在本实施例中,具体可以是坐标数据。
[0089]
应理解的是,视频流中包含多个视频帧,每个视频帧中提取一组人体关键点数据。
[0090]
在一具体可选实施方式中,基于视频流提取人体关键点数据包括:
[0091]
采用目标检测算法,对视频流中的视频帧依次进行人体检测;
[0092]
针对每个视频帧,若检测到人体,则采用人体姿态追踪算法,对检测到的人体进行姿态估计,得到预设区域和预设数量的人体关键点坐标,并将预设数量的人体关键点坐标进行序列化处理,得到初始坐标序列;
[0093]
对初始坐标序列进行居中化处理,得到目标坐标序列,并将目标坐标序列作为人体关键点数据。
[0094]
其中,预设区域是指预先设定提取关键点坐标的人体区域,预设数量是指提取的关键点的数量,具体可根据实际情况进行设定,作为优选方式,本实施例中,预设数量为17,预设区域包括鼻子、左眼、右眼、左耳、右耳、左肩、右肩、左肘、右肘、左手腕、右手腕、左臀、右臀、左膝、右膝、左脚踝、右脚踝。
[0095]
具体地,对收集到的视频流中的视频帧依次进行人体姿态提取,若该视频帧中存在人体,则对视频帧中的人进行姿态估计,得到该人体的17个人体关键点坐标,每个坐标包含x,y两个维度数据,每个包含人体的视频帧中得到数据的维度为[1,34],若视频帧中检测不到人体,则继续对下一帧进行检测,得到的人体关键点坐标形式为:[x1,y1,x2,y2...,x
17
,y
17
],依次对每个视频帧执行该操作,得到每个包含人体的视频帧的人体关键点数据。
[0096]
优选地,本实施例的人体姿态追踪算法采用改进的blazedark算法,该改进的blazedark算法主要包括heatmap编码模块、特征提取模块、上采样模块、heatmap解码模块以及输出模块,具体如图3所示,图3为本实施例采用改进的blazedark算法进行姿态识别的示意图,该上采样模块由三层上采样层构成,用于对由特征提取层生成的特征图进行上采样,并使用跳跃连接获取特征提取模块中的高分辨率特征,以还原图片的分辨率,从而较好的表示网络预测出的heatmap结果,最终上采样模块输出的特征图大小为17
×
64
×
64,并在此处计算网络的训练损失,利用反向传播对参数进行更新。
[0097]
进一步的,所述heatmap编码模块具体为,在网络的训练过程中,对于输入的包含人体的图片,对图片中的人体关键点对应的像素位置,利用二维高斯分布的方法对关键点
及其周围像素点生成二维高斯分布,以便于计算网络的损失;
[0098]
二维高斯分布生成heatmap的方式为:
[0099][0100]
其中x,y表示生成heatmap的坐标,u,v表示关键点的真实坐标,σ表示固定的空间方差。
[0101]
进一步的,所述特征提取模块由若干带有通道注意力机制的mobilebottleneck卷积块和blazeblock卷积块堆叠而成,用于提取输入图片中的深层语义特征,且具有相对较少的参数量,卷积操作主要由深度可分离卷积完成,能够在cpu上以较快的速度运行,其输入图片大小为3
×
256
×
256,输出特征图的大小为192
×8×
8;
[0102]
进一步的,进一步的,所述heatmap解码模块具体为,对预测得到的heatmap结果,利用对数似然估计和二阶泰勒展开得到关键点在图片中的位置坐标,并将其还原到原始输入图片中,从而得到模型的预测结果;
[0103]
进一步地,预设区域和预设数量的人体关键点坐标包括臀部区域的两个坐标,对坐标序列进行居中化处理,得到目标坐标序列包括:
[0104]
计算初始坐标序列中臀部区域的两个坐标的均值,作为人体的中心坐标;
[0105]
针对初始坐标序列中的每个人体关键点坐标,将人体关键点坐标的坐标值均减去人体的中心坐标的坐标值,得到修正后的坐标值;
[0106]
将修正后的坐标值构建的序列作为目标坐标序列。
[0107]
需要说明的是,居中化处理的目的是消除不同视频中人体不处于视频中央对健身动作分类的影响,从而提高后续识别的准确性。
[0108]
s202将人体关键点数据输入到训练好的健身动作分类网络中进行动作识别,得到动作分类结果,其中,动作分类结果包括至少一组识别动作数据和识别动作数据对应的类别,训练好的健身动作分类网络为多层神经网络mlp与长短时记忆神经网络lstm的叠加神经网络。
[0109]
进一步地,在步骤s202之前,还包括采用样本集对初始健身动作分类网络进行训练,得到训练好的健身动作分类网络,其中,样本集包括训练集和测试集,训练集和测试集的数据比例为4:1。
[0110]
在一具体可选实施方式中,样本集包含10类健身动作共1000段视频,健身动作的种类包含深蹲、仰卧起坐、俯卧撑等常见的健身动作,每类健身动作有100个视频,每段视频中包含一个健身者重复着做健身动作,视频持续时间为数十秒。
[0111]
s203获取预设的标准健身动作字典,并针对每个识别动作数据,将识别动作数据与标准健身动作字典中对应类别的标准动作数据进行相似度计算,得到相似度值。
[0112]
本实施例中,设置每一类健身动作的标准人体关键点坐标,进而得到标准动作数据与的字典,作为预设的标准健身动作字典,其中包含的每套标准动作数据对应一组类别,其中的标准人体关键点坐标是通过对样本集中的数据聚类得来。
[0113]
可选地,预设数量为17,将识别动作数据与标准健身动作字典中对应类别的标准动作数据进行相似度计算,得到相似度值,包括:
[0114]
采用如下公式,计算相似度值cos(θ):
[0115][0116]
其中,为标准动作数据的第i个人体关键点的的坐标,为识别动作数据的第i个人体关键点的坐标。
[0117]
s204基于每组识别动作数据对应的相似度值,进行健身动作质量评估,得到质量评估结果。
[0118]
具体根据相似度值确定质量评估结果的方式,可根据实际需要设定不同等级的质量评估结果对应的数值范围,此处不作具体限定。
[0119]
其中,所述质量评估结果包括但不限于:优秀、良好、一般和异常。
[0120]
可选地,在质量评估结果为异常时,执行强制暂停画面并语音提醒的预警措施,避免不规范动作对身体造成损伤。
[0121]
可选地,基于每组识别动作数据对应的相似度值,进行健身动作质量评估,得到质量评估结果包括:
[0122]
采用如下公式,对相似度值进行归一化,得到归一化:
[0123][0124]
其中,score为归一化分数;
[0125]
基于归一化分数确定质量评估结果。
[0126]
在本实施例的一个可选实施方式中,在将人体关键点数据输入到训练好的健身动作分类网络中进行动作识别,得到动作分类结果之后,基于人体姿态估计的健身动作识别方法还包括:
[0127]
获取动作分类结果中的类别对应的动作关注区域,作为目标区域,动作关注区域与类别之间预先设置有映射关系;
[0128]
针对类别对应的每个视频帧,根据视频帧中人体关键点数据,计算目标区域的关节角度;
[0129]
根据每个目标区域的关节角度,生成目标区域的可视化波动曲线,可视化波动曲线用以展示健身完成度。
[0130]
可选地,该方法还包括:生成类别对应的标准化波动曲线;在生成的目标区域的可视化波动曲线与标准化波动曲线形状差异程度较大时,进行预警提醒。
[0131]
其中,形状差异程度可通过相似度计算,预警提醒方式包括但不限于语音提醒、暂停画面等。
[0132]
进一步地,该类别为深蹲动作类别,根据视频帧中人体关键点数据,计算目标区域的关节角度包括:
[0133]
识别视频帧中膝关节区域,作为目标区域;
[0134]
将目标区域范围内的人体关键点作为关节点,采用如下公式计算关节角度:
[0135][0136]
其中,angle为关节角度,p2p1表示关节点p2到关节点p1的向量,p2p3表示关节点p2到关节点p3的向量。
[0137]
本实施例中,通过获取视频流,并基于视频流提取人体关键点数据,进而将人体关键点数据输入到训练好的健身动作分类网络中进行动作识别,得到动作分类结果,其中,动作分类结果包括至少一组识别动作数据和识别动作数据对应的类别,训练好的健身动作分类网络为多层神经网络mlp与长短时记忆神经网络lstm的叠加神经网络;获取预设的标准健身动作字典,并针对每个识别动作数据,将识别动作数据与标准健身动作字典中对应类别的标准动作数据进行相似度计算,得到相似度值;基于每组识别动作数据对应的相似度值,进行健身动作质量评估,得到质量评估结果,实现快速将实时的健身动作与标准动作进行对比,提高健身动作规范性识别的精准程度。
[0138]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0139]
图4示出与上述实施例基于人体姿态估计的健身动作识别方法一一对应的基于人体姿态估计的健身动作识别装置的原理框图。如图4所示,该基于人体姿态估计的健身动作识别装置包括数据提取模块31、识别分类模块32、相似度计算模块33和质量评估模块34。各功能模块详细说明如下:
[0140]
数据提取模块31,用于获取视频流,并基于视频流提取人体关键点数据;
[0141]
识别分类模块32,用于将人体关键点数据输入到训练好的健身动作分类网络中进行动作识别,得到动作分类结果,其中,动作分类结果包括至少一组识别动作数据和识别动作数据对应的类别,训练好的健身动作分类网络为多层神经网络mlp与长短时记忆神经网络lstm的叠加神经网络;
[0142]
相似度计算模块33,用于获取预设的标准健身动作字典,并针对每个识别动作数据,将识别动作数据与标准健身动作字典中对应类别的标准动作数据进行相似度计算,得到相似度值;
[0143]
质量评估模块34,用于基于每组识别动作数据对应的相似度值,进行健身动作质量评估,得到质量评估结果。
[0144]
可选地,数据提取模块31包括:
[0145]
目标检测单元,用于采用目标检测算法,对视频流中的视频帧依次进行人体检测;
[0146]
初始序列生成单元,用于针对每个视频帧,若检测到人体,则采用人体姿态追踪算法,对检测到的人体进行姿态估计,得到预设区域和预设数量的人体关键点坐标,并将预设数量的人体关键点坐标进行序列化处理,得到初始坐标序列;
[0147]
目标序列确定单元,用于对初始坐标序列进行居中化处理,得到目标坐标序列,并将目标坐标序列作为人体关键点数据。
[0148]
可选地,目标序列确定单元包括:
[0149]
中心坐标计算子单元,用于计算初始坐标序列中臀部区域的两个坐标的均值,作为人体的中心坐标;
[0150]
坐标值修正子单元,用于针对初始坐标序列中的每个人体关键点坐标,将人体关键点坐标的坐标值均减去人体的中心坐标的坐标值,得到修正后的坐标值;
[0151]
目标序列构建子单元,用于将修正后的坐标值构建的序列作为目标坐标序列。
[0152]
可选地,相似度计算模块33包括:
[0153]
采用如下公式,计算相似度值cos(θ):
[0154][0155]
其中,为标准动作数据的第i个人体关键点的的坐标,为识别动作数据的第i个人体关键点的坐标。
[0156]
可选地,质量评估模块34包括:
[0157]
采用如下公式,对相似度值进行归一化,得到归一化:
[0158][0159]
其中,score为归一化分数;
[0160]
基于归一化分数确定质量评估结果。
[0161]
可选地,基于人体姿态估计的健身动作识别装置还包括:
[0162]
目标区域获取模块,用于获取动作分类结果中的类别对应的动作关注区域,作为目标区域,动作关注区域与类别之间预先设置有映射关系;
[0163]
角度计算模块,用于针对类别对应的每个视频帧,根据视频帧中人体关键点数据,计算目标区域的关节角度;
[0164]
波动可视化模块,用于根据每个目标区域的关节角度,生成目标区域的可视化波动曲线,可视化波动曲线用以展示健身完成度。
[0165]
可选地,类别为深蹲动作类别,根据视频帧中人体关键点数据,计算目标区域的关节角度角度计算模块包括:
[0166]
目标区域定位子单元,用于识别视频帧中膝关节区域,作为目标区域;
[0167]
关节角度计算子单元,用于将目标区域范围内的人体关键点作为关节点,采用如下公式计算关节角度:
[0168][0169]
其中,angle为关节角度,p2p1表示关节点p2到关节点p1的向量,p2p3表示关节点p2到关节点p3的向量。
[0170]
关于基于人体姿态估计的健身动作识别装置的具体限定可以参见上文中对于基于人体姿态估计的健身动作识别方法的限定,在此不再赘述。上述基于人体姿态估计的健身动作识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0171]
为解决上述技术问题,本技术实施例还提供计算机设备。具体请参阅图5,图5为本实施例计算机设备基本结构框图。
[0172]
所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是,图中仅示出了具有组件连接存储器41、处理器42、网络接口43的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit,asic)、可编程门阵列(field-programmable gate array,fpga)、数字处理器(digital signal processor,dsp)、嵌入式设备等。
[0173]
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
[0174]
所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或d界面显示存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。当然,所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件,例如电子文件的控制的程序代码等。此外,所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
[0175]
所述处理器42在一些实施例中可以是中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的程序代码或者处理数据,例如运行基于人体姿态估计的健身动作识别的程序代码。
[0176]
所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
[0177]
本技术还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的基于人体姿态估计的健身动作识别方法的步骤。
[0178]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本技术各个实施例所述的方法。
[0179]
显然,以上所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例,附图中给出了本技术的较佳实施例,但并不限制本技术的专利范围。本技术可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本技术的公开内容的理解更加透彻全面。尽管参照前述实施例对本技术进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本技术说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本技术专利保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1