一种乒乓球运动分析方法与流程

文档序号:31051553发布日期:2022-08-06 07:32阅读:176来源:国知局
一种乒乓球运动分析方法与流程

1.本技术属于运动分析技术领域,更具体地说,本技术涉及一种乒乓球运动分析方法。


背景技术:

2.专利公开文献cn112085761a公开了一种乒乓球轨迹捕捉分析方法及分析系统,披露了以下技术方案:双目立体视觉子系统以固定帧率同步触发两台相机对乒乓球运动过程的图像进行采集,该图像包括左相机图像和右相机图像;将两台相机对应采集到的左相机图像和右相机图像分别输入到不同线程中的稀疏卷积神经网络中,对双目图像中的多个乒乓球进行匹配、重建和筛选。
3.可见,现有的乒乓球分析方法都是基于外置传感器或者标定极其复杂的多台摄像机系统,缺点为网络计算量大、成本高且部署使用困难。


技术实现要素:

4.本技术的目的在于提供一种乒乓球运动分析方法,以解决上述现有技术中存在的乒乓球分析方法网络计算量大、成本高且部署使用困难的技术问题。
5.为实现上述技术目的,本技术采用的技术方案如下:
6.一种乒乓球运动分析方法,包括以下步骤:
7.获取单个相机拍摄的实时视频流,对所述视频流的部分待识别视频帧中的球桌角点进行标注,基于标注后的球桌角点计算单应性矩阵;
8.将所述待识别视频帧输入到检测网络模型,以识别得到所有待识别视频帧中球的位置热图,根据所述位置热图对漏检的球进行插值以及进行轨迹平滑,得到球轨迹;
9.基于所述球轨迹获取第一极小值点,根据所述单应性矩阵将第一极小值点投影到标准球桌平面上得到第二极小值点,若第二极小值点位于标准球桌范围之内,则所述第二极小值点为弹桌点。
10.优选地,对所述视频流的部分待识别视频帧中的球桌角点进行标注,具体包括以下步骤:
11.对r、g、b三个颜色通道分成nr、ng、nb三组色阶,遍历所述待识别视频帧,得到像素个数最多的色阶;
12.遍历像素个数最多的色阶得到闭合区域,所述闭合区域为球桌掩膜,提取所述球桌掩膜的最大闭合边缘;
13.对所述最大闭合边缘进行多边形拟合,以计算得到所述待识别视频帧中球桌的四个预测顶点,四个预测顶点即为球桌角点。
14.优选地,遍历像素个数最多的色阶得到闭合区域,所述闭合区域为球桌掩膜,具体包括以下步骤:
15.从所述待识别视频帧的画面中央开始向左右两边遍历,将第一个落在像素个数最
多的色阶区间的像素点作为种子点,以所述种子点为起点开始向邻域遍历;
16.若所述种子点和邻域的距离小于预设的距离阈值,则将所述邻域归类为是桌面的像素点并继续生长,得到闭合区域即球桌掩膜。
17.优选地,对所述视频流的部分待识别视频帧中的球桌角点进行标注,具体包括以下步骤:
18.采集不同场景下的乒乓球桌照片并进行标注,基于所述乒乓球桌照片训练得到语义分割网络模型;
19.将所述视频流的部分待识别视频帧输入到语义分割网络模型,以计算得到球桌掩膜,基于所述球桌掩膜计算所述待识别视频帧中球桌的四个预测顶点,四个预测顶点即为球桌角点。
20.优选地,将所述待识别视频帧输入到检测网络模型,以识别得到所有待识别视频帧中球的位置热图,具体包括以下步骤:
21.所述检测网络模型包括上半分支和下半分支,将多张待识别视频帧输入到检测网络模型,下半分支通过少次下采样得到多张待识别视频帧的空间特征,上半分支通过多次下采样得到多张待识别视频帧的上下文特征;
22.所述上下文特征和所述空间特征进行拼接,拼接后经过卷积模块和注意力机制模块处理后输出预测结果,所述预测结果为待识别视频帧中球的位置热图。
23.优选地,将所述待识别视频帧输入到检测网络模型,以识别得到所有待识别视频帧中球的位置热图,具体包括以下步骤:
24.检测网络模型包括第三分支,第三分支包括卷积模块和1*1卷积模块;
25.将多张待识别视频帧输入到检测网络模型,通过卷积模块和1*1卷积模块预测待识别视频帧和高斯-拉普拉斯算子卷积的结果。
26.优选地,根据所述位置热图对漏检的球进行插值以及进行轨迹平滑,得到球轨迹,具体包括以下步骤:
27.所述位置热图的坐标均为0时,对漏检的球进行插值;
28.连接每一所述位置热图形成初始球轨迹,通过滤波器对所述初始球轨迹进行平滑,得到平滑后的球轨迹,基于所述平滑后的球轨迹计算每个时刻的球速度。
29.优选地,基于所述球轨迹获取第一极小值点,根据所述单应性矩阵将第一极小值点投影到标准球桌平面上得到第二极小值点,若第二极小值点位于标准球桌范围之内,则所述第二极小值点为弹桌点,具体包括以下步骤:
30.获取标准球桌平面上对应的标准顶点,基于待识别视频帧中标注的球桌角点和标准顶点计算单应性矩阵;
31.基于所述球轨迹获取第一极小值点,根据所述单应性矩阵将第一极小值点投影到标准球桌平面上得到第二极小值点,若第二极小值点位于标准球桌范围之内,则所述第二极小值点为弹桌点;
32.将标准球桌平面划分为若干区域,根据所述弹桌点的分布计算得到落点热区。
33.一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现如上述所述的一种乒乓球运动分析方法。
34.一种计算机可读存储介质,计算机可读存储介质上存储有计算机指令,所述计算机指令被处理器执行时实现上述所述方法的步骤。
35.本技术提供的有益效果在于:
36.1、本技术通过获取单个相机拍摄的实时视频流,识别得到所有待识别视频帧中球的位置热图,根据位置热图得到球轨迹,根据单应性矩阵将第一极小值点投影到标准球桌平面上得到第二极小值点,若第二极小值点位于标准球桌范围之内,则第二极小值点为弹桌点。本技术仅使用单个相机即可提取分析乒乓球比赛过程中的球轨迹,得到球速和落点热区等运动数据,本技术的技术方案网络计算量小、硬件成本低、简洁以及使用方便。
37.2、本技术遍历像素个数最多的色阶得到球桌掩膜,或将视频流的部分待识别视频帧输入到语义分割网络模型,以计算得到球桌掩膜,提取球桌掩膜的最大闭合边缘,对最大闭合边缘进行多边形拟合,以计算得到球桌的四个预测顶点,无需人工参与,无需使用复杂的摄像机系统或利用棋盘格拍摄多组图片进行复杂标定,自动识别出乒乓球桌的四个顶点,本技术的技术方案更加方便,使用简单,为乒乓球数据分析提供基础。
附图说明
38.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
39.图1是乒乓球运动分析方法的流程图;
40.图2是检测网络模型的结构示意图。
具体实施方式
41.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。
42.因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
43.实施例1:
44.如图1所示,本实施例包括一种乒乓球运动分析方法,包括以下步骤:获取单个相机拍摄的实时视频流,对视频流的部分待识别视频帧中的球桌角点进行标注,基于标注后的球桌角点计算单应性矩阵。
45.将待识别视频帧输入到检测网络模型,以识别得到所有待识别视频帧中球的位置热图,根据位置热图对漏检的球进行插值以及进行轨迹平滑,得到球轨迹。基于球轨迹获取第一极小值点,根据单应性矩阵将第一极小值点投影到标准球桌平面上得到第二极小值点,若第二极小值点位于标准球桌范围之内,则第二极小值点为弹桌点。
46.具体的,单个相机放置于乒乓球桌一侧,以使相机视场能够覆盖整个球桌及运动员活动区域,获取单个相机拍摄的实时视频流,将视频流解码成待识别视频帧。
47.具体的,在比赛开始前,需要对部分待识别视频帧中的球桌角点进行标注,标定可采用手动标定或者自动标定两种方式。手动标定是在实时展示的部分待识别视频帧中,找到球桌的左下预测顶点、左上预测顶点、右下预测顶点和右上预测顶点,同时记下对应的位置。自动标定包括以下方案:
48.对视频流的部分待识别视频帧中的球桌角点进行标注,具体包括以下步骤:对r、g、b三个颜色通道分成nr、ng、nb三组色阶,遍历待识别视频帧,得到像素个数最多的色阶。
49.遍历像素个数最多的色阶得到闭合区域,闭合区域为球桌掩膜,提取球桌掩膜的最大闭合边缘。对最大闭合边缘进行多边形拟合,以计算得到待识别视频帧中球桌的四个预测顶点,四个预测顶点即为球桌角点。
50.遍历像素个数最多的色阶得到闭合区域,闭合区域为球桌掩膜,具体包括以下步骤:从待识别视频帧的画面中央开始向左右两边遍历,将第一个落在像素个数最多的色阶区间的像素点作为种子点,以种子点为起点开始向邻域遍历。若种子点和邻域的距离小于预设的距离阈值,则将邻域归类为是桌面的像素点并继续生长,得到闭合区域即球桌掩膜。
51.具体的,对r、g、b三个颜色通道分成nr、ng、nb三组色阶,遍历待识别视频帧,统计落在每组色阶的像素个数,获得像素个数最多的色阶{[r1,r2],[g1,g2],[b1,b2]},其中,r1和r2是像素个数最多的色阶在r通道的左边界和右边界,g1和g2是像素个数最多的色阶在g通道的左边界和右边界,b1和b2是像素个数最多的色阶在b通道的左边界和右边界。从待识别视频帧的画面中央开始向左右两边遍历,找到落在{[r1,r2],[g1,g2],[b1,b2]}的第一个像素点作为种子点,以种子点为起点开始向邻域遍历。
[0052]
在本实施例中,定义预设的距离阈值可以为r
t
,g
t
,b
t
。若种子点和邻域同时满足:在[r1,r2]中,种子点和邻域的距离小于预设的距离阈值r
t
。在[g1,g2]中,种子点和邻域的距离小于预设的距离阈值g
t
。在[b1,b2]中,种子点和邻域的距离小于预设的距离阈值b
t
,则将邻域归类为是桌面的像素点并继续生长。若种子点和邻域的距离大于预设的距离阈值,则结束流程,遍历完成后得到初始的闭合区域,对初始的闭合区域进行内部填充,得到最终的闭合区域即球桌掩膜。
[0053]
提取球桌掩膜的最大闭合边缘,对最大闭合边缘进行多边形拟合,以计算得到待识别视频帧中球桌的四个预测顶点,四个预测顶点即为球桌角点。
[0054]
提取球桌掩膜的最大闭合边缘,具体包括以下步骤:统计球桌掩膜的连通域,将连通域的面积从大到小排序,以计算得到各个连通域直径。基于预设大小的连通域直径对球桌掩膜进行开操作,得到第一球桌掩膜,基于第一球桌掩膜计算最大闭合边缘。
[0055]
具体的,定义球桌掩膜表示为mt,统计mt的连通域,将连通域的面积从大到小排序得到{t1,t2,

,tn},{t1,t2,

,tn}的直径为{r1,r2,

,rn},对mt以预设的kernel大小为r2进行开操作得到第一球桌掩膜。
[0056]
基于第一球桌掩膜计算最大闭合边缘,具体包括以下步骤:按从上到下、从左到右的顺序遍历第一球桌掩膜得到边缘起点,根据边缘起点新建闭合边缘。以第一球桌掩膜中任一像素点为起点,按顺时针方向遍历像素点的4邻域,直至闭合边缘遍历完成。重复运行以上步骤直至第一球桌掩膜遍历完成,对闭合边缘按包含的元素数量进行排序,元素数量
最多的闭合边缘即为最大闭合边缘。
[0057]
具体的,步骤一:定义第一球桌掩膜表示为mto,定义mto的宽为w,定义mto的高为h,定义mto中任一像素点去x
i,j
,其中,0≤i≤w-1,0≤j≤h-1。按从上到下、从左到右的顺序遍历mto,若找到i1,j1,满足条件且则称为边缘起点,根据边缘起点新建闭合边缘blk=[(i1,j1)]。
[0058]
步骤二:以为起点,从开始按顺时针方向遍历的4邻域,若找到i2,j2,满足条件并且满足i1≠i2或j1≠j2,则令i1=i2,j1=j2,并将(i2,j2)加入到闭合边缘blk中。
[0059]
步骤三:重复步骤二,直到i1=i2且j1=j2,此时闭合边缘blk遍历完成。
[0060]
步骤四:重复步骤一至步骤三直到遍历完成mto,最终得到闭合边缘集合bl={bl1,bl2,

,blk},对bl按包含的元素数量进行排序,元素数量最多的闭合边缘即为即为最大闭合边缘bl
max

[0061]
对最大闭合边缘bl
max
进行多边形拟合,以计算得到待识别视频帧中球桌的左下预测顶点、左上预测顶点、右下预测顶点和右上预测顶点,左下预测顶点、左上预测顶点、右下预测顶点和右上预测顶点即为四个球桌角点。
[0062]
将待识别视频帧输入到检测网络模型,以识别得到所有待识别视频帧中球的位置热图,具体包括以下步骤:检测网络模型包括上半分支和下半分支,将多张待识别视频帧输入到检测网络模型,下半分支通过少次下采样得到多张待识别视频帧的空间特征,上半分支通过多次下采样得到多张待识别视频帧的上下文特征。
[0063]
上下文特征和空间特征进行拼接,拼接后经过卷积模块和注意力机制模块处理后输出预测结果,预测结果为待识别视频帧中球的位置热图。
[0064]
将待识别视频帧输入到检测网络模型,以识别得到所有待识别视频帧中球的位置热图,具体包括以下步骤:检测网络模型包括第三分支,第三分支包括卷积模块和1*1卷积模块。将多张待识别视频帧输入到检测网络模型,通过卷积模块和1*1卷积模块预测待识别视频帧和高斯-拉普拉斯算子卷积的结果。
[0065]
在乒乓球比赛中,球占视频帧的比例小,且运动速度较快,因此目前常用的检测网络模型难以保证检测的准确率。为了实现快速小目标的检测追踪,在本实例中,提出如下检测网络模型的结构:
[0066]
如图2所示,检测网络模型的输入为多帧堆叠,即一次输入多张待识别视频帧。检测网络模型包括上半分支和下半分支。下半分支称为空间分支,经过conv1模块、conv2模块和conv3模块采样后得到多张待识别视频帧的空间特征。conv1模块、conv2模块和conv3模块采用conv+bn+relu的结构。
[0067]
上半分支称为上下文分支,上下文分支分为两路处理,第一路处理经过4*down模块、8*down模块、16*down模块和se注意力机制模块,第二路处理经过4*down模块、8*down模块、16*down模块、32*down模块和se注意力机制模块,经过上下文分支的两路处理得到多张待识别视频帧的上下文特征,拼接上下文特征和空间特征,将拼接后的数据经过conv4模块和se注意力机制模块后,输出预测结果,预测结果为待识别视频帧中球的位置热图。conv4模块同样采用conv+bn+relu的结构。其中,4*down模块、8*down模块、16*down模块、32*down
模块的区别点在于下采样的倍率不同,检测网络模型在训练时,ce loss函数通过梯度下降指导整个检测网络模型的全局收敛。
[0068]
检测网络模型还包括第三分支,在conv2模块引出第三分支,通过conv5模块和1*1卷积模块预测待识别视频帧和高斯-拉普拉斯算子卷积的结果,其中,高斯-拉普拉斯算子优选为:或
[0069]
还包括步骤:获取真实待识别视频帧和高斯-拉普拉斯算子卷积的结果,通过gl loss函数对比预测卷积结果和真实卷积结果,以计算得到预测卷积结果的精度是否在预设范围内。若预测卷积结果的精度不在预设范围内,则梯度反向传播调整权重后重新预测待识别视频帧和高斯-拉普拉斯算子卷积的结果,直到预测卷积结果的精度在预设范围内。预测卷积结果的精度越高,则代表空间分支浅层学习到的细节信息更多。
[0070]
通过第三分支强化空间分支,模拟非线性变化,保证空间分支浅层学习到更多的细节信息。本技术的检测网络模型计算量小,即使输入的是高分辨率的视频帧仍然能满足乒乓球位置热图实时推理的需求。
[0071]
根据位置热图对漏检的球进行插值以及进行轨迹平滑,得到球轨迹,具体包括以下步骤:位置热图的坐标均为0时,对漏检的球进行插值。连接每一位置热图形成初始球轨迹,通过滤波器对初始球轨迹进行平滑,得到平滑后的球轨迹,基于平滑后的球轨迹计算每个时刻的球速度。
[0072]
在本实施例中,若位置热图中球的坐标表示为(0,0),则表示当前待识别视频帧漏检,需要对漏检的球进行插值,优先采用bicubic插值,采用的公式如下:
[0073][0074]
其中,w(x)表示为滤波器系数,x表示为点坐标,a表示为滤波常数。bicubic采用三次多项式进行拟合,可以更大程度的保留原始轨迹特征。
[0075]
在本实施例中,为了消除测量噪声的影响,保证轨迹的连续性,需要对初始球轨迹进行平滑,优先采用savitzky-golay滤波器对初始轨迹进行平滑,采用的公式如下:
[0076][0077]
其中,p
t,s
表示为平滑后的球坐标,h表示为滤波常数,hi表示为平滑系数,w表示为滤波窗口宽度,p
t+i
表示为第t+i时刻的球坐标。
[0078]
在本实施例中,基于平滑后的球轨迹计算每个时刻的球速度,球速度为当前时刻相对于上一时刻球的位移除以两帧的时间间隔。
[0079]
基于球轨迹获取第一极小值点,根据单应性矩阵将第一极小值点投影到标准球桌平面上得到第二极小值点,若第二极小值点位于标准球桌范围之内,则第二极小值点为弹桌点,具体包括以下步骤:获取标准球桌平面上对应的标准顶点,基于待识别视频帧中标注的球桌角点和标准顶点计算单应性矩阵。
[0080]
基于球轨迹获取第一极小值点,根据单应性矩阵将第一极小值点投影到标准球桌
平面上得到第二极小值点,若第二极小值点位于标准球桌范围之内,则第二极小值点为弹桌点。将标准球桌平面划分为若干区域,根据弹桌点的分布计算得到落点热区。
[0081]
具体的,待识别视频帧中的四个球桌角点分别为左下预测顶点、左上预测顶点、右下预测顶点和右上预测顶点,获取标准球桌平面上对应的四个标准顶点,基于四个球桌角点和四个标准顶点计算单应性矩阵,单应性矩阵即为画面坐标系和标准球桌坐标系之间相互转化的映射关系。
[0082]
具体的,基于平滑后的球轨迹获取第一极小值点p
tmin
,根据单应性矩阵将第一极小值点p
tmin
映射转换到标准球桌平面上,得到标准球桌平面上的第二极小值点p
tmin’,若p
tmin’位于标准球桌范围之内,该p
tmin’为弹桌点。将标准球桌平面划分为若干区域,根据弹桌点的分布计算得到落点热区,根据落点热区可以进一步分析运动员的比赛表现。
[0083]
实施例2:
[0084]
本实施例与实施例1的区别点在于:对待识别视频帧中的球桌角点进行自动标定的方式不同。
[0085]
在比赛开始前,需要对部分待识别视频帧中的球桌角点进行标注,标定可采用手动标定或者自动标定两种方式。手动标定是在实时展示的部分待识别视频帧中,找到球桌的左下预测顶点、左上预测顶点、右下预测顶点和右上预测顶点,同时记下对应的位置。自动标定包括以下方案:
[0086]
对视频流的部分待识别视频帧中的球桌角点进行标注,具体包括以下步骤:采集不同场景下的乒乓球桌照片并进行标注,基于乒乓球桌照片训练得到语义分割网络模型。将视频流的部分待识别视频帧输入到语义分割网络模型,以计算得到球桌掩膜,基于球桌掩膜计算待识别视频帧中球桌的四个预测顶点,四个预测顶点即为球桌角点。
[0087]
具体的,采集不同视角、光线和背景下的乒乓球桌照片,人工标注乒乓球桌照片的球桌掩膜,将乒乓球桌照片输入至分割网络模型,以对分割网络模型进行训练得到语义分割网络模型。
[0088]
采用损失函数对训练后的语义分割网络模型进行验证,判断是否为误差范围内的语义分割网络模型。若超出误差范围,则基于乒乓球桌照片继续训练语义分割网络模型,若没有超出误差范围,则结束训练,得到精准的语义分割网络模型。
[0089]
在本实施例中,分割网络模型包括但不限于常用的语义分割模型如unet、deeplabv3和fcn等。
[0090]
还包括步骤:损失函数由dice loss函数、binary cross entropy loss函数和boundary loss函数组成。损失函数的公式为:l=ω1l
dice
+ω2l
bce
+ω3l
boundary

[0091]
其中,l表示为损失函数,l
dice
表示为dice loss函数,l
bce
表示为binary cross entropy loss函数,l
boundary
表示为boundary loss函数,ω1表示为dice loss函数所占的权重,ω2表示为binary cross entropy loss函数所占的权重,ω3表示为boundary loss函数所占的权重。
[0092]
具体的,在本技术的技术方案中,边缘是定位预测顶点的关键信息,为了突出边缘,损失函数采用dice loss函数+binary cross entropy loss函数+boundary loss函数的组合。
[0093]
dice loss函数采用的公式如下:
[0094][0095]
其中,l
dice
表示为dice loss函数,y表示为真实的球桌掩膜,表示为预测的球桌掩膜。binary cross entropy loss函数采用的公式如下:
[0096][0097]
其中,l
bce
表示为binary cross entropy loss函数,y表示为真实的球桌掩膜,表示为预测的球桌掩膜。
[0098]
boundary loss函数采用的公式如下:
[0099]
l
boundary
=∫
ω
φg(q)s(q)dq
[0100]
其中,l
boundary
表示为boundary loss函数,y表示为真实的球桌掩膜,表示为预测的球桌掩膜,ω表示为y和的并集,g表示为y的边缘,q表示为ω中任意一点,φg(q)表示为q点到g上任意一点的最近距离,当q点在上时,s(q)=1,否则s(q)=0。
[0101]
具体的,dice loss函数和binary cross entropy loss函数用来保证预测的球桌掩膜形状接近真实标签的形状,boundary loss函数用来保证预测的边缘尽量贴近真实标签的边缘。参数ω1和参数ω2随着训练轮数的增加而减小,参数ω3随着训练轮数的增加而增加,使模型在训练初期关注预测的球桌掩膜的整体形状,而在训练后期关注边缘细节。
[0102]
训练语义分割网络模型时,通过数据增强操作增强语义分割网络模型对各种复杂环境的泛化能力。数据增强操作包括旋转、翻转、平移、缩放和随机遮挡策略。
[0103]
还包括步骤:统计球桌掩膜的连通域,将连通域的面积从大到小排序,以计算得到各个连通域直径。基于预设大小的连通域直径对球桌掩膜进行开操作,得到第一球桌掩膜,提取第一球桌掩膜的最大闭合边缘。对最大闭合边缘进行多边形拟合,得到待识别视频帧中球桌的四个预测顶点。
[0104]
具体的,定义球桌掩膜表示为mt,统计mt的连通域,将连通域的面积从大到小排序得到{t1,t2,

,tn},{t1,t2,

,tn}的直径为{r1,r2,

,rn},对mt以预设的kernel大小为r2进行开操作得到第一球桌掩膜。
[0105]
提取第一球桌掩膜的最大闭合边缘,具体包括以下步骤:按从上到下、从左到右的顺序遍历第一球桌掩膜得到边缘起点,根据边缘起点新建闭合边缘。以第一球桌掩膜中任一像素点为起点,按顺时针方向遍历像素点的4邻域,直至闭合边缘遍历完成。重复运行以上步骤直至第一球桌掩膜遍历完成,对闭合边缘按包含的元素数量进行排序,元素数量最多的闭合边缘即为最大闭合边缘。
[0106]
具体的,步骤一:定义第一球桌掩膜表示为mto,定义mto的宽为w,定义mto的高为h,定义mto中任一像素点去x
i,j
,其中,0≤i≤w-1,0≤j≤h-1。按从上到下、从左到右的顺序遍历mto,若找到i1,j1,满足条件且则称为边缘起点,根据边缘起点新建闭合边缘blk=[(i1,j1)]。
[0107]
步骤二:以为起点,从开始按顺时针方向遍历的4邻域,若找到i2,j2,满足条件并且满足i1≠i2或j1≠j2,则令i1=i2,j1=j2,并将(i2,j2)加入到闭
合边缘blk中。
[0108]
步骤三:重复步骤二,直到i1=i2且j1=j2,此时闭合边缘blk遍历完成。
[0109]
步骤四:重复步骤一至步骤三直到遍历完成mto,最终得到闭合边缘集合bl={bl1,bl2,

,blk},对bl按包含的元素数量进行排序,元素数量最多的闭合边缘即为最大闭合边缘bl
max

[0110]
对最大闭合边缘进行多边形拟合,得到待识别视频帧中球桌的四个预测顶点,具体包括以下步骤:获取最大闭合边缘上任意两点,计算两点之间的第一直线距离,计算两点之间的边缘点到第一直线的最大距离。
[0111]
若最大距离大于预设的距离阈值,则拆分两点之间的第一直线距离,得到第二直线和第三直线,重复运行以上步骤直至最大距离低于预设的距离阈值。遍历完闭合边缘上的所有点得到若干预测顶点,若干预测顶点组成预测顶点集。
[0112]
对预测顶点集中的预测顶点进行升序排序,得到球桌的左下预测顶点、左上预测顶点、右下预测顶点和右上预测顶点。
[0113]
具体的,获取最大闭合边缘bl
max
上的任意两点,两点分别定义为a点和b点,计算a点和b点之间的第一直线距离,即直线ab。计算两点之间的边缘点到直线ab的最大距离d,令最大距离的点为c点。在本实施例中,边缘点是按照顺时针或者逆时针遍历边缘时,在a点和b点之间遍历到的所有边缘点。
[0114]
若最大距离d大于预设的距离阈值dt,则将直线ab分为ac和cb两段,重复以上步骤直至最大距离低于预设的距离阈值。否则将直线ab作为a点和b点之间边缘的近似。对bl
max
上的所有点根据上述步骤遍历得到若干预测顶点,若干预测顶点组成预测顶点集{p1,p2,

,pk}。
[0115]
对{p1,p2,

,pk}按x轴进行升序排序,得到{p
′1,p
′2,

,p

k-1
,p
′k},球桌的左下预测顶点lb、左上预测顶点lt、右下预测顶点rb和右上预测顶点rt分别为:
[0116]
(lb,lt,rb,rt)=(p
′1,p
′2,p

k-1
,p
′k)。
[0117]
实施例3:
[0118]
一种电子设备,包括存储器和处理器,存储器用于存储一条或多条计算机指令,其中,一条或多条计算机指令被处理器执行以实现上述的一种乒乓球运动分析方法。
[0119]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的电子设备的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0120]
一种计算机可读存储介质,计算机可读存储介质上存储有计算机指令,计算机指令被处理器执行时实现实施例1中方法的步骤。
[0121]
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0122]
本发明是参照根据本发明的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指
令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0123]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0124]
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0125]
需要说明的是:
[0126]
说明书中提到的“一个实施例”或“实施例”意指结合实施例描述的特定特征、结构或特性包括在本技术的至少一个实施例中。因此,说明书通篇各个地方出现的短语“一个实施例”或“实施例”并不一定均指同一个实施例。
[0127]
尽管已描述了本技术的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本技术范围的所有变更和修改。
[0128]
此外,需要说明的是,本说明书中所描述的具体实施例,其零、部件的形状、所取名称等可以不同。凡依本技术专利构思所述的构造、特征及原理所做的等效或简单变化,均包括于本技术专利的保护范围内。本技术所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离本技术的结构或者超越本权利要求书所定义的范围,均应属于本技术的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1