陪练机器人控制方法、系统、设备及存储介质与流程

文档序号:24633833发布日期:2021-04-09 20:44阅读:106来源:国知局
陪练机器人控制方法、系统、设备及存储介质与流程

本发明涉及数据处理技术领域,尤其涉及一种陪练机器人控制方法、系统、设备及存储介质。



背景技术:

目前,市面上已经出现了一些球类运动的陪练机器人,例如羽毛球陪练机器人、乒乓球陪练机器人等。然而,现有的陪练机器人的工作方式较为单一,只能简单地发球和对用户的击打进行简单的反馈。然而,这种传统的陪练模式已经无法满足用户的不同需求,陪练效果不是很理想。



技术实现要素:

针对现有技术中的问题,本发明的目的在于提供一种陪练机器人控制方法、系统、设备及存储介质,通过对用户进行陪练等级评定,根据不同陪练等级选择不同的击打策略,从而适用不同用户的陪练需求。

本发明实施例提供一种陪练机器人控制方法,包括如下步骤:

采集用户数据并输入等级评定模型,得到陪练等级;

获取数据采集模块采集的数据,分析得到用户运动数据和球运动轨迹;

根据所述用户运动数据、球运动轨迹和所述陪练等级,选择击打策略;

根据所述击打策略生成机器人控制指令,并基于所述机器人控制指令控制机器人进行击打。

在一些实施例中,所述采集用户数据并输入等级评定模型,得到陪练等级之后,还包括获取陪练模式,所述陪练模式包括练习模式和对战模式;

所述选择击打策略包括根据所述用户运动数据、球运动轨迹、陪练等级和所述陪练模式,选择击打策略。

在一些实施例中,所述获取陪练模式包括根据陪练等级与陪练模式的对应关系,选择用户的陪练等级所对应的陪练模式,或获取用户选择的陪练模式。

在一些实施例中,所述陪练模式为练习模式时,所述选择击打策略,包括如下步骤:

根据用户的陪练等级选择对应的击打难度系数;

根据所述用户运动数据、球运动轨迹和选择的击打难度系数,确定机器人的击打策略;

采集用户的击打反馈数据;

根据所述击打反馈数据判断是否触发变更击打难度系数。

在一些实施例中,所述根据所述用户运动数据、球运动轨迹和选择的击打难度系数,确定机器人的击打策略,包括如下步骤:

根据所述击打难度系数选择对应的击打范围、击打速度和偶然性刺激的设置频率;

根据所述用户运动数据、球运动轨迹、击打范围、击打速度和偶然性刺激的设置频率,确定机器人的击打策略。

在一些实施例中,所述陪练模式为对战模式时,所述选择击打策略,包括如下步骤:

将所述用户运动数据和球运动轨迹作为输入数据,输入训练好的战术选择模型,得到选择的击打战术;

根据所述用户运动数据、球运动轨迹和选择的击打战术,确定陪练机器人的击打策略。

在一些实施例中,所述战术选择模型的输入数据还包括陪练等级;

所述陪练模式为对战模式时,所述选择击打策略还包括如下步骤:

采集用户的击打反馈数据;

根据所述击打反馈数据判断是否触发变更所述陪练等级。

在一些实施例中,所述方法还包括采用如下步骤训练所述战术选择模型:

采集对战数据,所述对战数据包括运动者运动数据和球运动轨迹;

针对所述对战数据中的每个回合,将第一运动者的运动数据和球运动轨迹作为样本数据,根据第二运动者的运动数据和球运动轨迹分析另一运动者的击打战术类型,为所述样本数据添加击打战术类型标签;

基于所述样本数据和击打战术类型标签训练所述战术选择模型。

在一些实施例中,所述样本数据还包括运动者的陪练等级,所述陪练等级通过将所述第一运动者的用户数据输入所述等级评定模型得到。

在一些实施例中,所述方法还包括如下步骤:

统计用户与所述机器人的一次对战中的击打反馈数据;

根据预设评分算法对用户此次对战进行评分;

判断所述评分是否大于预设评分阈值,如果是,则采集用户与所述机器人的此次对战数据,并基于此次对战数据优化训练所述战术选择模型。

在一些实施例中,所述采集用户与所述机器人的此次对战数据,并基于此次对战数据优化训练所述战术选择模型,包括如下步骤:

获取用户与所述机器人的此次对战视频;

从所述对战视频中提取用户击打成功的回合中机器人的运动数据和机器人击打后球的运动数据,作为优化样本数据;

提取用户击打成功的回合中用户的击打战术类型,为所对应的优化样本数据添加击打战术标签;

基于所述优化样本数据和对应的击打战术标签优化训练所述战术选择模型。

在一些实施例中,所述采集用户的击打反馈数据,包括如下步骤:

采集用户的身体状态数据,判断用户的疲劳状态;

对用户图像中球的位置进行识别,获取球运动轨迹;

根据所述球运动轨迹统计用户在多个回合中的击打稳定性;

将所述疲劳状态和击打稳定性作为用户的击打反馈数据。

在一些实施例中,所述采集用户的身体状态数据,判断用户的疲劳状态,包括如下步骤:

采集多帧用户图像和/或雷达的检测数据,对用户身体关键点的位置进行识别;

结合多个时刻的身体关键点的位置变化,判断用户的疲劳状态。

在一些实施例中,所述用户数据包括用户身份数据和用户训练数据;

根据所述击打反馈数据判断是否触发变更所述陪练等级之后,还包括如下步骤:

如果触发变更所述陪练等级,则采集用户在此次训练中的训练数据,和用户身份数据输入所述等级评定模型,得到陪练等级。

在一些实施例中,所述击打策略包括指定位置、球拍击打姿态、球拍击打速度和球拍执行球的落点控制;

基于所述机器人控制指令控制机器人进行击打,包括基于所述机器人控制指令控制机器人运动至指定位置,并控制所述机器人调整球拍击打姿态和以所述球拍击打速度进行击打。

本发明实施例还提供一种陪练机器人控制系统,用于实现所述的陪练机器人控制方法,所述系统包括:

等级评定模块,用于采集用户的第一数据并输入等级评定模型,得到陪练等级;

数据分析模块,用于获取数据采集模块采集的数据,分析得到用户运动数据和球运动轨迹;

策略选择模块,用于根据所述用户运动数据、球运动轨迹和所述陪练等级,选择击打策略;

击打控制模块,用于根据所述击打策略生成机器人控制指令,并基于所述机器人控制指令控制机器人进行击打。

本发明实施例还提供一种陪练机器人控制设备,包括:

处理器;

存储器,其中存储有所述处理器的可执行指令;

其中,所述处理器配置为经由执行所述可执行指令来执行所述的陪练机器人控制方法的步骤。

本发明实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被处理器执行时实现所述的陪练机器人控制方法的步骤。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

本发明的陪练机器人控制方法、系统、设备及存储介质具有如下有益效果:

本发明通过对用户进行陪练等级评定,根据不同陪练等级选择不同的击打策略,从而适用不同用户的陪练需求,并且在陪练过程中自动采集用户的运动数据和球运动轨迹,自动进行击打策略判断,实时控制机器人根据包含有所述击打策略的机器人控制指令运作,从而使得机器人实时对用户的击打动作进行响应,以达到最佳的陪练效果。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。

图1是本发明一实施例的陪练机器人控制方法的流程图;

图2是本发明一实施例的陪练机器人控制方法的应用场景示意图;

图3是本发明一实施例的陪练机器人的示意图;

图4是本发明一实施例的球运动轨迹采集的示意图;

图5是本发明一实施例的练习模式下确定击打策略的流程图;

图6是本发明一实施例的对战模式下确定击打策略的流程图;

图7是本发明一实施例的增加雷达后场地的示意图;

图8是本发明一实施例的陪练机器人控制系统的结构示意图;

图9是本发明一实施例的陪练机器人控制设备的结构示意图;

图10是本发明一实施例的计算机可读存储介质的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。

此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此,实际执行的顺序有可能根据实际情况改变。

如图1所示,本发明实施例提供一种陪练机器人控制方法,包括如下步骤:

s100:采集用户数据并输入等级评定模型,得到陪练等级;

s200:采集数据采集模块采集的数据,分析得到用户运动数据和球运动轨迹;

s300:根据所述用户运动数据、球运动轨迹和所述陪练等级,选择击打策略;

s400:根据所述击打策略生成机器人控制指令,并基于所述机器人控制指令控制机器人进行击打。

本发明通过步骤s100对用户进行陪练等级评定,根据不同陪练等级选择不同的击打策略,从而适用不同用户的陪练需求,并且在陪练过程中通过步骤s200自动采集用户的运动数据和球运动轨迹,通过步骤s300自动进行击打策略判断,通过步骤s400实时控制机器人根据包含有所述击打策略的机器人控制指令运作,从而使得机器人实时对用户的击打动作进行响应,以达到最佳的陪练效果。

本发明的陪练机器人可以用于各种球类运动中,例如羽毛球、乒乓球、网球、排球、足球等。本发明中所称用户,指的是陪练对象,即需要与陪练机器人一起训练的运动者,可以是业务爱好者,也可以是专业运动员等等。本发明的陪练机器人控制方法可以应用于陪练机器人的控制器中,也可以应用于一个单独的控制器,而此控制器可以与陪练机器人的控制器进行通信,以从陪练机器人中获取机器人的运动数据和向陪练机器人发送机器人控制指令。

在该实施例中,所述用户数据包括用户身份数据和用户训练数据。所述用户身份数据例如包括用户的年龄、用户性别、用户身高和体重、用户在该球类运动中的经验时长等。所述用户训练数据例如可以包括用户在训练时的响应速度、成功率、击打速度、单次训练时长等与训练过程相关的数据。

所述用户身份数据可以是采集用户输入的身份数据。例如,用户可以通过其移动终端与应用有该陪练机器人控制方法的控制器进行通信,将在移动终端上输入的身份数据发送到应用有该陪练机器人控制方法的控制器中。所述应用有该陪练机器人控制方法的控制器也可以连接有键盘、触控屏等输入装置,用户可以通过该输入装置输入身份数据。在其他实施方式中,也可以是从存储有用户数据的数据库中读取用户的身份数据。

所述步骤s100:采集用户数据并输入等级评定模型,得到陪练等级中,如果存储有历史用户训练数据或者可以采集到历史用户训练数据,则可以将用户身份数据和用户训练数据一起输入到基于机器学习的等级评定模型中。如果无法采集到历史用户训练数据,则可以先将用户训练数据中的各个参数设定为默认值,然后与用户身份数据一起输入到等级评定模型中,得到一个初始的陪练等级。待后续用户与陪练机器人进行训练后,再采集用户的训练数据,重新评定用户的陪练等级。

所述等级评定模型可以采用基于深度学习的机器学习模型,例如卷积神经网络,也可以采用决策树结构,例如采用套索回归算法、随机森林、极端梯度提升算法等。

所述陪练机器人控制方法还包括训练所述等级评定模型的步骤。训练所述等级评定模型包括:

采集作为样本数据的运动者身份数据和运动者训练数据;

为所述样本数据添加陪练等级标签;

基于所述样本数据和所对应的陪练等级标签迭代训练所述等级评定模型,训练至所述等级评定模型收敛,得到可以用于用户的陪练等级评定的模型。

如图2所示,为该实施例的陪练机器人控制方法的应用场景示意图。此处以将陪练机器人j400应用于羽毛球场j100的示意图。用户j300和陪练机器人j400分别处于羽毛球场j100的两边。图2中的虚线表示羽毛球j500的运动轨迹。所述数据采集模块包括摄像机j200,在羽毛球场j100的至少一侧设置有摄像机j200,摄像机j200可以拍摄场地的图像,其中包含有用户j300和羽毛球j500,并且进一步可以包括机器人j400。可以通过分析所述摄像机j200的图像来分析得到用户j300的运动数据和羽毛球j500的运动轨迹。

如图3所示,为该实施例的陪练机器人的结构示意图。陪练机器人j400包括底座j410、机械臂j420和球拍j430,球拍j430包括拍面j431和拍杆j432。所述陪练机器人j400的内部设置有机器人控制器,底部设置有移动机构(在图3中示出为滚轮)。所述机器人控制器通过控制移动机构,可以控制机器人在场地中移动,通过控制所述机械臂j420,可以控制球拍j430的球拍姿态、击打速度和实现球拍j430执行球的落点控制。此处仅为陪练机器人的结构进行示意。在其他的实施方式中,所述陪练机器人也可以采用其他的结构排布,而不限于图3中示出的结构,均属于本发明的保护范围之内。

所述步骤s200中,从摄像机中读取到采集的多帧图像后,可以对图像中的用户和球分别进行识别,并且分析得到用户运动数据和球运动轨迹。用户运动数据可以包括用户的运动速度、运动方向、挥拍高度、击球速度、击球姿态等数据,球运动轨迹可以包括球在各个时刻的三维坐标。如图4所示,示出了一种获取球运动轨迹的示意图。用户j300击打球j500后,根据用户j300的击打姿态和击打速度不同,球运动轨迹也会不同,例如球的落点可能会在l1、l2、l3中的一个,图中虚线即表示可能的球运动轨迹。在采集到球已经运动的轨迹之后,可以对球后续的轨迹进行预测,并且预测球可能的落点,在球距离机器人j400时,对球运动轨迹的采集越完整。

在该实施例中,所述步骤s100之后,还包括获取陪练模式,所述陪练模式包括练习模式和对战模式。所述步骤s300中,选择击打策略包括根据所述用户运动数据、球运动轨迹、陪练等级和所述陪练模式,选择击打策略。在不同的陪练模式下,应用用户的击打策略也会不同。因此,本发明进一步可以实现不同陪练模式的陪练控制,与陪练等级相结合,可以满足不同用户在不同场景下的训练需求。

进一步地,所述获取陪练模式可以根据陪练等级与陪练模式的对应关系,选择用户的陪练等级所对应的陪练模式。例如,预先设定一个等级限值,如果用户的陪练等级高于该等级限值,则说明用户等级较高,可以适用于对战模式。对战模式也就是对战制胜模式,指的是用户和机器人对战,对于用户来说,有更高的挑战性,在选择击打策略时也会选择对于用户来说较难以应对的击打策略。如果用户的陪练等级低于或等于该等级限值,则说明用户的等级仍然较低,适合于首先采用练习模式,即选择练习模式。练习模式对于用户来说,挑战性较低,更注重用户在训练过程中的娱乐性,在选择击打策略时选择一些相对较容易应对的击打策略,以保持用户训练时愉悦身心的效果。

在另一种实施方式中,所述获取陪练模式也可以是获取用户选择的陪练模式。例如,用户可以自主选择自己所需要的陪练模式。由此,对于陪练等级较高的用户来说,其也可以选择练习模式来适当放松,对于陪练等级较低的用户来说,其也可以选择对战模式来挑战自我能力,而机器人将在用户本身的陪练等级之上适当增添难度来与用户对抗。

用户选择陪练模式例如可以是通过移动终端向应用有该陪练机器人控制方法的控制器发送选择指令,也可以是直接在于该陪练机器人控制方法的控制器所连接的输入装置上输入选择指令,选择自己需要的陪练模式。

下面分别对练习模式和对战模式下,击打策略的不同选择方式进行介绍。

如图5所示,在该实施例中,所述陪练模式为练习模式时,所述步骤s300中,选择击打策略,包括如下步骤:

s311:确定当前的陪练模式为练习模式;

s312:根据用户的陪练等级选择对应的击打难度系数,不同的击打难度系数对应有不同的击打参数,可以预设陪练等级与击打难度系数的映射关系,查找映射关系即可以获取当前的击打难度系数;

s313:根据所述用户运动数据、球运动轨迹和选择的击打难度系数,确定机器人的击打策略;

s314:采集用户的击打反馈数据;

s315:根据所述击打反馈数据判断是否触发变更击打难度系数;

如果是,则继续步骤s316:调整难度系数,例如,在所述击打反馈数据满足调高陪练等级的要求时,提高所述难度系数,在所述击打反馈数据满足降低陪练等级的要求时,降低所述难度系数,从而可以根据用户当前的击打反馈来动态调整练习模式的难度,然后继续步骤s313;

如果否,则继续步骤s317:保持当前的难度系数。

在该实施例中,不同的击打难度系数对应有不同的击打范围、击打速度和偶然性刺激的设置方式。所述步骤s313:根据所述用户运动数据、球运动轨迹和选择的击打难度系数,确定机器人的击打策略,包括如下步骤:

根据所述击打难度系数选择对应的击打范围、击打速度和偶然性刺激的设置方式,此处偶然性刺激指的是在保持当前难度系数对应的击打范围时和击打速度时,击打策略发生突然的变化,以对用户的陪练过程产生刺激作用,提高陪练过程的趣味性。此处突然的变化可以指的是突然在一个回合中加大难度,例如提高击打速度或增大击打范围等,此处突然的变化也可以是指的突然在一个回合中降低难度,例如降低击打速度或减小击打范围等,使得对手有机可乘。此处偶然性刺激的设置方式可以包括偶然性刺激的击打数据(包括击打范围、击打速度等),也可以包括偶然性刺激的设置时间,例如将偶然性刺激的设置时间设置为每5个回合一次,或者每10个回合一次等的规律排布方式,也可以设置第一个偶然性刺激在第5个回合,第二个偶然性刺激在第8个回合的不规律排布方式,或者是设置根据用户的击打反馈数据来判断是否增加偶然性刺激。

根据所述用户运动数据、球运动轨迹、击打范围、击打速度和偶然性刺激的设置频率,确定机器人的击打策略。具体地,所述击打策略可以包括指定位置、球拍击打姿态和球拍击打速度。所述确定机器人的击打策略可以根据预设的击打参数计算公式或机器学习模型,将所述用户运动数据、球运动轨迹、击打范围、击打速度和偶然性刺激的设置频率作为该计算公式或机器学习模型的输入,输出即为对应的各个击打参数的值,例如指定位置的两维或三维坐标、球拍击打姿态(拍杆倾斜角度、拍面倾斜角度、球拍高度等)、球拍击打速度等。所述步骤s400中,基于所述机器人控制指令控制机器人进行击打,包括基于所述机器人控制指令控制机器人运动至指定位置,并控制所述机器人调整球拍击打姿态和以所述球拍击打速度进行击打。

进一步地,在练习模式时,用户还可以进一步选择多球练习的方式。在用户选择多球练习时,所述选择击打策略,包括如下步骤:

根据所述用户运动数据、球运动轨迹和所述陪练等级选择发球数据,所述发球数据包括发球范围、发球速度和发球频率中的至少一种;例如,可以根据用户的位置和运动速度选择发球范围,根据用户的陪练等级选择发球速度和发球频率等,对于陪练等级高的用户,发球速度可以设置得比较快,并且发球频率可以比较密集;

采集用户的击打反馈数据;

根据所述击打反馈数据判断是否调整所述发球数据,例如根据用户的击打反馈数据判断用户的击打动作不够规范或者击打成功率比较低,则可以调整发球数据,降低击打难度,如果根据用户的击打反馈数据判断用户的击打动作规范并且击打成功率比较高,则可以调整发球数据,提高击打难度。

所述多球模式也可以应用于多个用户的连续训练。即一个用户到达指定位置后,通过所述摄像机的图像数据判断有用户时,开始发球,在更换用户后,可以根据新更换的用户的相关数据来调整发球数据,继续发球。

如图6所示,在该实施例中,所述陪练模式为对战模式时,所述步骤s300中,选择击打策略,包括如下步骤:

s321:确定当前的陪练模式为对战模式;

s322:将所述用户运动数据和球运动轨迹作为输入数据,输入训练好的战术选择模型,得到选择的击打战术;

s323:根据所述用户运动数据、球运动轨迹和选择的击打战术,确定陪练机器人的击打策略。

在该实施例中,所述战术选择模型的输入数据还包括陪练等级。即所述步骤s322中,将所述用户运动数据、球运动轨迹和所述陪练等级输入到训练好的战术选择模型中,得到选择的击打战术。

所述陪练模式为对战模式时,所述选择击打策略还包括如下步骤:

s324:采集用户的击打反馈数据;

s325:根据所述击打反馈数据判断是否触发变更所述陪练等级;

如果是,则继续步骤s326:调整所述陪练等级,例如,在所述击打反馈数据满足调高陪练等级的要求时,提高所述陪练等级,在所述击打反馈数据满足降低陪练等级的要求时,降低所述陪练等级,从而可以实现在对战模式下基于击打反馈数据动态调整陪练等级,然后继续步骤s322;

如果否,则继续步骤s327:保持当前的陪练等级。

所述战术选择模型可以采用机器学习模型,例如基于深度学习的模型或者其他类型的分类模型。不同的战术类型可以包括拉吊突击、防守反击、下压控制、弱点限制、发球抢攻、接发球抢攻、底线控制、控制网前、重复线路、快慢结合等多种类型。在该实施例中,所述陪练机器人控制方法还包括采用如下步骤训练所述战术选择模型:

采集对战数据,所述对战数据包括运动者运动数据和球运动轨迹,此处对战数据例如可以是从比赛的录制视频中采集的,比赛双方即为第一运动者和第二运动者,也可以是预先存储的机器人之前与其他用户的对战数据,此处将机器人也看做第一运动者,而用户看做第二运动者;

针对所述对战数据中的每个回合,将第一运动者的运动数据和球运动轨迹作为样本数据,根据第二运动者的运动数据和球运动轨迹分析另一运动者的击打战术类型,为所述样本数据添加击打战术类型标签,此处为样本数据添加击打战术类型标签可以是人工添加标签,也可以是预先训练基于深度学习的战术识别模型进行标签预测,所述战术识别模型的输入数据包括运动者的运动数据和球运动轨迹,输出数据为预测的运动者所采用的战术,战术识别模型与战术选择模型不同,在战术识别模型和战术选择模型的输入均为运动者a的运动数据和球运动轨迹时,战术识别模型预测的是运动者a所采用的战术,而战术选择模型预测的是与运动者a对战的运动者b的战术;

基于所述样本数据和击打战术类型标签训练所述战术选择模型。例如,在采用深度学习模型时,基于所述战术选择模型的预测战术和所述击打战术类型标签构建损失函数,迭代训练所述战术选择模型,至损失函数小于预设损失函数阈值为止。

进一步地,所述战术选择模型的输入数据还可以包括用户的陪练等级,因此样本数据还包括运动者的陪练等级,所述陪练等级通过将所述第一运动者的用户数据输入所述等级评定模型得到。

在该实施例中,所述陪练机器人控制方法中,还可以包括对所述战术选择模型进一步优化训练的步骤。具体地,所述优化训练包括如下步骤:

统计用户与所述机器人的一次对战中的击打反馈数据;

根据预设评分算法对用户此次对战进行评分,例如,所述评分算法可以设定为统计用户的成功率、拦截率、响应速度、出界次数等指标,将各个指标加权求和或差,得到的结果作为对战评分,即对用户此次对战中的表现的评分;

判断所述评分是否大于预设评分阈值,如果是,则表明用户此次对战中的表现是比较优越的,采集用户与所述机器人的此次对战数据,并基于此次对战数据优化训练所述战术选择模型,从而使得所述战术选择模型可以不断学习到新的对战数据和战术选择策略,有利于在后续进行战术预测时,选择最合适的战术。

进一步地,所述采集用户与所述机器人的此次对战数据,并基于此次对战数据优化训练所述战术选择模型,包括如下步骤:

获取用户与所述机器人的此次对战视频;

从所述对战视频中提取用户击打成功的回合中机器人的运动数据和机器人击打后球的运动数据,作为优化样本数据;

提取用户击打成功的回合中用户的击打战术类型,为所对应的优化样本数据添加击打战术标签;即在优化训练中,将机器人的击打数据作为样本数据,用户的击打数据作为标签,从而在战术选择模型学习时,学习的是用户对战术的选择;

此处提取用户的击打战术类型,可以由人工根据用户的视频确定击打展示,然后人工添加击打战术标签。也可以将用户的运动数据和球运动轨迹输入到上述的战术识别模型,根据战术识别模型的输出数据添加击打战术标签;

基于所述优化样本数据和对应的击打战术标签优化训练所述战术选择模型。例如,在采用深度学习模型时,基于所述战术选择模型的预测战术和所述击打战术类型标签构建损失函数,迭代训练所述战术选择模型。

在该实施例中,所述击打反馈数据可以包括用户的疲劳状态和击打稳定性。所述步骤s314中采集用户的击打反馈数据和所述步骤s324中采集用户的击打反馈数据,可以分别采用如下步骤:

采集用户的身体状态数据,判断用户的疲劳状态,例如可以对用户的疲劳状态划分疲劳等级,根据不同疲劳状态对应的身体状态参数的范围,确定所述身体状态数据对应的疲劳等级;

对用户图像中球的位置进行识别,获取球运动轨迹;

根据所述球运动轨迹统计用户在多个回合中的击打稳定性,击打稳定性可以采用一个指标来表示,例如用户失误次数、用户回球落点稳定性、用户成功次数等,也可以采用多个指标组合计算来得到;

将所述疲劳状态和击打稳定性作为用户的击打反馈数据。

进一步地,所述采集用户的身体状态数据,判断用户的疲劳状态,包括如下步骤:

采集多帧用户图像的检测数据,对用户身体关键点的位置进行识别;例如,可以获取摄像机采集的多帧图像,采用神经网络对图像中用户身体关键点进行识别,得到每帧图像中的关键点位置信息;

在另一种实施方式中,所述数据采集模块也可以包括雷达。如图7所示,可以进一步在羽毛球场j100的侧面设置至少一个雷达j600,所述雷达可以采用例如激光雷达、红外雷达等。通过雷达可以采集球的运动轨迹,也可以采集用户的运动数据。也可以结合摄像机j200和雷达j600的检测数据来分析得到用户的运动数据和球的运动轨迹。

进一步地,可以采用雷达检测用户的身体关键点的位置,如图7所示,可以进一步在羽毛球场j100的侧面设置至少一个雷达j600;

结合多个时刻的身体关键点的位置变化,判断用户的疲劳状态。

例如,可以将用户的前胸作为一个身体关键点,通过检测用户的前胸的位置变化来判断前胸的起伏状态,进而判断用户的疲劳状态。在用户的前胸起伏幅度很大而且前胸起伏频率很高时,说明用户当前疲劳等级比较高。

在其他可替代的实施方式中,所述数据采集模块也可以包括其他类型的数据采集设备,例如包括用户佩戴的可穿戴式设备采集用户的运动速度等,也可以通过其他方式检测用户的疲劳状态,例如,通过用户佩戴的可穿戴式设备来获取用户的脉搏、心率、体温等数据,从而判断用户的疲劳状态。

进一步地,所述采集用户的击打反馈数据之后,还包括如下步骤:

根据用户的击打反馈数据判断用户的动作规范程度,判断用户的动作规范程度可以包括判断用户动作是否准确、是否符合技术规范性要求等,例如可以根据摄像机拍摄的图像或雷达的检测数据来判断用户关键点的位置,来判断用户击球时的姿态,与标准的规范性动作进行比较;

对于不符合预设的动作规范要求的用户,生成纠正信息,并推送至用户。此处推送纠正信息可以是推送到用户使用的移动终端,也可以进一步在羽毛球场设置一个显示屏,将纠正信息显示在显示屏中,供用户参考。

在练习模式下,在得到了用户的击打反馈数据后,可以根据用户的击打反馈数据判断是否触发调整难度系数。为了保持用户在练习状态下愉悦身心的状态,在用户的疲劳等级高于第一疲劳阈值和/或稳定性低于第一稳定性阈值时,调低难度系数,在用户的疲劳等级低于第二疲劳阈值和/或稳定性高于第二稳定性阈值时,调高难度系数。第一疲劳阈值大于第二疲劳阈值,第一稳定性阈值小于第二稳定性阈值。

在对战模式下,在得到了用户的击打反馈数据后,可以根据用户的击打反馈数据判断是否触发调整陪练等级。例如,在用户的疲劳等级低于第三疲劳阈值和/或稳定性高于第三稳定性阈值时,调高陪练等级,从而提高与用户对抗的强度。

在该实施例中,所述步骤s324:根据所述击打反馈数据判断是否触发变更所述陪练等级之后,还可以再次采用等级评定模型对用户的陪练等级进行再次评定。具体地,如果触发变更所述陪练等级,则采集用户在此次训练中的训练数据,和用户身份数据输入所述等级评定模型,得到新的陪练等级,然后后续在与用户的对战中,则根据新的陪练等级选择对应的击打策略。

如图8所示,本发明实施例还提供一种陪练机器人控制系统,用于实现所述的陪练机器人控制方法,所述系统包括:

等级评定模块m100,用于采集用户的第一数据并输入等级评定模型,得到陪练等级;

数据分析模块m200,用于获取数据采集模块采集的数据,分析得到用户运动数据和球运动轨迹;

策略选择模块m300,用于根据所述用户运动数据、球运动轨迹和所述陪练等级,选择击打策略;

击打控制模块m400,用于根据所述击打策略生成机器人控制指令,并基于所述机器人控制指令控制机器人进行击打。

本发明通过等级评定模块m100对用户进行陪练等级评定,根据不同陪练等级选择不同的击打策略,从而适用不同用户的陪练需求,并且在陪练过程中通过数据分析模块m200自动采集用户的运动数据和球运动轨迹,通过策略选择模块m300自动进行击打策略判断,通过击打控制模块m400实时控制机器人根据包含有所述击打策略的机器人控制指令运作,从而使得机器人实时对用户的击打动作进行响应,以达到最佳的陪练效果。

本发明的陪练机器人控制系统可以部署于陪练机器人的控制器中,也可以部署于一个单独的控制器中,其与陪练机器人的控制器可以进行通信。本发明的陪练机器人控制系统中各个模块的功能可以采用上述陪练机器人控制方法中各个步骤的具体实施方式来实现。例如,等级评定模块m100可以采用上述步骤s100的实施方式来实现用户的陪练等级评定,数据分析模块m200可以采用上述步骤s200的实施方式来提取用户运动数据和球运动轨迹,策略选择模块m300可以采用上述步骤s300的实施方式来选择击打策略,击打控制模块m400可以采用上述步骤s400的实施方式来实现陪练机器人的击打控制。

本发明实施例还提供一种陪练机器人控制设备,包括处理器;存储器,其中存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行所述的陪练机器人控制方法的步骤。

所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。

下面参照图9来描述根据本发明的这种实施方式的电子设备600。图9显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图9所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同系统组件(包括存储单元620和处理单元610)的总线630、显示单元640等。

其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元610执行,使得所述处理单元610执行本说明书上述陪练机器人控制方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元610可以执行如图1中所示的步骤。

所述存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(rom)6203。

所述存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。

所述陪练机器人控制设备中,所述存储器中的程序被处理器执行时实现所述的陪练机器人控制方法的步骤,因此,所述计算机存储介质也可以获得上述陪练机器人控制方法的技术效果。

本发明实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被处理器执行时实现所述的陪练机器人控制方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上执行时,所述程序代码用于使所述终端设备执行本说明书上述陪练机器人控制方法部分中描述的根据本发明各种示例性实施方式的步骤。

参考图10所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上执行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。

所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

所述计算机存储介质中的程序被处理器执行时实现所述的陪练机器人控制方法的步骤,因此,所述计算机存储介质也可以获得上述陪练机器人控制方法的技术效果。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1