识别跳舞教学视频片段的方法、装置及终端设备与流程

文档序号：34388052发布日期：2023-06-08 07:19阅读：92来源：国知局

本申请涉及互联网，具体涉及视频处理技术，尤其涉及一种识别跳舞教学视频片段的方法、装置、终端设备、计算机可读存储介质及计算机程序产品。

背景技术：

1、用户通过终端设备观看视频，可以学习各种知识，增加自己的见识和知识面。对于教学类视频，通常是指围绕特定主题进行教学或授课为主的视频，通常这类教学视频可视为包含多个部分，例如，对于阅读类的教学视频，整个视频可视为包含多个章节，对于舞蹈类的教学视频，整个视频可视为包含多组舞蹈动作。

2、通过对教学视频进行打点分段，对完整视频中的多个教学部分进行标识，用户可以快速定位至想要观看的位置，学习感兴趣的教学内容。但是，现有的视频打点分段，通常采用人工打点的方式，针对每一个视频需要工作人员从头到尾观看播放，对视频中不同部分进行打点和分段，对每一部分输入对应的标签。这种人工打点的方式消耗大量时间和人力，并且容易出现打点错误、标签与视频分段内容不一致等问题。

技术实现思路

1、有鉴于此，本申请实施例提供一种识别跳舞教学视频片段的方法、装置、服务端设备、计算机可存储介质及计算机程序产品，用于解决至少一种技术问题。

2、第一方面，本申请实施例提供一种识别跳舞教学视频片段的方法，所述跳舞教学视频中包括用于跳舞演示的演示子视频和用于跳舞教学的教学子视频，所述演示子视频仅包括音乐片段，所述教学子视频仅包括纯人声片段；所述识别跳舞教学视频片段的方法包括：在跳舞教学视频中提取第一音乐片段；将所述第一音乐片段的音频特征与其完整音乐音频的音频特征进行匹配处理，得到第一匹配结果，所述第一匹配结果包括所述第一音乐片段在其完整音乐音频中可能的位置信息；将所述第一音乐片段的歌词与其完整音乐音频的歌词进行匹配处理，得到第二匹配结果，所述第二匹配结果包括所述第一音乐片段在其完整音乐音频中可能的位置信息；基于第一匹配结果和第二匹配结果，确定所述第一音乐片段所属的演示子视频在所述跳舞教学视频中的起始位置和终止位置；基于所述演示子视频中跳舞演示者的特征将所述演示子视频识别为正面演示或背面演示；在所述跳舞教学视频中提取第一纯人声片段；通过扩大所述第一纯人声片段的时长并判断扩大后是否仍为纯人声片段的方式，确定所述第一纯人声片段所属的教学子视频在所述跳舞教学视频中的起始位置和终止位置；基于所述教学子视频中跳舞教学者的特征将所述教学子视频识别为正面教学或背面教学。

3、根据本申请实施例的方法，在教学视频中提取第一音乐片段或第一纯人声片段时，进一步包括：在所述跳舞教学视频中随机提取目标音频片段，判断目标音频片段是否仅包括一种声音；当目标音频片段包括多种声音时，将目标音频片段时长折半处理，直至目标音频片段仅包括一种声音；确定仅包括一种声音的目标音频片段为第一音乐片段或第一纯人声片段。

4、根据本申请实施例的方法，基于所述第一匹配结果和所述第二匹配结果无法确定第一音乐片段所属的演示子视频在所述跳舞教学视频中的起始位置和终止位置时，扩大所述第一音乐片段的时长后重新匹配直至能够确定第一音乐片段所属的演示子视频在跳舞教学视频中的起始位置和终止位置。

5、根据本申请实施例的方法，将所述第一音乐片段的歌词与其完整音乐音频的歌词进行匹配处理，得到第二匹配结果，包括：在第一音乐片段对应的关键帧图像中提取文本信息；在文本信息中获得第一音乐片段的歌词并与其完整音乐音频的歌词匹配得到第二匹配结果。

6、根据本申请实施例的方法，当所述文本信息中包括报幕文本时，在跳舞教学视频中重新提取第一音乐片段。

7、根据本申请实施例的方法，当所述演示子视频中包括跳舞演示者的正脸时，确定所述演示子视频为正面演示，否则为背面演示和/或当所述教学子视频包括跳舞教学者的正脸时，确定所述教学子视频为正面教学，否则为背面教学。

8、根据本申请实施例的方法，当所述演示子视频包括多个不同的跳舞演示者时，确定所述演示子视频为多人跳舞视频。

9、第二方面，本申请实施例提供一种识别跳舞教学视频片段的装置，包括：第一提取模块，用于在跳舞教学视频中提取第一音乐片段；匹配模块，用于将所述第一音乐片段的音频特征与其完整音乐音频的音频特征进行匹配处理，得到第一匹配结果，所述第一匹配结果包括所述第一音乐片段在其完整音乐音频中可能的位置信息；将所述第一音乐片段的歌词与其完整音乐音频的歌词进行匹配处理，得到第二匹配结果，所述第二匹配结果包括所述第一音乐片段在其完整音乐音频中可能的位置信息；第一确定模块，用于基于第一匹配结果和第二匹配结果，确定所述第一音乐片段所属的演示子视频在所述跳舞教学视频中的起始位置和终止位置；第一识别模块，用于基于所述演示子视频中跳舞演示者的特征将所述演示子视频识别为正面演示或背面演示；第二提取模块，用于在所述跳舞教学视频中提取第一纯人声片段；第二确定模块，用于通过扩大所述第一纯人声片段的时长并判断扩大后是否仍为纯人声片段的方式，确定所述第一纯人声片段所属的教学子视频在所述跳舞教学视频中的起始位置和终止位置；第二识别模块，用于基于所述教学子视频中跳舞教学者的特征将所述教学子视频识别为正面教学或背面教学。

10、第三方面，本申请的实施例提供一种终端设备，其特征在于，包括：处理器以及存储有计算机程序指令的存储器；所述处理器执行所述计算机程序指令时实现如上所述的方法。

11、第四方面，本申请的实施例提供一种计算机可读存储介质，其特征在于，所述计算机存储介质上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现如上所述的方法。

12、第五方面，本申请的实施例提供一种计算机程序产品，其特征在于，其包括计算机程序指令，所述计算机程序指令被处理器执行时实现如上所述的方法。

13、本申请的实施例针对跳舞教学视频进行打点分段，通过对跳舞教学视频文件中包含的音频（背景音乐）和文本（歌词或台词）进行识别，确定跳舞教学视频中的舞蹈动作演示片段的起止位置，并通过对跳舞演示者的特征识别判断是正面演示还是背面演示；并且，本申请的实施例还通过对跳舞教学视频文件中的纯人声片段的识别，确定教学视频中的讲解片段的起止位置，并可判断是正面教学还是背面教学。照此打点分段之后，能够方便用户快速定位到舞蹈动作演示片段以及带人声讲解的片段，方便用户集中学习舞蹈的正面动作以及背面动作，操作十分便捷。利用本申请实施例提供的方法对跳舞教学视频进行自动打点分段，能够大幅减少视频处理过程中由人为因素引入的错误操作，不仅能够高效、准确地确定跳舞教学视频中的每个分段视频，还节省人工成本。

技术特征：

1.一种识别跳舞教学视频片段的方法，其特征在于，所述跳舞教学视频中包括用于跳舞演示的演示子视频和用于跳舞教学的教学子视频，所述演示子视频仅包括音乐片段，所述教学子视频仅包括纯人声片段；所述识别跳舞教学视频片段的方法包括：

2.根据权利要求1所述的方法，其特征在于，其中，在教学视频中提取第一音乐片段或第一纯人声片段时，进一步包括：

3.根据权利要求1所述的方法，其特征在于，其中，基于所述第一匹配结果和所述第二匹配结果无法确定第一音乐片段所属的演示子视频在所述跳舞教学视频中的起始位置和终止位置时，扩大所述第一音乐片段的时长后重新匹配直至能够确定第一音乐片段所属的演示子视频在跳舞教学视频中的起始位置和终止位置。

4.根据权利要求1所述的方法，其特征在于，其中，将所述第一音乐片段的歌词与其完整音乐音频的歌词进行匹配处理，得到第二匹配结果，包括：在第一音乐片段对应的关键帧图像中提取文本信息；在文本信息中获得第一音乐片段的歌词并与其完整音乐音频的歌词匹配得到第二匹配结果。

5.根据权利要求4所述的方法，其特征在于，其中，当所述文本信息中包括报幕文本时，在跳舞教学视频中重新提取第一音乐片段。

6.根据权利要求1所述的方法，其特征在于，其中，当所述演示子视频中包括跳舞演示者的正脸时，确定所述演示子视频为正面演示，否则为背面演示和/或当所述教学子视频包括跳舞教学者的正脸时，确定所述教学子视频为正面教学，否则为背面教学。

7.根据权利要求1所述的方法，其特征在于，其中，当所述演示子视频包括多个不同的跳舞演示者时，确定所述演示子视频为多人跳舞视频。

8.一种识别跳舞教学视频片段的装置，其特征在于，包括：

9.一种终端设备，其特征在于，包括：处理器以及存储有计算机程序指令的存储器；所述处理器执行所述计算机程序指令时实现如权利要求1-7中任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现如权利要求1-7中任一项所述的方法。

11.一种计算机程序产品，其特征在于，其包括计算机程序指令，所述计算机程序指令被处理器执行时实现如权利要求1-7中任一项所述的方法。

技术总结
本申请涉及互联网技术领域，公开了一种识别跳舞教学视频片段的方法、装置、终端设备、服务端及存储介质。该方法包括：在跳舞教学视频中提取音乐片段；将音乐片段的音频特征与其完整音乐音频的音频特征进行匹配处理，得到第一结果；将音乐片段的歌词与其完整音乐音频的歌词进行匹配处理，得到第二结果；基于第一结果和第二结果，确定音乐片段所属的演示子视频在跳舞教学视频中的起、止位置；将演示子视频识别为正面或背面演示；在跳舞教学视频中提取纯人声片段；确定纯人声片段所属的教学子视频在跳舞教学视频中的起、止位置；将教学子视频识别为正面或背面教学。利用本申请能够高效准确地确定跳舞教学视频中的各个分段教学视频。

技术研发人员：章动,孙健,张远
受保护的技术使用者：北京小糖科技有限责任公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：章动孙健张远
技术所有人：北京小糖科技有限责任公司
我是此专利的发明人

上一篇：一种高效成炭阻燃防熔滴涤纶织物的制备方法与流程
上一篇：一种基于Janssen模型的筒仓效应实验系统及方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。