视频播放方法、装置、存储介质、电子设备及计算机程序产品与流程

文档序号：37084634发布日期：2024-02-20 21:40阅读：11来源：国知局

本技术属于视频处理，尤其涉及一种视频播放方法、装置、存储介质、电子设备及计算机程序产品。

背景技术：

1、随着显示设备的发展，当前市面上的视频播放器支持的视频格式越来越多，视频格式实质上体现了视频编码方式，视频播放器播放视频的方式取决于视频格式。

2、目前，常见的视频格式包括avi、3gp、rm(rmvb)、wmv、flv(f4v)、蓝光(blu-ray)bd、mkv、vr180、vr360等，vr180和vr360格式是最常见的两种vr视频格式。vr180通常是指180度的全景视角，观众只需向左或向右转动头部即可观察到视频中的内容。而vr360则是指360度全景视角，可以让观众在所有方向上观看视频内容。不同视频格式的视频对应不同的解码方式、以及播放方式，比如对于mkv格式的视频，可以采用2d播放模式进行视频播放，对于vr180格式的视频，采用vr播放模式进行视频播放。现有的视频格式识别技术大多是基于对视频文件扩展名的分析来实现，例如，常见的vr视频格式(如vr180和vr360)的视频，可能使用特定的标识(如vr180、vr360)作为文件扩展名。

3、但是，由于用户可以随意更改文件扩展名或某些视频格式可能使用相同的扩展名，故现有视频格式识别技术容易导致视频格式的误识别，识别精准度较低，误差较大，进而不利于采用正确的播放模式播放视频，比如将vr视频以2d的表现形式播放。

技术实现思路

1、本技术旨在至少解决现有技术中存在的技术问题之一。为此，本技术提出一种视频播放方法、装置、存储介质、电子设备及计算机程序产品，能通过深度学习模型实现对各种视频格式的正确识别，识别精准度高。

2、第一方面，本技术提供了一种视频播放方法，包括：

3、获取针对目标视频的视频播放指令；

4、根据所述视频播放指令，利用已训练的视频格式识别模型确定所述目标视频的目标视频格式，所述视频格式识别模型是利用视频样本集、以及所述视频样本集中每个视频样本对应的视频格式标签训练得到；

5、根据所述目标视频格式确定所述目标视频的播放模式；

6、以所述播放模式播放所述目标视频。

7、在一些实施例中，所述利用已训练的视频格式识别模型确定所述目标视频的目标视频格式，包括：

8、从当前的所述目标视频中选取一张视频帧，作为第一关键视频帧；

9、利用已训练的视频格式识别模型对所述第一关键视频帧进行预测，得到第一预测视频格式、以及所述第一预测视频格式对应的第一预测值；

10、当所述第一预测值大于或等于预设阈值，或者已预测次数到达预设次数时，将所述第一预测视频格式作为所述目标视频的目标视频格式；

11、当所述第一预测值小于所述预设阈值，且已预测次数小于所述预设次数时，将除所述第一关键视频帧之外的所述目标视频作为当前的所述目标视频，并返回执行所述从当前的所述目标视频中选取一张视频帧的步骤。

12、在一些实施例中，在根据所述视频播放指令，利用已训练的视频格式识别模型确定所述目标视频的目标视频格式之前，所述视频播放方法还包括：

13、获取已创建的视频预识别文件，所述视频预识别文件包括至少一个已存储视频的第二预测视频格式、以及所述第二预测视频格式对应的第二预测值，所述第二预测视频格式和所述第二预测值是在所述已存储视频存储时对所述已存储视频预测得到；

14、判断所述视频预识别文件中是否存在所述目标视频的所述第二预测值，且所述目标视频的所述第二预测值大于或等于预设阈值；

15、若是，则将相应的所述第二预测视频格式作为所述目标视频的目标视频格式；

16、若否，则执行所述根据所述视频播放指令，利用已训练的视频格式识别模型确定所述目标视频的目标视频格式的操作。

17、在一些实施例中，所述视频播放方法还包括：

18、当检测到针对至少一个视频的存储操作时，从存储的所述视频中提取第二关键视频帧；

19、利用所述视频格式识别模型对所述第二关键视频帧进行预测，得到相应视频的所述第二预测视频格式和所述第二预测值；

20、根据每个所述视频的所述第二预测视频格式和所述第二预测值，创建所述视频预识别文件。

21、在一些实施例中，所述视频格式识别模型部署于视频播放应用和文件管理应用中，所述利用所述视频格式识别模型对所述第二关键视频帧进行预测，包括：

22、通过所述文件管理应用中的所述视频格式识别模型，对所述第二关键视频帧进行预测；

23、所述根据所述视频播放指令，利用已训练的视频格式识别模型确定所述目标视频的目标视频格式的操作，包括：

24、根据所述视频播放指令，通过所述视频播放应用中的所述视频格式识别模型确定所述目标视频的目标视频格式。

25、在一些实施例中，所述根据每个所述视频的所述第二预测视频格式和所述第二预测值，创建所述视频预识别文件，包括：

26、获取每个所述视频的存储地址；

27、将所述第二预测视频格式和所述第二预测值，与相应视频的所述存储地址关联存储在所述视频预识别文件中，以创建所述视频预识别文件；

28、所述判断所述视频预识别文件中是否存在所述目标视频的所述第二预测值，包括：根据所述目标视频的存储地址，判断所述视频预识别文件中是否存在所述目标视频的所述第二预测值。

29、在一些实施例中，所述视频格式识别模型的训练步骤包括：

30、获取视频样本集以及视频格式标签集，所述视频样本集中的视频样本和所述视频格式标签集中的视频格式标签一一对应，且所述视频样本集包括训练样本集和验证样本集；

31、利用所述训练样本集和相应的所述视频格式标签，对所述视频格式识别模型进行训练，且在训练过程中，利用所述验证样本集和相应的所述视频格式标签，对所述视频格式识别模型进行验证。

32、在一些实施例中，所述视频格式识别模型是基于tensorflow框架或者pytorch框架构建的深度学习模型。

33、第二方面，本技术提供了一种视频播放装置，包括：

34、获取模块，用于获取针对目标视频的视频播放指令；

35、第一确定模块，用于根据所述视频播放指令，利用已训练的视频格式识别模型确定所述目标视频的目标视频格式，所述视频格式识别模型是利用视频样本集、以及所述视频样本集中每个视频样本对应的视频格式标签训练得到；

36、第二确定模块，用于根据所述目标视频格式确定所述目标视频的播放模式；

37、播放模块，用于以所述播放模式播放所述目标视频。

38、在一些实施例中，所述第一确定模块具体用于：

39、从当前的所述目标视频中选取一张视频帧，作为第一关键视频帧；

40、利用已训练的视频格式识别模型对所述第一关键视频帧进行预测，得到第一预测视频格式、以及所述第一预测视频格式对应的第一预测值；

41、当所述第一预测值大于或等于预设阈值，或者已预测次数到达预设次数时，将所述第一预测视频格式作为所述目标视频的目标视频格式；

42、当所述第一预测值小于所述预设阈值，且已预测次数小于所述预设次数时，将除所述第一关键视频帧之外的所述目标视频作为当前的所述目标视频，并返回执行所述从当前的所述目标视频中选取一张视频帧的步骤。

43、在一些实施例中，在根据所述视频播放指令，利用已训练的视频格式识别模型确定所述目标视频的目标视频格式之前，所述第一确定模块还用于：

44、获取已创建的视频预识别文件，所述视频预识别文件包括至少一个已存储视频的第二预测视频格式、以及所述第二预测视频格式对应的第二预测值，所述第二预测视频格式和所述第二预测值是在所述已存储视频存储时对所述已存储视频预测得到；

45、判断所述视频预识别文件中是否存在所述目标视频的所述第二预测值，且所述目标视频的所述第二预测值大于或等于预设阈值；

46、若是，则将相应的所述第二预测视频格式作为所述目标视频的目标视频格式；

47、若否，则执行所述根据所述视频播放指令，利用已训练的视频格式识别模型确定所述目标视频的目标视频格式的操作。

48、在一些实施例中，所述视频播放装置还包括创建模块，用于：

49、当检测到针对至少一个视频的存储操作时，从存储的所述视频中提取第二关键视频帧；

50、利用所述视频格式识别模型对所述第二关键视频帧进行预测，得到相应视频的所述第二预测视频格式和所述第二预测值；

51、根据每个所述视频的所述第二预测视频格式和所述第二预测值，创建所述视频预识别文件。

52、在一些实施例中，所述视频格式识别模型部署于视频播放应用和文件管理应用中，所述创建模块具体用于：

53、通过所述文件管理应用中的所述视频格式识别模型，对所述第二关键视频帧进行预测；

54、所述第一确定模块具体用于：根据所述视频播放指令，通过所述视频播放应用中的所述视频格式识别模型确定所述目标视频的目标视频格式。

55、在一些实施例中，所述创建模块具体用于：

56、获取每个所述视频的存储地址；

57、将所述第二预测视频格式和所述第二预测值，与相应视频的所述存储地址关联存储在所述视频预识别文件中，以创建所述视频预识别文件；

58、所述第一确定模块具体用于：根据所述目标视频的存储地址，判断所述视频预识别文件中是否存在所述目标视频的所述第二预测值。

59、在一些实施例中，还包括训练模块，用于：

60、获取视频样本集以及视频格式标签集，所述视频样本集中的视频样本和所述视频格式标签集中的视频格式标签一一对应，且所述视频样本集包括训练样本集和验证样本集；

61、利用所述训练样本集和相应的所述视频格式标签，对所述视频格式识别模型进行训练，且在训练过程中，利用所述验证样本集和相应的所述视频格式标签，对所述视频格式识别模型进行验证。

62、在一些实施例中，所述视频格式识别模型是基于tensorflow框架或者pytorch框架构建的深度学习模型。

63、第三方面，本技术提供了一种非暂态计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的视频播放方法。

64、第四方面，本技术提供了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述任一项所述的视频播放方法。

65、第五方面，本技术提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的视频播放方法。

66、本技术实施例提供的视频播放方法、装置、存储介质、电子设备和计算机程序产品，通过获取针对目标视频的视频播放指令；根据视频播放指令，利用已训练的视频格式识别模型确定目标视频的目标视频格式，视频格式识别模型是利用视频样本集、以及视频样本集中每个视频样本对应的视频格式标签训练得到；根据目标视频格式确定目标视频的播放模式；以该播放模式播放所述目标视频，从而能通过深度学习模型实现对各种视频格式的正确识别，识别精准度高，适用范围广，且能自动选取合适的视频播放模式，无需用户手动进行模式选择和切换，视频播放效果好，用户体验高。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马文泽
技术所有人：北京字跳网络技术有限公司
我是此专利的发明人

上一篇：一种具有调节功能的一体化雨量器的制作方法
上一篇：一种防溺水装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。