一种视频播放控制方法及装置的制造方法

文档序号：10516141阅读：369来源：国知局

一种视频播放控制方法及装置的制造方法
【专利摘要】本发明公开了一种视频播放控制方法，应用于一电子设备，包括：选定目标视频;识别目标视频的格式；根据所述目标视频的格式，采取相应的播放策略，播放目标视频。相应的，本发明还公开了一种视频播放控制装置，应用于一电子设备。本发明可以提高电子产品，特别是可穿戴设备，视频等文件播放的可操作性，极大提高用户使用电子设备的舒适度和体验感。
【专利说明】
一种视频播放控制方法及装置
技术领域
[0001]本发明涉及多媒体数据处理技术领域，具体涉及一种视频播放控制方法及视频播放控制装置。
【背景技术】
[0002]现今，随着科技的发展，3D技术也离大众越来越近，不仅电影院可以观看3D电影，连电视频道都具有了 3D频道，当然观看3D电影都需要额外佩戴一个3D眼镜。虽然目前绝大多数的智能手机都支持3D视频、图像的播放，但是如果直接用手机作为观看3D视频的显示平台，由于手机的屏幕较小，3D效果不好，几乎没有人会戴着3D眼镜在智能手机上观看3D视频。因此，逐步研发出手机与头戴光学装置相结合的头戴立体观影设备；作为头戴式可视设备的入门产品，人们借助该设备，可以观看3D大屏影视。
[0003]但是现有技术中的影视播放器，仅能处理简单的视频播放，还不能满足人们对2D和3D单双屏视频转换，以及其他3D视频播放更高的要求，即如何来提高用户播放观看舒适度，如何进行不同设备及不同内容排列的格式转换和界面交互，提高用户体验视频效果，成为一个有待解决的问题。

【发明内容】

[0004]本发明提供一种视频播放控制方法及装置，通过分屏操作、画面缩放、镜像、中心对焦等方式，以解决现有技术中存在视频内容等文件播放操作不方便，用户观看舒适度差、用户整体体验感不佳等问题。
[0005]为了实现上述发明目的，本发明提供了一种视频播放控制方法，应用于一电子设备，包括:
选定目标视频；
识别目标视频的格式；
根据所述目标视频的格式，采取相应的播放策略，播放目标视频。
[0006]优选的，上述方法中，
在选定目标视频前，可以开启分屏模式。
[0007]优选的，上述方法中，
所述分屏模式，是指所述播放控制界面复制为双屏幕显示，左右排列显示于屏幕；其中，左显示屏幕对应于人体左眼；
右显示屏幕对应于人体右眼。
[0008]优选的，上述方法中，
所述目标视频格式，包括但不限于:3D左右格式、3D上下格式和2D视频。
[0009]优选的，上述方法中，
所述设置目标视频播放策略包括但不限于:调节双屏显示中间间距、缩放目标视频画面尺寸和调整目标视频画面中心位置。
[0010]优选的，上述方法中，
所述选定及播放目标视频，进一步可以采用语音控制或肢体控制。
[0011]优选的，上述方法中，
所述语音控制是指，语音识别引擎针对语音控制信息进行识别，进而根据识别结果，执行相应控制；
所述肢体控制是指，通过加速度传感器测量重力产生的加速度，进而识别出设备姿态调整后的方向，发出控制信号，并执行相应控制。
[0012]优选的，上述方法中，
所述语音控制信息，是指预先设定的语音信息；
所述预先设定的语音信息，进一步包括但不限于:开门、帮助、返回、播放、音量加、音量减、亮度加、亮度减、暂停、快进、快退、重播和停止；
所述肢体控制信息，是指预先设定的肢体信息；
所述预先设定的肢体信息，进一步包括:抬头、点头、左摆头和右摆头。
[0013]相应的，本发明还提供了一种视频播放控制装置，应用于一电子设备，包括:视频选定模块，用于选定目标视频；
视频识别模块，用于识别目标视频的格式；
视频执行模块，根据所述目标视频的格式，采取相应的播放策略，播放目标视频。
[0014]优选的，上述的播放装置中，
所述视频执行模块，进一步包括，
语音信息识别执行单元，用于识别并执行语音控制信息；
肢体信息识别制定单元，用于识别并执行肢体控制信息。
[0015]与现有技术相比，本发明有益效果如下:
通过使用本发明所提供的视频播放控制方法及系统，可以极大提高电子产品，特别是可穿戴设备，视频等文件播放的可操作性，极大提高用户使用电子设备的舒适度和体验感。
【附图说明】
[0016]图1为本发明实施例所述的视频播放控制方法的流程示意图；
图2为本发明实施例所述的视频播放控制装置的结构示意图；
图3为本发明实施例所述的3D左右视频格式直筒分屏缩放示意图；
图4为本发明实施例所述的3D左右视频格式反射分屏缩放示意图；
图5为本发明实施例所述的3D左右视频格式单屏缩放示意图；
图6为本发明实施例所述的2D视频格式直筒分屏缩放示意图；
图7为本发明实施例所述的2D视频格式反射分屏缩放示意图；
图8为本发明实施例所述的3D上下视频格式左右转换示意图。
【具体实施方式】
[0017]本发明实施例所述的电子设备可以是头戴式显示器、手机、计算机、PDA等各种电子设备。
[0018]下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有创造性劳动下所获得的所有其他实施例，都属于本发明保护的范围。
[0019]本发明实施例所述的播放控制方法，应用于一电子设备。该电子设备优选为手机和头戴显示器，当然还可以是计算机、PDA等各种设备。如图1所示，所述播放控制方法包括以下步骤:
步骤11，选定目标视频；
步骤12，识别目标视频的格式；
步骤13，根据所述目标视频的格式，采取相应的播放策略，播放目标视频。
[0020]在执行步骤11前，在启动该视频播放控制方法时，可以自动检索、收集电子设备内所有本地视频文件，并将所有视频文件导入执行该视频播放控制方法的播放器中；或者播放器作为一个APP应用，其显示界面上有各种分类的在线视频播放列表。
[0021]同时，在选定目标视频前，可以选着开启分屏播放模式；所述分屏模式，是指所述播放控制界面复制为双屏幕显示，左右排列显示于屏幕；其中，左显示屏幕对应于人体左眼；右显示屏幕对应于人体右眼。当然，我们在选定目标视频之前，也可以不选着开启分屏播放模式；是否选择分屏播放模式，以用户实际体验需求为准。
[0022]进一步说明下,各种视频的分屏操作是通过使用开放图形库OpenGL (全写OpenGraphics Library)进行操作实现。OpenGL是个定义了一个跨编程语言、跨平台的编程接口规格的专业的图形程序接口。它用于三维图像(二维的亦可)，是一个功能强大，调用方便的底层图形库。OpenGL按照流水线型设计的，和硬件无关，这让它能够运行于各种各样的图形硬件上。同时它也是软件无关的，可以运行于不同的操作系统，而只需操作系统只需提供一个让OpenGL运行的图形用户界面(Graphical User Interface,简称⑶I)库，同样的OpenGL也还会提供描述三维模型或者读取图片文件的方法，所需要做的是将一系列三维图元(比如点，线，三角形)，来组成三维物体。
[0023]在所述步骤11，选定目标视频；进一步可以是手动选定目标视频，也可以通过语音控制或肢体控制来达到选定目标视频的目的。
[0024]进一步，同时可以采用语音控制或肢体控制来达到对目标视频播放的控制目的；所述语音控制是指，语音识别引擎针对语音控制信息进行识别，进而根据识别结果，执行相应控制；所述肢体控制是指，通过加速度传感器测量重力产生的加速度，进而识别出设备姿态调整后的方向，发出控制信号，并执行相应控制。
[0025]在详细阐述本实施例后续步骤之前，针对本实施例所述的体感或肢体控制及语音识别控制技术，先行说明下:
以手机电子设备为例，肢体控制开启可以为:打开播放器进入视频选择列表，将手机放入可穿戴式设备中。手机上的距离传感器被遮挡后，会发出距离值变化的信号，播放器判断到距离传感器的值低于阀值后，打开肢体控制模式；所述的阀值可以是预先设定值，一般情况下最佳阀值为O。
[0026]肢体控制所实现的功能，包括向左侧头摆选片、向右侧摆头选片、点头播放、抬头取消选择等。
[0027]显然，本领域普通技术人员，无需通过创造性劳动就可以理解，除手机之外，PDA、头戴显示器等其他电子设备，可以通过同样的技术方式，开启肢体控制模式。
[0028]语音识别控制技术，是指麦克风捕捉到的语音模拟信号，经过模数转换、滤波、放大、纠错编码等处理步骤后生成PCM (Pulse Code Modulat1n,脉码调制录音)数据。应用程序将PCM数据输入到语音识别引擎，引擎基于传统的隐马尔可夫模型和深度神经网络学习技术，将输入的语音，转成成对应的文字，完成整个识别过程。
[0029]在本发明实施例中，语音识别控制技术可以实现功能包括:
呼叫“开门”可进入语音操作模式；
呼叫“帮助”可查看语音指令列表；
呼叫“返回”或“播放”退出帮助；
呼叫“音量加(减)”可调节视频播放音量；
呼叫“亮度加(减)”可调节手机亮度；
呼叫“暂停”，暂停播放视频；
呼叫“播放”，继续播放视频；
呼叫“重播”，当前视频重新开始播放；
呼叫“快进(退)”，可快进(退)视频；
呼叫“停止”或“返回”，可退出视频播放；
呼叫“下一部”或“上一部”，可选择上一部视频或下一部视频；
以上说明内容仅是举例，并非穷尽。
[0030]本实施例所述的体感或肢体控制及语音识别控制技术可以通过播放场景互为切换，肢体控制模式可以为语音控制模式的入口，例如:用户可以通过肢体控制模式在无任何手部和外设辅助的情况下，仅通过肢体摆头行为即可实现影视内容的选取和确认播放，在进入影片的播放后再通过点头的肢体行为呼出语音菜单，此时语音控制模式被激活，用户可以使用语音指令对播放行为进行各种控制。
[0031]以下分别详细举例说明肢体控制和语音控制过程，
肢体控制，
向左侧摆头选片:用户向左侧摆头，加速度传感器判断出重力方向后，用3个向量值标示重力在X，Y, Z轴的加速度值，分别标示X，Y, Z轴的重力大小；当检测到Y轴加速度产生较大数值，可以是绝对值大于2，则确认手机两端产生了倾斜；播放器通过Y加速度值和手机放置方向，判断出手机姿态为向左侧时，视频播放器的信息识别模块发出“向左选片”控制信号，播放软件根据上述控制信号执行相应操作；即视频列表往左滚动一个视频。例如:手机屏是右转方式，此时检测到Y加速度值大于2，则确认手机相对人向左下坠，此时认为用户是向左侧选片。
[0032]向右侧摆头选片:用户向右侧摆头，加速度传感器判断出重力方向后，用3个向量值标示重力在X，Y, Z轴的加速度值，分别标示X，Y, Z轴的重力大小。当检测到Y轴加速度产生较大数值，可以是绝对值大于2，则确认手机两端产生了倾斜。播放器通过Y加速度值和手机放置方向，判断出手机姿态为向右侧时，视频播放器的信息识别模块发出“向右选片”控制信号，播放软件根据上述控制信号执行相应操作；即视频列表往右滚动一个视频。例如:手机屏是左转方式，此时检测到Y加速度值大于2，则确认手机相对人向右下坠，此时认为用户是向右侧选片。
[0033]点头播放:用户在视频选择列表中向下点头，陀螺仪传感器在Y轴检测到较大的角加速度值，当该值超过2.5时，可以确认用户做出了点头动作；视频播放器的信息识别模块发出“播放”控制信号，播放软件根据上述控制信号执行相应操作；即视频选择列表中的当前视频会被选中并播放。
[0034]抬头取消:用户在视频选择列表选中某个视频时，会出现一定时间的动画，时间可以预先设定，一般为5秒钟；在动画尚未消失时，用户向上抬头，陀螺仪传感器在Y轴检测到较大的角加速度值，当角速度值小于-2.5时，可以确定用户做出抬头动作；视频播放器的信息识别模块发出“取消”控制信号，播放软件根据上述控制信号执行相应操作；即停止动画并取消视频的选择。
[0035]语音控制，
暂停功能:视频播放过程中，快速抬头，可穿戴设备上的陀螺仪传感器将会测量到抬头动作的角加速度值，当角加速度值达到预设的门限值后，开启语音识别模式，所述门限值一般最佳的为2.5 ;在语音识别模式下对着麦克风说“暂停”。进而将麦克风捕捉到的语音信号送到语音识别引擎做识别，语音识别引擎识别到“暂停”后，视频播放器的信息识别模块发出“暂停”控制信号，播放软件根据上述控制信号执行相应操作。
[0036]播放功能:播放器处于暂停状态，快速抬头，可穿戴设备上的陀螺仪传感器将会测量到抬头动作的角加速度值，当角加速度值达到预设的门限值后，开启语音识别模式，所述门限值一般最佳的为2.5 ;开启语音识别模式，在语音识别模式下对着麦克风说“播放”。进而将麦克风捕捉到的语音信号送到语音识别弓I擎做识别，语音识别弓I擎识别到“播放”后，播放软件执行相应操作。
[0037]快进功能:视频播放过程中，快速抬头，可穿戴设备上的陀螺仪传感器将会测量到抬头动作的角加速度值，当角加速度值达到预设的门限值后，开启语音识别模式，所述门限值一般最佳的为2.5 ;开启语音识别模式，在语音识别模式下对着麦克风说“快进”。进而将麦克风捕捉到的语音信号送到语音识别弓I擎做识别，语音识别弓I擎识别到“快进”后，播放软件执行相应操作。
[0038]快退、音量加或减、亮度加或减、帮助和返回等功能，本领域普通技术人员，无须通过创造性劳动就能直接得出，其技术实现方案与上述实施例中“暂停、播放和快进功能”实现技术原理相同，在此不做赘述。
[0039]以上步骤12中，识别目标视频的格式；所述目标视频格式，包括但不限于:3D左右格式、3D上下格式和2D视频。
[0040]以上步骤13中，根据所述目标视频的格式，采取相应的播放策略，播放目标视频。所述目标视频播放策略包括但不限于:单屏或双(分)屏播放模式设定、调节双屏显示中间间距、缩放目标视频画面尺寸和调整目标视频画面中心位置。
[0041]上述步骤中的分屏操作是通过使用开放图形库OpenGL (全写Open GraphicsLibrary)进行操作实现。在分屏的技术操作中，将会用到Shader和Fragment Shaders ；Shader是着色器,它的工作就是读取你的网格并渲染在屏幕上；Fragment Shaders片段着色器，把一系列几何图形变成2D屏幕上的像素颜色，允许你一次修改一个像素点的颜色以及纹理贴图的坐标位置。
[0042]一般情况下分为两个步骤，首先判断某一像素点是否在绘图范围内；然后根据判断结果进行对应操作，即若某一像素点在绘图范围内，则使用视频帧来填充，否则，则填充背景色。
[0043]关于屏幕显示图像缩放方面的操作方法是，首先设置缩放参数，然后对每一个要绘制的像素，做坐标缩放。比方原坐标(200，100),缩放参数是0.5，则坐标变为(100，50)。
[0044]上述根据目标视频的格式，采取相应的播放策略，将通过如下具体实施例进行详细说明，即针对3D左右格式、3D上下格式和2D视频的三种主要视频格式的对应播放策略进行详细说明。
[0045]目前现有技术市场中，头戴显示器主要有两大类别，即直筒式头戴显示器和反射式头带显示器；在本实施例中，针对不同类型的头戴显示器，视频的缩放及分屏的播放策略所采取的技术方案是不一样；以下针对直筒式和反射式两种头戴显示器，分别阐述下其视频的缩放和分屏的播放策略。
[0046]3D左右视频格式相应的播放策略，
当所述视频播放控制方法运用于直筒式头戴显示器时，其缩放及分屏实现过程如图3所示，其中左边的E表示左屏幕显示的视频画面，右边的E表示右屏幕显示的视频画面，启动该视频播放策略前，左右两幅视频画面紧挨一起，通过左右两画面经过各一次fragmentshader，最终改变宽高比例并且在光学合适的位置，最终得到E’左右两幅视频画面。即我们可以根据实际需求或预先设计的参数调节左右两幅画面的中间间距、缩放画面同时可以调整画面的中心位置与头戴显示器的目镜中心一一对应，可以极大提高了人们头戴显示器观看视频的清晰度及舒适性。
[0047]当所述视频播放控制方法运用于放射式头戴显示器时，其缩放及分屏实现过程如图4所示，其中左边的E表示左屏幕显示的视频画面，右边的E表示右屏幕显示的视频画面，启动该视频播放策略前，左右两幅视频画面紧挨一起，先通过左右两画面经过各一次vertex shader顶点着色器，将画面内容变成镜像显示；然后左右两画面经过各一次fragment shader,改变宽高比例并且在光学合适的位置,最终得到E’左右两幅视频画面。即我们可以根据实际需求或预先设计的参数调节左右两幅画面的中间间距、缩放画面同时可以调整画面的中心位置与头戴显示器的目镜中心一一对应，可以极大提高了人们头戴显示器观看视频的清晰度及舒适性。
[0048]当3D左右格式视频，应用于其他电子设备，需要单屏播放时，通过所述视频播放控制方法也可以实现双屏画面转单幅画面全屏显示；其实现过程如图5所示，其中左边的E表示左屏幕显示的视频画面,右边的E表示右屏幕显示的视频画面，启动该视频播放策略前，左右两幅视频画面紧挨一起；进一步通过仅对左半幅或者右半幅画面做fragmentshader，最终显示左半幅(或者右半幅)比例调整后，达到全屏图像显示的目的。
[0049]2D视频格式相应的播放策略，
当所述视频播放控制方法运用于直筒式头戴显示器时，其缩放及分屏实现过程如图6所示，其中E表示2D视频显示单幅画面,通过两次fragment shader,最终改变宽高比例并且在光学合适的位置，最终得到E’左右两幅视频画面。即我们可以根据实际需求或预先设计的参数调节左右两幅画面的中间间距、缩放画面同时可以调整画面的中心位置与头戴显示器的目镜中心一一对应，可以极大提高了人们头戴显示器观看视频的清晰度及舒适性。
[0050]当所述视频播放控制方法运用于反射式式头戴显示器时，其缩放及分屏实现过程如图7所示,其中E表示2D视频显示单幅画面,先通过将画面经过一次vertex shader顶点着色器，将画面内容变成镜像显示；然后两次fragment shader，最终改变宽高比例并且在光学合适的位置，最终得到E’左右两幅视频画面。即我们可以根据实际需求或预先设计的参数调节左右两幅画面的中间间距、缩放画面同时可以调整画面的中心位置与头戴显示器的目镜中心一一对应，可以极大提高了人们头戴显示器观看视频的清晰度及舒适性。
[0051]3D上下格式视频相应的播放策略，
首先，将3D上下格式视频调整为3D左右格式视频；然后参照上述3D左右视频的播放策略，进行相应播放操作。
[0052]如图8所示，其中左边的E表示左屏幕显示的视频画面，右边的E表示下屏幕显示的视频画面，启动该视频播放策略前，上下两幅视频画面紧挨一起，通过上下两画面经过各一次vertex shader,将画面内容通过比例变换,得到满足左右分屏光学设备比例的视频画面E，即将3D上下格式视频调整为3D左右格式视频；然后参照上述3D左右视频的播放策略，进行相应播放操作。
[0053]本发明实施例，还提供了一种视频播放控制装置，应用于一电子设备，如图2所示，该装置包括:
视频选定模块，用于选定目标视频；
视频识别模块，用于识别目标视频的格式；
视频执行模块，根据所述目标视频的格式，采取相应的播放策略，播放目标视频。
[0054]其中，所述视频执行模块，进一步包括:
语音信息识别执行单元，用于识别并执行语音控制信息；
肢体信息识别制定单元，用于识别并执行肢体控制信息。
[0055]显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。
【主权项】
1.一种视频播放控制方法，应用于一电子设备，其特征在于，包括: 选定目标视频；识别目标视频的格式；根据所述目标视频的格式，采取相应的播放策略，播放目标视频。2.如权利要求1所述的方法，其特征在于，在选定目标视频前，可以开启分屏模式。3.如权利要求2所述的方法，其特征在于，所述分屏模式，是指所述播放控制界面复制为双屏幕显示，左右排列显示于屏幕；其中，左显示屏幕对应于人体左眼；右显示屏幕对应于人体右眼。4.如权利要求1所述的方法，其特征在于，所述目标视频格式，包括但不限于:3D左右格式、3D上下格式和2D视频。5.如权利要求1所述的方法，其特征在于，所述设置目标视频播放策略包括但不限于:调节双屏显示中间间距、缩放目标视频画面尺寸和调整目标视频画面中心位置。6.如权利要求1所述的方法，其特征在于，所述选定及播放目标视频，进一步可以采用语音控制或肢体控制。7.如权利要求6所述的方法，其特征在于，所述语音控制是指，语音识别引擎针对语音控制信息进行识别，进而根据识别结果，执行相应控制；所述肢体控制是指，通过加速度传感器测量重力产生的加速度，进而识别出设备姿态调整后的方向，发出控制信号，并执行相应控制。8.如权利要求7所述的方法，其特征在于，所述语音控制信息，是指预先设定的语音信息；所述预先设定的语音信息，进一步包括但不限于:开门、帮助、返回、播放、音量加、音量减、亮度加、亮度减、暂停、快进、快退、重播和停止；所述肢体控制信息，是指预先设定的肢体信息；所述预先设定的肢体信息，进一步包括:抬头、点头、左摆头和右摆头。9.一种视频播放控制装置，应用于一电子设备，其特征在于，包括: 视频选定模块，用于选定目标视频；视频识别模块，用于识别目标视频的格式；视频执行模块，根据所述目标视频的格式，采取相应的播放策略，播放目标视频。10.如权利要求7所述的装置，其特征在于，所述视频执行模块，进一步包括，语音信息识别执行单元，用于识别并执行语音控制信息；肢体信息识别制定单元，用于识别并执行肢体控制信息。
【文档编号】H04N21/431GK105872515SQ201510034301
【公开日】2016年8月17日
【申请日】2015年1月23日
【发明人】张彤
【申请人】上海乐相科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张彤;
技术所有人：上海乐相科技有限公司;
我是此专利的发明人

上一篇：获取立体片源视差参数的方法及装置的制造方法
上一篇：基于环境特征值的白平衡方法和装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。