全景视频识别方法及装置与流程

文档序号:17608710发布日期:2019-05-07 20:55阅读:504来源:国知局
全景视频识别方法及装置与流程

本发明涉及全景视频识别技术领域,尤其涉及一种全景视频识别方法及装置。



背景技术:

目前随着虚拟现实(VR,Virtual Reality)技术的兴起,各种全景视频不断涌现,但目前对于全景视频,缺乏技术标准,还是采用和目前普通视频文件相同的编码方式,因此全景视频和普通视频,很难从文件数据上加以区分。

现有技术中,由于无法区分普通视频和全景视频,对一个视频播放器来说,就不知道该选择怎样的播放模式(普通视频和全景视频的播放模式是不一样的),现有的方案一般是提供按钮,让用户切换播放模式,操作比较麻烦,尤其是用户带上VR头盔后。



技术实现要素:

本发明提供一种全景视频识别方法及装置,旨在解决由于无法区分普通视频和全景视频,从而导致播放操作繁琐,智能化较低的问题。

本发明第一方面提供一种全景视频识别方法,包括:选取待识别视频文件中预置帧图像的图像数据;根据所述预置帧图像的图像数据,判断所述预置帧图像最左端和最右端的像素点是否符合左右拼合的条件,以及,判断所述预置帧图像最上端和最下端的像素点是否符合上下收拢的条件;若所述预置帧图像最左端和最右端的像素点符合所述左右拼合的条件,且,所述预置帧图像最上端和最下端的像素点符合所述上下收拢的条件,则确定所述待识别视频文件为全景视频。

本发明第二方面提供一种全景视频识别装置,包括:选取模块,用于选取待识别视频文件中预置帧图像的图像数据;判断模块,用于根据所述预置帧图像的图像数据,判断所述预置帧图像最左端和最右端的像素点是否符合左右拼合的条件,以及,判断所述预置帧图像最上端和最下端的像素点是否符合上下收拢的条件;识别模块,用于若所述判断模块的判断结果为所述预置帧图像最左端和最右端的像素点符合所述左右拼合的条件,且,所述预置帧图像最上端和最下端的像素点符合所述上下收拢的条件,则确定所述待识别视频文件为全景视频。

上述本发明实施例提供的全景视频识别及装置,通过选取待识别视频文件中预置帧图像的图像数据,然后根据预置帧图像的图像数据,判断预置帧图像最左端和最右端的像素点是否符合左右拼合的条件,以及,判断预置帧图像最上端和最下端的像素点是否符合上下收拢的条件,并当预置帧图像最左端和最右端的像素点符合左右拼合的条件,且,预置帧图像最上端和最下端的像素点符合上下收拢的条件时,确定待识别视频文件为全景视频,相较于现有技术,本发明实施例可在视频播放前自动快速识别待播放的视频是否为全景视频,以便根据识别结果选择合适的播放模式,因此可简化视频播放操作,使得视频播放更为智能化。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

附图1示出了一种终端设备的结构框图;

附图2是本发明第一实施例提供的全景视频识别方法的实现流程示意图;

附图3是本发明第二实施例提供的全景视频识别方法的实现流程示意图;

附图4是本发明第三实施例提供的全景视频识别装置的结构示意图;

附图5是本发明第四实施例提供的全景视频识别装置的结构示意图。

具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

附图1示出了一种终端设备的结构框图。该终端设备可以但不限于包括:具有全景视频播放功能的智能手机、平板电脑、VR头盔等等。如附图1所示,终端设备10包括存储器102、存储控制器104,一个或多个(图中仅示出一个)处理器106、外设接口108、射频模块110、按键模块112、音频模块114以及显示模块116。这些组件通过一条或多条通讯总线/信号线122相互通讯。

可以理解,附图1所示的结构仅为示意,其并不对终端设备10的结构造成限定。例如,终端设备10还可包括比附图1所示更多或者更少的组件,或者具有与附图1所示不同的配置。附图1所示的各组件可以采用硬件、软件或其组合实现。

存储器102可用于存储软件程序以及模块,如本发明实施例中的全景视频识别方法及装置对应的程序指令/模块,处理器106通过运行存储在存储器102内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的全景视频识别方法。

存储器102可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器102可进一步包括相对于处理器106远程设置的存储器,这些远程存储器可以通过网络连接至终端设备10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。处理器106以及其他可能的组件对存储器102的访问可在存储控制器104的控制下进行。

外设接口108将各种输入/输入装置耦合至处理器106以及存储器102。处理器106运行存储器102内的各种软件、指令以执行终端设备10的各种功能以及进行数据处理。

在一些实例中,外设接口108,处理器106以及存储控制器104可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。

射频模块110用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。射频模块110可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。射频模块110可与各种网络如互联网、企业内部网、预置类型的无线网络进行通讯或者通过预置类型的无线网络与其他设备进行通讯。上述的预置类型的无线网络可包括蜂窝式电话网、无线局域网或者城域网。上述的预置类型的无线网络可以使用各种通信标准、协议及技术,包括但并不限于全球移动通信系统(Global System for Mobile Communication,GSM),增强型移动通信技术(Enhanced Data GSM Environment,EDGE),宽带码分多址技术(Wideband Code Division Multiple Access,W-CDMA),码分多址技术(Code Division Access,CDMA),时分多址技术(Time Division Multiple Access,TDMA),蓝牙,无线保真技术(Wireless-Fidelity,WiFi)(如美国电气和电子工程师协会标准IEEE 802.11a、IEEE 802.11b、IEEE802.11g和/或IEEE 802.11n),网络电话(Voice over Internet Protocol,VoIP),全球微波互联接入(Worldwide Interoperability for Microwave Access,Wi-Max),其他用于邮件、即时通讯及短消息的协议,以及任何其他合适的通讯协议,甚至可包括那些当前仍未被开发出来的协议。

按键模块112提供用户向终端设备10进行输入的接口,用户可以通过按下不同的按键以使终端设备10执行不同的功能。

音频模块114向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。音频电路从外设接口108处接收声音数据,将声音数据转换为电信息,将电信息传输至扬声器。扬声器将电信息转换为人耳能听到的声波。音频电路还从麦克风处接收电信息,将电信号转换为声音数据,并将声音数据传输至外设接口108中以进行进一步的处理。音频数据可以从存储器102处或者通过射频模块110获取。此外,音频数据也可以存储至存储器102中或者通过射频模块110进行发送。在一些实例中,音频模块114还可包括一个耳机播孔,用于向耳机或者其他设备提供音频接口。

显示模块116在终端设备10与用户之间提供一个输出界面。具体地,显示模块116向用户显示视频输出,这些视频输出的内容可包括文字、图形、视频、及其任意组合。一些输出结果是对应于一些用户界面对象。进一步地,显示模块116还在终端设备10与用户之间提供一个输入界面,用于接收用户的输入,例如用户的点击、滑动等手势操作,以便用户界面对象对这些用户的输入做出响应。检测用户输入的技术可以是基于电阻式、电容式或者其他任意可能的触控检测技术。显示模块116显示单元的具体实例包括但并不限于液晶显示器或发光聚合物显示器。

请参阅附图2,附图2为本发明第一实施例提供的全景视频识别方法的实现流程示意图。本实施例提供的全景视频识别方法可应用于如附图1所示的终端设备10中,如附图2所示,该方法主要包括以下步骤:

S101、选取待识别视频文件中预置帧图像的图像数据;

S102、根据预置帧图像的图像数据,判断预置帧图像最左端和最右端的像素点是否符合左右拼合的条件,以及,判断预置帧图像最上端和最下端的像素点是否符合上下收拢的条件;

S103、若预置帧图像最左端和最右端的像素点符合左右拼合的条件,且,预置帧图像最上端和最下端的像素点符合上下收拢的条件,则确定待识别视频文件为全景视频。

本发明实施例的实现原理是全景视频的每一帧数据都对应一张图片,并具有以下特征:

1、左右相连。即图像的最左端和最右端最后是要拼合在一起的,因此它们的数据是一样,具体的表现形式是最左端的第一列像素和最右端的最后一列像素是一样的,否则无法完美拼合。

2.、上下收拢。即图像的最上端和最下端在播放的时候会收拢为一个点,所以最上端第一行元素的像素点、最下端最后一行像素点是完全一致的。

作为对比,这个过程非常像将一幅平面世界地图贴到一个地球仪表面。左右相连就是地图最左端和最右端是同样的内容,这样才能拼合。上下收拢就是最上方、最下方要收拢成北极点和南极点,如果最上方像素点的数据不一致,那就无法确定北极点的像素数据取值。

基于上述实现原理,选取待识别视频文件中的一帧或多帧图像的图像数据,即,分别选取各帧图像中上端、下端、左端以及右端的多个像素点的参数值,然后根据选取的图像数据,对各帧图像进行左右相连检查以及上、下收拢检查,以判断各帧图像是否满足上述左右相连和上下收拢的特征条件,并当各帧图像均同时满足上述左右相连和上下收拢的特征条件时,确定待识别视频文件为全景视频。

进一步地,若预置帧图像最左端和最右端的像素点不符合左右拼合的条件,和/或,预置帧图像最上端和最下端的像素点不符合上下收拢的条件,则确定待识别视频文件为非全景视频。

本发明实施例提供的全景视频识别方法,通过选取待识别视频文件中预置帧图像的图像数据,然后根据预置帧图像的图像数据,判断预置帧图像最左端和最右端的像素点是否符合左右拼合的条件,以及,判断预置帧图像最上端和最下端的像素点是否符合上下收拢的条件,并当预置帧图像最左端和最右端的像素点符合左右拼合的条件,且,预置帧图像最上端和最下端的像素点符合上下收拢的条件时,确定待识别视频文件为全景视频,相较于现有技术,本发明实施例可在视频播放前自动快速识别待播放的视频是否为全景视频,以便根据识别结果选择合适的播放模式,因此可简化视频播放操作,使得视频播放更为智能化。

请参阅附图3,附图3为本发明第二实施例提供的全景视频识别方法的实现流程示意图。本实施例提供的全景视频识别方法可应用于如附图1所示的终端设备20中,如附图3所示,该方法主要包括以下步骤:

S201、确定待识别视频文件中预置数量的预置位置的视频帧图像,作为预置帧图像,选取待识别视频文件中预置帧图像的图像数据;

本发明实施例的实现原理是全景视频的每一帧数据都对应一张图片,并具有以下特征:

1、左右相连。即图像的最左端和最右端最后是要拼合在一起的,因此它们的数据是一样,具体的表现形式是最左端的第一列像素和最右端的最后一列像素是一样的,否则无法完美拼合。

2.、上下收拢。即图像的最上端和最下端在播放的时候会收拢为一个点,所以最上端第一行元素的像素点、最下端最后一行像素点是完全一致的。

作为对比,这个过程非常像将一幅平面世界地图贴到一个地球仪表面。左右相连就是地图最左端和最右端是同样的内容,这样才能拼合。上下收拢就是最上方、最下方要收拢成北极点和南极点,如果最上方像素点的数据不一致,那就无法确定北极点的像素数据取值。

基于上述实现原理,当检测到视频播放指令时,获取该视频播放指令指向的待识别视频文件,确定待识别视频文件中预置数量的预置位置的视频帧图像,作为预置帧图像。其中,预置位置的视频帧图像为非纯色背景图像,即,预置帧图像的颜色不能是纯色的,如全黑色、全白色、全蓝色等等。

可选地,分别取视频文件的第100s(秒)及第1000s的两帧数据。取第100s是为了防止前面的数据是片头,可能大部分背景都是黑色的,这样就自然符合上面的两条标准,无法区分了。取1000s是为了防止影片开场一直处于黑色背景中的情况。

于本发明其他实施例中,也可以按照以下方式确定待识别视频文件中预置数量的预置位置的视频帧图像,作为预置帧图像,具体的:

步骤1、分别从待识别视频文件的头部、中部及后部中的至少任意一个位置,随机抽取预置数量的视频帧图像,并识别抽取的视频帧图像是否均为非纯色背景图像;

步骤2、若均为非纯色背景图像,则将抽取的视频帧图像,作为预置帧图像;

步骤3、若抽取的视频帧图像中有任一帧图像不是非纯色背景图像,则将抽取的非纯色背景图像,作为预置帧图像;

步骤4、确定抽取的纯色背景图像的数量,从待识别视频文件中随机抽取对应数量的视频帧图像,并执行识别抽取的视频帧图像是否均为非纯色背景图像的步骤,直至抽取的所有视频帧图像均为非纯色背景图像为止。

举例来说,假设随机分别抽取第100s及第1000s的两帧数据X、Y,判断X、Y这两帧图像是否均为非黑色背景图像,若均为非黑色背景图像,则将图像X、Y作为预置帧图像;若图像X为黑色背景图像,则将非黑色背景图像的图像Y作为预置帧图像,并确定抽取的纯黑色背景图像的数量为1;随机抽取第2000s的帧数据Z,并判断图像Z是否为非黑色背景图像,若图像Z是非黑色背景图像,则将图像Z作为预置帧图像,若图像Z是黑色背景图像,则重复执行确定抽取的纯黑色背景图像的数量及后续步骤,直至抽取出一帧非黑色背景图像,并将其代替X作为预置帧图像。

S202、根据预置帧图像的图像数据,判断预置帧图像最左端和最右端的像素点是否符合同一行的像素点一致的条件;

具体的,分别获取预置帧图像的图像最左一列各像素点的三原色RGB(红、绿、蓝)值,以及,最右一列各像素点的RGB值;当最左一列各像素点的RGB值分别与最右一列各像素点中的目标像素点的RGB值的差值均小于预置阈值时,确定预置帧图像最左端和最右端的像素点符合同一行的像素点一致的条件,即,符合左右拼合的条件,其中,该目标像素点为与最左一列各像素点位于同一行的像素点。

RGB即是代表红、绿、蓝三个通道的颜色。RGB色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的。

举例来说,逐一对各图像进行左右相连检查,分别取每一图像最左一列和最右边一列的像素点的数据(即,每个像素点的RGB值),然后将其RGB值相减,得到一列像素点的RGB差值,如果每个像素点的RGB分量的差值都小于5,假设5是允许的阈值波动区间,则认为通过左右相连检查,符合同一行的像素点一致的条件。否则,如果有任一图像的最左一列和最右边一列的各像素点的RGB差值中有任一差值大于或等于5,则认为未通过左右相连检查,不符合同一行的像素点一致的条件。

若预置帧图像最左端和最右端的像素点符合同一行的像素点一致的条件,则执行步骤S203;若预置帧图像最左端和最右端的像素点不符合同一行的像素点一致的条件,则执行步骤S205。

S203、根据预置帧图像的图像数据,判断预置帧图像最上端和最下端的像素点是否一致;

具体的,分别获取预置帧图像的最上一行各像素点的RGB值,以及,最下一行各像素点的RGB值;分别获取最上一行各像素点的RGB值中的第一最大值和第一最小值,以及,最下一行各像素点的RGB值中的第二最大值和第二最小值;当第一最大值与第一最小值的差值小于第一阈值,且第二最大值与第二最小值的差值小于第二阈值时,确定预置帧图像最上端和最下端的像素点一致。

举例来说,逐一对各图像进行上、下收拢检查。其中,以上收拢为例,取图像最上面一行的像素点的数据,遍历这些像素点的RGB值,得到R、G、B的最大值和最小值:Rmin、Rmax、Gmin、Gmax、Bmin、Bmax,其中Rmin是这些像素点中R的最小取值,Rmax是这些像素点中R的最大取值,Gmin是这些像素点中G的最小取值,Gmax是这些像素点中G的最大取值,Bmin是这些像素点中B的最小取值,Bmax是这些像素点中B的最大取值。然后分别判断Rmax-Rmin、Gmax-Gmin、Bmax-Bmin是否均小于或等于5,假设5是允许的阈值波动区间。如果R、G、B的阈值波动区间都在5以内,则认为通过上收拢检查,否则认为没有通过上收拢检查。下收拢检查同理上收拢检查。

需要说明的是,步骤S203中的上、下收拢检查的顺序可以互换,即,可以先检查上收拢再检查下收拢,也可以先检查下收拢再检查上收拢。步骤S202和步骤S203的执行顺序可以互换,即,可以先执行上、下收拢检查再执行左右相连检查,也可以先执行左右相连检查再执行上、下收拢检查。

若预置帧图像最上端和最下端的像素点一致,则执行步骤S204;若预置帧图像最上端和最下端的像素点不一致,则执行步骤S205。

S204、确定待识别视频文件为全景视频;

若预置帧图像最左端和最右端的像素点符合同一行的像素点一致的条件,且,预置帧图像最上端和最下端的像素点一致,则确定待识别视频文件为全景视频。可以理解的,只有当所有的预置帧图像均通过左右相连检查以及上下收拢检查时,即,若所有的预置帧图像最左端和最右端的像素点均符合同一行的像素点一致的条件,且,所有预置帧图像最上端和最下端的像素点均一致时,则确定待识别视频文件为全景视频。

S205、确定待识别视频文件为非全景视频。

若预置帧图像最左端和最右端的像素点不符合同一行的像素点一致的条件,和/或,预置帧图像最上端和最下端的像素点不一致,则确定待识别视频文件为非全景视频。可以理解的,所有预置帧图像中只要有任一帧图像没有通过左右相连检查、或没有通过上下收拢检查、或没有通过左右相连检查和上下收拢检查,则确定待识别视频文件为非全景视频。

进一步地,根据识别结果,切换到与识别结果对应的播放模式对待识别视频文件进行播放。如,如果待识别视频文件为全景视频,则切换到全景视频播放模式,对该待识别视频文件进行播放;如果待识别视频文件为非全景视频,则切换到普通视频播放模式,对该待识别视频文件进行播放。

本发明实施例提供的全景视频识别方法,通过选取待识别视频文件中预置帧图像的图像数据,然后根据预置帧图像的图像数据,判断预置帧图像最左端和最右端的像素点是否符合同一行的像素点一致的条件,以及,判断预置帧图像最上端和最下端的像素点是否一致,并当预置帧图像最左端和最右端的像素点符合同一行的像素点一致的条件,且,预置帧图像最上端和最下端的像素点一致时,确定待识别视频文件为全景视频,相较于现有技术,本发明实施例可在视频播放前自动快速识别待播放的视频是否为全景视频,并进而根据识别结果选择合适的播放模式,因此可简化视频播放操作,使得视频播放更为智能化。

请参阅附图4,附图4是本发明第三实施例提供的全景视频识别装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分。附图4示例的全景视频识别装置可以是前述实施例提供的全景视频识别方法的执行主体,其可以是终端设备或者终端设备的一个功能模块。附图4示例的全景视频识别装置,主要包括:选取模块301、判断模块302以及识别模块303。各功能模块详细说明如下:

选取模块301,用于选取待识别视频文件中预置帧图像的图像数据;

判断模块302,用于根据该预置帧图像的图像数据,判断该预置帧图像最左端和最右端的像素点是否符合左右拼合的条件,以及,判断该预置帧图像最上端和最下端的像素点是否符合上下收拢的条件;

识别模块303,用于若判断模块302的判断结果为该预置帧图像最左端和最右端的像素点符合该左右拼合的条件,且,该预置帧图像最上端和最下端的像素点符合该上下收拢的条件,则确定该待识别视频文件为全景视频。

具体的,选择模块301选取待识别视频文件中的一帧或多帧图像的图像数据,即,分别选取各帧图像中上端、下端、左端以及右端的多个像素点的参数值,然后判断模块302根据选取的图像数据,对各帧图像进行左右相连检查以及上、下收拢检查,以判断各帧图像是否满足上述左右相连和上下收拢的特征条件,当各帧图像均同时满足上述左右相连和上下收拢的特征条件时,识别模块303确定待识别视频文件为全景视频。

进一步地,若预置帧图像最左端和最右端的像素点不符合左右拼合的条件,和/或,预置帧图像最上端和最下端的像素点不符合上下收拢的条件,则识别模块303确定待识别视频文件为非全景视频。

需要说明的是,以上附图4示例的全景视频识别装置的实施方式中,各功能模块的划分仅是举例说明,实际应用中可以根据需要,例如相应硬件的配置要求或者软件的实现的便利考虑,而将上述功能分配由不同的功能模块完成,即将该装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。而且,实际应用中,本实施例中的相应的功能模块可以是由相应的硬件实现,如由摄像镜头对镜头前的画面进行拍摄,由麦克风对周围环境中的声音进行采集,也可以由相应的硬件执行相应的软件完成。本说明书提供的各个实施例都可应用上述描述原则。

本发明实施例提供的全景视频识别装置,通过选取待识别视频文件中预置帧图像的图像数据,然后根据预置帧图像的图像数据,判断预置帧图像最左端和最右端的像素点是否符合左右拼合的条件,以及,判断预置帧图像最上端和最下端的像素点是否符合上下收拢的条件,并当预置帧图像最左端和最右端的像素点符合左右拼合的条件,且,预置帧图像最上端和最下端的像素点符合上下收拢的条件时,确定待识别视频文件为全景视频,相较于现有技术,本发明实施例可在视频播放前自动快速识别待播放的视频是否为全景视频,以便根据识别结果选择合适的播放模式,因此可简化视频播放操作,使得视频播放更为智能化。

请参阅附图5,附图5是本发明第四实施例提供的全景视频识别装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分。附图5示例的全景视频识别装置可以是前述实施例提供的全景视频识别方法的执行主体,其可以是终端设备或者终端设备中的一个功能模块。在附图4示例的全景视频识别装置的基础上,与第三实施例不同的是,在本实施例中:

进一步地,判断模块302,具体用于根据该预置帧图像的图像数据,判断该预置帧图像最左端和最右端的像素点是否符合同一行的像素点一致的条件,以及,判断该预置帧图像最上端和最下端的像素点是否一致。

进一步地,判断模块302包括:

第一获取模块3021,用于分别获取该预置帧图像的图像最左一列各像素点的三原色RGB值,以及,最右一列各像素点的RGB值;

第一比较模块3022,用于当该最左一列各像素点的RGB值分别与该最右一列各像素点中的目标像素点的RGB值的差值均小于预置阈值时,确定该预置帧图像最左端和最右端的像素点符合该同一行的像素点一致的条件,该目标像素点为与该最左一列各像素点位于同一行的像素点;

第二获取模块3023,用于分别获取该预置帧图像的最上一行各像素点的RGB值,以及,最下一行各像素点的RGB值;还用于分别获取该最上一行各像素点的RGB值中的第一最大值和第一最小值,以及,该最下一行各像素点的RGB值中的第二最大值和第二最小值;

第二比较模块3024,用于当该第一最大值与该第一最小值的差值小于第一阈值,且该第二最大值与该第二最小值的差值小于第二阈值时,确定该预置帧图像最上端和最下端的像素点一致。

具体的,首先,第一获取模块3021分别获取预置帧图像的图像最左一列各像素点的三原色RGB(红、绿、蓝)值,以及,最右一列各像素点的RGB值。然后,第一比较模块3022将最左一列各像素点的RGB值分别和最右一列各像素点中的目标像素点的RGB值的差值,与预置阈值进行比较,当最左一列各像素点的RGB值分别与最右一列各像素点中的目标像素点的RGB值的差值均小于预置阈值时,确定预置帧图像最左端和最右端的像素点符合同一行的像素点一致的条件,即,符合左右拼合的条件,其中,该目标像素点为与最左一列各像素点位于同一行的像素点。接着,第二获取模块3023分别获取该预置帧图像的最上一行各像素点的RGB值,最下一行各像素点的RGB值,该最上一行各像素点的RGB值中的第一最大值和第一最小值,以及,该最下一行各像素点的RGB值中的第二最大值和第二最小值。再接着,第二比较模块3024将该第一最大值和该第一最小值的差值,与第一阈值进行比较;将该第二最大值和该第二最小值的差值,与第二阈值进行比较。当该第一最大值与该第一最小值的差值小于第一阈值,且该第二最大值与该第二最小值的差值小于第二阈值时,第二比较模块3024确定该预置帧图像最上端和最下端的像素点一致。

需要说明的是,第一获取模块3021和第一比较模块3022,第二获取模块3023和第二比较模块3024,在实现各自的功能时,执行对应操作的先后顺序可以互换,即,第二获取模块3023和第二比较模块3024也可先于第一获取模块3021和第一比较模块3022执行对应的操作。

进一步地,该装置还包括:

确定模块401,用于确定该待识别视频文件中预置数量的预置位置的视频帧图像,作为该预置帧图像,该预置位置的视频帧图像为非纯色背景图像;

确定模块401包括:

抽取模块4011,用于分别从该待识别视频文件的头部、中部及后部中的至少任意一个位置,随机抽取预置数量的视频帧图像;

图像识别模块4012,用于识别抽取的视频帧图像是否均为该非纯色背景图像;

处理模块4013,用于若图像识别模块4012的识别结果为均为该非纯色背景图像,则将抽取的视频帧图像,作为该预置帧图像;还用于若图像识别模块4012的识别结果为抽取的视频帧图像中有任一帧图像不是该非纯色背景图像,则将抽取的非纯色背景图像,作为该预置帧图像;

抽取模块4011,还用于确定抽取的纯色背景图像的数量,从该待识别视频文件中随机抽取对应数量的视频帧图像,并触发图像识别模块4012执行该识别抽取的视频帧图像是否均为该非纯色背景图像的步骤,直至抽取的所有视频帧图像均为该非纯色背景图像为止。

具体的,抽取模块4011分别从该待识别视频文件的头部、中部及后部中的至少任意一个位置,随机抽取预置数量的视频帧图像。然后,触发图像识别模块4012识别抽取的视频帧图像是否均为该非纯色背景图像。若图像识别模块4012的识别结果为均为该非纯色背景图像,则触发处理模块4013将抽取的视频帧图像,作为该预置帧图像。若图像识别模块4012的识别结果为抽取的视频帧图像中有任一帧图像不是该非纯色背景图像,则触发处理模块4013将抽取的非纯色背景图像,作为该预置帧图像。再然后,触发抽取模块4011确定抽取的纯色背景图像的数量,从该待识别视频文件中随机抽取对应数量的视频帧图像,并触发图像识别模块4012执行该识别抽取的视频帧图像是否均为该非纯色背景图像的步骤,直至抽取的所有视频帧图像均为该非纯色背景图像为止。

可以理解的,确定模块401也可通过抽取模块4011直接按照预置的位置,抽取对应的帧图像,如取视频文件的第100s(秒)及第1000s的两帧数据。

进一步地,识别模块303,还用于若判断模块302的判断结果为该预置帧图像最左端和最右端的像素点不符合该左右拼合的条件,和/或,该预置帧图像最上端和最下端的像素点不符合该上下收拢的条件,则确定该待识别视频文件为非全景视频。

具体的,若第一比较模块3022的判断结果为该预置帧图像最左端和最右端的像素点不符合该左右拼合的条件,和/或,第二比较模块3024的判断结果为该预置帧图像最上端和最下端的像素点不符合该上下收拢的条件,则识别模块303确定该待识别视频文件为非全景视频识别模块,并可进一步地,根据识别结果,切换到与识别结果对应的播放模式对待识别视频文件进行播放。如,如果待识别视频文件为全景视频,则切换到全景视频播放模式,对该待识别视频文件进行播放;如果待识别视频文件为非全景视频,则切换到普通视频播放模式,对该待识别视频文件进行播放。

本发明实施例提供的全景视频识别装置,通过选取待识别视频文件中预置帧图像的图像数据,然后根据预置帧图像的图像数据,判断预置帧图像最左端和最右端的像素点是否符合同一行的像素点一致的条件,以及,判断预置帧图像最上端和最下端的像素点是否一致,并当预置帧图像最左端和最右端的像素点符合同一行的像素点一致的条件,且,预置帧图像最上端和最下端的像素点一致时,确定待识别视频文件为全景视频,相较于现有技术,本发明实施例可在视频播放前自动快速识别待播放的视频是否为全景视频,并进而根据识别结果选择合适的播放模式,因此可简化视频播放操作,使得视频播放更为智能化。

在本申请所提供的几个实施例中,应该理解到,所揭露方法和装置,可以通过其它的方式实现。例如,以上所描述装置实施例仅仅是示意性的,例如,该模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。

该作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。

该集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例该方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。

以上为对本发明所提供的全景视频识别方法及装置的描述,对于本领域的技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1