识别3D格式视频的方法及装置与流程

文档序号：11524652阅读：201来源：国知局

本发明涉及数据处理领域，具体而言，涉及一种识别3d格式视频的方法及装置。

背景技术：

随着社会的快速发展，人们观看视频的方式发生了很大的改变，越来越倾向于观看3d视频。但是由于3d视频的格式有多种，目前的播放器无法做到在播放前自动识别待播放3d视频为何种3d格式，格式识别错误会导致对当前视频进行错误的解码和播放，用户体验较差。

技术实现要素：

有鉴于此，本发明实施例的目的在于提供一种识别3d格式视频的方法及装置，以解决上述问题。

为了实现上述目的，本发明实施例采用的技术方案如下：

第一方面，本发明实施例提供了一种识别3d格式视频的方法，该方法判定获取的视频流数据中是否包括配置文件；若所述视频流数据中包括所述配置文件，则读取所述配置文件中的配置信息，根据所述配置信息，获得所述视频流数据的格式；若所述视频流数据中不包括所述配置文件，则获取所述视频流数据的第一帧画面，将所述第一帧画面按照第一方式划分为第一画面及第二画面；将所述第一画面再次进行划分，获得多个第一子画面；将所述第二画面按照相同的方式再次进行划分，获得多个第二子画面；分别计算所述第一画面中的各个所述第一子画面与所述第二画面中相应位置处的所述第二子画面的相似度；计算所述相似度大于第一阈值的第一统计个数，若所述第一统计个数大于或等于第二阈值，则所述视频流数据的格式为以第一格式存储的3d视频。

第二方面，本发明实施例提供了一种识别3d格式视频的装置，该装置包括：判定模块，用于判定获取的视频流数据中是否包括配置文件；第一处理模块，用于若所述视频流数据中包括所述配置文件，则读取所述配置文件中的配置信息，根据所述配置信息，获得所述视频流数据的格式；第二处理模块，用于若所述视频流数据中不包括所述配置文件，则获取所述视频流数据的第一帧画面，将所述第一帧画面按照第一方式划分为第一画面及第二画面；将所述第一画面再次进行划分，获得多个第一子画面；将所述第二画面按照相同的方式再次进行划分，获得多个第二子画面；分别计算所述第一画面中的各个所述第一子画面与所述第二画面中相应位置处的所述第二子画面的相似度；计算所述相似度大于第一阈值的第一统计个数，若所述第一统计个数大于或等于第二阈值，则所述视频流数据的格式为以第一格式存储的3d视频。

与现有技术相比，本发明实施例提供的一种识别3d格式视频的方法及装置，通过判定获取的视频流数据中是否包括配置文件，若所述视频流数据中包括所述配置文件，则读取所述配置文件中的配置信息，根据所述配置信息，获得所述视频流数据的格式，若所述视频流数据中不包括所述配置文件，则获取所述视频流数据的第一帧画面，将所述第一帧画面按照第一方式划分为第一画面及第二画面；将所述第一画面再次进行划分，获得多个第一子画面；将所述第二画面按照相同的方式再次进行划分，获得多个第二子画面；分别计算所述第一画面中的各个所述第一子画面与所述第二画面中相应位置处的所述第二子画面的相似度；计算所述相似度大于第一阈值的第一统计个数，若所述第一统计个数大于或等于第二阈值，则所述视频流数据的格式为以第一格式存储的3d视频，通过这种方式，实现了能够在播放前自动识别当前待播放的3d视频为何种3d格式，并且使得播放器能够根据识别的结果，对当前视频进行正确的解码和播放，提高了用户体验。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1是本发明实施例提供的用户终端的结构框图。

图2是本发明实施例提供的一种识别3d格式视频的方法的流程图。

图3是本发明实施例提供的一种将第一帧画面按照两次划分后的示意图。

图4是本发明实施例提供的一种识别3d格式视频的方法的部分流程图。

图5是本发明实施例提供的第一帧画面第一次划分方式的示意图。

图6是本发明实施例提供的一种识别3d格式视频的方法的另一部分流程图。

图7是本发明实施例提供的一种识别3d格式视频的装置的结构框图。

具体实施方式

下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本发明的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

图1示出了一种可应用于本发明实施例中的用户终端100的结构框图。如图1所示，用户终端100包括存储器102、存储控制器104，一个或多个(图中仅示出一个)处理器106、外设接口108、射频模块110、音频模块112、触控屏幕114等。这些组件通过一条或多条通讯总线/信号线116相互通讯。

存储器102可用于存储软件程序以及模块，如本发明实施例中的识别3d格式视频的方法以及装置对应的程序指令/模块，处理器106通过运行存储在存储器102内的软件程序以及模块，从而执行各种功能应用以及数据处理，如本发明实施例提供的识别3d格式视频的方法。

存储器102可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。处理器106以及其他可能的组件对存储器102的访问可在存储控制器104的控制下进行。

外设接口108将各种输入/输出装置耦合至处理器106以及存储器102。在一些实施例中，外设接口108，处理器106以及存储控制器104可以在单个芯片中实现。在其他一些实例中，他们可以分别由独立的芯片实现。

射频模块110用于接收以及发送电磁波，实现电磁波与电信号的相互转换，从而与通讯网络或者其他设备进行通讯。

音频模块112向用户提供音频接口，其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。

触控屏幕114在用户终端100与用户之间同时提供一个输出及输入界面。具体地，触控屏幕114向用户显示视频输出，这些视频输出的内容可包括文字、图形、视频及其任意组合。

可以理解，图1所示的结构仅为示意，用户终端100还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。

于本发明实施例中，用户终端100中安装有客户端，该客户端可以是第三方应用软件，如解码器或播放器，为用户提供解码或播放视频的服务。

图2示出了本发明实施例提供的一种识别3d格式视频的方法的流程图，请参阅图2，本实施例描述的是用户终端的处理流程，所述方法包括：

步骤s210，判定获取的视频流数据中是否包括配置文件。

若所述视频流数据中包括所述配置文件，则执行步骤s220；若所述视频流数据中不包括所述配置文件，则执行步骤s230至步骤s260。

步骤s220，读取所述配置文件中的配置信息，根据所述配置信息，获得所述视频流数据的格式。

作为一种实施方式，视频流数据中包含了一个配置文件，且该配置文件中的配置信息中存在一个字段是用于显示该视频流数据的格式，则直接读取并解析该字段，便能获得所述视频流数据的格式。

可以理解的是，通过这种方式，能够很快的识别视频流数据的格式，并进一步使得播放器能够根据识别的结果，更快的完成对当前视频进行正确的解码和播放，提高了用户体验。

步骤s230，获取所述视频流数据的第一帧画面，将所述第一帧画面按照第一方式划分为第一画面及第二画面。

所述第一方式的实施方式有多种，作为一种实施方式，所述第一方式包括：将所述第一帧画面进行左右均分。作为另一种实施方式，所述第一方式包括：将所述第一帧画面进行上下均分。

步骤s240，将所述第一画面再次进行划分，获得多个第一子画面；将所述第二画面按照相同的方式再次进行划分，获得多个第二子画面。

其中，再次进行划分的方式也有多种，例如，四等分，八等分，十六等分等，并不局限于此。

下面以第一划分方式为左右均分来进行详细说明。请参阅图3，将第一帧画面270首先左右均分，获得第一画面271及第二画面272。然后，再次将第一画面271及第二画面272按照相同的方式再次进行划分，如图3中所示，将第一画面271四等分为4个第一子画面，分别为第一子画面2711，第一子画面2712，第一子画面2713及第一子画面2714；将第二画面272四等分为4个第二子画面，分别为第二子画面2721，第二子画面2722，第二子画面2723及第二子画面2724。

步骤s250，分别计算所述第一画面中的各个所述第一子画面与所述第二画面中相应位置处的所述第二子画面的相似度。

计算第一子画面与第二子画面的相似度的实施方式很多，例如，可以分别计算第一子画面的直方图hista，及第二子画面的直方图histb，然后计算两个直方图的归一化相关系数，如巴氏距离，直方图相交距离等，将该归一化相关系数作为第一子画面与第二子画面的相似度。

请参阅图3，下面以图3继续进行说明。分别计算第一子画面2711与第二子画面2721的相似度sim1；计算第一子画面2712与第二子画面2722的相似度sim2；计算第一子画面2713与第二子画面2723的相似度sim3；计算第一子画面2714与第二子画面2724的相似度sim4。当然，可以理解的是，也可以采用并行计算的方式，同时计算出sim1至sim4。

步骤s260，计算所述相似度大于第一阈值的第一统计个数，若所述第一统计个数大于或等于第二阈值，则所述视频流数据的格式为以第一格式存储的3d视频。

第一阈值及第二阈值的实施方式很多，可以根据用户的需求设置，也可以根据第一画面及第二画面的再次划分方式进行设置。

继续上例进行说明。分别判断sim1至sim4是否大于第一阈值，若大于第一阈值，则将第一统计个数加1。假设此时第一统计个数的值为3，且第二阈值为3，则此时所述视频流数据的格式为以第一格式存储的3d视频。可以理解的是，由于图3所示的第一帧画面270的第一划分方式为左右划分，则此时该视频流数据的格式为左右格式。若第一帧画面270的第一划分方式为上下划分，则此时该视频流数据的格式为上下格式。

作为一种所述方式，请参阅图4，该方法还包括：

步骤s310，若所述第一统计个数小于第二阈值，将所述第一帧画面按照第二方式划分为第三画面及第四画面。

请参阅图5，若所述第一划分方式为左右均分(如图5所示左上角)且所述第一统计个数小于第二阈值，则第二划分方式可以为上下均分(如图5所示右上角)。若所述第一划分方式为上下均分(如图5所示右上角)且所述第一统计个数小于第二阈值，则第二划分方式可以为左右均分(如图5所示左上角)。

步骤s320，将所述第三画面再次进行划分，获得多个第三子画面。

步骤s330，将所述第四画面按照相同的方式再次进行划分，获得多个第四子画面。

步骤s340，分别计算所述第三画面中的各个所述第三子画面与所述第四画面中相应位置处的所述第四子画面的相似度。

步骤s350，计算所述相似度大于第一阈值的第二统计个数，若所述第二统计个数大于或等于第二阈值，则所述视频流数据的格式为以第二格式存储的3d格式视频。

作为一种实施方式，若第二划分方式为上下均分，则此时识别出的视频流数据的格式为上下格式的3d视频。

步骤s320至步骤s350的实施方式与上述步骤s240至步骤s260的实施方式相同，此处不再赘述。

进一步的，作为一种所述方式，请参阅图6，该方法还包括：

步骤s410，若所述第二统计个数小于第二阈值，将所述第一帧画面按照第三方式划分为多个第一划分画面。

请参阅图5，若第一划分方式及第二划分均无法识别出该视频数据，则可以采用第三划分方式，作为一种实施方式，所述第三方式包括：将所述第一帧画面进行九宫格划分，即如图5中的第二排所示的划分方式，将该第一帧画面按照九宫格进行划分。

步骤s420，将每个所述第一划分画面再次进行划分，获得多个第二划分画面。

步骤s430，分别计算每个所述第一划分画面中的各个所述第二划分画面与剩余的所述第一划分画面中相应位置处的所述第二划分画面的相似度。

步骤s440，分别计算每个所述第一划分画面中的各个所述第二划分画面与剩余的所述第一划分画面中相应位置处的所述第二划分画面的相似度大于第一阈值的第三统计个数。

步骤s420至步骤s440的实施方式与上述步骤s240至步骤s260的实施方式相同，此处不再赘述。

步骤s450，若所述第三统计个数大于或等于第二阈值，则将第四统计值更新，若所述第四统计值大于或等于第三阈值，则所述视频流数据的格式为以第三格式存储的的3d格式视频。

该第四统计值的初始值为0，每当所述第三统计个数大于或等于第二阈值，即每当出现两个第一划分画面相似时，第四统计值加一，可以理解的是，该第四统计值用于统计将第一帧画面划分后的多个第一划分画面中出现每两个第一划分画面相似的次数。

第三阈值的实施方式可以有很多，可以用户的需求进行设置，并且设置的不同，其对应的3d格式视频也可以不同，作为一种实施方式，若第三阈值为7，则该3d格式视频为八视图格式(图5中第二排后面两个图所示)，若第三阈值为8，则该3d格式视频为九宫格格式。

进一步的，若所述第四统计值小于第三阈值，则所述视频流数据的格式为二维视频。

本发明实施例提供的识别3d格式视频的方法，通过判定获取的视频流数据中是否包括配置文件，若所述视频流数据中包括所述配置文件，则读取所述配置文件中的配置信息，根据所述配置信息，获得所述视频流数据的格式，若所述视频流数据中不包括所述配置文件，则获取所述视频流数据的第一帧画面，将所述第一帧画面按照第一方式划分为第一画面及第二画面；将所述第一画面再次进行划分，获得多个第一子画面；将所述第二画面按照相同的方式再次进行划分，获得多个第二子画面；分别计算所述第一画面中的各个所述第一子画面与所述第二画面中相应位置处的所述第二子画面的相似度；计算所述相似度大于第一阈值的第一统计个数，若所述第一统计个数大于或等于第二阈值，则所述视频流数据的格式为以第一格式存储的3d视频，通过这种方式，实现了能够在播放前自动识别当前待播放的3d视频为何种3d格式，并且使得播放器能够根据识别的结果，对当前视频进行正确的解码和播放，提高了用户体验。

请参阅图7，是本发明实施例提供的识别3d格式视频的装置500的功能模块示意图。所述识别3d格式视频的装置500运行于用户终端100。所述识别3d格式视频的装置500包括判定模块510，第一处理模块520、及第二处理模块530。

判定模块510，用于判定获取的视频流数据中是否包括配置文件。

第一处理模块520，用于若所述视频流数据中包括所述配置文件，则读取所述配置文件中的配置信息，根据所述配置信息，获得所述视频流数据的格式。

第二处理模块530，用于若所述视频流数据中不包括所述配置文件，则获取所述视频流数据的第一帧画面，将所述第一帧画面按照第一方式划分为第一画面及第二画面；将所述第一画面再次进行划分，获得多个第一子画面；将所述第二画面按照相同的方式再次进行划分，获得多个第二子画面；分别计算所述第一画面中的各个所述第一子画面与所述第二画面中相应位置处的所述第二子画面的相似度；计算所述相似度大于第一阈值的第一统计个数，若所述第一统计个数大于或等于第二阈值，则所述视频流数据的格式为以第一格式存储的3d视频。

作为一种实施方式，所述第一方式包括：将所述第一帧画面进行左右均分，所述第一格式为左右格式。

作为一种实施方式，所述装置还包括第三处理模块540，用于若所述第一统计个数小于第二阈值，将所述第一帧画面按照第二方式划分为第三画面及第四画面；将所述第三画面再次进行划分，获得多个第三子画面；将所述第四画面按照相同的方式再次进行划分，获得多个第四子画面；分别计算所述第三画面中的各个所述第三子画面与所述第四画面中相应位置处的所述第四子画面的相似度；计算所述相似度大于第一阈值的第二统计个数，若所述第二统计个数大于或等于第二阈值，则所述视频流数据的格式为以第二格式存储的3d格式视频。

作为一种实施方式，所述第二方式包括：将所述第一帧画面进行上下均分，所述第二格式为上下格式。

作为一种实施方式，所述装置还包括第四处理模块550，用于若所述第二统计个数小于第二阈值，将所述第一帧画面按照第三方式划分为多个第一划分画面；将每个所述第一划分画面再次进行划分，获得多个第二划分画面；分别计算每个所述第一划分画面中的各个所述第二划分画面与剩余的所述第一划分画面中相应位置处的所述第二划分画面的相似度；分别计算每个所述第一划分画面中的各个所述第二划分画面与剩余的所述第一划分画面中相应位置处的所述第二划分画面的相似度大于第一阈值的第三统计个数，若所述第三统计个数大于或等于第二阈值，则将第四统计值更新；若所述第四统计值大于或等于第三阈值，则所述视频流数据的格式为以第三格式存储的的3d格式视频。

作为一种实施方式，所述第三方式包括：将所述第一帧画面进行九宫格划分，所述第三格式为九宫格格式的形式或八视图格式。

作为一种实施方式，所述装置还包括第五处理模块560，用于若所述第四统计值小于第三阈值，则判定所述视频流数据的格式为二维视频。

以上各模块可以是由软件代码实现，此时，上述的各模块可存储于用户终端100的存储器102内。以上各模块同样可以由硬件例如集成电路芯片实现。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本发明实施例所提供的识别3d格式视频的装置，其实现原理及产生的技术效果和前述方法实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read－onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张春光;顾开宇;李应樵;王华波;许泽山
技术所有人：宁波万维显示科技有限公司
我是此专利的发明人

上一篇：一种同步传输IMU数据和图像数据的方法及系统与流程
上一篇：一种基于H265引入视差补偿的立体视频编码方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。