一种生成3d媒体数据的方法和装置制造方法

文档序号:6620946阅读:287来源:国知局
一种生成3d媒体数据的方法和装置制造方法
【专利摘要】本发明的目的是提供一种生成3D媒体数据的方法和装置。根据本发明的方法包括以下步骤:确定所述初始媒体数据的内容类型;根据所述内容类型来确定与所述初始媒体数据对应的3D场景模型;根据所述与初始媒体数据对应的所述图像数据和所述3D场景模型,生成与所述初始媒体数据对应的3D媒体数据,以播放所述3D媒体数据。
【专利说明】一种生成3D媒体数据的方法和装置

【技术领域】
[0001]本发明涉及计算机【技术领域】,尤其涉及一种生成3D媒体数据的方法和装置。

【背景技术】
[0002]现有技术中,通常仅能获取基于3D数据源所生成的3D视频,然而,当前主流的视频信息仍然是2D视频,并且,由于视频数据量较大,而用户的需求则较为随机,将所有视频都进行3D转换处理以响应用户需求是不现实的。尤其在进行网络直播时,需要面对多种需求的用户,单一的将视频进行统一处理无法满足多种形式的用户需求。


【发明内容】

[0003]本发明的目的是提供一种生成3D媒体数据的方法和装置。
[0004]根据本发明的一个方面,提供了一种生成3D媒体数据的方法,其中,所述方法包括以下步骤:
[0005]a确定所述初始媒体数据的内容类型;
[0006]b根据所述内容类型来确定与所述初始媒体数据对应的3D场景模型;
[0007]c根据所述与初始媒体数据对应的所述图像数据和所述3D场景模型,生成与所述初始媒体数据对应的3D媒体数据,以播放所述3D媒体数据。
[0008]根据本发明的一个方面,还提供了一种生成3D媒体数据的播放装置,其中,所述播放装置包括以下步骤:
[0009]内容确定装置,用于确定所述初始媒体数据的内容类型;
[0010]模型确定装置,用于根据所述内容类型来确定与所述初始媒体数据对应的3D场景模型;
[0011]生成装置,用于根据所述与初始媒体数据对应的所述图像数据和所述3D场景模型,生成与所述初始媒体数据对应的3D媒体数据,以播放所述3D媒体数据。
[0012]与现有技术相比,本发明具有以下优点:根据媒体数据的内容类型确定对应的3D场景模型,以基于3D场景模型生成对应的3D媒体数据,提高了生成3D媒体数据的效率;并且,能够结合媒体数据的运动相关信息以及确定的3D场景模型,生成对应的3D媒体数据并播放,进一步提高了生成3D媒体数据的准确性。

【专利附图】

【附图说明】
[0013]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0014]图1示意出了根据本发明的一种生成3D媒体数据的方法流程图;
[0015]图2示意出了根据本发明的一种生成3D媒体数据的播放装置的结构示意图。
[0016]附图中相同或相似的附图标记代表相同或相似的部件。

【具体实施方式】
[0017]下面结合附图对本发明作进一步详细描述。
[0018]图1示意出了根据本发明的一种生成3D媒体数据的方法流程图。根据本发明的方法包括步骤S1、步骤S2和步骤S3。
[0019]其中,所述3D媒体数据包括但不限于以下任一种:
[0020]I)具有视差的左右眼图像对;
[0021]2)双目立体视频。
[0022]其中,根据本发明的方法通过包含于计算机设备中的播放装置来实现。所述计算机设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。所述计算机设备包括网络设备和/或用户设备。其中,所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。所述用户设备包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板、或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、PDA、游戏机、或IPTV等。其中,所述用户设备及网络设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
[0023]优选地,所述播放装置包含于用户设备中。
[0024]需要说明的是,所述用户设备、网络设备以及网络仅为举例,其他现有的或今后可能出现的用户设备、网络设备以及网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
[0025]参照图1,在步骤SI中,播放装置确定所述初始媒体数据的内容类型。
[0026]其中,所述初始媒体数据包括视频数据,例如,一段直播节目的视频或者一段电影视频等。
[0027]其中,所述初始媒体数据可对应于不同的内容类型。例如,一段电视节目视频可被分为“新闻”、“体育”或“综艺”等内容类型。
[0028]优选地,所述内容类型基于所述初始媒体数据中所播放的内容的场景信息来确定其分类,例如,对应于体育比赛的初始媒体数据可被分为足球赛类型、棒球赛类型、网球赛类型等等,又例如,对应于综艺节目的初始媒体数据可被分为谈话类型、选秀类型等等。
[0029]其中,播放装置确定所述初始媒体数据的内容类型的方式包括但不限于以下任一种:
[0030]I)直接获取初始媒体数据预定的内容类型信息;
[0031]2)将初始媒体数据的相关信息与预定的内容类型进行匹配,以确定与该初始媒体数据对应的内容类型。例如,初始媒体数据是一段直播节目的视频,则将该直播节目的名称与预定的内容类型进行匹配,以得到该视频对应的内容类型。
[0032]根据本发明的第一示例,初始媒体数据是一段时长为I分钟的直播视频stream_l,播放装置获取该视频的视频简介,确定该视频的内容类型为“棒球比赛”。
[0033]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何确定所述初始媒体数据的内容类型的实现方式,均应包含在本发明的范围内。
[0034]接着,在步骤S2中,播放装置根据所述内容类型来确定与所述初始媒体数据对应的3D场景模型。
[0035]具体地,所述播放装置根据所述内容类型,来查询并获取与所述内容类型对应的至少一个3D场景模型,并由该至少一个3D场景模型中选择与所述初始媒体数据对应的3D场景模型。
[0036]其中,所述3D场景模型包括用于预测初始媒体数据的图像数据对应的深度信息的模型。
[0037]其中,所述3D场景模型可基于对多个媒体数据执行机器学习过程来得到。例如,通过获取内容类型为“足球比赛”的视频的图像数据及其确定的深度信息并执行相应的机器学习过程来建立与内容类型“足球比赛”对应的3D场景模型,以基于媒体数据信息来输出相应的3D媒体数据的3D场景模型。
[0038]继续对前述第一示例进行说明,播放装置在3D场景模型数据库中查询并获得与初始媒体数据stream_l的内容类型“棒球比赛”对应的3D场景模型model_l。
[0039]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述内容类型来确定与所述初始媒体数据对应的3D场景模型的实现方式,均应包含在本发明的范围内。
[0040]接着,在步骤S3中,播放装置根据所述与初始媒体数据对应的所述图像数据和所述3D场景模型,生成与所述初始媒体数据对应的3D媒体数据,以播放所述3D媒体数据。
[0041]优选地,所述步骤S3进一步包括步骤S301 (图未示)和步骤S302(图未示)。
[0042]在步骤S301中,播放装置根据与所述初始媒体数据对应的所述图像数据来获取相应的运动相关信息。
[0043]其中,所述图像数据包括但不限于以下任一种:
[0044]I)所述初始媒体数据中的各个帧数据;
[0045]2)通过对初始媒体数据中的各个帧数据进行处理后所获得的一项或多项图像数据;例如,通过在相邻帧之间自动进行块的匹配,以将匹配获得的、具有相似块的一个或多个帧作为一项图像数据等。
[0046]优选地,所述运动相关信息包括但不限于以下至少任一项信息:
[0047]I)场景运动信息;其中,所述场景包括图像数据中所能识别的一个或多个分割区块。
[0048]例如,通过比较多个图像数据中分割区块的变化来分别获取该各个分割区块的运动信息等。
[0049]2)与所述图像数据中的至少一项物体对应的物体运动信息。
[0050]例如,通过识别图像数据中所包含的一个或多个物体,并比较该一个或多个物体分别在多个图像数据中的位置信息,来确定该物体的运动信息等。
[0051]继续对前述第一示例进行说明,播放装置提取该视频的视频帧作为图像数据并基于各个视频帧中的图形将其划分为若干分割区,并通过比较各个视频中该各个分割区的位置变化,来划分视频帧中的静止区域与运动区域,并确定运动区域的运动相关信息。
[0052]接着,在步骤S302中,播放装置根据所述运动相关信息以及所述3D场景模型信息来生成与所述初始媒体数据对应的3D媒体数据,以播放所述3D媒体数据。
[0053]优选地,所述步骤302进一步包括步骤S3021 (图未示)和步骤S3022 (图未示)。
[0054]在步骤S3021中,播放装置根据所述运动参数信息和所述3D场景模型,获取与所述图像数据对应的深度信息。
[0055]优选地,对于每个图像,播放装置通过利用所述3D场景模型对所述图像数据的运动参数信息进行处理,以获得与该图像数据对应的深度信息。
[0056]其中,所述播放装置可利用所述3D场景模型,采用多种技术,如基于运动特征的深度估计(DFM, depth from mot1n)技术等,基于所输入的图像数据以及相应的运动相关信息来获取与该图像数据对应的深度信息。
[0057]需要说明的是,本领域技术人员可根据实际情况和需求,选择其他合适的方法来获取所述深度信息,而不限于说明书中提到的方法。
[0058]接着,在步骤S3022中,播放装置根据所获得的深度信息来生成包含具有所述深度信息的图像数据的、与所述初始媒体数据对应的3D媒体数据。
[0059]具体地,播放装置直接将具有所述深度信息的图像数据作为3D媒体数据;或者,播放装置将所述具有所述深度信息的图像数据与所述初始媒体数据的音频数据进行同步,以生成所述3D媒体数据。
[0060]继续对前述第一示例进行说明,在步骤S3021中,播放装置将该图像数据作为3D场景模型model_l的输入,得到每个图像中的天空、地面等静止区域对应的深度信息。并且,播放装置利用该3D场景模型model_l,采用DFM技术,基于该图像数据中的运动区域的运动相关信息,来得到每个图像中棒球选手、棒球等运动区域对应的深度信息。接着,在步骤S3022中,播放装置根据得到的与图像数据对应的深度信息来生成包含具有所述深度信息的图像数据的、与该视频对应的3D媒体数据。
[0061]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述运动相关信息以及所述3D场景模型信息来生成与所述初始媒体数据对应的3D媒体数据,以播放所述3D媒体数据的实现方式,均应包含在本发明的范围内。
[0062]优选地,所述方法还包括步骤S4 (图未示)和步骤S5 (图未示)。
[0063]在步骤S4中,当播放直播媒体数据时,播放装置将所述直播媒体数据在预定历史时间段的部分媒体数据作为初始媒体数据。
[0064]在执行完步骤SI至步骤S3后,在步骤S5中,播放装置将与所述初始媒体数据对应的3D媒体数据与所述直播媒体数据同时进行播放。
[0065]例如,播放直播媒体数据时,播放装置在步骤S4中将该直播媒体数据在过去5分钟的媒体数据作为初始媒体数据。接着,播放装置执行步骤SI至步骤S3,以生成与该初始媒体数据对应的3D媒体数据。接着,在步骤S5中,播放装置将已生成的3D媒体数据和直播媒体数据同时进行播放。
[0066]根据本发明的方法,根据媒体数据的内容类型确定对应的3D场景模型,以基于3D场景模型生成对应的3D媒体数据,提高了生成3D媒体数据的效率;并且,能够结合媒体数据的运动相关信息以及确定的3D场景模型,生成对应的3D媒体数据并播放,进一步提高了生成3D媒体数据的准确性。
[0067]图2示意出了根据本发明的一种生成3D媒体数据的播放装置的结构示意图。根据本发明的播放装置包括内容确定装置1、模型确定装置2和生成装置3。
[0068]参照图2,内容确定装置I确定所述初始媒体数据的内容类型。
[0069]其中,所述初始媒体数据包括视频数据,例如,一段直播节目的视频或者一段电影视频等。
[0070]其中,所述初始媒体数据可对应于不同的内容类型。例如,一段电视节目视频可被分为“新闻”、“体育”或“综艺”等内容类型。
[0071]优选地,所述内容类型基于所述初始媒体数据中所播放的内容的场景信息来确定其分类,例如,对应于体育比赛的初始媒体数据可被分为足球赛类型、棒球赛类型、网球赛类型等等,又例如,对应于综艺节目的初始媒体数据可被分为谈话类型、选秀类型等等。
[0072]其中,内容确定装置I确定所述初始媒体数据的内容类型的方式包括但不限于以下任一种:
[0073]I)直接获取初始媒体数据预定的内容类型信息;
[0074]2)将初始媒体数据的相关信息与预定的内容类型进行匹配,以确定与该初始媒体数据对应的内容类型。例如,初始媒体数据是一段直播节目的视频,则将该直播节目的名称与预定的内容类型进行匹配,以得到该视频对应的内容类型。
[0075]根据本发明的第一示例,初始媒体数据是一段时长为I分钟的直播视频stream_l,内容确定装置I获取该视频的视频简介,确定该视频的内容类型为“棒球比赛”。
[0076]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何确定所述初始媒体数据的内容类型的实现方式,均应包含在本发明的范围内。
[0077]接着,模型确定装置2根据所述内容类型来确定与所述初始媒体数据对应的3D场景模型。
[0078]具体地,模型确定装置2根据所述内容类型,来查询并获取与所述内容类型对应的至少一个3D场景模型,并由该至少一个3D场景模型中选择与所述初始媒体数据对应的3D场景模型。
[0079]其中,所述3D场景模型包括用于预测初始媒体数据的图像数据对应的深度信息的模型。
[0080]其中,所述3D场景模型可基于对多个媒体数据执行机器学习过程来得到。例如,通过获取内容类型为“足球比赛”的视频的图像数据及其确定的深度信息并执行相应的机器学习过程来建立与内容类型“足球比赛”对应的3D场景模型,以基于媒体数据信息来输出相应的3D媒体数据的3D场景模型。
[0081 ] 继续对前述第一示例进行说明,模型确定装置2在3D场景模型数据库中查询并获得与初始媒体数据stream_l的内容类型“棒球比赛”对应的3D场景模型model_l。
[0082]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述内容类型来确定与所述初始媒体数据对应的3D场景模型的实现方式,均应包含在本发明的范围内。
[0083]接着,生成装置3根据所述与初始媒体数据对应的所述图像数据和所述3D场景模型,生成与所述初始媒体数据对应的3D媒体数据,以播放所述3D媒体数据。
[0084]优选地,所述生成装置3进一步包括运动获取装置(图未示)和立体生成装置(图未不)O
[0085]其中,获取装置根据与所述初始媒体数据对应的所述图像数据来获取相应的运动相关信息。
[0086]其中,所述图像数据包括但不限于以下任一种:
[0087]I)所述初始媒体数据中的各个帧数据;
[0088]2)通过对初始媒体数据中的各个帧数据进行处理后所获得的一项或多项图像数据;例如,通过在相邻帧之间自动进行块的匹配,以将匹配获得的、具有相似块的一个或多个帧作为一项图像数据等。
[0089]优选地,所述运动相关信息包括但不限于以下至少任一项信息:
[0090]I)场景运动信息;其中,所述场景包括图像数据中所能识别的一个或多个分割区块。
[0091]例如,通过比较多个图像数据中分割区块的变化来分别获取该各个分割区块的运动信息等。
[0092]2)与所述图像数据中的至少一项物体对应的物体运动信息。
[0093]例如,通过识别图像数据中所包含的一个或多个物体,并比较该一个或多个物体分别在多个图像数据中的位置信息,来确定该物体的运动信息等。
[0094]继续对前述第一示例进行说明,播放装置提取该视频的视频帧作为图像数据并基于各个视频帧中的图形将其划分为若干分割区,则获取装置通过比较各个视频中该各个分割区的位置变化,来划分视频帧中的静止区域与运动区域,并确定运动区域的运动相关信肩、O
[0095]接着,立体生成装置根据所述运动相关信息以及所述3D场景模型信息来生成与所述初始媒体数据对应的3D媒体数据,以播放所述3D媒体数据。
[0096]优选地,所述立体生成装置进一步包括深度获取装置(图未示)和子生成装置(图未示)。
[0097]其中,深度获取装置根据所述运动参数信息和所述3D场景模型,获取与所述图像数据对应的深度信息。
[0098]优选地,对于每个图像,深度获取装置通过利用所述3D场景模型对所述图像数据的运动参数信息进行处理,以获得与该图像数据对应的深度信息。
[0099]其中,所述深度获取装置可利用所述3D场景模型,采用多种技术,如基于运动特征的深度估计(DFM, depth from mot1n)技术等,基于所输入的图像数据以及相应的运动相关信息来获取与该图像数据对应的深度信息。
[0100]需要说明的是,本领域技术人员可根据实际情况和需求,选择其他合适的方法来获取所述深度信息,而不限于说明书中提到的方法。
[0101]接着,子生成装置根据所获得的深度信息来生成包含具有所述深度信息的图像数据的、与所述初始媒体数据对应的3D媒体数据。
[0102]具体地,子生成装置直接将具有所述深度信息的图像数据作为3D媒体数据;或者,子生成装置将所述具有所述深度信息的图像数据与所述初始媒体数据的音频数据进行同步,以生成所述3D媒体数据。
[0103]继续对前述第一示例进行说明,深度获取装置将该图像数据作为3D场景模型model_l的输入,得到每个图像中的天空、地面等静止区域对应的深度信息。并且,深度获取装置利用该3D场景模型model_l,采用DFM技术,基于该图像数据中的运动区域的运动相关信息,来得到每个图像中棒球选手、棒球等运动区域对应的深度信息。接着,子生成装置根据得到的与图像数据对应的深度信息来生成包含具有所述深度信息的图像数据的、与该视频对应的3D媒体数据。
[0104]需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述运动相关信息以及所述3D场景模型信息来生成与所述初始媒体数据对应的3D媒体数据,以播放所述3D媒体数据的实现方式,均应包含在本发明的范围内。
[0105]优选地,所述播放装置还包括数据获取装置(图未示)和同步播放装置(图未示)O
[0106]当播放直播媒体数据时,数据获取装置将所述直播媒体数据在预定历史时间段的部分媒体数据作为初始媒体数据。
[0107]在播放装置执行完确定所述初始媒体数据的内容类型的操作至根据所述与初始媒体数据对应的所述图像数据和所述3D场景模型,生成与所述初始媒体数据对应的3D媒体数据的操作后,同步播放装置将与所述初始媒体数据对应的3D媒体数据与所述直播媒体数据同时进行播放。
[0108]例如,播放直播媒体数据时,播放装置在步骤S4中将该直播媒体数据在过去5分钟的媒体数据作为初始媒体数据。接着,播放装置执行确定所述初始媒体数据的内容类型的操作至根据所述与初始媒体数据对应的所述图像数据和所述3D场景模型,生成与所述初始媒体数据对应的3D媒体数据的操作,以生成与该初始媒体数据对应的3D媒体数据。接着,同步播放装置将已生成的3D媒体数据和直播媒体数据同时进行播放。
[0109]根据本发明的方案,根据媒体数据的内容类型确定对应的3D场景模型,以基于3D场景模型生成对应的3D媒体数据,提高了生成3D媒体数据的效率;并且,能够结合媒体数据的运动相关信息以及确定的3D场景模型,生成对应的3D媒体数据并播放,进一步提高了生成3D媒体数据的准确性。
[0110]本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个功能或步骤的电路。
[0111]另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
[0112]对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此夕卜,显然“包括” 一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
【权利要求】
1.一种生成3D媒体数据的方法,其中,所述方法包括以下步骤: a确定所述初始媒体数据的内容类型; b根据所述内容类型来确定与所述初始媒体数据对应的3D场景模型;c根据所述与初始媒体数据对应的所述图像数据和所述3D场景模型,生成与所述初始媒体数据对应的3D媒体数据,以播放所述3D媒体数据。
2.根据权利要求1所述的方法,其中,所述步骤c包括以下步骤: Cl根据与所述初始媒体数据对应的所述图像数据来获取相应的运动相关信息;c2根据所述运动相关信息以及所述3D场景模型信息来生成与所述初始媒体数据对应的3D媒体数据,以播放所述3D媒体数据。
3.根据权利要求2所述的方法,其中,所述运动相关信息包括以下至少任一项信息: -场景运动息; -与所述图像数据中的至少一项物体对应的物体运动信息。
4.根据权利要求2或3所述的方法,其中,所述步骤c2包括以下步骤: c21根据所述运动参数信息和所述3D场景模型,获取与所述图像数据对应的深度信息; c22根据所获得的深度信息来生成包含具有所述深度信息的图像数据的、与所述初始媒体数据对应的3D媒体数据。
5.根据权利要求4所述的方法,其中,所述步骤c22包括以下步骤: -将所述具有所述深度信息的图像数据与所述初始媒体数据的音频数据进行同步,以生成所述3D媒体数据。
6.根据权利要求1至5中任一项所述的方法,其中,所述方法在步骤a之前还包括以下步骤: -当播放直播媒体数据时,将所述直播媒体数据在预定历史时间段的部分媒体数据作为初始媒体数据; 其中,所述方法还包括以下步骤: -将与所述初始媒体数据对应的3D媒体数据与所述直播媒体数据同时进行播放。
7.根据权利要求1至6中任一项所述的方法,其中,所述3D媒体数据包括以下任一种: -具有视差的左右眼图像对; -双目立体视频。
8.根据权利要求1至7中任一项所述的方法,其中,所述方法由用户设备执行。
9.一种生成3D媒体数据的播放装置,其中,所述播放装置包括以下步骤: 内容确定装置,用于确定所述初始媒体数据的内容类型; 模型确定装置,用于根据所述内容类型来确定与所述初始媒体数据对应的3D场景模型; 生成装置,用于根据所述与初始媒体数据对应的所述图像数据和所述3D场景模型,生成与所述初始媒体数据对应的3D媒体数据,以播放所述3D媒体数据。
10.根据权利要求9所述的播放装置,其中,所述生成装置包括: 运动获取装置,用于根据与所述初始媒体数据对应的所述图像数据来获取相应的运动相关信息; 立体生成装置,用于根据所述运动相关信息以及所述3D场景模型信息来生成与所述初始媒体数据对应的3D媒体数据,以播放所述3D媒体数据。
11.根据权利要求10所述的播放装置,其中,所述运动相关信息包括以下至少任一项信息: -场景运动息; -与所述图像数据中的至少一项物体对应的物体运动信息。
12.根据权利要求10或11所述的播放装置,其中,所述立体生成装置包括: 深度获取装置,用于根据所述运动参数信息和所述3D场景模型,获取与所述图像数据对应的深度信息; 子生成装置,用于根据所获得的深度信息来生成包含具有所述深度信息的图像数据的、与所述初始媒体数据对应的3D媒体数据。
13.根据权利要求12所述的播放装置,其中,所述子生成装置还用于: 将所述具有所述深度信息的图像数据与所述初始媒体数据的音频数据进行同步,以生成所述3D媒体数据。
14.根据权利要求9至13中任一项所述的播放装置,其中,播放装置还包括: 数据获取装置,用于当播放直播媒体数据时,将所述直播媒体数据在预定历史时间段的部分媒体数据作为初始媒体数据; 其中,所述播放装置还包括: 同步播放装置,用于将与所述初始媒体数据对应的3D媒体数据与所述直播媒体数据同时进行播放。
15.根据权利要求9至14中任一项所述的播放装置,其中,所述3D媒体数据包括以下任一种: -具有视差的左右眼图像对; -双目立体视频。
16.根据权利要求9至15中任一项所述的方法,其中,所述播放装置包含于用户设备中。
【文档编号】G06F17/30GK104185008SQ201410350305
【公开日】2014年12月3日 申请日期:2014年7月22日 优先权日:2014年7月22日
【发明者】李渊, 王文杰 申请人:上海聚力传媒技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1