发信号通知用于串流视频数据的随机存取点的制作方法

文档序号:7884516阅读:110来源:国知局
专利名称:发信号通知用于串流视频数据的随机存取点的制作方法
技术领域
本发明涉及经编码视频数据的输送。
背景技术
数字视频能力可并入到广泛范围的装置中,包括数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置等。数字视频装置实施视频压缩技术(例如,由MPEG-2、MPEG-4、ITU-T H. 263或ITU-T H. 264/MPEG-4第10部分高级视频译码(AVC)所定义的标准以及这些标准的扩展中所描述的视频压缩技术),以较有效地发射和接收数字视频信息。视频压缩技术执行空间预测和/或时间预测,以减少或移除视频序列中所固有的冗余。对于基于块的视频译码来说,可将视频帧或切片分割为多个宏块。可进一步分割每一宏块。使用相对于相邻宏块的空间预测来编码经帧内译码(I)帧或切片中的宏块。经帧间译码(P或B)帧或切片中的宏块可使用相对于同一帧或切片中的相邻宏块的空间预测或相对于其它参考帧的时间预测。一直在努力开发出基于H.264/AVC的新视频译码标准。一个此类标准为可缩放视频译码(SVC)标准,其为H.264/AVC的可缩放扩展。另一标准为多视图视频译码(MVC)标准,其已变成H. 264/AVC的多视图扩展。AVC标准的版本描述于JVT-AD007的“对ITU-TRec. H. 264 IIS0/IEC 14496-10 高级视频译码的编者修正草案-为 ITU-T SG 16 AAP同意做准备(以综合形式)(Editors' draft revision to ITU-T Rec. Η. 264 | IS0/IEC14496-lOAdvanced Video Coding-1n preparation for ITU-T SG 16 AAP Consent(inintegrated form) ”(2009年2月在瑞士日内瓦举办的第30届JVT会议)中,此文献可从http://wftp3.1tu.1nt/av-arch/jvt-site/2009_01_Geneva/JVT-AD007. zip 获得,其将SVC与MVC综合在AVC规范中。

发明内容
本发明描述与使用串流协议(例如超文本传送协议(HTTP)串流)输送媒体数据相关的技术。明确地说,本发明的技术针对于发信号通知媒体内容中的随机存取点(RAP)的特性。随机存取点大体上对应于解码器可开始在不参考较早数据(例如,在时间上在所述随机存取点之前的经编码单元)的情况下恰当地解码视频表示所在的点。也就是说,随机存取点可包含独立可解码单元,例如,视频数据的经帧内译码帧或切片。串流(例如,HTTP串流)大体上涉及将数据从源装置传送到目的地装置。根据本发明的技术,除了瞬时解码刷新(IDR)帧之外,源装置还可发信号通知开放解码刷新(ODR)帧的特性。通过发信号通知这些特性,目的地装置可产生在ODR帧处开始重放视频数据流中所含有的视频表示的请求。以此方式,目的地装置的用户可请求开始或跳转到所述视频表示的特定时间位置,且目的地装置可请求串流视频表示的含有最靠近所请求的时间位置的IDR或ODR图片的一部分。因此,并非限于在IDR图片处起始视频表示的重放和/或串流,根据本发明的技术的目的地装置可在IDR或ODR处起始流,这可减小带宽消耗且/或实现较频繁的随机存取点和/或视频切换点,以便改进用户的观看体验。本发明还提供用于发信号通知经帧内译码图片的特性的技术,使得目的地装置可在特技模式中检索并呈现经帧内译码图片。特技模式大体上对应于高速重放模式,例如快进或倒退。在此类模式中,目的地装置可仅重放视频表示中的可用帧的子集。因此,目的地装置仅需要检索将在特技模式中播放的帧。因此,根据本发明的技术,目的地装置可基于发信号通知的特性来产生针对经帧内译码帧的请求,这可减小带宽消耗且在使用网络串流协议传送媒体时允许特技模式重放。举例来说,本文中描述一种方法。所述方法包括在客户端装置处从服务器装置接收媒体分段的开放解码刷新(ODR)随机存取点(RAP)帧的指示,其中所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODRRAP之前的帧的内容的情况下被正确解码。所述方法进一步包括由所述客户端装置向所述服务器装置发送检索以含有所述所指示的ODR RAP帧的所述媒体分段开始的媒体数据流的请求。根据另一实例,本文中描述一种装置。所述装置包括用于从服务器装置接收媒体分段的开放解码刷新(ODR)随机存取点(RAP)帧的指示的装置,其中所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODRRAP之前的帧的内容的情况下被正确解码。所述装置进一步包括用于向所述服务器装置发送检索以所述所指示的ODR RAP帧开始的媒体数据流的请求的装置。根据另一实例,本文中描述一种计算机可读存储媒体。所述存储媒体包括在执行时致使客户端计算装置的处理器进行以下操作的指令在客户端装置处从服务器装置接收媒体分段的开放解码刷新(ODR)随机存取点(RAP)帧的指示,其中所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODRRAP之前的帧的内容的情况下被正确解码。所述指令进一步致使所述客户端计算装置由所述客户端装置向所述服务器装置发送检索以含有所述所指示的ODR RAP帧的所述媒体分段开始的媒体数据流的请求。根据另一实例,本文中描述一种包括一个或一个以上处理器的装置。所述一个或一个以上处理器经配置以接收媒体分段的开放解码刷新(ODR)随机存取点(RAP)帧的指示,其中所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODR RAP之前的帧的内容的情况下被正确解码。所述一个或一个以上处理器进一步经配置以向服务器装置发送检索以含有所述所指示的ODR RAP帧的所述媒体分段开始的媒体数据流的请求。根据另一实例,本文中描述一种方法。所述方法包括接收媒体分段的包含开放解码刷新(ODR)随机存取点(RAP)帧的经编码视频帧序列,其中所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODR RAP之前的帧的内容的情况下被正确解码。所述方法进一步包括产生所述ODR RAP在所述经编码视频帧序列内的位置的指示。所述方法进一步包括输出所述指示。根据另一实例,本文中描述一种装置。所述装置包括用于接收媒体分段的包含开放解码刷新(ODR)随机存取点(RAP)帧的经编码视频帧序列的装置,其中所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODR RAP之前的帧的内容的情况下被正确解码。所述装置进一步包括用于产生所述ODR RAP在所述经编码视频帧序列内的位置的指示的装置。所述装置进一步包括用于输出所述指示的装置。根据另一实例,本文中描述一种计算机可读存储媒体。所述计算机可读存储媒体包括在执行时致使源装置的一个或一个以上处理器进行以下操作的指令接收媒体分段的包含开放解码刷新(ODR)随机存取点(RAP)帧的经编码视频帧序列,其中所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODR RAP之前的帧的内容的情况下被正确解码。所述指令进一步致使所述源装置产生所述ODR RAP在所述经编码视频帧序列内的位置的指示。所述指令进一步致使所述源装置输出所述指示。根据另一实例,本文中描述一种包括一个或一个以上处理器的装置。所述一个或一个以上处理器经配置以接收媒体分段的包含开放解码刷新(ODR)随机存取点(RAP)帧的经编码视频帧序列,其中所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODR RAP之前的帧的内容的情况下被正确解码。所述一个或一个以上处理器进一步经配置以产生所述ODR RAP在所述经编码视频帧序列内的位置的指示。所述一个或一个以上处理器进一步经配置以输出所述指示。根据另一实例,本文中描述一种方法。所述方法包括在客户端装置处从服务器装置接收表示经配置以按第一重放速度显示的视频呈现的媒体分段内的至少一个字节范围的指示,其中至少一个经帧内译码帧(1帧)出现在所述至少一个字节范围内。所述方法进一步包括由所述客户端装置向所述服务器装置发送检索所述至少一个字节范围内的媒体数据的请求。所述方法进一步包括使用所述至少一个字节范围内的所述所检索的媒体数据来按高于所述第一重放速度的第二重放速度呈现所述视频表示的包括所述至少一个I帧的闻速版本。
根据另一实例,本文中描述一种装置。所述装置包括用于在客户端装置处从服务器装置接收表示经配置以按第一重放速度显示的视频呈现的媒体分段内的至少一个字节范围的指示的装置,其中至少一个经帧内译码帧(I帧)出现在所述至少一个字节范围内。所述装置进一步包括用于由所述客户端装置向所述服务器装置发送检索所述至少一个字节范围内的媒体数据的请求的装置。所述装置进一步包括用于使用所述至少一个字节范围内的所述所检索的媒体数据来按高于所述第一重放速度的第二重放速度呈现所述视频表示的包括所述至少一个I帧的高速版本的装置。根据另一实例,本文中描述一种计算机可读存储媒体。所述计算机可读存储媒体存储经配置以致使计算装置进行以下操作的指令在客户端装置处从服务器装置接收表示经配置以按第一重放速度显示的视频呈现的媒体分段内的至少一个字节范围的指示,其中至少一个经帧内译码帧(I帧)出现在所述至少一个字节范围内。所述指令进一步经配置以致使所述计算装置由所述客户端装置向所述服务器装置发送检索所述至少一个字节范围内的媒体数据的请求。所述指令进一步经配置以致使所述计算装置使用所述至少一个字节范围内的所述所检索的媒体数据来按高于所述第一重放速度的第二重放速度呈现所述视频表示的包括所述至少一个I帧的高速版本。根据另一实例,本文中描述一种装置。所述装置包括至少一个处理器。所述至少一个处理器经配置以接收表示经配置以按第一重放速度显示的视频呈现的媒体分段内的至少一个字节范围的指示,其中至少一个经帧内译码帧(I帧)出现在所述至少一个字节范围内。所述至少一个处理器进一步经配置以向服务器装置发送检索所述至少一个字节范围内的媒体数据的请求。所述至少一个处理器进一步经配置以使用所述至少一个字节范围内的所述所检索的媒体数据来按高于所述第一重放速度的第二重放速度呈现所述视频表示的包括所述至少一个I帧的高速版本。根据另一实例,本文中描述一种方法。所述方法包括接收包含至少一个经帧内译码帧(I帧)的经编码视频帧序列。所述方法进一步包括产生所述经编码视频帧序列内的字节范围的指示,其中至少一个I帧出现在所述至少一个字节范围内。所述方法进一步包括输出所述经编码视频帧序列内的字节范围的所述指示。根据另一实例,本文中描述一种装置。所述装置包括用于接收包含至少一个经帧内译码帧(I帧)的经编码视频帧序列的装置。所述装置进一步包括用于产生所述经编码视频帧序列内的字节范围的指示的装置,其中至少一个I帧出现在所述至少一个字节范围内。所述装置进一步包括用于输出所述经编码视频帧序列内的字节范围的所述指示的装置。根据另一实例,本文中描述一种计算机可读存储媒体。所述计算机可读存储媒体存储经配置以致使计算装置进行以下操作的指令接收包含至少一个I帧的经编码视频帧序列。所述指令进一步致使所述计算装置产生字节范围的指示,其中至少一个I帧出现在所述至少一个字节范围内。所述指令进一步致使所述计算装置输出所述经编码视频帧序列内的字节范围的所述指示。根据另一实例,本文中描述一种装置。所述装置包括一个或一个以上处理器。所述一个或一个以上处理器经配置以接收包含至少一个I帧的经编码视频帧序列。所述一个或一个以上处理器进一步经配置以产生所述经编码视频帧序列内的字节范围的指示,其中至少一个1帧出现在所述至少一个字节范围内。所述一个或一个以上处理器进一步经配置以输出所述经编码视频帧序列内的字节范围的所述指示。一个或一个以上实例的细节陈述于附图和以下描述中。其它特征、目标和优点将从所述描述和图式以及从权利要求书显而易见。


图1为说明其中音频/视频(A/V)源装置将音频和视频数据输送到A/V目的地装置的实例系统的框图。图2为说明符合本发明的技术的视频片段的一个实例的概念图。图3为说明符合本发明的技术的视频片段的一个实例的概念图。图4为说明符合本发明的技术的分段文件的一个实例的框图。图5为说明符合本发明的技术的电影呈现的一个实例的框图。图6为说明符合本发明的技术的段索引盒的一个实例的框图。图7为说明符合本发明的技术的操作客户端装置以接收开放解码刷新(ODR)随机存取点(RAP)的指示的方法的一个实例的流程图。图8为说明符合本发明的技术的操作源装置以提供ODR RAP的指示的方法的一个实例的流程图。图9为说明符合本发明的技术的操作客户端装置以接收经帧内译码帧(I帧)的字节范围的指示的方法的一个实例的流程图。图10为说明符合本发明的技术的操作源装置以提供经帧内译码帧(I帧)的字节范围的指示的方法的一个实例的流程图。图11为说明符合本发明的技术的可由相应的HTTP客户端和服务器装置执行的步骤的一个实例的流程图。图12为说明符合本发明的技术的可由相应的HTTP客户端和服务器装置执行的步骤的一个实例的流程图。
具体实施例方式本发明的技术大体上针对于支持使用串流协议(例如超文本传送协议(HTTP)串流)的视频数据输送。一般来说,在本发明中对HTTP的参考可包括对HTTP串流的参考。本发明参考视频表示的两个特定类型的随机存取点(RAP)。明确地说,本发明描述瞬时解码刷新(IDR) RAP和开放解码刷新(ODR) RAP。IDR存取点为闭合GOP的可独立解码的帧内帧。闭合GOP为视频表示的帧分组,所述帧分组不包括依靠按解码或呈现次序在所述GOP之前的帧来可正确解码的任何帧。开放GOP为其中按显示(输出)次序在所述GOP的初始可独立解码的帧(I帧)之前但按解码次序在所述I帧之后的图片可能不可正确解码的G0P。举例来说,开放GOP可包括至少部分依靠在所述开放GOP外部的至少一个帧的内容的一个或一个以上帧。在开放GOP的一些实例中,开放GOP的I帧可用作用于开始视频表示的重放的随机存取点。举例来说,如果按显示次序在初始I帧之后的所有帧可被正确解码,那么所述I帧可用作RAP。此RAP可被称为ODR RAP。
视频表不的巾贞可被布置为一个或一个以上G0P。所述一个或一个以上GOP可被布置为一个或一个以上视频片段。所述一个或一个以上片段可被布置为一个或一个以上段。在一些实例中,多个段可形成视频表示。串流服务(例如HTTP串流服务)可允许客户端装置做出从服务器装置检索一个或一个以上G0P、片段、段或整个视频表示的HTTP请求。服务器装置可含有媒体内容的多个表示。在一个实例中,此请求可包括HTTP获取请求。HTTP获取请求可通过指定视频表示的一个或一个以上媒体分段(例如,G0P、片段、段或视频表示等级媒体文件)的统一资源定位符(URL)来提供对存储在服务器装置上的内容的客户端装置存取。在一些实例中,HTTP获取请求可指定媒体文件内的字节范围而非请求整个媒体文件。此HTTP获取请求可被称为部分获取请求。如本文中所描述,短语“媒体分段”指代任何文件,片段、段或视频表示等级媒体分段,其可根据例如HTTP获取或部分获取请求等串流协议请求来检索。在一些实例中,本文中所描述的各种形式的媒体内容可以一个或一个以上媒体分段的形式存储在服务器中。在一些实例中,服务器装置可经配置以提供信令信息以促进HTTP串流服务。根据本发明的一个方面,服务器装置可发信号通知视频表示的媒体分段(例如,片段、段、表示特定媒体分段)的开放解码刷新(ODR)随机存取点(RAP)。根据本发明的技术,客户端装置可向服务器装置递送针对基于ODR RAP的发信号通知来串流媒体数据的请求。通过发信号通知视频表示的ODR RAP,客户端装置可从视频表示的较多时间位置当中进行选择以用于开始串流、解码和/或重放视频表示。在一些实例中,在片段或段中未含有IDR的情况下,源装置可发信号通知媒体分段是否含有ODR RAP。因此,如果在所要时间位置附近没有包括IDR RAP的媒体分段可用,那么视频表示的重放可在与包括ODR RAP的媒体分段(例如,视频表示的片段或段,或整个视频表示)相关联的时间位置处开始。明确地说,源 装置可发信号通知与媒体分段的ODR RAP的字节偏移。媒体分段可为可使用视频片段所特有的统一资源定位符(URL)或统一资源名称(URN)来独立寻址的。在一个实例中,通过发信号通知与视频片段中的ODR RAP的字节偏移,客户端装置可构造获取请求,所述获取请求包含在ODR RAP处开始且在媒体分段的末端处结束的字节范围。根据本发明的另一方面,服务器装置可发信号通知视频表示的至少一个I帧的字节范围。客户端装置可将基于发信号通知的字节范围来检索所述至少一个I帧的请求递送到服务器装置,且使用所检索的I帧来提供视频内容的包括所述至少一个I帧的高速版本。视频内容的高速版本可支持视频表示的特技模式,例如快进或快退。通过直接发信号通知视频呈现的至少一个I帧的字节范围,可在不请求I帧所属的完整视频表示的情况下或在不请求视频表示的专门针对高速重放创建的替代版本的情况下提供高速版本。此外,这些技术允许提供视频表示的高速版本,同时最小化可被串流、解码和/或重放的数据的量。根据本发明的此方面,服务器装置可发信号通知表示媒体内容的一个或一个以上媒体分段内的一个或一个以上字节范围的指示。至少一个经帧内译码帧(I帧)可出现在所述一个或一个以上发信号通知的字节范围中的每一者内。客户端装置可基于所述一个或一个以上字节范围的发信号通知的指示来提交检索所述字节范围内的媒体数据的请求(例如,HTTP获取或部分获取请求)。客户端装置可连续呈现与所述一个或一个以上发信号通知的字节范围中的至少一者一起出现的在时间上由至少一个经帧内译码帧分开的两个或两个以上I帧,以相对高速地呈现所述视频呈现。此表示可视为媒体内容的高速版本。第三代合作伙伴计划(3GPP)为电信协会群组之间的合作,以在国际电信联盟(ITU)的国际移动电信-2000项目的范围内做出全球适用的第三代(3G)移动电话系统规范。3GPP规范是基于演进型全球移动通信系统(GSM)规范。3GPP标准化涵盖无线电、核心网络和服务架构。在一些实例中,本发明的技术在本文中使用与3GPP协议规范一致的实例和术语来描述。仅出于示范性目的来提供这些实例和术语,还预期用于串流视频数据的其它协议规范且所述其它协议规范与本发明一致。在根据HTTP串流的一些实例中,分段文件可被布置为多个不同表示,所述表示各自对应于特定节目(例如,电影、电视节目或其它视频节目)。3GPP文件可各自对应于节目和/或节目的呈现的段或片段的这些不同表示。视频表示(例如,3GPP文件)可布置为多个电影片段。电影片段可各自包括视频表示的多个帧或图片。3GPP视频表示的片段可为可使用HTTP获取或部分获取请求来个别地检索,所述HTTP获取或部分获取请求可提及3GPP文件的统一资源定位符(URL)或统一资源名称(URN)。HTTP客户端可在重放期间改变表示,例如当网络条件改变时或当检测到用户控制输入时。举例来说,当大量带宽可用时,客户端可检索相对较高质量的呈现的3GPP文件,而当较少量带宽可用时,客户端可检索相对较低质量的呈现的3GPP文件。类似地,用户可指示视频质量的所要改变。用户还可指示客户端针对视频表示的重放进行暂停、停止、查找(例如,快进、倒退)或扫描(指示所要起始点)。可能需要HTTP服务器提供针对一个或一个以上电影呈现可用的信息子集以允许HTTP客户端选择不同表示或表示部分来进行串流。此信息可被称为标头信息。标头信息可特定针对于节目、特定针对于节目的表示或所述表示的一部分,或特定针对于表示的电影片段或段。在根据3GPP的一个实例中,标头信息可包含在媒体呈现描述(MPD)文件中。MPD文件可发信号通知视频数据的多个表示的特性元素,例如位速率、帧速率、分辨率、交错或渐进扫描类型、编码类型(例如,MPEG-1、MPEG-2、H. 263、MPEG-4/H. 264或任何其它视频编解码器)、存取点或其它特性。电影片段可包括多个图片群组(GOP)。GOP可包括或可不包括用于开始解码和/或重放的随机存取点(RAP)。本发明描述用于在HTTP串流应用的上下文中发信号通知ODR存取点的技术。本发明的技术可提供一个或一个以上优点。举例来说,与提供发信号通知IDR存取点的已知技术相比,除IDR存取点之外还发信号通知ODR存取点可通过提供用于根据HTTP串流起始流的较细控制粒度来允许改进扫描或查找功能性。本发明的技术还可在串流包括用于解码的高水平帧间内容依赖性的较复杂视频节目时提供优点,因为可提供较多存取点,进而改进用于HTTP串流的扫描和/或查找功能性。本发明的技术可提供另外优点,因为通过在分段文件的标头信息中发信号通知一个或一个以上ODR存取点,客户端装置可请求在ODR存取点自身或包括所述ODR存取点的开放GOP处开始的媒体数据流,进而在选择用于串流/解码/重放由分段文件表示的视频的起始点时提供较细粒度。这些技术还可通过减少待针对视频表示的重放而串流的数据的量来优于现有技术。
在一些实例中,本发明的技术提供在分段文件的标头信息中发信号通知ODR存取点和/或其它信息。在一个实例中,可在电影表示或段的段索引盒(SIDX)中发信号通知ODR存取点。分段文件可根据ISO基础媒体文件格式或任何其它分段文件类型来格式化,包括ISO基础媒体文件格式的扩展,例如可缩放视频译码(SVC)、高级视频译码(AVC)和/或多视图视频译码(MVC)等。本发明的技术可进一步提供用于发信号通知与扫描和/或查找功能性相关的其它信息,所述功能性在下文中进一步详细描述。本发明的技术进一步提供用于由HTTP服务器装置发信号通知一个或一个以上经帧内译码帧(I帧)的字节范围以用于扫描功能性的目的。举例来说,目的地装置可显示视频表示的高速版本以用于快进或倒退的目的,所述快进或倒退还被称为用于视频呈现的特技模式。根据这些技术,客户端装置可基于发信号通知I帧字节范围而仅请求和/或解码视频表示的发信号通知的I帧而不管呈现视频表示的高速版本不需要的其它帧。举例来说,客户端装置可专门请求(例如,通过一个或一个以上HTTP部分获取请求)出现在发信号通知的字节范围内的一个或一个以上I帧。客户端装置可连续呈现所检索的媒体数据的两个或两个以上I帧以相对高速地呈现所述视频内容。所述两个或两个以上I帧可在时间上由至少一个经帧间译码帧(例如,B或P帧)分开。通过仅检索、解码并显示所述发信号通知的I帧,客户端装置可向用户提供视频表示的高速版本以用于快进或倒退操作的目的。在一些实例中,发信号通知的I帧可包括IDR和/或ODR存取点。视频表示的I帧的字节范围可在各种译码单元(例如,媒体分段)的标头信息中发信号通知。举例来说,源装置可在媒体呈现的视频等级(例如,在Mro文件内)、表示等级、段等级、片段等级或其它等级的标头信息处发信号通知I帧的字节范围。这些技术可提供一个或一个以上优点。举例来说,目的地装置可在串流协议(例如HTTP串流)的上下文中在不创建、存储和/或发射视频表示的高速版本的情况下执行视频表示的高速重放。另外,这些技术可为有利的,因为 客户端装置可基于发信号通知的I帧来向用户呈现快进和快退重放中的任一者或两者。图1为说明其中音频/视频(A/V)源装置20将音频和视频数据输送到A/V目的地装置40的实例系统10的框图。A/V源装置20还可称为“源视频装置”。图1的系统10可对应于视频电话会议系统、服务器/客户端系统、广播器/接收器系统或其中将视频数据从源装置(例如A/V源装置20)发送到目的地装置(例如A/V目的地装置40)的任何其它系统。A/V目的地装置40还可称为“目的地视频装置”或“客户端装置”。在一些实例中,A/V源装置20和A/V目的地装置40可执行双向信息交换。也就是说,A/V源装置20和A/V目的地装置40可能够编码和解码(以及发射和接收)音频和视频数据。在一些实例中,音频编码器26可包含语音编码器,其还称为声码器。在图1的实例中,A/V源装置20包含音频源22和视频源24。举例来说,音频源22可包含麦克风,所述麦克风产生表示待由音频编码器26编码的所俘获的音频数据的电信号。或者,音频源22可包含存储先前所记录的音频数据的存储媒体、例如计算机化合成器等音频数据产生器或任何其它音频数据源。视频源24可包含摄像机,其产生待由视频编码器28编码的视频数据;经编码有先前所记录的视频数据的存储媒体;视频数据产生单元;或任何其它视频数据源。原始音频和视频数据可包含模拟或数字数据。模拟数据可在由音频编码器26和/或视频编码器28编码之前进行数字化。音频源22可在说话参与者正在说话时从所述说话参与者获得音频数据,且视频源24可同时获得所述说话参与者的视频数据。在其它实例中,音频源22可包含包括所存储的音频数据的计算机可读存储媒体,且视频源24可包含包括所存储的视频数据的计算机可读存储媒体。以此方式,本发明中所描述的技术可应用于实况、串流、实时音频和视频数据或所存档的、预先记录的音频和视频数据。对应于视频帧的音频帧大体上为含有与在视频帧内所含有的由视频源24所俘获的视频数据同时发生的由音频源22所俘获的音频数据的音频帧。举例来说,当说话参与者大体上通过说话而产生音频数据时,音频源22俘获音频数据,且视频源24同时(即,在音频源22正俘获音频数据的同时)俘获说话参与者的视频数据。因此,音频帧可在时间上对应于一个或一个以上特定视频帧。因而,音频帧对应于视频帧大体上对应于同时俘获到音频数据和视频数据且音频帧和视频帧分别包含同时俘获到的音频数据和视频数据的情形。在一些实例中,音频编码器26可将表示记录每一经编码音频帧的音频数据所在的时间的时戳编码于所述经编码音频帧中,且类似地,视频编码器28可将表示记录每一经编码视频帧的视频数据所在的时间的时戳编码于所述经编码视频帧中。在这些实例中,音频帧对应于视频帧可包含音频帧包含时戳且视频帧包含相同时戳。A/V源装置20可包括内部时钟,音频编码器26和/或视频编码器28可从所述内部时钟产生时戳,或音频源22和视频源24可使用所述内部时钟来使音频和视频数据分别与时戳相关联。在一些实例中,音频源22可将对应于记录音频数据所在的时间的数据发送到音频编码器26,且视频源24可将对应于记录视频数据所在的时间的数据发送到视频编码器28。在一些实例中,音频编码器26可将序列识别符编码于经编码音频数据中以指示经编码音频数据的相对时间排序但不必指示记录音频数据所在的绝对时间,且类似地,视频编码器28还可使用序列识别符来指示经编码视频数据的相对时间排序。类似地,在一些实例中,序列识别 符可经映射或以其它方式与时戳相关。本发明的技术大体上是针对于经编码多媒体(例如,音频和视频)数据的输送,以及所输送的多媒体数据的接收及后续解译和解码。本发明的技术可应用于各种标准和扩展的视频数据(例如可缩放视频译码(SVC)、高级视频译码(AVC)、ISO基础媒体文件格式或多视图视频译码(MVC)数据或其它视频数据)的输送。在一些实例中,视频源24可将场景的多个视图提供到视频编码器28。在一些实例中,视频数据的多个视图可适用于产生待由三维显示器(例如立体或裸眼式立体三维显示器)使用的三维视频数据。A/V源装置20可向A/V目的地装置40提供“服务”。服务可大体上对应于MVC数据的可用视图的子集。举例来说,多视图视频数据可为可用于八个视图,其被排序为零到七。一个服务可对应于具有两个视图的立体视频,而另一服务可对应于四个视图,且又一服务可对应于所有八个视图。一般来说,服务对应于所述可用视图的任何组合(即,任何子集)。服务还可对应于可用视图以及音频数据的组合。数据(无论是音频还是视频)的每一个别流被称作基本流。基本流为节目的单个经数字译码(可能经压缩)的分量。举例来说,所述节目的经译码视频或音频部分可为基本流。基本流可在多路复用为节目流或输送流之前转换成包化基本流(PES)。在同一节目内,使用流ID来区分属于一个基本流的PES包与属于另一基本流的PES包。基本流的数据的基本单元为包化基本流(PES)包。因此,MVC视频数据的每一视图对应于相应基本流。类似地,音频数据对应于一个或一个以上相应基本流。在图1的实例中,包封单元30接收来自视频编码器28的包含视频数据的基本流和来自音频编码器26的包含音频数据的基本流。在一些实例中,视频编码器28和音频编码器26可各自包括用于从经编码数据形成PES包的包化器。在其它实例中,视频编码器28和音频编码器26可各自与用于从经编码数据形成PES包的相应包化器介接。在另外其它实例中,包封单元30可包括用于从经编码音频和视频数据形成PES包的包化器。如本发明中所使用的“节目”可包含音频数据与视频数据的组合,例如音频基本流和通过A/V源装置20的服务传递的可用视图的子集。每一 PES包包括streamjd,其识别所述PES包所属的基本流。包封单元30可将基本流组合为构成节目流或输送流。节目流和输送流为以不同应用为目标的两个替代性多路复用。一般来说,节目流包括用于一个节目的数据,而输送流可包括用于一个或一个以上节目的数据。包封单元30可基于正提供的服务、所述流将被传递到其中的媒体、待发送的多个节目或其它考虑因素来编码节目流或输送流中的任一者或两者。举例来说,当视频数据将编码在存储媒体中时,包封单元30可较有可能形成节目流,而当视频数据将经由网络串流、广播或作为视频电话的一部分发送时,包封单元30可较有可能使用输送流。包封单元30从音频编码器26和视频编码器28接收用于节目的基本流的PES包且从所述PES包形成对应的网络 抽象层(NAL)单元。在H.264/AVC (高级视频译码)的实例中,经译码视频段被组织成NAL单元,其提供“网络友好的”视频表示寻址应用,例如视频电话、存储、广播或串流。NAL单元可被分类为视频译码层(VCL) NAL单元和非VCLNAL单元。VCL单元含有核心压缩引擎且可包含块、宏块和/或切片等级。其它NAL单元为非VCLNAL单元。在自身有效负载中包括视频数据的NAL单元可包含各种粒度等级的视频数据。举例来说,NAL单元可包含视频数据的块、宏块、多个宏块、视频数据的切片或视频数据的整个帧。一般来说,存取单元可包含用于表示视频数据的帧以及对应于所述帧的音频数据(当此音频数据为可用时)的一个或一个以上NAL单元。存取单元大体上包括一个输出时间实例的所有NAL单元,例如,一个时间实例的所有音频和视频数据。在对应于H. 264/AVC的实例中,存取单元可包含一个时间实例中的经译码图片,其可呈现为主要经译码图片。因此,存取单元可包含共同时间实例的所有视频帧,例如对应于时间X的所有视图分量。包封单元30可将NAL单元组合为遵照ISO基础媒体文件格式或其衍生物(例如,SVC、AVC、MVC*3GPP)的视频文件的轨道,且将所述视频文件传递到输出接口 32。举例来说,输出接口 32可包含发射器、收发器、用于将数据写入到计算机可读媒体的装置(例如光盘驱动器、磁性媒体驱动器(例如,软盘驱动器))、通用串行总线(USB)端口、网络接口或其它输出接口。输出接口 32将NAL单元或存取单元输出到计算机可读媒体(例如,信道34),举例来说,例如传输信号或载波等暂时媒体或者例如磁性媒体、光学媒体、存储器或快闪驱动器等计算机可读存储媒体。输入接口 36从计算机可读媒体(例如,信道34)检索数据。举例来说,输入接口36可包含光盘驱动器、磁性媒体驱动器、USB端口、接收器、收发器或其它计算机可读媒体接口。输入接口 36可将NAL单元或存取单元提供到解包封单元38。解包封单元38可将输送流或节目流多路分用为构成PES流,解包化PES流以检索经编码数据,且将经编码数据发送到音频解码器46或视频解码器48,这取决于所述经编码数据是音频流还是视频流的一部分,例如由所述流的PES包标头指示。解包封单元38可最初选择所接收的视频文件中所包括的轨道中的一者,且接着仅将选定轨道的数据和由选定轨道的析取字提及的其它轨道的数据传递到视频解码器48,从而丢弃选定轨道的析取字未提及的其它轨道的数据。音频解码器46解码经编码音频数据且将经解码音频数据发送到音频输出42,而视频解码器48解码经编码视频数据且将经解码视频数据(其可包括流的多个视图)发送到视频输出44。视频输出44可包含使用场景的多个视图的显示器,例如,同时呈现场景的每一视图的立体或裸眼式立体显示器。如同多数视频译码标准一样,H. 264/AVC定义无错误位流的语法、语义和解码过程,其中的任一者遵照某一简档或等级。H. 264/AVC不指定编码器,但编码器的任务是保证所产生的位流对于解码器来说为符合标准的。在视频译码标准的上下文中,“简档”对应于算法、特征或工具和施加到算法、特征或工具的约束的子集。如由H. 264标准所定义,例如,“简档”为由H. 264标准指定的整个位流语法的子集。“等级”对应于解码器资源消耗的限制,例如与图片的分辨率、位速率和宏块(MB)处理速率有关的解码器存储器和计算。举例来说,H. 264标准认识到,在由给定简档的语法强加的边界内,仍有可能需要编码器和解码器的性能的大变化,此取决于位流中的语法元素所采取的值(例如,经解码图片的指定大小)。H. 264标准进一步认识到,在许多应用中,实施能够处理特定简档内的语法的所有假设使用的解码器既不实用也不经济。因此,H. 264标准将“等级”定义为强加于位流中的语法元素的值的约束的指定集合。这些约束可为对各值的简单限制。或者,这些约束可采取对各值的算术组合(例如,图片宽度乘以图片高度乘以每秒经解码的图片的数目)的约束的形式。H. 264标准进一步提供,个别实施方案可针对每一所支持简档支持不同等级。遵照简档的解码器通常支持所述简档中定义的所有特征。举例来说,作为译码特征,B图片译码在H. 264/AVC的基线简档中未受到支持,但在H. 264/AVC的其它简档中受到支持。遵照等级的解码器 应能够解码不需要超出所述等级中定义的限制的资源的任何位流。简档和等级的定义可有助于可解译性。举例来说,在视频发射期间,可针对整个发射会话来协商一对简档和等级定义并实现一致。更具体来说,在H. 264/AVC中,等级可定义(例如)对以下各者的限制需要加以处理的宏块的数目、经解码图片缓冲器(DPB)大小、经译码图片缓冲器(CPB)大小、垂直运动向量范围、每两个连续MB的运动向量的最大数目,以及B块是否可具有少于8X8个像素的子宏块分区。以此方式,解码器可确定所述解码器是否能够适当地解码所述位流。参数集大体上含有在序列参数集(SPS)中的序列层标头信息和在图片参数集(PPS)中的偶尔改变的图片层标头信息。就参数集而论,无需针对每一序列或图片来重复此偶尔改变的信息;因此,可改进译码效率。此外,参数集的使用可实现标头信息的带外发射,从而避免为实现错误恢复而进行冗余发射的需要。在带外发射中,参数集NAL单元可在与其它NAL单元不同的信道上发射。补充增强信息(SEI)消息可含有并非为解码来自VCL NAL单元的经译码图片样本所必需的信息。SEI消息可含于非VCL NAL单元中,如上文所描述。在一些实例中,SEI消息为标准规范(例如,H. 264)的定标准部分,且对于符合标准的解码器的实施方案来说并非总是必选的。在一些实例中,SEI消息可辅助与解码、显示、错误恢复和其它目的有关的过程。在一些实例中,SEI消息可为序列等级(例如,多个连续图片/帧)消息。在其它实例中,SEI消息可特定针对于视频数据的一个或一个以上图片/帧。在H. 264/AVC和其它视频标准中,可能存在作为开放GOP的按解码次序的第一图片的经帧内译码图片。开放GOP为其中按输出次序的在初始帧内图片之前的图片可能不可正确解码的图片群组。H. 264/AVC解码器可辨识开始开放GOP的帧内图片且开始解码随后图片。应注意,此帧内图片可与恢复点SEI相关联。在一些实例中,开始开放GOP的帧在本文中称为开放解码刷新(ODR)帧。闭合GOP为其中所有图片均可正确解码的图片群组。在
H.264/AVC中,闭合GOP可从IDR存取单元开始。图2为说明包括图片群组(G0P)210的视频片段201的一个实例的概念图。可将GOP描述为视频序列的顺序(按呈现次序)帧的分组。视频片段可包括任何数目的与GOP210类似的G0P。

图2的实例描绘视频片段201的一部分。视频片段包括多个帧220A到220K。片段201可包含一个或一个以上图片群组(GOP),例如GOP 210。可将所述一个或一个以上GOP 210描述为视频表示的帧的分组。图2中所说明的GOP 210为闭合GOP的实例。也就是说,帧220B到2201中的每一者可在不参考在GOP 210外部的帧(例如,帧220A、220J和220K)的情况下进行解码。如图2中所示,帧220A在GOP 210的帧220B到2201之前(按呈现次序)。帧220J到220K在GOP 210的帧220B到2201之后(按呈现次序)。帧220A和220J到220K可为片段201的另一 GOP的一部分。帧220A到220K的呈现次序可不同于所述帧的解码次序。举例来说,GOP可包括1、B或P帧的任何组合。经帧内译码帧(I帧)为可独立解码的那些帧,意味着为了解码I帧,解码器不需要依赖于其它帧的内容。在图2的实例中,帧220A和2201为I帧的实例。P帧可在一个方向上相对于一个或一个以上帧进行帧间译码。在图2的实例中,帧220B、220C和220E为P帧的实例。B帧可在两个方向上相对于一个或一个以上帧进行帧间译码。在图2的实例中,帧220D、220F、220G和220H为B帧的实例。如上文所论述,根据图2的实例,帧220A到220K的解码次序可不同于所述帧的呈现次序。举例来说,当解码帧220B到2201时,可首先解码帧2201 (I帧)。如箭头222E所指示,帧220E依赖于帧2201的内容来被正确解码。因而,可在解码帧2201之后解码帧220E。如箭头222C指示,帧220C可依赖于帧220E的内容来被正确解码。如箭头222G指示,帧220G可依赖于帧220E和帧2201两者的内容来被正确解码。因而,在一些实例中,帧220C和220G的解码可发生在解码帧2201和220E之后。帧220B、220D、220F和220H各自分别依赖于帧220C、220E、220G和2201中的一者或一者以上的内容,且因此可在帧220C、220E、220G和2201已经被解码之后解码。如上文所描述,瞬时解码刷新(IDR)存取点可被描述为闭合G0P(例如,图2中的GOP 210)的存取点。仅包括可在不依赖于GOP的外部的帧的内容的情况下正确解码的帧的GOP可被视为闭合GOP 210。
图2描绘IDR存取点的两个实例。如图2实例中展示,帧220A不依赖于任何其它帧的内容来可正确解码,即,帧220A不包括指示对另一帧的依赖的任何箭头。帧220A自身可被视为G0P,因为在帧220A之前没有帧。因而,帧220A可被视为IDR存取点,因为帧220A 为不依赖于在GOP (仅由帧220A组成)外部的任何帧的内容来被正确解码的GOP的存取点。
帧2201也可被视为闭合GOP 210的IDR存取点。如图2实例中展示,帧2201为可在不依赖于GOP 210的任何其它帧(例如,帧220B到220H)的内容的情况下独立解码的 I帧。虽然帧220B到220H中的每一者依赖于GOP 210内的其它帧的内容来被正确解码,如上文所描述,但帧220B到220H均不依赖于在GOP 210的外部的任何帧的内容。因而,GOP 210可被视为包括IDR存取点(B卩,帧2201)的闭合G0P。
图3为说明包括包含开放解码刷新(ODR)存取点的开放GOP 310的视频片段的至少一部分的一个实例的概念图。类似于图2的实例,帧320A为I帧和IDR存取点。也类似于图2的实例,巾贞3201为对应于随机存取点的I巾贞。然而,图3实例不同于图2实例,在于 GOP 310的按显示次序在I帧3201之前的帧依赖于帧320A的内容以便为可正确解码的。 举例来说,如方向箭头指示,帧320B、320C和320E中的每一者直接依赖于帧320A的内容。 帧320D和320F到320H各自间接依赖于帧320A的内容,因为各自至少部分依赖于帧320B、 320C和320E中的一者或一者以上的内容来被正确解码。然而,如图3中还描绘,按显示次序在I帧3201之后的帧320J和320K可在不依赖于在I帧3201之前的任何帧的情况下被正确解码。因此,I帧3201可用作ODR RAP。
本发明针对于用于在串流视频的上下文中改进随机存取功能性的技术。本发明的技术提供用于发信号通知ODR存取点和各种其它信息以用于开始HTTP串流、解码和/或重放视频呈现。
举例来说,客户端装置可从服务器装置接收视频表示的第一 GOP的ODR存取点的指示。第一 GOP的至少一个帧的编码信息指示媒体分段的按解码次序在ODR RAP帧之后的至少一个帧可能不被正确解码。媒体分段的按显示次序在ODR RAP帧之后的每一帧可在不依赖于按显示次序在ODR RAP之前的帧的内容的情况下被正确解码。客户端装置可向服务器装置发送检索以所指示的ODR RAP开始的媒体数据流的请求(例如,获取或部分获取请求)。客户端装置可接着在ODR RAP处开始解码/重放媒体数据。
明确地说,源装置可发信号通知与视频片段的ODR RAP的字节偏移。视频片段可为可使用所述视频片段所特有的统一资源定位符(URL)或统一资源名称(URN)来独立寻址。 在一个实例中,通过发信号通知与视频片段中的ODR RAP的字节偏移,客户端装置可构造部分获取请求,其包含在ODR RAP处开始且在视频片段的末端处结束的字节范围。
作为另一实例,服务器装置可接收经编码视频帧序列。所述经编码视频帧序列的分段文件包括至少一个ODR RAP。媒体分段的按解码次序在ODR RAP帧之后的至少一个帧可能不被正确解码。媒体分段的按显示次序在ODR RAP帧之后的每一帧可在不依赖于按显示次序在ODR RAP之前的帧的内容的情况下被正确解码。服务器装置可产生ODR RAP的位置的指示。服务器装置可将至少一个指示输出到客户端装置(例如,在视频文件、呈现或视频呈现的片段的标头信息中)。客户端可基于所述至少一个指示来请求视频呈现的段或段的一部分的串流。
作为另一实例, 客户端装置可接收视频片段或呈现的至少一个I帧的字节范围的至少一个指示。客户端装置可基于所述指示来向服务器装置发送检索所述I帧的请求。客户端装置可使用所述至少一个所检索的I帧来呈现视频呈现或片段的包括所述I帧的高速版本。所述I帧可为或可不为IDR或ODR存取点,如上文所描述。可响应于客户端接收针对快进或倒退操作的用户请求来呈现视频呈现的高速版本。
图4为说明节目430的一个实例的框图。节目430可为视频(例如,电影、电视节目或其它移动图片呈现)的数字表示。节目430可存储在一个或一个以上计算装置上或可由一个或一个以上计算装置存取,所述计算装置经配置以作为用于HTTP串流的服务器来操作。根据图4的实例,节目430包括多个表示440A到440C以及媒体呈现描述(MPD) 432。 所述多个表示440A到440C可包括多个电影片段442。所述多个片段442可按重放次序来布置且表示视频的各种时间(即,在时间上)部分。
虽然图4中未描绘,但电影表示440A到440C的一个或一个以上片段442可布置为一个或一个以上电影段。段可包括一组连续电影片段,其可根据单个URL来请求。举例来说,段可为小文件,其可含有视频和音频。作为另一实例,段可对应于一个电影片段,其可自身含有单个视频轨道片段和单个音频轨道片段。作为又一实例,段可对应于若干电影片段,其任一者可具有一个视频片段和一个音频片段,且电影片段可在解码时间上连续。虽然图4中未描绘,但所述用于根据HTTP串流发信号通知视频重放的表示的信息的技术可适用于媒体节目的任何标头信息,例如分段文件(例如,电影表示、电影段、电影片段)的标头信肩、O
MPD 432可被视为节目430的标头信息。MPD 432可包括描述一个或一个以上表示 440A到440C的信息。客户端装置可检索MPD 432以便选择表示440A到440C中的一者或一者以上的全部或一部分用于串流重放。表示440还可包括片段标头443。片段标头443 可包括特定针对于表示440A到440C的特定片段442的信息。如同MPD 432,片段标头443 可为可由HTTP客户端装置存取,例如,以用于选择一个或一个以上表示440A到440C的一个或一个以上片段442。
表不的片段442可包括或可不包括IDR或ODR存取点。对于一些表不,片段442 可仅包括单个IDR存取点。可在节目430的标头信息(例如,图4的MPD 432)中或在节目 430的一个或一个以上片段442的标头信息443中发信号通知一个或一个以上IDR存取点。 本发明的一个方面针对于在MPD 432、片段标头443或节目430的其它标头信息中的一者或一者以上中发信号通知ODR存取点。因此,HTTP客户端可被提供用于开始节目430的串流、解码和/或重放的增大数目的时间选项。
在一些实例中,电影可为两个小时或更长。表示所述电影的节目430或表示可包括多个按时间布置(按重放时间次序)的电影片段,其可表示整个呈现的相对较短部分。举例来说,每一电影片段可表示若干秒或为若干分钟长。根据HTTP串流,客户端装置可请求在所述电影的特定时间点处重放分段文件。为了这样做,客户端装置可向提供所述表示的服务器提交获取或部分获取请求。HTTP获取请求可针对于特定URL或URN,以便检索与URL 或URN相关联的整个文件。HTTP部分获取也针对于URL或URN,但进一步指定所述文件的字节范围来检索。
根据本发明的技术,电影表示440的一些片段442可包括发信号通知特定片段是否包括IDR存取点的标头信息。在一些情况下,如果电影片段仅包括IDR作为电影片段的第一帧,那么客户端装置可不得不在视频片段的开始或其它特定时间位置处开始重放。一些电影片段可不包括IDR存取点,且仅包括一个或一个以上ODR存取点。在一些实例中,客户端装置可不能够在视频片段中的任何点处开始重放。
视频片段可表示若干秒或甚至数分钟的视频数据。因此,假如仅发信号通知IDR 存取点,那么客户端可被提供用于开始重放的有限选项。举例来说,可能需要用户观看视频呈现的已经观看过的部分来返回到所述呈现的特定时间点,例如,如果所述用户停止重放且接着在后续观看期间请求从特定时间位置恢复重放的话。作为另一实例,客户端装置可需要下载视频呈现的比在用户所请求的时间位置或客户端装置起始的时间位置(例如,其中客户端装置已请求节目的替代表示,例如其中带宽条件已经改变)处开始解码/重放所需要的帧多的帧。此外,一些视频片段可不包括IDR存取点。
通过在分段文件、视频表示或视频片段的标头信息中发信号通知ODR存取点,可改进用于HTTP视频串流的扫描和查找功能性。举例来说,在用于HTTP串流的已知技术可仅在较小数目的片段和/或片段内的位置处提供串流/解码/重放开始的情况下,本发明的技术可提供用于重放的增大数目的随机存取点。本发明的技术还可适用于包括大量GOP 间解码依赖性的视频表示。
本发明的其它方面提供用于发信号通知分段文件或呈现的I帧的字节范围以用于电影表示的高速重放(例如,快进、倒退)的目的。根据这些方面,可向客户端装置发信号通知电影呈现的一个或一个以上I帧的字节范围,使得客户端装置可请求、接收和/或解码电影表示的I巾贞以用于高速地显示视频表示(例如,通过仅显示视频表示的I巾贞或可用 I帧的子集)的目的。
本发明的技术可应用于遵照ISO基础媒体文件格式、可缩放视频译码(SVC)文件格式、高级视频译码(AVC)文件格式、第三代合作伙伴计划(3GPP)文件格式和/或多视图视频译码(MVC)文件格式中的任一者的视频文件。所述ISO基础媒体文件格式经设计以含有呈灵活、可扩展的格式的用于呈现的时控媒体信息,所述灵活、可扩展的格式促进媒体的互换、管理、编辑和呈现。ISO基础媒体文件格式(IS0/IEC 14496-12 :2004)在MPEG-4第 12部分中指定,MPEG-4第12部分定义基于时间的媒体文件的一般结构。ISO基本媒体文件格式用作所述系列中的例如以下各项的其它文件格式的基础经定义以支持H. 264/MPEG-4 AVC视频压缩的AVC文件格式(IS0/IEC 14496-15)、3GPP文件格式、SVC文件格式和MVC文件格式。3GPP文件格式和MVC文件格式为AVC文件格式的扩展。ISO基础媒体文件格式含有用于媒体数据的时控序列(例如,音频视觉表示)的时序、结构和媒体信息。所述文件结构可为面向对象的。可极其简单地将文件分解成基本对象,且对象的结构由其类型暗示。
遵照ISO基础媒体文件格式的文件被形成为一连串对象,称作“盒”。呈ISO基础媒体文件格式的数据含于盒中,且所述文件内没有其它数据。此包括特定文件格式所需的任何初始签名。“盒”为通过唯一类型识别符和长度定义的面向对象的构建块。通常,呈现含于一个文件中,且媒体呈现为自含式的。电影容器(电影盒)含有媒体的元数据,且视频和音频帧含于媒体数据容器中且可在其它文 件中。
呈现(运动序列)可含于若干文件中。时序和成帧(位置和大小)信息可包括在遵照ISO基础媒体文件格式的文件中,而辅助文件可基本上使用任何格式。此呈现可在含有所述呈现的系统的“本地”,或可经由网络或其它流传递机制来提供。
所述文件可具有逻辑结构、时间结构和物理结构,且这些结构不需要耦合。文件的逻辑结构可为电影的,所述电影又含有一组时间并行的轨道。文件的时间结构可使得轨道含有按时间的样本的序列,且那些序列通过任选的编辑列表而映射到整个电影的时间线中。文件的物理结构可将逻辑、时间和结构分解所需的数据与媒体数据样本自身分开。此结构信息可集中于电影盒中,可能在时间上由电影片段盒扩展。所述电影盒可评注样本的逻辑和时序关系,且还可含有到其所处位置的指针。那些指针可指向同一文件或另一文件 (例如,通过URL参考)。
每一媒体流可含于专门用于那个媒体类型(音频、视频等)的轨道中,且可进一步通过样本条目来参数化。所述样本条目可含有确切媒体类型(解码所述流所需的解码器的类型)的“名称”和那个所需解码器的任何参数化。所述名称还可采取四字符码(例如, “moov”或“trak”)的形式。存在不仅用于MPEG-4媒体而且用于使用此文件格式系列的其它组织所使用的媒体类型的经定义的样本条目格式。
对元数据的支持大体上采取两种形式。首先,可将时控元数据存储于适当轨道中, 在需要时与其所描述的媒体数据同步。其次,可存在对附接到电影或个别轨道的非时控元数据的一般支持。结构支持为一般的,且如在媒体数据中,允许元数据资源存储于所述文件中的别处或存储于另一文件中。另外,可为这些资源指定名称且可保护这些资源。
如上文所论述,ISO基础媒体文件格式扩展的一个实例为AVC文件形式。根据 AVC文件格式创建的分段文件可包括作为参数集的NAL单元,所述参数集包括序列参数集 (SPS)和图片参数集(PPS)。参数集可与视频的基本流相关联,所述基本流可包括在一个或一个以上视频轨道中。在一些实例中,参数集可在与视频的基本流不同的轨道(参数集轨道)中。参数集轨道可为含有作为SPS和/或PPS NAL单元的样本的参数集基本流。SPS 和PPS NAL单元可包括一个或一个以上SEI消息,所述SEI消息包括不为解码来自VCL NAL 单元的经译码图片样本所必要的信息。包括SEI消息的NAL单元的位置不受限制,只要任何SEI消息存在于解码时间在使用所述SEI消息的任何图片之前的样本中。
如上文还论述,ISO文件格式扩展的其它实例包括SVC和MVC文件格式。SVC和 MVC还可被视为上文所描述的AVC文件格式的扩展。根据SVC和MVC格式,视频的多个层/ 视图可包含在单个视频轨道或多个视频轨道中。SVC和MVC文件格式规范可提供使得能够在以各种组织呈现层/视图时构造操作点的工具。
渐进式下载是用以描述通常使用HTTP协议的数字媒体分段从服务器到客户端的传送的术语。当由计算机起始时,消费者可在下载完成之前开始媒体的重放。串流媒体与渐进式下载之间的差别在于,正存取数字媒体的最终用户装置如何接收并存储数字媒体数据。能够进行渐进式下载重放的媒体播放器依赖于位于文件的标头中的元数据为完整的以及在从网络服务器下载数字媒体文件时对 其进行本地缓冲。在指定量的数据变得可为本地重放装置所用时,所述媒体将开始播放。此指定量的缓冲可由编码器设定中的内容的制作者嵌入到文件中,且可通过媒体播放器所强加的额外缓冲器设定来加强。
使用HTTP进行视频串流具有一些优点,且基于HTTP的视频串流服务正变得风行。 HTTP串流的一些优点包括可使用现有因特网组件和协议,使得不需要做出新的努力来开发用于经由网络输送视频数据的新技术。其它输送协议(例如,RTP有效负载格式)需要中间网络装置(例如,中间盒)知晓媒体格式和信令上下文。而且,HTTP串流可为客户端驱动的,这避免了许多控制问题。举例来说,为了利用所有特征来获得最佳性能,服务器可跟踪尚未得到应答的包的大小和内容。服务器还可分析文件结构并重构客户端缓冲器的状态以做出RD最佳切换/精简决策。另外,可满足对位流变化的约束以便保持遵从所协商的简档。HTTP在实施HTTP1.1的网络服务器处可能不需要新的硬件或软件实施方案。HTTP串流还可提供TCP友好性和防火墙穿越。本发明的技术可改进视频数据的HTTP串流以克服与带宽有关的问题,例如通过提供位速率调适。
视频压缩标准(例如,ITU-TH. 261、H. 262、H. 263、MPEG-U MPEG-2 和 H. 264/ MPEG-4第10部分)利用运动补偿时间预测来减少时间冗余。编码器使用来自一些先前经编码图片(本文中还称作帧)的运动补偿预测根据运动向量来预测当前经译码图片。在典型视频译码中,存在三种主要图片类型。所述三种主要图片类型为经帧内译码图片(“I图片”或“I帧”)、预测图片(“P图片”或“P帧”)和双向预测图片(“B图片”或“B帧”)。 P图片的块可经帧内译码或参考一个其它图片来预测。在B图片中,块可从一个或两个参考图片来预测,或可经帧内译码。这些参考图片可在时间次序上位于当前图片之前或之后。
3GPP文件格式(3GPP)为ISO媒体基础文件格式的扩展的另一实例。3GPP为由第三代合作伙伴计划(3GPP)针对3G UMTS多媒体服务界定的多媒体容器格式。其通常在3G 移动电话和其它具有3G功能的装置上使用,但还可在一些2G和4G电话和各种其它装置上起作用。3GPP文件格式是基于ISO基础媒体文件格式。最近的3GP在3GPP TS26. 244 “透明的端到端包交换串流服务(PSS) ;3GPP文件格式(3GP) (Transparent end-to-end packet switched streaming service (PSS) ;3GPP file format (3GP)) ”中指定。3GPP 文件格式如同MPEG-4第2部分或H. 263或MPEG-4第10部分(AVC/H. 264)存储视频流。3GPP允许以 ISO基础媒体文件格式(MPEG-4第12部分)使用AMR和H. 263编解码器,因为3GPP指定以 ISO基础媒体文件格式使用样本条目和模板字段以及界定编解码器所参考的新盒。对于以 3GP文件存储MPEG-4媒体特定信息,3GP规范参考MP4和AVC文件格式,所述MP4和AVC文件格式也基于ISO基础媒体文件格式。MP4和AVC文件格式规范描述以ISO基础媒体文件格式使用MPEG-4内容。
3GPP文件格式可支持HTTP串流。在一些实例中,3GPP文件格式可包括媒体呈现描述MPD(例如,如图4中所说明的MPD 432)。MPD可包括不同替代表示(例如,具有不同质量的视频服务)的描述,且所述描述可包括(例如)代码、简档和等级信息。MH)可不为包括视频数 据的3GPP文件的一部分。
图5为描绘用于视频节目的表示540 (例如,以上图4中说明的表示440A到440C 中的一者)的一个实例的框图。图5的实例描绘根据3GPP文件格式的表示540。仅出于解释本发明的技术的目的来提供图5的表示540,且其既定为非限制性的。本发明的技术可应用于视频数据的任何数字表示,而不管本文中是否明确地提及。
如图5中展示,表示540包括电影盒(mooV) 544、段索引盒(sidx) 570和一个或一个以上电影片段(moof)546。为了易于说明,在图5实例中仅描绘一个电影片段546。典型的电影表不540可包括多个电影片段546,如图4中描绘。
电影盒544可包括特定针对于表示540的各种信息。举例来说,电影盒544可指示例如用于串流所述电影表示的所要位速率等信息。电影盒544可代替地或另外地包括特定针对于片段546的信息的一个或一个以上指示。举例来说,电影盒544可包括指示表示中所含有的多个片段546的信息、对应于一个或一个以上片段546的开始和/或结束的重放时间和/或表不540的片段546的位范围的一个或一个以上指不。
表示540可进一步包括一个或一个以上段索引盒570。段索引盒570可在表示540 的一个或一个以上片段546之前。在一些实例中,段索引盒570可在表示540的每一片段 546之前(例如,见图4)。在其它实例中,段索引盒570可在表示的每一片段之前,其中多个片段被布置为一个电影段。
段索引盒570可经配置以发信号通知与用于片段546的随机存取功能性相关的信息。举例来说,根据已知实施方案,段索引盒570可指示片段546的IDR存取点。段索引盒570可进一步指示包括IDR存取点的片段(参考片段)的字节偏移(参考偏移)。段索引盒570可进一步指示参考片段的第一样本的时序信息(参考增量时间)。段索引盒可进一步指示当前电影片段(例如,在段索引盒570之后的片段)是否包括随机存取点(含有 RAP)。段索引盒570可进一步指示电影片段546的第一样本与电影片段546的第一随机存取点之间的时序差异。
以下伪码为根据一些技术的可用以实施段索引盒570的代码的一个实例。以下伪码描述可用于段索引盒数据结构的一些变量。这些变量大体上对应于上文所描述的类似命名的变量。
权利要求
1.一种方法,其包含在客户端装置处从服务器装置接收媒体分段的开放解码刷新ODR随机存取点RAP帧的指示,其中所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODR RAP之前的帧的内容的情况下被正确解码;以及由所述客户端装置向所述服务器装置发送检索以含有所述所指示的ODR RAP帧的所述媒体分段开始的媒体数据流的请求。
2.根据权利要求1所述的方法,其进一步包含在所述客户端装置处接收所述ODR RAP帧是否为所述媒体分段的第一帧的至少一个指示;且其中发送所述请求包含向所述服务器装置发送所述检索以含有所述所指示的ODR RAP 帧的所述媒体分段开始的所述媒体数据流的请求。
3.根据权利要求1所述的方法,其进一步包含在所述ODR RAP帧不是所述媒体分段的第一帧的情况下,在所述客户端装置处接收所述媒体分段的所述第一帧与所述ODR RAP帧之间的偏移的至少一个指示,其中所述偏移描述所述媒体分段的所述第一帧与所述ODR RAP帧之间的多个帧;以及以所述媒体分段的所述ODR RAP帧开始对所述媒体数据流进行解码。
4.根据权利要求1所述的方法,其进一步包含在所述客户端装置处接收所述媒体分段的第一字节与所述ODR RAP帧的第一字节之间的字节偏移的至少一个指示;且其中向所述服务器装置发送所述检索所述媒体数据流的请求包含发送检索所述媒体流的从所述ODR RAP帧的所述第一字节到所述媒体分段的至少末端的一部分的请求。
5.根据权利要求1所述的方法,其进一步包含接收所述媒体分段是否包括瞬时解码刷新IDR RAP帧的至少一个指示;且其中向所述服务器装置发送所述检索以含有所述所指示的ODR RAP帧的媒体分段开始的所述媒体数据流的请求包括基于所述媒体文件是否包括瞬时解码刷新IDR RAP帧的所述至少一个指示来发送所述请求。
6.根据权利要求1所述的方法,其进一步包含将所述请求构造为检索在含有所述ODR RAP帧的所述媒体分段的开始处开始的所述流的超文本传送协议HTTP获取请求。
7.根据权利要求6所述的方法,其进一步包含将所述请求构造为检索在所述媒体分段内的所述ODR RAP帧的位置处开始的流的包括字节范围的指示的超文本传送协议HTTP获取请求。
8.根据权利要求1所述的方法,其中所述指示包含呈现时间小于所述媒体文件内的所述ODR RAP帧的呈现时间的多个帧的指示,所述方法进一步包含跳过对呈现时间小于所述ODR RAP帧的所述呈现时间的所述多个帧的解码。
9.一种装置,其包含用于从服务器装置接收媒体分段的开放解码刷新ODR随机存取点RAP帧的指示的装置,其中所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODR RAP之前的帧的内容的情况下被正确解码;以及 用于向所述服务器装置发送检索以所述所指示的ODR RAP帧开始的媒体数据流的请求的装置。
10.根据权利要求9所述的装置,其进一步包含 用于接收所述ODR RAP帧是否为所述媒体分段的第一帧的至少一个指示的装置;且 其中所述用于发送请求的装置向所述服务器装置发送检索以含有所述所指示的ODRRAP帧的所述媒体分段开始的所述媒体数据流的请求。
11.根据权利要求9所述的装置,其进一步包含 用于在所述ODR RAP帧不是所述媒体分段的第一帧的情况下接收所述媒体分段的所述第一帧与所述ODR RAP帧之间的偏移的至少一个指示的装置,其中所述偏移描述所述媒体分段的所述第一帧与所述ODR RAP帧之间的多个帧;以及 用于以所述媒体分段的所述ODR RAP帧开始对所述媒体数据流进行解码的装置。
12.根据权利要求9所述的装置,其进一步包含 用于接收所述媒体分段的第一字节与所述ODR RAP帧的第一字节之间的字节偏移的至少一个指示的装置;且 其中所述用于向所述服务器装置发送所述请求的装置发送检索所述媒体流的从所述ODR RAP帧的所述第一字节到所述媒体分段的至少末端的一部分的请求。
13.根据权利要求9所述的装置,其进一步包含 用于接收所述媒体分段是否包括瞬时解码刷新IDR RAP帧的至少一个指示的装置;且 其中所述用于发送请求的装置基于所述媒体文件是否包括瞬时解码刷新IDR RAP帧的所述至少一个指示来发送所述检索以含有所述所指示的ODR RAP帧的媒体分段开始的所述媒体数据流的请求。
14.根据权利要求9所述的装置,其中所述用于发送所述请求的装置将所述请求构造为检索在含有所述ODR RAP帧的所述媒体分段的开始处开始的所述流的超文本传送协议HTTP获取请求。
15.根据权利要求14所述的装置,其中所述用于发送所述请求的装置将所述请求构造为检索在所述媒体分段内的所述ODR RAP帧的位置处开始的所述流的包括字节范围的指示的超文本传送协议HTTP获取请求。
16.根据权利要求9所述的装置,其中所述指示包含呈现时间小于所述媒体文件内的所述ODR RAP的呈现时间的多个帧的指示,且所述装置进一步包含 用于跳过对呈现时间小于所述ODR RAP帧的所述呈现时间的所述多个帧的解码的装置。
17.一种计算机可读存储媒体,其包含在执行时致使客户端计算装置的处理器进行以下操作的指令 在客户端装置处从服务器装置接收媒体分段的开放解码刷新ODR随机存取点RAP帧的指示,其中所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODR RAP之前的帧的内容的情况下被正确解码;以及由所述客户端装置向所述服务器装置发送检索以含有所述所指示的ODR RAP帧的所述媒体分段开始的媒体数据流的请求。
18.根据权利要求17所述的计算机可读存储媒体,其中所述指令进一步致使所述计算装置在所述客户端装置处接收所述ODR RAP帧是否为所述媒体分段的第一帧的至少一个指示;以及向所述服务器装置发送所述检索以含有所述所指示的ODR RAP帧的所述媒体分段开始的所述媒体数据流的请求。
19.根据权利要求17所述的计算机可读存储媒体,其中所述指令进一步致使所述计算装置在所述ODR RAP帧不是所述媒体分段的第一帧的情况下,在所述客户端装置处接收所述媒体分段的所述第一帧与所述ODR RAP帧之间的偏移的至少一个指示,其中所述偏移描述所述媒体分段的所述第一帧与所述ODR RAP帧之间的多个帧;以及以所述媒体分段的所述ODR RAP帧开始对所述媒体数据流进行解码。
20.根据权利要求17所述的计算机可读存储媒体,其中所述指令进一步致使所述计算装置在所述客户端装置处接收所述媒体分段的第一字节与所述ODR RAP帧的第一字节之间的字节偏移的至少一个指示;以及向所述服务器装置发送检索所述媒体流的从所述ODR RAP帧的所述第一字节到所述媒体分段的至少末端的一部分的请求。
21.根据权利要求17所述的计算机可读存储媒体,其中所述指令进一步致使所述计算装置接收所述媒体分段是否包括瞬时解码刷新IDR RAP帧的至少一个指示;以及基于所述媒体文件是否包括瞬时解码刷新IDR RAP帧的所述至少一个指示来发送所述请求。
22.根据权利要求17所述的计算机可读存储媒体,其中所述指令进一步致使所述计算装置将所述请求构造为检索在含有所述ODR RAP帧的所述媒体分段的开始处开始的所述流的超文本传送协议HTTP获取请求。
23.根据权利要求22所述的计算机可读存储媒体,其中所述指令进一步致使所述计算装置将所述请求构造为检索在所述媒体分段内的所述ODR RAP帧的位置处开始的流的包括字节范围的指示的超文本传送协议HTTP获取请求。
24.根据权利要求17所述的计算机可读存储媒体,其中所述指示包含呈现时间小于所述媒体文件内的所述ODR RAP帧的呈现时间的多个帧的指示,其中所述指令进一步致使所述计算装置跳过对呈现时间小于所述ODR RAP帧的所述呈现时间的所述多个帧的解码。
25.一种包含一个或一个以上处理器的装置,所述一个或一个以上处理器经配置以接收媒体分段的开放解码刷新ODR随机存取点RAP帧的指示,其中所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODR RAP之前的帧的内容的情况下被正确解码;以及 向服务器装置发送检索以含有所述所指示的ODR RAP帧的所述媒体分段开始的媒体数据流的请求。
26.根据权利要求25所述的装置,其中一个或一个以上处理器进一步经配置以 接收所述ODR RAP帧是否为所述媒体分段的第一帧的至少一个指示;以及 向所述服务器装置发送所述检索以含有所述所指示的ODR RAP帧的所述媒体分段开始的所述媒体数据流的请求。
27.根据权利要求25所述的装置,其中所述处理器进一步经配置以 在所述ODR RAP帧不是所述媒体分段的第一帧的情况下,接收所述媒体分段的所述第一帧与所述ODR RAP帧之间的偏移的至少一个指示,其中所述偏移描述所述媒体分段的所述第一帧与所述ODR RAP帧之间的多个帧;以及 以所述媒体分段的所述ODR RAP帧开始对所述媒体数据流进行解码。
28.根据权利要求25所述的装置,其中所述处理器进一步经配置以 接收所述媒体分段的第一字节与所述ODR RAP帧的第一字节之间的字节偏移的至少一个指示;以及 发送检索所述媒体流的从所述ODR RAP帧的所述第一字节到所述媒体分段的至少末端的一部分的请求。
29.根据权利要求25所述的装置,其中所述处理器进一步经配置以 接收所述媒体分段是否包括瞬时解码刷新IDR RAP帧的至少一个指示;以及 基于所述媒体文件是否包括瞬时解码刷新IDR RAP帧的所述至少一个指示来发送所述请求。
30.根据权利要求25所述的装置,其中所述处理器进一步经配置以 将所述请求构造为检索在含有所述ODR RAP帧的所述媒体分段的开始处开始的所述流的超文本传送协议HTTP获取请求。
31.根据权利要求30所述的装置,其中所述处理器进一步经配置以 将所述请求构造为检索在所述媒体分段内的所述ODR RAP帧的位置处开始的流的包括字节范围的指示的超文本传送协议HTTP获取请求。
32.根据权利要求25所述的装置,其中所述指示包含呈现时间小于所述媒体文件内的所述ODR RAP帧的呈现时间的多个帧的指示,且其中所述处理器进一步经配置以 跳过对呈现时间小于所述ODR RAP帧的所述呈现时间的所述多个帧的解码。
33.一种方法,其包含 接收包含媒体分段的开放解码刷新ODR随机存取点RAP帧的经编码视频帧序列,其中所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODR RAP之前的帧的内容的情况下被正确解码; 产生所述ODR RAP在所述经编码视频帧序列内的位置的指示;以及 输出所述指示。
34.根据权利要求33所述的方法,其进一步包含接收检索以所述所指示的ODR RAP帧开始的媒体数据流的请求;以及响应于所述请求,输出以含有所述所指示的ODR RAP帧的所述媒体分段开始的所述媒体数据流。
35.根据权利要求34所述的方法,其中所述请求包含检索在含有所述ODRRAP帧的所述媒体分段的开始处开始的所述流的超文本传送协议HTTP获取请求,且所述方法进一步包含响应于所述请求而提供所述经编码视频帧序列的在含有所述ODR RAP帧的所述媒体分段的开始处开始的一部分。
36.根据权利要求34所述的方法,其中所述请求包含检索在所述媒体分段内的所述 ODR RAP帧的位置处开始的所述流的包括字节范围的指示的超文本传送协议HTTP获取请求,且所述方法进一步包含提供所述经编码视频帧序列的在所述媒体分段内的所述ODR RAP帧的所述位置处开始的一部分。
37.一种装置,其包含用于接收包含媒体分段的开放解码刷新ODR随机存取点RAP帧的经编码视频帧序列的装置,其中所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODR RAP之前的帧的内容的情况下被正确解码;用于产生所述ODR RAP在所述经编码视频帧序列内的位置的指示的装置;以及用于输出所述指示的装置。
38.根据权利要求37所述的装置,其中所述用于接收的装置接收检索以所述所指示的 ODR RAP帧开始的媒体数据流的请求;以及用于响应于所述请求而输出以含有所述所指示的ODR RAP帧的所述媒体分段开始的所述媒体数据流的装置。
39.根据权利要求37所述的装置,其中所述请求包含检索在含有所述ODRRAP帧的所述媒体分段的开始处开始的所述流的超文本传送协议HTTP获取请求,且所述装置进一步包含用于响应于所述请求而提供所述经编码视频帧序列的在含有所述ODR RAP帧的所述媒体分段的开始处开始的一部分的装置。
40.根据权利要求37所述的装置,其中所述请求包含检索在所述媒体分段内的所述 ODR RAP帧的位置处开始的所述流的包括字节范围的指示的超文本传送协议HTTP获取请求,且所述装置进一步包含用于提供所述经编码视频帧序列的在所述媒体分段内的所述ODR RAP帧的所述位置处开始的一部分的装置。
41.一种计算机可读存储媒体,其包含在执行时致使源装置的一个或一个以上处理器进行以下操作的指令接收包含媒体分段的开放解码刷新ODR随机存取点RAP帧的经编码视频帧序列,其中所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODR RAP之前的帧的内容的情况下被正确解码; 产生所述ODR RAP在所述经编码视频帧序列内的位置的指示;以及 输出所述指示。
42.根据权利要求41所述的计算机可读存储媒体,其进一步包含 致使所述一个或一个以上处理器发送检索以所述所指示的ODR RAP帧开始的媒体数据流的请求的指令;以及 响应于所述请求,输出以含有所述所指示的ODR RAP帧的所述媒体分段开始的所述媒体数据流。
43.根据权利要求42所述的计算机可读存储媒体,其中所述请求包含检索在含有所述O DR RAP帧的所述媒体分段的开始处开始的所述流的超文本传送协议HTTP获取请求,且所述计算机可读存储媒体进一步包含 致使所述一个或一个以上处理器响应于所述请求而提供所述经编码视频帧序列的在含有所述ODR RAP帧的所述媒体分段的开始处开始的一部分的指令。
44.根据权利要求42所述的计算机可读存储媒体,其中所述请求包含检索在所述媒体分段内的所述ODR RAP帧的位置处开始的所述流的包括字节范围的指示的超文本传送协议HTTP获取请求,且所述计算机可读存储媒体进一步包含且其中所述指令进一步致使所述一个或一个以上处理器 提供所述经编码视频帧序列的在所述媒体分段内的所述ODR RAP帧的所述位置处开始的一部分。
45.一种包含一个或一个以上处理器的装置,所述一个或一个以上处理器经配置以 接收包含媒体分段的开放解码刷新ODR随机存取点RAP帧的经编码视频帧序列,其中所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODR RAP之前的帧的内容的情况下被正确解码; 产生所述ODR RAP在所述经编码视频帧序列内的位置的指示;以及 输出所述指示。
46.根据权利要求45所述的装置,其中所述一个或一个以上处理器进一步经配置以 接收检索以所述所指示的ODR RAP帧开始的媒体数据流的请求;以及 响应于所述请求,输出以含有所述所指示的ODR RAP帧的所述媒体分段开始的所述媒体数据流。
47.根据权利要求46所述的装置,其中所述请求包含检索在含有所述ODRRAP帧的所述媒体分段的开始处开始的所述流的超文本传送协议HTTP获取请求,其中所述一个或一个以上处理器进一步经配置以 响应于所述请求而提供所述经编码视频帧序列的在含有所述ODR RAP帧的所述媒体分段的开始处开始的一部分。
48.根据权利要求47所述的装置,其中所述请求包含检索在所述媒体分段内的所述ODR RAP帧的位置开始的所述流的包括字节范围的指示的超文本传送协议HTTP获取请求,其中所述一个或一个以上处理器进一步经配置以提供 所述经编码视频帧序列的在所述媒体分段内的所述ODR RAP帧的所述位置处开始的一部分。
全文摘要
本发明描述与媒体数据的HTTP串流相关的技术。根据这些技术,服务器装置可发信号通知电影表示的电影分段的开放解码刷新ODR随机存取点RAP。所述媒体分段的按解码次序在所述ODR RAP帧之后的至少一个帧可能不被正确解码,且其中所述媒体分段的按显示次序在所述ODR RAP帧之后的每一帧可在不依赖于按显示次序在所述ODR RAP之前的帧的内容的情况下被正确解码。根据本发明的所述技术,客户端装置可基于所述ODR RAP的发信号通知来向服务器装置递送针对所述串流媒体数据的请求。还根据本发明的所述技术,客户端装置可基于所述ODR RAP的发信号通知来开始所述电影表示的解码和/或重放。
文档编号H04N21/854GK103039087SQ201180037742
公开日2013年4月10日 申请日期2011年6月29日 优先权日2010年6月29日
发明者陈盈, 马尔塔·卡切维奇 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1