编码和解码方法与流程

文档序号:11412411阅读:364来源:国知局
编码和解码方法与流程
编码和解码方法本申请是申请日为2008年4月7日、申请号为200880012349.X、发明名称为“编码系统”的发明专利申请的分案申请。相关申请的交叉引用本申请要求下列每一项的优先权,并且因此为所有目的将其以全文引用的方式并入本文中:(1)2007年4月18日提交(代理人案号PU070101)的美国临时申请序号No.60/923,993,题为“SupplementalSequenceParameterSetforScalableVideoCodingorMulti-viewVideoCoding”以及(2)2007年6月28日提交(代理人案号PA070032)的美国专利申请序号No.11/824,006,题为“SupplementalSequenceParameterSetforScalableVideoCodingorMulti-viewVideoCoding”。技术领域至少一个实现方式涉及以可缩放方式对视频数据进行编码和解码。

背景技术:
当数据所针对的终端具有不同的能力并且因此不对全部数据流进行解码而仅对全部数据流的一部分进行解码时,根据多个层对视频数据进行编码可以是有用的。当以可缩放方式根据多个层对视频数据进行编码时,接收终端可以根据终端的简档从接收到的比特流中提取一部分数据。完整的数据流还可以传输用于每一个所支持的层的开销信息,以便于在终端处对每一层进行解码。

技术实现要素:
根据一个总的方面,访问来自序列参数集(“SPS”)网络抽象层(“NAL”)单元的信息。所述信息描述在对图像序列的第一层编码进行解码中使用的参数。还访问来自补充SPSNAL单元的信息,补充SPSNAL单元具有与SPSNAL单元不同的结构。来自补充SPSNAL单元的信息描述在对图像序列的第二层编码进行解码中使用的参数。基于第一层编码、第二层编码、所访问的来自SPSNAL单元的信息、以及所访问的来自补充SPSNAL单元的信息,来生成图像序列的解码。根据另一个总的方面,使用了一种语法结构,所述语法结构提供对图像序列进行多层解码。所述语法结构包括用于SPSNAL单元的语法,SPSNAL单元包括描述在对图像序列的第一层编码进行解码中使用的参数的信息。所述语法结构还包括用于补充SPSNAL单元的语法,补充SPSNAL单元具有与SPSNAL单元不同的结构。补充SPSNAL单元包括描述在对图像序列的第二层编码进行解码中使用的参数的信息。基于第一层编码、第二层编码、来自SPSNAL单元的信息、以及来自补充SPSNAL单元的信息,可以生成图像序列的解码。根据另一个总的方面,一种信号被格式化为包括来自SPSNAL单元的信息。所述信息描述在对图像序列的第一层编码进行解码中使用的参数。所述信号还被格式化为包括来自补充SPSNAL单元的信息,补充SPSNAL单元具有与SPSNAL单元不同的结构。来自补充SPSNAL单元的信息描述在对图像序列的第二层编码进行解码中使用的参数。根据另一个总的方面,生成SPSNAL单元,所述SPSNAL单元包括描述在对图像序列的第一层编码进行解码中使用的参数的信息。生成补充SPSNAL单元,补充SPSNAL单元具有与SPSNAL单元不同的结构。补充SPSNAL单元包括描述在对图像序列的第二层编码进行解码中使用的参数的信息。提供包括图像序列的第一层编码、图像序列的第二层编码、SPSNAL单元、以及补充SPSNAL单元在内的数据集合。根据另一个总的方面,使用了一种语法结构,所述语法结构提供对图像序列进行多层编码。所述语法结构包括用于SPSNAL单元的语法。SPSNAL单元包括描述在对图像序列的第一层编码进行解码中使用的参数的信息。所述语法结构包括用于补充SPSNAL单元的语法。补充SPSNAL单元具有与SPSNAL单元不同的结构。补充SPSNAL单元包括描述在对图像序列的第二层编码进行解码中使用的参数的信息。提供包括图像序列的第一层编码、图像序列的第二层编码、SPSNAL单元、以及补充SPSNAL单元在内的数据集合。根据另一个总的方面,访问第一规范参数集合中的依赖于第一层的信息。所访问的依赖于第一层的信息在对图像序列的第一层编码进行解码中使用。访问第二规范参数集合中的依赖于第二层的信息。所述第二规范参数集合具有与第一规范参数集合不同的结构。所访问的依赖于第二层的信息在对图像序列的第二层编码进行解码中使用。基于所访问的依赖于第一层的信息或者所访问的依赖于第二层的信息中的一个或者更多,来对图像序列进行解码。根据另一个总的方面,生成包括依赖于第一层的信息在内的第一规范参数集合。所述依赖于第一层的信息在对图像序列的第一层编码进行解码中使用。生成具有与第一规范参数集合不同结构的第二规范参数集合。所述第二规范参数集合包括依赖于第二层的信息,所述依赖于第二层的信息在对图像序列的第二层编码进行解码中使用。提供包括第一规范参数集合和第二规范参数集合在内的数据集合。根据另一个总的方面,一种用于多视点视频编码“MVC”的解码方法,所述方法包括:访问来自序列参数集网络抽象层单元“SPSNAL单元”的信息,所述信息描述至少在对图像序列中的第一MVC层编码进行解码中使用的参数;访问来自补充SPSNAL单元的补充信息,补充SPSNAL单元具有与SPSNAL单元不同的NAL单元类型代码,并且具有与SPSNAL单元不同的语法结构,并且来自补充SPSNAL单元的补充信息描述在对图像序列中的第二MVC层编码进行解码中使用的参数;以及基于来自SPSNAL单元的访问的信息对第一MVC层的编码进行解码,以及基于来自补充SPSNAL单元的访问的补充信息对第二MVC层的编码进行解码。根据另一个总的方面,一种用于多视点视屏编码“MVC”处理的方法,所述方法包括:访问来自序列参数集网络抽象层单元“SPSNAL单元”的信息,所述信息描述至少在对图像序列中的第一MVC层编码进行解码中使用的参数;访问来自补充SPSNAL单元的补充信息,补充SPSNAL单元具有与SPSNAL单元不同的NAL单元类型代码,并且具有与SPSNAL单元不同的语法结构,并且来自补充SPSNAL单元的补充信息描述MVC视频可用性信息“VUI”参数,该参数在对图像序列中的第二MVC层编码进行解码中使用,其中,在包括时间指示符的补充信息中反映不同的结构,所述时间指示符指示MVCVUI参数应用于第二MVC层的编码;以及基于来自SPSNAL单元的访问的信息对第一MVC层的编码进行解码,以及基于来自补充SPSNAL单元的访问的补充信息对第二MVC层的编码进行解码。根据另一个总的方面,一种用于多视点视频编码“MVC”处理的编码方法,所述方法包括:生成序列参数集网络抽象层单元“SPSNAL单元”的信息,所述信息描述至少在对图像序列中的第一MVC层编码进行解码中使用的参数;生成补充SPSNAL单元的补充信息,补充SPSNAL单元具有与SPSNAL单元不同的NAL单元类型代码,并且具有与SPSNAL单元不同的语法结构,并且补充SPSNAL单元的补充信息描述在对图像序列中的第二MVC层编码进行解码中使用的参数;基于生成的SPSNAL单元的信息来编码以便生成第一MVC层的编码;以及基于生成的补充SPSNAL单元的补充信息来编码以便生成第二MVC层的编码。根据另一个总的方面,一种用于多视点视频编码“MVC”处理的方法,所述方法包括:访问来自序列参数集网络抽象层单元“SPSNAL单元”的信息,所述信息描述至少在对图像序列中的第一MVC层编码进行解码中使用的参数;访问来自补充SPSNAL单元的补充信息,补充SPSNAL单元具有与SPSNAL单元不同的NAL单元类型代码,并且具有与SPSNAL单元不同的语法结构,并且来自补充SPSNAL单元的补充信息描述MVC视频可用性信息“VUI”参数,该参数在对图像序列中的第二MVC层的编码进行解码中使用,以及基于来自SPSNAL单元的访问的信息对第一MVC层的编码进行解码,以及基于来自补充SPSNAL单元的访问的补充信息对第二MVC层的编码进行解码。根据另一个总的方面,一种用于多视点视频编码“MVC”处理的编码方法,所述方法包括:生成序列参数集网络抽象层单元“SPSNAL单元”的信息,所述信息描述至少在对图像序列中的第一MVC层编码进行解码中使用的参数;生成补充SPSNAL单元的补充信息,补充SPSNAL单元具有与SPSNAL单元不同的NAL单元类型代码,并且具有与SPSNAL单元不同的语法结构,并且补充SPSNAL单元的补充信息描述MVC视频可用性信息“VUI”参数,该参数在对图像序列中的第二MVC层编码进行解码中使用,其中,在包括时间指示符的补充信息中反映不同的结构,所述时间指示符指示MVCVUI参数应用于第二MVC层的编码;基于生成的SPSNAL单元的信息来编码以便生成第一MVC层的编码;以及基于生成的补充SPSNAL单元的补充信息来编码以便生成第二MVC层的编码。根据另一个总的方面,一种方法,包括:访问来自序列参数集“SPS”网络抽象层“NAL”单元的信息,所述信息描述在对图像序列中的图像的第一层编码进行解码中使用的参数;访问来自补充SPSNAL单元的补充信息,补充SPSNAL单元具有与SPSNAL单元不同的NAL单元类型代码,并且具有与SPSNAL单元不同的语法结构,并且来自补充SPSNAL单元的补充信息描述在对图像序列中的图像的第二层编码进行解码中使用的参数;以及分别基于来自SPSNAL单元的访问的信息,和来自补充SPSNAL单元的访问的补充信息,对第一层编码和第二层编码进行解码。在下面的附图和描述中阐述了一个或者更多实现方式的细节。即使以一个特定方式来描述,也应当清楚,可以以各种方式来配置或者实施实现方式。例如,可以将实现方式作为方法执行,或者实施为设备,例如配置为执行操作集合的设备或者存储用于执行操作集合的指令的设备,或者在信号中实施。通过结合附图和权利要求来考虑的以下详细描述,其它方面和特征将变得显而易见。附图说明图1示出了编码器的实现方式的框图。图1a示出了编码器的另一个实现方式的框图。图2示出了解码器的实现方式的框图。图2a示出了解码器的另一个实现方式的框图。图3示出了单层序列参数集(“SPS”)网络抽象层(“NAL”)单元的实现方式的结构。图4示出了部分数据流的示例的方框视图,示意了SPSNAL单元的使用。图5示出了补充SPS(“SUPSPS”)NAL单元的实现方式的结构。图6示出了SPS单元和多个SUPSPS单元之间的组织分级的实现方式。图7示出了SUPSPSNAL单元的另一个实现方式的结构。图8示出了生成SUPSPS单元的可缩放视频编码器的实现方式的功能视图。图9示出了生成包含SUPSPS单元的数据流的实现方式的分级视图。图10示出了由图9的实施生成的数据流的示例的方框视图。图11示出了编码器的实现方式的框图。图12示出了编码器的另一个实现方式的框图。图13示出了由图11或者12的编码器所使用的编码过程的实现方式的流程图。图14示出了由图13的过程生成的数据流的示例的方框视图。图15示出了解码器的实现方式的框图。图16示出了解码器的另一个实现方式的框图。图17示出了由图15或者16的解码器所使用的解码过程的实现方式的流程图。具体实施方式今天存在多种可以根据不同层和/或简档来对视频数据进行编码的视频编码标准。其中,可以引用H.264/MPEG-4AVC(“AVC标准”),也称作国际标准化组织/国际电子技术委员会(ISO/IEC)运动图像专家组-4(MPEG-4)第10部分高级视频编码(AVC)标准/国际电信联盟电信分部(ITU-T)H.264建议。此外,存在对于AVC标准的扩展。第一个这种扩展是可缩放视频编码(“SVC”)扩展(附录G),称作H.264/MPEG-4AVC,可缩放视频编码扩展(“SVC扩展”)。第二个这种扩展是多视点视频编码(“MVC”)扩展(附录H),称作H.264/MPEG-4AVC,MVC扩展(“MVC扩展”)。本公开中描述的至少一个实现方式可以与AVC标准以及SVC和MVC扩展一起使用。该实现方式提供具有与SPSNAL单元不同的NAL单元类型的补充(“SUP”)序列参数集(“SPS”)网络抽象层(“NAL”)单元。SPS单元典型地包括(但不是必须包括)用于至少单个层的信息。此外,SUPSPSNAL单元包括用于至少一个附加层的依赖于层的信息。因此,通过访问SPS和SUPSPS单元,解码器具有对比特流进行解码所需的可用特定(典型地为全部)依赖于层的信息。在AVC系统中使用该实现方式,不需要传输SUPSPSNAL单元,并且可以传输单层SPSNAL单元(如下所述)。在SVC(或者MVC)系统中使用该实现方式,除了SPSNAL单元之外,可以传输用于所需附加层(或者视点)的SUPSPSNAL单元。在包括AVC兼容解码器和SVC兼容(或者MVC兼容)解码器的系统中使用该实现方式,AVC兼容解码器可以通过检测NAL单元类型来忽略SUPSPSNAL单元。在每一种情况中,可以实现高效率和兼容性。上述实现方式还对施加下述要求的系统(标准或其它)提供益处:要求特定层共享首部信息(例如,SPS或者在SPS中典型携带的特定信息)。例如,如果基础层及其合成时间层需要共享SPS,则不能用共享的SPS来传输依赖于层的信息。然而,SUPSPS提供了一种用于传输依赖于层的信息的机制。各种实现方式的SUPSPS还提供了高效的优点:SUPSPS不需要包括并且因此不需要重复SPS中的所有参数。SUPSPS将典型地专注于依赖于层的参数。然而,各种实现方式包括SUPSPS结构,该结构包括不依赖于层的参数,或者甚至重复全部SPS结构。各种实现方式涉及SVC扩展。SVC扩展提出根据多个空间等级、时间等级以及质量等级的视频数据的传输。对于一个空间等级,可以根据多个时间等级来进行编码,对于每一个时间等级,可以根据多个质量等级来进行编码。因此,当定义有m个空间等级、n个时间等级、以及O个质量等级时,可以根据m*n*O个不同组合来对视频数据进行编码。将这些组合称作层,或者互操作性点(“IOP”)。根据解码器(也称作接收机或者客户端)的能力,可以传输不同层,多至与最大客户端能力相对应的特定层。如本文所使用的,“依赖于层”的信息是指具体与单一层相关的信息。即,顾名思义,该信息依赖于特定层。这种信息不一定随层与层而不同,但是典型地对于每一层单独提供这种信息。如本文所使用的,“高等级语法”是指在比特流中出现的、在分级中位于宏块层之上的语法。例如,如本文所使用的,高等级语法可以指(但不限于):片首部等级、补充增强信息(SEI)等级、画面参数集(PPS)等级、序列参数集(SPS)等级、以及网络抽象层(NAL)单元首部等级的语法。参见图1,由参考数字100来总体指示示例SVC编码器。SVC编码器100还可以用于AVC编码,即用于单层(例如基础层)。此外,如本领域普通技术人员将理解的,SVC编码器100可以用于MVC编码。例如,SVC编码器100的各种组件,或者这些组件的变型,可以在对多视点进行编码中使用。时间分解模块142的第一输出以信号通信方式与帧内块的帧内预测模块146的第一输入连接。时间分解模块142的第二输出以信号通信方式与运动编码模块144的第一输入连接。帧内块的帧内预测模块146的输出以信号通信方式与变换/熵编码器(信噪比(SNR)可缩放)149的输入连接。变换/熵编码器149的第一输出以信号通信方式与复用器170的第一输入连接。时间分解模块132的第一输出以信号通信方式与帧内块的帧内预测模块136的第一输入连接。时间分解模块132的第二输出以信号通信方式与运动编码模块134的第一输入连接。帧内块的帧内预测模块136的输出以信号通信方式与变换/熵编码器(信噪比(SNR)可缩放)139的输入连接。变换/熵编码器139的第一输出以信号通信方式与复用器170的第一输入连接。变换/熵编码器149的第二输出以信号通信方式与2D空间插值模块138的输入连接。2D空间插值模块138的输出以信号通信方式与帧内块的帧内预测模块136的第二输入连接。运动编码模块144的第二输出以信号通信方式与运动编码模块134的输入连接。时间分解模块122的第一输出以信号通信方式与帧内预测器126的第一输入连接。时间分解模块122的第二输出以信号通信方式与运动编码模块124的第一输入连接。帧内预测器126的输出以信号通信方式与变换/熵编码器(信噪比(SNR)可缩放)129的输入连接。变换/熵编码器129的第一输出以信号通信方式与复用器170的第一输入连接。变换/熵编码器139的第二输出以信号通信方式与2D空间插值模块128的输入连接。2D空间插值模块128的输出以信号通信方式与帧内预测器126的第二输入连接。运动编码模块134的第二输出以信号通信方式与运动编码模块124的输入连接。运动编码模块124的第一输出、运动编码模块134的第一输出、以及运动编码模块144的第一输出均以信号通信方式与复用器170的第二输入连接。2D空间抽取模块104的第一输出以信号通信方式与时间分解模块132的输入连接。2D空间抽取模块104的第二输出以信号通信方式与时间分解模块142的输入连接。时间分解模块122的输入以及2D空间抽取模块104的输入可用作编码器100的输入,用于接收输入视频102。复用器170的输出可用作编码器100的输出,用于提供比特流180。在编码器100的核心编码器部分187中包括:时间分解模块122、时间分解模块132、时间分解模块142、运动编码模块124、运动编码模块134、运动编码模块144、帧内预测器126、帧内预测器136、帧内预测器146、变换/熵编码器129、变换/熵编码器139、变换/熵编码器149、2D空间插值模块128、以及2D空间插值模块138。图1包括三个核心编码器187。在图中所示的实现方式中,最底部的核心编码器187可以对基础层进行编码,中间和上部的核心编码器187对较高层进行编码。转到图2,由参考数字200总体指示示例SVC解码器。SVC解码器200还可以用于AVC解码,即用于单一视点。此外,本领域普通技术人员将理解,SVC解码器200可以用于MVC解码。例如,SVC解码器200的各种组件,或者这些组件的不同变型可以在对多个视点的解码中使用。注意,可以将编码器100和解码器200,以及本公开中讨论的其它编码器和解码器,配置为执行贯穿本公开示出的各种方法。除了执行编码操作之外,为了对解码器的预期行动进行镜像,本公开中描述的编码器可以执行重构过程期间的各种解码操作。例如,为了产生编码视频数据的重构以预测附加视频数据,编码器可以对SUPSPS单元进行解码以对编码的视频数据进行解码。因此,编码器可以执行由解码器执行的实质上所有操作。解复用器202的输入可用作对可缩放视频解码器200的输入,用于接收可缩放比特流。解复用器202的第一输出以信号通信方式与空间反变换SNR可缩放熵解码器204的输入连接。空间反变换SNR可缩放熵解码器204的第一输出以信号通信方式与预测模块206的第一输入连接。预测模块206的输出以信号通信方式与组合器230的第一输入连接。空间反变换SNR可缩放熵解码器204的第二输出以信号通信方式与运动向量(MV)解码器210的第一输入连接。MV解码器210的输出以信号通信方式与运动补偿器232的输入连接。运动补偿器232的输出以信号通信方式与组合器230的第二输入连接。解复用器202的第二输出以信号通信方式与空间反变换SNR可缩放熵解码器212的输入连接。空间反变换SNR可缩放熵解码器212的第一输出以信号通信方式与预测模块214的第一输入连接。预测模块214的第一输出以信号通信方式与插值模块216的输入连接。插值模块216的输出以信号通信方式与预测模块206的第二输入连接。预测模块214的第二输出以信号通信方式与组合器240的第一输入连接。空间反变换SNR可缩放熵解码器212的第二输出以信号通信方式与MV解码器220的第一输入连接。MV解码器220的第一输出以信号通信方式与MV解码器210的第二输入连接。MV解码器220的第二输出以信号通信方式与运动补偿器242的输入连接。运动补偿器242的输出以信号通信方式与组合器240的第二输入连接。解复用器202的第三输出以信号通信方式与空间反变换SNR可缩放熵解码器222的输入连接。空间反变换SNR可缩放熵解码器222的第一输出以信号通信方式与预测模块224的输入连接。预测模块224的第一输出以信号通信方式与插值模块226的输入连接。插值模块226的输出以信号通信方式与预测模块214的第二输入连接。预测模块224的第二输出以信号通信方式与组合器250的第一输入连接。空间反变换SNR可缩放熵解码器222的第二输出以信号通信方式与MV解码器230的输入连接。MV解码器230的第一输出以信号通信方式与MV解码器220的第二输入连接。MV解码器230的第二输出以信号通信方式与运动补偿器252的输入连接。运动补偿器252的输出以信号通信方式与组合器250的第二输入连接。组合器250的输出可用作解码器200的输出,用于输出层0信号。组合器240的输出可用作解码器200的输出,用于输出层1信号。组合器230的输出可用作解码器200的输出,用于输出层2信号。参见图1a,由参考数字2100来总体指示示例AVC编码器。AVC编码器2100可以用于例如对单一层(例如,基础层)进行编码。视频编码器2100包括帧排序缓冲器2110,缓冲器2110具有与组合器2185的非反相输入进行信号通信的输出。组合器2185的输出以信号通信方式与变换器和量化器2125的第一输入连接。变换器和量化器2125的输出以信号通信方式与熵编码器2145的第一输入以及反变换器和反量化器2150的第一输入连接。熵编码器2145的输出以信号通信方式与组合器2190的第一非反相输入连接。组合器2190的输出以信号通信方式与输出缓冲器2135的第一输入连接。编码器控制器2105的第一输出以信号通信方式与帧排序缓冲器2110的第二输入、反变换器和反量化器2150的第二输入、画面类型判定模块2115的输入、宏块类型(MB类型)判定模块2120的输入、帧内预测模块2160的第二输入、解块滤波器2165的第二输入、运动补偿器2170的第一输入、运动估计器2175的第一输入、以及参考画面缓冲器2180的第二输入相连接。编码器控制器2105的第二输出以信号通信方式与补充增强信息(“SEI”)插入器2130的第一输入、变换器和量化器2125的第二输入、熵编码器2145的第二输入、输出缓冲器2135的第二输入、序列参数集(SPS)和画面参数集(PPS)插入器2140的输入相连接。图像类型判定模块2115的第一输出以信号通信方式与帧排序缓冲器2110的第三输入连接。图像类型判定模块2115的第二输出以信号通信方式与宏块类型判定模块2120的第二输入连接。序列参数集(“SPS”)和画面参数集(“PPS”)插入器2140的输出以信号通信方式与组合器2190的第三非反相输入连接。SEI插入器2130的输出以信号通信方式与组合器2190的第二非反相输入连接。反量化器和反变换器2150的输出以信号通信方式与组合器2127的第一非反相输入连接。组合器2127的输出以信号通信方式与帧内预测模块2160的第一输入以及解块滤波器2165的第一输入连接。解块滤波器2165的输出以信号通信方式与参考画面缓冲器2180的第一输入连接。参考图像缓冲器2180的输出以信号通信方式与运动估计器2175的第二输入以及运动补偿器2170的第一输入连接。运动估计器2175的第一输出以信号通信方式与运动补偿器2170的第二输入连接。运动估计器2175的第二输出以信号通信方式与熵编码器2145的第三输入连接。运动补偿器2170的输出以信号通信方式与开关2197的第一输入连接。帧内预测模块2160的输出以信号通信方式与开关2197的第二输入连接。宏块类型判定模块2120的输出以信号通信方式与开关2197的第三输入连接,以向开关2197提供控制输入。开关2197的输出以信号通信方式与组合器2127的第二非反相输入以及组合器2185的反相输入连接。帧排序缓冲器2110以及编码器控制器2105的输入可用作编码器2100的输入,用于接收输入画面2101。此外,SEI插入器2130的输入可用作编码器2100的输入,用于接收元数据。输出缓冲器2135的输出可用作编码器2100的输出,用于输出比特流。参见图2a,由参考数字2200来总体指示能够根据MPEG-4AVC标准来执行视频解码的视频解码器。视频解码器2200包括输入缓冲器2210,缓冲器2210具有与熵解码器2245的第一输入以信号通信方式连接的输出。熵解码器2245的第一输出以信号通信方式与反变换器和反量化器2250的第一输入连接。反变换器和反量化器2250的输出以信号通信方式与组合器2225的第二非反相输入连接。组合器2225的输出以信号通信方式与解块滤波器2265的第二输入和帧内预测模块2260的第一输入连接。解块滤波器2265的第二输出以信号通信方式与参考画面缓冲器2280的第一输入连接。参考画面缓冲器2280的输出以信号通信方式与运动补偿器2270的第二输入连接。熵解码器2245的第二输出以信号通信方式与运动补偿器2270的第三输入以及解块滤波器2265的第一输入连接。熵解码器2245的第三输出以信号通信方式与解码器控制器2205的输入连接。解码器控制器2205的第一输出以信号通信方式与熵解码器2245的第二输入连接。解码器控制器2205的第二输出以信号通信方式与反变换器和反量化器2250的第二输入连接。解码器控制器2205的第三输出以信号通信方式与解块滤波器2265的第三输入连接。解码器控制器2205的第四输出以信号通信方式与帧内预测模块2260的第二输入、运动补偿器2270的第一输入以及参考画面缓冲器2280的第二输入相连接。运动补偿器2270的输出以信号通信方式与开关2297的第一输入连接。帧内预测模块2260的输出以信号通信方式与开关2297的第二输入连接。开关2297的输出以信号通信方式与组合器2225的第一非反相输入连接。输入缓冲器2210的输入可用作解码器2200的输入,用于接收输入比特流。解块滤波器2265的第一输出可用作解码器2200的输出,用于输出输出画面。参见图3,示出了单层SPS300的结构。SPS是一般而言包含语法元素的语法结构,所述语法元素应用于零个或者更多整个编码的视频序列。在SVC扩展中,SPS中传递的一些语法元素的值是依赖于层的。这些依赖于层的语法元素包括但不限于:定时信息、HRD(代表“假定参考解码器”)参数、以及比特流限制信息。HRD参数可以包括例如:缓冲器大小、最大比特率以及初始延迟的指示符。HRD参数可以例如允许接收系统验证接收比特流的完整性和/或确定接收系统(例如,解码器)是否能够对比特流进行解码。因此,系统可以针对每一层提供前述语法元素的传输。单层SPS300包括提供SPS的标识符的SPS-ID310。单层SPS300还包括用于单一层的VUI(代表视频可用性信息)参数320。VUI参数包括用于单一层(例如,基础层)的HRD参数330。单层SPS300还可以包括附加参数340,尽管实现方式不需要包括任何附加参数340。参见图4,数据流400的方框视图示出了单层SPS300的典型使用。在AVC标准中,例如,典型的数据流可以包括SPS单元、提供用于特定画面的参数的多个PPS(画面参数序列)单元,以及用于编码画面数据的多个单元,以及其它成分。在图4中示出了这种总体框架,其包括SPS300、PPS-1410、包括编码画面1数据的一个或者更多单元420、PPS-2430、以及包括编码画面2数据的一个或者更多单元440。PPS-1410包括用于编码画面1数据420的参数,PPS-2430包括用于编码画面2数据440的参数。编码画面1数据420以及编码画面2数据440均与特定SPS(在图4的实现方式中为SPS300)相关联。如现在解释的,这是通过使用指针来实现的。编码图像1数据420包括PPS-ID(图中未示出),该PPS-ID标识PPS-1410,如箭头450所示。可以在例如片首部中存储该PPS-ID。编码图像2数据440包括PPS-ID(图中未示出),该PPS-ID标识PPS-2430,如箭头460所示。PPS-1410和PPS-2430均包括SPS-ID(图中未示出),该SPS-ID标识SPS300,如箭头470和480分别所示。参见图5,示出了SUPSPS500的结构。SUPSPS500包括SPSID510、包括HRD参数530(该参数用于称为“(D2,T2,Q2)”的单一附加层)在内的VUI520、以及可选的附加参数540。“D2,T2,Q2”是指具有空间(D)等级2、时间(T)等级2、以及质量(Q)等级2的第二层。注意,可以使用各种编号方案来指代层。在一个编号方案中,基础层具有值为0,x,0的D,T,Q,意味着空间等级为零、任何时间等级、以及质量等级为零。在该编号方案中,增强层具有D,T,Q,其中D或者Q大于零。SUPSPS500的使用允许例如系统使用仅包括用于单一层的参数在内的SPS结构,或者允许系统使用不包括任何依赖于层的信息在内的SPS结构。这样的系统可以为基础层之上的每一个附加层创建单独的SUPSPS。附加层可以标识其通过使用SPSID510来关联的SPS。显然,多个层可以通过在其相应的SUPSPS单元中使用共同的SPSID来共享单一SPS。参见图6,示出了SPS单元605和多个SUPSPS单元610和620之间的组织分级600。将SUPSPS单元610和620示为单层SUPSPS单元,但是其它实现方式可以在使用单层SUPSPS单元之外或者作为替代,使用一个或者更多的多层SUPSPS单元。在典型场景中,分级600示出了多个SUPSPS单元可以与单一SPS单元相关联。当然,实现方式可以包括多个SPS单元,并且每一个SPS单元可以具有相关联的SUPSPS单元。参见图7,示出了另一个SUPSPS700的结构。SUPSPS700包括多个层的参数,而SUPSPS500包括单一层的参数。SUPSPS700包括SPSID710、VUI720、以及可选附加参数740。VUI720包括用于第一附加层(D2,T2,Q2)的HRD参数730以及用于多至层(Dn,Tn,Qn)的其它附加层的HRD参数。再次参照图6,可以修改分级600以使用多层SUPSPS。例如,如果SUPSPS610和620都包括相同的SPSID,则可以用SUPSPS700来替代SUPSPS610和620的组合。此外,SUPSPS700可以与例如包括用于单一层的参数的SPS、或者包括用于多个层的参数的SPS、或者不包括用于任何层的依赖于层的参数的SPS一起使用。SUPSPS700允许系统在较少开销的情况下提供用于多个层的参数。其它实现方式可以基于例如包括用于所有可能层的所有所需参数的SPS。即,不管是否传输所有层,这种实现方式的SPS包括可用于传输的所有相应的空间(Di)、时间(Ti)以及质量(Qi)等级。然而,即使对于这样的系统,可以使用SUPSPS以提供在不再次传输整个SPS的情况下改变用于一个或者更多层的参数的能力。参见表1,为单层SUPSPS的特定实现方式提供了语法。该语法包括用于标识相关联SPS的sequence_parameter_set_id、以及用于标识可缩放层的标识符temporal_level、dependency_id以及quality_level。通过svc_vui_parameters()的使用来包括VUI参数(参见表2),svc_vui_parameters()通过hrd_parameters()的使用来包括HRD参数。下面的语法允许每一层指定其自己的依赖于层的参数,例如HRD参数。表1sup_seq_parameter_set_svc()语法的语义如下所述。-sequence_parameter_set_id标识:针对当前层,当前SUPSPS所映射至的序列参数集,;-temporal_level、dependency_id和quality_level指定当前层的时间等级、依赖关系标识符以及质量等级。dependency_id一般指示空间等级。然而,dependency_id还用于指示粗粒度可缩放性(“CGS”)分级,该分级包括空间和SNR可缩放性,其中SNR可缩放性是传统的质量可缩放性。相应地,quality_level和dependency_id均可以用于区分质量等级。-vui_parameters_present_svc_flag等于1指示如下定义的svc_vui_parameters()语法结构存在。vui_parameters_present_svc_flag等于0指示svc_vui_parameters()语法结构不存在。表2给出了svc_vui_parameters()的语法。因此,VUI参数对于每一层是分离的,并被放入单独的SUPSPS单元中。然而,其它实现方式将用于多个层的VUI参数组合为单一SUPSPS。表2在2007年4月的JVT_U201附录EE.1下存在的SVC扩展的版本中定义了表2的svc_vui_parameters()语法的字段。具体地,定义用于AVC标准的hrd_parameters()。还注意到,svc_vui_parameters()包括各种依赖于层的信...
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1