视频图像序号的编码、解码方法及装置、电子设备的制造方法

文档序号：8434223阅读：378来源：国知局

视频图像序号的编码、解码方法及装置、电子设备的制造方法
【技术领域】
[0001] 本发明涉及通信领域，具体而言，涉及一种视频图像序号的编码、解码方法及装置、电子设备。
【背景技术】
[0002] 正在制定的基于高性能视频编码（H. 265/Hi曲EfficiencyVideoCoding,简称为肥VC)标准兼容的H维视频（T虹ee-DimensionalVideo,简称为3DV)编码标准MV-肥VC (HEVCMulti-viewvideocodingextensionframework)、3D-HEVC(3DHighEfficiency VideoCoding)和可伸缩视频编码（Seal油levideocoding,简称为SVC)中，采用了统一的高层结构设计。该个统一的设计结构基于"多层视频编码"的概念，将MV-HEVC和3D-HEVC 的不同视点的纹理分量（TexUireComponent)和深度分量（DepthComponent)、可伸缩编码的不同可伸缩层均抽象为"层（Layer)"，并使用层表示序号（Layerld)来标识不同的视点和可伸缩层。该里，将已发布的H. 265/肥VC标准称为"H. 265/肥VCVersionl"标准。
[0003] 在多层视频编码中，同时刻获得的视频图像及其对应的编码比特组成一个接入单元（Access化it,简称为AU)。在同一个AU中，各层图像可使用不同的编码方法。该样，在同一个AU中，某层的图像可W是能够作为随机点的峽内编码随机接入（IntraRandom Access化int，简称为IRAP)图像，而其他某一个或多个层是普通的峽间、层间预测编码图像。在实际应用中，不同层可W根据网络传输状况、视频内容变换情况等选择各自的IRAP 图像插入策略。例如，对于兼容H. 265/肥VC的基本层视频图像可采用较高频次的IRAP图像插入策略，对增强层视频图像可采用频次较低的IRAP图像插入策略。该样，使用该种逐层（layer-wise)接入的多层视频编码结构，可W在不出现大的码率激增的情况下，保证多层视频编码码流的随机接入性能。
[0004] 对于多层视频编码码流，其基本层（BaseLayer，简称为BL)码流必须符合 H. 265/肥VCVersionl标准的规范。换言之，多层视频编码码流必须保证根据H. 265/肥VC Versionl标准设计的解码器能够正确解码从多层视频编码码流中提取出的化码流。特别地，对于MV-HEVC和3D-HEVC，化对应于基本视点（BaseView)或独立视点（inebpendent View)，E；L对应于增强视点（EnhancementView)或非独立视点（DependentView)。实际应用中，可通过提取多层视频编码码流的方法，获得仅用于传统二维电视播放的基本视点码流、支持H维立体显示的双视点码流W及支持更加丰富H维立体显示的多视点码流。
[0005] 在H. 265/肥VCVersionl标准中，IRAP图像的类型有H种，分别是解码立即刷新（InstantaneousDecodingRefresh,简称为IDR)图像、断开连接访问（BrokenLink Access,简称为BLA)图像和清除随机存取（CleanRandomAccess,简称为CRA)图像。该H 种图像均使用峽内（Intra)编码方式进行编码，其解码不依赖于其他图像。该H种图像类型的不同之处在于对视频图像序号（Pic化re化derCount,P0C)和解码图像缓冲区（Decoded PierreBuffer,DPB)的操作。
[0006]P0C是H. 265/肥VCVersionl中用于标识图像播放顺序的序号。根据H. 265/肥VC Versionl标准，图像的POC值由两部分组成。使用Pic化der化tVal表示图像的POC值，贝ij;PicOrderQitVal=PicOrde;rQitMsb+PicOrde;rQitLsb。其中，PicOrderQitMsb是图像P0C值的最高有效位（MostSi即ificantBit,简称为MSB)取值，PicOrderQitLsb是图像P0C值的最低有效位化eastSi即ificantBit,简称为LSB)。通常情况下，PicOrderQitMsb的取值等于按解码顺序当前图像的前一个Temporalld等于0的图像的Pic化der化tMsb的取值， PicOrderQitLsb的取值等于分片（slice)头信息中的slice_pic_order_cnt_lsb字段的取值。slice_pic_order_cnt_lsb字段的比特数由序列参数集（SequanceParameterSet, SPS)中的log2_max_pic_order_cnt_lsb_minus4 确定，所需比特数等于log2_max_pic_ order_cnt_lsb_minus4+4。
[0007] 在H. 265/肥VCVersionl中，若当前图像是IDR图像，则PicOrderCntMsb的取值将被置为0,分片头信息中不包含slice_pic_order_cnt_lsb字段，PicOrderQitLsb的取值默认为0。若当前图像是BLA图像，则Pic化der化tMsb的取值将被置为0,分片头信息中包含 slice_pic_order_cnt_lsb字段用于确定PicOrderQitLsb的取值。若当前图像是CRA图像且标志位Handle&aAsBlaFlag的取值等于0,则使用通常方法计算P0C;若当前图像是CRA 图像且标志位Handle化aAsBlaFlag的取值等于1，则使用BLA图像的方法计算该CRA图像的P0C值。
[0008] 需要说明的是，在多层视频编码标准中，不论图像类型，增强层（Enhancement Layer,简称为化）的分片头信息中始终包含slice_pic_order_cnt_lsb字段。
[0009] 在此基础上，对于多层视频编码码流，为保证在DPB控制过程中检测同时刻的图像，同时为方便解码器使用P0C值在码流中确定各AU的起止位置，要求AU中所有图像均具有相同的P0C值。对于layer-wise的编码结构，AU中可能同时包含有IRAP图像和非IRAP 图像。该样，如果IRAP图像是IDR图像和BLA图像，则该AU中包含图像的P0C值将不同。因此，需要为多层视频编码标准设计P0C对齐（P0CAlignment)功能W满足在layer-wise 结构时AU中各图像可W具有相同的P0C。
[0010] 为解决该个问题，JCT-VC标准会议提案JCTVC-N0244中提出了一种P0C对齐方法。该方法是用分片头信息中的预留比特，增加长度为1比特的P〇c_reset_flag字段。当该字段的取值等于1时，首先按照通常方法解码图像P0C值，然后将DPB中同层(包括化）中图像的P0C值减少之前计算得到的P0C值（即P0C平移操作)，最后将该分片所在图像的P0C 值被置为0。
[0011] 该方法的最主要缺点是其化码流无法兼容H. 265/肥VCVersionl标准，即不能保证符合H. 265/肥VCVersionl标准的解码器能够解码从多层视频编码码流中抽取得到的化码流。
[001引为解决该兼容性问题，JCT-VC会议提案JCTVC-00140和JCTVC-00213提出在JCTVC-N0244的基础上，在需要进行P0C对齐时，仅将P0C中的MSB置为0。进一步， JCTVC-00213中增加了P0C对齐的延迟操作选项，W应对携带有重置P0C值的标志位的分片丢失和峽率不同的应用情况。JCTVC-00176提出在IDR图像时直接进行P0C对齐，而不是用显式的分片头标志位，并且在化码流的IDR图像分片头中增加预留比特，用于计算若该图像是CRA图像而非IDR图像时的P0C值，该计算得到的P0C值用于化层DPB中存储图像的P0C平移操作。JCTVC-00275提出了一种layerP0C的概念，对于化层图像，维护两套不同的POC。其中，LayerPOC为不使用POC对齐条件下得到的POC值，该值用于参考图像集（ReferencePic化reSet,RPS)等解码算法的相关操作；另外一套是经过P0C对齐处理的P0C，该P0C与同AU中化图像的P0C值一致，该P0C值用于控制图像的输出、播放过程。 JCTVC-00275提出的方法在进行P0C对齐过程中使用化的信息，且P0C对齐过程的触发使用编解码器内部维护的变量标志位，该标志位的取值与化层图像类型相关。
[0013]W上方法存在如下缺陷：
[0014] 对DPB中图像的P0C平移操作将改变DPB中已存储图像的原始P0C值。该样一来，如果包含有P0C对齐信息的分片丢失，那么将无法对DPB中图像的P0C进行正确的平移操作，使得后续的图像无法获得正确的参考图像。由于平移P0C值的错误，原本已经正确解码并存储在DPB中的图像将成为"错误解码图像"。
[00巧]对于层间峽率不同的情况，如果化的IDR图像所在AU中不包含化图像，则化将不能进行P0C对齐所需的P0C平移操作，该就使得在各层DPB中，即使同AU解码得到的图像也将具有不同的P0C值，从而使得解码器无法进行正确的图像输出操作。该问题也使得 JCTVC-00213中的P0C延迟对齐操作无法保证可W正确解码和输出多层视频编码码流。
[0016] 对于LayerP0C的情况，需要维护两套不同的P0C系统，但该两套P0C系统中，P0C 对齐操作之后，任意两幅图像的P0C之差是相等的，即两套P0C系统存在较大兀余。
[0017] 上述方法中JCTVC-00140和JCTVC-00213均需要使用化预留比特，并且多层视频编码编解码器在处理化码流时要根据该预留比特的取值进行不同于H. 265/肥VC Versionl标准的操作。该就使得已有的符合H. 265/肥VCVersionl的产品设计方案不能直接用于多层视频编码产品。尽管JCTVC-00176方法在分片层扩展中增加比特信息，不改变任何BL层解码流程，但分片层扩展信息是W字节为单位，该样就增加了分片头的额外比特开销。
[0018] 为了保证正确地进行P0C对齐操作，W上方法需要对可用编码结构进行较多限巧||。例如，JCTVC-00176要求化的IDR图像的AU中必须包含化图像。该降低了多层视频编码的应用灵活性，特别是非协调联播应用（uncoordinatedsimulcast)。
[0019] 针对相关技术中的上述问题，目前尚未提出有效的解决方案。

【发明内容】

[0020] 针对相关技术中，在多层视频编码及解码过程中，无法保证正确解码和输出多层视频编码码流W及增加网络资源的额外开销等问题，本发明提供了一种视频图像序号的编码、解码方法及装置、电子设备，W至少解决上述问题。
[0021] 为了达到上述目的，根据本发明的一个方面，提供了一种视频图像序号P0C的解码方法，包括；获取对P0C进行对齐操作时所使用的最高比特位MSB参数和最低比特位LSB 参数；根据所述MSB参数和所述LSB参数确定当前图像P0C值的MSB取值和LSB取值；根据所述MSB取值和所述LSB取值计算得到所述当前图像P0C值。
[0022] 优选地，根据所述MSB参数确定当前图像P0C值的MSB取值包括W下之一：方法一，从码流中直接获取所述码流携带的MSB参数，根据所述码流携带的MSB参数获取所述 MSB取值；方法二，获取用于指示在P0C对齐过程中增强层化所使用的MSB取值的第一指示信息，根据所述第一指示信息推导所述EL所使用的MSB取值，得到所述当前图像P0C值的MSB取值；方法H，获取用于指示所述MSB参数的获取方式的第二指示信息集；根据所述第二指示信息集确定所述化所使用的MSB取值，得到所述当前图像POC值的MSB取值。
[002

完整全部详细技术资料下载

当前第1页1 2 3 4 5

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李明;吴平;尚国强;谢玉堂;
技术所有人：中兴通讯股份有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。