基于位深度的样本自适应偏移缩放的制作方法_2

文档序号：8947768阅读：来源：国知局

r>[0031] 在图1的实例中，源装置12包含视频源18、视频编码器20及输出接口 22。在一些状况下，输出接口 22可包含调制器/解调器（调制解调器）及/或发射器。在源装置12 中，视频源18可包含诸如视频捕获装置（例如，视频相机）的源、含有经先前捕获视频的视频存档、用以从视频内容提供者接收视频的视频馈送接口，及/或用于产生计算机图形数据作为源视频的计算机图形系统，或此类源的组合。作为一个实例，如果视频源18为视频相机，那么源装置12及目的地装置14可形成所谓相机电话或视频电话。然而，本发明所描述的技术可大体上适用于视频译码，且可应用于无线应用及/或有线应用。
[0032] 可由视频编码器20编码经捕获、经预捕获或经计算机产生的视频。可经由源装置 12的输出接口 22而将经编码视频数据直接地发射到目的地装置14。此外（或替代地），可将经编码视频数据存储到存储装置31上以由目的地装置14或其它装置稍后存取，以供解码及/或回放。
[0033] 目的地装置14包含输入接口 28、视频解码器30及显示装置32。在一些状况下，输入接口 28可包含接收器及/或调制解调器。目的地装置14的输入接口 28经由链路16 而接收经编码视频数据。经由链路16而传达或在存储装置31上提供的经编码视频数据可包含由视频编码器20产生以由诸如视频解码器30的视频解码器用来解码所述视频数据的多种语法元素。此类语法元素可与在通信媒体上发射、存储在存储媒体上或存储在文件服务器上的经编码视频数据一起被包含。
[0034] 显示装置32可与目的地装置14整合，或在目的地装置14外部。在一些实例中，目的地装置14可包含整合式显示装置，且还经配置以与外部显示装置进行接口连接。在其它实例中，目的地装置14可为显示装置。一般来说，显示装置32向用户显示经解码视频数据，且可包括多种显示装置中的任一者，诸如，液晶显示器（IXD)、等离子显示器、有机发光二极管（OLED)显示器，或另一类型的显示装置。
[0035] 视频编码器20及视频解码器30可根据包含HEVC或其类似者的其它视频压缩标准而操作。Bross等人在2012年10月于中国上海召开的ITU-TSG16WP3及IS0/IEC JTC1/SC29/WG11的视频译码联合协作团队（JCT-VC)第11届会议中的"HighEfficiency VideoCoding(HEVC)textspecificationdraft9" 中描述"HEVC工作草案 9" 或WD9,其仍可从http://phenix.int-evry.fr/jct/doc_end_user/documents/ll_Shanghai/wgll/ JCTVC-K1003-v8.zip下载，其全部内容是以引用方式并入本文中。然而，本发明的技术不限于任何特定译码标准或技术。
[0036] 替代地，视频编码器20及视频解码器30可根据诸如以下各者的其它专有或工业标准而操作：ITU-TH. 264标准，替代地被称作MPEG-4第10部分的高级视频译码（AVC);或此类标准的扩展。然而，本发明的技术不限于任何特定译码标准。视频压缩标准的其它实例包含MPEG-2 及ITU-TH. 263。
[0037] 尽管图1中未图示，但在一些方面中，视频编码器20及视频解码器30各自可与音频编码器及解码器整合，且可包含适当MUX-DEMUX单元或其它硬件及软件以处置共同数据流或单独数据流中的音频及视频两者的编码。适用时，在一些实例中，MUX-DEMUX单元可符合ITUH. 223多路复用器协议，或诸如用户数据报协议（UDP)的其它协议。
[0038] 视频编码器20及视频解码器30各自可被实施为多种合适编码器电路系统中的任一者，诸如，一或多个微处理器、数字信号处理器（DSP)、专用集成电路（ASIC)、现场可编程门阵列（FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当部分地以软件来实施所述技术时，装置可将用于所述软件的指令存储在合适非暂时性计算机可读媒体中，且使用一或多个处理器而以硬件来执行所述指令以执行本发明的技术。视频编码器20及视频解码器30 中的每一者可包含在一或多个编码器或解码器中，所述一或多个编码器或解码器中的任一者可被整合为相应装置中的组合式编码器/解码器（CODEC)的部分。
[0039]JCT-VC正致力于HEVC标准的开发。HEVC标准化努力是基于视频译码装置的演进模型，其被称作ffiVC测试模型（HM)。HM假设视频译码装置相对于根据（例如）ITU-TH. 264/ AVC的现有装置的若干额外能力。举例来说，H. 264提供九个帧内预测编码模式，而HM可提供多达三十三个帧内预测编码模式。
[0040] 一般来说，HM的工作模型描述出，可将视频帧或图片划分成包含亮度样本及色度样本两者的译码树型单元（CTU)的序列，其也被称为最大译码单元（LCU)。树型块具有与 H. 264标准的宏块的目的相似的目的。切片包含按译码次序的数个连续树型块。可将视频帧或图片分割成一或多个切片。可根据四叉树而将每一树型块分裂成若干译码单元（CU)。举例来说，可将树型块（作为四叉树的根节点）分裂成四个子节点，且每一子节点又可为父节点且被分裂成另外四个子节点。最后未分裂子节点（作为四叉树的叶节点）包括译码节点，即，经译码视频块。与经译码位流相关联的语法数据可定义树型块可被分裂的最大次数，且还可定义译码节点的最小大小。
[0041]CU包含译码节点，以及与译码节点相关联的预测单元（PU)及变换单元（TU)。CU 的大小对应于译码节点的大小且为正方形形状。CU的大小的范围可为从8X8像素直到具有最大64X64像素或更大像素的树型块的大小。每一CU可含有一或多个PU及一或多个 TU。与CU相关联的语法数据可描述（例如）将CU分割成一或多个PU。分割模式可依CU 被跳过或直接模式编码、被帧内预测模式编码还是被帧间预测模式编码而不同。PU可被分割为非正方形形状。与CU相关联的语法数据还可描述（例如）根据四叉树而将CU分割成一或多个TU。TU可为正方形或非正方形形状。
[0042]HEVC标准允许根据TU的变换，所述变换针对不同⑶可不同。通常基于针对经分割LCU所定义的给定CU内的PU的大小来设置TU的大小，但可并非总是此状况。TU通常为与PU的大小相同的大小，或小于HJ。在一些实例中，可使用被称为"残差四叉树"（RQT) 的四叉树结构而将对应于CU的残差样本再分成较小单元。RQT的叶节点可被称作变换单元 (TU)。可变换与TU相关联的像素差值以产生变换系数，所述变换系数可被量化。
[0043] 一般来说，HJ包含与预测过程相关的数据。举例来说，当HJ被帧内模式编码时， PU可包含描述用于PU的帧内预测模式的数据。作为另一实例，当PU被帧间模式编码时， PU可包含定义用于HJ的运动矢量的数据。定义用于PU的运动矢量的数据可描述（例如）运动矢量的水平分量、运动矢量的垂直分量、用于运动矢量的分辨率（例如，四分之一像素精确度，或八分之一像素精确度）、运动矢量所指向的参考图片，及/或用于运动矢量的参考图片列表（例如，列表0、列表1或列表C)。
[0044] 一般来说，TU用于变换过程及量化过程。具有一或多个PU的给定⑶还可包含一或多个变换单元（TU)。在预测之后，视频编码器20可计算对应于PU的残差值。所述残差值包括可被变换成变换系数、被量化且使用TU而被扫描以产生序列化变换系数以供熵译码的像素差值。本发明通常使用术语"视频块"以指⑶的译码节点。在一些特定状况下，本发明还可使用术语"视频块"以指包含译码节点以及PU及TU的树型块，S卩，IXU或⑶。
[0045] 视频序列通常包含一系列视频帧或图片。图片群组（GOP)通常包括所述视频图片中的一系列一或多个视频图片。GOP可在所述GOP的标头中、在所述图片中的一或多者的标头中或在别处包含语法数据，所述语法数据描述包含在所述GOP中的图片的数目。图片的每一切片可包含描述用于所述相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作，以便编码视频数据。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小，且其大小可根据指定译码标准而不同。
[0046] 作为实例，HM支持以各种HJ大小的预测。假定特定⑶的大小为2NX2N，那么HM 支持以2~\2~或~\~的？1]大小的帧内预测，及以2~\212~\1~\21^或~\~的对称卩1] 大小的帧间预测。HM还支持用于以2NXnU、2NXnD、nLX2N及nRX2N的PU大小的帧间预测的不对称分割。在不对称分割中，CU的一个方向未被分割，而另一方向被分割成25%及 75%。⑶的对应于25%分割区的部分是通过"n"后面是"向上"、"向下"、"向左"或"向右" 的指示而指示。因此，举例来说，"2NXnU"是指被水平地分割的2NX2N⑶，其中2NX0. 5N PU位于顶部上且2NXI. 5NPU位于底部上。
[0047] 在本发明中，"NXN"与"N乘N"可被互换式地使用以指视频块在垂直维度及水平维度上的像素尺寸，例如，16X16像素或16乘16像素。一般来说，16X16块将在垂直方向上具有16个像素（y= 16)且在水平方向上具有16个像素（X= 16)。同样地，NXN块通常在垂直方向上具有N个像素且在水平方向上具有N个像素，其中N表示非负整数值。可按行及列来布置块中的像素。此外，块未必需要在水平方向上与在垂直方向上具有相同数目个像素。举例来说，块可包括NXM个像素，其中M未必等于N。
[0048] 在使用⑶的HJ进行帧内预测性译码或帧间预测性译码之后，视频编码器20可计算用于⑶的TU的残差数据。PU可包括位于空间域（也被称作像素域）中的像素数据，且 TU可包括在将变换（例如，离散余弦变换（DCT)、整数变换、小波变换或概念上相似变换）应用于残差视频数据之后位于变换域中的系数。残差数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包含用于CU的残差数据的TU，且接着变换所述TU以产生用于CU的变换系数。
[0049] 在进行任何变换以产生变换系数之后，视频编码器20可执行变换系数的量化。量化通常是指如下过程：量化变换系数以可能地缩减用以表示所述系数的数据的量，从而提供进一步压缩。所述量化过程可缩减与所述系数中的一些或全部相关联的位深度。举例来说，可在量化期间将n位值降值舍位到m位值，其中n大于m。
[0050] 在一些实例中，视频编码器20可利用预定义扫描次序以扫描经量化变换系数，以广生可被烟编码的序列化矢量。在其它实例中，视频编码器20可执行自适应扫描。在扫描经量化变换系数以形成一维矢量之后，视频编码器20可熵编码所述一维矢量，例如，根据上下文自适应可变长度译码（CAVLC)、上下文自适应二进制算术译码（CABAC)、基于语法的上下文自适应二进制算术译码（SBAC)、概率区间分割熵（PIPE)译码或另一熵编码方法。视频编码器20还可熵编码与经编码视频数据相关联的语法元素以由视频解码器30用来解码所述视频数据。
[0051] 为了执行CABAC，视频编码器20可将上下文模型内的上下文指派到待发射符号。所述上下文可关于（例如）所述符号的相邻值是否为非零。为了执行CAVLC，视频编码器20 可针对待发射符号选择可变长度代码。可将VLC中的代码字构造成使得相对较短代码对应于较可能符号，而较

完整全部详细技术资料下载

当前第2页1 2 3 4 5 6