视频编码装置、视频解码装置、视频编码方法、视频解码方法、视频编码或解码程序的制作方法

文档序号:7941314阅读:199来源:国知局
专利名称:视频编码装置、视频解码装置、视频编码方法、视频解码方法、视频编码或解码程序的制作方法
技术领域
本发明涉及例如可被适当地用作用于高清晰度广播的高图像质量视频编码装置 或视频解码装置的视频编码装置、视频解码装置、视频编码方法、视频解码方法以及视频编 码或解码程序,并且更具体而言涉及基于上下文自适应算术编码的视频编码装置、视频解 码装置、视频编码方法、视频解码方法以及视频编码或解码程序。
背景技术
在视频处理装置之中,视频编码装置被设计来通过基于预定的视频编码方法对从 外部装置馈送来的输入视频数据进行编码,来生成比特流。供视频编码装置使用的代表性 视频编码方法之一是H. 264标准。H. 264标准由ITU(国际电信联盟)于2003年五月推荐 作为运动视频数据压缩编码方法的一种标准。在基于H. 264的视频编码方法中,联合模型(joint model, JM)方法作为一种参考 模型是已知的。采用联合模型方法的视频编码装置作为与本发明相关的技术被提出(例如 参见专利文献1)。在本说明书中,所提出的该视频编码装置将被称为作为相关技术的视频
编码装置。图17示出了作为相关技术的视频编码装置的结构。作为相关技术的视频编码 装置100包括顺序接收视频数据101的输入作为输入图像的预测-变换-量化单元102、 PCM(脉冲编码调制)编码器103以及第一开关104 ;视频编码装置100以宏块为单位工作。被馈送到图17所示的视频编码装置100中的视频数据101的视频信号格式被假 定为QCIF(四分之一通用中间格式)。QCIF是ITU确定的视频信号格式之一。图18示出了 QCIF视频信号格式的图像帧。该图像帧是由水平11个和垂直9个 宏块形成的。一个图像帧在逐行扫描的情况中由一帧图片形成。在隔行扫描的情况中,它 由两场图片形成。在以下描述中,这些帧图片将被简称为“图片”。作为形成图片的基本单元的宏块由16X 16亮度像素和用于Cr和Cb分量的一对 8 X 8色度像素形成。在图中,对于通过将宏块划分成16个子块而获得的4 X 4像素块,亮度 位置(x)和色度位置(0)是以像素为单位表示的。图片中的每个宏块在从图片的左上到右 下的逐线扫描中被编码。返回图17,将进行描述。预测-变换-量化单元102以宏块为单位接收视频数据 101的输入并根据存储在解码图片缓冲器121中的解码后图像122生成预测图像以执行从 作为输入图像的图像数据101中减去预测图像的处理。输入图像被设计为在被应用频率变 换的情况下从空间域被变换到频域,随后被量化并作为经编码数据123输出。这里,预测-变换-量化单元102被设计为被码率控制器125提供以宏块量化参 数126M。在预测-变换-量化单元102处,通过向输入图像应用频率变换而获得的经变换 系数将按与宏块量化参数126M相对应的量化步长被量化。在本说明书中,在预测-变换-量化单元102处获得的输入图像的上述经变换和量化的系数将被称为“位阶值”(level value) 0位阶值对应于权利要求的范围中的“经变 换和量化的值”。码率控制器125监视由复用器从根据相关技术的视频编码装置100输出的比特流
128。然后,它控制量化参数126,以便将比特流128的比特数目调整到目标比特数目。更 具体而言,在当前比特数目大于目标比特数目的情况下,计算使量化步长变大的量化参数 126,相反地,在当前比特数目小于目标比特数目的情况下,计算使量化步长变小的量化参 数 126。这样计算出的量化参数126在被称为片层(slice)的宏块的集合单位的开头处作 为片层量化参数126S被输出。量化参数126还将在宏块开头处作为宏块量化参数126M被 输出。其中,片层量化参数126S被设计为被提供给复用器127以及上下文初始值计算 器129。从被布置在作为相关技术的视频编码装置100外部的未示出的模型计算器提供来 的模型ID(model_id) 131被设计为也被类似地提供给复用器127以及上下文初始值计算器
129。上下文初始值计算器129基于从码率控制器125提供来的片层量化参数126S和 从外部模型计算器提供来的模型ID 131来计算二值算术编码的上下文的初始值。然后,将 上下文的初始值132设定在存储器133处。片层量化参数126S对应于上述的“ITU-T H. 264 | IS0/IEC 14496-10高级视频编 码”中的7. 3. 3节中的“片层头部语法”的“SliCe_qp_delta”和该7. 3. 3节中的“图片参 数集RBSP语法”的“piC_int_qp_minuS16”与“26”相加的总和。模型ID 131也对应于该 7. 3.3节中的“片层头部语法”中的“(油%_111^_1(1(3”。上下文是下文将要描述的针对一二值符号的一对优势符号 (most-probable-symbol, MPS)和劣势符号(least-probable-symbol,LPS)出现概率状态 索弓I (occurrence probability state index) (pStateidx)。在二值算术编码中,由以下式 (1)表达的关系成立。MPS = 1-LPS. . . (1)在视频编码系统的H. 264标准中,上下文的“pStateidx”的数字是64。在二值算 术编码处理中,对应于“pStateidx”劣势符号出现概率(rLPS)是基于查找表来设定的。其 细节在上述的“ITU-T H. 264|IS0/IEC14996-10高级视频编码”中的“9. 3片层数据的CABAC 解析过程”中记载。从预测-变换-量化单元102输出的经编码数据123被提供给二值化单元135。 这里的经编码数据123是由与预测图像的生成有关的预测参数、宏块量化参数以及经变换 和量化的系数(或经变换和量化的值)形成的。将补充描述。严格来说,通过从宏块量化参数中减去前一宏块的宏块量化参数而 获得的差异值被作为经编码数据提供给二值化单元135。是量化参数的值被按原样二值化 还是差异值被二值化对于本发明来说并不是很关键。因此在假定诸如宏块量化参数之类的 经编码数据123被提供给二值化单元135的情况下进行描述。另一方面,上述的从预测_变换_量化单元102输出的位阶值136被提供给本地 解码器137。本地解码器137对位阶值136进行逆量化。然后,通过应用逆频率变换,它将
6位阶值136恢复成原始空间域中的图像。然而,一般而言,由于预测_变换_量化单元102 的量化的影响,这将是不可逆的恢复。最后,本地解码器137通过把从预测_变换_量化单 元102提供来的预测图像加到上述的被返回到原始空间域的图像来计算本地经解码图像 138。本地经解码图像138被提供给第一开关104。已接收到提供来的经编码数据123的二值化单元135根据由H. 264标准确定的过 程将图像转换成二值串,以顺序地输出该二值串的每个比特。在以下描述中,二值串的每个 比特将被称为一个二值符号(bin)。由二值化单元135执行的二值串转换的细节在“ITU-T H. 264| IS0/IEC 14496-10高级视频编码”中的第9. 3节中的“片层数据的CABAC解析过程” 中公开。PCM判定单元139被设计为监视被提供给二值化单元135的经编码数据123。然 后,判定与一个宏块的经编码数据相对应的bin的数目是否超过了预定且固定的bin数目。 监视被提供给二值化单元135的经编码数据123相当于监视要被输入到与二值化单元135 的输出侧相连的二值算术编码器141的bin 142的数目。bin 142的数目是在通过使上述 与一个宏块的经编码数据123相对应的bin数目经历二值算术编码而获得的比特数目超过 一个未压缩的宏块的比特数目的情况下的bin数目。在本说明书中,与输入的一个未压缩宏块相当的比特数目将被称为预定比特数 目。在H. 264标准中,当输入视频数据为4:2:0时,其预定比特数目为3200比特。当监视的结果是与一个宏块的经编码数据123相对应的bin数目不超过预定bin 数目时,PCM判定单元139输出PCM模式未选择作为控制信号144。另一方面,当与一个宏 块的经编码数据123相对应的bin数目超过预定bin数目时,输出PCM模式选择作为控制 信号144。控制信号144被提供给第一开关104、二值算术编码器141、上下文模拟单元146 以及第二开关147和第三开关148。其中,二值算术编码器141在控制信号144通知PCM模 式选择时和通知PCM模式未选择时的操作方式不同。首先,当控制信号144通知PCM模式选择时,二值算术编码器141向连接到该单元 的第一缓冲器151和第二缓冲器152中的第一缓冲器151输出数据153。更具体而言,首 先,它使得与PCM模式相对应的预测参数的bin经历基于从上下文模拟单元146提供来的 上下文154的二值算术编码。接下来,它冲刷二值算术编码器141的当前范围并将其输出 到第一缓冲器151。最后,通过输出所需数目的比特“0”,输出到第一缓冲器151的比特串 被对齐。由于与PCM模式相对应的预测参数的bin是唯一确定的值,因此二值算术编码器 141独自生成bin以执行二值算术编码。另一方面,当控制信号144通知PCM模式未选择时,二值算术编码器141对第二缓 冲器152执行输出。二值算术编码器141使得从二值化单元135顺序提供来的bin 142经 历基于从上下文模拟单元146提供来的上下文154的二值算术编码。然后,它将其比特输 出156写在第二缓冲器152中。通过由二值算术编码器141进行的上述二值算术编码,由上下文模拟单元146 提供的上下文154将根据作为二值算术编码的对象的bin 142被顺序更新。大致来说, 当优势符号(MPS)等于H. 264标准中的某一 bin时,它更新劣势符号出现概率状态索引 (pStateidx),使得劣势符号出现概率(rLPS)减小。当优势符号(MPS)不等于H. 264标准中的某一 bin时,更新劣势符号出现概率状态索引(pStateidx),使得劣势符号出现概率 (rLPS)增大。当优势符号(MPS)不等于bin并且劣势符号出现概率状态索引(pStateidx) 为“0”时,即当劣势符号出现概率(rLPS)最大时,使优势符号(MPS)反转。这一点的细节 在“ITU-T H. 264| IS0/IEC14496-10高级视频编码”中的“9. 3片层数据的CABAC解析过程”
中记载。从而,通过根据输入bin更新(学习)每个上下文154,二值算术编码器141实现 了符合输入bin的出现概率的熵编码。上下文模拟单元146从存储器133中顺序地读取与被提供给二值算术编码器141 的bin 142相对应的上下文154。然后,上下文154被提供给二值算术编码器141,并且由 二值算术编码器141学习到的上下文被存储在存储器133中。另一方面,PCM编码器103以宏块为单位接收视频数据101的输入并且使输入宏 块的像素值成为PCM代码(非熵代码)。该PCM编码输出157被输出到第三缓冲器158。在其像素值为8比特的情况下,对一个宏块的PCM编码的比特数目将是384(像 素)和8比特的乘积,即3072比特。严格来说,用于指定PCM编码的头部比特的数目被加 到3072比特,其总比特数目将大于上述的预定比特数目。此外,至于头部比特的数目,在 H. 264标准中,一个B片层中的8个bin的比特数目将为最大值。当控制信号144通知PCM模式选择时,第一开关104向解码图片缓冲器121提供 视频数据101作为输入图像。另一方面,当控制信号144通知PCM模式未选择时,第一开关 104选择从本地解码器137输出的本地经解码图像138并将其提供给解码图片缓冲器121。 解码图片缓冲器121将存储通过第一开关104输入的图像作为以下编码的经解码图像。只有当控制信号144通知PCM模式选择时,第二开关147才会向复用器127提供 第一缓冲器151的输出数据161。换言之,当控制信号144通知PCM模式未选择时,第一缓 冲器151的输出数据161不被提供给复用器127。当控制信号144通知PCM模式未选择时,第三开关148向复用器127提供第二缓 冲器152的输出数据162。当控制信号144通知PCM模式选择时,复用器127将被提供以 第三缓冲器158的输出数据163。复用器127对片层量化参数126S、从外部模型计算器提 供来的模型ID(model_id) 131以及分别通过第二开关147和第三开关148输入的输出数据 161及输出数据162和163中任一者进行复用,并将所获得的数据作为比特流128输出。专利文献1 日本专利早期公布No. 2004-135251 (第0005段)。如上所述的视频编码装置100使得能够以宏块为单位选择性地执行二值算术编 码或PCM编码。因此,即使当对某一宏块的经编码数据的二值算术编码的比特数目超过预 定比特数目时,选择PCM编码也将保证该宏块的输出比特数目不大于该预定比特数目。对某一宏块的经编码数据的二值算术编码的比特数目超过预定比特数目的一个 原因是在过去的宏块中学习到的上下文的符号出现概率不与当前宏块的经编码数据的bin 出现概率一致。更具体而言,假定在某一宏块中,其符号出现概率急剧变化。在此情况下, 对宏块的经编码数据的二值算术编码的比特数目超过上述的预定比特数目,这是符号出现 概率和bin出现概率相互不一致的一个因素。更具体而言,一个示例是这样一种情况,其 中,在仅在经变换和量化的系数的最高频率分量中具有有效位阶值(significant level value)的连续宏块经历二值算术编码之后,在经变换和量化的系数的所有频率分量中具有
8有效位阶值的后续宏块被输入。这里,有效位阶值表示具有大于零的绝对值的位阶。作为相关技术的视频编码装置100在选择PCM编码时不可能学习到与位阶值相关 的上下文。因此,假定在经变换和量化的系数的每一频率分量中都具有有效位阶值的宏块 被输入并被PCM编码,那么即使当在此之后在经变换和量化的系数的每一频率分量中都具 有有效位阶值的宏块再次被输入时,上下文也未被学习。结果,不可能也对后一宏块实现高 效的二值算术编码。从而,作为相关技术的视频编码装置100具有编码效率由于符号出现概率的急剧 变化而降低的问题。虽然在以上描述中,已经考虑了视频编码,但是在对符号出现概率具有 急剧变化时获得的图像数据进行解码时也发生同样的问题。在这些情况下,本发明的一个目的是提供防止上下文自适应编码中由于符号出现 概率的急剧变化而导致的压缩效率降低的视频编码装置、视频编码方法和视频编码程序及 其相应的视频解码装置、视频解码方法和解码程序。

发明内容
根据本发明的一示例性方面的一种视频编码装置包括第一编码单元,用于使通 过向图像块应用频率变换和量化而获得的经变换和量化的值经历基于上下文的二值算术 编码;第二编码单元,用于利用与第一编码单元的方法不同的编码方法对图像块编码;输 出数据选择单元,用于选择由第一编码单元输出的第一输出数据或由第二编码单元输出的 第二输出数据;以及上下文更新单元,用于在输出数据选择单元选择第二输出数据时对用 于经变换和量化的值的二值算术编码中的上下文进行更新。更具体而言,根据本发明,通过设置用于使通过向图像块应用频率变换和量化而 获得的经变换和量化的值经历基于上下文的二值算术编码的第一编码单元和用于执行另 外的编码的第二编码单元,当输出数据选择单元选择第二输出数据时,用于经变换和量化 的值的二值算术编码中的上下文被更新。这避免了由于符号出现概率的急剧变化而导致的 编码效率的降低。根据本发明的一示例性方面的一种视频解码装置包括第一解码单元,用于使输 入图像数据经历基于上下文的二值算术解码以对经变换和量化的值解码;第二解码单元, 用于利用与第一解码单元的方法不同的解码方法对输入图像数据解码;解码选择单元,用 于选择第一解码单元或第二解码单元用于对输入图像数据解码;以及上下文更新单元,用 于在解码选择单元选择利用第二解码单元进行解码时对用于经变换和量化的值的二值算 术解码中的上下文进行更新。更具体而言,根据本发明,通过设置用于使输入图像数据经历基于上下文的二值 算术解码以对经变换和量化的值解码的第一解码单元和用于执行另外的解码的第二解码 单元,当解码选择单元选择利用第二解码单元进行解码时,用于经变换和量化的值的二值 算术解码中的上下文被更新。当宏块由于符号出现概率中的急剧变化而被编码时,这使得 能够在应用符合变化后的符号出现概率的上下文更新的同时对经编码的比特流进行解码。根据本发明的一示例性方面的一种视频编码方法包括第一编码步骤,使通过向 图像块应用频率变换和量化而获得的经变换和量化的值经历基于上下文的二值算术编码; 第二编码步骤,利用与第一编码步骤的方法不同的编码方法对图像块编码;输出数据选择步骤,选择在第一编码步骤输出的第一输出数据或在第二编码步骤输出的第二输出数据; 以及上下文更新步骤,当在输出数据选择步骤中第二输出数据被选择时,对用于经变换和 量化的值的二值算术编码中的上下文进行更新。更具体而言,根据本发明,通过设置使通过向图像块应用频率变换和量化而获得 的经变换和量化的值经历基于上下文的二值算术编码的第一编码步骤和执行另外的编码 的第二编码步骤,当输出数据选择步骤选择第二输出数据时,用于经变换和量化的值的二 值算术编码中的上下文被更新。这避免了由于符号出现概率的急剧变化而导致的编码效率 的降低。根据本发明的一示例性方面的一种视频解码方法包括第一解码步骤,使输入图像数据经历基于上下文的二值算术解码以对经变换和量 化的值解码,第二解码步骤,利用与第一解码步骤的方法不同的解码方法对输入图像数据解 码,解码选择步骤,选择第一解码步骤或第二解码步骤用于对输入图像数据解码,以 及上下文更新步骤,当在解码选择步骤中利用第二解码步骤进行的解码被选择时, 对用于经变换和量化的值的二值算术解码中的上下文进行更新。更具体而言,根据本发明,通过设置使输入图像数据经历基于上下文的二值算术 解码以对经变换和量化的值解码的第一解码步骤和执行另外的解码的第二解码步骤,当解 码选择步骤选择利用第二解码步骤进行解码时,用于经变换和量化的值的二值算术解码中 的上下文被更新。当宏块由于符号出现概率中的急剧变化而被编码时,这使得能够在应用 符合变化后的符号出现概率的上下文更新的同时对经编码的比特流进行解码。根据本发明的一示例性方面一种视频编码程序使得计算机执行第一编码处理,使通过向图像块应用频率变换和量化而获得的经变换和量化的值 经历基于上下文的二值算术编码,第二编码处理,利用与第一编码处理的方法不同的编码方法对图像块编码,输出数据选择处理,选择在第一编码处理输出的第一输出数据或在第二编码处理 输出的第二输出数据,以及上下文更新处理,当在输出数据选择处理中第二输出数据被选择时,对用于经变 换和量化的值的二值算术编码中的上下文进行更新。更具体而言,根据本发明,作为要被计算机执行的视频编码程序,通过设置使输入 图像数据经历基于上下文的二值算术编码以对经变换和量化的值编码的第一编码处理和 执行另外的编码的第二编码处理,当输出数据选择处理选择第二输出数据时,用于经变换 和量化的值的二值算术编码中的上下文被更新。这避免了由于符号出现概率的急剧变化而 导致的编码效率的降低。根据本发明的一示例性方面的一种视频解码程序使得计算机执行第一解码处理,使输入图像数据经历基于上下文的二值算术解码以对经变换和量 化的值解码,第二解码处理,利用与第一解码处理的方法不同的解码方法对输入图像数据解
10码,解码选择处理,选择第一解码处理或第二解码处理用于对输入图像数据解码,以 及上下文更新处理,当在解码选择处理中利用第二解码处理进行的解码被选择时, 对用于经变换和量化的值的二值算术解码中的上下文进行更新。更具体而言,根据本发明,作为要被计算机执行的视频解码程序,在使输入图像数 据经历基于上下文的二值算术解码以对经变换和量化的值解码的第一解码处理和执行另 外的解码的第二解码处理都被设定为可执行的情况下,当解码选择处理选择利用第二解码 处理进行解码时,用于经变换和量化的值的二值算术解码中的上下文被更新。当宏块由于 符号出现概率中的急剧变化而被编码时,这使得能够在应用符合变化后的符号出现概率的 上下文更新的同时对经编码的比特流进行解码。如上所述,本发明实现了能够防止由符号出现概率的急剧变化导致的压缩效率降 低的视频编码和解码。


图1是示出根据本发明第一示例性实施例的视频编码装置的结构的框图;图2是用于说明根据第一示例性实施例的位阶值的示图;图3是用于说明图2所示的位阶值的帧扫描顺序的示图;图4是用于说明根据图3所示的扫描顺序对图2所示的位阶值进行计算的结果的 示图;图5是用于说明与“leveljninusl”相对应的二值串的一个示例的示图;图6是示出上下文更新单元如何执行上下文更新处理的流程图;图7是用于说明状态索引转变表的内容的示图;图8是用于说明如何执行在步骤S405描述的“contextjevel ”的更新处理的示 图;图9是示出与根据相关技术的装置相比第一示例性实施例获得的效果的特性图;图10是示出根据本发明第一示例性实施例的视频编码装置的修改示例的框图;图11是示出根据本发明第二示例性实施例的视频编码装置的结构的框图;图12是示出根据本发明第三示例性实施例的视频编码装置的结构的框图;图13是示出在PCM选择时上下文等概率更新单元进行的处理的流程的流程图;图14是示出作为本发明的第三示例性实施例的修改示例的视频编码装置的结构 的框图;图15是示出根据本发明第四示例性实施例的视频解码装置的结构的框图;图16是当利用软件形成包括根据本发明的视频编码装置和视频解码装置的视频 处理装置时的硬件结构的示意图;图17是示出作为与本发明相关的相关技术的视频编码装置的结构的框图;图18是用于说明作为QCIF的视频格式的图像帧的示图;图19是示出劣势符号出现概率状态索引与劣势符号出现概率之间的关系的特性 图;并且
图20是示出劣势符号出现概率状态索引与比特数目之间的关系的特性图。
具体实施例方式在描述本发明的示例性实施例之前,将描述本发明的原理。根据本发明,当由于符 号出现概率的急剧变化而使宏块经历PCM编码时,与位阶值相关的经编码数据的符号的上 下文在后续宏块的编码开始之前被更新,以便与改变后的符号出现概率相一致。更具体而 言,将上下文的劣势符号出现概率状态索引设定为小于当前索引号码。图19示出了劣势符号出现概率状态索引与劣势符号出现概率之间的关系。从图 19可见,将劣势符号出现概率状态索引(pStateidx)更新为较小的号码相当于增大劣势符 号出现概率(rLPS)。换言之,增大劣势符号出现概率相当于减小优势符号出现概率。另外,根据劣势符号(LPS),劣势符号出现概率(rLPS)将不会高于优势符号出现 概率。因此,这些概率达到等概率导致劣势符号出现概率中的最高概率。因此,在本发明 中,在PCM编码时对与位阶值相关的经编码数据的符号的上下文的劣势符号出现概率进行 更新以便接近等概率。根据本发明,即使在下述情况下也可通过更新上下文来学习到上下文即,当输入 宏块在所有频率分量中具有有效位阶值并且PCM编码被应用之后,后续输入的另一宏块也 在所有频率分量中具有有效位阶值。因此,可以利用具有比PCM编码更少的比特数目的二 值算术编码来对该后续输入宏块进行编码。图20示出了劣势符号出现概率状态索引与比特数目之间的关系。在图20中,优 势符号(MPS)由曲线201表示,而劣势符号(LPS)由曲线202表示。将劣势符号出现概率 状态索引(pStateidx)更新(学习)为较少的号码使得即使在输入相同LSP时也具有较小 的比特数目。另一方面,假定当在所有频率分量中具有有效位阶值的宏块突然被输入时选择了 PCM编码之后,仅在最高频率分量中具有有效位阶值的后续宏块被输入。即使在此情况下, 由于后续宏块的符号数目较小,因此也可以在学习上下文的同时,利用具有比PCM编码更 小的比特数目的二值算术编码来进行编码。(第一示例性实施例)图1是示出根据本发明第一示例性实施例的视频编码装置的结构的框图。在图1 所示的视频编码装置300中,与图17的部分相同的部分被分配以相同的标号,对这些部分 的描述被适当地省略。视频编码装置300具有向图17所示的根据相关技术的视频编码装置 100新设置上下文更新单元301的结构。上下文更新单元301被设计为接收控制信号144 的输入,其中控制信号144是PCM判定单元139监视经编码数据123的结果。然后,当作为 结果的控制信号144由于与一个宏块的经编码数据123相对应的bin数目超过预定bin数 目而通知选择PCM模式时,上下文更新单元301执行更新上下文的处理。换言之,在接收到 对PCM模式选择的通知时,上下文更新单元301通过上下文模拟单元146A对存储在存储器 133中的与位阶值相关的经编码数据的上下文进行更新。本示例性实施例中的与位阶值相关的经编码数据是H. 264标准中的 “significant_coeff—flag、last_significant_coeff—flag、coef—abs_leve 1—minus 1,,。下 面将描述其中每一个。
在H. 264标准中使用4X4块大小频率变换。对于形成图18所示的图像帧的每一 个宏块,在一个4X4块中,相应地存在分别对应于每个频率分量的16个位阶值。图2示出了位阶值的分布示例。对于4X4块,水平分量被表示为u并且垂直分量 被表示为ν。图3示出了图2所示的位阶值的帧扫描的顺序。在图3中,“0”至“15”表示 扫描号码。根据H.264标准定义的扫描顺序,排除最高频率分量“i = 15”,按扫描号码的升 序(0 < i < 14),将表明在与扫描号码“i”相对应的频率分量中是否存在有效位阶值的标 志编码为“significant_c0eff_flag[i]”。"i = 0”是直流分量(DC)0 在图 2 中,“1”表示 存在有效位阶值,而“0”表示不存在有效位阶值。另外,将表明与扫描号码“i”相对应的频 率分量的有效位阶值是否是该块中的最后的有效位阶值的标志编码为“laSt_Signifcant_ coeff_flag[i] ”。“1”表明是该块中最后的有效位阶值,而“0”表明不是该块中最后的有效 位阶值。在执行前述编码之后,随后按扫描号码的降序(0 < i < 15)把通过从其中存在 有效位阶值的频率分量的有效位阶值的绝对值中减去“1”而获得的值编码为“coef_abS_ 1 evel_minusl ”。此时,有效位阶值的“ sign”码也同时被编码。图4作为一个示例示出了根据图3所示的扫描顺序对图2所示的位阶值的计算 结果。这里指示为“sig”的是指示对“Significant_c0eff_flag”的计算结果的列,指示 为“last”的是指示对“last_significant_c0eff_flag”的计算结果的列。此外,指示对 “coef_abs_level_minusl”的计算结果的列被指示为“level_minusl”。指示对“sign(位 阶值的士码)”的计算结果的列被按原样指示为“sign”。在本说明书中,下面将使用简化 记号。图4所示的计算结果中由“_”指示的部分表示这些值无效。从图4清楚可见,“Sig”、“laSt”和“sign”是二值符号(bin)。其中,“sig”和 “last”的bin经历了基于与除最高频率分量外的扫描号码(0彡i彡14)相对应的上下文的 二值算术编码。与扫描号码“i”的“sig[i]”相对应的上下文被假定为“COntext_Sig[i]”, 而与“last[i]”相对应的上下文被假定为“COntext_last[i]”。由于“sign”是士的代码, 所以它是在不使用上下文的情况下按照作为出现概率的等概率来经历二值算术编码的。另一方面,“leveljninusl”根据H. 264标准的“UEGk 二值化”被转换成二值串。 "UEGk 二值化”的细节在上述的“ITU-T H. 264| IS0/IEC14496-10高级视频编码”中的“9. 3 片层数据的CABAC解析过程”中记载。图5示出了与“leveljninusl”相对应的这种二值串的一个示例。从图5可以发 现,在“ leveljninusl ”的二值串的第一 bin中,二值算术编码是基于从上下文号码“0”至 “4”的五种上下文来执行的。还发现从第2个到第14个,二值算术编码是基于作为另外五 种上下文的从上下文号码“5”到“9”的五种上下文来执行的。然而,在图5中,符号“一”被 用于省略指示第3个至第14个bin经历了按照针对二值串的第二 bin设定的上下文的二 值算术编码。至于“leveljninusl”的二值串的第15和之后的bin,不使用上下文来执行以等概 率作为出现概率的二值算术编码。为了指示前述情况,图5中在上下文号码的列中示出了 字符“eq”。在以下描述中,用于“leveljninusl”的第1至第14个bin的二值算术编码中 的上下文将被表示为“contextjevel [i] ” (0彡i彡9)。联系本发明的与H. 264标准相关
根据第一示例性实施例的视频编码装置300具有如上所述的新设置了上下文更 新单元301的结构,并且除上下文更新单元301外的其他装置及其相关装置的操作与图17 所示的作为相关技术的视频编码装置100的相同。因此,下面将描述在选择PCM时将要执 行的上下文更新单元301的操作,并且将省略对与作为现有技术的视频编码装置100重叠 的部分的操作的描述。图6示出了上下文更新单元如何执行上下文更新处理。对于上下文更新,当作为 编码器的视频编码装置300选择PCM编码时,在未示出的解码器侧的装置未能得知每个 4X4块中的位阶值的分布。因此,假定在PCM编码时,在编码器和解码器两者中,在所有 4X4块的每一频率分量中都生成有效位阶值。作为上下文更新的开始,将4X4块索引号码“b4”设定为“0”。这里的4X4块索 引号码是图18所示的宏块中的4X4块编码顺序的号码。为了简化描述,将只考虑亮度像在步骤S401,把扫描号码“i”设定为“15”并且把作为绝对值为“1”的连续位阶值 的数目的“Cl”设定为“ 1 ”。另外,把“c2”设定为绝对值不小于“2”的连续位阶值的数目, 并且前进到后续步骤S402。“Cl”和“c2”最多被计数到四个。在对后续的步骤S403和以后的步骤的描述中,应当注意,在第一示例性实施例 中,每个4X4块的最高频率分量的“i = 15”到直流分量(DC)的“i = 0”,与“i”分量的 位阶值相对应的“00壯611_8丨8”、“(;0壯611_1381”和“(;0壯611_16¥61_11^111181”的每个上下 文被更新。不同于按从“i = 0”到“i = 15”的升序进行的普通直接执行,这是按降序执行 的。按降序的"context_sig” 禾口"context_last” 与“context_level_minusl” 的同时 上下文更新的原理因为以下条件得到满足而成立。(a)假定有效位阶值出现在所有4X4块的每一频率分量中。(b) “ sig [i],,和“ last [i],,对于每个频率分量具有上下文。这使得上下文“context_sig[i]” 和 “context_last[i]” 在从 “i = 15” 到 “i = 0”的降序处理和通常情况下的从“i = 0”到“i = 15”的升序处理两者中都被类似地更新。在步骤S402,为了判定其是否为最高频率分量,判定扫描号码“i”是否大于15。当 其不是最高频率分量时,即,当扫描号码“i”不大于15时(Y),前进到步骤S403。当其是最 高频率分量并且扫描号码“i”为15以上时,前进到步骤S405。在步骤S403,通过使用以下式(2)来更新与扫描号码“i”的“sig[i]”相对应的上 下文“context_sig[i],,。context — .pStateidx
示接下来在图7中示出的由H. 264定义的状态索引转变表,并且“transIdxLPSk] ”表示与 图7所示的“pStateidx”的值“χ”相对应的串的“transIdxLPX”的值的返回。图7示出了状态索引转变表的内容。从图7清楚可见,“transIdxLPSk]”表示不 大于当前“X”的值的返回。返回图6继续描述。当优势符号(MPS)因为在步骤S403利用式⑵对“COnteXt_ sig[i]”的更新而是“0”时,“pStateidx”被更新到接近更小的号码。更具体而言,执行更 新以使得劣势符号(LPS = 1)的上下文的劣势符号出现概率将会高于以前的。利用此布置, 即使当作为劣势符号(LPS = 1)的“sig= 1”的二值符号通过对经PCM编码的宏块后的宏 块的编码而被大量输入时,二值算术编码的效率也将得到与所更新的劣势符号出现概率的 增大程度相同程度的提高,即,效率将被提高到足以应对符号出现概率的急剧变化。在下一步骤S404,利用以下式(3)更新与扫描号码“ i ”的“ last [i] ”相对应的上 下文"context_last[i],,。
其中“context_last[i].pStateidx” 是“context_last[i] ” 的劣势符号出现概率 状态索引,而"context_last [i] · MPS,,是"context_last [i],,的优势符号。当优势符号(MPS)因为利用式(3)对“COnteXt_laSt[i]”的更新而是“1”时, “pStateidx”被更新到接近更小的号码。更具体而言,执行更新以使得劣势符号(LPS = O) 的上下文的劣势符号出现概率将会高于以前的。利用此布置,即使当作为劣势符号(LPS = 0)的“last = 0”的二值符号通过对经PCM编码的宏块后的宏块的编码而被大量输入时, 二值算术编码的效率也将得到与所更新的劣势符号出现概率的增大程度相同程度的提高, 即,效率将被提高到足以应对符号出现概率的急剧变化。在下一步骤S405,在上述的绝对值为“ 1 ”的连续位阶值的数目“c 1 ”被设定为“ 1 ” 的情况下,基于绝对值不大于2的连续位阶值的数目“c2”和通过从与扫描号码“i”相对应 的频率分量的位阶值的绝对值中减去“1”而获得的值“leveljninusUi]”,更新“context level,,。图8示出了如何执行在步骤S405中描述的对“contextjevel”的更新处理。在 此处理中,考虑到在PCM编码时,当编码器选择PCM编码时,解码器一侧不被允许发现每个 4X4块中的每个扫描号码“i”的“leveljninusUi]”。换言之,在PCM编码时,编码器和解 码器都在假定每个4X4块中的每个扫描号码“i”的“leveljiiinusl [i] ”为“14”的情况下 执行图8所示的处理。首先,在步骤S451,利用以下式⑷更新与“χ = Cl”相对应的“context level [χ]”。context _ level[x] .pStateidx 其中“context_level[χ]. pStateidx,,是“context_level [χ] ” 的劣势符号出现概 率状态索引,而 “context_level [χ] · MPS” 是 “context_level [χ],,的优势符号。当优势符号(MPS)因为利用式⑷对“contextJeveUx]”的更新而是“0”时, “pStateidx”被更新到接近更小的号码。更具体而言,执行更新以使得劣势符号(LPS = 1) 的上下文的劣势符号出现概率将会高于以前的。利用此布置,即使当作为劣势符号(LPS = 1)的“bin = 1”的“leveljiiinusl”的二值串中的第一二值符号通过对经PCM编码的宏块 后的宏块的编码而被大量输入时,二值算术编码的效率也将得到与所更新的劣势符号出现 概率的增大程度相同程度的提高,即,效率将被提高到足以应对符号出现概率的急剧变化。在随后的步骤S452,判定“leveljninusUi]”是否大于“0”。当其大于“0”时(Y), 前进到步骤S453。当其为“0”时(步骤S452 :N),前进到步骤S454。在步骤S453,利用以 下式(5)设定循环计数器1。1 = min(13,level_minusl[i]-l) ____(5),其中式(5)中的右侧的“13”是考虑到“leveljninusUi]”的二值串的第2至第 14个bin使用相同的上下文并且第15及其后的bin不使用上下文的值。将1设定为大于 “13”的值是没有意义的。在步骤S455处的处理(其是在步骤S453的处理之后执行的)中,利用式(4)更新 与“χ = c2+5”相对应的上下文“context_level[x] ”。即使当在步骤S455处对“context_ level [χ]”的更新结果是作为劣势符号(LPS = 1)的“bin = 1”的“ leveljninusl”的二值 串中的第2及其后的二值符号通过对经PCM编码的宏块后的宏块的编码而被大量输入时, 二值算术编码的效率也将得到与所更新的劣势符号出现概率的增大程度相同程度的提高, 即,效率将被提高到足以应对符号出现概率的急剧变化。然后,前进到步骤S456。在步骤S456,判定循环计数器1是否为“0”。当其为“0” 时(Y),前进到步骤S457。当其不为“0”时(步骤S456:N),前进到步骤S458,以将循环计 数器1递减1,以返回到步骤S455。c2 = min(4, c2++)____(6)另一方面,在步骤S454,将“c2”重置为“0”,并且还利用以下式(7)来更新“cl”。 然后,结束与图6中的步骤S405相关的处理(结束)。c2 = min(4, cl++)____(7)在图8所示的处理中,通过如式(6)或(7)中所示切换绝对值为“1”的连续位 阶值的数目“Cl”和绝对值不大于“2”的连续位阶值的数目“c2”,执行了根据过去处理的 "level_minusl"的上下文模拟。返回图6继续描述。当步骤S405的处理结束时,步骤S406的处理被执行。在步 骤S406,判定扫描号码“i”是否为“0”。当其为“0”时(Y),前进到步骤S407。这表示当前 4X4块的处理完成。如果其不为“0” (步骤S406 =N),则前进到步骤S408,以将扫描号码 “i”递减1并返回到步骤S402。另一方面,在步骤S407,判定4X4块索引号码“b4”是否为“15”。当其为“15”时(Y),结束上下文更新(结束)。如果其不为“15”(步骤S407:N),则前进到步骤S409,以将 4X4块索引号码“b4”递增“1”,并返回到步骤S401。这表示前进到对宏块中的后续4X4 块的处理。如以上详细描述的,上下文更新单元301在PCM选择时执行上下文更新处理。在 经PCM编码的宏块之后要编码的宏块中,这导致了更新与“ significant_coeff_flag,,、 “last_signifcant_coefT_flag,,禾口 “coef_abs_level_minusl” 中每一个相对应的上下文 的劣势符号出现概率状态索引“pStateidx”,以符合与急剧变化的“SignifiCant_COett_ flag,,、“last_significant_coeff_flag"禾口“coef_abs_level_minusl,,中的每一个相对应 的二值符号出现概率。更具体而言,对于“significant_coeff_flag”的每个上下文(context_sig[i], 0彡i彡14),当其优势符号(MPS)为“0”时,其“pStateidx”被更新为接近更小的号码。对 于 “last_significant_coeff_flag” 的每个上下文(context_last [i],0 ^ i ^ 14),当其 优势符号(MPS)为“1”时,其“pStateidx”被更新为接近更小的号码。另外,对于“coef_ abs_level_minusl” 的每个上下文(context_level [c], 0 ^ c ^ 9),当其优势符号(MPS) 为“0”时,其“pStateidx”被更新为接近更小的号码。换言之,上下文更新单元301执行更 新以使得"context_sig[i],,、“context_last [i] ”和“context_level [c] ” 中每一个的劣势 符号出现概率接近等概率。结果,即使当在后续宏块的编码开始时,上下文的作为与优势符 号不同的劣势符号的二值符号被大量输入时,二值算术编码的效率也可得到与所更新的劣 势符号出现概率的增大程度相同程度的提高。图9示出了与相关技术装置相比第一示例性实施例获得的效果。在该图中,宏块 量化参数(QP)由横轴表示,而二值算术编码比特的数目由纵轴表示。宏块量化参数(QP) 是在使用H. 264的应用中经常使用的值。此图中示出了以下情况由于在仅在最高频率分量中具有有效位阶值的宏块连 续经历二值算术编码之后,一个在所有频率分量中均具有有效位阶值的宏块的输入选择了 PCM编码。换言之,图中示出了针对每个宏块量化参数(QP),在所有频率分量中均具有有效 位阶值的宏块中的二值算术编码比特的数目。本示例性实施例被设计为在选择PCM编码时 更新上下文。结果,因为在本示例性实施例中,上下文被更新以符合急剧变化的符号出现概 率,所以实现了由曲线332指示的二值算术编码的比特数目,而不会超过指示上述预定比 特数目的上限值331。在图9中,在使用作为相关技术的视频编码装置100(图17)的情况下二值算术编 码的比特数目由曲线333表示,用于参考。在使用作为相关技术的视频编码装置100的情 况下,当选择PCM编码时不执行上下文更新。更具体而言,由于在作为相关技术的视频编码 装置100中不更新上下文以符合急剧变化的符号出现概率,因此二值算术编码的比特数目 将超过预定比特数目。比较曲线332和333将发现,本发明避免了由于符号出现概率的急 剧变化而导致的PCM编码的编码效率的降低。(第一示例性实施例的修改示例)图10示出了根据本发明的第一示例性实施例的视频编码装置的修改示例。在图 10所示的视频编码装置300B中,与图1的部分相同的部分被分配以相同的标号,对其的描 述将被适当地省略。视频编码装置300B与图1所示的视频编码装置300类似地具有上下 文更新单元301,其中PCM判定单元139B不监视经编码数据123,而是监视作为二值算术编码器141的比特输出156的比特的数目,以判定该比特数目是否超过上述预定bin数目,从 而判定其是否是PCM模式。另外,在视频编码装置300B中,存储器133从作为另一存储器 的匹配存储器501输入数据/向其输出数据。这样构造的视频编码装置300B与图1所示的视频编码装置300的差异仅在于二 值算术编码器141、PCM判定单元139B、匹配存储器501和上下文更新单元301的操作。因 此将主要描述该差异。二值算术编码器141在宏块的第一 bin被输入的时刻,存储在即将使第一 bin经 历二值算术编码之前算术编码器的状态,并将其保存在二值算术编码器141中的未示出的 本地存储器中。这些存储和保存的内容例如是二值算术编码器141的范围或下限值。如果 未收到来自PCM判定单元139B的对PCM模式的选择的通知,二值算术编码器141将经常性 地使宏块的bin经历二值算术编码并将所获得的结果输出到第二缓冲器152。假定当执行这种处理时,指示对PCM模式的选择的控制信号144B被从PCM判定单 元139B通知给二值算术编码器141。此时,二值算术编码器141清空第二缓冲器152。然 后,在当前的二值算术编码器141中存储曾被存储在该缓冲器中的前一比特输出156的状 态。然后,使与PCM模式相对应的预测参数的bin经历基于从上下文模拟单元146B提 供来的上下文的二值算术编码,并将所获得的结果输出到第一缓冲器151。在使与PCM模式 相对应的预测参数的bin经历二值算术编码之后,冲刷在该时刻二值算术编码器141的范 围,并将所获得的数据输出到第一缓冲器151。最后,通过输出所需数目的比特“0”,使输出 到第一缓冲器151的比特串的比特对齐。与PCM模式相对应的预测参数的bin是唯一确定 的值。因此,以上描述的前提是二值算术编码器141独自生成bin并使其经历二值算术编 码。PCM判定单元139B监视从二值算术编码器141输出到第二缓冲器152的宏块的比 特数目。然后,在该比特数目超过上述预定比特数目的时刻,向控制信号144B输出对PCM模 式的选择。在向控制信号144B输出对PCM模式的选择之后,在完成对当前宏块的编码时, PCM判定单元139B向控制信号144B输出对PCM模式的非选择。当宏块的第一 bin被输入时,匹配存储器501拷贝即将对第一 bin进行二值算术 编码之前存储器133的上下文并对其进行保存,直到后续宏块的编码开始为止。然而,匹配 存储器501在利用控制信号144B从PCM判定单元139B通知对PCM模式的选择的时刻将先 前拷贝的上下文覆写在存储器133上。这使得覆写在存储器133上的上下文与对前一宏块 的编码结束时的上下文一致,从而维持与解码器的上下文匹配。当利用控制信号144B从PCM判定单元139B通知对PCM模式的选择,从而将匹配 存储器501的上下文覆写在存储器133上时,上下文更新单元301对存储在存储器133中 的与位阶值相关的经编码数据的上下文进行更新。取代采用这种更新过程,在将匹配存储 器501的上下文覆写在存储器133上之前,上下文更新单元301可对存储在匹配存储器501 的上下文中的与位阶值相关的经编码数据的上下文进行更新。从而,在根据第一示例性实施例的修改示例的视频编码装置300B中,当一宏块由 于符号出现概率的急剧变化而被PCM编码时,只利用上下文更新单元301的功能,上下文就 可被更新,以与改变后的符号出现概率一致。由于匹配存储器501只保存前一宏块的上下文并保存尚待学习的上下文,所以当宏块由于符号出现概率的急剧变化而被PCM编码时, 不可能更新上下文以与急剧变化的符号出现概率一致。(第二示例性实施例)图11示出了根据本发明的第二示例性实施例的视频解码装置的结构。视频解码 装置600包括分离器601,用于输入从图1所示的视频编码装置300输出的比特流128。分 离器601将比特流128分成片层头部信息和宏块信息。有关更多细节,参见上述“ITU-T H. 264|IS0/IEC 14496-10高级视频编码”中的“7语法和语义”。片层的头部信息对应于在 上述“高级视频编码”中的第7. 3. 3节中记载的片层头部语法。有关宏块信息,参见上述“高 级视频编码”中的第7. 3. 5节中记载的“宏块层语法[muni] ”。分离器601连接到上下文初始值计算器611和第四开关612的输入侧。由片层量 化参数和模型ID(model_id)形成的片层的头部信息613被从分离器601提供到上下文初 始值计算器611。上下文初始值计算器611被设计为基于该片层量化参数和model ID来计 算二值算术解码的上下文的初始值,并且将作为计算结果的值614设定在存储器615处。另一方面,从分离器601输出的宏块信息的比特616通过第四开关612被提供给 二值算术解码器617或PCM解码器618。在二值算术解码器617与存储器615之间,连接了 上下文模拟单元619。此外,上下文模拟单元619连接到上下文更新单元621。二值算术解 码器617基于从上下文模拟单元619提供来的上下文622对输入比特执行二值算术解码。 经二值算术解码器617解码的二值符号(bin) 623被提供给经编码数据解码器624。二值算术解码器617还连接到PCM检测器625。二值算术解码器617在被PCM检 测器625通知当前宏块处于PCM模式时将二值算术解码器617的当前范围重置为预定值。 然后,二值算术解码器617停止二值算术解码,直到处于PCM模式中的当前宏块的解码被 PCM解码器618完成为止。另一方面,经编码数据解码器624根据输入bin 623的二值串,对原始经编码数据 进行解码。经解码的经编码数据的预测参数626被提供给与经编码数据解码器624连接的 PCM检测器625和预测单元627。经解码的经编码数据的宏块量化参数和位阶值628被提 供给与经编码数据解码器624连接的逆量化·逆变换单元629。PCM检测器625利用输入的预测参数626检测当前宏块是否处于PCM模式中。当 当前宏块处于PCM模式中时,通过其输出控制信号631通知二值算术解码器617、上下文更 新单元621、第四开关612和第五开关632当前宏块处于PCM模式中。作为逆量化 逆变换单元629和预测单元627的输出的预测误差图像634和预测 图像635被输入到加法器636并被相加,使得作为加法结果的预测解码图像637被输入到 第五开关632。第五开关632交替地选择预测解码图像637和作为PCM解码器618的解码 结果的PCM解码图像638,以将选择输出639输入到经解码图像缓冲器641。从经解码图像 缓冲器641输出的经解码图像642被输入到预测单元627,并被从视频解码装置600输出作 为经解码图像642。这里,在输入到逆量化 逆变换单元629的宏块量化参数和位阶值628中,位阶值 被按照与宏块量化参数相对应的量化步长进行逆量化。为了对位阶值(经变换和量化的系 数)进行逆量化,应用逆频率变换以从频域返回到空间域。返回到空间域的经变换和量化 的系数是预测误差图像634。预测误差图像634被输入到加法器636的一侧。由预测单元627生成的预测图像635被输入到加法器636的另一侧。该预测图像635是通过由预测单元627接收预测参数 626和从经解码图像缓冲器641输出的经解码图像642的输入而生成的。从加法器636输 出的作为加法结果的预测解码图像637将作为宏块的经解码图像被提供到第五开关632。当从PCM检测器625输出的控制信号631通知PCM模式时,第四开关612把从分 离器601输出的宏块信息的比特616提供给PCM解码器618。当当前宏块处于PCM模式中 时,PCM解码器618对所提供的宏块信息的比特616执行PCM解码。作为结果从PCM解码 器618输出的PCM解码图像638将作为有关宏块的经解码图像被提供到第五开关632。在通常情况下,第四开关612将分离器601的输出连接到二值算术解码器617的 输入。当被来自PCM检测器625的控制信号631通知当前宏块处于PCM模式中时,第四开 关612将分离器601的输出连接到PCM解码器618的输入,直到当前宏块的PCM解码完成 为止。因此,在上述通常情况下,第五开关632将预测解码图像637提供给经解码图像缓 冲器641。当被PCM检测器625通知当前宏块是PCM模式时,将PCM解码图像638提供给经 解码图像缓冲器641。在PCM检测器625利用控制信号631通知当前宏块是PCM模式的时刻,上下文更 新单元621通过上下文模拟单元619对存储在存储器615中的与位阶值相关的经编码数据 的上下文进行更新。第二示例性实施例中的与位阶值相关的经编码数据与第一示例性实施 例类似是 H. 264 标准中的 “significant_coefT_flag,,、“last_significant_coefT_flag,, 禾口 "coef_abs_level_minusl”。经解码图像缓冲器641在适当地显示定时向外部输出所存储的经解码图像642。在上述的根据第二示例性实施例的视频解码装置600中,上下文更新单元621具 有关键特征。由于上下文更新单元621的操作与在第一示例性实施例中描述的上下文更新 单元301的操作相同,因此将不对其进行描述。根据第二示例性实施例的视频解码装置600使得能够对由根据第一示例性实施 例的视频编码装置300生成的经解码比特流进行解码。更具体而言,当宏块由于符号出现 概率的急剧变化而被PCM编码时,可以在应用符合改变后符号出现概率的上下文更新的同 时对经编码比特流进行解码。(第三示例性实施例)在图1和图10所示的作为第一示例性实施例及其修改示例的视频编码装置300 和300B中,当宏块被PCM编码时,上下文更新单元301将“significant_coeff_flag”的每 个上下文(context_sig[i],0 彡 i 彡 14)、“ last_significant_coefT_flag”的每个上下文 (context_last[i],0 彡 i 彡 14)以及"coef_abs_level_minusl,,的每个上下文(context_ level[c],0^c^9)的劣势符号出现概率状态索引(pStateidx)更新为更小的号码。换言 之,上下文更新单元 301 将"context_sig[i],,、"context_last [i] ”和"context_level [c],, 的每个劣势符号出现概率更新为等概率。然而,为了使得上下文的劣势符号出现概率为等概率,不需要第一示例性实施例 或其修改示例中的顺序更新。换言之,只需要将优势符号(MPS)和劣势符号出现概率状态 索引(pStateidx)设定为适当的值即可。更具体而言,对于每个“c0nteXt_sig[i]”,将MPS 设定为1并将pStateidx设定为0,对于每个“context_last [i] ”,将MPS设定为0并将pStateidx设定为0,而对于每个“context_level [c] ”,将MPS设定为1并将pStateidx设 定为0。此设定相当于将优势符号出现概率设定为等概率。此外,将上下文的劣势符号出 现概率设定为等概率使得对通过使用所关注的上下文首先编码的一个bin的二值算术编 码的输出将为一个比特并且在不发生由于二值算术编码而导致的编码损耗的状态下被重置。在本发明的第三示例性实施例中,“ context_s i g [ i ] ”、“ context_last [ i ] ”和 “COntext_level [c] ”的每个劣势符号出现概率不被顺序更新为等概率,而是被立即更新为 等概率。图12示出了根据本发明的第三示例性实施例的视频编码装置的结构。在图12所 示的第三示例性实施例的视频编码装置300C中,与图1的部分相同的部分被分配以相同的 标号,其描述将被适当地省略。与第一示例性实施例的视频编码装置300相比,视频编码装 置300C设有取代存在于图1中的上下文更新单元301的上下文等概率更新单元701。当被从PCM判定单元139输出的控制信号144通知PCM模式选择时,上下文等 概率更新单元701将作为存储在存储器133中的与位阶值相关的经编码数据的上下文的 "context_sig[i],,、"context_last [i],,和"context_level [c],,更新为上述值。换言之, 将劣势符号出现概率设定为等概率。由于对存储在存储器133中的数据执行了直接更新, 因此上下文等概率更新单元701进行的上述更新处理相当于存储器133覆写处理。在第三示例性实施例的视频编码装置300C中,除上下文等概率更新单元701外的 其他部分与根据第一示例性实施例的视频编码装置300的相同。这里将只描述在PCM选择 时上下文等概率更新单元701的操作。图13示出了在PCM选择时上下文等概率更新单元进行的处理的流程。首先,在PCM 选择中,在步骤S801利用以下的式(8)和(9)更新所有的“COntext_sig[i]”(0彡i彡14) 和优势符号(MPS)的出现概率状态索引(pStateidx)。context_sig[i]. pStateidx = 0 …(8)context_sig[i], MPS = 1 ... (9)按照式(8),劣势符号出现概率将为等概率。因此,即使当式(9)的右侧是“1”而 不是“0”时,对利用有关上下文编码的第一个bin的二值算术编码的输出也将是一个比特。在下一步骤S802,利用以下的式(10)和(11)更新所有“ConteXt_ last[i]”(0彡i彡14)的出现概率状态索引(pStateidx)和优势符号(MPS)。context_last[i]. pStateidx = 0 . . . (10)context_last[i], MPS = 1 . . . (11)与“COnteXt_Sig”类似,因为按照式(10),劣势符号出现概率将为等概率,所以即 使当式(11)的右侧是“0”而不是“1”时,对利用有关上下文编码的第一个bin的二值算术 编码的输出也将是一个比特。在下一步骤S803,利用以下的式(12)和(13)更新所有“COnteXt_ level [c] ”(0彡c彡9)的出现概率状态索引(pStateidx)和优势符号(MPS)。context_level[c]. pStateidx = 0 …(12)context_level[c].MPS = 1 · · · (13)
与“COnteXt_sig”和“contextjast”类似,因为按照式(8),劣势符号出现概率将 为等概率,所以即使当式(13)的右侧不是“1”而是“0”时,对利用有关上下文编码的第一 个bin的二值算术编码的输出也将是一个比特。前述处理完成了上下文等概率的更新。当宏块被PCM编码时,上述的根据第三示例性实施例的视频编码装置300C使得能 够不像第一示例性实施例中那样进行顺序上下文更新,而是进行瞬时上下文更新。因此,可 以利用比第一示例性实施例更简单的算术运算来更新上下文以符合急剧变化的符号出现 概率。(第三示例性实施例的修改示例)图14示出了根据本发明的第三示例性实施例的视频编码装置的修改示例的结 果。在图14所示的作为第三示例性实施例的修改示例的视频编码装置300D中,与图12的 部分相同的部分被分配以相同的标号,对其的描述将被适当地省略。在作为修改示例的视 频编码装置300D中,PCM判定单元139D被设计为在不监视经编码数据123的情况下监视 作为二值算术编码器141的比特输出156的比特的数目,以判定比特数目是否超过上述的 预定bin数目,从而判定其是否处于PCM模式中。这与图10所示的视频编码装置300B与 图1所示的视频编码装置300的关系相同。这样构造的视频编码装置300D与图12所示的视频编码装置300的差异仅在于二 值算术编码器141、PCM判定单元139D和上下文模拟单元146D的操作。因此将主要描述该差异。二值算术编码器141在宏块的第一 bin被输入的时刻,存储在即将使第一 bin经 历二值算术编码之前算术编码器的状态,并将其保存在二值算术编码器141中的未示出的 本地存储器中。这些存储和保存的内容例如是二值算术编码器141的范围或下限值。如果 未收到来自PCM判定单元139D的对PCM模式的选择的通知,二值算术编码器141将经常性 地使宏块的bin经历二值算术编码并将所获得的结果输出到第二缓冲器152。 假定当执行这种处理时,指示对PCM模式的选择的控制信号144D被从PCM判定单 元139D通知给二值算术编码器141。此时,二值算术编码器141清空第二缓冲器152。然 后,在当前的二值算术编码器141中存储曾被存储在该缓冲器中的前一比特输出156的状 态。然后,使与PCM模式相对应的预测参数的bin经历基于从上下文模拟单元146D提 供来的上下文的二值算术编码,并将所获得的结果输出到第一缓冲器151。在使与PCM模式 相对应的预测参数的bin经历二值算术编码之后,冲刷在该时刻二值算术编码器141的范 围,并将所获得的数据输出到第一缓冲器151。最后,通过输出所需数目的比特“0”,使输出 到第一缓冲器151的比特串的比特对齐。与PCM模式相对应的预测参数的bin是唯一确定 的值。因此,以上描述的前提是二值算术编码器141独自生成bin并使其经历二值算术编 码。用于与PCM模式相对应的预测参数的bin的上下文在H. 264标准中少到只有大约 三种。因此,二值算术编码器141被构造为在宏块的第一宏块被输入时独自顺序地保留在 该第一 bin即将经历二值算术编码之前的上下文。然后,在从PCM判定单元139D利用控制 信号144D通知对PCM模式的选择时,二值算术编码器141通过上下文模拟单元146D将所保留的上下文写回到存储器133。PCM判定单元139D监视从二值算术编码器141输出到第二缓冲器152的宏块的比 特数目。然后,在该比特数目超过上述预定比特数目的时刻,向控制信号144D输出对PCM模 式的选择。在向控制信号144D输出对PCM模式的选择之后,在完成对当前宏块的编码时, PCM判定单元139D向控制信号144D输出对PCM模式的非选择。将以上所述的作为第三示例性实施例的修改示例的视频编码装置300D与图10所 示的作为第一示例性实施例的修改示例的视频编码装置300B相比较。可以发现,与图10 所示的视频编码装置300B不同,在图14所示的视频编码装置300D中不需要匹配存储器 501。这是因为,当宏块被PCM编码时,只要通过把上述预定值覆写在视频编码装置300D的 存储器133中存储的与位阶值相关的经编码数据的上下文(“C0ntext_Sig[i]”、“C0ntext_ laSt[i],ln“COntext_level[C]”)上,上下文就被更新。换言之,图14所示的视频编码装 置300D不需要像图10所示的视频编码装置300B的结构中所做的那样基于存储在匹配存 储器501中的上下文进行顺序更新。图14所示的基于上下文等概率更新单元701的视频 编码装置300D因此具有装置结构更简单的优点。(第四示例性实施例)图15示出了根据本发明的第四示例性实施例的视频解码装置的结构。在图15所 示的视频解码装置600E中,与图11的部分相同的部分被分配以相同的标号,对其的描述将 被适当地省略。在根据本示例性实施例的视频解码装置600E中,与图11所示的视频解码 装置600相比,取代上下文更新单元621 (图11)设置了上下文等概率更新单元901。当被PCM检测器625通知PCM模式时,根据第四示例性实施例的视频解码装置 600E的上下文等概率更新单元901把存储器615中存储的作为与位阶值相关的经编码数据 的上下文的“context_sig[i] ”、“context_last [i] ”和“context_level [c] ” 的每个劣势符 号出现概率更新为等概率。由于存储在存储器133中的数据被直接更新,所以上下文等概 率更新单元901相当于覆写存储器615的处理。视频解码装置600E中除上下文等概率更新单元901之外的其他电路组件与根据 第二示例性实施例的视频解码装置600的相同。本示例性实施例的视频解码装置600E使 得能够对由图12所示的根据第三示例性实施例的视频编码装置300C编码的比特流进行解 码。更具体而言,对于由于符号出现概率的急剧变化而经历了 PCM编码的宏块,可以在应用 符合变化后的符号出现概率的上下文等概率更新的同时对经编码的比特流进行解码。在以上描述的本发明的示例性实施例中,已经描述了在PCM编码情况下对 "significant_coeff_flag">“last_significant_coeff_flag" 禾口 "coef_abs_level_ minusl”的上下文的更新。很明显,本发明的技术思想可类似地应用于Huffman编码而不是 PCM编码,或者应用到使用二值算术编码而不使用上下文的视频处理装置。此外,虽然在以上描述的本发明的示例性实施例及其修改示例中,已经描述了当 使用 4X4 ±夬大小频率变换时对“significant_coeff_flag”、“last_significant_coeff_ flag"和“COef_abS_level_minuSl”的上下文更新,但其并不限于此。同样,例如,在诸如 H. 264标准的“高档次”(Highprofile)之类的使用8X8块大小频率变换的视频编码·解 码中,与通过4X4块大小频率变换生成的图像块(4X4频率块)的位阶值类似,二值算术 编码·解码基于 “significant_coeff_flag,,、“last_significant_coeff_flag,m“coef_abS_level_minuSl”被应用到通过8X8块大小频率变换生成的图像块(8X8频率块)的位 阶值。因此很明显,已经描述的4X4频率块上下文更新的方法可应用于这种8X8频率块。在此情况下,在第一示例性实施例和第二示例性实施例中对8X8频率块执行的 上下文更新单元 301 的操作中,“significant_coeff_flag,m“last_significant_coeff_ flag”的上下文按从DC分量到高频分量的顺序被一度更新。然后,按从高频分量到DC分量 的顺序,更新“c0ef_abS_level_minuSl”的上下文。至于第三示例性实施例和第四示例性 实施例中的上下文等概率更新单元701和901,不需要改变处理顺序。另外,在本发明的上述示例性实施例中的每一个中,在使用作为图片编码结构的 MBAFF(宏块自适应帧场)编码的情况下,当在PCM编码时更新上下文时,不仅当前宏块 的编码结构(帧结构或场结构)的 “significant_coeff_flag” 和 “last_significant_ coeff_flag"的上下文,而且除当前宏块外的其他编码结构的“signifiCant_COeff_flag” 和“last_significant_c0eff_flag”也可被同时更新。例如,如果当前宏块的编码结构是 帧结构,则场结构的上下文也被更新。这避免了由于本发明中的上下文更新而导致的宏块 编码结构的偏差。另外,在本发明的每个示例性实施例中,在PCM编码时是否执行上下文更新可被 嵌入在PCM模式宏块的头部信息中,虽然这要求在视频编码器一侧设置用于判定是否执行 上下文更新的上下文更新判定单元,但却使得能够在继PCM模式宏块之后的宏块中进行符 合符号出现概率的算术编码。取代嵌入在PCM模式宏块的头部信息中,本发明还可被构造为仅当预定数目的 PCM模式宏块连续出现时更新上下文。这消除了在视频编码器一侧对上下文更新判定单元 的需要。虽然在每个上述示例性实施例中,视频编码装置或视频解码装置是仅用硬件构造 的,但CPU(中央处理单元)可执行计算机程序并且一部分构成电路装置可实现为软件。图16示出了作为一个示例当包括视频编码装置和视频解码装置的视频处理装置 由软件形成时的硬件结构。视频处理装置1000包括用于视频数据存储的第一存储介质 1001和用于比特流存储的第二存储介质1002。视频处理装置1000还包括具有未示出的 CPU和工作存储器的、堆叠为半导体芯片的处理器1003,并且连接到存储要被CPU执行的控 制程序的程序存储器1004。连接到处理器1003的是供用户或负责维护的人操作视频处理 装置1000的操作单元1005,以及用于显示或打印出关于在编码之前或解码之后的视频等 等的各种信息或操作的状态的输出装置1006。处理器1003从第一存储介质1001中读取视频数据1011,并对其进行编码以将比 特流1012存储在第二存储介质1002中。还从第二存储介质1002中读取比特流1013并将 其解码为视频数据1014,以将所获得的数据存储在第一存储介质1001中。通过由CPU对控 制处理器的运行,这里的处理器1003实现在每个上述示例性实施例中实质描述的各种电
路装置。很明显,第一存储介质1001、第二存储介质1002或程序存储器1004的一部分或全 部可被布置在未示出的诸如因特网之类的网络上。虽然以上已经针对优选的示例性实施例(以及示例)描述了本发明,但是本发明 并不一定限于上述的示例性实施例(以及示例)。本发明的结构或细节允许本领域的技术人员可以理解的各种修改,而不会脱离本发明的范围。通过引用并入本申请基于2007年9月6日提交的日本专利申请No. 2007-231478并要求其优先 权,其公开内容通过引用被全部并入在此。
权利要求
一种视频编码装置,包括第一编码单元,用于使通过向图像块应用频率变换和量化而获得的经变换和量化的值经历基于上下文的二值算术编码;第二编码单元,用于利用与所述第一编码单元的方法不同的编码方法对所述图像块编码;输出数据选择单元,用于选择由所述第一编码单元输出的第一输出数据或由所述第二编码单元输出的第二输出数据;以及上下文更新单元,用于在输出数据选择单元选择所述第二输出数据时对用于所述经变换和量化的值的二值算术编码中的上下文进行更新。
2.根据权利要求1所述的视频编码装置,其中,所述上下文更新单元是对用于所述经 变换和量化的值的二值算术编码中的上下文进行更新以减小与劣势符号出现概率相关联 的上下文的数目的单元。
3.根据权利要求1所述的视频编码装置,其中,所述上下文更新单元是增大用于所述 经变换和量化的值的二值算术编码中的上下文的劣势符号的出现概率的单元。
4.根据权利要求1所述的视频编码装置,其中,所述上下文更新单元是把与符号出现 概率的预定的确定值相关联的上下文覆写在用于所述经变换和量化的值的二值算术编码 中的上下文上的单元。
5.根据权利要求4所述的视频编码装置,其中,所述符号出现概率的预定的确定值是 等概率的值。
6.根据权利要求1所述的视频编码装置,其中,与所述第一编码单元的方法不同的编 码方法是PCM编码、Huffman编码和二值算术编码中的任何一种。
7.一种视频解码装置,包括第一解码单元,用于使输入图像数据经历基于上下文的二值算术解码以对经变换和量 化的值解码;第二解码单元,用于利用与所述第一解码单元的方法不同的解码方法对所述输入图像 数据解码;解码选择单元,用于选择所述第一解码单元或所述第二解码单元用于对所述输入图像 数据解码;以及上下文更新单元,用于在解码选择单元选择利用所述第二解码单元进行解码时对用于 所述经变换和量化的值的二值算术解码中的上下文进行更新。
8.根据权利要求7所述的视频解码装置,其中,所述上下文更新单元是对用于所述经 变换和量化的值的二值算术解码中的上下文进行更新以减小与劣势符号出现概率相关联 的上下文的数目的单元。
9.根据权利要求7所述的视频解码装置,其中,所述上下文更新单元是增大用于所述 经变换和量化的值的二值算术编码中的上下文的劣势符号的出现概率的单元。
10.根据权利要求7所述的视频解码装置,其中,所述上下文更新单元是把与符号出现 概率的预定的确定值相关联的上下文覆写在用于所述经变换和量化的值的二值算术编码 中的上下文上的单元。
11.根据权利要求10所述的视频解码装置,其中,所述符号出现概率的预定的确定值是等概率的值。
12.根据权利要求7所述的视频解码装置,其中,与所述第一解码单元的方法不同的解 码方法是PCM解码、Huffman解码和二值算术解码中的任何一种。
13.—种视频编码方法,包括第一编码步骤,使通过向图像块应用频率变换和量化而获得的经变换和量化的值经历 基于上下文的二值算术编码;第二编码步骤,利用与所述第一编码步骤的方法不同的编码方法对所述图像块编码;输出数据选择步骤,选择在所述第一编码步骤输出的第一输出数据或在所述第二编码 步骤输出的第二输出数据;以及上下文更新步骤,当在输出数据选择步骤中所述第二输出数据被选择时,对用于所述 经变换和量化的值的二值算术编码中的上下文进行更新。
14.根据权利要求13所述的视频编码方法,其中,与所述第一编码步骤的方法不同的 编码方法是PCM编码、Huffman编码和二值算术编码中的任何一种。
15.一种视频解码方法,包括第一解码步骤,使输入图像数据经历基于上下文的二值算术解码以对经变换和量化的 值解码;第二解码步骤,利用与所述第一解码步骤的方法不同的方法对所述输入图像数据解码;解码选择步骤,选择所述第一解码步骤或所述第二解码步骤用于对所述输入图像数据 解码;以及上下文更新步骤,当在解码选择步骤中利用所述第二解码步骤进行的解码被选择时, 对用于所述经变换和量化的值的二值算术解码中的上下文进行更新。
16.根据权利要求15所述的视频解码方法,其中,与所述第一解码步骤的方法不同的 解码方法是PCM解码、Huffman解码和二值算术解码中的任何一种。
17.—种视频编码程序,其使得计算机执行第一编码处理,使通过向图像块应用频率变换和量化而获得的经变换和量化的值经历 基于上下文的二值算术编码;第二编码处理,利用与所述第一编码处理的方法不同的编码方法对所述图像块编码;输出数据选择处理,选择所述第一编码处理输出的第一输出数据或所述第二编码处理 输出的第二输出数据;以及上下文更新处理,当在输出数据选择处理中所述第二输出数据被选择时,对用于所述 经变换和量化的值的二值算术编码中的上下文进行更新。
18.根据权利要求17所述的视频编码程序,其中,与所述第一编码处理的方法不同的 编码方法是PCM编码、Huffman编码和二值算术编码中的任何一种。
19.一种视频解码程序,其使得计算机执行第一解码处理,使输入图像数据经历基于上下文的二值算术解码以对经变换和量化的 值解码;第二解码处理,利用与所述第一解码处理的方法不同的解码方法对所述输入图像数据 解码;解码选择处理,选择所述第一解码处理或所述第二解码处理用于对所述输入图像数据 解码;以及上下文更新处理,当在解码选择处理中利用所述第二解码处理进行的解码被选择时, 对用于所述经变换和量化的值的二值算术解码中的上下文进行更新。
20.根据权利要求19所述的视频解码程序,其中,与所述第一解码处理的方法不同的 解码方法是PCM解码、Huffman解码和二值算术解码中的任何一种。
全文摘要
提供能够防止在上下文自适应编码中由于符号出现概率的突然波动而导致的压缩效率的降低的视频编码装置、视频编码方法和视频编码程序并获得相应的视频解码装置、视频解码方法和解码程序。视频数据(101)以宏块为单位被输入。量化后的编码数据(123)经历由PCM判断单元(139)进行的关于其是否处于PCM模式中的判断。如果PCM被选择,则上下文更新单元(301)执行上下文更新处理,从而提高数字算术编码的效率。第三开关(148)依据PCM模式是否未被选择数字算术编码或PCM编码后的输出。
文档编号H04N7/30GK101933331SQ20088011503
公开日2010年12月29日 申请日期2008年9月5日 优先权日2007年9月6日
发明者宫本义弘, 蝶野庆一 申请人:日本电气株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1