通过使用大型变换单元编码和解码图像的方法和设备与制造工艺

文档序号:11057248阅读:387来源:国知局
通过使用大型变换单元编码和解码图像的方法和设备与制造工艺
通过使用大型变换单元编码和解码图像的方法和设备本申请是申请日为2010年8月13日,申请号为“201080036020.4”,标题为“通过使用大型变换单元编码和解码图像的方法和设备”的发明专利申请的分案申请。技术领域示例性实施例涉及一种编码和解码图像的方法和设备,更具体地说,涉及一种通过将像素域的图像变换为频域的系数来对图像进行编码和解码的方法和设备。

背景技术:
为了执行图像压缩,多数图像编码和解码方法和设备通过将像素域的图像变换为频域的系数来对图像编码。作为频率变换技术之一的离散余弦变换(DCT)是广泛使用于图像和声音压缩中的公知技术。使用DCT的图像编码方法包括:对像素域的图像执行DCT,生成离散余弦系数,量化生成的离散余弦系数,对生成的离散余弦系数执行熵编码。

技术实现要素:
技术方案示例性实施例提供一种通过使用更有效的离散余弦变换(DCT)来对图像进行编码和解码的方法和设备,还提供一种其上记录了用于执行所述方法的程序的计算机可读记录介质。有益效果根据一个或多个示例性实施例,可以将变换单元设置为比预测单元大,并执行DCT,从而可有效地对图像进行压缩和编码。附图说明通过参照附图详细描述本发明的示例性实施例,示例性实施例的以上和其它特点将变得更清楚,其中:图1是根据示例性实施例的图像编码设备的框图;图2是根据另一示例性实施例的图像解码设备的示图;图3是根据另一示例性实施例的层次编码单元;图4是根据另一示例性实施例的基于编码单元的图像编码器的框图;图5是根据另一示例性实施例的基于编码单元的图像解码器的框图;图6示出根据另一示例性实施例的最大编码单元、次级编码单元和预测单元;图7是根据另一示例性实施例的编码单元和变换单元的示图;图8A和图8B示出根据另一示例性实施例的最大编码单元、预测单元和变换单元的划分形状;图9是根据另一示例性实施例的图像编码设备的框图;图10是变换器的示图;图11A到图11C示出根据另一示例性实施例的变换单元的类型;图12示出根据另一示例性实施例的不同变换单元;图13是根据另一示例性实施例的图像解码设备的框图;图14是根据示例性实施例的图像编码方法的流程图;图15是根据另一示例性实施例的图像解码方法的流程图。最佳实施方式根据示例性实施例的一方面,提供了一种图像编码方法,包括以下操作:通过选择多个相邻预测单元来设置变换单元;根据变换单元将所述多个相邻预测单元变换为频域,并生成频率分量系数;量化频率分量系数;对量化的频率分量系数执行熵编码。可基于指示大小缩减的等级的深度来执行设置变换单元的操作,所述大小缩减从当前片段或当前图片的最大编码单元到包括所述多个相邻预测单元的次级编码单元逐级执行。可通过选择根据相同预测模式执行预测的多个相邻预测单元来执行设置变换单元的操作。相同预测模式可以是帧间预测模式或帧内预测模式。图像编码方法还可包括通过对不同的变换单元重复执行上述操作来设置最佳变换单元的操作,其中,上述操作包括以下操作:通过选择多个相邻预测单元来设置变换单元,根据变换单元将所述多个相邻预测单元变换为频域并生成频率分量系数,量化频率分量系数并对量化的频率分量系数执行熵编码。根据示例性实施例的另一方面,提供了一种图像编码设备,包括:变换器,通过使用多个相邻预测单元来设置变换单元,根据变换单元将所述多个相邻预测单元变换为频域并生成频率分量系数;量化单元,量化频率分量系数;熵编码单元,对量化的频率分量系数执行熵编码。根据示例性实施例的另一方面,提供了一种图像解码方法,包括以下操作:根据变换单元对通过被变换到频域而生成的频率分量系数进行熵解码;反量化频率分量系数;将频率分量系数反变换为像素域,并重构包括在变换单元中的多个相邻预测单元。根据示例性实施例的另一方面,提供了一种图像解码设备,包括:熵解码器,根据变换单元对通过被变换到频域而生成的频率分量系数进行熵解码的;反量化单元,反量化频率分量系数;反变换器,将频率分量系数反变换为像素域,并重构包括在变换单元中的多个相邻预测单元。根据示例性实施例的另一方面,提供了一种记录了用于执行图像编码和解码方法的计算机可读记录介质。具体实施方式在下文,将参照附图详细描述示例性实施例。在示例性实施例中,根据上下文,“单元”可表示或可不表示单元的大小,“图像”可表示视频的静止图像或运动图像(即,视频本身)。图1是根据示例性实施例的用于编码图像的设备100的框图。参照图1,设备100包括最大编码单元划分单元110、编码深度确定单元120、图像数据编码器130以及编码信息编码器140。最大编码单元划分单元110可基于作为最大大小的编码单元的最大编码单元划分当前图片或片段。也就是说,最大编码单元划分单元110可划分当前图片或片段以获得至少一个最大编码单元。根据示例性实施例,可使用最大编码单元和深度来表示编码单元。如上所述,最大编码单元指示当前图片的编码单元中的具有最大大小的编码单元,深度指示通过层次地减小编码单元而获得的次级编码单元的大小。随着深度增加,编码单元可在大小上从最大编码单元减小到最小编码单元,其中,最大编码单元的深度被定义为最小深度,最小编码单元的深度被定义为最大深度。由于编码单元的大小随着深度增加从最大编码单元减小,因此第k深度的次级编码单元可包括多个第(k+n)(k和n是等于或大于1的整数)深度的次级编码单元。根据将要编码的图片的大小的增加,以更大的编码单元对图像编码可得到更高的图像压缩率。然而,如果固定采用更大的编码单元,则考虑到连续变化的图像特征的因素,不能高效地编码图像。例如,当对诸如大海或天空的平滑区域进行编码时,编码单元越大,压缩率就会越增加。然而,当对诸如人物或建筑物的复杂区域进行编码时,编码单元越小,压缩率就会越增加。因此,根据示例性实施例,对每个图片或片段设置不同最大图像编码单元和不同最大深度。由于最大深度表示编码单元可减小的倍数的最大数量,因此可根据最大深度不同地设置包括在最大图像编码单元中的每个最小编码单元的大小。编码深度确定单元120确定最大深度。可基于速率失真(R-D)成本的计算来确定最大深度。可为每个图片或片段或每个最大编码单元不同地确定最大深度。确定的最大深度被提供到编码信息编码器140,根据最大编码单元的图像数据被提供到图像数据编码器130。最大深度表示可包括在最大编码单元中的具有最小大小的编码单元(即最小编码单元)。换句话说,最小编码单元可被划分为根据不同深度的具有不同大小的次级编码单元。稍后参照图8A到图8B对此详细描述。此外,可基于具有不同大小的处理单元预测或变换包括在最大编码单元中的具有不同大小的次级编码单元。换句话说,设备100可基于具有不同大小和不同形状的处理单元执行用于图像编码的多种处理操作。为了对图像数据进行编码,执行诸如预测、变换和熵编码的处理操作,其中,具有相同大小的处理单元可用于每个操作,或者具有不同大小的处理单元可用于每个操作。例如,设备100可选择与编码单元不同的处理单元来预测所述编码单元。当编码单元的大小是2N×2N(其中N是正整数)时,用于预测的处理单元可以是2N×2N、2N×N、N×2N和N×N。换句话说,可基于具有编码单元的高和宽中的至少一个被等分为二的形状的处理单元来执行运动预测。在下文,作为预测的基础的处理单元被定义为“预测单元”。预测模式可以是帧内模式(intra-mode)、帧间模式(inter-mode)、跳过模式和仅对具有特定大小或形状的预测单元执行的特定预测模式中的至少一个。例如,可仅对具有2N×2N和N×N的大小的形状为正方形的预测单元执行帧内模式。此外,仅对具有2N×2N的大小的预测单元执行跳过模式。如果多个预测单元存在于编码单元中,则可在对每个预测单元执行预测之后选择具有最少编码错误的预测模式。可选择地,设备100可基于具有与编码单元的大小不同大小的处理单元对图像数据执行频率变换。对于编码单元中的频率变换而言,可基于具有与编码单元的大小相同的大小或比编码单元的大小小的大小的处理单元执行频率变换。在下文,作为频率变换基础的处理单元被定义为“变换单元”。频率变换可以是离散余弦变换(DCT)或Karhunen-Loeve变换(KLT)。编码深度确定单元120可使用基于拉格朗日乘数的RD优化来确定包括在最大编码单元中的次级编码单元。换句话说,编码深度确定单元120可确定从最大编码单元划分的多个次级编码单元的形状,其中,所述多个次级编码单元根据它们的深度具有不同的大小。图像数据编码器130通过基于由编码深度确定单元120确定的划分形状(即,划分最大编码单元的形状)对最大编码单元进行编码来输出比特流。编码信息编码器140对与由编码深度确定单元120确定的最大编码单元的编码模式有关的信息进行编码。换句话说,编码信息编码器140通过对关于最大编码单元的划分形状的信息、关于最大深度的信息以及关于每个深度的次级编码单元的编码模式的信息进行编码来输出比特流。关于次级编码单元的编码模式的信息可包括:关于次级编码单元的预测单元的信息、关于每个预测单元的预测模式的信息以及关于次级编码单元的变换单元的信息。由于每个最大编码单元存在具有不同大小的次级编码单元,并且必须为每个次级编码单元确定关于编码模式的信息,因此可为一个最大编码单元确定关于至少一个编码模式的信息。设备100可根据深度的增加通过将最大编码单元的高和宽两者等分为二来生成次级编码单元。也就是说,当第k深度的编码单元的大小是2N×2N时,第(k+1)深度的编码单元的大小是N×N。因此,根据示例性实施例的设备100可考虑到图像特征,基于最大编码单元的大小和最大深度确定每个最大编码单元的最佳划分形状。通过考虑到图像特征不同地调整最大编码单元的大小,并通过将最大编码单元划分为不同深度的次级编码单元来对图像编码,可更有效地对具有不同分辨率的图像进行编码。图2是根据示例性实施例的用于解码的设备200的框图。参照图2,设备200包括图像数据获得单元210、编码信息提取单元220以及图像数据解码器230。图像数据获得单元210通过解析由设备200接收的比特流来获得根据最大编码单元的图像数据,并将图像数据输出到图像数据解码器230。图像数据获得单元210可从当前图片或片段的头提取关于当前图片或片段的最大编码单元的信息。换句话说,图像数据获得单元210按照最大编码单元划分比特流,从而图像数据解码器230可根据最大编码单元对图像数据进行解码。编码信息提取单元220通过解析由设备200接收的比特流来从当前图片的头提取关于最大编码单元、最大深度、最大编码单元的划分形状以及次级编码单元的编码模式的信息。关于划分形状的信息和关于编码模式的信息被提供到图像数据解码器230。关于最大编码单元的划分形状的信息可包括关于根据包括在最大编码单元中的深度具有不同大小的次级编码单元的信息,关于编码模式的信息可包括关于根据次级编码单元的预测单元的信息、关于预测模式的信息以及关于变换单元的信息。图像数据解码器230通过基于由编码信息提取单元220提取的信息对每个最大编码单元的图像数据进行解码来恢复当前图片。...
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1