运动图像解码装置以及运动图像编码装置的制作方法

文档序号:24347331发布日期:2021-03-19 12:31阅读:142来源:国知局
运动图像解码装置以及运动图像编码装置的制作方法

本发明的实施方式涉及一种运动图像解码装置以及运动图像编码装置。



背景技术:

为了高效地传输或记录运动图像,使用通过对运动图像进行编码而生成编码数据的运动图像编码装置和通过对该编码数据进行解码而生成解码图像的运动图像解码装置。

作为具体的运动图像编码方式,例如可列举出在h.264/avc、hevc(high-efficiencyvideocoding:高效视频编码)中提出的方式等。

在这种运动图像编码方式中,构成运动图像的图像(图片:picture)通过包括切片、编码树单元(ctu:codingtreeunit)、编码单位(有时也称为编码单元(codingunit:cu))以及变换单元(tu:transformunit)的分级结构进行管理,并按每个cu进行编码/解码,上述切片通过对图像进行分割而得到,上述编码树单元通过对切片进行分割而得到,上述编码单位通过对编码树单元进行分割而得到,上述变换单元通过对编码单位进行分割而得到。

此外,在这种运动图像编码方式中,通常基于通过对输入图像进行编码/解码而得到的局部解码图像来生成预测图像,对从输入图像(原图像)中减去该预测图像而得到的预测误差(有时也称为“差分图像”或“残差图像”)进行编码。作为预测图像的生成方法,可列举出画面间预测(帧间预测)和画面内预测(帧内预测)。

此外,作为近年来的运动图像编码以及解码技术可列举非专利文献1。在非专利文献2中,公开有通过从邻接图像导出的参照图像与权重矩阵的积和运算导出预测图像的矩阵帧内预测技术(matrix-basedintraprediction,mip)。

现有技术文献

非专利文献

非专利文献1:“versatilevideocoding(draft6)”,jvet-o2001-ve,jointvideoexplorationteam(jvet)ofitu-tsg16wp3andiso/iecjtc1/sc29/wg11

非专利文献2:“ce3:affinelinearweightedintraprediction(ce3-4.1,ce3-4.2)”,jvet-n0217-v1,jointvideoexplorationteam(jvet)ofitu-tsg16wp3andiso/iecjtc1/sc29/wg11



技术实现要素:

发明要解决的问题

在非专利文献1、非专利文献2这种矩阵帧内预测中,根据多种块大小和帧内预测模式而保存不同的权重矩阵,因此存在保存权重矩阵的存储器大小较大这一问题。此外,存在用于生成预测图像的处理量巨大这一问题。

本发明的目的在于,在降低权重矩阵的存储器大小的同时进行优选的帧内预测以及削减处理量。

技术方案

为了解决上述问题,本发明的一个方案的运动图像解码装置的特征在于,具备:矩阵参照像素导出部,导出对邻接于对象块的上侧和左侧的图像进行下采样而得到的图像作为参照图像;权重矩阵导出部,根据帧内预测模式和对象块大小导出权重系数的矩阵;矩阵预测图像导出部,由上述参照图像的元素与上述权重系数的矩阵的元素之积导出预测图像;以及矩阵预测图像插值部,导出上述预测图像或对上述预测图像进行插值而得到的图像作为预测图像,上述权重矩阵导出部导出对象块大小的宽度以下且高度以下大小的矩阵。

上述运动图像解码装置的特征在于,上述权重矩阵导出部在对象块的一边为4的情况下导出4×4大小的矩阵。

上述运动图像解码装置的特征在于,上述权重矩阵导出部在对象块大小为4×16和16×4的情况下导出4×4大小的矩阵。

上述运动图像解码装置的特征在于,上述权重矩阵导出部导出大小为4×4的sizeid=0、1的矩阵和大小为8×8的sizeid=2的矩阵中的任一方,在对象块的一边为4的情况下导出sizeid=1或2的矩阵。

此外,上述权重矩阵导出部也可以在对象块大小的宽度与高度之积为64以下的情况下导出4×4大小的矩阵。

上述运动图像解码装置的特征在于,上述矩阵预测图像导出部导出宽度与高度相等的正方形的中间预测图像predmip[][]。

一种运动图像编码装置,其特征在于,具备:矩阵参照像素导出部,导出对邻接于对象块的上侧和左侧的图像进行下采样而得到的图像作为参照图像;权重矩阵导出部,根据帧内预测模式和对象块大小导出权重系数的矩阵;矩阵预测图像导出部,由上述参照图像的元素与上述权重系数的矩阵的元素之积导出预测图像;以及矩阵预测图像插值部,导出上述预测图像或对上述预测图像进行插值而得到的图像作为预测图像,上述权重矩阵导出部导出对象块大小的宽度以下且高度以下大小的矩阵。

上述运动图像编码装置的特征在于,上述权重矩阵导出部在对象块的一边为4的情况下导出4×4大小的矩阵。

上述运动图像编码装置的特征在于,上述权重矩阵导出部在对象块大小为4×16和16×4的情况下导出4×4大小的矩阵。

上述运动图像编码装置的特征在于,上述权重矩阵导出部导出大小为4×4的sizeid=0、1的矩阵和大小为8×8的sizeid=2的矩阵中的任一方,在对象块的一边为4的情况下导出sizeid=1或2的矩阵。

此外,上述权重矩阵导出部也可以在对象块大小的宽度与高度之积为64以下的情况下导出4×4大小的矩阵。

上述运动图像编码装置的特征在于,上述矩阵预测图像导出部导出宽度与高度相等的正方形的中间预测图像predmip[][]。

有益效果

根据本发明的一个方案,能在降低权重矩阵的存储器大小或削减处理量的同时进行优选的帧内预测。

附图说明

图1是表示本实施方式的图像传输系统的构成的概略图。

图2是表示搭载有本实施方式的运动图像编码装置的发送装置和搭载有运动图像解码装置的接收装置的构成的图。prod_a表示搭载有运动图像编码装置的发送装置,prod_b表示搭载有运动图像解码装置的接收装置。

图3是表示搭载有本实施方式的运动图像编码装置的记录装置和搭载有运动图像解码装置的再现装置的构成的图。prod_c表示搭载有运动图像编码装置的记录装置,prod_d表示搭载有运动图像解码装置的再现装置。

图4是表示编码流的数据的分级结构的图。

图5是表示ctu的分割例的图。

图6是表示帧内预测模式的种类(模式编号)的概略图。

图7是表示运动图像解码装置的构成的概略图。

图8是表示帧内预测参数解码部的构成的概略图。

图9是表示帧内预测中使用的参照区域的图。

图10是表示帧内预测图像生成部的构成的图。

图11是表示mip处理的一个示例的图。

图12是表示mip处理的一个示例的图。

图13是表示运动图像编码装置的构成的框图。

图14是表示帧内预测参数编码部的构成的概略图。

图15是表示mip部的详情的图。

图16是表示本实施方式的mip处理的图。

图17是表示通过mip导出包括非正方形的predmip的情况下的预测图像生成的参数的图。

图18是表示本发明的一实施方式(mip实施例1)的sizeid的导出方法的图。

图19是表示通过mip导出正方形的predmip的情况下的预测图像生成的参数的图。

图20是表示本发明的一实施方式(mip实施例2)的sizeid的导出方法的图。

图21是表示本发明的一实施方式(mip实施例3)的sizeid的导出方法的图。

图22是表示本发明的一实施方式(mip实施例4)的sizeid的导出方法的图。

具体实施方式

(第一实施方式)

以下,参照附图对本发明的实施方式进行说明。

图1是表示本实施方式的图像传输系统1的构成的概略图。

图像传输系统1是传输对编码对象图像进行编码而成的编码流并对所传输的编码流进行解码而显示图像的系统。图像传输系统1构成为包括:运动图像编码装置(图像编码装置)11、网络21、运动图像解码装置(图像解码装置)31以及运动图像显示装置(图像显示装置)41。

向运动图像编码装置11输入图像t。

网络21将运动图像编码装置11所生成的编码流te传输至运动图像解码装置31。网络21为互联网(internet)、广域网(wan:wideareanetwork)、局域网(lan:localareanetwork)或这些的组合。网络21未必限定于双向通信网,也可以是传输地面数字广播、卫星广播等广播波的单向通信网。此外,网络21也可以由dvd(digitalversatiledisc(数字通用光盘):注册商标)、bd(blue-raydisc(蓝光光盘):注册商标)等记录有编码流te的存储介质代替。

运动图像解码装置31对网络21所传输的各编码流te进行解码,生成解码后的一个或多个解码图像td。

运动图像显示装置41显示运动图像解码装置31所生成的一个或多个解码图像td中的全部或一部分。运动图像显示装置41例如具备液晶显示器、有机el(electro-luminescence:电致发光)显示器等显示设备。作为显示器的方案,可列举出固定型、移动型、hmd(helmetmounteddisplay:头盔显示器)等。此外,在运动图像解码装置31具有高处理能力的情况下显示画质高的图像,在仅具有较低的处理能力的情况下显示无需高处理能力、显示能力的图像。

<运算符>

以下记述在本说明书中使用的运算符。

>>为右位移,<<为左位移,&为逐位and,|为逐位or,|=为or代入运算符,||表示逻辑或。

x?y:z是在x为真(0以外)的情况下取y、在x为假(0)的情况下取z的3项运算符。

clip3(a,b,c)是将c限幅于a以上b以下的值的函数,是在c<a的情况下返回a、在c>b的情况下返回b、在其他情况下返回c的函数(其中,a<=b)。

clip1y(c)是在clip3(a,b,c)中设定为a=0、b=(1<<bitdepthy)-1的运算符。bitdepthy是亮度的位深度。

abs(a)是返回a的绝对值的函数。

int(a)是返回a的整数值的函数。

floor(a)是返回a以下的最大整数的函数。

ceil(a)是返回a以上的最小整数的函数。

a/d表示a除以d(舍去小数点以下)。

min(a,b)表示返回a与b中较小的值的函数。

<编码流te的结构>

在详细说明本实施方式的运动图像编码装置11和运动图像解码装置31之前,对由运动图像编码装置11生成并由运动图像解码装置31解码的编码流te的数据结构进行说明。

图4是表示编码流te中的数据的分级结构的图。编码流te示例性地包括序列和构成序列的多张图片。图4中表示分别表示规定序列seq的编码视频序列、规定图片pict的编码图片、规定切片s的编码切片、规定切片数据的编码切片数据、编码切片数据中所包括的编码树单元以及编码树单元中所包括的编码单元的图。

(编码视频序列)

在编码视频序列中,规定有运动图像解码装置31所参照的数据的集合以用于对处理对象的序列seq进行解码。如图4的编码视频序列所示,序列seq包括:视频参数集(videoparameterset)、序列参数集sps(sequenceparameterset)、图片参数集pps(pictureparameterset)、图片pict以及补充增强信息sei(supplementalenhancementinformation)。

视频参数集vps在由多层构成的运动图像中,规定有对多个运动图像通用的编码参数的集合和运动图像中所包括的多层和与各层关联的编码参数的集合。

在序列参数集sps中,规定有运动图像解码装置31所参照的编码参数的集合以用于将对象序列解码。例如,规定了图片的宽度、高度。需要说明的是,sps可以存在多个。在该情况下,从pps中选择多个sps中的任一个。

在图片参数集pps中,规定有运动图像解码装置31所参照的编码参数的集合以用于将对象序列内的各图像解码。例如包括图片的解码中所使用的量化宽度的基准值(pic_init_qp_minus26)和指示加权预测的应用的标志(weighted_pred_flag)。需要说明的是,pps可以存在多个。在该情况下,从对象序列内的各图片中选择多个pps中的任一个。

(编码图片)

在编码图片中,规定有运动图像解码装置31所参照的数据的集合以用于对处理对象的图片pict进行解码。如图4的编码图片所示,图片pict包括切片0~切片ns-1(ns为图片pict中所包括的切片的总数)。

需要说明的是,以下,在无需区别各切片0~切片ns-1的的情况下,有时会省略编码下标来记述。此外,对于以下说明的编码流te中所包括的且附有下标的其他数据也是同样的。

(编码切片)

在编码切片中,规定有运动图像解码装置31所参照的数据的集合以用于对处理对象的切片s进行解码。切片如图4的编码切片所示,包括切片报头和切片数据。

切片报头中包括运动图像解码装置31所参照的编码参数组以用于确定对象切片的解码方法。指定切片类型的切片类型指定信息(slice_type)是切片报头中所包括的编码参数的一个示例。

作为能够由切片类型指定信息指定的切片类型,可列举出:(1)在编码时仅使用帧内预测的i切片、(2)在编码时使用单向预测或帧内预测的p切片以及(3)在编码时使用单向预测、双向预测或帧内预测的b切片等。需要说明的是,帧间预测并不限定于单向预测、双向预测,也可以使用更多参照图片生成预测图像。以下,在称为p、b切片的情况下,是指包括能使用帧间预测的块的切片。

需要说明的是,切片报头也可以包括对图片参数集pps的参照(pic_parameter_set_id)。

(切片编码数据)

在编码切片数据中,规定有运动图像解码装置31所参照的数据的集合以用于对处理对象的切片数据进行解码。如图4的编码切片报头所示,切片数据包括ctu。ctu为构成切片的固定大小(例如64×64)的块,有时也称为最大编码单位(lcu:largestcodingunit)。

(编码树单元)

在图4的编码树单元中,规定有运动图像解码装置31所参照的数据的集合以用于对处理对象的ctu进行解码。ctu通过递归的四叉树分割(qt(quadtree)分割)、二叉树分割(bt(binarytree)分割)或三叉树分割(tt(ternarytree)分割),分割为编码处理的基本单位即编码单元cu。将bt分割与tt分割并称为多叉树分割(mt(multitree)分割)。将通过递归的四叉树分割得到的树形结构的节点称为编码节点(codingnode)。四叉树、二叉树以及三叉树的中间节点为编码节点,ctu自身也被规定为最高位的编码节点。

ct包括表示是否进行qt分割的qt分割标志(cu_split_flag)、表示mt分割的有无的mt分割标志(split_mt_flag)、表示mt分割的分割方向的mt分割方向(split_mt_dir)以及表示mt分割的分割类型的mt分割类型(split_mt_type)作为ct信息。cu_split_flag、split_mt_flag、split_mt_dir、split_mt_type按每个编码节点进行传输。

在cu_split_flag为1的情况下,编码节点被分割为四个编码节点(图5的qt)。

当cu_split_flag为0时,在split_mt_flag为0的情况下,编码节点具有一个cu作为节点而不被分割(图5的未分割)。cu为编码节点的末端节点,不进行进一步分割。cu为编码处理的基本单位。

在split_mt_flag为1的情况下,编码节点以如下方式进行mt分割。当split_mt_type为0时,在split_mt_dir为1的情况下,编码节点被水平分割为两个编码节点(图5的bt(水平分割)),在split_mt_dir为0的情况下,编码节点被垂直分割为两个编码节点(图5的bt(垂直分割))。此外,当split_mt_type为1时,在split_mt_dir为1的情况下,编码节点被水平分割为三个编码节点(图5的tt(水平分割)),在split_mt_dir为0的情况下,编码节点被垂直分割为三个编码节点(图5的tt(垂直分割))。将该内容在图5的ct信息中示出。

此外,在ctu的大小为64×64像素的情况下,cu的大小可以取64×64像素、64×32像素、32×64像素、32×32像素、64×16像素、16×64像素、32×16像素、16×32像素、16×16像素、64×8像素、8×64像素、32×8像素、8×32像素、16×8像素、8×16像素、8×8像素、64×4像素、4×64像素、32×4像素、4×32像素、16×4像素、4×16像素、8×4像素、4×8像素以及4×4像素中的任一方。

(编码单元)

如图4的编码单元所示,规定有运动图像解码装置31所参照的数据的集合以用于对处理对象的编码单元进行解码。具体而言,cu由cu报头cuh、预测参数、变换参数、量化变换系数等构成。在cu报头中规定有预测模式等。

预测处理存在以cu为单位进行的情况和以进一步分割cu而成的子cu为单位进行的情况。在cu与子cu的大小相等的情况下,cu中的子cu为一个。在cu的大小大于子cu的大小的情况下,cu被分割为子cu。例如在cu为8×8,子cu为4×4的情况下,cu被分割为四个子块,包括水平分割的两部分和垂直分割的两部分。

预测种类(预测模式)有帧内预测和帧间预测两种。帧内预测为同一图片内的预测,帧间预测是指在互不相同的图片间(例如显示时刻间、层图像间)进行的预测处理。

变换/量化处理以cu为单位进行,但量化变换系数也可以以4×4等子块为单位进行熵编码。

(预测参数)

预测图像由附带于块的预测参数导出。预测参数中有帧内预测和帧间预测的预测参数。

以下,对帧内预测的预测参数进行说明。帧内预测参数由亮度预测模式intrapredmodey、色差预测模式intrapredmodec构成。图6是表示帧内预测模式的种类(模式编号)的概略图。如图6所示,帧内预测模式例如存在67种(0~66)。例如为平面预测(0)、dc预测(1)、angular预测(2~66)。进而,可以在色差中追加lm模式(67~72)。

用于导出帧内预测参数的语法元素中,例如有intra_luma_mpm_flag、intra_luma_mpm_idx、intra_luma_mpm_remainder等。

(mpm)

intra_luma_mpm_flag是表示对象块intrapredmodey与mpm(mostprobablemode)是否一致的标志。mpm是mpm候选列表mpmcandlist[]中所包括的预测模式。mpm候选列表是储存有根据邻接块的帧内预测模式和规定的帧内预测模式而推测为应用于对象块的概率高的候选的列表。在intra_luma_mpm_flag为1的情况下,使用mpm候选列表和索引intra_luma_mpm_idx导出对象块的intrapredmodey。

intrapredmodey=mpmcandlist[intra_luma_mpm_idx]

(rem)

在intra_luma_mpm_flag为0的情况下,从由所有帧内预测模式中除去mpm候选列表中所包括的帧内预测模式后剩余的模式remintrapredmode选择帧内预测模式。能够选择为remintrapredmode的帧内预测模式称为“非mpm”或“rem”。使用intra_luma_mpm_remainder导出remintrapredmode。

(运动图像编码装置的构成)

对本实施方式的运动图像解码装置31(图7)的构成进行说明。

运动图像解码装置31构成为包括:熵解码部301、参数解码部(预测图像解码装置)302、环路滤波器305、参照图片存储器306、预测参数存储器307、预测图像生成部(预测图像生成装置)308、逆量化/逆变换部311以及加法部312。需要说明的是,也存在根据后文所述的运动图像编码装置11,在运动图像解码装置31中不包括环路滤波器305的构成。

此外,参数解码部302构成为包括未图示的帧间预测参数解码部303和帧内预测参数解码部304。预测图像生成部308构成为包括帧间预测图像生成部309和帧内预测图像生成部310。

此外,以下记述使用ctu、cu作为处理单位的示例,但并不限定于该示例,也可以子cu为单位进行处理。或者,也可以将ctu、cu替换为块,将子cu替换为子块,进行以块或子块为单位的处理。

熵解码部301对从外部输入的编码流te进行熵解码,将各个编码(语法元素)分离来进行解码。熵编码中存在如下方式:使用根据语法元素种类或周围状况而自适应地选出的上下文(概率模型)来对语法元素进行可变长度编码的方式;以及使用预先规定的表或计算式对语法元素进行可变长度编码的方式。在前者的cabac(contextadaptivebinaryarithmeticcoding:上下文自适应二进制算术编码)中,将按编码或解码后的每个图片(切片)来更新的概率模型储存于存储器。然后,从存储器中储存的概率模型之中,设定使用相同切片类型、相同切片等级的量化参数的图片的概率模型作为p图片或b图片的上下文的初始状态。将该初始状态用于编码、解码处理。分离后的编码中存在用于生成预测图像的预测信息和用于生成差分图像的预测误差等。

熵解码部301将分离后的编码输出至参数解码部302。基于参数解码部302的指示来控制对哪一编码进行解码。

(帧内预测参数编码部304的构成)

帧内预测参数解码部304基于从熵解码部301输入的编码,参照存储于预测参数存储器307的预测参数对帧内预测参数例如帧内预测模式intrapredmode进行解码。帧内预测参数解码部304将解码后的帧内预测参数输出至预测图像生成部308,并存储于预测参数存储器307。帧内预测参数解码部304也可以导出亮度和色差不同的帧内预测模式。

图8是表示参数解码部302的帧内预测参数解码部304的构成的概略图。如图8所示,帧内预测参数解码部304构成为包括:参数解码控制部3041、亮度帧内预测参数解码部3042以及色差帧内预测参数解码部3043。

参数解码控制部3041指示熵解码部301进行语法元素的解码,并从熵解码部301接受语法元素。在其中的intra_luma_mpm_flag为1的情况下,参数解码控制部3041向亮度帧内预测参数解码部3042内的mpm参数解码部30422输出intra_luma_mpm_idx。此外,在intra_luma_mpm_flag为0的情况下,参数解码控制部3041向亮度帧内预测参数解码部3042的非mpm参数解码部30423输出intra_luma_mpm_remainder。此外,参数解码控制部3041向色差帧内预测参数解码部3043输出色差帧内预测参数的语法元素。

亮度帧内预测参数解码部3042构成为包括:mpm候选列表导出部30421、mpm参数解码部30422以及非mpm参数解码部30423(解码部、导出部)。

mpm参数解码部30422参照由mpm候选列表导出部30421导出的mpmcandlist[]和intra_luma_mpm_idx,导出intrapredmodey,并输出至帧内预测图像生成部310。

非mpm参数解码部30423由mpmcandlist[]和intra_luma_mpm_remainder导出remintrapredmode,并将intrapredmodey输出至帧内预测图像生成部310。

色差帧内预测参数解码部3043由色差帧内预测参数的语法元素导出intrapredmodec,并输出至帧内预测图像生成部310。

环路滤波器305为设于编码环路内且去除块失真、振铃失真来改善画质的滤波器。环路滤波器305对加法部312所生成的cu的解码图像实施去块滤波、采样自适应偏移(sao)、自适应环路滤波(alf)等滤波。

参照图片存储器306将加法部312所生成的cu的解码图像存储于按每张对象图片和每个对象cu预先规定的位置。

预测参数存储器307将预测参数存储于按解码对象的每个ctu或每个cu预先规定的位置。具体而言,预测参数存储器307存储参数解码部302解码后的参数和熵解码部301分离出的预测模式predmode等。

向预测图像生成部308输入预测模式predmode、预测参数等。此外,预测图像生成部308从参照图片存储器306读出参照图片。预测图像生成部308以预测模式predmode所指示的预测模式,使用预测参数和所读出的参照图片(参照图片块)来生成块或子块的预测图像。在此,参照图片块是指参照图片上的像素的集合(由于通常为矩形,因此称为块),是为了生成预测图像而参照的区域。

(帧内预测图像生成部310)

在预测模式predmode指示帧内预测模式的情况下,帧内预测图像生成部310使用从帧内预测参数解码部304输入的帧内预测参数和从参照图片存储器306读出的参照像素进行帧内预测。

具体而言,帧内预测图像生成部310从参照图片存储器306读出对象图片上的位于距离对象块预先规定的范围的邻接块。预先规定的范围是指对象块的左、左上、上、右上的邻接块,参照的区域根据帧内预测模式而不同。

帧内预测图像生成部310参照所读出的解码像素值和intrapredmode所指示的预测模式,生成对象块的预测图像。帧内预测图像生成部310将所生成的块预测图像输出至加法部312。

以下,对基于帧内预测模式的预测图像的生成进行说明。在planar预测、dc预测、angular预测中,将与预测对象块邻接(接近)的解码完成的周边区域设定为参照区域r。然后,通过在特定方向外插参照区域r上的像素来生成预测图像。例如,参照区域r也可以设定为包括预测对象块的左和上(或进一步包括左上、右上、左下)的l字型区域(例如图9的参照区域的示例1的斜线圆形标记的像素所示的区域)。

(预测图像生成部的详情)

接着,使用图10对帧内预测图像生成部310的构成的详情进行说明。帧内预测图像生成部310具备:参照采样滤波器部3103(第二参照图像设定部)、预测部3104以及预测图像校正部3105(预测图像校正部、滤波器切换部、权重系数变更部)。

预测部3104基于参照区域r上的各参照像素(参照图像)、应用参照像素滤波器(第一滤波器)而生成的滤波完成参照图像、帧内预测模式,生成预测对象块的临时预测图像(校正前预测图像),并输出至预测图像校正部3105。预测图像校正部3105根据帧内预测模式对临时预测图像进行校正,生成预测图像(校正完成预测图像)并输出。

以下,对帧内预测图像生成部310所具备的各部进行说明。

(参照采样滤波器部3103)

参照采样滤波器部3103参照参照图像来导出参照区域r上的各位置(x,y)的参照采样s[x][y]。此外,参照采样滤波器部3103根据帧内预测模式对参照采样s[x][y]应用参照像素滤波器(第一滤波器),对参照区域r上的各位置(x,y)的参照采样s[x][y]进行更新(导出滤波完成参照图像s[x][y])。具体而言,对位置(x,y)与其周边的参照图像应用低通滤波器,导出滤波完成参照图像(图9的参照区域的示例2)。需要说明的是,并非必须对所有帧内预测模式应用低通滤波器,也可以对一部分帧内预测模式应用低通滤波器。需要说明的是,将在参照采样滤波器部3103中应用于参照区域r上的参照图像的滤波器称为“参照像素滤波器(第一滤波器)”,与之相对,将后文所述的在预测图像校正部3105中对临时预测图像进行校正的滤波器称为“位置依赖滤波器(第二滤波器)”。

(帧内预测部3104的构成)

帧内预测部3104基于帧内预测模式、参照图像、滤波完成参照像素值生成预测对象块的临时预测图像(临时预测像素值、校正前预测图像),并输出至预测图像校正部3105。预测部3104在内部具备:planar预测部31041、dc预测部31042、angular预测部31043、lm预测部31044以及mip部31045。预测部3104根据帧内预测模式来选择特定预测部,并输入参照图像、滤波完成参照图像。帧内预测模式与对应的预测部的关系如下所述。

·planar预测···planar预测部31041

·dc预测···dc预测部31042

·angular预测···angular预测部31043

·lm预测···lm预测部31044

·矩阵帧内预测···mip部31045

(planar预测)

planar预测部31041根据预测对象像素位置与参照像素位置的距离,对参照采样s[x][y]进行线性相加来生成临时预测图像,并输出至预测图像校正部3105。

(dc预测)

dc预测部31042导出相当于参照采样s[x][y]的平均值的dc预测值,并输出将dc预测值作为像素值的临时预测图像q[x][y]。

(angular预测)

angular预测部31043使用帧内预测模式所指示的预测方向(参照方向)的参照采样s[x][y]生成临时预测图像q[x][y],并输出至预测图像校正部3105。

(lm预测)

lm预测部31044基于亮度像素值来预测色差像素值。具体而言,是基于解码后的亮度图像,使用线性模型生成色差图像(cb,cr)的预测图像的方式。作为lm预测之一,存在cclm(cross-componentlinearmodelprediction:跨组件线性模型预测)预测。cclm预测是对一个块使用用于根据亮度预测色差的线性模型的预测方式。

(mip实施例1)

以下,使用图11~图22对通过mip部31045执行的mip处理(matrix-basedintraprediction:矩阵帧内预测处理)的一个示例进行说明。mip是通过从邻接图像导出的参照图像与权重矩阵的积和运算导出预测图像的技术。图中,对象块的宽度为ntbw、高度为ntbh。

(1)边界参照像素导出

mip部利用下式导出与对象块大小有关的变量sizeid(图18)。

sizeid=(ntbw<=4&&ntbh<=4)?0:(ntbw<=8&&ntbh<=8)?1:2(mip-1)

如图18所示,在对象块大小(ntbwxntbh)为4×4、8×8、16×16的情况下,sizeid分别为0、1、2。在为4×16、16×4的情况下,sizeid=2。

接着,mip部31045使用sizeid,导出使用mip模式的个数nummodes、下采样后的参照区域redt[]、redl[]的大小boundarysize、中间预测图像predmip[][]的宽度和高度predw、predh、权重矩阵mweight[predc*predc][insize]在预测过程中所得到的预测图像的一边的大小predc。

nummodes=(sizeid==0)?35:(sizeid==1)?19:11(mip-2)

boundarysize=(sizeid==0)?2:4

predw=(sizeid<=1)?4:min(ntbw,8)

predh=(sizeid<=1)?4:min(ntbh,8)

predc=(sizeid<=1)?4:8

在图17中示出sizeid与这些变量的值的关系。

权重矩阵为正方形(predc*predc),在sizeid=0、sizeid=1的情况下为4×4,在sizeid=2的情况下为8×8。在权重矩阵的大小与中间预测图像的输出大小predw*predh不同的情况下(特别是predc>predwpredc>predh),如后文所述间隔剔除权重矩阵来参照。例如,在本实施方式中,在输出大小为4×16、16×4的情况下,选择sizeid=2所指示的大小(predc)为8的权重矩阵,因此分别产生predw=4(<predc=8)、predh=4(<predc=8)的情况。由于中间预测图像的大小(predw*predh)需要为对象块大小ntbw*ntbh以下,因此,在对象块大小较小的情况下,当选择更大的权重矩阵(predc*predc)时,需要使权重矩阵符合中间预测图像大小的处理。

此外,mip部31045使用intrapredmode导出转换处理用标志istransposed。intrapredmode例如是图6所示的帧内预测模式0~66。

istransposed=(intrapredmode>(nummodes/2))?1:0

此外,导出利用权重矩阵mweight[predc*predc][insize]进行的预测中使用的参照像素数insize、转换后的中间预测图像predmip[][]的宽度和高度mipw、miph。

insize=2*boundarysize-((sizeid==2)?1:0)

mipw=istransposed?predh:predw

miph=istransposed?predw:predh

mip部31045的矩阵参照像素导出部,将与对象块上方邻接的块的像素值predsamples[x][-1](x=0..ntbw-1)设置于第一参照区域reft[x](x=0..ntbw-1)。此外,将与对象块左方邻接的块的像素值predsamples[-1][y](y=0..ntbh-1)设置于第一参照区域refl[y](y=0..ntbh-1)。接着,mip部31045对第一参照区域reft[x]、refl[y]进行下采样导出第二参照区域redt[x](x=0..boundarysize-1)、redl[y](y=0..boundarysize-1)。在下采样中对reft[]、refl[]进行同样的处理,因此以下称为refs[i](i=0..ntbx-1)、reds[i](i=0..boundarysize-1)。

矩阵参照像素导出部对reft[]或代入refl[]的refs[]实施以下处理,导出reds[]。在将reft代入refs的情况下,ntbs=ntbw,在将refl代入refs的情况下,ntbs=ntbh。

在此,σ为i=0~i=bdwn-1的总和。

接着,矩阵参照像素导出部将第二参照区域redl[]、redt[]结合并导出p[i](i=0..2*boundarysize-1)。

bitdepthy为亮度的位深度,例如可以是10bit。

需要说明的是,在无法参照上述参照像素的情况下,与现有的帧内预测同样地使用能够利用的参照像素值。在无法参照所有参照像素的情况下,使用1<<(bitdepthy-1)作为像素值。istransposed表示预测方向是否接近垂直预测,因此当根据istransposed切换在p[]的前半部分储存redl还是储存redt时,能将mweight[][]的图案减半。

(2)预测像素导出(矩阵运算)

mip部31045在图11的step2预测像素导出(矩阵运算)中,通过针对p[]的矩阵运算导出predw*predh大小的中间预测图像predmip[][]。

mip部31045的权重矩阵导出部参照sizeid和modeid从矩阵集中选择权重矩阵mweight[predc*predc][insize]。

首先,权重矩阵导出部使用intrapredmode导出modeid。modeid为在mip中使用的帧内预测模式。

modeid=intrapredmode-((istransposed==1)?(nummodes/2):0)

权重矩阵导出部在sizeid=0的情况下,从储存权重矩阵的数组weights0[18][16][4]中参照modeid选择mweight[16][4]。在sizeid=1的情况下,从储存权重矩阵的数组weights1[10][16][8]中参照modeid选择mweight[16][8]。在sizeid=2的情况下,从储存权重矩阵的数组weights2[6][64][7]中参照modeid选择mweight[64][7]。这些由下式表示。

接着,权重矩阵导出部参照sizeid和modeid,导出在(mip-7)中使用的移位值sw和偏移系数fo。shifts0[18]、shifts1[10]、shifts2[6]为储存移位值的数组,offsets0[18]、offsets1[10]、offsets2[6]为储存偏移系数的数组。

mip部31045的矩阵预测图像导出部对p[]进行(mip-7)的积和运算,由此导出mipw*miph的大小的predmip[][]。在此按predmip[][]所对应的每个位置来参照权重矩阵mweight[][]的元素,导出中间预测图像。需要说明的是,在本实施例中,在sizeid=2时,有时权重矩阵的大小predc大于predmip的大小mipw或miph。因此,使用变量incw和inch间隔剔除权重矩阵来参照。

σ为i=0~i=insize-1的总和。

在istransposed=1时,向积和运算的输入p[]替换上方参照像素和左方参照像素的位置并储存,在将积和运算的输出predmip[][]输出至(3)之前进行转换。

(3)预测像素导出(线性插值)

在ntbw=predw且ntbh=predh的情况下,mip部31045的矩阵预测图像插值部将predmip[][]复制至predsamples[][]。

for(x=0;x<ntbw;x++)

for(y=0;y<ntbh;y++)

predsamples[x][y]=predmip[x][y]

在除此以外(ntbw>predw或ntbh>predh)的情况下,矩阵预测图像插值部在图11的step3(步骤3)预测像素导出(线性插值)的3-1中,将predmip[][]储存于ntbw*ntbh大小的预测图像predsamples[][]。在predw、predh与ntbw、ntbh不同的情况下,在3-2中对预测像素值进行插值。

(3-1)矩阵预测图像插值部将predmip[][]储存于predsamples[][]。就是说,在图12的插值前图像中,将predmip[][]储存于右上左下方向的阴影像素位置。

(3-2)在ntbh>ntbw的情况下,按水平方向、垂直方向的顺序使用邻接块的像素值对在(3-1)中未储存的像素进行补值,生成预测图像。

实施水平方向的插值,使用predsamples[xhor][yhor]和predsamples[xhor+uphor][yhor](图12中的水平插值后图像的阴影像素)导出“○”所指示的位置的像素值。

在水平方向的插值后,使用predsamples[xver][yver]和predsamples[xver][yver+upver](图12中的垂直插值后图像的阴影像素)导出“○”所指示的位置的像素值。

在ntbh<=ntbw的情况下,按垂直方向、水平方向的顺序使用邻接块的像素值进行插值,生成预测图像。垂直和水平插值处理与ntbh>ntbw的情况下相同。

(mip实施例2)

在本实施例中,对与mip实施例1相比不降低编码效率而又简化处理的示例进行说明。以下,以变更点为中心进行说明,因此未记述的部分为与mip实施例1相同的处理。

图16表示参照对象块的宽度ntbw和高度btbh以下大小的正方形的矩阵mweight,导出相同大小的正方形的中间预测图像predmip的mip部31045的构成。

在本实施例中,在sizeid=2时设定为predw=predh=predc。随之变更sizeid的定义。以下,将predw、predh、predc记载为predsize。

(1)边界参照像素导出

mip部利用下式导出与对象块大小有关的变量sizeid(图20)。

sizeid=(ntbw<=4&&ntbh<=4)?0:((ntbw<=4||ntbh<=4)||(ntbw==8&&ntbh==8))?1:2(mip-21)

例如,在对象块大小为4xn、nx4(n>4)、8x8的情况下,sizeid为1。若为相同分类,则式(mip-21)也可以使用其他表述。例如,如下所示。

sizeid=(ntbw<=4&&ntbh<=4)?0:((ntbw<=8&&ntbh<=8)||ntbw<=4||ntbh<=4)?1:2(mip-21)

作为其他示例,

也可以是sizeid=(ntbw<=4&&ntbh<=4)?0:((ntbw==8&&ntbh==8)||ntbw<=4||ntbh<=4)?1:2(mip-21)。此外,在输入块的最小大小为4×4的情况下,也可以将ntbw<=4和ntbh<=4分别替换为ntbw==4和ntbh==4。

进而,在限制应用mip的块大小的情况下,mip部也可以通过其他导出方法导出sizeid。例如,如图20所示,在仅对输入块大小的纵横比为4倍以下(abs(log2(ntbw)-log2(ntbh))<=2)的块应用mip的情况下,也可以代替(mip-21)如下所述地导出sizeid。

sizeid=(ntbw<=4&&ntbh<=4)?0:(ntbw*ntbh<=64)?1:2(mip-21a)

或者也可以使用对数表述如下所述地导出。

sizeid=(ntbw<=4&&ntbh<=4)?0:(log2(ntbw)+log2(ntbh)<=6)?1:2(mip-21b)

在限制应用mip的块大小的情况下,使用(mip-21a)、(mip-21b)导出sizeid,因此有处理变简单的效果。

如图20所示,在本实施方式中,在4×16、16×4的情况下,选择sizeid=1所指示的大小(predc)为4的矩阵,因此不会发生predw、predh小于矩阵大小predc(=predsize)的情况。本实施方式的mip部31045选择ntbw和btbh以下大小的矩阵(predc=predsize),就是说满足以下式的矩阵。

predsize=predc<=min(ntbw,ntbh)

在本实施方式中,sizeid=0、1的情况下的矩阵大小为4×4,sizeid=2的情况下的矩阵大小为8×8,因此,mip部31045选择“在ntbw和btbh中的一方为4的情况下,sizeid=0或sizeid=1的矩阵”。这样的选择限制在后文所述的图21、图22中也相同。

就是说,mip部31045所具备的权重矩阵导出部导出对象块大小的宽度以下且高度以下大小的矩阵。此外,权重矩阵导出部在对象块的一边为4的情况下导出4×4的大小的矩阵。此外,权重矩阵导出部在对象块的大小为4×16和16×4的情况下导出4×4的大小的矩阵。此外,权重矩阵导出部导出大小为4×4的sizeid=0、1所指示的矩阵和大小为8×8的sizeid=2所指示的矩阵中的任一方,在对象块的一边为4的情况下导出sizeid=1或2的矩阵。

接着,mip部31045使用sizeid导出mip模式的个数nummodes、下采样后的参照区域redt[]、redl[]的大小boundarysize、权重矩阵mweight以及中间预测图像predmip[][]的宽度和高度predsize。

nummodes=(sizeid==0)?35:(sizeid==1)?19:11(mip-22)

boundarysize=(sizeid==0)?2:4

predsize=(sizeid<=1)?4:8

在图19中示出sizeid与这些变量的值的关系。

istransposed、insize的导出与mip实施例1相同。

第一参照区域reft[]、refl[]、第二参照区域redt[]、redl[]、predmip的导出所需的p[]、ptemp[]的导出也与mip实施例1相同。

(2)预测像素导出(矩阵运算)

mip部31045在图11的step2预测像素导出(矩阵运算)中,通过针对p[]的矩阵运算导出predsize*predsize大小的predmip[][]。

mip部31045的权重矩阵导出部参照sizeid和modeid从矩阵的集合中选择权重矩阵mweight[predsize*predsize][insize]。

modeid、mweight[][]的选择方法、移位值sw、偏移系数fo的导出方法与mip实施例1相同。

mip部31045的矩阵预测图像导出部通过对p[]进行(mip-23)的积和运算,导出predsize*predsize大小的predmip[][]。在此,在本实施例的sizeid的分类中,mipw和miph始终为predsize(predc)以上。因此,实施例1的incw和inch始终为1,省略计算过程。

σ为i=0~i=insize-1的总和。

(3)预测像素导出(线性插值)

在ntbw=predsize且ntbh=predsize的情况下,mip部31045的矩阵预测图像插值部将predmip[][]复制至predsamples[][]。

for(x=0;x<ntbw;x++)

for(y=0;y<ntbh;y++)

predsamples[x][y]=predmip[x][y]

在除此以外(ntbw>predsize或ntbh>predsize)的情况下,矩阵预测图像插值部在图11的step3预测像素导出(线性插值)中,将predsize*predsize的predmip[][]放大至ntbw*ntbh大小的预测图像predsamples[][]。在3-1中复制对应位置的像素,在3-2中通过插值导出不对应的位置的像素。

(3-1)矩阵预测图像插值部将predmip[][]储存于predsamples[][]的对应位置。就是说,在图12的插值前图像中,将predmip[][]储存于3-1的predsamples[][]的阴影像素位置。

(3-2)在ntbh>ntbw的情况下,在水平方向、垂直方向使用邻接块的像素值对在(3-1)中未储存的像素进行插值,生成预测图像。以下按水平方向、垂直方向的顺序进行插值,但也可以按垂直方向、水平方向的顺序进行插值。

实施水平方向的插值,使用predsamples[xhor][yhor]和predsamples[xhor+uphor][yhor](图12的水平插值后图像的阴影像素)导出“○”所指示的位置的像素值。

在水平方向的插值后,使用predsamples[xver][yver]和predsamples[xver][yver+upver](图12的垂直插值后图像的阴影像素)导出“○”所指示的位置的像素值。

在ntbh<=ntbw的情况下,按垂直方向、水平方向的顺序使用邻接块的像素值进行插值,生成预测图像。垂直和水平插值处理与ntbh>ntbw的情况下相同。

mip实施例2的mip部31045的特征在于,导出正方形(predw=predh=predsize)的中间预测图像predmip[][]。简化导出处理以使预测图像的地址计算变得容易。

mip实施例2的mip部31045通过选择对象块的宽度ntbw和高度ntbh以下的predsize,使利用sizeid选择的矩阵大小predc(=predsize)与predw、predh相等,因此predmip导出中的矩阵元素的参照变得容易。

在mip实施例2中,限制分类为sizeid=2的预测图像的宽度和高度,由此能与mip实施示例1相比大幅削减运算量。通过模拟确认出几乎不存在由这些变更所致的编码效率的降低。

(mip实施例3)

在本实施例中,对与mip实施例1相比不降低编码效率而又简化处理的其他示例进行说明。以下,以变更点为中心进行说明,未记述的部分为与mip实施例2相同的处理。

本实施例中,在sizeid=2时设定为predw=predh=predc。随之,变更sizeid的定义。以下,将predw、predh、predc记载为predsize。

(1)边界参照像素导出

mip部利用下式导出与对象块大小有关的变量sizeid(图21上方的图)。

sizeid=(ntbw<=4&&ntbh<=4)?0:(ntbw<=4||ntbh<=4)?1:2(mip-28)

或者也可以用其他条件确定sizeid(图21下方的图)。

sizeid=(ntbw<=4&&ntbh<=4)?0:(ntbw<=8||ntbh<=8)?1:2(mip-29)

(2)预测像素导出(矩阵运算)

与mip实施示例2相同。

(3)预测像素导出(线性插值)

与mip实施例2相同。

如上所述,在mip实施例3中,与mip实施例2相比进一步简化sizeid的判定,由此,能与mip实施例2相比进一步削减运算量。

需要说明的是,mip实施例3也与mip实施例2相同,导出正方形(predw=predh=predsize)的中间预测图像predmip[][],选择对象块的宽度ntbw和高度ntbh以下的predsize,限制分类为sizeid=2的预测图像的宽度和高度,因此发挥与mip实施例2相同的效果。

(mip实施例4)

在本实施例中,对与mip实施例1相比削减权重矩阵的储存所需的存储器的其他示例进行说明。以下,以变更点为中心进行说明,未记述的部分为与mip实施例2相同的处理。

在本实施例中,在sizeid=2时设定为predw=predh=predc。随之,变更sizeid的定义。以下,将predw、predh、predc记载为predsize。

(1)边界参照像素导出

mip部利用下式导出与对象块大小有关的变量sizeid。

sizeid=(ntbw<=4||ntbh<=4)?0:1(mip-30)

作为sizeid的值,在上述示例中设为0、1,但若如图22上方的图所示地设为:sizeid=(ntbw<=4||ntbh<=4)?0:2(mip-34)或者若如图22下方的图所示地设为:sizeid=(ntbw<=4||ntbh<=4)?1:2(mip-34),则能将sizeid表示为0、2或1、2的组合。需要说明的是,也可以设为(ntbw<=8||ntbh<=8)来代替条件式(ntbw<=4||ntbh<=4)。

在式mip-30的示例中,sizeid的值为0、1两种。因此,可以将mip实施例2中的sizeid=2的情况下的处理全部省略。例如,从第二参照区域redl[]、redt[]导出p[i](i=0..2*boundarysize-1)仅为下式。

(2)预测像素导出(矩阵运算)

也可以设为与mip实施例2相同,但由于不使用sizeid=2,因此参照sizeid和modeid从矩阵集中选择权重矩阵mweight[predsize*predsize][insize]的处理省略sizeid=2的情况,用下式表示。

同样,参照sizeid和modeid导出移位值sw和偏移系数fo的处理用下式表示。

(3)预测像素导出(线性插值)

与mip实施例2相同。

如上所述,在mip实施例3中,与mip实施例2相比减少sizeid的种类,因此能与mip实施例2相比削减权重矩阵的储存所需的存储器。

需要说明的是,mip实施例3也可以与mip实施例2相同,导出正方形(predw=predh=predsize)的中间预测图像predmip[][],选择对象块大小ntbwxntbh以下的矩阵(predsize),限制分类为sizeid=2的预测图像的宽度和高度,由此发挥与mip实施例2相同的效果。

(预测图像校正部3105的构成)

预测图像校正部3105根据帧内预测模式,对从预测部3104输出的临时预测图像进行校正。具体而言,预测图像校正部3105根据参照区域r和对象预测像素的位置,针对临时预测图像的各像素导出依赖于位置的权重系数。然后,通过对参照采样s[][]和临时预测图像进行加权相加(加权平均),导出对临时预测图像进行了校正的预测图像(校正完成预测图像)pred[][]。需要说明的是,在一部分帧内预测模式中,也可以不利用预测图像校正部3105对临时预测图像进行校正而将预测部3104的输出直接作为预测图像。

逆量化/逆变换部311将从熵解码部301输入的量化变换系数逆量化求出变换系数。该量化变换系数是在编码处理中对预测误差进行dct(discretecosinetransform,离散余弦变换)、dst(discretesinetransform,离散正弦变换)等频率变换并量化而得到的系数。逆量化/逆变换部311对求出的变换系数进行逆dct、逆dst等逆频率变换,计算预测误差。逆量化/逆变换部311将预测误差输出至加法部312。

加法部312将从预测图像生成部308输入的块预测图像和从逆量化/逆变换部311输入的预测误差按每个像素相加,生成块解码图像。加法部312将块解码图像存储于参照图片存储器306,并输出至环路滤波器305。

(运动图像编码装置的构成)

接着,对本实施方式示例的运动图像编码装置11的构成进行说明。图13是表示本实施方式示例的运动图像编码装置11的构成的框图。运动图像编码装置11构成为包括:预测图像生成部101、减法部102、变换/量化部103、逆量化/逆变换部105、加法部106、环路滤波器107、预测参数存储器(预测参数存储部、帧存储器)108、参照图像存储器(参照图像存储部、帧存储器)109、编码参数确定部110、参数编码部111以及熵编码部104。

预测图像生成部101按分割图像t的各图片而得到的每个区域即每个cu生成预测图像。预测图像生成部101与已说明的预测图像生成部308相同地动作,在此省略其说明。

减法部102从图像t的像素值中减去从预测图像生成部101输入的块预测图像的像素值生成预测误差。减法部102将预测误差输出至变换/量化部103。

变换/量化部103对从减法部102输入的预测误差,通过频率变换计算变换系数,并通过量化导出量化变换系数。变换/量化部103将量化变换系数输出至熵编码部104和逆量化/逆变换部105。

逆量化/逆变换部105与运动图像解码装置31的逆量化/逆变换部311(图7)相同,在此省略其说明。计算出的预测误差被输出至加法部106。

从变换/量化部103向熵编码部104输入量化变换系数,并从参数编码部111向熵编码部104输入编码参数。熵编码部104对分割信息、预测参数、量化变换系数等进行熵编码生成编码流te并输出。

参数编码部111具备:未图示的报头编码部1110、ct信息编码部1111、cu编码部1112(预测模式编码部)、帧间预测参数编码部112以及帧内预测参数编码部113。cu编码部1112还具备tu编码部1114。

(帧内预测参数编码部113的构成)

帧内预测参数编码部113根据从编码参数确定部110输入的intrapredmode,导出用于编码的形式(例如intra_luma_mpm_idx、intra_luma_mpm_remmainder等)。帧内预测参数编码部113包括与帧内预测参数解码部304导出帧内预测参数的构成一部分相同的构成。

图14是表示参数编码部111的帧内预测参数编码部113的构成的概略图。帧内预测参数编码部113构成为包括:参数编码控制部1131、亮度帧内预测参数导出部1132以及色差帧内预测参数导出部1133。

从编码参数确定部110向参数编码控制部1131输入intrapredmodey和intrapredmodec。参数编码控制部1131参照mpm候选列表导出部30421的mpmcandlist[]确定intra_luma_mpm_flag。然后,将intra_luma_mpm_flag和intrapredmodey输出至亮度帧内预测参数导出部1132。此外,将intrapredmodec输出至色差帧内预测参数导出部1133。

亮度帧内预测参数导出部1132构成为包括:mpm候选列表导出部30421(候选列表导出部)、mpm参数导出部11322以及非mpm参数导出部11323(编码部、导出部)。

mpm候选列表导出部30421参照预测参数存储器108中储存的邻接块的帧内预测模式导出mpmcandlist[]。mpm参数导出部11322在intra_luma_mpm_flag为1的情况下,由intrapredmodey和mpmcandlist[]导出intra_luma_mpm_idx,并输出至熵编码部104。非mpm参数导出部11323在intra_luma_mpm_flag为0的情况下,由intrapredmodey和mpmcandlist[]导出remintrapredmode,并将intra_luma_mpm_remainder输出至熵编码部104。

色差帧内预测参数导出部1133由intrapredmodey和intrapredmodec导出intra_chroma_pred_mode并输出。

加法部106将从预测图像生成部101输入的块预测图像的像素值和从逆量化/逆变换部105输入的预测误差按每个像素相加,生成解码图像。加法部106将生成的解码图像存储于参照图片存储器109。

环路滤波器107对加法部106所生成的解码图像实施去块滤波、sao、alf。需要说明的是,环路滤波器107未必包括上述三种滤波器,例如也可以是仅有去块滤波器的构成。

预测参数存储器108将编码参数确定部110所生成的预测参数存储于按每个对象图片和按每个cu预先规定的位置。

参照图片存储器109将环路滤波器107所生成的解码图像存储于按每个对象图片和每个cu预先规定的位置。

编码参数确定部110选择编码参数的多个集合中的一个集合。编码参数是指上述qt、bt或tt分割信息、预测参数或与这些关联而生成的作为编码对象的参数。预测图像生成部101使用这些编码参数生成预测图像。

编码参数确定部110针对多个集合分别算出表示信息量的大小和编码误差的rd成本值。编码参数确定部110选择计算出的成本值最小的编码参数集。由此,熵编码部104将所选出的编码参数集作为编码流te输出。编码参数确定部110将所确定的编码参数存储于预测参数存储器108。

需要说明的是,也可以通过计算机实现上述实施方式的运动图像编码装置11、运动图像解码装置31中的一部分,例如熵解码部301、参数解码部302、环路滤波器305、预测图像生成部308、逆量化/逆变换部311、加法部312、预测图像生成部101、减法部102、变换/量化部103、熵编码部104、逆量化/逆变换部105、环路滤波器107、编码参数确定部110以及参数编码部111。在该情况下,可以通过将用于实现上述控制功能的程序记录于计算机可读记录介质,使计算机系统读入记录于该记录介质中的程序并执行来实现。需要说明的是,在此提到的“计算机系统”是指内置于运动图像编码装置11、运动图像解码装置31中的任一方的计算机系统,采用包括os和外围设备等硬件的计算机系统。此外,“计算机可读记录介质”是指软盘、磁光盘、rom、cd-rom等可移动介质、内置于计算机系统的硬盘等存储装置。而且,“计算机可读记录介质”也可以包括:像经由互联网等网络或电话线路等通信线路来发送程序的情况下的通信线那样短时间内、动态地保存程序的记录介质;以及像作为该情况下的服务器、客户端的计算机系统内部的易失性存储器那样在固定时间保存程序的记录介质。此外,上述程序可以是用于实现前述功能的一部分的程序,还可以是能够通过与已记录在计算机系统的程序进行组合来实现前述功能的程序。

此外,也可以将上述实施方式中的运动图像编码装置11、运动图像解码装置31中的一部分或全部作为lsi(largescaleintegration:大规模集成电路)等集成电路而实现。运动图像编码装置11、运动图像解码装置31的各功能块可以单独地处理器化,也可以将一部分或全部集成来处理器化。此外,集成电路化的方法不限于lsi,也可以通过专用电路或通用处理器来实现。此外,在随着半导体技术的进步而出现代替lsi的集成电路化的技术的情况下,也可以使用该技术的集成电路。

以上,参照附图对本发明的一实施方式进行了详细说明,但具体构成并不限定于上述实施方式,能够在不脱离本发明主旨的范围内进行各种设计变更等。

〔应用例〕

上述运动图像编码装置11和运动图像解码装置31可以搭载于进行运动图像的发送、接收、记录、再现的各种装置来利用。需要说明的是,运动图像可以是通过摄像机等拍摄到的自然运动图像,也可以是通过计算机等生成的人工运动图像(包括cg和gui)。

首先,参照图2对能将上述运动图像编码装置11和运动图像解码装置31用于运动图像的发送和接收的情况进行说明。

在图2中示出表示搭载有运动图像编码装置11的发送装置prod_a的构成的块图。如图2所示,发送装置prod_a具备:编码部prod_a1,通过对运动图像进行编码来获得编码数据;调制部prod_a2,通过在编码部prod_a1所获得的编码数据调制载波来获得调制信号;以及发送部prod_a3,发送调制部prod_a2所获得的调制信号。上述运动图像编码装置11被用作该编码部prod_a1。

发送装置prod_a也可以进一步具备作为输入至编码部prod_a1的运动图像的供给源的拍摄运动图像的摄像机prod_a4、记录有运动图像的记录介质prod_a5、用于从外部输入运动图像的输入端子prod_a6以及生成或加工图像的图像处理部a7。图中示例出发送装置prod_a具备全部这些的构成,但也可以省略一部分。

需要说明的是,记录介质prod_a5可以是记录有未编码的运动图像的介质,也可以是记录有以与传输用的编码方式不同的记录用的编码方式进行编码后的运动图像。在后者的情况下,使按照记录用的编码方式对从记录介质prod_a5读出的编码数据进行解码的解码部(未图示)介于记录介质prod_a5与编码部prod_a1之间为好。

此外,在图2中示出表示搭载有运动图像解码装置31的接收装置prod_b的构成的框图。如图2所示,接收装置prod_b具备:接收部prod_b1,接收调制信号;解调部prod_b2,通过对接收部prod_b1接收到的调制信号进行解调来获得编码数据;以及解码部prod_b3,通过对解调部prod_b2所获得的编码数据进行解码来获得运动图像。上述运动图像解码装置31被用作该解码部prod_b3。

接收装置prod_b也可以具备作为解码部prod_b3所输出的运动图像的供给目的地的显示运动图像的显示器prod_b4、用于记录运动图像的记录介质prod_b5以及用于将运动图像输出至外部的输出端子prod_b6。在图2中,例示出接收装置prod_b具备全部这些的构成,但也可以省略一部分。

需要说明的是,记录介质prod_b5可以是用于记录未编码的运动图像的介质,也可以是记录有以与传输用的编码方式不同的记录用的编码方式进行编码后的运动图像。在后者的情况下,使按照记录用的编码方式对从解码部prod_b3获取到的运动图像进行编码的编码部(未图示)介于解码部prod_b3与记录介质prod_b5之间为好。

需要说明的是,传输调制信号的传输介质可以是无线的,也可以是有线的。此外,传输调制信号的传输方案可以是广播(在此是指发送目的地未预先确定的发送方案),也可以是通信(在此是指发送目的地预先确定的发送方案)。即,调制信号的传输可以通过无线广播、有线广播、无线通信以及有线通信中的任一个来实现。

例如,地面数字广播的广播站(广播设备等)/接收站(电视接收器等)是通过无线广播收发调制信号的发送装置prod_a/接收装置prod_b的一个示例。此外,有线电视广播的广播站(广播设备等)/接收站(电视接收器等)是通过有线广播收发调制信号的发送装置prod_a/接收装置prod_b的一个示例。

此外,使用互联网的vod(videoondemand:视频点播)服务、运动图像共享服务等服务器(工作站等)/客户端(电视接收器、个人计算机、智能手机等)是通过通信收发调制信号的发送装置prod_a/接收装置prod_b的一个示例(通常,在lan中使用无线或有线中的任一方作为传输介质,在wan中使用有线作为传输介质)。在此,个人计算机包括台式pc、膝上型pc以及平板型pc。此外,智能手机也包括多功能便携电话终端。

需要说明的是,运动图像共享服务的客户端除了具有对从服务器下载的编码数据进行解码并显示于显示器的功能以外,还具有对通过摄像机拍摄到的运动图像进行编码并上传至服务器的功能。即,运动图像共享服务的客户端作为发送装置prod_a和接收装置prod_b这两者发挥功能。

接着,参照图3对能将上述运动图像编码装置11和运动图像解码装置31用于运动图像的记录和再现的情况进行说明。

在图3中示出表示搭载有上述运动图像编码装置11的记录装置prod_c的构成的块图。如图3所示,记录装置prod_c具备:编码部prod_c1,通过对运动图像进行编码来获得编码数据;以及写入部prod_c2,将编码部prod_c1所获得的编码数据写入记录介质prod_m。上述运动图像编码装置11被用作该编码部prod_c1。

需要说明的是,记录介质prod_m可以是(1)如hdd(harddiskdrive:硬盘驱动器)、ssd(solidstatedrive:固态硬盘)等那样内置于记录装置prod_c的类型的记录介质,也可以是(2)如sd存储卡或usb(universalserialbus:通用串行总线)闪存等那样连接于记录装置prod_c的类型的记录介质者,还可以是(3)如dvd(digitalversatiledisc:注册商标)或bd(blu-raydisc:注册商标)等那样装填至内置于记录装置prod_c的驱动器装置(未图标)的记录介质。

此外,记录装置prod_c也可以进一步具备作为输入至编码部prod_c1的运动图像的供给源的拍摄运动图像的摄像机prod_c3、用于从外部输入运动图像的输入端子prod_c4、用于接收运动图像的接收部prod_c5以及生成或加工图像的图像处理部prod_c6。在图3中,例示出记录装置prod_c具备全部这些的构成,但也可以省略一部分。

需要说明的是,接收部prod_c5可以接收未编码的运动图像,也可以接收以与记录用的编码方式不同的传输用的编码方式编码后的编码数据。在后者的情况下,使对以传输用的编码方式编码后的编码数据进行解码的传输用解码部(未图示)介于接收部prod_c5与编码部prod_c1之间为好。

作为这种记录装置prod_c,例如可列举出:dvd记录器、bd记录器、hdd(harddiskdrive)记录器等(在该情况下,输入端子prod_c4或接收部prod_c5为运动图像的主要供给源)。此外,便携式摄像机(在该情况下,摄像机prod_c3为运动图像的主要供给源)、个人计算机(在该情况下,接收部prod_c5或图像处理部c6为运动图像的主要供给源)、智能手机(在该情况下,摄像机prod_c3或接收部prod_c5为运动图像的主要供给源)等也是这种记录装置prod_c的一个示例。

此外,在图3中示出表示搭载有上述运动图像解码装置31的再现装置prod_d的构成的框图。如图3所示,再现装置prod_d具备:读出部prod_d1,将写入记录介质prod_m的编码数据读出;以及解码部prod_d2,通过对读出部prod_d1所读出的编码数据进行解码来获得运动图像。上述运动图像解码装置31被用作该解码部prod_d2。

需要说明的是,记录介质prod_m可以是(1)如hdd或ssd等这样内置于再现装置prod_d的类型的记录介质,也可以是(2)如sd存储卡或usb闪存等这样连接于再现装置prod_d的类型的记录介质,还可以是(3)如dvd或bd等这样装填至内置于再现装置prod_d的驱动器装置(未图示)的记录介质。

此外,再现装置prod_d也可以进一步具备作为解码部prod_d2所输出的运动图像的供给目的地的显示运动图像的显示器prod_d3、用于将运动图像输出至外部的输出端子prod_d4以及发送运动图像的发送部prod_d5。在图3中,例示出再现装置prod_d具备全部这些的构成,但也可以省略一部分。

需要说明的是,发送部prod_d5可以发送未编码的运动图像,也可以发送以与记录用的编码方式不同的传输用的编码方式编码后的编码数据。在后者的情况下,使以传输用的编码方式对运动图像进行编码的编码部(未图示)介于解码部prod_d2与发送部prod_d5之间为好。

作为这种再现装置prod_d,例如可列举出dvd播放器、bd播放器、hdd播放器等(在该情况下,连接有电视接收器等的输出端子prod_d4为运动图像的主要供给目的地)。此外,电视接收器(在该情况下,显示器prod_d3为运动图像的主要供给目的地)、数字标牌(也称为电子看板、电子公告板等,显示器prod_d3或发送部prod_d5为运动图像的主要供给目的地)、台式pc(在该情况下,输出端子prod_d4或发送部prod_d5为运动图像的主要供给目的地)、膝上型或平板型pc(在该情况下,显示器prod_d3或发送部prod_d5为运动图像的主要供给目的地)、智能手机(在该情况下,显示器prod_d3或发送部prod_d5为运动图像的主要供给目的地)等也是这种再现装置prod_d的一个示例。(以硬件方式实现和以软件方式实现)

此外,上述运动图像解码装置31和运动图像编码装置11的各块可以通过形成于集成电路(ic芯片)上的逻辑电路而以硬件方式实现,也可以利用cpu(centralprocessingunit:中央处理器)以软件方式实现。

在后者的情况下,上述各装置具备:执行实现各功能的程序的命令的cpu、储存有上述程序的rom(readonlymemory:只读存储器)、展开上述程序的ram(randomaccessmemory:随机接入存储器)以及储存上述程序和各种数据的存储器等的存储装置(记录介质)等。而且,本发明的实施方式的目的也可以通过以下方式达成:将以计算机可读取的方式记录有实现上述功能的软件即上述各装置的控制程式的程序代码(执行形式程序、中间代码程序、源程序)的记录介质供给至上述各装置,由该计算机(或cpu、mpu)读出并执行记录于记录介质中的程序代码。

作为上述记录介质,例如可以使用:磁带、盒式磁带等磁带类;包括软盘(注册商标)/硬盘等磁盘、cd-rom(compactdiscread-onlymemory:光盘只读存储器)/mo盘(magneto-opticaldisc:磁光盘)/md(minidisc:迷你磁光盘)/dvd(digitalversatiledisc:注册商标)/cd-r(cdrecordable:光盘刻录片)/蓝光光盘(blu-raydisc:注册商标)等光盘的盘类;ic卡(包括存储卡)/光卡等卡类;掩模rom/eprom(erasableprogrammableread-onlymemory:可擦可编程只读存储器)/eeprom(electricallyerasableandprogrammableread-onlymemory(电可擦可编程只读存储器):注册商标)/闪存rom等半导体存储器类;或者pld(programmablelogicdevice:可编程逻辑器件)、fpga(fieldprogrammablegatearray:现场可编程门阵列)等逻辑电路类等。

此外,也可以将上述各装置构成为能够与通信网连接,并经由通信网供给上述程序代码。该通信网只要能够传输程序代码即可,不特别进行限定。例如可利用:互联网、内部网、外部网、lan(localareanetwork)、isdn(integratedservicesdigitalnetwork:综合业务数字网)、van(value-addednetwork:增值网络)、catv(communityantennatelevision/cabletelevision:共用天线电视/有线电视)通信网、虚拟专用网(virtualprivatenetwork)、电话线路网、移动通信网、卫星通信网等。此外,构成该通信网的传输介质,只要是能够传输程序代码的介质即可,并不限定于特定的构成或种类。例如,可以用于ieee(instituteofelectricalandelectronicengineers:电气和电子工程师协会)1394、usb、电力线输送、电缆tv线路、电话线、adsl(asymmetricdigitalsubscriberline:非对称数字用户线路)线路等有线,也可以用于如irda(infrareddataassociation:红外线数据协会)、遥控器那样的红外线、bluetooth(注册商标)、ieee802.11无线、hdr(highdatarate:高数据速率)、nfc(nearfieldcommunication:近场通讯)、dlna(digitallivingnetworkalliance(数字生活网络联盟):注册商标)、便携电话网、卫星线路、地面数字广播网等无线。需要说明的是,本发明的实施方式也可以利用通过电子传输使上述程序代码具体化的嵌入载波的计算机数据信号的形式实现。

本发明的实施方式并不限定于上述实施方式,能够在权利要求所示的范围进行各种变更。即,将在权利要求所示的范围内经过适当变更的技术方案组合而得到的实施方式也包括在本发明的技术范围内。

工业上的可利用性

本发明的实施方式能优选地应用于对图像数据编码后的编码数据进行解码的运动图像解码装置以及生成图像数据编码后的编码数据的运动图像编码装置。此外,能优选地应用于通过运动图像编码装置生成并被运动图像解码装置参照的编码数据的数据构造。

符号说明

31:图像解码装置

301:熵解码部

302:参数解码部

3020:报头解码部

303:帧间预测参数解码部

304:帧内预测参数解码部

308:预测图像生成部

309:帧间预测图像生成部

310:帧内预测图像生成部

311:逆量化/逆变换部

312:加法部

11:图像编码装置

101:预测图像生成部

102:减法部

103:变换/量化部

104:熵编码部

105:逆量化/逆变换部

107:环路滤波器

110:编码参数确定部

111:参数编码部

112:帧间预测参数编码部

113:帧内预测参数编码部

1110:报头编码部

1111:ct信息编码部

1112:cu编码部(预测模式编码部)

1114:tu编码部

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1