编码装置和解码装置的制作方法

文档序号:31531969发布日期:2022-09-16 20:31阅读:41来源:国知局
编码装置和解码装置的制作方法
编码装置和解码装置
1.本技术是申请日为2018年12月19日、申请号为201880057799.4、发明名称为“编码装置、解码装置、编码方法和解码方法”的发明专利申请的分案。
技术领域
2.本发明涉及编码装置、解码装置、编码方法和解码方法。


背景技术:

3.被称为hevc(high-efficiency video coding:高效视频编码)的视频编码标准规格由jct-vc(joint collaborative team on video coding:视频编码联合协作小组)进行标准化。
4.现有技术文献
5.非专利文献
6.非专利文献1:h.265(iso/iec 23008-2hevc(high efficiency video coding))
7.非专利文献2:jianle chen et al.,algorithm description of joint exploration test model 5(jem5),joint video exploration team(jvet)of itu-t sg 16wp 3and iso/iec jtc 1/sc 29/wg 11 5th meeting:geneva,ch,document:jvet-e1001,january2017


技术实现要素:

8.发明要解决的课题
9.在这样的编码及解码技术中,要求进一步的压缩效率的提高及处理负荷的减轻。
10.因此,本发明提供能够实现进一步的压缩效率的提高及处理负荷的减轻的编码装置、解码装置、编码方法或者解码方法。
11.用于解决课题的手段
12.有关本发明的一技术方案的编码装置,其中,具备电路和存储器,上述电路使用上述存储器进行如下处理:判定根据编码对象块的尺寸来选择变换基的模式是否有效,在上述模式有效的情况下,在上述编码对象块的水平尺寸满足规定条件时,从多个变换基的候选中选择第1变换基作为水平方向的变换基,在上述编码对象块的水平尺寸不满足上述规定条件时,选择第2变换基作为水平方向的变换基,上述第2变换基是固定的变换基,在上述编码对象块的垂直尺寸满足第2规定条件时,从多个变换基的候选中选择第3变换基作为垂直方向的变换基,在上述编码对象块的垂直尺寸不满足上述第2规定条件时,选择第4变换基作为垂直方向的变换基,上述第4变换基是固定的变换基,通过使用所选择的上述水平方向及上述垂直方向的变换基对上述编码对象块的残差进行水平方向及垂直方向的第1变换,生成第1变换系数。
13.有关本发明的一技术方案的解码装置,其中,具备电路和存储器,上述电路使用上述存储器进行如下处理:判定根据解码对象块的尺寸来选择变换基的模式是否有效,在上
述模式有效的情况下,在上述解码对象块的水平尺寸满足规定条件时,从多个变换基的候选中选择第1变换基作为水平方向的变换基,在上述解码对象块的水平尺寸不满足上述规定条件时,选择第2变换基作为水平方向的变换基,上述第2变换基是固定的变换基,在上述解码对象块的垂直尺寸满足第2规定条件时,从多个变换基的候选中选择第3变换基作为垂直方向的变换基,在上述解码对象块的垂直尺寸不满足上述第2规定条件时,选择第4变换基作为垂直方向的变换基,上述第4变换基是固定的变换基,使用所选择的上述水平方向及上述垂直方向的变换基对上述解码对象块进行水平方向及垂直方向的第1逆变换。
14.另外,这些总体性或具体的技术方案也可以由系统、方法、集成电路、计算机程序或计算机可读取的cd-rom等的记录介质实现,也可以由系统、方法、集成电路、计算机程序及记录介质的任意的组合来实现。
15.发明效果
16.本发明能够提供能够实现进一步的压缩效率的提高及处理负荷的减轻的编码装置、解码装置、编码方法或者解码方法。
附图说明
17.图1是表示有关实施方式1的编码装置的功能结构的框图。
18.图2是表示实施方式1的块分割的一例的图。
19.图3是表示与各变换类型对应的变换基函数的表。
20.图4a是表示alf中使用的滤波器的形状的一例的图。
21.图4b是表示alf中使用的滤波器的形状的另一例的图。
22.图4c是表示alf中使用的滤波器的形状的另一例的图。
23.图5a是表示帧内预测的67个帧内预测模式的图。
24.图5b是用来说明基于obmc处理进行的预测图像修正处理的概要的流程图。
25.图5c是用来说明基于obmc处理进行的预测图像修正处理的概要的概念图。
26.图5d是表示fruc的一例的图。
27.图6是用来说明沿着运动轨迹的2个块之间的图案匹配(双向匹配)的图。
28.图7是用来说明当前图片内的模板与参照图片内的块之间的图案匹配(模板匹配)的图。
29.图8是用来说明假定了等速直线运动的模型的图。
30.图9a是用来说明基于多个相邻块的运动矢量进行的子块单位的运动矢量的导出的图。
31.图9b是用来说明基于合并模式的运动矢量导出处理的概要的图。
32.图9c是用来说明dmvr处理的概要的概念图。
33.图9d是用来说明采用基于lic处理的亮度修正处理的预测图像生成方法的概要的图。
34.图10是表示有关实施方式1的解码装置的功能结构的框图。
35.图11a是表示有关实施方式1的第1方式的编码装置的变换部的内部结构的框图。
36.图11b是表示有关实施方式1的第1方式的编码装置的逆变换部的内部结构的框图。
37.图12a是表示有关实施方式1的第1方式的编码装置的变换部及量化部的处理的流程图。
38.图12b是表示有关实施方式1的第1方式的编码装置的变换部及量化部的处理的变形例的流程图。
39.图13a是表示有关实施方式1的第2方式的编码装置的变换部及量化部的处理的流程图。
40.图13b是表示有关实施方式1的第2方式的编码装置的熵编码部的处理的流程图。
41.图14是表示有关实施方式1的第2方式中的语法的具体例的图。
42.图15是表示在实施方式1的第2方式中使用的变换基和信号的编码的有无的具体例的表。
43.图16是表示有关实施方式1的第3方式的编码装置的变换部及量化部的处理的流程图。
44.图17a是表示有关实施方式1的第4方式的编码装置的变换部及量化部的处理的流程图。
45.图17b是表示有关实施方式1的第4方式的编码装置的熵编码部的处理的流程图。
46.图18是表示实施方式1的第4方式中的语法的具体例的图。
47.图19是表示在实施方式1的第4方式中使用的变换基和信号的编码的有无的具体例的表。
48.图20是表示有关实施方式1的第5方式的解码装置的逆变换部的内部结构的框图。
49.图21是表示有关实施方式1的第5方式的解码装置的逆量化部及逆变换部的处理的流程图。
50.图22a是表示有关实施方式1的第6方式的解码装置的熵解码部的处理的流程图。
51.图22b是表示有关实施方式1的第6方式的解码装置的逆量化部及逆变换部的处理的流程图。
52.图23是表示有关实施方式1的第7方式的解码装置的逆量化部及逆变换部的处理的流程图。
53.图24a是表示有关实施方式1的第8方式的解码装置的熵解码部的处理的流程图。
54.图24b是表示有关实施方式1的第8方式的解码装置的逆量化部及逆变换部的处理的流程图。
55.图25是实现内容分发服务的内容供给系统的整体结构图。
56.图26是表示可分级编码时的编码构造的一例的图。
57.图27是表示可分级编码时的编码构造的一例的图。
58.图28是表示web页的显示画面例的图。
59.图29是表示web页的显示画面例的图。
60.图30是表示智能电话的一例的图。
61.图31是表示智能电话的结构例的框图。
具体实施方式
62.以下,参照附图对实施方式进行具体说明。
63.另外,以下说明的实施方式都表示包含性或具体的例子。在以下的实施方式中表示的数值、形状、材料、构成要素、构成要素的配置及连接形态、步骤、步骤的顺序等是一例,不是限定权利要求的意思。此外,关于以下的实施方式的构成要素中的、在表示最上位概念的独立权利要求中没有记载的构成要素,设为任意的构成要素而进行说明。
64.(实施方式1)
65.首先,作为能够应用在后述的本发明的各形态中说明的处理及/或结构的编码装置及解码装置的一例,说明实施方式1的概要。但是,实施方式1只不过是能够应用在本发明的各形态中说明的处理及/或结构的编码装置及解码装置的一例,在本发明的各形态中说明的处理及/或结构在与实施方式1不同的编码装置及解码装置中也能够实施。
66.在对于实施方式1应用在本发明的各形态中说明的处理及/或结构的情况下,例如也可以进行以下中的某个。
67.(1)对于实施方式1的编码装置或解码装置,将构成该编码装置或解码装置的多个构成要素中的、与在本发明的各形态中说明的构成要素对应的构成要素,替换为在本发明的各形态中说明的构成要素;
68.(2)对于实施方式1的编码装置或解码装置,在对构成该编码装置或解码装置的多个构成要素中的一部分构成要素施以功能或实施的处理的追加、替换、删除等的任意的变更后,将与在本发明的各形态中说明的构成要素对应的构成要素替换为在本发明的各形态中说明的构成要素;
69.(3)对于实施方式1的编码装置或解码装置实施的方法,施以处理的追加、及/或对于该方法中包含的多个处理中的一部分处理施以替换、删除等的任意的变更后,将与在本发明的各形态中说明的处理对应的处理替换为在本发明的各形态中说明的处理;
70.(4)将构成实施方式1的编码装置或解码装置的多个构成要素中的一部分构成要素,与在本发明的各形态中说明的构成要素、具备在本发明的各形态中说明的构成要素所具备的功能的一部分的构成要素、或实施在本发明的各形态中说明的构成要素所实施的处理的一部分的构成要素组合而实施;
71.(5)将具备构成实施方式1的编码装置或解码装置的多个构成要素中的一部分构成要素所具备的功能的一部分的构成要素、或实施构成实施方式1的编码装置或解码装置的多个构成要素中的一部分构成要素所实施的处理的一部分的构成要素,与在本发明的各形态中说明的构成要素、具备在本发明的各形态中说明的构成要素所具备的功能的一部分的构成要素、或实施在本发明的各形态中说明的构成要素所实施的处理的一部分的构成要素组合而实施;
72.(6)对于实施方式1的编码装置或解码装置所实施的方法,将该方法中包含的多个处理中的与在本发明的各形态中说明的处理对应的处理,替换为在本发明的各形态中说明的处理;
73.(7)将在实施方式1的编码装置或解码装置所实施的方法中包含的多个处理中的一部分的处理与在本发明的各形态中说明的处理组合而实施。
74.另外,在本发明的各形态中说明的处理及/或结构的实施的方式并不限定于上述的例子。例如,也可以在以与实施方式1中公开的运动图像/图像编码装置或运动图像/图像解码装置不同的目的使用的装置中实施,也可以将在各形态中说明的处理及/或结构单独
地实施。此外,也可以将在不同的形态中说明的处理及/或结构组合而实施。
75.[编码装置的概要]
[0076]
首先,说明有关实施方式1的编码装置的概要。图1是表示有关实施方式1的编码装置100的功能结构的框图。编码装置100是将运动图像/图像以块单位进行编码的运动图像/图像编码装置。
[0077]
如图1所示,编码装置100是将图像以块单位进行编码的装置,具备分割部102、减法部104、变换部106、量化部108、熵编码部110、逆量化部112、逆变换部114、加法部116、块存储器118、循环滤波部120、帧存储器122、帧内预测部124、帧间预测部126和预测控制部128。
[0078]
编码装置100例如由通用处理器及存储器实现。在此情况下,当保存在存储器中的软件程序被处理器执行时,处理器作为分割部102、减法部104、变换部106、量化部108、熵编码部110、逆量化部112、逆变换部114、加法部116、循环滤波部120、帧内预测部124、帧间预测部126及预测控制部128发挥功能。此外,编码装置100也可以作为与分割部102、减法部104、变换部106、量化部108、熵编码部110、逆量化部112、逆变换部114、加法部116、循环滤波部120、帧内预测部124、帧间预测部126及预测控制部128对应的专用的1个以上的电子电路实现。
[0079]
以下,对编码装置100中包含的各构成要素进行说明。
[0080]
[分割部]
[0081]
分割部102将输入运动图像中包含的各图片分割为多个块,将各块向减法部104输出。例如,分割部102首先将图片分割为固定尺寸(例如128
×
128)的块。该固定尺寸的块有被称作编码树单元(ctu)的情况。并且,分割部102基于递归性的四叉树(quadtree)及/或二叉树(binary tree)块分割,将固定尺寸的各个块分割为可变尺寸(例如64
×
64以下)的块。该可变尺寸的块有被称作编码单元(cu)、预测单元(pu)或变换单元(tu)的情况。另外,在本实施方式中,不需要将cu、pu及tu区分,而也可以将图片内的一部分或全部的块作为cu、pu、tu的处理单位。
[0082]
图2是表示实施方式1的块分割的一例的图。在图2中,实线表示基于四叉树块分割的块边界,虚线表示基于二叉树块分割的块边界。
[0083]
这里,块10是128
×
128像素的正方形块(128
×
128块)。该128
×
128块10首先被分割为4个正方形的64
×
64块(四叉树块分割)。
[0084]
左上方的64
×
64块再被垂直地分割为2个矩形的32
×
64块,左方的32
×
64块再被垂直地分割为2个矩形的16
×
64块(二叉树块分割)。结果,左上方的64
×
64块被分割为2个16
×
64块11、12和32
×
64块13。
[0085]
右上方的64
×
64块被水平地分割为2个矩形的64
×
32块14、15(二叉树块分割)。
[0086]
左下方的64
×
64块被分割为4个正方形的32
×
32块(四叉树块分割)。4个32
×
32块中的左上方的块及右下方的块进一步被分割。左上方的32
×
32块被垂直地分割为2个矩形的16
×
32块,右方的16
×
32块再被水平地分割为2个16
×
16块(二叉树块分割)。右下方的32
×
32块被水平地分割为2个32
×
16块(二叉树块分割)。结果,左下方的64
×
64块被分割为16
×
32块16、2个16
×
16块17、18、2个32
×
32块19、20、以及2个32
×
16块21、22。
[0087]
右下方的64
×
64块23不被分割。
[0088]
如以上这样,在图2中,块10基于递归性的四叉树及二叉树块分割而被分割为13个可变尺寸的块11~23。这样的分割有被称作qtbt(quad-tree plus binary tree,四叉树加二叉树)分割的情况。
[0089]
另外,在图2中,1个块被分割为4个或2个块(四叉树或二叉树块分割),但分割并不限定于此。例如,也可以是1个块被分割为3个块(三叉树分割)。包括这样的三叉树分割在内的分割有被称作mbt(multi type tree,多类型树)分割的情况。
[0090]
[减法部]
[0091]
减法部104以由分割部102分割的块单位从原信号(原样本)减去预测信号(预测样本)。即,减法部104计算编码对象块(以下称作当前块)的预测误差(也称作残差)。并且,减法部104将计算出的预测误差向变换部106输出。
[0092]
原信号是编码装置100的输入信号,是表示构成运动图像的各图片的图像的信号(例如亮度(luma)信号及2个色差(chroma)信号)。以下,也有将表示图像的信号也称作样本的情况。
[0093]
[变换部]
[0094]
变换部106将空间域的预测误差变换为频域的变换系数,将变换系数向量化部108输出。具体而言,变换部106例如对空间域的预测误差进行预先设定的离散余弦变换(dct)或离散正弦变换(dst)。
[0095]
另外,变换部106也可以从多个变换类型之中适应性地选择变换类型,使用与所选择的变换类型对应的变换基函数(transform basis function),将预测误差变换为变换系数。这样的变换有被称作emt(explicit multiple core transform,多核变换)或amt(adaptive multiple transform,自适应多变换)的情况。
[0096]
多个变换类型例如包括dct-ii、dct-v、dct-viii、dst-i及dst-vii。图3是表示与各变换类型对应的变换基函数的表。在图3中,n表示输入像素的数量。从这些多个变换类型之中的变换类型的选择,例如既可以依赖于预测的种类(帧内预测及帧间预测),也可以依赖于帧内预测模式。
[0097]
表示是否应用这样的emt或amt的信息(例如称作amt标志)及表示所选择的变换类型的信息以cu级被信号化。另外,这些信息的信号化并不需要限定于cu级,也可以是其他级(例如,序列级、图片级、切片级、瓦片级或ctu级)。
[0098]
此外,变换部106也可以对变换系数(变换结果)进行再变换。这样的再变换有被称作ast(adaptive secondary transform,自适应二次变换)或nsst(non-separable secondary transform,不可分二次变换)的情况。例如,变换部106按与帧内预测误差对应的变换系数的块中包含的每个子块(例如4
×
4子块)进行再变换。表示是否应用nsst的信息及与nsst中使用的变换矩阵有关的信息以cu级被进行信号化。另外,这些信息的信号化并不需要限定于cu级,也可以是其他级(例如,序列级、图片级、切片级、瓦片级或ctu级)。
[0099]
这里,separable(可分离)的变换是指与输入的维度数相当地按每个方向分离而进行多次变换的方式,non-separable(不可分)的变换是指当输入是多维时将2个以上的维度合起来看作1个维度而一起进行变换的方式。
[0100]
例如,作为non-separable的变换的1例,可以举出在输入是4
×
4的块的情况下将其看作具有16个元素的一个排列,对该排列以16
×
16的变换矩阵进行变换处理的方式。
[0101]
此外,同样,在将4
×
4的输入块看作具有16个元素的一个排列后对该排列多次进行givens旋转的方式(hypercube givens transform),也是non-separable的变换的例子。
[0102]
[量化部]
[0103]
量化部108对从变换部106输出的变换系数进行量化。具体而言,量化部108对当前块的变换系数以规定的扫描顺序进行扫描,基于与被扫描的变换系数对应的量化参数(qp)对该变换系数进行量化。并且,量化部108将当前块的量化后的变换系数(以下称作量化系数)向熵编码部110及逆量化部112输出。
[0104]
规定的顺序是用于变换系数的量化/逆量化的顺序。例如,用频率的升序(从低频向高频的顺序)或降序(从高频向低频的顺序)定义规定的扫描顺序。
[0105]
量化参数是指定义量化步长(量化宽度)的参数。例如,如果量化参数的值增加,则量化步长也增加。即,如果量化参数的值增加,则量化误差增大。
[0106]
[熵编码部]
[0107]
熵编码部110通过对作为来自量化部108的输入的量化系数进行可变长编码,生成编码信号(编码比特流)。具体而言,熵编码部110例如将量化系数进行二值化,对二值信号进行算术编码。
[0108]
[逆量化部]
[0109]
逆量化部112对作为来自量化部108的输入的量化系数进行逆量化。具体而言,逆量化部112对当前块的量化系数以规定的扫描顺序进行逆量化。并且,逆量化部112将当前块的逆量化后的变换系数向逆变换部114输出。
[0110]
[逆变换部]
[0111]
逆变换部114通过对作为来自逆量化部112的输入的变换系数进行逆变换,复原预测误差。具体而言,逆变换部114通过对变换系数进行与变换部106的变换对应的逆变换,复原当前块的预测误差。并且,逆变换部114将复原后的预测误差向加法部116输出。
[0112]
另外,复原后的预测误差由于通过量化丢失了信息,所以与减法部104计算出的预测误差不一致。即,复原后的预测误差中包含量化误差。
[0113]
[加法部]
[0114]
加法部116通过将作为来自逆变换部114的输入的预测误差与作为来自预测控制部128的输入的预测样本相加,重构当前块。并且,加法部116将重构的块向块存储器118及循环滤波部120输出。重构块有被称作本地解码块的情况。
[0115]
[块存储器]
[0116]
块存储器118是用来将在帧内预测中参照的、编码对象图片(以下称作当前图片)内的块进行保存的存储部。具体而言,块存储器118保存从加法部116输出的重构块保存。
[0117]
[循环滤波部]
[0118]
循环滤波部120对由加法部116重构的块施以循环滤波,将滤波后的重构块向帧存储器122输出。循环滤波是指在编码循环内使用的滤波(环内滤波),例如包括解块滤波(df)、样本自适应偏移(sao)及自适应循环滤波(alf)等。
[0119]
在alf中,采用用来除去编码失真的最小二乘误差滤波器,例如按当前块内的每个2
×
2子块,采用基于局部性的梯度(gradient)的方向及活性度(activity)从多个滤波器中
选择的1个滤波器。
[0120]
具体而言,首先将子块(例如2
×
2子块)分类为多个类(例如15或25类)。子块的分类基于梯度的方向及活性度来进行。例如,使用梯度的方向值d(例如0~2或0~4)和梯度的活性值a(例如0~4),计算分类值c(例如c=5d+a)。并且,基于分类值c,将子块分类为多个类(例如15或25类)。
[0121]
梯度的方向值d例如通过将多个方向(例如水平、垂直及2个对角方向)的梯度进行比较而导出。此外,梯度的活性值a例如通过将多个方向的梯度相加、并对相加结果进行量化来导出。
[0122]
基于这样的分类的结果,从多个滤波器之中决定用于子块的滤波器。
[0123]
作为在alf中使用的滤波器的形状,例如使用圆对称形状。图4a~图4c是表示在alf中使用的滤波器的形状的多个例子的图。图4a表示5
×
5钻石形状滤波器,图4b表示7
×
7钻石形状滤波器,图4c表示9
×
9钻石形状滤波器。表示滤波器的形状的信息以图片级被进行信号化。另外,表示滤波器的形状的信息的信号化不需要限定于图片级,也可以是其他级(例如,序列级、切片级、瓦片级、ctu级或cu级)。
[0124]
alf的开启/关闭例如以图片级或cu级决定。例如,关于亮度,以cu级决定是否采用alf,关于色差,以图片级决定是否采用alf。表示alf的开启/关闭的信息以图片级或cu级被进行信号化。另外,表示alf的开启/关闭的信息的信号化并不需要限定于图片级或cu级,也可以是其他级(例如,序列级、切片级、瓦片级或ctu级)。
[0125]
可选择的多个滤波器(例如到15个或25个为止的滤波器)的系数集以图片级被进行信号化。另外,系数集的信号化并不需要限定于图片级,也可以是其他级(例如,序列级、切片级、瓦片级、ctu级、cu级或子块级)。
[0126]
[帧存储器]
[0127]
帧存储器122是用来将在帧间预测中使用的参照图片进行保存的存储部,也有被称作帧缓冲器的情况。具体而言,帧存储器122保存由循环滤波部120滤波后的重构块。
[0128]
[帧内预测部]
[0129]
帧内预测部124参照保存在块存储器118中的当前图片内的块而进行当前块的帧内预测(也称作画面内预测),从而生成预测信号(帧内预测信号)。具体而言,帧内预测部124通过参照与当前块相邻的块的样本(例如亮度值、色差值)进行帧内预测而生成帧内预测信号,并将帧内预测信号向预测控制部128输出。
[0130]
例如,帧内预测部124使用预先规定的多个帧内预测模式中的1个进行帧内预测。多个帧内预测模式包括1个以上的非方向性预测模式和多个方向性预测模式。
[0131]
1个以上的非方向性预测模式例如包括由h.265/hevc(high-efficiency video coding)规格(非专利文献1)规定的planar(平面)预测模式及dc预测模式。
[0132]
多个方向性预测模式例如包括由h.265/hevc规格规定的33个方向的预测模式。另外,多个方向性预测模式也可以除了33个方向以外还包括32个方向的预测模式(合计65个方向性预测模式)。图5a是表示帧内预测中的67个帧内预测模式(2个非方向性预测模式及65个方向性预测模式)的图。实线箭头表示由h.265/hevc规格规定的33个方向,虚线箭头表示追加的32个方向。
[0133]
另外,在色差块的帧内预测中,也可以参照亮度块。即,也可以基于当前块的亮度
成分来预测当前块的色差成分。这样的帧内预测有被称作cclm(cross-component linear model,跨组件的线性模型)预测的情况。也可以将这样的参照亮度块的色差块的帧内预测模式(例如称作cclm模式)作为色差块的帧内预测模式的1个来添加。
[0134]
帧内预测部124也可以基于水平/垂直方向的参照像素的梯度,将帧内预测后的像素值进行修正。伴随着这样的修正的帧内预测有被称作pdpc(position dependent intra prediction combination,位置决定的帧内预测组合)的情况。表示有没有采用pdpc的信息(例如称作pdpc标志)例如以cu级被进行信号化。另外,该信息的信号化并不需要限定于cu级,也可以是其他级(例如,序列级、图片级、切片级、瓦片级或ctu级)。
[0135]
[帧间预测部]
[0136]
帧间预测部126参照保存在帧存储器122中的与当前图片不同的参照图片进行当前块的帧间预测(也称作画面间预测),从而生成预测信号(帧间预测信号)。帧间预测以当前块或当前块内的子块(例如4
×
4块)的单位进行。例如,帧间预测部126对于当前块或子块,在参照图片内进行运动估计(motion estimation)。并且,帧间预测部126使用通过运动估计得到的运动信息(例如运动矢量)进行运动补偿,从而生成当前块或子块的帧间预测信号。并且,帧间预测部126将所生成的帧间预测信号向预测控制部128输出。
[0137]
在运动补偿中使用的运动信息被信号化。在运动矢量的信号化中也可以使用预测运动矢量(motion vector predictor)。即,也可以是运动矢量与预测运动矢量之间的差被信号化。
[0138]
另外,也可以是,不仅使用通过运动估计得到的当前块的运动信息,还使用相邻块的运动信息来生成帧间预测信号。具体而言,也可以将基于通过运动估计得到的运动信息的预测信号、与基于相邻块的运动信息的预测信号进行加权相加,由此以当前块内的子块单位生成帧间预测信号。这样的帧间预测(运动补偿)有被称作obmc(overlapped block motion compensation,重叠块运动补偿)的情况。
[0139]
在这样的obmc模式中,对表示用于obmc的子块的尺寸的信息(例如称作obmc块尺寸)以序列级进行信号化。此外,对表示是否采用obmc模式的信息(例如称作obmc标志)以cu级进行信号化。另外,这些信息的信号化的级别并不需要限定于序列级及cu级,也可以是其他级(例如图片级、切片级、瓦片级、ctu级或子块级)。
[0140]
对于obmc模式更具体地进行说明。图5b及图5c是用来说明基于obmc处理进行的预测图像修正处理的概要的流程图及概念图。
[0141]
首先,使用被分配给编码对象块的运动矢量(mv),取得通过通常的运动补偿得到的预测图像(pred)。
[0142]
接着,对编码对象块采用已编码的左相邻块的运动矢量(mv_l)而取得预测图像(pred_l),通过将上述预测图像和pred_l加权叠加,进行预测图像的第1次修正。
[0143]
同样,对编码对象块采用已编码的上相邻块的运动矢量(mv_u)而取得预测图像(pred_u),通过对进行上述第1次修正后的预测图像和pred_u加权叠加,进行预测图像的第2次修正,将其作为最终的预测图像。
[0144]
另外,这里说明了使用左相邻块和上相邻块的两阶段的修正的方法,但也可以构成为使用右相邻块及下相邻块进行比两阶段多的次数的修正。
[0145]
另外,进行叠加的区域也可以不是块整体的像素区域,而仅是块边界附近的一部
分区域。
[0146]
另外,这里对根据1张参照图片的预测图像修正处理进行了说明,但在根据多张参照图片对预测图像进行修正的情况下也是同样的,在根据各个参照图片取得修正后的预测图像后,将得到的预测图像进一步叠加,由此作为最终的预测图像。
[0147]
另外,上述处理对象块也可以是预测块单位,也可以是将预测块进一步分割的子块单位。
[0148]
作为是否采用obmc处理的判定的方法,例如有使用表示是否采用obmc处理的信号即obmc_flag的方法。作为具体的一例,在编码装置中,判定编码对象块是否属于运动复杂的区域,在属于运动复杂的区域的情况下,作为obmc_flag而设定值1并采用obmc处理进行编码,在不属于运动复杂的区域的情况下,作为obmc_flag而设定值0,不采用obmc处理而进行编码。另一方面,在解码装置中,通过将流中记述的obmc_flag解码,根据其值切换是否采用obmc处理,来进行解码。
[0149]
另外,也可以不将运动信息进行信号化,而在解码装置侧导出。例如,也可以使用由h.265/hevc规格规定的合并模式。此外,例如也可以通过在解码装置侧进行运动估计来导出运动信息。在此情况下,不使用当前块的像素值而进行运动估计。
[0150]
这里,对在解码装置侧进行运动估计的模式进行说明。该在解码装置侧进行运动估计的模式有被称作pmmvd(pattern matched motion vector derivation,图案匹配的运动矢量推导)模式或fruc(frame rate up-conversion,帧速率上转换)模式的情况。
[0151]
在图5d中表示fruc处理的一例。首先,参照与当前块在空间或时间上相邻的已编码块的运动矢量,生成分别具有预测运动矢量的多个候选的列表(也可以与合并列表共用)。接着,从登记在候选列表中的多个候选mv之中选择最佳候选mv。例如,计算候选列表中包含的各候选的评价值,基于评价值选择1个候选。
[0152]
并且,基于所选择的候选的运动矢量,导出用于当前块的运动矢量。具体而言,例如将所选择的候选的运动矢量(最佳候选mv)原样作为用于当前块的运动矢量来导出。此外,例如也可以通过在与所选择的候选的运动矢量对应的参照图片内的位置的周边区域中进行图案匹配,来导出用于当前块的运动矢量。即,也可以对最佳候选mv的周边区域通过同样的方法进行搜索,在有评价值为更好的值的mv的情况下,将最佳候选mv更新为上述mv,将其作为当前块的最终的mv。另外,也可以做成不实施该处理的结构。
[0153]
也可以在以子块单位进行处理的情况下也进行完全同样的处理。
[0154]
另外,关于评价值,通过与运动矢量对应的参照图片内的区域和规定区域之间的图案匹配求出重构图像的差分值来计算。另外,也可以是,除了差分值以外还使用其以外的信息来计算评价值。
[0155]
作为图案匹配,使用第1图案匹配或第2图案匹配。第1图案匹配及第2图案匹配有分别被称作双向匹配(bilateral matching)及模板匹配(template matching)的情况。
[0156]
在第1图案匹配中,在不同的2个参照图片内的、沿着当前块的运动轨迹(motion trajectory)的2个块之间进行图案匹配。因而,在第1图案匹配中,作为上述的用于候选的评价值的计算的规定区域,使用沿着当前块的运动轨迹的其他参照图片内的区域。
[0157]
图6是用来说明沿着运动轨迹的2个块间的图案匹配(双向匹配)的一例的图。如图6所示,在第1图案匹配中,通过在沿着当前块(cur block)的运动轨迹的2个块、且不同的2
个参照图片(ref0,ref1)内的2个块的对之中搜索最匹配的对,导出2个运动矢量(mv0,mv1)。具体而言,对于当前块,导出由候选mv指定的第1已编码参照图片(ref0)内的指定位置处的重构图像、与由将上述候选mv以显示时间间隔进行缩放后的对称mv指定的第2已编码参照图片(ref1)内的指定位置处的重构图像的差分,使用所得到的差分值计算评价值。可以在多个候选mv之中选择评价值为最好的值的候选mv作为最终mv。
[0158]
在连续性的运动轨迹的假定下,指示2个参照块的运动矢量(mv0,mv1)相对于当前图片(cur pic)与2个参照图片(ref0,ref1)之间的时间上的距离(td0,td1)成比例。例如,在当前图片在时间上位于2个参照图片之间、从当前图片向2个参照图片的时间上的距离相等的情况下,在第1图案匹配中,导出镜像对称的双方向的运动矢量。
[0159]
在第2图案匹配中,在当前图片内的模板(在当前图片内与当前块相邻的块(例如上及/或左相邻块))与参照图片内的块之间进行图案匹配。因而,在第2图案匹配中,作为上述的用于候选的评价值的计算的规定区域,使用当前图片内的与当前块相邻的块。
[0160]
图7是用来说明当前图片内的模板与参照图片内的块之间的图案匹配(模板匹配)的一例的图。如图7所示,在第2图案匹配中,通过在参照图片(ref0)内搜索与在当前图片(cur pic)内相邻于当前块(cur block)的块最匹配的块,导出当前块的运动矢量。具体而言,对于当前块,导出左相邻及上相邻的双方或某一方的已编码区域的重构图像与由候选mv指定的已编码参照图片(ref0)内的同等位置处的重构图像的差分,使用所得到的差分值计算评价值,在多个候选mv之中选择评价值为最好的值的候选mv作为最佳候选mv。
[0161]
这样的表示是否采用fruc模式的信息(例如称作fruc标志)以cu级被信号化。此外,在采用fruc模式的情况下(例如fruc标志为真的情况下),表示图案匹配的方法(第1图案匹配或第2图案匹配)的信息(例如称作fruc模式标志)以cu级被信号化。另外,这些信息的信号化并不需要限定于cu级,也可以是其他级(例如,序列级、图片级、切片级、瓦片级、ctu级或子块级)。
[0162]
这里,说明基于假定了等速直线运动的模型来导出运动矢量的模式。该模式有被称作bio(bi-directional optical flow,双向光流)的情况。
[0163]
图8是用来说明假定了等速直线运动的模型的图。在图8中,(v
x
,vy)表示速度矢量,τ0、τ1分别表示当前图片(cur pic)与2个参照图片(ref0,ref1)之间的时间上的距离。(mvx0,mvy0)表示与参照图片ref0对应的运动矢量,(mvx1,mvy1)表示与参照图片ref1对应的运动矢量。
[0164]
此时,在速度矢量(v
x
,vy)的等速直线运动的假定下,(mvx0,mvy0)及(mvx1,mvy1)分别被表示为(vxτ0,vyτ0)及(-vxτ1,-vyτ1),以下的光流(optical flow)等式(1)成立。
[0165]
[数式1]
[0166][0167]
这里,i
(k)
表示运动补偿后的参照图像k(k=0、1)的亮度值。该光流等式表示(i)亮度值的时间微分、(ii)水平方向的速度及参照图像的空间梯度的水平成分的积、以及(iii)垂直方向的速度及参照图像的空间梯度的垂直成分的积的和等于零。基于该光流等式与埃尔米特内插值(hermite interpolation)的组合,对从合并列表等得到的块单位的运动矢量以像素单位进行修正。
[0168]
另外,也可以通过与基于假定了等速直线运动的模型的运动矢量的导出不同的方
法,在解码装置侧导出运动矢量。例如,也可以基于多个相邻块的运动矢量,以子块单位导出运动矢量。
[0169]
这里,对基于多个相邻块的运动矢量以子块单位导出运动矢量的模式进行说明。该模式有被称作仿射运动补偿预测(affine motion compensation prediction)模式的情况。
[0170]
图9a是用来说明基于多个相邻块的运动矢量进行的子块单位的运动矢量的导出的图。在图9a中,当前块包括16个4
×
4子块。这里,基于相邻块的运动矢量,导出当前块的左上角控制点的运动矢量v0,基于相邻子块的运动矢量,导出当前块的右上角控制点的运动矢量v1。并且,使用2个运动矢量v0及v1,通过以下的式(2),导出当前块内的各子块的运动矢量(v
x
,vy)。
[0171]
[数式2]
[0172][0173]
这里,x及y分别表示子块的水平位置及垂直位置,w表示预先设定的权重系数。
[0174]
在这样的仿射运动补偿预测模式中,也可以包括左上及右上角控制点的运动矢量的导出方法不同的若干模式。表示这样的仿射运动补偿预测模式的信息(例如称作仿射标志)以cu级被信号化。另外,表示该仿射运动补偿预测模式的信息的信号化并不需要限定于cu级,也可以是其他级(例如,序列级、图片级、切片级、瓦片级、ctu级或子块级)。
[0175]
[预测控制部]
[0176]
预测控制部128选择帧内预测信号及帧间预测信号中的某一个,将所选择的信号作为预测信号,向减法部104及加法部116输出。
[0177]
这里,说明通过合并模式导出编码对象图片的运动矢量的例子。图9b是用来说明基于合并模式的运动矢量导出处理的概要的图。
[0178]
首先,生成登记有预测mv的候选的预测mv列表。作为预测mv的候选,有在空间上位于编码对象块的周边的多个已编码块所具有的mv即空间相邻预测mv、将已编码参照图片中的编码对象块的位置投影的近旁的块所具有的mv即时间相邻预测mv、将空间相邻预测mv与时间相邻预测mv的mv值组合而生成的mv即结合预测mv、以及值为零的mv即零预测mv等。
[0179]
接着,通过从登记在预测mv列表中的多个预测mv之中选择1个预测mv,决定为编码对象块的mv。
[0180]
进而,在可变长编码部中,将作为表示选择了哪个预测mv的信号的merge_idx记述在流中并编码。
[0181]
另外,在图9b中说明的预测mv列表中登记的预测mv是一例,也可以是与图中的个数不同的个数、或者是不包含图中的预测mv的一部分种类的结构、或者是追加了图中的预测mv的种类以外的预测mv的结构。
[0182]
另外,也可以使用通过合并模式导出的编码对象块的mv进行后述的dmvr处理,从而决定最终的mv。
[0183]
这里,对使用dmvr处理决定mv的例子进行说明。
[0184]
图9c是用来说明dmvr处理的概要的概念图。
[0185]
首先,将对处理对象块设定的最优mvp作为候选mv,按照上述候选mv,从作为l0方向的已处理图片的第1参照图片及作为l1方向的已处理图片的第2参照图片分别取得参照像素,通过取各参照像素的平均来生成模板。
[0186]
接着,使用上述模板,分别搜索第1参照图片及第2参照图片的候选mv的周边区域,将成本最小的mv决定为最终的mv。另外,关于成本值,使用模板的各像素值与搜索区域的各像素值的差分值及mv值等来计算。
[0187]
另外,在编码装置及解码装置中,这里说明的处理的概要基本上是共通的。
[0188]
另外,即使不是这里说明的处理本身,只要是能够搜索候选mv的周边并导出最终的mv的处理,也可以使用其他处理。
[0189]
这里,对使用lic处理生成预测图像的模式进行说明。
[0190]
图9d是用来说明使用基于lic处理的亮度修正处理的预测图像生成方法的概要的图。
[0191]
首先,导出用来从作为已编码图片的参照图片取得与编码对象块对应的参照图像的mv。
[0192]
接着,对于编码对象块,使用左相邻及上相邻的已编码周边参照区域的亮度像素值和由mv指定的参照图片内的同等位置处的亮度像素值,提取表示在参照图片和编码对象图片中亮度值怎样变化的信息,计算亮度修正参数。
[0193]
通过使用上述亮度修正参数对由mv指定的参照图片内的参照图像进行亮度修正处理,生成对于编码对象块的预测图像。
[0194]
另外,图9d中的上述周边参照区域的形状是一例,也可以使用其以外的形状。
[0195]
此外,这里对根据1张参照图片生成预测图像的处理进行了说明,但在根据多张参照图片生成预测图像的情况下也是同样的,在对从各个参照图片取得的参照图像以同样的方法进行亮度修正处理后生成预测图像。
[0196]
作为是否采用lic处理的判定的方法,例如有使用作为表示是否采用lic处理的信号的lic_flag的方法。作为具体的一例,在编码装置中,判定编码对象块是否属于发生了亮度变化的区域,在属于发生了亮度变化的区域的情况下,作为lic_flag而设定值1,采用lic处理进行编码,在不属于发生了亮度变化的区域的情况下,作为lic_flag而设定值0,不采用lic处理而进行编码。另一方面,在解码装置中,通过将记述在流中的lic_flag解码,根据其值切换是否采用lic处理而进行解码。
[0197]
作为是否采用lic处理的判定的其他方法,例如还有按照在周边块是否采用了lic处理来判定的方法。作为具体的一例,在编码对象块是合并模式的情况下,判定在合并模式处理中的mv的导出时所选择的周边的已编码块是否采用lic处理进行了编码,根据其结果,切换是否采用lic处理而进行编码。另外,在该例的情况下,解码中的处理也完全同样。
[0198]
[解码装置的概要]
[0199]
接着,对能够将从上述编码装置100输出的编码信号(编码比特流)进行解码的解码装置的概要进行说明。图10是表示有关实施方式1的解码装置200的功能结构的框图。解码装置200是将运动图像/图像以块单位进行解码的运动图像/图像解码装置。
[0200]
如图10所示,解码装置200具备熵解码部202、逆量化部204、逆变换部206、加法部
208、块存储器210、循环滤波部212、帧存储器214、帧内预测部216、帧间预测部218和预测控制部220。
[0201]
解码装置200例如由通用处理器及存储器实现。在此情况下,当由处理器执行了保存在存储器中的软件程序时,处理器作为熵解码部202、逆量化部204、逆变换部206、加法部208、循环滤波部212、帧内预测部216、帧间预测部218及预测控制部220发挥功能。此外,解码装置200也可以作为与熵解码部202、逆量化部204、逆变换部206、加法部208、循环滤波部212、帧内预测部216、帧间预测部218及预测控制部220对应的专用的1个以上的电子电路实现。
[0202]
以下,对解码装置200中包含的各构成要素进行说明。
[0203]
[熵解码部]
[0204]
熵解码部202对编码比特流进行熵解码。具体而言,熵解码部202例如从编码比特流算数解码为二值信号。接着,熵解码部202将二值信号进行多值化(debinarize)。由此,熵解码部202以块单位将量化系数向逆量化部204输出。
[0205]
[逆量化部]
[0206]
逆量化部204对作为来自熵解码部202的输入的解码对象块(以下称作当前块)的量化系数进行逆量化。具体而言,逆量化部204对于当前块的量化系数,分别基于与该量化系数对应的量化参数,对该量化系数进行逆量化。并且,逆量化部204将当前块的逆量化后的量化系数(即变换系数)向逆变换部206输出。
[0207]
[逆变换部]
[0208]
逆变换部206通过对作为来自逆量化部204的输入的变换系数进行逆变换,将预测误差复原。
[0209]
例如在从编码比特流读解出的信息表示采用emt或amt的情况下(例如amt标志是真),逆变换部206基于读解出的表示变换类型的信息,对当前块的变换系数进行逆变换。
[0210]
此外,例如在从编码比特流读解出的信息表示采用nsst的情况下,逆变换部206对变换系数应用逆再变换。
[0211]
[加法部]
[0212]
加法部208通过将作为来自逆变换部206的输入的预测误差与作为来自预测控制部220的输入的预测样本相加,重构当前块。并且,加法部208将重构的块向块存储器210及循环滤波部212输出。
[0213]
[块存储器]
[0214]
块存储器210是用来将作为在帧内预测中参照的、解码对象图片(以下称作当前图片)内的块进行保存的存储部。具体而言,块存储器210保存从加法部208输出的重构块。
[0215]
[循环滤波部]
[0216]
循环滤波部212对由加法部208重构的块施以循环滤波,将滤波后的重构块向帧存储器214及显示装置等输出。
[0217]
在从编码比特流读解出的表示alf的开启/关闭的信息表示alf的开启的情况下,基于局部性的梯度的方向及活性度从多个滤波器之中选择1个滤波器,对所重构块应用选择的滤波器。
[0218]
[帧存储器]
[0219]
帧存储器214是用来将在帧间预测中使用的参照图片进行保存的存储部,也有称作帧缓冲器的情况。具体而言,帧存储器214保存由循环滤波部212滤波后的重构块。
[0220]
[帧内预测部]
[0221]
帧内预测部216基于从编码比特流读解出的帧内预测模式,参照保存在块存储器210中的当前图片内的块进行帧内预测,由此生成预测信号(帧内预测信号)。具体而言,帧内预测部216通过参照与当前块相邻的块的样本(例如亮度值、色差值)进行帧内预测,由此生成帧内预测信号,将帧内预测信号向预测控制部220输出。
[0222]
另外,在色差块的帧内预测中选择了参照亮度块的帧内预测模式的情况下,帧内预测部216也可以基于当前块的亮度成分来预测当前块的色差成分。
[0223]
此外,在从编码比特流读解出的信息表示pdpc的采用的情况下,帧内预测部216基于水平/垂直方向的参照像素的梯度,对帧内预测后的像素值进行修正。
[0224]
[帧间预测部]
[0225]
帧间预测部218参照保存在帧存储器214中的参照图片,预测当前块。预测以当前块或当前块内的子块(例如4
×
4块)的单位进行。例如,帧间预测部218使用从编码比特流读解出的运动信息(例如运动矢量)进行运动补偿,由此生成当前块或子块的帧间预测信号,将帧间预测信号向预测控制部220输出。
[0226]
另外,在从编码比特流读解出的信息表示采用obmc模式的情况下,帧间预测部218不仅使用通过运动估计得到的当前块的运动信息,还使用相邻块的运动信息来生成帧间预测信号。
[0227]
此外,在从编码比特流读解出的信息表示采用fruc模式的情况下,帧间预测部218按照从编码流读解出的图案匹配的方法(双向匹配或模板匹配)进行运动估计,由此导出运动信息。并且,帧间预测部218使用所导出的运动信息进行运动补偿。
[0228]
此外,帧间预测部218在采用bio模式的情况下,基于假定了等速直线运动的模型导出运动矢量。此外,在从编码比特流读解出的信息表示采用仿射运动补偿预测模式的情况下,帧间预测部218基于多个相邻块的运动矢量以子块单位导出运动矢量。
[0229]
[预测控制部]
[0230]
预测控制部220选择帧内预测信号及帧间预测信号中的某一个,将所选择的信号作为预测信号,向加法部208输出。
[0231]
(实施方式1的第1方式)
[0232]
接着,参照附图对实施方式1的第1方式进行具体说明。
[0233]
[编码装置的变换部的内部结构]
[0234]
首先,参照图11a说明有关本方式的编码装置100的变换部106的内部结构。图11a是表示有关实施方式1的第1方式的编码装置100的变换部106的内部结构的框图。
[0235]
如图11a所示,有关本方式的变换部106具备变换模式判定部1061、尺寸判定部1062、第1变换基选择部1063、第1变换部1064、第2变换实施判定部1065、第2变换基选择部1066、以及第2变换部1067。
[0236]
变换模式判定部1061判定自适应变换基选择模式是否在编码对象块中有效。自适应变换基选择模式是指从1个或多个第1变换基的候选中自适应地选择变换基的模式。基于例如第1变换基或自适应变换基选择模式的识别信息进行自适应变换基选择模式是否有效
的判定。
[0237]
尺寸判定部1062判定编码对象块的水平尺寸是否超过第1水平阈值尺寸。此外,尺寸判定部1062判定编码对象块的垂直尺寸是否超过了第1垂直阈值尺寸。第1水平阈值尺寸可以与第1垂直阈值尺寸相同,也可以不同。第1水平阈值尺寸及第1垂直阈值尺寸例如也可以以标准规格预先定义。此外,例如,第1水平阈值尺寸及第1垂直阈值尺寸可以是基于图像决定的尺寸,也可以编码在比特流内。
[0238]
第1变换基选择部1063选择第1变换基。在本发明中,选择基是指除了从多个基的候选中选择至少1个基之外,还包括无多个基的候选而决定或设定至少1个基。
[0239]
在自适应变换基选择模式不是有效的情况下,第1变换基选择部1063选择1个基本变换基作为水平方向及垂直方向的第1变换基。此外,在自适应变换基选择模式有效的情况下,基于编码对象块的水平尺寸及垂直尺寸,第1变换基选择部1063如以下的(1)~(4)那样选择水平方向及垂直方向的第1变换基。
[0240]
(1)在编码对象块的水平尺寸大于第1水平阈值尺寸的情况下,第1变换基选择部1063从1个或者多个变换基的候选中自适应地选择水平方向的第1变换基。
[0241]
(2)在编码对象块的水平尺寸为第1水平阈值尺寸以下的情况下,第1变换基选择部1063将水平方向的固定的变换基选择为水平方向的第1变换基。
[0242]
(3)在编码对象块的垂直尺寸大于第1垂直阈值尺寸的情况下,第1变换基选择部1063从1个或者多个变换基的候选中自适应地选择垂直方向的第1变换基。
[0243]
(4)在编码对象块的垂直尺寸为第1垂直阈值尺寸以下的情况下,第1变换基选择部1063选择垂直方向的固定的变换基作为垂直方向的第1变换基。
[0244]
水平方向的固定的变换基可以与垂直方向的固定的变换基相同,也可以不同。作为水平方向及垂直方向的固定的变换基,例如能够使用类型7的离散正弦变换(dst-vii)的变换基。
[0245]
第1变换部1064使用由第1变换基选择部1063选择的第1变换基,对编码对象块的残差进行第1变换,由此生成第1变换系数。具体而言,第1变换部1064使用水平方向的第1变换基进行水平方向的第1变换,使用垂直方向的第1变换基进行垂直方向的第1变换。
[0246]
第2变换实施判定部1065基于在编码对象块中自适应变换基选择模式是否有效,判定是否实施进一步变换第1变换系数的第2变换。具体而言,第2变换实施判定部1065在自适应变换基选择模式不是有效的情况下实施第2变换,在自适应变换基选择模式有效的情况下判定为不实施第2变换。
[0247]
第2变换基选择部1066在判定为实施第2变换的情况下,选择第2变换基。即,在自适应变换基选择模式不是有效的情况下,第2变换基选择部1066选择第2变换基。相反,在自适应变换基选择模式有效的情况下,第2变换基选择部1066不选择第2变换基。即,在自适应变换基选择模式有效的情况下,第2变换基选择部1066跳过第2变换基的选择。
[0248]
在判定为实施第2变换的情况下,第2变换部1067使用由第2变换基选择部1066选择的第2变换基来变换第1变换系数。即,在自适应变换基选择模式不是有效的情况下,第2变换部1067通过使用第2变换基对第1变换系数进行第2变换来生成第2变换系数。相反,在自适应变换基选择模式有效的情况下,第2变换部1067不对第1变换系数进行第2变换。即,在自适应变换基选择模式有效的情况下,第2变换部1067跳过第2变换。
[0249]
[编码装置的逆变换部的内部结构]
[0250]
接着,参照图11b对有关本方式的编码装置100的逆变换部114的内部结构进行说明。图11b是表示有关实施方式1的第1方式的编码装置100的逆变换部114的内部结构的框图。
[0251]
如图11b所示,有关本方式的逆变换部114具备第2逆变换基选择部1141、第2逆变换部1142、第1逆变换基选择部1143、以及第1逆变换部1144。
[0252]
在自适应变换基选择模式在编码对象块中不是有效的情况下,第2逆变换基选择部1141选择由第2变换基选择部1066选择的第2变换基的逆变换基作为第2逆变换基。
[0253]
在自适应变换基选择模式在编码对象块中不是有效的情况下,第2逆变换部1142通过使用由第2逆变换基选择部1141选择的第2逆变换基对逆量化系数进行第2逆变换,生成第2逆变换系数。逆量化系数意味着由逆量化部112逆量化的系数。
[0254]
第1逆变换基选择部1143选择由第1变换基选择部1063选择的第1变换基的逆变换基作为第1逆变换基。
[0255]
在自适应变换基选择模式在编码对象块中不是有效的情况下,第1逆变换部1144通过使用第1逆变换基对第2逆变换系数进行第1逆变换,重构编码对象块的残差。另一方面,在自适应变换基选择模式在编码对象块中有效的情况下,通过使用第1逆变换基对逆量化系数进行第1逆变换,重构编码对象块的残差。
[0256]
[编码装置的变换部及量化部的处理]
[0257]
接着,与量化部108的处理一起参照图12a对如上构成的变换部106的处理进行说明。图12a是表示有关实施方式1的第1方式的编码装置100的变换部106及量化部108的处理的流程图。
[0258]
变换模式判定部1061判定在编码对象块中自适应变换基选择模式是否有效(s101)。
[0259]
在自适应变换基选择模式不是有效的情况下(s101的“否”),第1变换基选择部1063选择1个基本变换基作为水平方向及垂直方向的第1变换基(s102)。
[0260]
在自适应变换基选择模式有效的情况下(s101的“是”),尺寸判定部1062判定水平方向的变换尺寸是否超过一定范围(s103)。即,尺寸判定部1062判定编码对象块的水平尺寸是否大于第1水平阈值尺寸。
[0261]
在水平方向的变换尺寸超过一定范围的情况下(s103的“是”),第1变换基选择部1063从多个自适应变换基中选择水平方向的变换基作为水平方向的第1变换基(s104)。
[0262]
在水平方向的变换尺寸在一定范围以内的情况下(s103的“否”),第1变换基选择部1063选择固定的变换基作为水平方向的第1变换基(s105)。
[0263]
接着,尺寸判定部1062判定垂直方向的变换尺寸是否超过一定范围(s106)。即,尺寸判定部1062判定编码对象块的垂直尺寸是否大于第1垂直阈值尺寸。
[0264]
在垂直方向的变换尺寸超过一定范围的情况下(s106的“是”),第1变换基选择部1063从多个自适应变换基中选择垂直方向的变换基作为垂直方向的第1变换基(s107)。
[0265]
在垂直方向的变换尺寸在一定范围以内的情况下(s106的“否”),第1变换基选择部1063选择固定的变换基作为垂直方向的第1变换基(s108)。
[0266]
另外,水平方向及垂直方向的变换基的选择顺序可以是水平方向及垂直方向的顺
序,也可以是其相反顺序。另外,也可以同时选择水平方向的变换基和垂直方向的变换基。
[0267]
第1变换部1064使用在步骤s102、s107或步骤s108中选择的第1变换基,对预测残差实施第1变换,生成第1变换系数(s109)。
[0268]
接着,第2变换实施判定部1065判定是否对第1变换系数实施第2变换(s110)。这里,第2变换实施判定部1065基于在编码对象块中自适应变换基选择模式是否有效,判定是否实施第2变换。
[0269]
在自适应变换基选择模式有效的情况下(s110的“是”),第2变换基的选择和第2变换均不实施,量化部108通过实施第1变换系数的量化而生成量化系数(s113)。即,跳过图12a的步骤s111及步骤s112。
[0270]
在自适应变换基选择模式不是有效的情况下(s110的“否”),第2变换基选择部1066从1个或者多个第2变换基的候选中选择第2变换基(s111)。然后,第2变换部1067通过使用选择的第2变换基对第1变换系数实施第2变换,生成第2变换系数(s112)。然后,量化部108通过实施第2变换系数的量化,生成量化系数(s113)。
[0271]
作为上述的基本变换基,能够使用规定的变换基。在此情况下,可以基于水平方向及垂直方向的第1变换基是否为规定的变换基,判定自适应变换基选择模式是否有效。此外,该规定的变换基可以是1个变换基,也可以是2个以上的变换基。
[0272]
另外,在不实施(跳过)第2变换的情况下,可以不实施第2变换,也可以实施与不实施变换等价的变换作为第2变换。在前者中,表示不实施第2变换的信息也可以被编码到比特流内。另外,在后者中,表示与不实施变换等价的变换的信息也可以被编码到比特流内。以下,在跳过各变换的处理中也可以说是同样的。
[0273]
此外,图12a所示的步骤及步骤的顺序等是一例,并不限定于此。例如,如图12b所示,也可以合并图12a的自适应变换基选择模式的判定(s101)和第2变换的实施判定(s110)。图12b是表示有关实施方式1的第1方式的编码装置100的变换部106及量化部108的处理的变形例的流程图。图12b的流程图是与图12a的流程图实质上相等的流程图。
[0274]
在图12b中,删除第2变换的实施判定(s110),将第1变换(s109)分割为2个(s109a、s109b)。在此情况下,编码装置100的变换部106也可以不具备第2变换实施判定部1065。
[0275]
关于逆变换部114中的第2逆变换基的选择及第2逆变换、以及第1逆变换基的选择及第1逆变换,只要按照图12a的变换部106的变换来实施即可,所以省略说明及图示。
[0276]
另外,第1变换可以是如非专利文献2所记载的emt那样的能够自适应地选择变换基的频率变换,也可以是在一定的条件下切换变换基的频率变换,还可以是其他一般的变换。例如,也可以取代选择第1变换基而设定固定的变换基。另外,也可以使用与不实施第1变换等价的第1变换基。此外,在第1变换中,可以使用表示自适应变换基选择模式和使用固定的基本变换基(例如,类型2的离散余弦变换(dct-ii)的变换基)的变换基固定模式中的哪一个有效的识别信息来选择2个模式中的任一个。在此情况下,根据识别信息,也能够判断自适应变换基选择模式和变换基固定模式中的哪一个在编码对象块中有效。例如,在非专利文献2所记载的emt中,由于存在以cu(coding unit:编码单位)等为单位表示自适应变换基选择模式是否有效的识别信息(emt_cu_flag),因此能够使用该识别信息来判定在编码对象块中自适应变换基选择模式是否有效。
[0277]
另外,第2变换可以是非专利文献2所记载的nsst那样的2次变换处理,也可以是在
一定的条件下切换变换基的变换,还可以是其他一般的变换。例如,也可以取代选择第2变换基而设定固定的变换基。另外,也可以使用与不实施第2变换等价的第2变换基。另外,nsst可以是dct或者dst后的频率空间变换,例如,表现针对离线取得的dct或者dst的变换系数的klt(karhunen loveve transform:卡洛南-洛伊变换)或与klt同等的基,也可以是通过旋转变换的组合来表现的hygt(hypercube-givens transform:超立方体-吉文斯变换)。
[0278]
此外,本处理也能够应用于亮度信号和色差信号的任一个,只要输入信号是rgb形式,则也可以应用于r、g、b的各信号。进而,在亮度信号和色差信号中,在第1变换或第2变换中可选择的基也可以不同。例如,由于亮度信号的频带比色差信号宽,所以为了进行最佳的变换,在亮度信号的第1变换或第2变换中,也可以使用比色差更多的种类的基作为选择候选。另外,本处理在帧内处理和帧间处理的任一个中都能够应用。
[0279]
[效果等]
[0280]
在非专利文献2所记载的第1变换(一次变换)及第2变换(二次变换)中,选择最佳的变换基或者变换系数(滤波器),实现总计最佳的编码效率。因此,为了搜索在第1变换及第2变换中使用的变换基及变换系数(滤波器)的候选的最佳组合,需要多次试行第1变换及第2变换。即,在非专利文献2所记载的变换方法中,需要针对第1变换的变换基的候选和第2变换的变换基的候选的全部组合计算评价值,选择评价值最小的组合。因此,本发明人发现,在非专利文献2所记载的变换方法中,处理量变得庞大。
[0281]
因此,有关本方式的编码装置100并非始终进行第1变换和第2变换双方,而是基于自适应变换基选择模式是否有效而跳过第2变换。由此,编码装置100能够削减第1变换的变换基的候选和第2变换的变换基的候选的组合的数量,能够减少处理量。
[0282]
此外,根据有关本方式的编码装置100,能够基于水平方向及垂直方向的变换尺寸的条件来限定第1变换基的候选。由此,能够减少通过试行来搜索最佳的第1变换基的处理量。此外,基于在第1变换基中选择的基等的条件,能够减少通过试行搜索最佳的第2变换基的处理。此外,可以减少有关第1变换和第2变换的组合的试行的处理量。
[0283]
作为一例,作为基本变换基,能够使用dct-ii的变换基。dct-ii在残差形状平坦时被采用或随机被采用的可能性高,例如如果使用dct-ii作为第1变换基,则存在由于有向低频的汇集度提高的倾向所以第2变换的效果提高的可能性。另一方面,在dct-ii以外的变换基中,高频成分容易残留,存在第2变换的效果降低的可能性。
[0284]
另外,作为一例,作为在变换尺寸在一定范围内的情况下选择的固定变换基,能够使用dst-vii变换基。特别是,如果是帧内处理,则dst-vii具有在残差形状倾斜且尺寸小的情况下以非常高的概率被选择的倾向。
[0285]
另外,作为基本变换基,不限于1个规定的变换基,也可以使用多个规定的变换基。
[0286]
另外,是否实施第2变换基的选择和第2变换可以根据变换尺寸来切换。此外,第2变换基的候选也可以根据变换尺寸来切换。
[0287]
另外,也可以构成为仅基于自适应变换基选择模式是否有效来切换是否实施第2变换,不进行与变换尺寸相应的第1变换基的切换。即,在图12a中,也可以删除步骤s103、s105、s106以及步骤s108。这里,也可以基于表示该模式的使用的识别信息、或者第1变换基的类型来判定自适应变换基选择模式是否有效。
[0288]
同样地,也可以构成为不进行基于自适应变换基选择模式是否有效的第2变换实施与否的切换,而仅进行与变换尺寸相应的第1变换基的切换。即,在图12a中,也可以删除步骤s110。
[0289]
此外,也可以与自适应变换基选择模式是否有效无关地,不跳过第2变换基的选择及第2变换。另外,也可以与第1变换基的选择方法无关地,在自适应变换基选择模式不是有效的情况下,实施第2变换基的选择及第2变换,在自适应变换基选择模式有效的情况下,跳过第2变换基的选择及第2变换。
[0290]
另外,作为是从多个自适应变换基中选择候选作为第1变换基还是选择固定变换基的、水平方向或垂直方向的具体的变换尺寸的阈值(即,第1水平阈值尺寸及第1垂直阈值尺寸),也可以使用4、8、16、32或者64像素等。
[0291]
[与其他方式的组合]
[0292]
也可以将本方式与本发明中的其他方式的至少一部分组合来实施。此外,也可以将本方式的流程图所记载的一部分处理、装置的一部分结构、语法的一部分等与其他方式组合来实施。
[0293]
(实施方式1的第2方式)
[0294]
接着,对实施方式1的第2方式进行说明。在本方式中,对与第1方式中的第1变换及第2变换有关的各种信号的编码的一例进行说明。以下,以与第1方式不同的点为中心,参照附图对本方式进行具体说明。
[0295]
另外,有关本方式的编码装置100的变换部106及逆变换部114的内部结构与第1方式同样,因此省略图示。
[0296]
[编码装置的变换部、量化部以及熵编码部的处理]
[0297]
参照图13a及图13b,对有关本方式的编码装置100的变换部106、量化部108以及熵编码部110的处理进行说明。图13a是表示有关实施方式1的第2方式的编码装置100的变换部106及量化部108的处理的流程图。图13b是表示有关实施方式1的第2方式的编码装置100的熵编码部110的处理的流程图。在图13a及图13b中,对与第1方式共用的处理标注相同的标号并省略说明。
[0298]
在实施了量化后(s113),熵编码部110对自适应变换基选择模式信号进行编码(s201)。自适应变换基选择模式信号是自适应变换基选择模式的识别信息的一例。
[0299]
然后,如果自适应变换基选择模式有效(s202的“是”),则在水平方向的变换尺寸超过一定范围的情况下(s203的“是”),熵编码部110对水平方向的第1基选择信号进行编码(s204)。另一方面,在水平方向的变换尺寸在一定范围以内的情况下(s203的“否”),熵编码部110不对水平方向的第1基选择信号进行编码。进而,在垂直方向的变换尺寸超过一定范围的情况下(s205的“是”),熵编码部110对垂直方向的第1基选择信号进行编码(s206)。另一方面,在垂直方向的变换尺寸在一定范围以内的情况下(s205的“否”),熵编码部110不对垂直方向的第1基选择信号进行编码。
[0300]
在自适应变换基选择模式不是有效的情况下(s202的“否”),跳过第1基选择信号的编码(s204、s206)。
[0301]
接着,熵编码部110对量化系数进行编码(s207)。
[0302]
这里,在自适应变换基选择模式不是有效的情况下(s208的“否”),熵编码部110对
vii变换基被用作水平方向的第1变换基的候选,并且dst-vii变换基及其他变换基被用作垂直方向的第1变换基的候选。此时,虽然水平方向的第1基选择信号(emt_horizontal_tridx)不被编码,但垂直方向的第1基选择信号(emt_vertical_tridx)被编码。
[0315]
此外,例如,在水平尺寸h大于4像素且垂直尺寸v为4像素以下的情况下,dst-vii变换基及其他变换基被用作水平方向的第1变换基的候选,并且仅dst-vii变换基被用作垂直方向的第1变换基的候选。此时,水平方向的第1基选择信号(emt_horizontal_tridx)被编码,但垂直方向的第1基选择信号(emt_vertical_tridx)不被编码。
[0316]
此外,例如,在水平尺寸h大于4像素且垂直尺寸v大于4像素的情况下,dst-vii变换基和其他变换基被用作水平方向及垂直方向的第1变换基的候选。此时,水平方向及垂直方向的第1基选择信号(emt_horizontal_tridx和emt_vertical_tridx)被编码。
[0317]
[效果等]
[0318]
如上所述,根据有关本方式的编码装置100,能够仅在自适应变换基选择模式有效且变换尺寸超过一定范围的情况下,对表示第1变换基的信息(第1基选择信号)进行编码,存在能够削减第1变换基的信号化(signaling)所需的码量的可能性。此外,能够仅在自适应变换基选择模式不是有效的情况下,对表示第2变换基的信息(第2基选择信号)进行编码,存在能够削减第2变换基的信号化所需的码量的可能性。此外,通过在表示第2变换基的信息之前对用于判定是否跳过第2变换的信息(自适应变换基选择模式信号等)进行编码,能够在解码时判断表示第2变换基的信息是否被编码了。
[0319]
另外,也可以与自适应变换基选择模式无关地,始终实施第2基选择信号的编码。此外,也可以与变换尺寸无关地,如果是自适应变换基选择模式则始终实施第1基选择信号的编码。此外,可以利用水平方向的尺寸和垂直方向的尺寸来独立地判断第1基选择信号的编码的有无,也可以组合进行判断。
[0320]
[与其他方式的组合]
[0321]
也可以将本方式与本发明中的其他方式的至少一部分组合来实施。此外,也可以将本方式的流程图所记载的一部分处理、装置的一部分结构、语法的一部分等与其他方式组合来实施。
[0322]
(实施方式1的第3方式)
[0323]
接着,对实施方式1的第3方式进行说明。在本方式中,与上述第1方式的不同之处在于,在自适应变换基选择模式不是有效的情况下,根据编码对象块的尺寸,不同的基本变换基被用作第1变换基。以下,以与第1方式及第2方式不同的点为中心,参照附图对本方式进行具体说明。
[0324]
另外,有关本方式的编码装置100的变换部106及逆变换部114的内部结构与第1方式同样,因此省略图示。
[0325]
[编码装置的变换部及量化部的处理]
[0326]
参照图16对有关本方式的编码装置100的变换部106及量化部108的处理进行说明。图16是表示有关实施方式1的第3方式的编码装置100的变换部106及量化部108的处理的流程图。在图16中,对与第1方式共用的处理标注相同的标号并省略说明。
[0327]
在自适应变换基选择模式不是有效的情况下(s101的“否”),尺寸判定部1062判定变换尺寸是否在一定范围以内(s301)。即,尺寸判定部1062判定编码对象块的尺寸是否为
第2阈值尺寸以下。例如,尺寸判定部1062判定编码对象块的水平尺寸与垂直尺寸之积是否为阈值以下,从而判定编码对象块的尺寸是否为第2阈值尺寸以下。
[0328]
这里,在变换尺寸在一定范围以内的情况下(s301的“是”),第1变换基选择部1063选择第2基本变换基作为水平方向及垂直方向的第1变换基(s302)。另一方面,在变换尺寸超过一定范围的情况下(s301的“否”),第1变换基选择部1063选择第1基本变换基作为水平方向及垂直方向的第1变换基(s303)。
[0329]
作为一例,作为第1基本变换基,能够使用dct-ii的变换基,作为第2基本变换基,能够使用dst-vii变换基。
[0330]
另外,基本变换基也可以从多个基本变换基的候选中选择。
[0331]
此外,也可以与自适应变换基选择模式是否有效无关地,不跳过第2变换基的选择及第2变换。另外,也可以与第1变换基的选择方法无关地,在自适应变换基选择模式不是有效的情况下,实施第2变换基的选择及第2变换,在自适应变换基选择模式有效的情况下,跳过第2变换基的选择及第2变换。
[0332]
另外,在自适应变换基选择模式不是有效的情况下,作为用于选择第1基本变换基以及第2基本变换基的一方的第2阈值尺寸,例如能够使用4x4、4x8、8x4、8x8像素尺寸等。另外,作为与阈值进行比较的变换尺寸,可以如本方式那样使用编码对象块的水平尺寸与垂直尺寸之积,也可以分别使用水平尺寸及垂直尺寸。
[0333]
此外,在自适应变换基选择模式不是有效的情况下,如果水平尺寸及垂直尺寸之积在一定范围以内,则也可以选择第2基本变换基作为水平方向及垂直方向的第1变换基,跳过第2变换基的选择及第2变换。
[0334]
[效果等]
[0335]
如上所述,根据有关本方式的编码装置100,在自适应变换基选择模式不是有效的情况下,能够根据变换尺寸在第1基本变换基与第2基本变换基之间切换第1变换基。因此,能够使用与变换尺寸对应的第1变换基来进行第1变换,能够实现码量的削减。
[0336]
[与其他方式的组合]
[0337]
也可以将本方式与本发明中的其他方式的至少一部分组合来实施。此外,也可以将本方式的流程图所记载的一部分处理、装置的一部分结构、语法的一部分等与其他方式组合来实施。
[0338]
(实施方式1的第4方式)
[0339]
接着,对实施方式1的第4方式进行说明。在本方式中,对有关第3方式的第1变换及第2变换的各种信号的编码的一例进行说明。以下,以与第1~第3方式不同的点为中心,参照附图对本方式进行具体说明。
[0340]
另外,有关本方式的编码装置100的变换部106及逆变换部114的内部结构与第1方式同样,因此省略图示。
[0341]
[编码装置的变换部、量化部以及熵编码部的处理]
[0342]
参照图17a及图17b,对有关本方式的编码装置100的变换部106、量化部108以及熵编码部110的处理进行说明。图17a是表示有关实施方式1的第4方式的编码装置100的变换部106及量化部108的处理的流程图。图17b是表示有关实施方式1的第4方式的编码装置100的熵编码部110的处理的流程图。在图17a及图17b中,对于与第1~第三方式中的任一个共
用的处理,标注相同的标号并省略说明。
[0343]
在实施了量化后(s113),熵编码部110判定是否跳过自适应变换基选择模式信号的编码(s401)。例如,在满足以下(a)及(b)中的任一个条件的情况下,熵编码部110判定为跳过自适应变换基选择模式信号的编码,否则,熵编码部110判定为不跳过自适应变换基选择模式信号的编码。
[0344]
(a)自适应变换基选择模式不是有效。
[0345]
(b)自适应变换基选择模式有效,且满足以下的(b1)~(b4)的全部条件。
[0346]
(b1)变换尺寸为步骤s301中使用的第2阈值尺寸w1xh1以下。
[0347]
(b2)水平方向的变换尺寸为步骤s103中使用的第1水平阈值尺寸w2以下。
[0348]
(b3)垂直方向的变换尺寸为步骤s106中使用的第1垂直阈值尺寸h2以下。
[0349]
(b4)第2基本变换基和水平方向及垂直方向的固定变换基是同一变换基。
[0350]
作为具体例,在第2阈值尺寸w1xh1为4
×
4像素、第1水平阈值尺寸w2为4像素、第1垂直阈值尺寸h2为4像素、第2基本变换基及固定变换基都是dst-vii变换基的情况下,如果变换尺寸为4
×
4像素以下,则熵编码部110判定为跳过自适应变换基选择模式信号的编码。
[0351]
相反,在不满足上述的(a)及(b)中的任一个条件的情况下,熵编码部110判定为不跳过自适应变换基选择模式信号的编码。
[0352]
这里,在判定为跳过自适应变换基选择模式信号的编码的情况下(s401的“是”),熵编码部110跳过步骤s201~步骤s206,对量化系数进行编码(s207)。另一方面,在判定为不跳过自适应变换基选择模式信号的编码的情况下(s401的“否”),熵编码部110与第2方式同样地,执行步骤s201~步骤s206后,对量化系数进行编码(s207)。
[0353]
此外,也可以预先设定各个编码的顺序,以与上述编码的顺序不同的方式对各种信号进行编码。
[0354]
[语法]
[0355]
这里,对本方式中的语法进行说明。图18表示有关实施方式1的第4方式中的语法的具体例。
[0356]
在图18中,例如,在跳过自适应变换基选择模式信号的编码的情况下(第20行),跳过自适应变换基选择模式信号(emt_cu_flag)及第1基选择信号(emt_horizontal_tridx及emt_vertical_tridx)的编码(第21行)。这里,在水平方向的变换尺寸(horizontal_tu_size)为第1水平阈值尺寸(horizontal_tu_size_th)以下且垂直方向的变换尺寸(vertical_tu_size)为第1垂直阈值尺寸(vertical_tu_size_th)以下的情况下,跳过自适应变换基选择模式信号的编码。在不跳过自适应变换基选择模式信号的编码的情况下(第3~4行),自适应变换基选择模式信号(emt_cu_flag)被编码(第5行),与第2方式同样地,第1基选择信号(emt_horizontal_tridx及emt_vertical_tridx)根据需要被编码(第7~16行)。
[0357]
此外,在跳过自适应变换基选择模式信号的编码的情况下,也可以跳过第2变换基的选择及第2变换。
[0358]
[变换基及编码信号的具体例]
[0359]
接着,对变换基及编码信号的具体例进行说明。图19表示在实施方式1的第4方式中使用的变换基和信号的编码的有无的具体例。在图19中,编码对象块的水平尺寸及垂直
尺寸均为4像素以下的情况下的变换基及编码的有无与图15不同。以与图15不同的点为中心对图19进行说明。
[0360]
在图19中,在自适应变换基选择模式不是有效的情况下,如果编码对象块的水平尺寸h及垂直尺寸v均为4像素以下,则不是dct-ii的变换基而是dst-vii变换基被用作水平方向及垂直方向的第1变换基。
[0361]
此外,在自适应变换基选择模式有效的情况下,如果编码对象块的水平尺寸h及垂直尺寸v均为4像素以下,则自适应变换基选择模式信号(emt_cu_flag)不被编码。
[0362]
[效果等]
[0363]
如上所述,根据有关本方式的编码装置100,在满足跳过自适应变换基选择模式信号的编码的条件的情况下,能够省略自适应变换基选择模式信号及第1基选择信号的全部的编码,存在能够削减码量的可能性。
[0364]
[与其他方式的组合]
[0365]
也可以将本方式与本发明中的其他方式的至少一部分组合来实施。此外,也可以将本方式的流程图所记载的一部分处理、装置的一部分结构、语法的一部分等与其他方式组合来实施。
[0366]
(实施方式1的第5方式)
[0367]
接着,对实施方式1的第5方式进行说明。在本方式中,对解码装置进行说明。另外,有关本方式的解码装置对应于上述第1方式的编码装置。即,有关本方式的解码装置能够对由上述第1方式的编码装置编码后的比特流进行解码。以下,参照附图对本方式进行具体说明。
[0368]
[解码装置的变换部及逆变换部的内部配置]
[0369]
首先,对有关本方式的解码装置200的逆变换部206的内部结构进行说明。图20是表示有关实施方式1的第5方式的解码装置200的逆变换部206的内部结构的框图。
[0370]
如图20所示,有关本方式的逆变换部206具备第2逆变换实施判定部2061、第2逆变换基选择部2062、第2逆变换部2063、变换模式判定部2064、尺寸判定部2065、第1逆变换基选择部2066、以及第1逆变换部2067。
[0371]
第2逆变换实施判定部2061基于在解码对象块中自适应变换基选择模式是否有效,判定是否对从逆量化部204输出的解码对象块的逆量化系数实施第2逆变换。具体而言,第2逆变换实施判定部2061在自适应变换基选择模式不是有效的情况下实施第2逆变换,在自适应变换基选择模式有效的情况下判定为不实施第2逆变换。
[0372]
在判定为实施第2逆变换的情况下,第2逆变换基选择部2062选择第2逆变换基。具体而言,在自适应变换基选择模式不是有效的情况下,第2逆变换基选择部2062取得由熵解码部202从比特流内解码后的、表示第2逆变换基的第2基选择信号2062s。然后,第2逆变换基选择部2062基于第2基选择信号2062s,选择第2逆变换基。相反,在自适应变换基选择模式有效的情况下,第2逆变换基选择部2062不选择第2逆变换基。即,在自适应变换基选择模式有效的情况下,第2逆变换基选择部2062跳过第2逆变换基的选择。
[0373]
在判定为实施第2逆变换的情况下,第2逆变换部2063使用由第2逆变换基选择部2062选择的第2逆变换基,对解码对象块的逆量化系数进行第2逆变换。即,在自适应变换基选择模式不是有效的情况下,第2逆变换部2063通过使用第2逆变换基对逆量化系数进行第
2逆变换,生成第2逆变换系数。相反,在自适应变换基选择模式有效的情况下,第2逆变换部2063不对逆量化系数进行第2逆变换。即,在自适应变换基选择模式有效的情况下,第2逆变换部2063跳过第2逆变换。
[0374]
变换模式判定部2064判定自适应变换基选择模式是否在解码对象块中有效。基于由熵解码部202从比特流内解码的、第1基选择信号2066s或自适应变换基选择模式信号2064s来进行自适应变换基选择模式是否有效的判定。即,基于第1逆变换基或者自适应变换基选择模式的识别信息来进行判定。
[0375]
尺寸判定部2065判定解码对象块的水平尺寸是否超过第1水平阈值尺寸。另外,尺寸判定部1062判定解码对象块的垂直尺寸是否超过了第1垂直阈值尺寸。基于由熵解码部202从比特流内解码的尺寸信号2065s来进行水平尺寸及垂直尺寸的判定。
[0376]
第1逆变换基选择部2066选择第1逆变换基。具体而言,在自适应变换基选择模式不是有效的情况下,第1逆变换基选择部2066选择1个基本变换基作为水平方向及垂直方向的第1逆变换基。另外,在自适应变换基选择模式有效的情况下,第1逆变换基选择部2066基于解码对象块的水平尺寸及垂直尺寸,如以下的(1)~(4)那样选择水平方向及垂直方向的第1逆变换基。
[0377]
(1)在解码对象块的水平尺寸比第1水平阈值尺寸大的情况下,第1逆变换基选择部2066取得由熵解码部202从比特流内解码后的、表示第1逆变换基的第1基选择信号2066s。然后,第1逆变换基选择部2066基于第1基选择信号2066s,选择水平方向的第1逆变换基。
[0378]
(2)在解码对象块的水平尺寸为第1水平阈值尺寸以下的情况下,第1逆变换基选择部2066选择水平方向的固定的变换基作为水平方向的第1逆变换基。
[0379]
(3)在解码对象块的垂直尺寸大于第1垂直阈值尺寸的情况下,第1逆变换基选择部2066取得第1基选择信号2066s。然后,第1逆变换基选择部2066基于第1基选择信号2066s,选择垂直方向的第1逆变换基。
[0380]
(4)在解码对象块的垂直尺寸为第1垂直阈值尺寸以下的情况下,第1逆变换基选择部2066选择垂直方向的固定的变换基作为垂直方向的第1逆变换基。
[0381]
第1逆变换部2067通过使用由第1逆变换基选择部2066选择的第1逆变换基,对解码对象块的逆量化系数进行第1逆变换,由此,复原解码对象块的残差。具体而言,第1逆变换部2067使用水平方向的第1逆变换基进行水平方向的第1逆变换,使用垂直方向的第1逆变换基进行垂直方向的第1逆变换。
[0382]
[解码装置的逆量化部及逆变换部的处理]
[0383]
接着,与逆量化部204的处理一起参照图21说明如上构成的逆变换部206的处理。图21是表示有关实施方式1的第5方式的解码装置200的逆量化部204及逆变换部206的处理的流程图。
[0384]
逆量化部204通过对由熵解码部202解码后的解码对象块的量化系数进行逆量化,生成逆量化系数(s501)。
[0385]
第2逆变换实施判定部2061判定是否对逆量化系数实施第2逆变换(s502)。这里,第2逆变换实施判定部2061基于在解码对象块中自适应变换基选择模式是否有效,判定是否实施第2逆变换。
[0386]
这里,在自适应变换基选择模式有效的情况下(s502的“是”),第2逆变换基的选择和第2逆变换均不被实施。即,跳过步骤s503及步骤s504。
[0387]
另一方面,在自适应变换基选择模式不是有效的情况下(s502的“否”),第2逆变换基选择部2062基于第2基选择信号2062s,选择第2逆变换基(s503)。进而,第2逆变换部2063使用选择的第2逆变换基,对逆量化系数实施第2逆变换(s504)。
[0388]
接着,变换模式判定部2064判定在解码对象块中自适应变换基选择模式是否有效(s505)。例如,变换模式判定部2064基于自适应变换基选择模式信号2064s,判定自适应变换基选择模式是否有效。
[0389]
在自适应变换基选择模式不是有效的情况下(s505的“否”),第1逆变换基选择部2066选择1个基本变换基作为水平方向及垂直方向的第1逆变换基(s512)。另一方面,在自适应变换基选择模式有效的情况下(s505的“是”),尺寸判定部2065判定水平方向的变换尺寸是否超过一定范围(s506)。即,尺寸判定部2065判定解码对象块的水平尺寸是否大于第1水平阈值尺寸。
[0390]
在水平方向的变换尺寸超过一定范围的情况下(s506的“是”),第1逆变换基选择部2066作为水平方向的第1逆变换基,从多个自适应变换基中选择水平方向的变换基(s507)。另一方面,在水平方向的变换尺寸在一定范围以内的情况下(s506的“否”),第1逆变换基选择部2066选择固定的变换基作为水平方向的第1逆变换基(s508)。
[0391]
尺寸判定部2065判定垂直方向的变换尺寸是否超过一定范围(s509)。即,尺寸判定部2065判定解码对象块的垂直尺寸是否大于第1垂直阈值尺寸。
[0392]
在垂直方向的变换尺寸超过一定范围的情况下(s509的“是”),第1逆变换基选择部2066作为垂直方向的第1逆变换基,从多个自适应变换基中选择变换基(s510)。在垂直方向的变换尺寸在一定范围以内的情况下(s509的“否”),第1逆变换基选择部2066选择固定的变换基作为垂直方向的第1逆变换基(s511)。
[0393]
第1逆变换部2067通过使用如上选择的第1逆变换基对逆量化系数或第2逆变换系数进行第1逆变换,复原解码对象块的残差(s513)。
[0394]
另外,水平方向及垂直方向的逆变换基的选择顺序可以是水平方向及垂直方向的顺序,也可以是其相反顺序。另外,也可以同时选择水平方向的逆变换基和垂直方向的逆变换基。
[0395]
此外,在解码装置200中选择逆变换基,意味着对表示在编码比特流内包含的逆变换中使用的基的信息进行解码,基于解码后的信息来决定逆变换基,或者基于帧内预测模式、解码对象块尺寸、或者第1逆变换中的基等信息来决定唯一地表示的逆变换基。
[0396]
另外,也可以采用匹配于图12a或图12b所示的第1方式的编码方法的解码方法。
[0397]
[效果等]
[0398]
如上所述,根据有关本方式的解码装置200,能够起到与有关第1方式的编码装置100同样的效果。
[0399]
[与其他方式的组合]
[0400]
也可以将本方式与本发明中的其他方式的至少一部分组合来实施。此外,也可以将本方式的流程图所记载的一部分处理、装置的一部分结构、语法的一部分等与其他方式组合来实施。
[0401]
(实施方式1的第6方式)
[0402]
接着,对实施方式1的第6方式进行说明。在本方式中,对第5方式中的与第1变换及第2变换有关的各种信号的解码的一例进行说明。另外,有关本方式的解码装置对应于上述第2方式的编码装置。以下,以与第5方式不同的点为中心,参照附图对本方式进行具体说明。
[0403]
另外,有关本方式的解码装置200的逆变换部206的内部结构与第5方式同样,因此省略图示。
[0404]
[解码装置的熵解码部、逆量化部以及逆变换部的处理]
[0405]
参照图22a及图22b,对有关本方式的解码装置200的熵解码部202、逆量化部204以及逆变换部206的处理进行说明。在图22a及图22b中,对与第5方式共用的处理标注相同的标号并省略说明。
[0406]
首先,熵解码部202从比特流解码自适应变换基选择模式信号(s601)。然后,变换模式判定部2064基于自适应变换基选择模式信号,判定在解码对象块中自适应变换基选择模式是否有效(s602)。
[0407]
如果自适应变换基选择模式有效(s602的“是”),则在水平方向的变换尺寸超过一定范围的情况下(s603的“是”),熵解码部202从比特流解码水平方向的第1基选择信号(s604)。另一方面,在水平方向的变换尺寸在一定范围以内的情况下(s603的“否”),熵解码部202不对水平方向的第1基选择信号进行解码。进而,在垂直方向的变换尺寸超过一定范围的情况下(s605的“是”),熵解码部202从比特流解码垂直方向的第1基选择信号(s606)。另一方面,在垂直方向的变换尺寸在一定范围以内的情况下(s605的“否”),熵解码部202不对垂直方向的第1基选择信号进行解码。
[0408]
在自适应变换基选择模式不是有效的情况下(s602的“否”),跳过第1基选择信号的解码(s604、s606)。
[0409]
接着,熵解码部202对量化系数进行解码(s607)。
[0410]
这里,在自适应变换基选择模式不是有效的情况下(s608的“否”),熵解码部202从比特流内解码第2基选择信号(s609)。另一方面,在自适应变换基选择模式有效的情况下(s608的“是”),跳过第2基选择信号的解码(s609)。
[0411]
此外,也可以与编码方法相匹配地,预先设定各自的解码的顺序,以与上述解码的顺序不同的方式对各种信号进行解码。另外,在不实施(跳过)第2逆变换的情况下,熵解码部202可以从比特流解码表示不实施第2逆变换的信号,也可以从比特流解码用于选择与不变换等价的第2逆变换基的信号。
[0412]
另外,也可以采用匹配于图13a、图13b以及图14所示的第2方式的编码方法的解码方法。
[0413]
[效果等]
[0414]
如上所述,根据有关本方式的解码装置200,能够起到与有关第2方式的编码装置100同样的效果。
[0415]
[与其他方式的组合]
[0416]
也可以将本方式与本发明中的其他方式的至少一部分组合来实施。此外,也可以将本方式的流程图所记载的一部分处理、装置的一部分结构、语法的一部分等与其他方式
组合来实施。
[0417]
(实施方式1的第7方式)
[0418]
接着,对实施方式1的第7方式进行说明。在本方式中,与上述第5方式的不同之处在于,在自适应变换基选择模式不是有效的情况下,根据编码对象块的尺寸而使用不同的基本变换基作为第1逆变换基。另外,有关本方式的解码装置对应于上述第3方式的编码装置。以下,以与第5方式及第6方式不同的点为中心,参照附图对本方式进行具体说明。
[0419]
另外,有关本方式的解码装置200的逆变换部206的内部结构与第5方式同样,因此省略图示。
[0420]
[解码装置的逆量化部及逆变换部的处理]
[0421]
参照图23对有关本方式的编码装置100的变换部106和量化部108的处理进行说明。图23是表示有关实施方式1的第7方式的解码装置200的逆量化部204以及逆变换部206的处理的流程图。在图23中,对与第5方式共用的处理标注相同的标号并省略说明。
[0422]
在自适应变换基选择模式不是有效的情况下(s505的“否”),尺寸判定部2065判定变换尺寸是否在一定范围以内(s701)。即,尺寸判定部2065判定解码对象块的水平尺寸及垂直尺寸是否为第2阈值尺寸以下。具体而言,尺寸判定部2065例如判定解码对象块的水平尺寸与垂直尺寸之积是否为阈值以下。
[0423]
这里,在变换尺寸在一定范围以内的情况下(s701的“是”),第1逆变换基选择部2066选择第2基本变换基作为水平方向及垂直方向的第1逆变换基(s702)。另一方面,在变换尺寸超过一定范围的情况下(s701的“否”),第1逆变换基选择部2066选择第1基本变换基作为水平方向及垂直方向的第1逆变换基(s703)。
[0424]
另外,也可以采用匹配于图16所示的第3方式的编码方法的解码方法。
[0425]
[效果等]
[0426]
如上所述,根据有关本方式的解码装置200,能够起到与有关第3方式的编码装置100同样的效果。
[0427]
[与其他方式的组合]
[0428]
也可以将本方式与本发明中的其他方式的至少一部分组合来实施。此外,也可以将本方式的流程图所记载的一部分处理、装置的一部分结构、语法的一部分等与其他方式组合来实施。
[0429]
(实施方式1的第8方式)
[0430]
接着,对实施方式1的第8方式进行说明。在本方式中,对第7方式中的与第1变换及第2变换有关的各种信号的解码的一例进行说明。另外,有关本方式的解码装置对应于上述第4方式的编码装置。以下,以与第5~第7方式不同的点为中心,参照附图对本方式进行具体说明。
[0431]
另外,有关本方式的解码装置200的逆变换部206的内部结构与第5方式同样,因此省略图示。
[0432]
[解码装置的熵解码部、逆量化部以及逆变换部的处理]
[0433]
参照图24a及图24b对有关本方式的解码装置200的熵解码部202、逆量化部204以及逆变换部206的处理进行说明。在图24a及图24b中,对于与第5~第7方式中的任一个共用的处理,标注相同的标号并省略说明。
[0434]
熵解码部202判定是否跳过自适应变换基选择模式信号的解码(s801)。例如,在满足以下的(a)及(b)中的任一个条件的情况下,熵解码部202判定为跳过自适应变换基选择模式信号的解码,否则,熵解码部202判定为不跳过自适应变换基选择模式信号的解码。
[0435]
(a)自适应变换基选择模式不是有效。
[0436]
(b)自适应变换基选择模式有效,且满足以下的(b1)~(b4)的全部条件。
[0437]
(b1)变换尺寸为步骤s701中使用的第2阈值尺寸w1xh1以下。
[0438]
(b2)水平方向的变换尺寸为步骤s506中使用的第1水平阈值尺寸w2以下。
[0439]
(b3)垂直方向的变换尺寸为步骤s509中使用的第1垂直阈值尺寸h2以下。
[0440]
(b4)第2基本变换基和水平方向及垂直方向的固定变换基是同一变换基。
[0441]
作为具体例,在第2阈值尺寸w1xh1为4
×
4像素、第1水平阈值尺寸w2为4像素、第1垂直阈值尺寸h2为4像素、第2基本变换基及固定变换基都是dst-vii变换基的情况下,如果变换尺寸为4
×
4像素以下,则熵解码部202判定为跳过自适应变换基选择模式信号的解码。
[0442]
相反,在上述的(a)及(b)中的任一个条件都不满足的情况下,熵解码部202判定为不跳过自适应变换基选择模式信号的解码。
[0443]
这里,在判定为跳过自适应变换基选择模式信号的解码的情况下(s801的“是”),熵解码部202跳过步骤s601~步骤s606,对量化系数进行解码(s607)。另一方面,在判定为不跳过自适应变换基选择模式信号的解码的情况下(s801的“否”),熵解码部202与第6方式同样地,执行步骤s601~步骤s606后,对量化系数进行解码(s207)。
[0444]
另外,也可以采用匹配于图17a、图17b以及图18所示的第4方式的编码方法的解码方法。
[0445]
[效果等]
[0446]
如上所述,根据有关本方式的解码装置200,能够起到与有关第4方式的编码装置100同样的效果。
[0447]
[与其他方式的组合]
[0448]
也可以将本方式与本发明中的其他方式的至少一部分组合来实施。此外,也可以将本方式的流程图所记载的一部分处理、装置的一部分结构、语法的一部分等与其他方式组合来实施。
[0449]
(实施方式1的各方式的变形例)
[0450]
另外,也可以对表示第1~第8方式中的任一项所记载的处理的一部分或全部是否有效的信号进行编码及解码。这样的信号可以按cu(coding unit)或ctu(coding tree unit:编码树单元)为单位进行编码,也可以以相当于h.265/hevc标准的sps(sequence parameter set:序列参数集)、pps(picture parameter set:图片参数集)或切片单位进行编码。
[0451]
基于图片类型(i、p、b)、切片类型(i、p、b)、变换尺寸(4
×
4像素、8x8像素或其他)、非零系数的数量、量化参数、temporal_id(分级编码的层)或者它们的任意组合,可以跳过第1变换基的选择及第1变换,也可以跳过第2变换基的选择及第2变换。
[0452]
在有关第1~第4方式的编码装置进行以上那样的动作的情况下,有关第5~第8方式的解码装置也进行对应的动作。例如,在编码装置对表示是否使跳过第1变换或者第2变换的处理有效的信息进行编码的情况下,解码装置对该信息进行解码,判定第1变换或者第
2变换是否有效以及表示第1变换或者第2变换的信息是否被编码。
[0453]
(实施方式2)
[0454]
在以上的各实施方式中,各个功能块通常可以通过mpu及存储器等实现。此外,各个功能块的处理通常通过由处理器等程序执行部将记录在rom等记录介质中的软件(程序)读出并执行来实现。该软件既可以通过下载等来分发,也可以记录到半导体存储器等记录介质中来分发。另外,当然也能够通过硬件(专用电路)实现各功能块。
[0455]
此外,在各实施方式中说明的处理既可以通过使用单一的装置(系统)集中处理来实现,或者也可以通过使用多个装置进行分散处理来实现。此外,执行上述程序的处理器既可以是单个,也可以是多个。即,既可以进行集中处理,也可以进行分散处理。
[0456]
本发明的形态并不限定于以上的实施例,能够进行各种各样的变更,它们也包含在本发明的形态的范围内。
[0457]
进而,这里说明在上述各实施方式中表示的运动图像编码方法(图像编码方法)或运动图像解码方法(图像解码方法)的应用例和使用它的系统。该系统的特征在于,具有使用图像编码方法的图像编码装置、使用图像解码方法的图像解码装置、以及具备两者的图像编码解码装置。关于系统中的其他结构,根据情况能够适当地变更。
[0458]
[使用例]
[0459]
图25是表示实现内容分发服务的内容供给系统ex100的整体结构的图。将通信服务的提供区分割为希望的尺寸,在各单元内分别设有作为固定无线站的基站ex106、ex107、ex108、ex109、ex110。
[0460]
在该内容供给系统ex100中,在因特网ex101上经由因特网服务提供商ex102或通信网ex104、以及基站ex106~ex110连接着计算机ex111、游戏机ex112、相机ex113、家电ex114以及智能电话ex115等各设备。该内容供给系统ex100也可以将上述的某些要素组合而连接。也可以不经由作为固定无线站的基站ex106~ex110而将各设备经由电话网或近距离无线等直接或间接地相互连接。此外,流媒体服务器ex103经由因特网ex101等而与计算机ex111、游戏机ex112、相机ex113、家电ex114及智能电话ex115等各设备连接。此外,流媒体服务器ex103经由卫星ex116而与飞机ex117内的热点内的终端等连接。
[0461]
另外,也可以代替基站ex106~ex110而使用无线接入点或热点等。此外,流媒体服务器ex103既可以不经由因特网ex101或因特网服务提供商ex102而直接与通信网ex104连接,也可以不经由卫星ex116而直接与飞机ex117连接。
[0462]
相机ex113是数字相机等能够进行静止图像摄影及运动图像摄影的设备。此外,智能电话ex115是与通常被称作2g、3g、3.9g、4g、及今后被称作5g的移动通信系统的方式对应的智能电话机、便携电话机或phs(personal handyphone system)等。
[0463]
家电ex118是电冰箱或在家庭用燃料电池热电联供系统中包含的设备等。
[0464]
在内容供给系统ex100中,具有摄影功能的终端经由基站ex106等连接到流媒体服务器ex103上,由此能够进行现场分发等。在现场分发中,终端(计算机ex111、游戏机ex112、相机ex113、家电ex114、智能电话ex115及飞机ex117内的终端等)对由用户使用该终端拍摄的静止图像或运动图像内容进行在上述各实施方式中说明的编码处理,将通过编码得到的影像数据和将与影像对应的声音进行编码而得到的声音数据复用,将得到的数据向流媒体服务器ex103发送。即,各终端作为有关本发明的一形态的图像编码装置发挥功能。
[0465]
另一方面,流媒体服务器ex103将对有请求的客户端发送的内容数据进行流分发。客户端是能够将上述编码处理后的数据进行解码的计算机ex111、游戏机ex112、相机ex113、家电ex114、智能电话ex115或飞机ex117内的终端等。接收到被分发的数据的各设备对接收到的数据进行解码处理并再现。即,各设备作为有关本发明的一形态的图像解码装置发挥功能。
[0466]
[分散处理]
[0467]
此外,流媒体服务器ex103也可以是多个服务器或多个计算机,将数据分散处理或记录而分发。例如,流媒体服务器ex103也可以由cdn(contents delivery network)实现,通过将分散在世界中的许多边缘服务器与边缘服务器之间相连的网络来实现内容分发。在cdn中,根据客户端而动态地分配在物理上较近的边缘服务器。并且,通过向该边缘服务器高速缓存及分发内容,能够减少延迟。此外,在发生了某种错误的情况下或因通信量的增加等而通信状态变化的情况下,能够用多个边缘服务器将处理分散、或将分发主体切换为其他边缘服务器、或绕过发生故障的网络的部分而继续分发,所以能够实现高速且稳定的分发。
[0468]
此外,不限于分发自身的分散处理,所拍摄的数据的编码处理既可以由各终端进行,也可以在服务器侧进行,也可以相互分担而进行。作为一例,通常在编码处理中进行2次处理循环。在第1次的循环中对帧或场景单位的图像的复杂度或代码量进行检测。此外,在第2次的循环中进行维持画质而使编码效率提高的处理。例如,通过由终端进行第1次的编码处理、由接收到内容的服务器侧进行第2次的编码处理,能够在减少各终端中的处理负荷的同时使内容的质和效率提高。在此情况下,如果有几乎实时地接收并解码的请求,则也可以将终端进行的第一次编码完成的数据由其他终端接收并再现,所以也能够进行更灵活的实时分发。
[0469]
作为其他例子,相机ex113等从图像进行特征量提取,将关于特征量的数据作为元数据压缩并向服务器发送。服务器例如根据特征量来判断目标的重要性而切换量化精度等,进行与图像的意义对应的压缩。特征量数据对于服务器中的再次压缩时的运动矢量预测的精度及效率提高特别有效。此外,也可以由终端进行vlc(可变长编码)等简单的编码,由服务器进行cabac(上下文自适应二值算术编码方式)等处理负荷大的编码。
[0470]
作为其他例子,在体育场、购物中心或工厂等中,有存在由多个终端拍摄大致相同的场景而得到的多个影像数据的情况。在此情况下,使用进行了拍摄的多个终端、以及根据需要而使用没有进行摄影的其他终端及服务器,例如以gop(group of picture)单位、图片单位或将图片分割而得到的瓦片单位等分别分配编码处理而进行分散处理。由此,能够减少延迟而更好地实现实时性。
[0471]
此外,由于多个影像数据是大致相同场景,所以也可以由服务器进行管理及/或指示,以将由各终端拍摄的影像数据相互参照。或者,也可以是服务器接收来自各终端的已编码数据并在多个数据间变更参照关系,或将图片自身进行修正或替换而重新编码。由此,能够生成提高了一个个数据的质和效率的流。
[0472]
此外,服务器也可以进行将影像数据的编码方式变更的转码后将影像数据分发。例如,服务器也可以将mpeg类的编码方式变换为vp类,也可以将h.264变换为h.265。
[0473]
这样,编码处理能够由终端或1个以上的服务器进行。因此,以下作为进行处理的
主体而使用“服务器”或“终端”等的记载,但也可以将由服务器进行的处理的一部分或全部用终端进行,也可以将由终端进行的处理的一部分或全部用服务器进行。此外,关于这些,对于解码处理也是同样的。
[0474]
[3d、多角度]
[0475]
近年来,将由相互大致同步的多个相机ex113及/或智能电话ex115等终端拍摄的不同场景、或从不同的角度拍摄了相同场景的图像或影像合并而利用的情况增加。将由各终端拍摄的影像基于另取得的终端间的相对位置关系、或影像中包含的特征点一致的区域等来合并。
[0476]
服务器不仅是将二维的运动图像进行编码,也可以基于运动图像的场景解析等自动地或在用户指定的时刻将静止图像进行编码并向接收终端发送。服务器还在能够取得拍摄终端间的相对位置关系的情况下,不仅是二维的运动图像,还能够基于从不同的角度拍摄了相同场景的影像,生成该场景的三维形状。另外,服务器也可以将由点云(point cloud)等生成的三维的数据另行编码,也可以基于使用三维数据将人物或目标进行识别或跟踪的结果,从由多个终端拍摄的影像中选择或重构而生成向接收终端发送的影像。
[0477]
这样,用户既能够任意地选择与各拍摄终端对应的各影像而欣赏场景,也能够欣赏从使用多个图像或影像重构的三维数据中切取了任意视点的影像的内容。进而,与影像同样,声音也可以从多个不同的角度集音,由服务器匹配于影像而将来自特定的角度或空间的声音与影像复用并发送。
[0478]
此外,近年来,virtual reality(vr:虚拟现实)及augmented reality(ar:增强现实)等将现实世界与虚拟世界建立对应的内容也正在普及。在vr图像的情况下,服务器分别制作右眼用及左眼用的视点图像,既可以通过multi-view coding(mvc:多视点编码)等进行在各视点影像间容许参照的编码,也可以相互不参照而作为不同的流进行编码。在不同的流的解码时,可以根据用户的视点相互同步地再现,以再现虚拟的三维空间。
[0479]
在ar图像的情况下,也可以是,服务器基于三维的位置或用户的视点的移动,对现实空间的相机信息重叠虚拟空间上的虚拟物体信息。解码装置取得或保持虚拟物体信息及三维数据,根据用户的视点的移动而生成二维图像,通过平滑地相连来制作重叠数据。或者,也可以是,解码装置除了虚拟物体信息的委托以外还将用户的视点的移动发送给服务器,服务器根据保持在服务器中的三维数据,匹配于接收到的视点的移动而制作重叠数据,将重叠数据进行编码并向解码装置分发。另外,重叠数据在rgb以外具有表示透射度的α值,服务器将根据三维数据制作出的目标以外的部分的α值设定为0等,在该部分透射的状态下进行编码。或者,服务器也可以如色度键那样将规定值的rgb值设定为背景,生成将目标以外的部分设为背景色的数据。
[0480]
同样,分发的数据的解码处理既可以由作为客户端的各终端进行,也可以在服务器侧进行,也可以相互分担而进行。作为一例,也可以是某个终端先向服务器发送接收请求,由其他终端接收与该请求对应的内容并进行解码处理,将已解码的信号向具有显示器的装置发送。通过与可通信的终端自身的性能无关地都将处理分散而选择适当的内容,能够再现画质较好的数据。此外,作为其他例子,也可以由tv等接收大尺寸的图像数据,并且由欣赏者的个人终端将图片被分割后的瓦片等一部分区域进行解码并显示。由此,能够在使整体像共有化的同时,在手边确认自己的负责领域或想要更详细地确认的区域。
[0481]
此外,预想今后在不论室内外都能够使用近距离、中距离或长距离的多个无线通信的状况下,利用mpeg-dash等的分发系统标准,一边对连接中的通信切换适当的数据一边无缝接收内容。由此,用户不仅用自身的终端,还能够自由地选择设置在室内外的显示器等解码装置或显示装置来实时地切换。此外,能够基于自身的位置信息等,切换解码的终端及显示的终端来进行解码。由此,还能够在向目的地的移动中一边在埋入有可显示的设备的旁边的建筑物的墙面或地面的一部分上显示地图信息一边移动。此外,还能够基于在能够从接收终端以短时间访问的服务器中高速缓存有编码数据、或在内容分发服务的边缘服务器中复制有编码数据等的向网络上的编码数据的访问容易性,来切换接收数据的比特率。
[0482]
[可分级编码]
[0483]
关于内容的切换,使用图26所示的、使用应用在上述各实施方式中表示的运动图像编码方法进行压缩编码的可分级(scalable)的流进行说明。对服务器而言,作为单独的流也可以具有内容相同而品质不同的多个流,也可以是如图示那样利用通过分层进行编码而实现的时间/空间上的可分级的流的特征来切换内容的结构。即,通过由解码侧根据性能这样的内在因素和通信频带的状态等外在因素来决定解码到哪个层,解码侧能够自由地切换低分辨率的内容和高分辨率的内容来解码。例如在想要将在移动中用智能电话ex115视听的影像的后续在回家后用因特网tv等设备视听的情况下,该设备只要将相同的流解码到不同的层就可以,所以能够减轻服务器侧的负担。
[0484]
进而,在如上述那样按每个层将图片编码、实现在基本层的上位存在增强层的分级性的结构以外,也可以是增强层(enhancement layer)包含基于图像的统计信息等的元信息,解码侧通过基于元信息将基本层的图片进行超析像来生成高画质化的内容。超析像可以是相同分辨率下的sn比的提高及分辨率的扩大中的任意一种。元信息包括用来确定在超析像处理中使用的线性或非线性的滤波系数的信息、或确定在超析像处理中使用的滤波处理、机器学习或最小2乘运算中的参数值的信息等。
[0485]
或者,也可以是根据图像内的目标等的意义将图片分割为瓦片等,解码侧通过选择进行解码的瓦片而仅将一部分区域解码的结构。此外,通过将目标的属性(人物、车、球等)和影像内的位置(同一图像中的坐标位置等)作为元信息保存,解码侧能够基于元信息确定希望的目标的位置,决定包括该目标的瓦片。例如,如图27所示,使用hevc中的sei消息等与像素数据不同的数据保存构造来保存元信息。该元信息例如表示主目标的位置、尺寸或色彩等。
[0486]
此外,也可以以流、序列或随机访问单位等由多个图片构成的单位保存元信息。由此,解码侧能够取得特定人物在影像内出现的时刻等,通过与图片单位的信息匹配,能够确定目标存在的图片、以及图片内的目标的位置。
[0487]
[web页的优化]
[0488]
图28是表示计算机ex111等中的web页的显示画面例的图。图29是表示智能电话ex115等中的web页的显示画面例的图。如图28及图29所示,有web页包含多个作为向图像内容的链接的链接图像的情况,根据阅览的设备而其可见方式不同。在画面上能看到多个链接图像的情况下,在用户明示地选择链接图像之前、或链接图像接近于画面的中央附近或链接图像的整体进入到画面内之前,显示装置(解码装置)中作为链接图像而显示各内容所
具有的静止图像或i图片,或用多个静止图像或i图片等显示gif动画那样的影像,或仅接收基本层而将影像解码及显示。
[0489]
在由用户选择了链接图像的情况下,显示装置将基本层最优先地解码。另外,如果在构成web页的html中有表示是可分级的内容的信息,则显示装置也可以解码到增强层。此外,在为了确保实时性而在选择之前或通信频带非常紧张的情况下,显示装置可以通过仅将前方参照的图片(i图片、p图片、仅进行前方参照的b图片)解码及显示,来减少开头图片的解码时刻与显示时刻之间的延迟(从内容的解码开始到显示开始的延迟)。此外,显示装置也可以将图片的参照关系强行地忽视而将全部的b图片及p图片设为前方参照而粗略地解码,随着时间经过而接收到的图片增加,进行正常的解码。
[0490]
[自动行驶]
[0491]
此外,在为了车的自动行驶或行驶辅助而收发二维或三维的地图信息等的静止图像或影像数据的情况下,接收终端也可以除了属于1个以上的层的图像数据以外,还作为元信息而接收天气或施工的信息等,将它们建立对应而解码。另外,元信息既可以属于层,也可以只与图像数据复用。
[0492]
在此情况下,由于包含接收终端的车、无人机或飞机等在移动,所以接收终端通过在接收请求时发送该接收终端的位置信息,能够切换基站ex106~ex110来进行无缝接收及解码。此外,接收终端根据用户的选择、用户的状况或通信频带的状态,能够动态地切换将元信息以何种程度接收、或将地图信息以何种程度更新。
[0493]
如以上这样,在内容供给系统ex100中,客户端能够将用户发送的已编码的信息实时地接收并解码、再现。
[0494]
[个人内容的分发]
[0495]
此外,在内容供给系统ex100中,不仅是由影像分发业者提供的高画质、长时间的内容,还能够进行由个人提供的低画质、短时间的内容的单播或多播分发。此外,可以想到这样的个人内容今后也会增加。为了使个人内容成为更好的内容,服务器也可以在进行编辑处理后进行编码处理。这例如可以通过以下这样的结构实现。
[0496]
在拍摄时实时地或累积下来拍摄后,服务器根据原图像或已编码数据,进行拍摄错误、场景搜索、意义的解析及目标检测等的识别处理。并且,服务器基于识别结果,手动或自动地进行将焦点偏差或手抖动等修正、或将明亮度比其他图片低或焦点没有对上的场景等的重要性低的场景删除、或将目标的边缘强调、或使色调变化等的编辑。服务器基于编辑结果,将编辑后的数据进行编码。此外,已知如果拍摄时刻过长则视听率会下降,服务器也可以根据拍摄时间,不仅将如上述那样重要性低的场景,还将运动少的场景等基于图像处理结果自动地限制,以成为特定的时间范围内的内容。或者,服务器也可以基于场景的意义解析的结果而生成摘要并编码。
[0497]
另外,个人内容在原状态下有被写入侵害著作权、著作者人格权或肖像权等的内容的情形,也有共享的范围超过了想要的范围等对于个人而言不便的情况。因此,例如服务器也可以将画面的周边部的人的脸、或家中等强行地变更为不对焦的图像而进行编码。此外,服务器也可以识别在编码对象图像内是否拍摄到与预先登记的人物不同的人物的脸,在拍摄到的情况下,进行对脸部分施加马赛克等的处理。或者,作为编码的前处理或后处理,也可以从著作权等的观点出发,用户指定想要将图像加工的人物或背景区域,服务器进
行将所指定的区域替换为别的影像、或将焦点模糊化等的处理。如果是人物,则能够在运动图像中跟踪人物的同时,将脸部分的影像替换。
[0498]
此外,数据量小的个人内容的视听其实时性要求较强,所以虽然也取决于带宽,但解码装置首先将基本层最优先地接收并进行解码及再现。解码装置也可以在此期间中接收增强层,在再现被循环的情况等2次以上被再现的情况下,将增强层也包括在内再现高画质的影像。这样,如果是进行了可分级编码的流,则能够提供在未选择时或刚开始看的阶段是虽然较粗糙的运动图像但流逐渐变得流畅而图像变好的体验。除了可分级编码以外,在第1次被再现的较粗糙的流和参照第1次的运动图像而被编码的第2次的流构成为1个流的情况下也能够提供同样的体验。
[0499]
[其他使用例]
[0500]
此外,这些编码或解码处理通常在各终端所具有的lsiex500中处理。lsiex500既可以是单芯片也可以是由多芯片构成的结构。另外,也可以将运动图像编码或解码用的软件装入到能够由计算机ex111等读取的某种记录介质(cd-rom、软盘、硬盘等)中、使用该软件进行编码处理及解码处理。进而,在智能电话ex115带有相机的情况下,也可以发送由该相机取得的运动图像数据。此时的运动图像数据是用智能电话ex115所具有的lsiex500进行编码处理后的数据。
[0501]
另外,lsiex500也可以是将应用软件下载并将其激活的结构。在此情况下,终端首先判定该终端是否与内容的编码方式对应、或是否具有特定服务的执行能力。在终端不与内容的编码方式对应的情况下、或不具有特定服务的执行能力的情况下,终端下载编解码器或应用软件,然后进行内容取得及再现。
[0502]
此外,并不限于经由因特网ex101的内容供给系统ex100,也能够在数字广播用系统中组装上述各实施方式的至少运动图像编码装置(图像编码装置)或运动图像解码装置(图像解码装置)中的某一种。由于利用卫星等使广播用的电波承载将影像与声音复用的复用数据而收发,所以相对于内容供给系统ex100的容易单播的结构,有适合多播的差异,但关于编码处理及解码处理能够进行同样的应用。
[0503]
[硬件结构]
[0504]
图30是表示智能电话ex115的图。此外,图31是表示智能电话ex115的结构例的图。智能电话ex115具有用来在与基站ex110之间收发电波的天线ex450、能够拍摄影像及静止图像的相机部ex465、显示由相机部ex465拍摄的影像及将由天线ex450接收到的影像等解码后的数据的显示部ex458。智能电话ex115还具备作为触摸面板等的操作部ex466、用来输出声音或音响的作为扬声器等的声音输出部ex457、用来输入声音的作为麦克风等的声音输入部ex456、能够保存所拍摄的影像或静止图像、录音的声音、接收到的影像或静止图像、邮件等的编码后的数据或解码后的数据的存储器部ex467、或者作为与simex468的接口部的插槽部ex464,所述simex468用来确定用户,进行以网络为代表向各种数据的访问的认证。此外,也可以代替存储器部ex467而使用外置存储器。
[0505]
此外,对显示部ex458及操作部ex466等进行综合控制的主控制部ex460与电源电路部ex461、操作输入控制部ex462、影像信号处理部ex455、相机接口部ex463、显示器控制部ex459、调制/解调部ex452、复用/分离部ex453、声音信号处理部ex454、插槽部ex464及存储器部ex467经由总线ex470相互连接。
[0506]
电源电路部ex461如果通过用户的操作使电源键成为开启状态,则通过从电池组对各部供给电力,将智能电话ex115启动为能够动作的状态。
[0507]
智能电话ex115基于具有cpu、rom及ram等的主控制部ex460的控制,进行通话及数据通信等处理。在通话时,通过声音信号处理部ex454将由声音输入部ex456集音的声音信号变换为数字声音信号,将其用调制/解调部ex452进行波谱扩散处理,由发送/接收部ex451实施数字模拟变换处理及频率变换处理之后经由天线ex450发送。此外,将接收数据放大并实施频率变换处理及模拟数字变换处理,由调制/解调部ex452进行波谱逆扩散处理,由声音信号处理部ex454变换为模拟声音信号后,将其从声音输出部ex457输出。在数据通信时,通过主体部的操作部ex466等的操作将文本、静止图像或影像数据经由操作输入控制部ex462向主控制部ex460送出,同样进行收发处理。在数据通信模式时,在发送影像、静止图像或影像和声音的情况下,影像信号处理部ex455将保存在存储器部ex467中的影像信号或从相机部ex465输入的影像信号通过在上述各实施方式中表示的运动图像编码方法进行压缩编码,将编码后的影像数据向复用/分离部ex453送出。此外,声音信号处理部ex454将在由相机部ex465拍摄影像、静止图像等的过程中由声音输入部ex456集音的声音信号编码,将编码后的声音数据向复用/分离部ex453送出。复用/分离部ex453将已编码影像数据和已编码声音数据以规定的方式复用,由调制/解调部(调制/解调电路部)ex452及发送/接收部ex451实施调制处理及变换处理,经由天线ex450发送。
[0508]
在接收到添附在电子邮件或聊天工具中的影像、或链接在网页等上的影像的情况下,为了将经由天线ex450接收到的复用数据进行解码,复用/分离部ex453通过将复用数据分离而将复用数据分为影像数据的比特流和声音数据的比特流,经由同步总线ex470将编码后的影像数据向影像信号处理部ex455供给,并将编码后的声音数据向声音信号处理部ex454供给。影像信号处理部ex455通过与在上述各实施方式中表示的运动图像编码方法对应的运动图像解码方法将影像信号进行解码,经由显示器控制部ex459从显示部ex458显示被链接的运动图像文件中包含的影像或静止图像。此外,声音信号处理部ex454将声音信号进行解码,从声音输出部ex457输出声音。另外,由于实时流媒体正在普及,所以根据用户的状况,也可能发生声音的再现在社会上不适合的场合。因此,作为初始值,优选的是不将声音信号再现而仅将影像数据再现的结构。也可以仅在用户进行了将影像数据点击等操作的情况下将声音同步地再现。
[0509]
此外,这里以智能电话ex115为例进行了说明,但作为终端,可以考虑除了拥有编码器及解码器双方的收发型终端以外,还有仅具有编码器的发送终端、仅具有解码器的接收终端这3种安装形式。进而,在数字广播用系统中,假设将在影像数据中复用了声音数据等的复用数据接收、发送而进行了说明,但在复用数据中除了声音数据以外还可以复用与影像关联的字符数据等,也可以不是将复用数据而是将影像数据自身接收或发送。
[0510]
另外,假设包括cpu的主控制部ex460控制编码或解码处理而进行了说明,但终端具备gpu的情况也较多。因此,也可以做成通过由cpu和gpu共用的存储器、或以能够共同使用的方式管理地址的存储器,来利用gpu的性能将较大的区域一起处理的结构。由此,能够缩短编码时间,确保实时性,实现低延迟。特别是,如果将运动估计、解块滤波、sao(sample adaptive offset)及变换/量化的处理不是用cpu进行而是用gpu以图片等单位一起进行,则更有效。
[0511]
产业上的可利用性
[0512]
本发明能够利用于例如电视接收机、数字视频记录器、汽车导航系统、移动电话、数字相机、或者数字摄像机等。
[0513]
标号说明
[0514]
100 编码装置
[0515]
102 分割部
[0516]
104 减法部
[0517]
106 变换部
[0518]
108 量化部
[0519]
110 熵编码部
[0520]
112、204 逆量化部
[0521]
114、206 逆变换部
[0522]
116、208 加法部
[0523]
118、210 块存储器
[0524]
120、212 循环滤波部
[0525]
122、214 帧存储器
[0526]
124、216 帧内预测部
[0527]
126、218 帧间预测部
[0528]
128、220 预测控制部
[0529]
200 解码装置
[0530]
202 熵解码部
[0531]
1061、2064 变换模式判定部
[0532]
1062、206 5尺寸判定部
[0533]
1063 第1变换基选择部
[0534]
1064 第1变换部
[0535]
1065 第2变换实施判定部
[0536]
1066 第2变换基选择部
[0537]
1067 第2变换部
[0538]
1141、2062 第2逆变换基选择部
[0539]
1142、2063 第2逆变换部
[0540]
1143、2066 第1逆变换基选择部
[0541]
1144、2067 第1逆变换部
[0542]
2061 第2逆变换实施判定部
[0543]
2062s 第2基选择信号
[0544]
2064s 自适应变换基选择模式信号
[0545]
2065s 尺寸信号
[0546]
2066s 第1基选择信号
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1