用于可伸缩视频编码的层间运动向量缩放的制作方法_2

文档序号:9333054阅读:来源:国知局
相应地,对于被放大的(up-scaled) 的基本层参考图片,相关的运动向量也需被放大。Refldx模式对现有的HEVC语法影响较 小。
[0023] 在SHM-1. 0帧内基本层模式Intra_BLmode中,在基本层中对应的区块的中心运 动向量(即,图2中位置f处的运动向量)被缩放,并设置为增强层合并候选清单中的第一 合并候选以作为层间合并候选。层间合并候选的运动向量缩放过程与在ffiVC过程中的运 动向量缩放过程不同。在SHM-1. 0中,基本层运动向量基于在增强层和基本层之间的视频 分辨率的比率来缩放。被缩放的运动向量通过如下公式得到:
[0024]mvEL_X= (mvBL_XXpicEL_ff+(picBL_ff/2-l)X
[0025]sign(mvBL_X))/picBL_W,以及 (5)
[0026]mvEL_Y= (mvBL_YXpicEL_H+(picBL_H/2_l)X
[0027]sign(mvBL_Y))/picBL_H, (6)
[0028] 其中,(mvEL_X,mvEL_Y)为增强层中被缩放的运动向量,(mvBL_X,mvBL_Y)为基本 层中对应区块的中心运动向量,picEL_W和picEL_H为增强层图片的图片宽度和高度,以及 picBL_W和picBL_H为基本层中图片的宽度和高度。
[0029] 在SHM-1. 0中,对于具有像素位置等于(xEL,yEL)的增强层中的像素,像素位置映 射用于得到对应增强层像素的基本层参考像素,该像素位置映射可通过如下公式得到:
[0030]xBL= (xELXpicBL_W+picEL_W/2)/picEL_W,以及 (7)
[0031]yBL= (yELXpicBL_H+picEL_H/2)/picEL_H, (8)
[0032] 其中,(xBL,yBL)为在基本层中的参考像素的像素位置,picEL_W和picEL_H为在 增强层图片的图片宽度和高度,以及为基本层图片的图片宽度和高度。
[0033] 在SHM-1. 0纹理上采样中,基本层中参考像素的基本层像素位置以1/16个采样像 素单位来输出。1/16个采样像素单位的基本层像素位置的推导描述如下:
[0034] 通过如下公式得到变量xBL16:
[0035] xBL16 = (xELXpicBL_WX16+picEL_W/2)/picEL_W。
[0036] 通过如下公式得到变量yBL16:
[0037] 若cldx等于0,则变量yBL16通过如下公式得到:
[0038] yBL16 = (yELXpicBL_HX 16+picEL_H/2)/picEL_H,
[0039] 否则,变量yBL16通过如下公式得到:
[0040] yBL16 = (yELXpicBL_HX 16+picEL_H/2)/picEL_H-〇ffset,
[0041] 其中,cldx为颜色组分索引,以及通过如下描述得到偏移offset:
[0042]若(picEL_H= =picBL_H)
[0043]offset= 0;
[0044]否则若(picEL_H= = 1. 5*picBL_H)
[0045]offset= 1;以及
[0046]否则若(picEL_H= = 2. 0*picBL_H)
[0047] offset=2〇
[0048] 在通过SHVC测试模型1. 0 (SHM-1. 0)支持的参考图片索引RefIdx模式中,已解码 的基本层图片被上采样并被包括于长期参考图片清单中,以作为层间参考图片。对于层间 参考图片来说,不仅纹理自基本层图片上采样,而且运动场(motionfield)根据增强层和 基本层之间的空间比率而自基本层图片上采样和映射,图3为具有1. 5倍空间可伸缩的运 动场映射的示例。在此示例中,基本层(即,b0~b3)中的四个最小预测单元(SPUs)被映 射至增强层(即,e〇~e8)中的九个最小预测单元。在增强层中的九个预测单元的运动场 自基本层的运动场来得到。
[0049] 为降低运动数据缓冲器的尺寸,增强层中的运动场在运动映射后被压缩为具有 16x16区块的单元大小。如图4所示,在SHM-1.0中,在压缩后,16x16区块的中心运动向量 (由C表示)用于代表此16x16区块的运动向量。
[0050] 如公式(5)和公式(6)所示,运动向量缩放涉及每一个运动向量的一些操作。在 这些操作之间,推导过程最花时间或最复杂。此情况与公式(7)和公式(8)所示的层间像 素位置映射相同。因此,需要开发一种简化用于层间编码的运动向量缩放和像素位置映射 的方法。

【发明内容】

[0051] 本发明提供一种用于可伸缩视频编码的层间运动向量缩放方法。其中运动向量 缩放利用层间运动向量缩放因子来降低计算复杂性。视频序列数据被配置为基本层和增 强层,以及在该增强层中的增强层图片具有比在该基本层中的基本层图片更高的空间分辨 率。根据本发明的实施方式接收关于视频序列的增强层图片和基本层图片的图像大小信 息;并基于关于增强层图片和基本层图片的图像大小信息,确定层间运动向量缩放因子; 接收与基本层图片相关的基本层运动向量;基于基本层运动向量和层间运动向量缩放因 子,确定被缩放的运动向量;并且被缩放的运动向量被提供以用于增强层图片的层间预测 编码。
[0052] 在一个实施方式中,层间运动向量缩放因子与增强层图片的已裁剪的增强层图片 分辨率和基本层图片的已裁剪的基本层图片分辨率相关。层间运动向量缩放因子自已偏差 预缩放的已裁剪增强层图片分辨率至已裁剪基本层图片分辨率的比率来确定,其中已偏差 预缩放的已裁剪增强层图片分辨率通过将偏差值与预缩放的已裁剪增强层图片分辨率相 加来得到,以及其中该预缩放的已裁剪增强层图片分辨率通过应用算术左移K比特至该已 裁剪的增强层图片分辨率来得到,以及K为非负整数。该比率进一步剪切至具有最低值和 最高值之间的范围内。
[0053] 在另一实施方式中,单个层间运动向量缩放因子被确定以用于水平方向和垂直方 向。用于水平方向和垂直方向的单个层间运动向量缩放因子在序列级、图片级、或切片级中 被发送出去。用于该水平方向和该垂直方向的该单个层间运动向量缩放因子在序列参数 级、图片参数级、切片头、序列参数级扩展、图片参数级扩展或切片段头扩展中被发送出去。 一个标志用于指示该单独的层间运动向量缩放因子是否相等。
[0054] 在又一实施方式中,层间运动向量缩放因子被确定一次,以用于增强层图像单元, 以及在增强层图像单元中的所有区块共享层间运动向量缩放因子,其中图像单元对应于一 个视频序列、一个图片、一个切片、一个编码树单元、一个编码树区块、一个编码单元、或一 个预测单元。在又一实施方式中,基于层间运动向量缩放因子,确定层间位置映射缩放因 子,其中层间位置映射缩放因子用于确定对应于增强层像素位置的基本层映射位置,以及 其中基本层映射位置基于增强层像素位置和层间位置映射缩放因子来确定。
[0055] 本发明提供一种用于可伸缩视频编码的层间位置映射方法。其中,像素位置映射 利用层间位置映射缩放因子以降低计算复杂性。根据本发明的实施方式接收关于视频序列 的增强层图片和基本层图片的图像大小信息;并基于关于增强层图片和基本层图片的图像 大小信息,确定层间位置映射缩放因子。对应于增强层像素位置的基本层映射位置基于增 强层像素位置和层间位置映射缩放因子被确定,并且基本层映射位置被提供以用于增强层 图片的层间预测编码。
[0056] 在一个实施方式中,层间位置映射缩放因子与基本层图片的已裁剪的基本层图片 分辨率和增强层图片的已裁剪的增强层图片分辨率相关。层间位置映射缩放因子自已偏差 预缩放的已裁剪基本层图片分辨率至已裁剪增强层图片分辨率的比率来确定,其中已偏差 预缩放的已裁剪基本层图片分辨率通过将偏差值与预缩放的已裁剪基本层图片分辨率相 加来得到,以及其中预缩放的已裁剪基本层图片分辨率通过应用算术左移N比特至已裁剪 的基本层图片分辨率来得到,以及N为非负整数。
[0057] 用于给定增强层像素位置的基本层映射位置通过将第一偏移项加至第一乘积来 确定,其中该第一偏移项对应于基本层图片的剪切起始位置,第一乘积通过将层间位置映 射缩放因子与第一距离相乘来得到,该第一距离为从给定增强层像素位置至基本层图片剪 切起始位置的距离。第一乘积进一步与偏差值相加,而得到已偏差的第一乘积,并应用算术 右移N比特至已偏差的第一乘积,以及N为非负整数。用于给定的增强层像素位置的基本 层映射位置通过将第二偏移项与第一偏移项和第一乘积相加来确定,其中第二偏移项对应 于与应用于增强层图片和基本层图片的上采样和下采样相关的相移。增强层像素位置和基 本层像素位置可被剪切至一个范围。
[0058] 在另一实施方式中,基于层间位置映射缩放因子,确定层间运动向量缩放因子,其 中层间运动向量缩放因子基于该基本层运动向量和层间运动向量缩放因子,确定被缩放的 运动向量。
【附图说明】
[0059] 图1为由三层组成的可伸缩视频编码系统的预测结构的示意图。
[0060]图2为基于对应的基本层区块和基本层区块的相邻区块的运动信息的用于增强 层区块的多个候选的推导的示意图。
[0061] 图3描述了对应于1. 5倍空间可伸缩的运动场映射的示意图。
[0062] 图4描述了在压缩后用于表示16x16区块的运动向量的16x16区块的中心运动向 量(由C表示)的示意图。
[0063] 图5描述了自基本层图片得到用于增强层图片的层间同一位置运动向量的示意 图。
[0064] 图6为包括在被缩放的运动向量推导中的层间运动向量缩放因子的可伸缩视频 编码系统的示范性流程图。
[0065]图7描述了包括在基本层像素位置映射中的层间位置映射缩放因子的可伸缩视 频编码系统的示范性流程图。
【具体实施方式】
[0066] 如上所述,在基于AVC/H. 264 (可伸缩视频编码)或基于HEVC(SHVC)的可伸缩视 频编码中,处理过程涉及运动向量缩放和层间像素位置映射的适当计算。本发明揭示了降 低需要的计算复杂性的各种实施方式。
[0067] 层间运动向量缩放
[0068] 如公式(5)和公式(6)所示,除法需要被执行以用于每一个层间运动向量,即使增 强层至基本层的图片分辨率比率为固定值。另外,公式(5)和公式(6)没有考虑帧的裁剪 问题。本发明的实施方式揭示了用于SHVC的层间运动信息的推导,以降低需要的计算复杂 性。
[0069] 在一个实施方式中,首先,两个层间运动向量缩放因子被得到,以用于层间运动向 量缩放。如公式(4)所示的在HEVC中的运动向量缩放过程被重使用。一个缩放因子被用 于水平方向(MV_x),以及另一个缩放因子被用于垂直方向(MV_y)。对于层间运动向量缩放 因子来说,裁剪因子也被考虑。根据本发明实施方式,根据如下内容得到在X方向上的层间 运动向量缩放因子:
[0070]ILScalingFactor_x= ( ( (picELCropffidth) <<K1) +offsetl_x) / (picBLCropffidth),
[0071] (9)
[0072]其中,picELCropffidth=picEL_W-picELCropLeftOfTset-picELCropRigh tOffset以及picBLCropffidth=picBL_W-picBLCropLeftOfTset-picBLCropRight Offset。增强层图片在左侧根据picELCropLeftOffset像素而裁剪,以及在右侧根据picELCropRightOffset像素而裁剪。基本层图片在左侧根据picBLCropLeftOffset像素而 裁剪,以及在右侧根据此0<^1^8111:(^€861:像素而裁剪。偏移〇€€861:1_1可以为0,或可以 导出为(picBLCropWidth)?l或((picBLCropWidth)?l)-l。K1 为整数,以及举例来说,K1 可为8。
[0073] 如公式(9)所示,缩放因子EScalingFactor_x与已裁剪的增强层图片宽度(即, picELCropWidth)至已裁剪的基本层图片宽度(即,picBLCropWidth)的比率相关,以及 ILScalingFactor_x为整数。然而,picELCropWidth通过应用算术左移K1比特来预缩放。 此外,偏差值(即,〇ffsetl_x)与预缩放的picELCropWidth相加。然后,已相加偏差的、预 缩放的picELCropWidth除以picBLCropWidth,以得到缩放因子ILScalingFactor_x。
[0074] 根据本发明的实施方式,根据如下内容得到在y方向上的层间运动向量缩放因 子:
[0075]ILScalingFactor_y= ( ( (picELCropHeight)
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1