深度预测模式选择方法及装置的制造方法

文档序号：9650903阅读：272来源：国知局

深度预测模式选择方法及装置的制造方法
【专利说明】
[oow] 相关申请
[0002] 本申请要求于2013年1月11日由顾舟叶等提交的、申请号为61/751，589、发明名称为"低复杂度帖内编码方法"的美国临时专利申请的优先权，其全部内容通过引用结合在本申请中。
技术领域
[0003] 本申请一般来说设及一种视频编解码的装置、方法及计算机程序。
【背景技术】
[0004] 本节旨在提供权利要求中所引用的本发明的背景。本节的描述可包括可推行但不一定已形成或推行的概念。因此，除非本文另有说明，本节所描述的并不是本申请的说明和权利要求的现有技术，也不因包括在本节中而承认为现有技术。
[0005] 即使在较短的影片中，需要预测的数据量也是庞大的，运使得数据难W在有限的带宽上在通信网络上通过流或其他方式进行传送。因此，在通过现代通信网络传送之前，视频数据通常会先经过压缩。数据传输前，视频压缩设备通常在源端使用软件和/或硬件对视频数据进行压缩，从而减少呈现数字视频图像所需的数据量。经过压缩的数据在目的端被视频解压缩设备接收，该视频解压缩设备对所述视频数据进行解压缩。由于网络资源有限，而对视频质量的要求又不断提高，需要有改进的压缩和解压缩技术来提高压缩率，而不影响图像质量或对图像质量影响很少。
[0006] 视频编码系统可包括编码器和解码器，所述编码器将输入视频变换成适于存储/ 传输的压缩呈现，所述解码器可将所述压缩的视频呈现解压缩还原成可视形式。为使视频呈现更为紧凑，例如，为使视频信息W低于其他情况可能需要的比特率进行存储/传输，所述编码器可丢弃原始视频序列中的部分信息。
[0007] 当前正在调研和开发各类提供=维（3D)视频内容的技术。研究尤其集中在各种多视应用，其中观察者从特定视点只能看到一个立体视频对，从不同视点又能看到另一立体视频对。运类多视应用的最可行方案之一是只将限量的单一或立体视频及补充数据等输入视图提供给解码器侧，由解码器在本地对全部所需视图进行擅染（例如，合成），然后显示在显示器上。
[0008] 3D视频内容编码可使用各种视频压缩系统，如高级视频编码标准H. 264/AVC或比264/AVC的多视视频编码扩展MVC、高效视频编码标准肥VC或肥VC的多视扩展加深度或肥VC的3D扩展。

【发明内容】

[0009] 根据第一实施例，提供了一种用于对深度图的块进行编码的预测模式选择方法，所述方法包括：
[0010] 获取编码模式的有序列表，其中所述编码模式的有序列表包括多种编码模式，所述编码模式能用于所述块的编码；
[0011] 获取多个深度建模模式值MM)，所述深度建模模式能用于所述块的编码；
[0012] 根据决策条件确定是否将所述多个DMM中的DMM添加到所述编码模式的有序列表。
[0013] 根据第二实施例，提供了一种装置，包括至少一个处理器和至少一个包括计算机程序代码的内存，其中所述至少一个内存及所述计算机程序代码用于，与所述至少一个处理器一起，使所述装置执行W下操作：
[0014] 获取编码模式的有序列表，其中所述编码模式的有序列表包括多种编码模式，其中每种编码模式都能用于对深度图的块进行编码；
[0015] 获取多个深度建模模式值MM)，其中每个深度建模模式都能用于所述块的编码；
[0016] 根据决策条件确定是否将所述多个DMM中的DMM添加到所述编码模式的有序列表。
[0017] 根据第S实施例，提供了一种装置，包括：
[0018] 获取编码模式的有序列表的单元，其中所述编码模式的有序列表包括多种编码模式，其中每种编码模式都能用于对深度图的块进行编码；
[0019] 获取多个深度建模模式值MM)的单元，其中每个深度建模模式都能用于所述块的编码；
[0020] 根据决策条件确定是否将所述多个DMM中的DMM添加到所述编码模式的有序列表的单元。
【附图说明】
[0021] 为了更完整地理解本发明，请结合附图及具体实施例参考W下【附图说明】，其中相似的附图标号表示相似的部件。
[0022] 图1为较佳视频编码器的一部分；
[0023] 图2为模式选择方法的一个实施例；
[0024] 图3为模式选择方法的另一个实施例；
[00巧]图4为模式选择方法的另一个实施例；
[00%] 图5为模式选择方法的另一个实施例；
[0027] 图6为各模式选择实施例中适用的决策条件的其他实施例；
[0028] 图7为模式选择方法的另一实施例的实验结果；
[0029] 图8为电子设备的一个实施例的示意图。
【具体实施方式】
[0030] 首先，应理解，尽管W下对一个或多个实施例的实现方式进行了举例说明，但所公开的系统和/或方法可通过任意多的已知或现有技术实现。本发明绝不限于W下所阐述的实现方式、附图和技术，包括本发明阐述和说明的典型设计及实现方式，而是可W在所附权利要求及其所有同等替代的范围内进行修改。
[0031] W下W-个视频编码设备为例对本发明的几个实施例进行描述。但是，要注意的是本发明并不局限于该特定设备。事实上，所述不同实施例在任何需要对参考图片处理进行改进的情况都有广泛应用。例如，本发明可应用于W下视频编码系统：流媒体系统、DVD播放器、数字电视接收机、个人视频录像机、个人电脑上的系统和计算机程序、手持电脑和通讯设备，W及处理视频数据的网元，如变码器和云计算设备。
[0032] 比264/AVC标准由国际电信联盟电信标准部aTU-T)的视频编码专家组（VCEG) 的联合视频组（JVT)及国际标准化组织（ISO)/国际电工委员会（IEC)的运动图像专家组 (MPEG)开发。比264/AVC标准由上述两大标准化组织发布，分别称为ITU-T建议H. 264和 ISCVIEC国际标准14496-10,也称为MPEG-4第10部分：高级视频编码（AVC).H. 264/AVC标准已有很多版本，每个版本都为标准纳入了新的扩展或特性。运些扩展包括可伸缩视频编码（SVC)及多视视频编码（MVC)。
[0033] 目前，MPEG和VCEG的视频编码联合协作组（JCT-VC)正在进行（高效视频编码 (肥VC)的标准化项目。肥VC标准的具体信息，可参考电气电子工程师学会（I邸巧的文件《高效视频编码（肥VC)标准概述》，该文件可在IE邸网站(http：//ieeexplore.ieee.org/ Xplore/home.isp)用数字对象标识"10. 1109/TCSVT. 2012. 2221191"进行访问。该IE邸文件的全部内容都通过引用结合在本申请中。
[0034] 本节用H. 264/AVC和肥VC的一些关键定义、比特流和编码结构W及概念，对实现各实施例的视频编码器、解码器、编码方法、解码方法及比特流结构进行举例说明。H. 264/ AVC的某些关键定义、比特流和编码结构W及概念与肥VC标准草案相同，因此将在下文统一说明。但本发明并不限于H. 264/AVC或肥VC，且所述说明旨在阐明本发明可部分或全部实现的一个可能的基础。
[0035] 与很多早期的视频编码标准类似，H. 264/AVC和肥VC中规定了实现无差错比特流的比特流语法和语义W及解码过程。编码过程虽然没有规定，但编码器必须产生符合要求的比特流。比特流和解码器是否符合要求可通过假想参考解码器（HRD)进行验证。标准包含有助于处理传输误差和损失的编码工具，但工具在编码中的使用是可选的，且没有对有差错比特流的解码过程进行规定。
[0036] 比264/AVC或肥VC编码器输入及H. 264/AVC或肥VC解码器输出的基本单位分别是图片。在H. 264/AVC和肥VC中，图片可W为帖或域。帖包括亮度样本及对应色度样本组成的矩阵。域是帖中样本行的隔行集合，在源信号经过交织处理时，可作为编码器的输入。与亮度图片比对时，色度图片可进行二次采样。例如，在4:2:0采样模式中，色度图片的空间分辨率在两个坐标轴上都是亮度图片的空间分辨率的一半。
[0037] 在H. 264/AVC中，宏块由16X16的亮度样本块及对应的色度样本块组成。例如，在4:2:0采样模式中，宏块的每个色度组件包含8x8的色度样本块。在H. 264/AVC中，图片被分割为一个或多个切片组，一个切片组包含一个或多个切片。在H. 264/AVC中，切片由特定切片组内进行的光栅扫描中连续排列的整数个宏块组成。
[003引在肥VC标准的一个草案中，视频图片被划分为覆盖图片区域的编码单元（CU)。CU由一个或多个预测单元（PU)及一个或多个变化单元（TU)组成，所述PU定义CU中样本的预测过程，所述TU定义CU中样本的预测误差编码过程。通常，CU由方块组成，所述方块的尺寸可从预定义的CU可能尺寸集中进行选择。最大尺寸的CU通常称为LCU(最大编码单元），视频图片被划分为不重叠的LCU。LCU可进一步拆分为更小CU的组合，例如，通过对 LCU及所得CU进行递归拆分。每个拆分所得的CU通常有至少一个PU及至少一个与该PU 相关联的TU。每个PU和TU可进一步拆分为更小的PU和TU，W分别增加预测的粒度及预测误差编码过程。PU拆分可通过把CU拆分为四个等大的正方形PU或把CU拆分为竖直或水平的对称或不对称的两个矩形PU。图片到CU的划分W及CU到PU和TU的划分，通常在比特流中进行指示，使解码器能重现各单元的结构。
[0039] 在肥VC标准的一个草案中，图片可分割为矩形的图块，所述图块包含整数个LCU。在肥VC标准的一个草案中，图块的分割构成规则的网格，其中图块间的高度和宽带相差最多一个LCU。在肥VC标准的一个草案中，切片由整数个CU组成。CUW图块中或，如果没有使用图块，图片中LCU的光栅扫描顺序进行扫描。在LCU内，CU具有一定的扫描顺序。
[0040] 在肥VC的工作草案（WD) 5中，图片分割的关键定义及概念如下：分割指的是将一个集合划分为多个子集，使该集合中每个元素都正好是一个所述子集。
[0041] 肥VCWD5中的基本编码单元叫做树块。树块为具有S个样本阵列的图片的一个化N亮度样本块及两个对应的色度样本块；或者树块为单色图片或用=种单独的颜色平面进行编码的图片的一个化N样本块。树块可针对不同编码和解码过程进行分割。对具有S 个样本阵列的图片进行树块分割时得到的树块分区为一个化N亮度样本块及两个对应的色度样本块；对单色图片或用=种单独的颜色平面进行编码的图片进行树块分割时得到的树块分区为一个亮度样本块。每个树块都分配了一个分区信令，用来标识用于帖内或帖间预测及用于变换编码的块大小。所述分割为递归的四分树分割。所述四分树的根节点与树块相关联。四分树被不断拆分，直至到达叶节点，叶节点被称为编码节点。编码节点为两个树的根节点，所述两个树为预测树和变换树。预测树指定预测块的位置和大小。预测树和相关预测数据称为预测单元。变换树指定变化块的位置和大小。变换树和相关变化数据称为变化单元。亮度和色度的拆分信息对于预测树是相同的，但对变换树可W相同也可W不同。编码节点及相关预测和变化单元共同组成编码单元。阳0创在肥VCWD5中，图片被划分为切片或图块。切片可W是树块序列，但（指所谓的细粒度切片时）也可将树块内变化单元和预测单元重合的位置作为其边界。切片内树块W 光栅扫描顺序进行编码和解码。对基础编码图片，将每个图片划分为切片的过程即分割过程。
[0043] 在肥VCWD5中，图块指的是同时出现在一列和一行的整数个树块，该树块在图块内W光栅扫描顺序连续排列。对基础编码图化将每个图片划分为图块的过程即分割过程。图块在图片内W光栅扫描顺序连续排列。尽管切片包含图块内W光栅扫描顺序连续排列的树块，但是运些树块却不一定在图片内W光栅扫描顺序连续排列。切片和图块不需包含相同的树块序列。图块可包括多个切片中包含的树块。同样，切片可包括多个图块中包含的树块。
[0044] 在H. 264/AVC和HEVC中，可跨切片边界禁用图内预测。由此，切片可看作将编码图片拆分为独立的可解码片段的方式，因此切片经常被当作传输的基本单位。很多情况下，编码器可在比特流中指示跨切片边界禁用的图内预测类型，解码器在确定可用预测源等操作时考虑该信息。例如，如果相邻宏块或CU位于不同的切片，则可认为来自该相邻宏块或 CU的样本对帖内预测不可用。
[0045] 语法元素可定义为比特流中呈现的数据元素。语法结构可定义为在比特流中一同 W-定的顺序呈现的零个或更多的语法元素。
[0046] 在一个肥VC草案中，还有第S种参数集类型，此处称为自适应参数集（APS)，其包括在多个编码切片中可能不会改变但在每个图片或每几个图片等中可能改变的参数。在一个肥VC草案中，AI^语法结构包括与量化矩阵（QM)、自适应样本偏移（SAO)、自适应环路滤波（AL巧及去块滤波相关联的参数或语法元素。在一个肥VC草案中，AI^为NAL单元，其编码不W其他NAL单元为参考或预测。在APSNAL单元中包括标识，即语法元素aps_id，切片头部也包括该标识，用于指示特定的APS。
[0047] 比264/AVC和肥VC语法容许大量的参数集实例，每个实例由唯一的标识符进

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：顾舟叶;郑建铧;林楠;张臣雄;
技术所有人：华为技术有限公司;圣塔克拉拉大学;
我是此专利的发明人

上一篇：丢失视频数据的条件隐藏的制作方法
上一篇：多内容视图显示装置和用于显示多内容视图的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。