支持针对片数据的多通路视频语法结构的方法和设备的制作方法

文档序号：7938011阅读：103来源：国知局

专利名称：支持针对片数据的多通路视频语法结构的方法和设备的制作方法
技术领域：
本发明总体上涉及视频编码和解码，更具体地，涉及支持针对片数据的多通路视频语法结构的方法和设备。

背景技术：
在一些编码策略中，帧分块(例如，宏块、子块和/或块)中的语法元素的编码取决于或依赖于对来自整个邻域(根据编码扫描顺序是因果或非因果的)的语法元素分配的数据。典型的宏块数据编码，例如在国际标准化组织/国际电工委员会(ISO/IEC)运动图像专家组-4(MPEG-4)的第10部分高级视频编码(AVC)标准/国际电信联盟电信部(ITU-T)H.264推荐标准(此后称之为“MPEG-4 AVC标准”)中执行的宏块数据编码，削弱了这种编码策略的使用，这是由于在扫描顺序中来自后续宏块的数据是不可用的。
MPEG-4 AVC标准提出了被分块成三种类别的片数据，其中，数据被基本划分如下类别A是除了残差以外的所有数据；类别B是残差数据的部分一；以及类别C是残差数据的部分二。数据分块的目的是差错复原。在解码器处，可以将三种类别的语法合并成一个完整情况并基于扫描顺序执行一通路分析。MPEG-4 AVC标准不允许关于整个宏块和/或块邻域的模式数据对运动数据进行条件和/或相依编码。此外，MPEG-4 AVC标准不允许在模式数据和运动数据内插入其他语法数据类。
根据第一现有技术方法的实际应用(例如，叶合并)仅集中于算法，并且不支持用于对数据进行适当系统编码的有序方案。
叶合并范例依赖于以下事实在图像编码领域，近来已发现用于表示几何图像特征的四叉树不能够获得最优的指数衰减速率失真行为。通过在速率失真(R-D)最优树修剪之后进行叶合并步骤可以纠正该问题。考虑到同样的问题，第一种现有技术方法注意到基于四叉树对视频压缩的运动表示具有同样的基本缺陷，该基本缺陷同样可以通过叶合并来克服。基于这些观察，第一种现有技术方法提出对MPEG-4 AVC标准所使用的现有模型的非迭代扩展，其中，在第一树分解之后，自适应地合并相邻的块以进行联合编码。这在对预测进行编码的块、这些块的编码模式和合并辅助信息之间产生了一系列因果和非因果相依性。为此，有必要关于扫描顺序以非因果方式来访问一些数据类。然而，第一种现有技术方法并没有提供一种系统且有序的方式来对必要数据类进行编码以将叶合并到编码流中。实际上，对于每个块，对合并假设进行测试。如果压缩效率通过与相邻块进行合并而提高，则使能合并以将该块与所选目标块合并。对于给定块的可能合并目标取决于相邻块模式，并取决于合并候选块的特定模式。因此，合并辅助信息取决于所有相邻块模式和合并候选块的特定模式。最终，预测编码将取决于块的合并辅助信息，其同时取决于相邻块的合并辅助信息以及本地和相邻编码模式。
转向图1，一般由参考数字100指示能够根据MPEG-4 AVC标准执行视频编码的视频编码器。
视频编码器100包括帧排序缓冲器110，帧排序缓冲器110具有与组合器185的非反相输入进行信号通信的输出。组合器185的输出以信号通信的方式与变换器和量化器125的第一输入相连接。变换器和量化器125的输出以信号通信的方式与熵编码器145的第一输入和逆变换器和逆量化器150的第一输入相连接。熵编码器145的输出以信号通信的方式与组合器190的第一非反相输入相连接。组合器190的输出以信号通信的方式与输出缓冲器135的第一输入相连接。
编码器控制器105的第一输出以信号通信的方式与帧排序缓冲器110的第二输入、逆变换器和逆量化器150的第二输入、图像类型判决模块115的输入、宏块类型(MB类型)判决模块120的输入、帧内预测模块160的第二输入、解块滤波器165的第二输入、运动补偿器170的第一输入、运动估计器175的第一输入、以及参考图像缓冲器180的第二输入相连接。
编码器控制器105的第二输出以信号通信的方式与补充增强信息(SEI)插入器130的第一输入、变换器和量化器125的第二输入、熵编码器145的第二输入、输出缓冲器135的第二输入、以及序列参数集(SPS)和图像参数集(PPS)插入器140的输入相连接。
图像类型判决模块115的第一输出以信号通信的方式与帧排序缓冲器110的第三输入相连接。图像类型判决模块115的第二输出以信号通信的方式与宏块类型判决模块120的第二输入相连接。
序列参数集(SPS)和图像参数集(PPS)插入器140的输出以信号通信的方式与组合器190的第三非反相输入相连接。
逆量化器和逆变换器150的输出以信号通信的方式与组合器127的第一非反相输入相连接。组合器127的输出以信号通信的方式与帧内预测模块160的第一输入和解块滤波器165的第一输入相连接。解块滤波器165的输出以信号通信的方式与参考图像缓冲器180的第一输入相连接。参考图像缓冲器180的输出以信号通信的方式与运动估计器175的第二输入相连接。运动估计器175的第一输出以信号通信的方式与运动补偿器170的第二输入相连接。运动估计器175的第二输出以信号通信的方式与熵编码器145的第三输入相连接。
运动补偿器170的输出以信号通信的方式与开关197的第一输入相连接。帧内预测模块160的输出以信号通信的方式与开关197的第二输入相连接。宏块类型判决模块120的输出以信号通信的方式与开关197的第三输入相连接。开关197的输出以信号通信的方式与组合器127的第二非反相输入相连接。
帧排序缓冲器110和编码器控制器105的输入可用作编码器100的输入，以用于接收输入图像101。此外，补充增强信息(SEI)插入器130的输入可用作编码器100的输入，以用于接收元数据。输出缓冲器135的输出可用作编码器100的输出，以用于输出比特流。
转向图2，一般由参考数字200指示能够根据MPEG-4 AVC标准执行视频解码的视频解码器。
视频解码器200包括输入缓冲器210，该输入缓冲器210具有与熵解码器245的第一输入以信号通信的方式相连接的输出。熵解码器245的第一输出以信号通信的方式与逆变换器和逆量化器250的第一输入相连接。逆变换器和逆量化器250的输出以信号通信的方式与组合器225的第二非反相输入相连接。组合器225的输出以信号通信的方式与解块滤波器265的第二输入和帧内预测模块260的第一输入相连接。解块滤波器265的第二输出以信号通信的方式与参考图像缓冲器280的第一输入相连接。参考图像缓冲器280的输出以信号通信的方式与运动补偿器270的第二输入相连接。
熵解码器245的第二输出以信号通信的方式与运动补偿器270的第三输入和解块滤波器265的第一输入相连接。熵解码器245的第三输出以信号通信的方式与解码器控制器205的输入相连接。解码器控制器205的第一输出以信号通信的方式与熵解码器245的第二输入相连接。解码器控制器205的第二输出以信号通信的方式与逆变换器和逆量化器250的第二输入相连接。解码器控制器205的第三输出以信号通信的方式与解块滤波器265的第三输入相连接。解码器控制器205的第四输出以信号通信的方式与帧内预测模块260的第二输入、运动补偿器270的第一输入、以及参考图像缓冲器280的第二输入相连接。
运动补偿器270的输出以信号通信的方式与开关297的第一输入相连接。帧内预测模块260的输出以信号通信的方式与开关297的第二输入相连接。开关297的输出以信号通信的方式与组合器225的第一非反相输入相连接。
输入缓冲器210的输入可用作解码器400的输入，以用用接收输入比特流。解块滤波器265的第一输出可用作解码器200的输出，以用于对输出图像进行输出。

发明内容
本发明解决了现有技术的这些和其他缺点和缺陷，本发明针对支持针对片数据的多通路视频语法结构的方法和设备。
根据本发明的一个方面，提供了一种设备。所述设备包括用于对与图像的至少一部分的至少两个分块有关的至少一个语法数据元素进行编码的编码器。所述至少一个语法元素被编码在多通路语法结构内。所述至少一个语法元素属于给定的数据类。所述编码器在对下个数据类进行编码之前对关于所述图像的至少所述部分的所有分块的所述至少一个语法数据元素进行编码，其中，关于比所述下个类更早编码的在先编码数据类，包括所述下个类在内的在后编码数据类具有因果相依性和非因果相依性当中的至少一个的显式编码和隐式编码当中的至少一个。
根据本发明的另一方面，提供了一种方法，所述方法包括对于与图像的至少一部分的至少两个分块相关的至少一个语法数据元素进行编码。所述至少一个语法元素被编码在多通路语法结构内。所述至少一个语法元素属于给定的数据类。编码步骤在对下个数据类进行编码之前对关于所述图像的至少所述部分的所有分块的所述至少一个语法数据元素进行编码，其中，包括所述下个类在内的在后编码数据类具有关于比所述下个类更早编码的在先编码数据类的因果相依性和非因果相依性当中的至少一个的显式编码和隐式编码当中的至少一个。
根据本发明的又一方面，提供了一种设备。所述设备包括用于对与图像的至少一部分的至少两个分块有关的至少一个语法数据元素进行解码的解码器。所述至少一个语法元素是从多通路语法结构中被解码的。所述至少一个语法元素属于给定的数据类。解码器在对下个数据类进行解码之前对关于所述图像的至少所述部分的所有分块的所述至少一个语法数据元素进行解码，其中，包括所述下个类在内的在后解码数据类具有关于比所述下个类更早解码的在先解码数据类的因果相依性和非因果相依性当中的至少一个的显式解码和隐式解码当中的至少一个。
根据本发明的另一方面，提供了一种方法。所述方法包括对与图像的至少一部分的至少两个分块有关的至少一个语法数据元素进行解码。所述至少一个语法元素是从多通路语法结构中被解码的。所述至少一个语法元素属于给定的数据类。所述解码步骤在对下个数据类进行解码之前对关于所述图像的至少所述部分的所有分块的所述至少一个语法数据元素进行解码，其中，包括所述下个类在内的在后解码数据类，具有关于比所述下个类更早解码的在先解码数据类的因果相依性和非因果相依性当中的至少一个的显式解码和隐式解码当中的至少一个。
根据结合附图阅读的以下示例实施例的详细描述，本发明的这些和其他方面、特征和优点将变得显而易见。

根据以下示例附图可以更好地理解本发明，在附图中图1示出了能够根据MPEG-4 AVC标准来执行视频编码的视频编码器的框图；图2示出了能够根据MPEG-4 AVC标准来执行视频解码的视频解码器的框图；图3示出了根据本发明实施例的能够根据MPEG-4 AVC标准来执行视频编码的、被扩展为供本发明使用的示例视频编码器的框图；图4示出了根据本发明实施例的能够根据MPEG-4 AVC标准来执行视频解码的、被扩展为供本发明使用的示例视频解码器的框图；图5示出了根据本发明实施例的针对片数据进行多通路语法编码的示例方法的流程图；图6示出了根据本发明实施例的针对片数据进行多通路语法解码的示例方法的流程图；图7示出了根据本发明实施例的、在片数据的多通路语法编码中对针对一个宏块的运动矢量和残差进行编码的示例方法的流程图；以及图8示出了根据本发明实施例的、在片数据的多通路语法解码中对针对一个宏块的运动矢量和残差进行解码的示例方法的流程图。

具体实施例方式 本发明针对支持针对片数据的多通路视频语法结构的方法和设备。
本说明书示意了本发明。因此将理解的是，尽管这里没有明确描述或示出，本领域的技术人员将能够设想体现本发明并包括在本发明精神和范围内的各种布置。
这里所引述的所有示例和条件性语言均为了教导的目的，以帮助读者理解本发明以及发明人对现有技术做出贡献的构思，并且将被理解为不限于这些具体引述的示例和条件。
此外，这里对本发明的原理、方面、实施例及其特定示例做出引述的所有声明意在包括本发明的结构和功能上的等同物。另外，该等同物将包括当前已知的等同物以及将来开发出的等同物，即所开发出来的执行相同功能的任何组件，而与结构无关。
因此，本领域的技术人员可以理解，例如这里所表示的框图展示出体现本发明的示意性电路的概念图。类似地，将理解，任何流程、流程图、状态转移图、伪码等表现出实质上可以在计算机可读介质上表现的、并且由计算机或处理器执行的各个过程，无论是否明确示出该计算机或处理器。
可以通过使用专用硬件和能够与适合的软件一同执行软件的硬件而实现图中所示各个组件的功能。当由处理器来提供时，这些功能可以由单个的专用处理器、单个的共享处理器、或其中的一些可以被共享的多个单独的处理器来提供。此外，术语“处理器”或“控制器”的显式使用不应被解释为排他性地指代能够执行软件的硬件，而且可以隐式地包括(不限为)数字信号处理器(“DSP”)硬件、用于存储软件的只读存储器(“ROM”)、随机存取存储器(“RAM”)以及非易失性存储器。
还可以包括常规和/或专用的其它硬件。类似地，图中所示的任何开关仅是概念上的。可以通过程序逻辑的操作、专用逻辑、程序控制和专用逻辑的交互、或甚至是手动地实现这些开关的功能，如从上下文中更明确理解的，具体的技术是可以由实施者来选择的。
在权利要求书中，表示为用于执行特定功能的装置的任何组件意在包括执行该功能的任何方式，例如包括a)执行该功能的电路组件的组合，或b)任意形式的软件，从而包括固件、微代码等，与用于执行该软件的适合电路相组合以执行该功能。由权利要求所限定的本发明在于如下事实将各个引述的装置所提供的功能以权利要求所要求的方式组合在一起。因此，可以把能够提供这些功能的任意装置看作与这里所示的装置相等同。
在说明书中涉及本发明原理的“一个实施例”或“实施例”是指结合实施例描述的特定特征、结构、特性等包括在本发明的至少一个实施例中。因此，贯穿说明书在不同地方出现的术语“在一个实施例中”或“在实施例中”不必均指相同的实施例。
此外，应当理解的是，术语“和/或”以及“……当中的至少一个”的使用，例如在“A和/或B”以及“A和B当中的至少一个”的情况下，意在包括仅选择第一所列项目(A)、仅选择第二所列项目(B)、或选择两个项目(A和B)。作为另一示例，在“A、B和/或C”和“A、B和C当中的至少一个”的情况下，这样的表示意在包括仅选择第一所列项目(A)、仅选择第二所列项目(B)、仅选择第三所列项目(C)、选择第一和第二所列项目(A和B)、选择第一和第三所列项目(A和C)、选择第二和第三所列项目(B和C)、或选择所有三个项目(A和B和C)。对于本领域和相关领域的普通技术人员之一来说显而易见的是，以上所述可以扩展到许多所列项目的情况。
转向图3，一般由参考数字300指示能够根据MPEG-4 AVC标准执行视频编码的视频编码器。
视频编码器300包括帧排序缓冲器310，帧排序缓冲器310具有与组合器385的非反相输入进行信号通信的输出。组合器385的输出以信号通信的方式与变换器和量化器325的第一输入相连接。变换器和量化器325的输出以信号通信的方式与具有多通路语法的熵编码器345的第一输入、逆变换器和逆量化器350的第一输入相连接。具有多通路语法的熵编码器345的输出以信号通信的方式与组合器390的第一非反相输入相连接。组合器390的输出以信号通信的方式与输出缓冲器335的第一输入相连接。
具有多通路语法的编码器控制器305以信号通信的方式与帧排序缓冲器310的第二输入、逆变换器和逆量化器350的第二输入、图像类型判决模块315的输入、宏块类型(MB类型)判决模块320的输入、帧内预测模块360的第二输入、解块滤波器365的第二输入、运动补偿器370的第一输入、运动估计器375的第一输入、以及参考图像缓冲器380的第二输入相连接。
具有多通路语法的编码器控制器305的第二输出以信号通信的方式与补充增强信息(SEI)插入器330的第一输入、变换器和量化器325的第二输入、具有多通路语法的熵编码器345的第二输入、输出缓冲器335的第二输入、序列参数集(SPS)和图像参数集(PPS)插入器340的输入相连接。
图像类型判决模块315的第一输出以信号通信的方式与帧排序缓冲器310的第三输入相连接。图像类型判决模块315的第二输出以信号通信的方式与宏块类型判决模块320的第二输入相连接。
序列参数集(SPS)和图像参数集(PPS)插入器340的输出以信号通信的方式与组合器390的第三非反相输入相连接。
逆量化器和逆变换器350的输出以信号通信的方式与组合器327的第一非反相输入相连接。组合器327的输出以信号通信的方式与帧内预测模块360的第一输入和解块滤波器365的第一输入相连接。解块滤波器365的输出以信号通信的方式与参考图像缓冲器380的第一输入相连接。参考图像缓冲器380的输出以信号通信方式与运动估计器375的第二输入相连接。运动估计器375的第一输出以信号通信方式与运动补充器370的第二输入相连接。运动估计器375的第二输出以信号通信方式与具有多通路语法的熵编码器345的第三输入相连接。
运动补偿器370的输出以信号通信方式与开关397的第一输入相连接。帧内预测模块360的输出以信号通信的方式与开关397的第二输入相连接。宏块类型判决模块320的输出以信号通信的方式与开关397的第三输入相连接。开关397的输出以信号通信的方式与组合器327的第二非反相输入相连接。
具有多通路语法的编码器控制器305的第三输出以信号通信的方式与块合并判决单元333的第二输入相连接。宏块类型判决模块320的第二输出以信号通信的方式与块合并判决单元333的第一输入相连接。块合并判决单元333的第一输出以信号通信的方式与具有多通路语法的熵编码器345的第四输入相连接。块合并判决单元333的第二输出以信号通信的方式与运动估计器375的第三输入相连接。
帧排序缓冲器310和具有多通路语法的编码器控制器305的输入可用作编码器300的输入，以用于接收输入图像301。此外，补充增强信息(SEI)插入器330的输入可用作编码器300的输入，以用于接收元数据。输出缓冲器335的输出可用作编码器300的输出，以用于输出比特流。
转向图4，一般由参考数字400指示能够根据MPEG-4 AVC标准执行视频解码的视频解码器。
视频解码器400包括输入缓冲器410，输入缓冲器410具有与具有多通路语法的熵解码器445的第一输入进行信号通信的输出。具有多通路语法的熵解码器445的第一输出以信号通信的方式与逆变换器和逆量化器450的第一输入相连接。逆变化器和逆量化器450的输出以信号通信的方式与组合器425的第二非反相输入相连接。组合器425的输出以信号通信的方式与解块滤波器465的第二输入和帧内预测模块460的第一输入相连接。解块滤波器465的第二输出以信号通信的方式与参考图像缓冲器480的第一输入相连接。参考图像缓冲器480的输出以信号通信的方式与运动补偿器470的第二输入相连接。
具有多通路语法的熵解码器445的第二输出以信号通信的方式与运动补偿器470的第三输入和解块滤波器465的第一输入相连接。具有多通路语法的熵解码器445的第三输出以信号通信的方式与具有多通路语法的解码器控制器405的输入相连接。具有多通路语法的解码器控制器405的第一输出以信号通信的方式与具有多通路语法的熵解码器445的第二输入相连接。具有多通路语法的解码器控制器405的第二输出以信号通信的方式与逆变换器和逆量化器450的第二输入相连接。具有多通路语法的解码器控制器405的第三输出以信号通信的方式与解块滤波器465的第三输入相连接。具有多通路语法的解码器控制器405的第四输出以信号通信的方式与帧内预测模块460的第二输入、运动补偿器470的第一输入、参考图像缓冲器480的第二输入、以及块合并单元433的输入相连接。块合并单元433的第一输出以信号通信的方式与具有多通路语法的熵解码器445的第三输入相连接。块合并单元433的第二输出以信号通信的方式与运动补偿器470的第四输入相连接。
运动补偿器470的输出以信号通信的方式与开关497的第一输入相连接。帧内预测模块460的输出以信号通信的方式与开关497的第二输入相连接。开关497的输出以信号通信的方式与组合器425的第一非反相输入相连接。
输入缓冲器410的输入可用作解码器400的输入，以用于接收输入比特流。解块滤波器465的第一输出可用作解码器400的输出，以用于对输出图像进行输出。
如上所述，本发明针对支持针对片数据的多通路视频语法结构的方法和设备。
根据实施例，将宏块数据划分成若干类的片数据语法，并且在输出下个类的数据之前针对所有宏块输出每个类的数据。这使得可以使用给定语法类的整个宏块邻域中的已解码的数据来对关于所述给定语法类在后编码的其他语法数据类进行条件和/或相依编码。在实施例中，允许使用基于叶合并技术(例如，与上述第一现有技术方法有关的叶合并技术)的数据条件编码。确实，基于来自整个宏块邻域的宏块模式数据和用于指示合并信息的专用额外语法(这两种数据都是在片语法的不同通路中编码的)，可以有条件地对诸如运动和/或参考图像等数据进行编码。
因此，根据实施例，提出了针对片数据编码的多通路语法结构。所提出的针对片数据编码的多通路结构允许考虑宏块和/或块的整个邻域(因果和非因果的)对该宏块语法元素和/或该块语法元素进行条件和/或相关编码和/或进行分析。
在一个实施例中，针对片数据编码使用多通路语法结构。在片数据中使用若干连续的编码循环，以按顺序进行编码，首先是针对所有宏块的与所有模式和/或子模式相关的数据，然后是与预测相关的数据以及与残差相关的数据。还可以根据MPEG-4 AVC标准数据类别来进一步分块与残差相关的数据。此外，为了使用辅助信息来插入对预测的条件编码，还可以将其他数据类插入到附加数据通路形式的片数据通路内。
如上所述，多通路片数据语法结构的实施例针对叶合并编码技术。在实施例中，首先，按照宏块和子块的普通扫描顺序对片内的所有模式数据进行编码。然后，第二语法通路对针对所有宏块和子块的所有合并信息进行编码。该第二通路基于来自第一通路的模式数据的周围相邻信息来获得用于当前块的合并信息进行条件和/或隐式编码的许多编码规则。第三通路根据已可用的数据(例如，在实施例中，来自所有宏块的模式和合并信息)有条件地(和/或隐式地)对预测数据进行编码。
转向图5，一般由参考数字500指示针对片数据的多通路语法编码的示例方法。
方法500包括将控制传递至循环限制框510的开始框505。循环限制框510在(正被处理的)当前片中的每个宏块上执行循环，并将控制传递至功能框515。功能框515对宏块和子块编码模式进行编码，并将控制传递至循环限制框520。循环限制框520结束在当前片中每个宏块上的循环，并将控制传递至循环限制框525。循环限制框525在当前片中的每个宏块上执行循环，并将控制传递至功能框530。功能框530基于来自关于当前宏块的因果和/或非因果邻域的模式信息(针对第一已编码数据类)对宏块和子块合并语法(针对第二已编码数据类)进行显示或隐式地编码，并将控制传递至循环限制框535。功能框535结束在当前片中的每个宏块上的循环，并将控制传递至循环限制框540。循环限制框540在当前片中的每个宏块上执行循环，并将控制传递至功能框545。功能框545基于来自关于当前宏块的因果和/或非因果邻域的宏块和子块模式(针对第一已编码数据类)以及宏块和子块合并语法(针对第二已编码数据类)对运动数据(针对第三已编码数据类)进行显示或隐式地编码以及进行残差编码，并将控制传递至循环限制框550。循环限制框550结束在当前片中的每个宏块上的循环，并将控制传递至结束框599。
转向图6，一般由参考数字600指示针对片数据的多通路语法解码的示例方法。
方法600包括将控制传递至循环限制框610的开始框605。循环限制框610在(正被处理的)当前片中的每个宏块上执行循环，并将控制传递至功能框615。功能框615对宏块和子块编码模式进行解码，并将控制传递至循环限制框620。循环限制框620结束在当前片中的每个宏块上的循环，并将控制传递至循环限制框625。循环限制框625在当前片中的每个宏块上执行循环，并将控制传递至功能框630。功能框630基于来自关于当前宏块的因果和/或非因果邻域的模式信息(针对第一已编码数据类)对宏块和子块合并语法(针对第二已编码数据类)进行显示或隐式地解码，并将控制传递至循环限制框635。功能框635结束在当前片中的每个宏块上的循环，并将控制传递至循环限制框640。循环限制框640在当前片中的每个宏块上执行循环，并将控制传递至功能框645。功能框645根据来自因果和/或非因果邻域的宏块和子块模式(针对第一已编码数据类)以及宏块和子块合并语法(针对第二已编码数据类)对运动数据(针对第三已编码数据类)进行显示或隐式地解码以及进行残差解码，并将控制传递至循环限制框650。循环限制框650结束在当前片中的每个宏块上的循环，并将控制传递至结束框699。
转向图7，一般由参考数字700指示在片数据的多通路语法编码中对一个宏块的运动矢量和残差进行编码的示例方法。
方法700包括将控制传递至循环限制框710的开始框705。循环限制框710在当前宏块中的每个块上执行循环，并将控制传递至判决框715。判决框715确定当前块是非合并的还是来自已合并段的第一块。如果是，将控制传递至功能框720。否则，将控制传递至循环限制框725。
功能框720对运动信息进行编码，并将控制传递至循环限制框725。
循环限制框725结束在当前宏块中的每个块上的循环，并将控制传递至功能框730。功能框730执行残差编码，并将控制传递至结束框799。
转向图8，一般由参考数字800指示在片数据的多通路语法解码中对一个宏块的运动矢量和残差进行解码的示例方法。
方法800包括将控制传递至循环限制框810的开始框805。循环限制框810在当前宏块中的每个块上执行循环，并将控制传递至判决框815。判决框815确定当前块是非合并的还是来自已合并段的第一块。如果是，将控制传递至功能框820。否则，将控制传递至循环限制框825。
功能框820对运动信息进行解码，并将控制传递至循环限制框825。
循环限制框825结束在当前宏块中的每个块上的循环，并将控制传递至功能框830。功能框830执行残差解码，并将控制传递至结束框899。
以下表明确描述了用于使用叶合并和合并辅助信息对预测数据进行条件和/或关联编码的多通路片语法数据编码的实施例。
表1示出了根据本发明实施例的针对多通路片语法数据编码的slice_data()函数的语法。
表1 表2示出了根据本发明实施例的针对多通路片语法数据编码的macroblocK_layer_getMBmode_only()函数的语法。
表2 表3示出了根据本发明实施例的针对多通路片语法数据的macroblock_layer_getMergeInfo_only()函数的语法。
表3 表4示出了根据本发明实施例的针对多通路片语法数据编码的macroblocK_layer_getPredictionData&Residual_only()函数的语法。
表4 表5示出了根据本发明实施例的针对多通路片语法数据编码的sub_mb_pred subMBMode_only(mb_type)函数的语法。
表5 表6示出了根据本发明实施例的针对多通路片语法数据编码的sub_mb_pred_PredictionData_only(mb_type)函数的语法。
表6 表7示出了根据本发明实施例的针对多通路片语法数据编码的mb_pred(mb_type)函数的语法。
表7 表8示出了根据本发明实施例的针对多通路片语法数据编码的sub_mb_get_mergeinfo(mb_type)函数的语法。
表8 表9示出了根据本发明实施例的针对多通路片语法数据编码的get_mergeinfo(mb_type)函数的语法。
表9 现在将对本发明的许多附带优点/特征中的一些给出描述，这些优点/特征当中的一些以上已经提到过。例如，一个优点/特征是包括对与图像的至少一部分的至少两个分块有关的至少一个语法数据元素进行编码的编码器的设备。所述至少一个语法元素被编码在多通路语法结构内。所述至少一个语法元素属于给定的数据类。编码器在对下个数据类进行编码之前对关于所述图像的至少所述部分的所有分块的所述至少一个语法数据元素进行编码，其中，关于比所述下个类更早编码的在先编码数据类，包括所述下个类在内的在后编码数据类具有因果相依性和非因果相依性当中的至少一个的显式编码和隐式编码当中的至少一个。
另一优点/特征是，具有编码器的上述设备，其中，编码器是现有视频编码标准或视频编码推荐标准的现有编码器的扩展版本。
又一优点/特征是具有编码器的上述设备，其中，多通路语法结构用于片语法编码。
又一优点/特征是具有编码器的上述设备，其中，使用高级语法元素中的至少一个语法数据字段来启用或禁用多通路语法结构的使用。
此外，另一优点/特征是具有编码器的上述设备，其中，所述至少两个分块的模式数据和预测数据与不同的数据类有关。
此外，另一优点/特征是具有编码器的上述设备，其中，数据包括模式数据和运动数据，并且在模式数据和运动数据内插入针对基于叶合并的编码的特定数据类。
基于这里的教导，本领域的普通技术人员可以容易地确定本发明的这些以及其它特征和优点。应理解的是，本发明的教导可以以各种形式的硬件、软件、固件、专用处理器或其组合来实现。
最优选地，将本发明的教导实现为硬件和软件的组合。此外，可以将该软件实现为在程序存储单元上具体体现的应用程序。可将该应用程序上载到包括任何适合架构在内的机器并由该机器执行。优选地，在具有硬件(如，一个或多个中央处理单元(“CPU”)、随机存取存储器(“RAM”)以及输入/输出(“I/O”)接口)的计算机平台上实现该机器。该计算机平台还可以包括操作系统和微指令代码。这里描述的各种处理和功能可以是可由CPU执行的微指令代码的一部分或应用程序的一部分，或其组合。此外，可将其它各种外围单元连接到计算机平台，如附加的数据存储单元和打印单元。
还应理解的是，由于在附图中描述的一些构成系统组件和方法优选地以软件来实现，所以系统组件或处理功能块之间的实际连接可以依据对本发明编程的方式的不同而不同。在这里给出教导的情况下，本领域的普通技术人员将能够想到本发明的这些以及类似的实现方式或配置。
虽然这里参考附图描述了示意性的实施例，但是应理解的是，本发明并不限于这些确定的实施例，在不背离本发明的范围或精神的情况下，本领域的普通技术人员可以实现各种变化和修改。所有这些变化和修改都旨在包括在如所附权利要求中所阐述的本发明的范围内。
权利要求
1、一种设备，包括
编码器(300)，用于对与图像的至少一部分的至少两个分块有关的至少一个语法数据元素进行编码，其中，所述至少一个语法元素被编码在多通路语法结构内，所述至少一个语法元素属于给定的数据类，并且所述编码器在对下个数据类进行编码之前对关于所述图像的至少所述部分的所有分块的所述至少一个语法数据元素进行编码，其中，关于比所述下个类更早编码的在先编码数据类，包括所述下个类在内的在后编码数据类具有因果相依性和非因果相依性当中的至少一个的显式编码和隐式编码当中的至少一个。
2、根据权利要求1所述的设备，其中，编码器(300)是现有视频编码标准或视频编码推荐标准的现有编码器的扩展版本。
3、根据权利要求1所述的设备，其中，多通路语法结构用于片语法编码。
4、根据权利要求1所述的设备，其中，使用高级语法元素中的至少一个语法数据字段来启用或禁用多通路语法结构的使用。
5、根据权利要求1所述的设备，其中，针对所述至少两个分块的模式数据和预测数据与不同的数据类有关。
6、根据权利要求1所述的设备，其中，所述数据包括模式数据和运动数据，并且在模式数据和运动数据内插入针对基于叶合并的编码的特定数据类。
7、一种方法，包括
对于与图像的至少一部分的至少两个分块相关的至少一个语法数据元素进行编码，其中，所述至少一个语法元素被编码在多通路语法结构内，所述至少一个语法元素属于给定的数据类，并且所述编码步骤在对下个数据类进行编码之前对关于所述图像的至少所述部分的所有分块的所述至少一个语法数据元素进行编码，其中，关于比所述下个类更早编码的在先编码数据类，包括所述下个类在内的在后编码数据类具有因果相依性和非因果相依性当中的至少一个的显式编码和隐式编码当中的至少一个(515、530、545)。
8、根据权利要求7所述的方法，其中，所述方法由编码器来执行，所述编码器是现有视频编码标准或视频编码推荐标准的现有编码器的扩展版本。
9、根据权利要求7所述的方法，其中，多通路语法结构用于片语法编码(510、520、525、535、540、550)。
10、根据权利要求7所述的方法，其中，使用高级语法元素中的至少一个语法数据字段来启用或禁用多通路语法结构的使用。
11、根据权利要求7所述的方法，其中，针对所述至少两个分块的模式数据和预测数据与不同的数据类有关(515、545)。
12、根据权利要求7所述的方法，其中，所述数据包括模式数据和运动数据，并且在模式数据和运动数据内插入针对基于叶合并的编码的特定数据类。
13、一种设备，包括
解码器(400)，用于对与图像的至少一部分的至少两个分块有关的至少一个语法数据元素进行解码，其中，所述至少一个语法元素是从多通路语法结构中被解码的，所述至少一个语法元素属于给定的数据类，并且所述解码器在对下个数据类进行解码之前对关于所述图像的至少所述部分的所有分块的所述至少一个语法数据元素进行解码，其中，关于比所述下个类更早解码的在先解码数据类，包括所述下个类在内的在后解码数据类具有因果相依性和非因果相依性当中的至少一个的显式解码和隐式解码当中的至少一个。
14、根据权利要求13所述的设备，其中，解码器(400)是现有视频编码标准或视频编码推荐标准的现有解码器的扩展版本。
15、根据权利要求13所述的设备，其中，多通路语法结构用于片语法解码。
16、根据权利要求13所述的设备，其中，使用高级语法元素中的至少一个语法数据字段来启用或禁用多通路语法结构的使用。
17、根据权利要求13所述的设备，其中，针对所述至少两个分块的模式数据和预测数据与不同的数据类有关。
18、根据权利要求13所述的设备，其中，所述数据包括模式数据和运动数据，并且在模式数据和运动数据内插入针对基于叶合并的编码的特定数据类。
19、一种方法，包括
对与图像的至少一部分的至少两个分块有关的至少一个语法数据元素进行解码，其中，所述至少一个语法元素是从多通路语法结构中被解码的，所述至少一个语法元素属于给定的数据类，并且所述解码步骤在对下个数据类进行解码之前对关于所述图像的至少所述部分的所有分块的所述至少一个语法数据元素进行解码，其中，关于比所述下个类更早解码的在先解码数据类，包括所述下个类在内的在后解码数据类具有因果相依性和非因果相依性当中的至少一个的显式解码和隐式解码当中的至少一个。
20、根据权利要求19所述的方法，其中，解码器是现有视频编码标准或视频编码推荐标准的现有解码器的扩展版本。
21、根据权利要求19所述的方法，其中，多通路语法结构用于片语法解码(610、620、625、635、640、650)。
22、根据权利要求19所述的方法，其中，使用高级语法元素中的至少一个语法数据字段来启用或禁用多通路语法结构的使用。
23、根据权利要求19所述的方法，其中，针对所述至少两个分块的模式数据和预测数据与不同的数据类有关(615、645)。
24、根据权利要求19所述的方法，其中，所述数据包括模式数据和运动数据，并且在模式数据和运动数据内插入针对基于叶合并的编码的特定数据类(630)。
25、一种其上编码了视频信号数据的存储介质，包括
与图像的至少一部分的至少两个分块有关的至少一个语法数据元素，其中，所述至少一个语法元素被编码在多通路语法结构内，所述至少一个语法元素属于给定的数据类，并且在对下个数据类进行解码之前对关于所述图像的至少所述部分的所有分块的所述至少一个语法数据元素进行编码，其中，关于比所述下个类更早编码的在先编码数据类，包括所述下个类在内的在后编码数据类具有因果相依性和非因果相依性当中的至少一个的显式编码和隐式编码当中的至少一个。
全文摘要
本发明提供了支持针对片数据的多通路视频结构的方法和设备。设备包括编码器(300)，所述编码器(300)用于对与图像的至少一部分的至少两个分块有关的至少一个语法数据元素进行编码。所述至少一个语法元素被编码在多通路语法结构内。所述至少一个语法元素属于给定的数据类。编码器(300)在对下个数据类进行编码之前对关于所述图像的至少所述部分中的所有分块的所述至少一个语法数据元素进行编码，其中，包括所述下个类在内的在后编码数据类具有关于比所述下个类更早编码的在先编码数据类的因果相依性和非因果相依性当中的至少一个的显式编码和隐式编码当中的至少一个。
文档编号H04N7/26GK101682763SQ200880015603
公开日2010年3月24日申请日期2008年5月29日优先权日2007年6月12日
发明者奥斯卡·迪沃拉埃斯科达, 鹏尹, 普尔温·比贝哈斯·潘迪特申请人:汤姆森许可贸易公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：奥斯卡.迪沃拉埃斯科达;尹鹏;普尔温.比贝哈斯.潘迪特
技术所有人：汤姆森许可贸易公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。