有效度图编码的复杂度降低的制作方法

文档序号：12890341阅读：208来源：国知局

本申请是同一申请人的申请日为2013年1月18日的、申请号为201380000180.7(pct/us2013/022267)、发明名称为“有效度图编码的复杂度降低”的中国发明专利申请的分案申请。相关申请的交叉引用本申请根据美国法典第35篇第119条(e)款要求2012年1月20日提交的申请号为61/589,183且发明名称为“complexityreductionofsignificancemapcoding(有效度图编码的复杂度降低)”的美国临时申请的优先权，因此通过全文引用将其并入本文以用于所有目的。本发明涉及视频编码领域。更具体地，本发明涉及视频编码的复杂度降低。
背景技术：
：为了编码significant_coeff_flag(有效系数标记)，已经使用了以下的方法：基于位置的4×4编码方法，其中将9段临近关系(context)用于亮度且将6段临近关系用于色度；基于位置的8×8编码方法，其中将11段临近关系用于亮度且将11段临近关系用于色度；以及基于掩码的16×16/32×32编码方法，其中将7段临近关系用于亮度且将4段临近关系用于色度。如图1所示，基于位置的4×4编码方法具有用于亮度102和色度100的有效度图(significancemap)的不同分组。因此，供色度102和亮度100使用的不同映射被用于将有效度图内的位置映射为对应的临近关系索引增量。结果就存在以下的复杂度：两个15元素的映射表被用于确定临近关系增量，并且需要用基于亮度/色度决策的支路来确定4×4、8×8和16×16/32×32有效度图编码中的临近关系增量。技术实现要素：将相同的映射用于选择4×4的亮度和色度临近关系即可降低视频编码例如高效视频编码(hevc)中编码significant_coeff_flag的复杂度。结果就能够去除用于选择significant_coeff_flag临近关系索引的15元素查找表和多条支路，并且wd文本也得以简化。在一个方面中，一种降低在设备内编写的非零4×4有效度图编码复杂度的方法包括扫描量化的变换系数，确定最后一个非零量化系数的位置，并根据量化的变换系数生成有效度图，其中在最后一个非零量化系数之前的量化变换系数的有效度将相同数量的临近关系和相同的映射用于亮度和色度以确定临近关系索引增量。临近关系增量映射包括单个15元素的查找表。所述方法进一步包括编码视频内容而无需基于8×8、16×16和32×32有效度图中的至少一个的亮度/色度决策来确定临近关系偏移量。所述设备选自由个人计算机、膝上型计算机、计算机工作站、服务器、大型计算机、手持式计算机、个人数字助理、蜂窝/移动电话、智能电话、智能家电、游戏机、数字照相机、数码摄像机、照相电话、便携式音乐播放器、平板计算机、视频播放器、dvd刻录机/播放器、高清视频刻录机/播放器、电视和家庭娱乐系统等构成的组。在另一个方面中，一种编码器包括在硬件内编写的被配置成扫描量化变换系数的扫描模块，在硬件内编写的被配置成生成最后一个非零量化变换系数的位置的第一生成模块，以及在硬件内编写的被配置成根据量化的变换系数生成有效度图的第二生成模块，其中在最后一个非零量化系数之前的量化变换系数的有效度将相同数量的临近关系和相同的映射用于亮度和色度以确定临近关系索引增量。临近关系增量映射包括单个15元素的查找表。编码器进一步包括在硬件内编写的编码模块用于在不基于8×8、16×16和32×32有效度图中的至少一个的亮度/色度决策来确定临近关系偏移量的情况下对视频内容进行编码。编码器被包含在设备内，所述设备选自由个人计算机、膝上型计算机、计算机工作站、服务器、大型计算机、手持式计算机、个人数字助理、蜂窝/移动电话、智能电话、智能家电、游戏机、数字照相机、数码摄像机、照相电话、便携式音乐播放器、平板计算机、视频播放器、dvd刻录机/播放器、高清视频刻录机/播放器、电视和家庭娱乐系统等构成的组。在另一种应用中，一种装置包括用于存储应用程序的非暂时性存储器，所述应用程序用于根据量化的变换系数生成有效度图，其中在最后一个非零量化系数之前的量化变换系数的有效度将相同数量的临近关系和相同的映射用于亮度和色度以确定临近关系索引增量，还包括耦合至存储器的处理组件，所述处理组件被配置成处理所述应用程序。所述应用程序进一步用于扫描量化的变换系数。临近关系增量映射包括单个15元素的查找表。所述应用程序进一步用于在不基于8×8、16×16和32×32有效度图中的至少一个的亮度/色度决策来确定临近关系偏移量的情况下对视频内容进行编码。附图说明图1根据某些实施例示出了有效度图的示意图，其中具有用于亮度和色度临近关系的不同分组。图2根据某些实施例示出了有效度图的示意图，其中亮度和色度临近关系具有相同数量的临近关系和相同的临近关系索引增量映射。图3根据某些实施例示出了有效度图编码的复杂度降低方法的流程图。图4根据某些实施例示出了被配置成实施降低了复杂度的有效度图编码方法的示范性计算设备的方块图。图5根据某些实施例示出了hevc编码器的总图。图6根据某些实施例示出了hevc解码器的总图。具体实施方式视频压缩被用于更加高效地发送和接收数字视频信息。视频压缩采用多种技术来减少或去除视频序列中的冗余数据。在高效视频编码(hevc)中，视频帧被划分为编码单元(cu)。cu能够被细分为用于预测或变换的更小区块。每一个cu都能被进一步划分为预测单元(pu)和变换单元(tu)。cu通常具有一个标记为y的亮度分量以及两个标记为u和v的色度分量。为了编码数据块而导出用于该数据块的预测块。预测块能够通过帧内(i)预测(例如空间预测)或帧间(p或b)预测(例如时间预测)而导出。通过识别预测块确定原始视频数据块及其预测块之间的差值。这种差值被称作预测残差数据并指明了被编码区块内的像素值和选择用于表示被编码区块的预测块内的像素值之间的像素差值。为了实现更好的压缩，预测残差数据能够(例如使用离散余弦变换(dct)或另外的变换方法)来进行变换。变换块内的残差数据能够被排列为驻留在空间像素域内的像素差值的二维(2d)数组。变换将像素残差值转化为变换域例如频域内变换系数的二维数组。为了进一步压缩，变换系数能够在熵编码之前即被量化。熵编码器对量化的变换系数进行熵编码例如临近关系自适应变长编码(cavlc)、临近关系自适应二进制算术编码(cabac)、概率区间划分熵编码(pipe)或另外的熵编码。为了对量化的变换系数块进行熵编码，通常要执行扫描过程以根据变换系数的有序一维(1-d)数组(例如向量)中的特定扫描顺序处理块内量化变换系数的二维(2-d)数组。熵编码应按变换系数的一维顺序进行。扫描变换单元中的量化变换系数以将用于熵编码器的变换系数二维数组串行化。可以生成有效度图以指示有效(例如非零)系数的位置。扫描可以应用于有效(例如非零)系数的编码层级和/或有效系数的编码符号。在hevc标准中，4×4的非零系数位置通过4×4的有效度图来编码。hevc标准中4×4的有效度图如下所述进行编码。发送最后一个有效系数的坐标。然后对于扫描顺序中在最后一个有效系数之前的每一个系数都发送一比特的符号significant_coeff_flag。将相同的映射用于选择亮度和色度的临近关系即可降低视频编码例如高效视频编码(hevc)中编码significant_coeff_flag的复杂度。结果就能够去除用于选择临近关系索引的15元素查找表和多条支路，并且wd文本也得以简化。已经在hm5.0中观测到解码器运行时间0-3％的减少。用于ai_he、ra_he、lb_he的bd-rate分别为0.00％、-0.01％、0.01％。用于ai_lc、ra_lc、lb_lc的bd-rate分别为0.00％、0.01％、-0.01％。用于ra_he10的bd-rate是0.03％。如图2中的分组颜色所示，4×4的亮度临近关系200的相同分组可以被重复用于4×4的色度临近关系202的分组。结果就在以下的方面降低了复杂度：去除了先前使用的色度15元素映射表，基于亮度/色度决策确定8×8/16×16/32×32有效度图中的至少一个中初始临近关系偏移量的支路也被去除。临近关系的简化也被集成到hm5.0中。在三种微软高性能计算集群中执行仿真，共同的测试条件和参考配置如下：·所有的帧内仿真都在2.4ghz的amdopteron处理器6136集群上执行。·所有的ra仿真都在3.47ghz的intelxeonx5690集群上执行。·所有的ld仿真都在3.33ghz的intelxeonx5680集群上执行。表1示出了用于有效度图编码的复杂度降低的bd-rate和计时。表1：复杂度降低的bd-rate如表3所示，本文中介绍的方法将解码器的执行时间缩短了0％至3％，并且得到的平均亮度bd-rate是从-0.01％到0.03％。helche-10i99％100％ra99％99％100％lb97％99％表2：有效度图编码复杂度降低的平均解码时间helche-10i0.00％0.00％ra-0.01％0.01％0.03％lb0.01％-0.01％表3：有效度图编码复杂度降低的平均bdr以下是参照hm5.0修改的用于语法元素significant_coeff_flag的ctxidxinc的导出过程：该过程的输入是颜色分量索引cidx、当前的系数扫描位置(xc,yc)、变换块宽度log2trafowidth和变换块高度log2trafoheight。该过程的输出是ctxidxinc。变量sigctx取决于当前位置(xc,yc)、颜色分量索引cidx、变换块尺寸和先前解码的二进制语法元素significant_coeff_flag。对于sigctx的导出，适用以下规则：-如果log2trafowidth等于log2trafoheight且log2trafowidth等于2，那么就如下利用在表4中列出的ctxidxmap4x4[]来导出sigctx：sigctx＝ctxidxmap4x4[(yc<<2)+xc]-否则如果log2trafowidth等于log2trafoheight且log2trafowidth等于3，那么就如下利用在表5中列出的ctxidxmap8x8[]来导出sigctx：sigctx＝((xc+yc)＝＝0)？10:ctxidxmap8x8[((yc>>1)<<2)+(xc>>1)]sigctx+＝9-否则如果xc+yc等于0，那么sigctx就导出如下：sigctx＝20-否则(xc+yc大于0)，如下所述利用先前解码的二进制语法元素significant_coeff_flag来导出sigctx：-如下所述初始化变量sigctx：sigctx＝0-当xc小于(1<<log2trafowidth)-1时，适用以下规则：sigctx＝sigctx+significant_coeff_flag[xc+1][yc]-当xc小于(1<<log2trafowidth)-1且yc小于(1<<log2trafoheight)-1时，适用以下规则：sigctx＝sigctx+significant_coeff_flag[xc+1][yc+1]-当xc小于(1<<log2trafowidth)-2时，适用以下规则：sigctx＝sigctx+significant_coeff_flag[xc+2][yc]-当以下所有条件均为真时，-yc小于(1<<log2trafoheight)-1，-xc％4不等于0或者yc％4不等于0，-xc％4不等于3或者yc％4不等于2，适用以下规则：sigctx＝sigctx+significant_coeff_flag[xc][yc+1]-当yc小于(1<<log2trafoheight)-2且sigctx小于4时，适用以下规则：sigctx＝sigctx+significant_coeff_flag[xc][yc+2]-变量sigctx的修改如下所述：-如果cidx等于0且xc+yc大于(1<<(max(log2trafowidth,log2trafoheight)-2))-1，则适用以下规则：sigctx＝((sigctx+1)>>1)+24-否则就适用以下规则：sigctx＝((sigctx+1)>>1)+21临近关系索引增量ctxidxinc如下所述利用颜色分量索引cidx和sigctx导出：-如果cidx等于0，那么ctxidxinc就导出如下：ctxidxinc＝sigctx-否则(cidx大于0)，那么ctxidxinc就导出如下：ctxidxinc＝27+sigctxi01234567891011121314ctxidxmap4x4[i]014523456688778表4-ctxidxmap4x4[i]的规格i0123456789101112131415ctxidxmap8x8[i]0123456386679977表5–ctxidxmap8x8[i]的规格临近关系的导出假设用于亮度的最大变换尺寸小于或等于32×32且用于色度的最大变换尺寸小于或等于16×16，而最小变换尺寸大于或等于4×4。表6–用于有效系数标记ctxidx的可变初始值的数值图3根据某些实施例示出了4×4有效度图编码的复杂度降低方法的流程图。在步骤300，扫描具有至少一个非零量化变换系数的量化变换系数。在步骤302，确定最后一个非零量化系数在扫描顺序中的位置。在步骤304，将最后一个系数的位置编码。在步骤306，将最后一个非零系数之前的量化变换系数的有效度以用于亮度和色度系数的相同数量的临近关系和临近关系增量映射编码。在某些实施例中可以执行更多或更少的步骤。在某些实施例中可以修改步骤的顺序。图4根据某些实施例示出了被配置成实施降低了复杂度的有效度图编码方法的示范性计算设备的方块图。计算设备400能够被用于获取、存储、计算、处理、传输和/或显示例如图像和视频等信息。通常，适合用于实现计算设备400的硬件结构包括网络接口402、内存404、处理器406、i/o设备408、总线410和存储设备412。处理器的选择并非关键点，只要选择速度足够的适当处理器即可。内存404可以是现有技术中已知的任何常规计算机内存。存储设备412可以包括硬盘驱动器、cdrom、cdrw、dvd、dvdrw、蓝光盘闪存卡或任何其他的存储设备。计算设备400可以包括一个或多个网络接口402。网络接口的示例包括连接至以太网或其他类型局域网的网卡。i/o设备408可以包括以下的一种或多种设备：键盘、鼠标、监视器、显示屏、打印机、调制解调器、触摸屏、按钮接口和其他设备。用于执行降低了复杂度的有效度图编码方法的降低复杂度有效度图编码应用程序430可以存放在存储设备412和内存404中并像通常处理应用程序那样进行处理。计算设备400当中可以包括比图4中所示更多或更少的组件。在某些实施例中包括降低复杂度的有效度图编码硬件420。尽管图4中的计算设备400包括用于降低复杂度的有效度图编码方法的应用程序430和硬件420，但是降低复杂度的有效度图编码方法也可以在计算设备上通过硬件、固件、软件或其任意组合来实施。例如，在某些实施例中，降低复杂度的有效度图编码应用程序430是在内存中编写并且利用处理器执行。在另一个示例的某些实施例中，降低复杂度的有效度图编码硬件420是编程硬件逻辑，包括专门设计用于实施降低复杂度的有效度图编码方法的门电路。在某些实施例中，降低复杂度的有效度图编码应用程序430包括几种应用程序和/或模块。在某些实施例中，模块还包括一个或多个子模块。在某些实施例中可以包括更少或附加的模块。合适的计算设备示例包括个人计算机、膝上型计算机、计算机工作站、服务器、大型计算机、手持式计算机、个人数字助理、蜂窝/移动电话、智能家电、游戏机、数字照相机、数码摄像机、照相电话、智能电话、便携式音乐播放器、平板计算机、移动设备、视频播放器、影碟刻录机/播放器(例如dvd刻录机/播放器、刻录机/播放器)、电视、家庭娱乐系统或任意其他合适的计算设备。图5根据某些实施例示出了hevc编码器的总图。编码器500包括通用编码器控制组件、变换缩放和量化组件、缩放和逆变换组件、帧内图像估算组件、帧内图像预测组件、去块和sao滤波器组件、运动补偿组件、运动估算组件以及头部格式化和cabac组件。输入视频信号由编码器500接收并且划分为编码树单元(ctu)。hevc编码器组件处理视频数据并生成编码比特流。编码器500实现了有效度图编码的复杂度降低。图6根据某些实施例示出了hevc解码器的总图。解码器600包括熵解码组件、逆量化组件、逆变换组件、当前帧组件、帧内预测组件、先前帧组件、运动补偿组件、去块滤波器和sao组件。输入比特流(例如编码视频)由解码器600接收，并且生成用于显示的解码比特流。为了使用降低复杂度的有效度图编码方法，可以使用某种设备例如数字照相机来获取视频。降低复杂度的有效度图编码方法可自动用于执行视频处理。降低复杂度的有效度图编码方法可以自动执行而无需用户干预。在操作中，降低复杂度的有效度图编码方法通过使用相同的映射来选择亮度和色度的临近关系而降低了视频编码例如高效视频编码(hevc)中编码significant_coeff_flag的复杂度。结果就能够去除用于选择临近关系索引的15元素查找表和多条支路，并且wd文本也得以简化。有效度图编码降低复杂度的某些实施例1、一种在设备内编写的降低非零4×4有效度图的编码复杂度的方法，包括：a.扫描量化的变换系数；b.确定最后一个非零量化系数的位置；以及c.根据量化的变换系数生成有效度图，其中在所述最后一个非零量化系数之前的量化变换系数的有效度将相同数量的临近关系和相同的映射用于亮度和色度以确定临近关系索引增量。2、如第1条所述的方法，其中临近关系增量映射包括单个15元素的查找表。3、如第1条所述的方法，进一步包括在不基于8×8、16×16和32×32有效度图中的至少一个的亮度/色度决策来确定临近关系偏移量的情况下对视频内容进行编码。4、如第1条所述的方法，其中所述设备选自由个人计算机、膝上型计算机、计算机工作站、服务器、大型计算机、手持式计算机、个人数字助理、蜂窝/移动电话、智能电话、智能家电、游戏机、数字照相机、数码摄像机、照相电话、便携式音乐播放器、平板计算机、视频播放器、dvd刻录机/播放器、高清视频刻录机/播放器、电视和家庭娱乐系统构成的组。5、一种编码器，包括：a.在硬件内编写的被配置成扫描量化变换系数的扫描模块；b.在硬件内编写的被配置成生成最后一个非零量化变换系数的位置的第一生成模块；以及c.在硬件内编写的被配置成根据量化的变换系数生成有效度图的第二生成模块，其中在最后一个非零量化系数之前的量化变换系数的有效度将相同数量的临近关系和相同的映射用于亮度和色度以确定临近关系索引增量。6、如第5条所述的编码器，其中临近关系增量映射包括单个15元素的查找表。7、如第5条所述的编码器，进一步包括在硬件内编写的编码模块，用于在不基于8×8、16×16和32×32有效度图中的至少一个的亮度/色度决策来确定临近关系偏移量的情况下对视频内容进行编码。8、如第5条所述的编码器，其中所述编码器被包含在设备内，所述设备选自由个人计算机、膝上型计算机、计算机工作站、服务器、大型计算机、手持式计算机、个人数字助理、蜂窝/移动电话、智能电话、智能家电、游戏机、数字照相机、数码摄像机、照相电话、便携式音乐播放器、平板计算机、视频播放器、dvd刻录机/播放器、高清视频刻录机/播放器、电视和家庭娱乐系统构成的组。9、一种装置，包括：a.用于存储应用程序的非暂时性存储器，所述应用程序用于根据量化的变换系数生成有效度图，其中在最后一个非零量化系数之前的量化变换系数的有效度将相同数量的临近关系和相同的映射用于亮度和色度以确定临近关系索引增量；以及b.耦合至存储器的处理组件，所述处理组件被配置成处理所述应用程序。10、如第9条所述的装置，其中所述应用程序进一步用于扫描量化的变换系数。11、如第9条所述的装置，其中临近关系增量映射包括单个15元素的查找表。12、如第9条所述的装置，其中所述应用程序进一步用于在不基于8×8、16×16和32×32有效度图中的至少一个的亮度/色度决策来确定临近关系偏移量的情况下对视频内容进行编码。已经根据包含有细节的具体实施例介绍了本发明以帮助理解本发明的结构和操作原理。本文中对具体实施例及其细节内容的这些说明并不是为了限制本文所附权利要求的保护范围。对于本领域技术人员来说显而易见的是可以对选择用于进行说明的实施例进行各种不同的修改而并不背离本发明由权利要求定义的实质和保护范围。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：C·奥耶恩
技术所有人：索尼公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。