用于可缩放视频译码的粗粒度可缩放性增强层译码的上下文自适应可变长度译码增强的制作方法

文档序号:7936221阅读:209来源:国知局

专利名称::用于可缩放视频译码的粗粒度可缩放性增强层译码的上下文自适应可变长度译码增强的制作方法
技术领域
:本文中的标的物大体上涉及图像处理。
背景技术
:通信技术的发展除导致文本和语音通信的增加外,还已导致视频通信的增加。视频数据通常体积较大,且在传输期问利用大量带宽。为了降低带宽消耗,可使用压縮译码方案来将视频序列传送到较宽范围的装置,包含数字电视、数字直播系统、无线通信装置、个人数字助理(PDA)、膝上型计算机、桌上型计算机、视频游戏控制台、数码相机、数字记录装置、蜂窝式或卫呈无线电电话及其类似物。已建立了用于对数字视频序列进行编码的不同视频编码标准。举例来说,移动图片专家组(MPEG)己开发了包含MPEG-1、MPEG-2禾QMPEG-4在内的许多标准。其它实例包含国际电信联盟(ITU)-TH.263标准和ITU-TH.264标准及其对应部分(ISO/IECMPEG-4,第0部分,g卩,高级视频译码(AVC)和可縮放视频译码(SVC))。这些视频编码标准通过以压缩方式对数据进行编码来支持视频序列的经改进的传输效率。上下文自适应可变长度译码(CAVLC)可以是一种针对H.264/AVC和SVC的用于对经折线扫描的4x4和2x2残余块进行编码的方法。在SVC粗粒度可缩放性(CGS)中,所有层将CAVLC用于H.264/AVC,且同一CAVLC方法适用于基础层译码和增强层译码两者。然而,由于不同预测结构的缘故,与基础层的残余相比,产生CGS增强层残余的不同统计量,这导致CGS增强层CAVLC残余译码的效率较低。
发明内容可通过利用大于一的经量化输入图像数据系数的数目(NLrgl)作为语法元素来执6行用于可縮放视频译码(SVC)的粗粒度可縮放性(CGS)增强层译码的上下文自适应可变长度译码(CAVLC)。coeff—token(系数—令牌)的译码可基于TotalCoeff(总系数)和NLrgl。可使用基于剩余系数中大于一的系数的数目而选择的VLC表来执行等级译码。可通过基于使用当前块的上方和左方的块中的total一zeros(总—零)的数目而确定的total—zeros估计来自适应地选择VLC表而执行total_zeros译码。提供此概述是为了以简化形式介绍下文中在详细描述内容中进一步描述的概念选择。此概述无意识别所主张标的物的关键特征或本质特征,也无意用于限制所主张标的物的范围。图1是说明支持视频可縮放性的数字多媒体广播系统的框图。图2是说明可縮放视频位流的基础层和增强层内的视频帧的图。图3是说明图1的数字多媒体广播系统中的广播服务器和订户装置的示范性组件的框图。图4A和图4B是用于阐释扫描次序的视图。图5是基于H.264编码方案的可变长度编码设备的框阁。图6是展示H.264中的语法元素的次序的视图。图7是基于经修改的H.264编码方案的可变长度编码设备的实施方案。图8展示用于可缩放视频译码(SVC)的粗粒度可缩放性(CGS)增强层译码的CAVLC的过程的阶段。图9展示用于确定语法元素且输出经编码流的过程的阶段。具体实施例方式可缩放视频译码可用于提供视频的时间和空间可缩放性,使得可一次译码视频内容,且内容提供者可提供具有各种质量的流。作为实例,经编码的视频可包含基础^和增强层。所述基础层携载视频解码所必需的最小量的数据,且提供基础等级的质量。所述增强层携载增强经解码视频的质量的额外数据。一般来说,基础层可指代含有表示第一等级的空间-时问-SNR可缩放性的经编码视频数据的位流。增强层可指代含有表不第二等级的空间-时间-SNR可縮放性的经编码视频数据的位流。增强层位流可结合基础层而解码,即,增强层位流含有对用于产生最终经解码视频数据的经解码基础层视频数据的参考。在物理层、基础层和增强层上使用分层调制可在相同载波或副载波上传输,但是以导致不同包错误率(PER)的不同传输特征来传输。基础层具有较低PER以用于贯穿覆盖区域的较可靠的接收。如果增强层被可靠地接收到且/或经受其它准则,那么解码器可仅对基础层或基础层加上增强层进行解码。在一些实施方案中,本文中所揭示的技术可适用于实施用于可符合H.264标准的装置的低复杂性视频可縮放性扩展。举例来说,扩展可表示用于H.264标准或其它标准的将来版本或扩展的潜在修改。H.264标准是作为被称为联合视频小组(JVT)的合作伙伴的产物由ITU-T视频译码专家组和ISO/正C移动图片专家组(MPEG)开发。可在网络抽象层(NAL)单元中携载经译码的视频数据和可缩放的扩展。每一NAL单元是可采取含有整数数目个字节的包的形式的网络传输单元。NAL单元可携载基础层数据或增强层数据。NAL单元中的基础层位流语法和语义可大体符合可适用标准(例如,H.264标准),可能经受某些约束和/或修改。本发明中所描述的技术可结合多种预测性视频编码标准中的任一者而使用,所述编码标准例如是MPEG-l、MPEG-2或MPEG-4标准、ITUH.263或H.264标准、或ISO/IECMPEG-4第10部分标准(即,高级视频译码(AVC),其人体等同于H.264标准)。出于说明的目的,木文中将描述用于支持与H.264标准相关联的视频可缩放性的低fi杂性扩展的此些技术的应用。如果在例如移动手持机或其它小型便携式装置的客户端装置屮执行解码,那么由于计算复杂性和存储器要求而可能存在限制。因此,可以使得基础层加上增强层的解码与单层解码相比不会显著增加计算复杂性和存储器要求的方式来设计可縮放编码。适当的语法元素和相关联的语义可支持基础层和增强)S数据的高效解码。图1是说明支持视频可缩放性的数字多媒体广播系统10的框图。在图1的实例中,系统IO包含广播服务器12、发射塔14和多个订户装置I6A、16B。广播服务器12从-个或一个以上来源获得数字多媒体内容,且(例如)根据本文中所描述的视频编码标准中的任一者(例如,H.264或其修改)来对多媒体内容进行编码。可将由广播服务器12编码的多媒体内容安排在单独的位流中,以支持用于供与订户装置16相关联的用户选择的不同信道。广播服务器12可从不同的内容提供者馈入获得作为现场多媒体或存档多媒体的数字多媒体内容。广播服务器12可包含或耦合到调制器/发射器,所述调制器/发射器包含用于驱动与发射塔14相关联的一个或一个以上天线以在无线信道上传递从广播服务器12获得的经编码多媒体的适当射频(RF)调制组件、滤波组件和放大器组件。在一些方面中,广播服务器12通常可经配置以根据多种无线通信技术中的任一者来传递实时视频服务,例如码分多址(CDMA)、时分多址(TDMA)、频分多址(FDMA)、正交频分多路复用(OFDM)或此些技术的任一组合。每一订户装置16可驻存在能够解码和呈现数字多媒体数据的任一装置内,例如数字直播系统、无线通信装置(例如,蜂窝式或卫星无线电电话)、个人数字助理(PDA)、膝上型计算机、桌上型计算机、视频游戏控制台或其类似物。订户装置16可支持多媒体数据的有线和/或无线接收。此外,一些订户装置16可经装备以编码和传输多媒体数据,以及支持包含视频电话、视频流式传输及其类似物在内的语音和数据应用。在一些实施方案中,为了支持可縮放的视频,广播服务器12可对源视频进行编码,以产生用于视频数据的多个信道的单独的基础层和增强层位流。可大体同时传输所述信道,使得订户装置16A、16B可选择用于在任一时间观看的不同信道。因此,订户装置16A、16B在用户控制下可选择一个信道来观看体育运动,且接着选择另一信道来观看新闻或某一其它经排定的节目安排事件,更像电视观看经历。一般来说,每一信道包含以不同PER等级传输的基础层和增强层。在图l的实例中,展不两个订户装置16A、16B。然而,系统10在给定覆盖区域内可包含任一数目的订户装置16A、16B。值得注意的是,多个订户装置16A、16B可接入相同信道以同吋观看相同内容。图l表示订户装置16A和16B相对于发射塔14的定位,使得一个订户装置16A较接近发射塔,且另-订户装置16B较远离发射塔。因为基础层是以较低PER编码,所以其应由适用覆盖区域内的任一订户装置16可靠地接收和解码。如图1中所展不,两个订户装置16A、16B接收基础层。然而,订户16B位于较远离发射塔14处,且可能不可靠地接收增强层。较近的订户装置16A能够具有较高质量的视频,因为基础层与增强层数据均可用,而较远的订户装置16B仅能够呈现由基础层数据提供的最小质量等级。闳此,由订户装置16获得的视频在增强层可被解码且添加到基础层以增加经解码视频的信噪比的意义上是可缩放的。图2是说明可縮放视频位流的基础层17和增强层18内的示范性视频帧的图。基础层17是含有表示第一等级的空间-时间-SNR可缩放性的经编码视频数据的位流。基础层18是含有表示第二等级的空间-吋间-SNR可缩放性的经编码视频数据的位流。-.般来说,增强层位流仅可结合基础层来解码,且不可独立解码。增强层18含有对基础层17中的经解码视频数据的参考。此些参考可在变换域或像素域中使用以产生最终的经解码视频数据。9基础层17和增强层18可含有帧内(1)、帧间(P)和双向(B)帧。增强层18中的P帧依赖于对基础层17中的P帧的参考。通过对增强层18和基础层17中的帧进行解码,视频解码器能够增加经解码视频的视频质量。举例来说,基础层17可包含以15帧每秒的最小帧速率编码的视频,而增强层18可包含以30帧每秒的较高帧速率编码的视频。为了支持不同质量等级的编码,可分别用较高量化参数(QP)和较低QP来对基础层17和增强层18进行编码。图3是说明图1的数字多媒体广播系统10中的广播服务器12和订户装置16的示范性组件的框图。如图3中所展示,广播服务器12包含一个或一个以上视频源20,或一到达各种视频源的接口。广播服务器12还包含视频编码器22、NAL单元模块23和调制器/发射器24。订户装置16包含接收器/解调器26、NAL单元模块27、视频解码器28和视频显示装置30。接收器/解调器26经由通信信道15接收来自调制器/发射器24的视频数据。视频编码器22包含基础层编码器模块32和增强层编码器模块34。视频解码器28包含基础层/增强层组合器模块38和基础层/增强层熵解码器39。基础层编码器32与增强层编码器34接收共用视频数据。基础层编码器32以第一质量等级对视频数据进行编码。增强层编码器34对加细(refinement)进行编码,所述加细在被添加到基础^时,将视频增强到第二、较高质量等级。NAL单元模块23处理来向视频编码器22的经编码位流,且产生含有来自基础层和增强层的经编码视频数据的NAL竿-元。NAL单元模块23可为如图3屮所示的单独组件,或嵌入视频编码器22内或以其它方式与视频编码器22集成。一-'些NAL单元携载基础层数据,而其它NAL单元携载增强层数据。在一些实施方案中,所述NAL单元中的一些NAL单元可包含用于在不添加实质复杂性的情况下辅助视频解码器28对基础层和增强层数据进行解码的语法元素和语义。举例来说,可在包含增强层视频数据的NAL单元、包含基础层视频数据的NAL单元或两者中提供指示增强层视频数据存在于NAL单元中的一个或一个以上语法元素。调制器/发射器24可包含用于支持由NAL单元模块23产生的NAL单元的调制和无线传输的合适的调制解调器、放大器、滤波器、频率转换组件。接收器/解调器26可包含用于支持由广播服务器12发射的NAL单元的无线接收的合适的调制解调器、放大器、滤波器和频率转换组件。在-…些方面'11,广播服务器12和订户装置16可经装备以用于双向通信,使得广播服务器12、订户装置16或两者包含发射和接收组件两者,且两者均能够对视频进行编码和解码。在其它方面中,广播服务器12可为经装备以使用基础层和增强层编码来编码、解码、发射和接收视频数据的订户装置16。因此,还预期对两10个或两个以上订户装置之间所传输的视频的可缩放视频处理。NAL单元模块27从接收到的NAL单元提取语法元素,并向视频解码器28提供相关联的信息以用于对基础层和增强层视频数据进行解码。NAL单元模块27可以是如图3中所示的单独组件,或嵌入视频解码器28内或以其它方式与视频解码器28集成。基础层/增强层熵解码器39对接收到的视频数据应用熵解码。如果增强层数据可用,那么基础层/增强层组合器模块38使用由NAL单元模块27提供的指示来组合来自基础层和增强层的系数,以支持经组合信息的单层解码。视频解码器28对经组合的视频数据进行解码,以产生到达驱动显示装置30的输出视频。存在于每一NAL单元中的语法元素以及所述语法元素的语义指导视频解码器28对接收到的基础层和增强层视频数据进行组合和解码。广播服务器12和订户装置16中的各种组件可通过硬件、软件和固件的任一合适组合来实现。举例来说,可通过以下各项来实现视频编码器22和NAL单元模块23以及NAL单元模块27和视频解码器28:—个或一个以上通用微处理器、数字信号处理器(DSP)、硬件核心、专用集成电路(ASIC)、现场可编程门阵列(FPGA),或其任一组合。此外,各种组件可在视频编码器-解码器(CODEC)内实施。在一些情况下,所揭示技术的-一些方面可由调用硬件核心中的各种硬件组件以加速编码过程的DSP来执行。对于以软件来实施功能性(例如,由处理器或DSP执行的功能性)的方而来说,本发明还预期-'种计算机可读媒体,其包括计算机程序产品内的代码。当在机器巾执行所述代码时,所述代码致使所述机器执行木发明中所描述的技术的一个或一个以上方面。所述机器可读媒体可包括例如同步动态随机存取存储器(SDRAM)的随机存取存储器(RAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、快闪存储器及其类似物。参看图4A,在根据H.264的熵编码过程中,在正交变换之后,在4x4块基础上处理变换系数。在H.264编码方案中,通过以与图4A中相对于4x4块而展示的折线扫描次序相反的次序(即,反向扫描次序)执行处理而产生五个语法元素(下文所描述)并对其进行可变长度译码。块中的每一变换系数被表达为等级[l],其中"I"表示折线扫描次数。接下来将描述由基于H.264编码方案的上下文自适应可变长度译码CAVLC方案进行的包含图4B中所示的变换系数的4x4块的熵编码处理。阁5是基于H.264编码方案的可变长度编码设备(例如,视频编码器22)的框图。图6展不组合对应于4x4块基础上的五个语法元素的可变长度代码以形成经编码流的次序。11TotalCoeffs(总系数)确定单元44计算4x4块中不具有值=0的变换系数的数目。举例来说,参看图4B,TotalCoeffs-6。tota—zeros确定单元46计算等级[I]值在等级[9]与等级之间为0的作为最终有效系数的变换系数的数目。在此情况下,total—zeroS=4。trailing—ones(尾部—一)确定单元45计算从等级[9]开始绝对值为1的作为最终有效系数的变换系数的数目(至多达三个)。在此情况下,因为等级[9]和等级[7]对应于绝对值1,所以trailing—ones=2。注意,coeff—token可变长度代码产生单元49根据由TotalCoeffs确定单元44计算的TotalCoeffs的值和由trailing—ones确定单元45计算的trailing—ones的值来计算coeff—token,作为二维事件中的语法元素。因为作为语法元素的"等级"值是以反向扫描次序循序产生的,所以"等级"值从等级[9]开始循序地产生作为最终有效系数。然而,需要根据由trailing—ones确定单元45计算的trailing_ones的值来校正所述"等级"值。等级选择单元41执行此过程。等级选择单元41将等级[I]的值不为0的变换系数循序地输出到阖值确定单元42和等级可变长度代码产生单元43。如果trailing一ones的值小于3,那么从绝对值不为1的第一等级[I]的绝对值中减去1。在此情况下,因为trailing—0neS=2,所以输出通过从等级[6]的绝对值"6"中减去1而获得的值"5"。此外,阈值确定单元42确定suffixLength(后缀长度),并将其输出到等级可变长度代码产生单元43。通过将根据H.264规范而预定的阈值表与等级[I]的输入愤进行比较来确定SuffixLength。等级可变长度代码产生单兀43根据SuffixLength的值来选择待用于可变长度编码的可变长度表(未阁示)。run一before(游程—前)确定单元47以反向扫描次序循序地计算零游程(zerorun)。举例来说,等级[9]与等级[7]之间的run—bef0re=l,且等级[7]与等级[6]之间的run_before=0。注意,zeros—left(零—左)管理单元将通过从total—zeros的值中减去循序计算出的run—before的值而获得的值作为zerosjeft输出到run—before可变长度代码产生单元51。run_before可变长度代码产生单元51根据run—before和zeros—left的值产牛可变长度代码。可变长度代码组合单元52根据图6中所示的次序,循序地组合从coeff—token可变长度代码产生单元49输入的可变长度代码、从trailing—ones确定单元45输入的trailing—ones—sign(尾部—_正负号)、从等级可变长度代码产生单元43输入的可变长度代码、从total—zeros可变长度代码产生单元50输入的可变长度代码以及从run—before可变长度代码产生单元51输入的可变长度代码。归因于增强层编码过程中的不同场景特征,用于SVCCGS增强层编码的CAVLC编码可能是低效的。举例来说,在许多情况下,对于CGS增强层编码来说,量化之后的残余变换系数为零或一。因此,大于l的系数的概率极低。基于此情形,在一实施方案中,可如图7中所示修改CAVLC语法元素,图7是基于经修改的H.264编码方案的可变长度编码设备40的实施方案。在图7中,与图5的编码设备共用的元件被展示为具有参考标号,且下文中不再对其进行描述。在经正交变换的4x4图像数据中,具有大于1的绝对值的经量化变换系数的数目由NLrgl确定单元53确定。与图5相比,coeff一token的定义被修改,使得coeff一token产生单元55对TotalCoeff确定单元44和NLrgl确定单元53的输出进行编码。在一些实施方案中,下文中的表1到表3中所展示的VLC表可用于基于非零系数的数目(tmz)的估计或预测值(nC)来对coeff—token进行编码,非零系数的数目(nnz)是根据4x4图像数据的左侧块(nA)的nnz和上部块(nB)的nnz来确定。估计(nC)在ISO/IEC14496-10中定义,且可如下来确定如果仅上部块可用,那么nOnB。如果仅左侧块可用,那么nOnA。如果任一块均不可用,那么nC=0。如果两个块均可用,那么nC=round((nA+nB)/2)。表1coefftokenVLC0NnzVNLrgl01>=201--10100010-20010000100000001010001100000110000001004000011000001000000000110000010100000011000000000116000000111000000010000000000107000000010000000000110000000001080000000000101000000000010000000000001190000000000010100000000000100ooooooooooon100000000000001001000000000000100000000000000011110000000000000110100000000000000111000000000000101120000000000000110000000000000000"00000000000000111130000000000000101100000000000000101000000000000000111400000000000001010000000000000001000000000000000001015000000000000010010000000000000000"00000000000000000116000000000000000000000000000000001000000000000000000013表2coeff—tokenVLCl<table>tableseeoriginaldocumentpage14</column></row><table>表3coefftokenVLC2<table>tableseeoriginaldocumentpage14</column></row><table>如果llC>8,那么可如下写入固定长度代码字:如果TotalCoeff=0,那么,代码00否则可使用6位固定长度代码,其包含2个位的min(NLrgl+l,3)和4个位的TotalCoeff-l。在一些实施方案中,当NLrgl确定单元53的输出大于2时,将一元代码(NLrgl-2)附加到所述输出。等级译码确定单元54可基于待译码的剩余系数中大于1的系数的数目而选择用于等级译码的VLC表。在一些实施方案中,当待译码的所有剩余系数的量值均小于或等于1时,那么对正负号位进行译码。当具有大于1的绝对值的系数的数目为1时,那么使用VLC表0,否则使用VLC表1来对等级进行译码。total—zeros产生单元56基于可以与nC相同的方式来确定的total_zeros估计(即,使用当前块上方和左方的块中的total—zeros的数目)而自适应地选择VLC表。如下文在表4中所展示而指派VLC表索引。此实施方案考虑用于可能不仅不同于基础层而且层与层之间也不同的增强层的total—zeros统计。可根据TotalCoeff值而调节用于totazeros指派的VLC。表5和表6是用于total—zeros的VLC表。表4totalzerosVLC表索引指派<table>tableseeoriginaldocumentpage15</column></row><table><table>tableseeoriginaldocumentpage16</column></row><table>1400000000100000000___備15000000000-誦_画—TotalCoefftotalzeros8910111213141500000010000100001000100010010111000000000000000000000000000102000010001000100101100_0001Oil00111101__4Oil0101110001_-■5010111001-_—誦6111001_—一—710001■—_-_8001—_■---國9一-—--—_10——■---_11—墨—-—-_12一■_----一13_-—_-—--14_—-----15_一一-----可变长度代码组合单元52循序地组合并输出从coeff一token可变长度代码产生单元55输入的可变长度代码、从等级可变长度代码产生单元54输入的可变长度代码、从Total—zeros可变长度代码产生单元56输入的可变长度代码以及从run—before可变长度代码产生申.兀51输入的可变长度代码。阁8展示用于可缩放视频译码(SVC)的粗粒度可缩放性(CGS)增强层译码的CAVLC的过程100的阶段。在102处,接收图像数据。举例来说,可由编码器22接收经正交变换的块图像数据。在104处,确定语法元素。举例来说,语法元素可根据块图像数据内的系数而指定译码。在106处,执行译码。举例来说,可通过自适应地应用VLC表来对图像数据进行译码而执行译码。在108处,输出经编码的流。举例来说,可从视频编码器输出经编码的流以用于处理和传输。图9展示用于确定语法元素和输出经编码流的过程120的阶段。在122处,确定具有大于1的绝对值的经量化变换系数的数目(NLrgl)。举例来说,NLrgl确定单元5117可根据输入的块图像数据来确定此值。在124处,确定TotalCoeffs。举例来说,TotalCoeffs确定单元44可计算图像数据块中不具有值=0的变换系数的数目。在126处,根据NLrgl禾卩TotalCoeffs来执行coeff」oken编码。举例来说,coeff—token可变长度代码产生单元49根据由TotalCoeffs确定单元55计算的TotalCoeffs的值和NLrgl确定单元53的输出来计算coeff—token作为语法元素。在128处,基于剩余系数中大于一的系数的数目而执行等级译码。举例来说,等级代码产生单元54可基于待译码的剩余系数中大于1的系数的数目而选择用于等级译码的VLC表。在130处,根据估计来执行total_zeros译码。举例来说,total_zeros产生单元56可基于使用当前块的上方和左方的块中的total—zeros的数目而确定的total—zeros估计来自适应地选择VLC表。在132处,执行run—before译码。举例来说,run—before确定单元47可以反向扫描次序循序地计算零游程。在134处,组合在126、128、130和132处所确定的可变长度代码。在136处,输出经组合的代码作为经编码的流。举例来说,可从编码器22输出经编码的流。本文中所描述的实施例可由硬件、软件、间件、中问件、微码或其任一组合来实施。当系统及/或方法以软件、固件、中间件或微码、程序代码或代码段来实施时,其可存储在机器可读媒体(例如,存储组件)中。代码段可表示规程、函数、了程序、程序、例程、子例程、模块、软件包、类,或指令、数据结构或程序语句的任一组合。代码段可通过传递和/或接收信息、数据、自变量、参数或存储器内容而耦合到另--.代码段成硬件电路。可使用包含存储器共享、消总传递、令牌传递、网络传输等在内的任何合适方法来传递、转发或传输信息、自变量、参数、数据等。对于软件实施方案来说,可用执行木文中所描述的功能的模块(例如,规程、函数等等)来实施本文中所描述的技术。软件代码可存储在存储器单元中,且由处理器来执行。存储器单元可实施于处理器内或处理器外部,在实施于处理器外部的情况下,存储器单元可通过如此项技术中已知的各种方法以通信方式耦合到处理器。结合本文中所揭示的实施例而描述的方法或算法的阶段可直接体现在硬件中、由处理器执行的软件模块中或两者的组合中。软件模块可驻存在随机存取存储器("RAM")、快闪存储器、只读存储器("ROM")、可擦除可编程只读存储器("EPROM")、电可擦除可编程只读存储器("EEPROM")、寄存器、硬盘、可移除盘、CD-ROM或此项技术中已知的任一其它形式的存储媒体中。实例存储媒体耦合到处理器,使得处理器可从存储媒体读取信息且将信息写入到存储媒体。在替代方案,存储媒体可与处理器成一体式。处理器和存储媒体可驻存在专用用户电路("ASIC")中。ASIC可驻存在用户终端中。在替代方案中,处理器和存储媒体可作为离散组件驻存在用户终端中。应注意,本文中所描述的方法可在所属领域的技术人员已知的多种硬件、处理器和系统上实施。举例来说,一实施方案中所使用的机器可具有用于显示内容和信息的显示器、用于控制客户端的操作的处理器以及用于存储与所述机器的操作有关的数据和程序的存储器。在一些实施方案中,所述机器是蜂窝式电话。在一些实施方案中,所述机器是具有通信能力的手持式计算机或手持机。在另一实施方案中,所述机器是具有通信能力的个人计算机。结合本文中所揭示的实施方案而描述的各种说明性逻辑、逻辑块、模块和电路可用以下各项来实施或执行通用处理器、DSP、ASIC、现场可编程门阵列(FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其经设计以执行本文中所描述的功能的任一组合。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。还可将处理器实施为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器的组合、一个或一个以上微处理器结合DSP核心的组合或任一其它此类配置。尽管已用结构特征和/或方法动作特有的语言描述了标的物,但.应理解,所附权利要求书中所界定的标的物不一定限于h文所描述的特定特征或动作。相反,上文所描述的特定特征和动作是作为实施权利耍求书的实例形式而揭示的。19权利要求1.一种用于基于上下文的自适应可变长度译码的方法,所述方法包括接收经变换的块图像数据;根据块输入数据确定语法元素,所述语法元素包含TotalCoeffs值、具有大于1的绝对值的经量化变换系数的数目(NLrg1)值、total_zeros值、run_before值和等级值;以及根据所述语法值来对所述经变换的块图像数据进行译码。2.根据权利要求1所述的方法,其进一步包括根据NLrgl值和所述TotalCoeffs值来对coeff—token进行编码。3.根据权利要求2所述的方法,其进一步包括基于先前译码的左侧块nA和先前译码的上部块nB的非零系数的数目来确定预测值nC:基于所述预测值nC来选择用于执行coeff—token编码的VLC表。4.根据权利要求3所述的方法,其进一歩包括如果nC大于预定整数值,那么写入固定代码字以及如果nC小于所述预定整数值,那么:'j入包含min(NLrgl+l,3)和TotalCoeff-l的固定长度代码。5.根据权利要求3所述的方法,其进-…步包括如果NLrg1大于2,那么附加一元4^码NLrg1-2。6.根据权利耍求1所述的方法,其进一步包括根据待译码的剩余系数中大于1的系数的数目来确定等级译码。7.根据权利要求6所述的方法,其进一歩包括如果所述待译码的剩余系数的量值小于或等于1,那么对正负号位进行译码。8.根据权利耍求6所述的方法,其进一步包括如果大于1的系数的所述数目为1,那么使用VLC表0来对等级进行译码;以及如果大于1的系数的所述数目不为1,那么使用VLC表1来对等级进行译码。9.根据权利要求1所述的方法,其进一步包括-基于根据相邻块的total_zeros而确定的估计total_zeros值来确定total—zeros编码。10.—种上下文自适应可变长度译码(VLC)设备,其包括语法元素确定单元,其确定TotalCoeffs值、具有大于1的绝对值的经量化变换系数的数目(NLrgl)值、total—zeros值、run—before值和等级值;coeff—token产生单元,其根据所述NLrgl值和所述TotalCoeffs值来对coeff_token进行编码;等级代码产生单元,其根据待译码的剩余系数中大于1的系数的数目来确定等级译码;total_zeros产生单元,其棊于根据相邻块的total—zeros而确定的估计total—zeros伹来确定totalzeros编石马;run—before产生单元,其根据run—before禾nzeros—left的所述值而产生可变长度代码;以及可变长度组合单兀,其组合所述coeff—token产生争.兀、所述等级代码产生单兀、所述total—zeros产生单元和所述run—before产生单元的输出。11.根据权利耍求10所述的设备,其中所述total—zeros产生单元和所述coeff—token产生单元基于先前译码的左侧块nA和先前译码的上部块nB的非零系数的数目来确定预测值nC,且基于所述预测值nC而选择用于执行coeffjoken编码的VLC表。12.根据权利要求11所述的设备,其中如果nC大于预定整数值,那么写入问定代码字,或如果nC小于所述预定整数但,那么写入包含min(NLrgl+l,3)和TotalCoeff-l的固定长度代码。13.根据权利要求lO所述的设备,其中如果NLrgl大于2,那么附加一元代码NLrgl-2。14.根据权利要求IO所述的设备,其中如果所述待译码的剩余系数的量值小于或等于1,那么所述等级代码产生单元对正负号位进行译码,且其中如果大于1的系数的所述数目为l,那么所述等级代码产生单元使用VLC表0来对等级进行译码,且如果大于1的系数的所述数目不为1,那么使用VLC表1来对等级进行译码。15.—种视频编码器,其包括用于接收经变换的块图像数据的装置;用于根据块输入数据来确定语法元素的装置,所述语法元素包含TotalCoeffs值、具有大于1的绝对值的经量化变换系数的数目(NLrgl)值、tota1—zeros值、run—before值和等级值;以及用于根据所述语法值来对所述经变换的块图像数据进行译码的装置。16.根据权利要求15所述的视频编码器,其进一步包括用于根据NLrgl值和所述TotalCoeffs值来对coeff—token进行编码的装置。17.根据权利要求16所述的视频编码器,其中所述用于对所述c0eff_token进行编码的装置基丁-先前译码的左侧块nA和先前译码的上部块nB的非零系数的数目来确定预测值nC,且基于所述预测值nC来选择用于执行coeff一token编码的VLC表。18.根据权利要求15所述的视频编码器,其进一步包括用于根据待译码的剩余系数中大于1的系数的数目来确定等级译码的装置。19.根据权利耍求18所述的视频编码器,其进一步包括用于在所述待译码的剩余系数的量值小于或等于1时对正负号位进行译码的装置;以及用于在大于1的系数的所述数目为I时使用VLC表O来对等级进行译码且在大于1的系数的所述数目不为1时使用VLC表1来对等级进行译码的装贾。20.根据权利耍求15所述的视频编码器,其进一步包括用于基于根据相邻块的total—zeros而确定的估计total—zeros值来确定total—zeros编码的装置。21.—种计算机可读媒体,其包括用于执行基于上下文的自适应可变长度译码的方法的可执行指令,所述方法包括接收经变换的块图像数据;根据块输入数据确定语法元素,所述语法元素包含TotalCoeffs值、具有大于1的绝对值的经量化变换系数的数目(NLrgl)值、total_zeros值、mnj)efore值和等级值;以及根据所述语法值来对所述经变换的块图像数据进行译码。22.根据权利要求21所述的计算机可读媒体,其进一步包括用于执行以下动作的指令根据NLrgl值和所述TotalCoeffs值来对coeff—token进行编码。23.根据权利要求21所述的计算机可读媒体,其进一步包括用于执行以下动作的指令基于先前译码的左侧块nA和先前译码的上部块nB的非零系数的数目来确定预测值nC;基于所述预测值nC而选择用于执行coeff—token编码的VLC表。24.根据权利耍求21所述的计算机可读媒体,其进一步包括用亍执行以下动作的指令根据待译码的剩余系数中大于1的系数的数目来确定等级译码。25.根据权利要求21所述的计算机可读媒体,其进-'歩包括用于执行以下动作的指令基于根据相邻块的total—zeros而确定的估计total—zeros值米确定total—zeros编码。全文摘要本发明提供用于可缩放视频译码(SVC)的粗粒度可缩放性(CGS)增强层译码的上下文自适应可变长度译码(CAVLC),其利用大于一的系数的数目(NLrg1)作为语法元素。对coeff_token的译码是基于TotalCoeff和NLrg1值的。基于NLrg1而对等级进行自适应编码,通过基于相邻块的total_zeros的估计数目自适应地选择VLC表来对语法元素total_zeros进行编码。文档编号H04N7/34GK101578871SQ200880001663公开日2009年11月11日申请日期2008年1月7日优先权日2007年1月8日发明者玛尔塔·卡切维奇申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1