使用带宽扩展技术编码和/或解码数字数据的方法和装置的制作方法

文档序号:2822164阅读:367来源:国知局
专利名称:使用带宽扩展技术编码和/或解码数字数据的方法和装置的制作方法
技术领域
本发明涉及数字数据的编码和解码,尤其涉及一种使用带宽扩展技术编码和解码数字数据的方法及装置。
背景技术
随着数字信号处理技术的发展,音频信号主要是作为数字数据存储和播放的。数字音频存储和/或播放装置采样并量化模拟音频信号,将模拟音频信号转换为是数字信号的脉冲编码调制(PCM)音频数据,并且将PCM音频数据存储在诸如压缩磁盘(CD)、数字通用磁盘(DVD)等的信息存储介质上,所以一个用户能够在他/她希望听PCM音频数据时从信息存储介质上播放数据。数字音频信号存储和/或再现方法与用在长时间唱片(LP),磁带等等上的模拟音频信号存储和/或再现方法相比,相当大地改善了音质,并且显著地减少了由于长时间存储而导致的声音退化。然而,大量的数字数据有时会引起存储和传输的问题。
为了解决这些问题,使用了各种用于减少数字音频数据数量的压缩技术。由国际标准化组织(International Standard Organization,ISO)制定的运动图像专家组(Moving Picture Expert Group,MPEG)音频标准或Dolby研发的AC-2/AC-3技术采用了一种使用音质模型来减少数据数量的方法,它可以不考虑信号特性的有效减少数据的数量。换句话说,MPEG音频标准和AC-2/AC-3技术仅以现有数字编码技术的比特率的1/6-1/8、也就是64K比特/秒-384k比特/秒提供了几乎与CD相同的音质。
然而,所有这些技术遵守以固定比特率在最佳状态下检波、量化以及编码数字数据的方法。因此,当数字数据经由网络传输时,可能会由于不良的网络状况而减少传输带宽。同样,网络可能是断开的以致没有可用的网络服务。并且,当将数字数据转换为较小的位流传输以适于具有有限存储容量的移动设备时,应该再编码以减少数据的数量。为了完成它,需要相当大的计算量。
为此,本发明申请人在1997年11月19日向韩国知识产权局提出了申请号为97-61298的“Bit Rate Scalable Audio Encoding and/or Decoding Methodand Apparatus Using Bit-Sliced Arithmetic Loding(BSAC)Technology”的专利申请,并且已在200年4月17日被授权,韩国专利登记号为261253。根据BASC技术,以高比特率编码的位流可以被转换为具有低比特率的位流。由于可以只使用位流中的一部分来实现恢复,所以即使网络超载、解码器的性能较差、或者用户要求低比特率,也可以只使用位流中的一部分来以适中的音质为用户提供服务(尽管解码器的性能可能会退化得与低比特率时差不多)。然而,在低比特率,解码器的性能也不可避免地退化。

发明内容
本发明提供了一种数字数据编码和/或解码方法和装置,其能够控制数字数据的比特率以使得即使只使用位流中的一部分来实现恢复也能够再现高质量的声音。
根据本发明的一个方面,提供了一种编码数字数据的方法。此方法包括带宽扩展编码数字数据,输出有限带宽数据,并且生成带宽扩展信息;将有限带宽数据编码为具有一个基层和至少一个增强层的分层结构以便控制比特率;以及多路复用已编码的有限带宽数据和带宽扩展信息。
根据本发明的另一方面,提供了一种编码音频数据的方法。此方法包括带宽扩展编码音频数据,输出有限带宽音频数据,并且生成带宽扩展信息;将有限带宽音频数据编码为具有一个基层和至少一个增强层的分层结构以便控制比特率;以及多路复用已编码的有限带宽音频数据和带宽扩展信息。
根据本发明的另一方面,提供了一种解码数字数据的方法。此方法包括多路分解输入位流,并且对被编码为具有一个基层和至少一个增强层的分层结构的有限带宽数据和带宽扩展信息进行采样;对与基层对应的有限带宽数据中的至少一部分解码;以及基于有限带宽数据的已解码部分并且参考带宽扩展信息,在至少一部分没有被有限带宽数据的已解码部分覆盖的频带中生成数字数据,然后将产生的数字数据插入(patch)到有限带宽数据的已解码部分。
根据本发明的又一方面,提供了一种解码音频数据的方法。此方法包括多路分解输入音频位流,并且对被编码为具有一个基层和至少一个增强层的分层结构的有限带宽音频数据和带宽扩展信息采样;对与基层对应的有限带宽音频数据中的至少一部分解码;以及基于有限带宽音频数据的已解码部分并且参考带宽扩展信息,在至少一部分没有被有限带宽音频数据的已解码部分覆盖的频带中生成数字数据,然后将产生的数字数据插入(patch)到有限音频带宽数据的已解码部分。
根据本发明的又一方面,提供了一种用于编码数字数据的装置。此装置包括一个带宽扩展编码器,带宽扩展编码数字数据,输出有限带宽数据,并且生成带宽扩展信息;一个细粒可伸缩性编码器(fine grain scalability encoder),将有限带宽数据编码为具有一个基层和至少一个增强层的分层结构以便控制比特率;以及一个多路复用器,多路复用已编码的有限带宽数据和带宽扩展信息。
根据本发明的又一方面,提供了一种用于编码音频数据的装置。此装置包括一个带宽扩展编码器,带宽扩展编码音频数据,输出有限带宽音频数据,并且生成带宽扩展信息;一个细粒可伸缩性编码器(fine grain scalabilityencoder),将有限带宽音频数据编码为具有一个基层和至少一个增强层的分层结构以便控制比特率;以及一个多路复用器,多路复用已编码的有限带宽数据和带宽扩展信息。
根据本发明的又一方面,提供了一种解码数字数据的装置。此装置包括一个多路分解器,多路分解输入位流,并且对被编码为具有一个基层和至少一个增强层的分层结构的有限带宽数据和带宽扩展信息进行采样;一个细粒可伸缩性解码器(fine grain scalability encoder),对与基层对应的已采样有限带宽数据中的至少一部分解码;以及一个带宽扩展解码器,基于有限带宽数据的已解码部分并且参考带宽扩展信息,在至少一部分没有被有限带宽数据的已解码部分覆盖的频带中生成数字数据,然后将产生的数字数据插入(patching)到有限带宽数据的已解码部分。


通过参考附图来详细描述其中的典型实施例,本发明的上述及其它特征和有益效果将会更加清楚,其中图1是根据本发明的编码装置的方框图;图2是根据本发明一个实施例的编码装置的方框图;图3说明了实现如图2所示的编码装置的一个例子;
图4是根据本发明的解码装置的方框图;图5是根据本发明实施例的解码装置的方框图;图6说明了实现如图5所示的解码装置的一个例子;图7说明了从细粒可伸缩性(FGS)解码器2(fine grain scalabilityencoder)输出的位流的结构;图8说明了如图7所示的辅助信息(side information)的详细结构;图9说明了从多路复用器3输出的位流的结构;图10是用于更详细地说明由带宽扩展(BWE)解码器9实施的带宽扩展解码的参考视图;图11是用于说明本发明的编码方法的流程图;图12是用于说明根据本发明一个实施例的编码方法的流程图;图13是用于说明依据本发明的解码方法的流程图;和图14是用于说明根据本发明一个实施例的解码方法的流程图。
具体实施例方式
在下文中,将参考附图详细地描述本发明的优选实施例。
图1是根据本发明的编码装置的方框图。参考图1,编码数字数据并且输出数字数据作为位流的编码装置,包括带宽扩展(BWE)编码器1、细粒可伸缩性(FGS)解码器(fine grain scalability encoder)2、以及多路复用器3。
BWE编码器1BWE编码数字数据,输出有限带宽数字数据并且生成BWE信息。BWE编码指的是一种用于接收数字数据,切下(slicing off)在高频带中的数字数据的一部分,以及生成为恢复数字数据的切下部分所需要的辅助信息的技术。这里,数字数据的剩余部分被称为“有限带宽数据”,而辅助信息被称为“BWE信息”。BWE技术的一个例子就是由编码技术专家研发的频带复制技术(SpectralBand Replication,SBR)。SBR技术的细节在2002年5月10号-12号举行的音频工程学会的第112次会议上介绍的“Convention Paper 55560”中公开了。
FGS编码器2将有限带宽数据据编码为具有一个基层和至少一个增强层的分层结构以便控制比特率。FGS编码指的是一种用于将数据编码为一种具有多个层的结构以便控制比特率、即提供FGS的技术。在申请号为97-61298的韩国专利申请中公开的BSAC技术就是FGS编码的一个例子。
多路复用器3多路复用由FGS编码器2编码的有限带宽数字数据以及由BWE编码器1生成的BWE信息。
图2是根据本发明一个实施例的编码装置的方框图。参考图2,接收并且编码PCM音频数据、然后输出音频位流的编码装置,包括BWE编码器1,FGS编码器2以及多路复用器3。与图1所示的编码装置相比,图2所示的编码装置是以处理音频数据为特征的。与图1所示的那些执行相同功能的块用相同的参考数字表示,因此省略了重复的描述。
BWE编码器1BWE编码PCM音频数据,输出有限带宽PCM音频数据并且生成BWE信息。FGS编码器2将有限带宽PCM音频数据编码为具有一个基层和至少一个增强层的分层结构以便控制比特率。换句话说,FGS编码器2区别地编码与基层对应的辅助信息,位分段编码(bit-sliced-encodes)与基层对应的多个量化采样,区别地编码与下一增强层对应的多个辅助信息直到多个预定层已全部被编码为止。在这里,辅助信息包含缩放系数信息和编码模型信息,并且通过转换以及量化输入数字数据来获得量化采样。辅助信息和量化采样将在随后详细说明。多路复用器3多路复用由FGS编码器2编码的有限带宽PCM音频数据和由BWE1生成的BWE信息。
图3说明了实现图2所示的编码装置的一个例子。参考图3,编码装置包括BWE编码器1,FGS编码器2及多路复用器3。与图2所示的那些执行相同功能的块用相同的参考数字表示,因此省略了重复的描述。
特别地,FGS编码器2包括转换单元21、音质评价单元22,和量化单元23以及FGS编码单元24。转换单元21接收是时域中的音频信号的PCM音频数据,并且参照由音质评价单元22提供的音质模型信息将PCM音频数据转换为频域的音频信号。能被人感知的音频信号(在下文中称为感性音频信号)的特性在时域中没有很大不同。相反,就音质模型来说,在频域中的感性的与非感性的音频信号的特性是非常不同的。因此,通过为每个频带分配不同的位数可以提高压缩效率。
音质评价单元22将诸如攻击检测信息(attack detection information)等之类的、关于音质模型的信息提供给转换单元21,将由转换单元21转换的音频信号压缩(pack)成为子频带(sub-band)音频信号,使用由子频带信号中的交互作用产生的屏蔽效应来计算每个子频带信号的屏蔽阈值,并将屏蔽阈值提供给量化单元23。屏蔽阈值表示由于音频信号之间的交互作用人类不能感觉到的音频数据的最大功率(power)。在本实施例中,音质评价单元22使用立体声屏蔽级别降低(Binaural Masking Level Depression BMLD)来计算立体声成份的屏蔽阈值等。
量化单元23基于相应的缩放系数信息分等级地量化(scalar-quantizes)每个子频带音频信号,以将在每一个子频带中的量化噪声功率减少到小于由音质评价单元22提供的屏蔽阈值,然后输出量化采样,所以人类可以听到子频带音频信号而不能感觉到其中的量化噪音。换句话说,量化单元23以这种方式量化子频带音频信号以使噪声屏蔽比(表示在每个子频带中产生的噪音与由音质评价单元22计算的屏蔽阈值的比率)在全带宽下为0分贝或更小。0分贝或更小的NMR值表示人类不能听到量化噪声。
FGS编码单元24将属于每一层的量化采样和辅助信息编码为分层结构。辅助信息含有对应于每层的缩放频带(Scale Band)信息、编码频带信息、缩放系数信息和编码模型信息。缩放频带信息和编码频带信息可以被压缩为报头信息并且然后被传输到解码装置。可选地,缩放频带信息和编码频带信息可以被编码以及压缩为对应于每层的辅助信息,然后被传输到解码装置。此外,由于缩放频带信息和编码频带信息已经被存储在解码装置中了,所以可以不将缩放频带信息和编码频带信息传输到解码装置中。
更详细地,当参照编码模型信息来位分段编码(bit-sliced-encoding)与第一层对应的量化采样时,FGS编码单元24将对含有与第一层对应的缩放系数信息和编码模型信息的辅助信息进行编码。位分段编码(bit-sliced-encoding)表示在上述BSAC中所用的编码,并顺序地无损编码最高有效位、次有效位、……、以及最低有效位。第二层也经过与第一层相同的处理。换句话说,多个预定的层被一层接一层地顺序编码,直到所有的层都被完全编码为止。第一层被称作基层,而其余的层被称作增强层。分层结构的更多细节描述将在随后提供。
缩放频带信息对于取决于音频数据的频率特性正确执行量化是必要的,并且当频域被分成多个频带、而且每个频带被分配了适当的缩放系数时,将向每一层通知对应于它的缩放频带。因此,每一层属于至少一个缩放频带。每个缩放频带分配了一个缩放系数。编码频带信息对于取决于音频数据的频率特性正确执行编码是必要的,并且当频域被分成多个频带而且每个频带被分配了适当的编码模型时,将向每一层通知对应于它的编码频带。缩放频带和编码频带将通过测试来划分,然后确定对应于它的缩放系数和编码模型。
多路复用器3以某一顺序来多路复用有限带宽音频数据和BWE信息,这个顺序可以为定位与基层对应的已编码量化采样的数据、定位BWE信息、以及定位对应于其余增强层的已编码量化采样的数据,或者这一顺序为定位BWE信息、定位与基层对应的已编码量化采样的数据、以及定位与其余增强层对应的已编码量化采样的数据。
图4是根据本发明的解码装置的方框图。参考图4,解码位流然后输出数字数据的解码装置,包括多路分解器7、FGS解码器8和BWE解码器9。
多路分解器7多路分解输入位流,以对已被编码为具有一个基层和至少一个增强层的分层结构的有限带宽数据和BWE信息进行采样。在这里,有限带宽数据和BWE信息与参照图1所描述的相同。FGS解码器8对由多路分解器17采样的与基层对应的有限带宽数据中的至少一部分进行解码。在其上执行解码的层取决于网络的状态、用户的选择等等。基于被FGS解码器8解码的有限带宽数据的那部分并且参照由多路分解器7采样的BWE信息,BWE解码器9在没有被由FGS解码器8解码的有限带宽数据覆盖的频段的至少一部分中生成数字数据,并且将生成的数据插入(patch)到由FGS解码器8解码的有限带宽数据中。即使由FGS解码器8解码的有限带宽数据只是基带数据,但是BWE解码器9也将产生遗漏的频带数据,并且将遗漏的频带数据插入(patch)到基带数据中。因此,有限带宽数据的已解码部分的质量可以得到改盖。
图5是根据本发明实施例的解码装置的方框图。参考图5,接收并解码音频位流,然后输出音频数据的解码装置,包括多路分解器7、FGS解码器8和BWE解码器9。与图4所示的解码装置相比,图5所示的解码装置是以处理音频数据为特征的。因此,执行与图4中的那些功能相同的功能的块用相同的参考数字表示,因此省略了重复描述。
多路分解器7多路分解输入音频位流,以对已被编码为具有一个基层和至少一个增强层的分层结构的有限带宽数据和BWE信息进行采样。FGS解码器8对与基层对应的有限带宽音频数据中的至少一部分进行解码。基于被FGS解码器8解码的有限带宽音频数据的那部分,并且参照由多路分解器7采样的BWE信息,BWE解码器9在没有被由FGS解码器8解码的有限带宽音频数据覆盖的频带的至少一部分中产生音频数据,并且将产生的音频数据插入(patch)到由FGS解码器8解码的有带宽音频数据中。
图6说明了实现如图5所示的解码装置的一个例子。参考图6,解码装置包括多路分解器7、FGS解码器8和BWE解码器9。执行与图5中的那些功能相同的功能的块用相同的参考数字表示,因此省略了重复描述。
特别地,FGS解码器8执行解码直到取决于网络状态、解码装置的性能、用户的选择等为了控制比特率而确定的目标层为止。FGS解码器8包括FGS解码单元81,解量化单元82以及逆向转换单元83。FGS解码单元81执行解码直到音频位流的目标层为止。更详细地,FGS解码单元81基于通过对含有与每层对应的缩放系数信息和编码模型信息的辅助信息进行解码而获得的编码模型信息,对已编码的量化采样进行无损解码,以获得量化采样。
缩放频带信息和编码频带信息可从音频位流的报头信息中获得,或者也可以通过对每层的辅助信息进行解码而获得。可选地,解码装置可以事先存储缩放频带信息和编码频带信息。解量化单元82基于对应于每层的缩放系数信息对每层的量化采样进行解量化以及重构。逆向转换单元83对重构的采样进行频率/时间映射(map),将映射的采样转换为时域PCM音频数据,并且输出时域PCM音频数据。
BWE解码器9包括转换单元91、高频产生单元92,调整单元93和合成单元94。转换单元91将从逆向转换单元83输出的时域PCM音频数据转换为频域数据。频域数据被称为低频部分。高频产生单元92通过参照BWE信息复制低频部分、然后将复制的低频部分插入(patching)到频域数据、即原始低频部分中,生成没有被频域数据覆盖的部分、即高频部分。调整单元93使用包含在BWE信息中的封装(envelope)信息调整由高频率生成单元92生成的高频部分的级别。从编码节点传送的封装信息,表示与是在BWE编码期间被编码节点切片(sliced)的部分的高频部分对应的音频数据的封装信息。合成单元94对从转换单元91输出的低频部分和从调整单元93输出的高频部分进行合成,然后输出PCM音频数据。如上所述,尽管FGS解码器8只对基带音频数据进行解码,但是BWE解码器9也将重构遗漏的频带音频数据,然后将遗漏的频带音频数据插入(patches)到基带音频数据中。因此,基带音频数据的质量可得到改善。
图7说明了从FGS编码器2输出的位流的结构。参考图7,位流的帧(frame)由FGS编码器2通过映射量化采样和辅助信息而将其编码为细粒可伸缩性(finegrain scalability)的分层结构。换句话说,所述帧具有其中较低层的位流被包括在增强层中的分层结构。为每一层所必需的辅助信息在一层接一层的基础上被编码。
其中存储了报头信息的报头区位于位流的开头部分,第零层的信息被打包,并且作为增强层的第1层到第N层的信息也被依次打包。基层的范围是从报头区到第零层的信息,第一层的范围是从报头区域到第一层的信息,而第二层的范围是从报头区到第二层的信息。同样地,最高层的范围是从报头区到第N层的信息,也就是从基层到第N层。辅助信息和编码数据被存储为每层的信息。例如,辅助信息2和已编码的量化采样2被存储为第二层的信息。在这里,N是大于等于1的整数。
图8说明了如图7所示的辅助信息的详细结构。参考图8,辅助信息和已编码的量化采样作为任意层的信息存储。在本发明实施例中,如果作为无损编码地执行霍夫曼编码,那么辅助信息包含霍夫曼编码模型信息、量化系数信息、信道辅助信息,以及其他的辅助信息。霍夫曼编码模型信息指的是被用来编码和解码包含在相应层中的量化采样的霍夫曼编码模型的索引信息。量化系数信息把适于量化或解量化包含在相应层中的音频数据的量化阶(quantizing step)的大小通知给相应层。信道辅助信息指的是在诸如中间/边(M/S)立体声的信道上的信息。其他的辅助信息是指示是否使用M/S立体声的标志信息。
图9说明了从多路复用器3输出的位流的结构。参考图9,是由FGS编码器2编码的基层的第零层位于位流的开头部分,BWE信息位于第零层后面,并且增强层、即第一层、第二层、……、和第N层位于BWE信息之后。尽管解码节点只接收或解码基层,但是解码节点也可以基于基层的已解码数据并且参照BWE信息来创建遗漏的层信息。
图10是用于详细地说明由BWE解码器9执行的BWE解码的示意图。参考图10,有条纹的部分表示由FGS解码器8解码的数据,有点的部分表示由BWE解码器9创建的数据。当在采样频率Fs的四分之一部分之内的所有数据属于基层时,图10(a)说明了只有基带数据被解码节点解码的情况,以及图10(b)、10(c)和10(d)说明了与基层和至少一个增强层对应的数据被FGS解码器8解码的情况。换句话说,FGS解码器8能够解码数据以便能够控制比特率,并且BWE解码器9能够创建没有被FGS解码器8解码的遗漏频带数据。
根据本发明优选实施例的编码和解码方法将基于上述的结构给予描述。
图11是用于说明依据本发明的编码方法的流程图。参考图11,在步骤1101中,编码装置BWE编码数字数据,输出有限带宽数据,以及生成BWE信息。在步骤1102中,编码装置将有限带宽数据编码为具有一个基层和至少一个扩展层的分层结构以便控制比特率。在这里,编码装置编码与基层对应的辅助信息,位分段编码多个与基层对应的量化采样,并且编码对应于下一增强层的辅助信息和量化采样直到该多个预定层被全部编码为止。在步骤1103中,编码装置多路复用已编码的有限带宽数据和BWE信息,然后输出位流。在这里,编码装置以某一顺序多路复用有限带宽数据和BWE信息,这个顺序可以为定位与基层对应的已编码有限带宽数据部分的数据、定位BWE信息、以及定位对应于其余增强层的已编码有限带宽数据部分,或者这一顺序为定位BWE信息、定位与基层对应的已编码有限带宽数据部分、以及定位与其余增强层对应的已编码有限带宽数据部分。
图12是用于说明根据本发明实施例的编码方法的流程图。参考图12,在步骤1201中,编码装置BWE编码音频数据,输出有限带宽音频数据以及生成与基层对应的BWE信息。基层的BWE信息对于使用解码节点基于与基层对应的音频数据生成遗漏的频带音频数据来说是必要的。编码装置将有限带宽音频数据编码为具有一个基层和至少一个增强层的分层结构。更详细地,在步骤1202中,编码装置将对应于每一层的音频数据在一层一层的基础上转换为有限带宽音频数据,在步骤1203中量化有限带宽音频数据,并且无损编码量化的音频数据,以及将无损编码的音频数据封装为分层结构以便控制比特率。在步骤1025中,编码装置多路复用已编码的有限带宽音频数据和BWE信息,然后输出位流。更详细地,编码装置以某一顺序多路复用有限带宽数据和BWE信息,这个顺序可以为定位与基层对应的已编码有限带宽数据部分的数据、定位BWE信息、以及定位对应于其余增强层的已编码有限带宽数据部分,或者这一顺序为定位BWE信息、定位与基层对应的已编码有限带宽数据部分、以及定位与其余增强层对应的已编码有限带宽数据部分。
图13是用于说明根据本发明的解码方法的流程图。参考图13,在步骤1301中,解码装置多路分解输入位流,并且对已被编码为具有一个基层和至少一个增强层的分层结构的有限带宽数据和BWE信息进行采样。换句话说,解码装置以某一顺序多路分解输入位流,这个顺序为它从输入位流中采样与基层对应的数据、BWE信息以及与其余增强层对应的数据,或者这一顺序也可为它从输入位流中采样BWE信息、与基层对应的数据、以及与其余增强层对应的数据。在步骤1302中,解码装置解码与基层对应的有限带宽数据中的至少一部分。更详细地,解码装置解码与基层对应的辅助信息,位分片解码多个与基层对应的量化采样,以及解码对应于下一增强层的辅助信息和量化采样直到多个预定层被全部解码完毕。在步骤1303中,基于在步骤1302中被解码的有限带宽数据的那部分并且参照BWE信息,解码装置在没有被在步骤1302中解码的有限带宽部分覆盖的频段的至少一部分内生成数字信号,然后将生成的数字信号插入(patches)到有限带宽数据的已解码部分。
图14是用于说明根据本发明实施例的解码方法的流程图。参考图14,在步骤1401中,解码装置多路分解输入音频位流,并且对已被编码为具有一个基层和至少一个增强层的分层结构的有限带宽音频数据和BWE信息进行采样。换句话说,解码装置以某一顺序多路分解输入音频位流,这个顺序为它从输入音频位流中采样与基层对应的数据、BWE信息以及与其余增强层对应的数据,或者这一顺序也可为它从输入音频位流中采样BWE信息、与基层对应的数据、以及与其余增强层对应的数据。解码装置解码与基层对应的有限带宽音频数据中的至少一部分以便控制比特率。更详细地,解码装置在步骤1402中执行无损解码直到目标层,在步骤1403中执行解量化,并且在步骤1404中执行逆向转换。在步骤1405中,基于在步骤1404中获得的有限带宽音频数据的那部分和参照BWE信息,解码装置在没有被在步骤1404中获得的有限带宽音频数据覆盖的频带的至少一部分中生成音频数据。
如上所述,本发明可以提供一种比特率可伸缩的编码及解码方法和装置,藉此通过仅仅恢复位流的一部分就可提供更好的音质。
虽然参考特定实施例具体显示和描述了本发明,但是本领域普通技术人员可以理解,在不脱离由随后权利要求定义的发明的精神和的范围的情况下,可在形式和细节上做出各种各样的变化。
权利要求
1.一种编码数字数据的方法,包括对数字数据进行带宽扩展编码,输出有限带宽的数据,并生成带宽扩展信息;将有限带宽数据编码为具有一个基层和至少一个增强层的分层结构,以便控制比特率;和对已编码的有限带宽的数据和带宽扩展信息进行多路复用。
2.根据权利要求1所述的方法,特征在于所述编码包括编码与基层对应的辅助信息;对多个与基层对应的量化采样进行位分段编码;和为下一增强层重复所述编码和位分段编码,直到该多个预定层被全部编码为止。
3.根据权利要求1所述的方法,特征在于所述编码包括编码含有与基层对应的缩放系数和编码模型信息的辅助信息;参照编码模型信息位分段编码多个与基层对应的量化采样;和为下一增强层重复所述编码和位分段编码直到该多个预定层被全部编码为止。
4.根据权利要求1所述的方法,特征在于已编码的有限带宽数据和带宽扩展信息以这种顺序被多路复用,这个顺序为定位与基层对应的已编码有限带宽数据、定位带宽扩展信息、以及定位与其余增强层对应的有限带宽数据部分。
5.根据权利要求1所述的方法,特征在于已编码的有限带宽数据和带宽扩展信息以这种顺序被多路复用,这个顺序为定位带宽扩展信息、定位与基层对应的已编码有限带宽数据、以及定位与其余增强层对应的有限带宽数据部分。
6.一种编码音频数据的方法,包括对音频数据进行带宽扩展编码,输出有限带宽的音频数据,并生成带宽扩展信息;将有限带宽音频数据编码为具有一个基层和至少一个增强层的分层结构,以便控制比特率;和对已编码的有限带宽的音频数据和带宽扩展信息进行多路复用。
7.根据权利要求6所述的方法,特征在于编码包括编码与基层对应的辅助信息;对多个与基层对应的量化采样进行位分段编码;和为下一增强层重复所述编码和位分段编码,直到该多个预定层被全部编码为止。
8.根据权利要求6所述的方法,特征在于所述编码包括编码含有与基层对应的缩放系数和编码模型信息的辅助信息;参照编码模型信息位分段编码多个与基层对应的量化采样;和为下一增强层重复所述编码和位分段编码直到该多个预定层被全部编码为止。
9.根据权利要求6所述的方法,特征在于已编码的有限带宽音频数据和带宽扩展信息以这种顺序被多路复用,这个顺序为定位与基层对应的已编码有限带宽音频数据、定位带宽扩展信息、以及定位与其余增强层对应的有限带宽音频数据部分。
10.根据权利要求6所述的方法,特征在于已编码的有限带宽音频数据和带宽扩展信息以这种顺序被多路复用,这个顺序为定位带宽扩展信息、定位与基层对应的已编码有限带宽音频数据、以及定位与其余增强层对应的有限带宽音频数据部分。
11.一种解码数字数据的方法,包括对输入位流进行多路分解,并且对被编码成具有一个基层和至少一个增强层的分层结构的有限带宽的数据和带宽扩展信息进行采样;对与所述基层对应的有限带宽的数据中的至少一部分进行解码;和根据有限带宽的数据的已解码部分并参照带宽扩展信息,在没有被有限带宽数据的已解码部分所覆盖的频带的至少一部分中生成数字数据,然后将生成的数字数据插入到有限带宽数据的已解码部分。
12.根据权利要求11所述的方法,特征在于所述输入位流以某一顺序被多路分解,这一顺序为从输入位流中采样与基层对应的数据、从输入位流中采样带宽扩展信息、以及从输入位流中采样与其余增强层对应的数据。
13.根据权利要求11所述的方法,特征在于所述输入位流以这种顺序被多路分解,这一顺序为从输入位流中采样带宽扩展信息、从输入位流中采样与基层对应的数据、以及从输入位流中采样与其余层对应的数据。
14.根据权利要求11所述的方法,特征在于解码包括解码与基层对应的辅助信息;位分片解码多个与基层对应的量化采样;和为下一增强层重复所述解码和位分片解码直到该多个预定层被全部解码为止。
15.根据权利要求11所述的方法,特征在于解码包括解码含有与基层对应的缩放系数和编码模型信息的辅助信息;参照编码模型信息位分片解码多个与基层对应的量化采样;和为下一增强层重复所述解码和位分片解码直到该多个预定层被全部解码。
16.一种解码音频数据的方法,包括对输入的音频位流进行多路分解,并且对被编码为具有一个基层和至少一个增强层的分层结构的有限带宽音频数据和带宽扩展信息进行采样;对与基层对应的有限带宽数据中的至少一部分进行解码;和根据有限带宽的音频数据的已解码部分并且参照带宽扩展信息,在没有被有限带宽音频数据的已解码部分覆盖的频带的至少一部分中生成音频数据,然后将生成的音频数据插入到有限带宽音频数据的已解码部分。
17.根据权利要求16所述的方法,特征在于所述输入位流以这种顺序被多路分解,这一顺序为从输入位流中采样与基层对应的数据、从输入位流中采样带宽扩展信息、以及从输入位流中采样与其余增强层对应的数据。
18.根据权利要求16所述的方法,特征在于所述输入位流以这种顺序被多路分解的,这一顺序为从输入位流中采样带宽扩展信息、从输入位流中采样与基层对应的数据、以及从输入位流中采样与其余层对应的数据。
19.根据权利要求16所述的方法,特征在于解码包括解码与基层对应的辅助信息;位分片解码多个与基层对应的量化采样;和为下一增强层重复所述解码和位分片解码直到该多个预定层被全部解码为止。
20.根据权利要求16所述的方法,特征在于解码包括解码含有与基层对应的缩放系数和编码模型信息的辅助信息;参照编码模型信息位分片解码多个与基层对应的量化采样;和为下一增强层重复所述解码和位分片解码直到该多个预定层被全部解码为止。
21.一种编码数字数据的装置,包括一个带宽扩展编码器,其对数字数据进行带宽扩展编码,输出有限带宽数据、并生成带宽扩展信息;一个细粒可伸缩性编码器,其将有限带宽数据编码为具有一个基层和至少一个增强层的分层结构,以便控制比特率;和一个多路复用器,其对已编码的有限带宽数据和带宽扩展信息进行多路复用。
22.根据权利要求21所述的装置,特征在于细粒可伸缩性编码器编码与基层对应的辅助信息,位分段编码多个与基层对应的量化采样,以及位分段编码与下一增强层对应的辅助信息和多个量化采样直到该多个预定层被全部编码为止。
23.根据权利要求21所述的装置,特征在于细粒可伸缩性编码器编码含有与基层对应的缩放系数和编码模型信息的辅助信息,参照编码模型信息位分段编码多个与基层对应的量化采样,编码含有与下一增强层对应的缩放系数和编码模型信息的辅助信息直到多个预定层被全部编码为止,以及位分段编码多个与下一增强层对应的量化采样。
24.根据权利要求21所述的装置,特征在于多路复用器以这种顺序多路复用已编码的有限带宽数据和带宽扩展信息,这一顺序为定位与基层对应的已编码有限带宽数据部分、定位带宽扩展信息、以及定位与其余增强层对应的有限带宽数据部分。
25.根据权利要求21所述的装置,特征在于多路复用器以这种顺序多路复用已编码的有限带宽数据和带宽扩展信息,这一顺序为定位带宽扩展信息、定位与基层对应的已编码有限带宽数据部分、以及定位与其余增强层对应的有限带宽数据部分。
26.一种编码音频数据的装置,包括一个带宽扩展编码器,其对音频数据进行带宽扩展编码、输出有限带宽音频数据、并生成带宽扩展信息;一个细粒可伸缩性编码器,其将有限带宽音频数据编码为具有一个基层和至少一个增强层的分层结构,以便控制比特率;和一个多路复用器,其对已编码的有限带宽音频数据和带宽扩展信息进行多路复用。
27.根据权利要求26所述的装置,特征在于细粒可伸缩性编码器编码与基层对应的辅助信息,位分段编码多个与基层对应的量化采样,以及位分段编码与下一增强层对应的辅助信息和多个量化采样直到该多个预定层被全部编码为止。
28.根据权利要求26所述的装置,特征在于细粒可伸缩性编码器编码含有与基层对应的缩放系数和编码模型信息的辅助信息,参照编码模型信息位分段编码多个与基层对应的量化采样,编码含有与下一增强层对应的缩放系数和编码模型信息的辅助信息直到该多个预定层被全部编码为止,以及位分段编码多个与下一增强层对应的量化采样。
29.根据权利要求26所述的装置,特征在于多路复用器以这种顺序多路复用已编码的有限带宽数据和带宽扩展信息,这一顺序为定位与基层对应的已编码有限带宽数据部分、定位带宽扩展信息、以及定位与其余增强层对应的有限带宽数据部分。
30.一种用于解码数字数据的装置,包括一个多路分解器,用于对输入位流进行多路分解,并且对被编码为具有一个基层和至少一个增强层的分层结构的有限带宽数据和带宽扩展信息进行采样;一个细粒可伸缩性解码器,其对与基层对应的有限带宽的数据中的至少一部分进行解码;和一个带宽扩展解码器,其根据有限带宽的数据的已解码部分并且参照带宽扩展信息,在没有被有限带宽的数据的已解码部分覆盖的频带的至少一部分中生成数字数据,然后将生成的数字数据插入到有限带宽数据的已解码部分。
31.根据权利要求30所述的装置,特征在于细粒可伸缩性解码器解码与基层对应的辅助信息,位分片解码多个与基层对应的量化采样,并且解码与下一增强层对应的辅助信息直到该多个预定的层被全部解码为止,以及位分片解码多个与下一增强层对应的量化采样。
32.根据权利要求31所述的装置,特征在于细粒可伸缩性解码器解码含有与基层对应的缩放系数和编码模型信息的辅助信息,参照编码模型信息位分片解码多个与基层对应的量化采样,解码与下一增强层对应的辅助信息直到该多个预定层被全部解码为止,以及位分片解码多个与下一增强层对应的量化采样。
33.根据权利要求30所述的装置,特征在于多路分解器以这种顺序多路分解输入位流,这一顺序为从输入位流中采样与基层对应的数据、从输入位流中采样带宽扩展信息,以及从输入位流中采样与其余增强层对应的数据。
34.一种用于解码音频数据的装置,包括一个多路分解器,其对输入的音频位流进行多路分解,并且对被编码为具有一个基层和至少一个增强层的分层结构的有限带宽音频数据和带宽扩展信息进行采样;一个细粒可伸缩性解码器,其对与基层对应的有限带宽音频数据中的至少一部分进行解码;和一个带宽扩展解码器,其根据有限带宽的音频数据的已解码部分并且参照带宽扩展信息,在没有被有限带宽的音频数据的已解码部分覆盖的频带的至少一部分中生成音频数据,然后将生成的音频数据插入到有限带宽数据的已解码部分。
35.根据权利要求34所述的装置,特征在于细粒可伸缩性解码器解码与基层对应的辅助信息,位分片解码多个与基层对应的量化采样,并且解码与下一增强层对应的辅助信息直到该多个预定的层被全部解码为止,以及位分片解码多个与下一增强层对应的量化采样。
36.根据权利要求34所述的装置,特征在于多路分解器以这种顺序多路分解输入位流,这一顺序为从输入位流中采样与基层对应的数据、从输入位流中采样带宽扩展信息、以及从输入位流中采样与其余增强层对应的数据。
37.根据权利要求34所述的装置,特征在于多路分解器以这种顺序多路分解输入位流,这一顺序为从输入位流中采样带宽扩展信息、从输入位流中采样与基层对应的数据,以及从输入位流中采样与其余增强层对应的数据。
全文摘要
提供了一种用于使用带宽扩展技术编码和解码数字数据的方法及装置。方法包括带宽扩展编码数字数据,输出有限带宽数据,以及生成带宽扩展信息;将有限带宽数据编码为具有一个基层和至少一个增强层的分层结构以便控制比特率;和多路复用已编码的有限带宽数据和带宽扩展信息。
文档编号G10L21/00GK1527306SQ0316489
公开日2004年9月8日 申请日期2003年9月17日 优先权日2003年3月7日
发明者金重会, 金尚煜 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1