可分级音频编码、解码的方法和装置以及编解码系统的制作方法

文档序号:2822476阅读:159来源:国知局

专利名称::可分级音频编码、解码的方法和装置以及编解码系统的制作方法
技术领域
:本发明涉及信源编码和信号处理
技术领域
,特别涉及可分级音频编码、解码的方法和装置以及编解码系统。
背景技术
:可分级音频编码的方法能够在编码端对音频信号进行高码率压縮,得到音频码流,并且在解码端能够根据具体的用户使用环境、内容需求、设备性能(例如带宽)等从音频码流中恢复不同的保真度。另外,可分级音频编码的方法不用分别保存相应的音频文件,能够减少存储量,此外,对分级后的音频码流加以不对等保护,从而能够在带宽不断变化的网络中提供不间断的音频服务。基于上述优点可分级音频编码的方法已被广泛的应用于音频压縮编码。现有技术提供了以下两种可分级音频编码的方法,包括第一种,包括有核和无核两种模式。在有核模式下,先采用AAC(AdvancedAudioCoding,高级音频编码)核心编码器对音频信号进行压縮编码,得到基本层码流,同时经过残差映射得到每个变换系数的残差;在无核模式下,每个变换系数的残差即为原始信号的频谱。对以上两种模式下的每个变换系数的残差做比特切割,得到位平面,其中,该位平面由子带的位平面组成,根据每个子带的JND(justnoticeabledistortion,临界可闻失真)计算每个子带的位平面移位量,并根据每个子带的位平面移位量,对每个子带的位平面向上平移,得到平移后的位平面,然后对位平面进行编码得到增强层码流,对基本层码流和增强层码流进行封装,得到编码后的音频码流。第二种,采用AAC核心编码器对音频信号进行高码率压縮,得到每个变换系数的量化值,对每个变换系数的量化值做比特切割得到各频带的位平面,将全频带划分为若干编码带,从低频编码带开始,在各编码带内按从低频到高频、从最高比特位向最低比特位对位平面进行编码。其中,为保证基本层音质,在编码时定义了基本层的频谱范围;为提高效率,编码时采用了基于上下文的位平面编码。在实现本发明的过程中,发明人发现现有技术存在如下的问题上述第一种技术,在有核模式下,在对增强层进行编码时,没有同时考虑实际量化噪声对音质的影响,即不能优先编码最能改善音质的子带,增强层编码不满足人耳听觉特性,不满足音频业务质量可分级的要求;在对增强层进行编码时,还需要记录每个子带的位平面移位量,如此,增加系统额外码率开销。上述第二种技术,在编码时,按照频带进行分级,没有考虑到人耳对不同子带的主观音质的感受不同,即没有优先考虑对主观音质影响较大的子带,编码器不满足人耳听觉特性,不能满足音频业务质量可分级的要求。
发明内容为了能够减少系统额外码率开销,提高有限码率下解码后的音频信号的音质,本发明实施例提供了可分级音频编码、解码的方法和装置以及编解码系统。所述技术方案如下—种可分级音频编码的方法,所述方法包括通过对音频信号压縮编码,获得基本层码流和每个子带的噪声遮蔽比NMR(NoisetoMaskRatio,噪声遮蔽比);获得所述音频信号的增强层位平面,所述增强层位平面由各子带的位平面组成;根据每个子带的NMR获取每个子带的位平面移位量;根据每个子带的位平面移位量,将每个子带的位平面向低比特位平移,得到每个子带的位平面优先级;根据每个子带的位平面优先级,对每个子带的位平面进行编码,得到增强层码流;对所述基本层码流和所述增强层码流进行封装,得到编码后的音频码流。所述获得所述音频信号的增强层位平面,具体包括根据所述音频信号的每个变换系数和其所在子带的比例因子,计算每个变换系数的归一化残差;对每个变换系数的归一化残差做预设数值比特的量化,得到所述增强层位平面。所述根据每个子带的NMR获取每个子带的位平面移位量,具体包括从所有子带的NMR中,查找最大的NMR;将每个子带的NMR与所述最大的NMR进行比较,得到每个子带的NMR差值;确定每个子带的NMR差值所在的NMR差值范围;根据每个子带的NMR差值范围,从位平面移位量与NMR差值范围的对应关系中查找每个子带的位平面移位量。—种对利用所述的可分级音频编码的方法得到的音频码流进行解码的方法,所述方法包括通过对所述音频码流进行解码,获取每个变换系数的量化值,每个子带的位平面的MSB(MostSignificantBit,最高比特位),每个子带的比例因子和增强层信息;根据增强层信息和每个子带的位平面的MSB,建立增强层位平面;根据所述增强层位平面、每个子带的比例因子和每个变换系数的量化值,重建音频信号。所述根据增强层信息和每个子带的位平面的MSB,建立增强层位平面,具体包括根据每个子带的位平面的MSB,建立空白的增强层位平面,所述增强层位平面包括所有子带的位平面;从增强层信息中读取每个子带的位平面的数据,将所述读取的数据顺序填入所述增强层位平面对应的位置处。所述根据所述增强层位平面、每个子带的比例因子和每个变换系数的量化值,重建音频信号,具体包括从所述增强层位平面中读取每个变换系数的位平面,根据每个变换系数的位平面,计算出每个变换系数的归一化残差;利用每个变换系数的归一化残差对每个变换系数的量化值进行修正,得到修正后的每个变换系数的量化值;根据修正后的每个变换系数的量化值和其所在子带的比例因子,获得到每个变换系数,对每个变换系数进行逆变换得到所述音频信号。—种可分级音频编码的装置,所述装置包括第一获得模块,用于通过对音频信号压縮编码,获得基本层码流和每个子带的噪声遮蔽比NMR;第二获得模块,用于获得所述音频信号的增强层位平面,所述增强层位平面由各子带的位平面组成;第三获得模块,用于根据每个子带的NMR获取每个子带的位平面移位量;平移模块,用于根据每个子带的位平面移位量,将每个子带的位平面向低比特位平移,得到每个子带的位平面优先级;编码模块,用于根据每个子带的位平面优先级,对每个子带的位平面进行编码,得到增强层码流;封装模块,用于对所述基本层码流和所述增强层码流进行封装,得到编码后的音频码流。所述第二获得模块具体包括第一计算单元,用于根据所述音频信号的每个变换系数和其所在子带的比例因子,计算每个变换系数的归一化残差;量化单元,用于对每个变换系数的归一化残差做预设数值比特的量化,得到所述增强层位平面。所述第三获得模块具体包括第一查找单元,用于从所有子带的NMR中,查找最大的NMR;比较单元,用于将每个子带的NMR与所述最大的NMR进行比较,得到每个子带的NMR差值;确定单元,用于确定每个子带的NMR差值所在的NMR差值范围;第二查找单元,用于根据每个子带的NMR差值范围,从位平面移位量与NMR差值范围的对应关系中查找每个子带的位平面移位量。—种对利用所述可分级音频编码的装置得到的音频码流进行解码的装置,所述装置包括获取模块,用于通过对所述音频码流进行解码,获取每个变换系数的量化值,每个子带的位平面的最高比特位MSB,每个子带的比例因子和增强层信息;建立模块,用于根据增强层信息和每个子带的位平面的MSB,建立增强层位平面;重建模块,用于根据所述增强层位平面、每个子带的比例因子和每个变换系数的量化值,重建音频信号。所述建立模块具体包括建立单元,用于根据每个子带的位平面的MSB,建立空白的增强层位平面,所述增强层位平面包括所有子带的位平面;填入单元,用于从增强层信息中读取每个子带的位平面的数据,将所述读取的数据顺序填入所述增强层位平面对应的位置处。所述重建模块具体包括第二计算单元,用于从所述增强层位平面中读取每个变换系数的位平面,根据每个变换系数的位平面,计算出每个变换系数的归一化残差;修正单元,用于利用每个变换系数的归一化残差对每个变换系数的量化值进行修正,得到修正后的每个变换系数的量化值;获得单元,用于根据修正后的每个变换系数的量化值和其所在子带的比例因子,获得到每个变换系数,对每个变换系数进行逆变换得到所述音频信号。通过对音频信号进行压縮编码,得到基本层码流和每个子带的NMR,根据每个子带的NMR获取每个子带的位平面移位量,将每个子带的位平面向低比特位平移,得到每个子带的位平面优先级;根据每个子带的位平面优先级,对每个子带的位平面进行编码,得到增强层码流;将基本层码流和增强层码流进行封装,得到编码后的音频码流。由于不需要在编码时记录每个子带的位平面移位量,节省了系统额外开销;根据每个子带的NMR获取每个子带的位平面移位量,根据移位量将各子带的位平面向低比特位平移,从而实现对不同子带分配不同的位平面优先级,根据每个子带的位平面优先级进行编码,可以对NMR较大的子带的位平面优先编码,从而保证解码后的音频信号的音质。图1是本发明实施例1提供的一种可分级音频编码的方法流程图;图2是本发明实施例1提供的一种可分级音频编码的方法详细流程图;图3是本发明实施例1提供的一种可分级音频编码的方法流程框图;图4是本发明实施例1提供的第一种位平面示意图;图5是本发明实施例1提供的第二种位平面示意图;图6是本发明实施例2提供的一种解码的方法流程图;图7是本发明实施例2提供的一种解码的方法详细流程图;图8是本发明实施例2提供的一种解码的方法流程框图;图9是本发明实施例2提供的一种空白增强层位平面示意图;图10是本发明实施例3提供的一种可分级音频编码的装置结构示意图;图11是本发明实施例4提供的一种解码的装置结构示意图;图12是本发明实施例5提供的一种编解码系统结构示意图。具体实施例方式为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。实施例1如图1所示,本发明实施例提供了一种音频编码方法,包括步骤101:通过感知编码器对音频信号进行压縮编码,获得基本层码流和每个子带的NMR;其中,音频信号包括多个子带,由于码率限制,感知编码器得到基本层码流只包括部分子带,这些子带码本号全不为零。基本层码流包括码本号不为零的子带包括的每个变换系数的量化值和每个码本号不零的子带的比例因子。步骤102:获得音频信号的增强层位平面,该增强层位平面包括各子带的位平面;步骤103:根据每个子带的NMR获取每个子带的位平面移位量;步骤104:根据每个子带的位平面移位量,将每个子带的位平面向低比特位平移,得到每个子带的位平面优先级;步骤105:根据得到的每个子带的位平面优先级,对每个子带的位平面进行编码,得到增强层码流;其中,根据位平面移位量将各子带位平面向低比特位进行平移,使NMR越大的子带的位平面优先级越高,从而能够在编码时,对NMR较大子带的位平面优先编码,从而保证解码后的音频信号的音质。步骤106:对基本层码流和增强层码流进行封装,得到编码后的音频码流。在本发明实施例中,利用AAC核心编码器对音频信号进行压縮编码,得到基本层码流和每个子带的NMR,并根据每个子带的NMR获取每个子带的位平面移位量,将每个子带的位平面向低比特位平移,得到每个子带的位平面优先级;根据每个子带的位平面优先级,对每个子带的位平面进行编码,得到增强层码流;将基本层码流和增强层码流进行封装,得到编码后的音频码流。由于不需要在编码时记录每个子带的位平面移位量,节省了系统额外开销;根据位平面移位量将各子带的位平面向低比特位进行平移,能够在编码时,对NMR较大的子带优先编码,从而保证了解码后的音频信号的音质。参见图2和图3,本发明实施例提供的上述音频编码方法,可以具体包括步骤201:采用感知编码器对音频信号进行压縮编码,得到基本层码流和每个子带的NMR,其中,基本层码流包括码本号不为零的子带的比例因子和其包括的每个变换系数的量化值;其中,通过感知编码器对音频信号进行编码,可以将音频信号转换成多个变换系数,而这些变换系数又被划分为多个子带。感知编码器(Perc印tualcoding)是指利用心理声学模型的音频压縮编码器,例如,变换编码器(transformcoding)、子带编码器(subbandcoding)、正弦参数编码器(parametercoding)和线性预测编码(linearpredictivecoding)等,再如AAC核心编码器、MPEG(MovingPicturesExpertsG丽p)-l层l(layer1)、层2(layerII)和层3(layerIII)编码器、MPEG-4等多种,这里的变换系数是指时_频变换的结果,时_频变换包括DFT(DiscreteFourierTransform,离散傅里叶变换)、MDCT(ModifiedDigitalCosineTransform,修正的离散余弦变换)、DWT(DiscreteWaveletTransform,离散小波变换),WPT(WaveletPacketTransform,小波包变换)、PQF(PolyphaseQuadratureFilter,子带滤波器组)等。因此每种编码器得到的变换系数的形式都不相同,例如,通过AAC核心编码器对音频信号进行编码得到的变换系数为MDCT频谱,通过MPEG-1层2(或称MUSICAM,Masking-patternUniversalSub-bandIntegratedCodingandMultiplexing)编码器对音频信号进行编码得到的变换系数为子带滤波。由于码率限制,感知编码器得到基本层码流只包括部分子带,这些子带码本号全不为零。基本层码流包括码本号不为零的子带包括的每个变换系数的量化值和每个码本号不为零的子带的比例因子。感知编码器先得到每个码本号不为零的子带的比例因子,再按公式(1)对码本号不为零的子带包括的每个变换系数进行量化,得到每个码本号不为零的子带包括的每个变换系数的量化值x—quant。<formula>formulaseeoriginaldocumentpage10</formula>x—quant=int{[abs(mdct—line)x24—_]4+MAGIC—NUMBER}....其中,MAGIC—NUMBER二0.4054,sf_decoder为子带的比例因子,SF_0FFSET=100,mdct_line为变换系数。在音频编码中,主要的误差即来自(1)式中的量化取整。如果在编码端能对(1)式中的取整环节进行某种形式的修正,则能够使每个变换系数的误差得到一定程度的减小,从而在解码时,利用每个变换系数的量化值恢复出的每个变换系数得到一定程度的还原。其中,感知编码器不对码本号为零的子带进行编码,也就不将码本号为零的子带的比例因子和其包括的变换系数的量化值写入基本层码流。对于码本号为零的子带,如果在解码端也能够对码本号为零的子带包括的每个变换系数的量化值进行修正,在解码时,利用每个变换系数的量化值恢复出的每个变换系数得到一定程度的修正。另外,感知编码1L器在编码时,还将各子带的码本号写入基本层码、》另外,感知编码器结合心理声学模型在对音频信号进行压縮编码时,可以得到每个子带的NMR。其中,有些感知编码器在对音频信号进行压縮编码时,能够得到每个子带的NMR,而有些感知编码器在对音频信号进行压縮编码时,只得到每个子带的SMR(SignalMaskRatio,信号遮蔽比),但得不到每个子带的NMR,如此需要根据每个子带的SMR,按以下的计算方法计算每个子带的NMR,具体步骤如下(1)、根据每个子带包括的变换系数,按如下的公式(2)计算各子带的信号能量codec_e(n):High(n)、2codec—e(n)=J](mdct—line(i))......(2)i=Low(n)其中,公式(2)中的n为子带序号,Low(n)和High(n)分别是第n个子带的下、上边界,mdctjine(i)是第i个变换系数;(2)、根据每个子带的信号能量codec—e和SMR,按如下的公式(3)计算每个带的遮蔽门限Mask(n);Mask(n)=codec_e(n)/SMR(n)......(3)(3)、根据每个变换系数的量化值和其所在子带的比例因子,并按如下的反量化公式(4)重建出每个变换系数x」nvauant(i);<formula>formulaseeoriginaldocumentpage10</formula>LO簡x—invquant(i)=x—q薩t(i)3x24一—......(4)其中,x—quant(i)为通过感知编码器得到的第i个变换系数的量化值,SFJ)FFSET=100,Sf_deCOder为第i个变换系数所在子带的比例因子。(4)、根据每个子带包括的变换系数和重建的变换系数,按如下的公式(5)计算各子带的量化噪声Noise(n):High(n)"、<formula>formulaseeoriginaldocumentpage10</formula>其中,公式(5)中的mdctjine(i)为通过感知编码器得到的第i个变换系数,x_invauant(i)为通过公式(4)重建得到的第i个变换系数。(5)、根据每个子带的量化噪声Noise(n)和遮蔽门限Mask(n)按如下的公式(6)计算出每个子带的NMR(n):腿(n)=Noise(n)/Mask(n)......(6)步骤202:根据码本号不为零的子带包括的每个变换系数和量化值x—quant,按公式(7)计算出每个变换系数的归一化残差x—enh;「mjn,-丄(sfdecoder-SFOFFSET)吞,、x—enh=(abs(mdct—line)x24——)4—x—quant……(7)其中,码本号不为零的子带包括的每个变换系数的归一化残差x—enhG(-1.0,1.0),mdct_line为每个变换系数。步骤203:对于码本号为零的那些子带,按如下的公式(8)计算每个码本号为零的子带的比例因子sf_decoder;sf_decoder=ceil[log2(maxspec4)]+SF_0FFSET......(8)maxspec为每个子带中的最大变换系数,ceil为向上舍入函数。步骤204:根据码本号为零的子带包括的变换系数以及该变换系数所在的子带的比例因子,按如下的公式(9)计算出变换系数的归一化残差x—enh;「mlcl-丄(sfdecoder-SFOFFSET)兰,、x—enh=(abs(mdct」ine)x24—_)4......(9)其中,码本号为零的子带包括的每个变换系数的归一化残差x—enhG(-1.0,1.0)。至此,得到码本号不为零的子带和码本号为零的子带包括的所有变换系数的归一化残差x_enh,且x_enhG(-1.0,1.0)。归一化残差x_enh用于修正变换系数的量化值,修正后的量化值用于重建变换系数。在解码端利用归一化残差x_enh来修正每个变换系数的量化值,利用修正后的量化值重建每个变换系数,就可以最大限度的修复每个变换系数。步骤205:对每一个变换系数的归一化残差X_enh做M比特的量化,得到增强层位平面,其中,该增强层位平面有M个比特位,由所有子带的位平面组成;具体地,针对一个变换系数,对该变换系数的归一化残差x_enh做M比特的量化,得到该变换系数的M+1个位平面分别为{b(M+l),b(M),b(M-l),...,b(lM,其中,位平面b(M+l)用于存放该变换系数的归一化残差的符号位,b(M),b(M-l),...,b(l)用于存储该变换系数的归一化残差的数据部分,将位平面b(M)与b(M+l)合并。按上述方法对每个变换系数的归一化残差进行M比特的量化,获得到每个变换系数的M个位平面,将各子带包括的变换系数的位平面组成子带的位平面,其中,每个子带的位平面都有一个MSB和LSB(LeastSignificantBit,最低比特位),即分别为子带的数据部分的最高比特位和最低比特位,由每个子带的位平面再组成增强层位平面,如图4所示为增强层位平面,该增强层位平面包括的每个子带位平面有M个比特位,每个比特位的位平面由k个子带的位平面组成。步骤206:根据每个子带的NMR计算各子带的NMR差值;具体地,从所有子带的NMR中查找最大的NMR,将每个子带的NMR与查找的最大的NMR进行比较,得到每个子带的NMR相对于最大的NMR之间的差值,即每个子带对应的NMR差值。步骤207:根据每个子带的NMR差值,从位平面移位量与NMR差值范围的对应关系中,获取每个子带对应的位平面移位量;具体地,针对一个子带,根据该子带的NMR差值,确定该子带的NMR差值所在的NMR差值范围,从位平面移位量与NMR差值范围的对应关系中,读取确定的NMR差值范围对应的位平面移位量,将读取的位平面移位量作为该子带的位平面移位量,按上述方法得到所有子带的位平面移位量。其中,当子带的NMR越大,该子带的NMR与最大NMR之间的NMR差值就越小,该子带的位平面移位量就越小。如表1所示为M取值为13时,所建立的位平面移位量与NMR差值范围对应关系。表l<table>tableseeoriginaldocumentpage12</column></row><table>步骤208:根据各子带的位平面移位量,在增强层位平面中将各子带的位平面向低比特位进行平移,得到各子带的位平面优先级;其中,对增强层位平面进行平移后,对于每个比特位平面,在编码前,所有子带的NMR相差约在6dB以内,而任意相邻两个比特位平面之间,任意两个子带的NMR相差约在6dB以上。所以,对平移后的位平面进行顺序编码,能够大致遵循最大NMR的准则,即NMR较大的子带其位平面的优先级相对较高,从而保证解码后的音质。例如,将如图4所示的增强层位平面进行移位后,得到的增强层位平面如图5所示。在图5中,对于MSB越高的子带的位平面,即向低位平移的位平面移位量越小的位平面,其位平面优先级越高。例如,第一个子带的位平面移位量为3,第一个子带的所有位平面向低位平移3个比特位,第二个子带的位平面移位量为O,第二个子带的所有位平面不平移,所以第二个子带的第1第3个位平面的优先级要高于第一个子带的第1个位平面优先级,并且第二个子带的第1第3个位平面的优先级是从高到低变化的。步骤209:在平移后的增强层位平面中,按各子带的位平面优先级进行编码,得到增强层码流,其中,增强层码流包括增强层位平面的数据部分,每个子带的MSB,码本号为零的子带的比例因子;具体地,对平移后的增强层位平面按从低频到高频、从MSB到LSB的顺序扫描方式进行扫描,其中,对于优先级高的位平面即MSB越大的子带的高比特位平面能够被优先扫描,对扫描的位平面包括的数据进行编码,得到码流,并将每个子带的MSB写入码流,对于码本号为零的子带,还要将每个码本号为零的子带的比例因子写入码流,如此得到增强层码流;其中,每个子带的MSB,码本号为零的子带的比例因子又可统称为边信息。例如,对如图5所示的增强层位平面按低频到高频、从MSB到LSB的顺序扫描方式进行扫描,由于第2个子带的位平面的MSB最高,其位平面优先级最高,首先扫描的位平面为位平面bp(2,M),再对位平面bp(2,M)进行编码,按上述方法直到将增强层位平面全编码完为止。其中,对于NMR越大的子带,其对应的MSB越大,对位平面采用顺序扫描方式进行编码,能够使NMR越大的子带的高比特位平面优先编码。步骤210:对基本层码流与增强层码流进行封装,得到编码后的音频码流。其中,增强层码流存储每个变换系数的归一化残差,在解码端利用增强层码流中的信息对每个变换系数进行修正。其中,在本实施例中,将每个变换系数的归一残差转换为位平面,而不是将每个变换系数的量化值转换成位平面,因此,将子带的位平面向低比特位平移时,只会改变变换系数的归一化残差的精度,而变换系数的量化值没有改变,因此,在编码时,不需要记录每个子带的位平面移位量,减少了系统的额外码率开销。其中,人耳听不见低于遮蔽门限的声音,而NMR为量化噪声与遮蔽门限的比值,如果NMR比较小,也即量化噪声低于遮蔽门限,人耳将感觉不到量化噪声的存在。在低码率时,由于基本层编码的码率限制,部分子带的量化噪声仍然大于遮蔽门限,在对位平面进行编码时,优先考虑量化噪声大的子带将会获得较高的音质收益,即优先对位平优先级高的子带的位平面进行编码。相反,如果没有优先考虑这些子带而优先考虑那些量化噪声已经低于遮蔽门限的子带,那么虽然码率增加了,音频业务质量却没有得到明显提升,从而造成码率与音频业务质量的不匹配。所以音频业务质量的可分级要求编码器要满足人耳的听觉特性。因此,利用每个子带的NMR来协调码率分级和主观音频质量分级,最大可能地保证码率分级和主观音质分级的一致性。在本发明实施例中,利用AAC核心编码器对音频信号进行压縮编码,得到基本层码流和每个子带的NMR,根据每个子带的NMR获取每个子带的位平面移位量,将每个子带的位平面向低比特位平移,得到每个子带的位平面优先级;根据每个子带的位平面优先级,对每个子带的位平面进行编码,得到增强层码流;将基本层码流和增强层码流进行封装,得到编码后的音频码流。由于在解码时,不需要利用每个子带的位平面移位量即可恢复出修正后的各变换系数的量化值,节省了系统额外开销;根据每个子带的NMR获取每个子带的位平面移位量,按照各子带的位平面移位量将位平面向低比特位进行平移,能够使NMR较大的子带的位平面优先编码,保证了解码后的音频信号的音质。实施例2如图6所示,本发明实施例还提供了一种解码方法,对利用实施例1提供的音频编码方法得到的音频码流进行解码,该方法包括步骤301:通过解码器对压縮编码后的音频码流进行解码,获得每个变换系数的量化值,每个子带的比例因子和每个子带的位平面MSB以及增强层信息;其中,增强层信息包括所有位平面的数据。步骤302:根据增强层信息和每个子带的位平面的MSB,建立增强层位平面;其中,增强层位平面包括所有子带的位平面,每个子带的位平面包括多个变换系数的位平面,每个子带有一个或多个位平面组成。步骤303:根据增强层位平面和每个变换系数的量化值,重建音频信号。本发明实施例中,通过解码器对音频码流进行解码,得到每个变换系数的量化值,每个子带的比例因子和每个子带位平面的MSB以及增强层信息,根据每个子带的位平面的MSB和增强层信息,建立增强层位平面,根据增强层位平面和每个变换系数的量化值,重建变换系数,对重建的变换系数进行逆变换即得到解码后的音频信号。由于解码时不需要利用位平面移位量即可恢复修正后的变换系数的量化值,从而能够减少系统额外码率开销。如图7和8所示,本发明实施例提供的上述方法,具体包括步骤401:利用解码器对音频码流进行解码,得到每个变换系数的量化值、每个子带的比例因子,增强层信息和每个子带的位平面的MSB;其中,增强层信息包括所有位平面的数据,解码器得到码本号为零的子带包括的各变换系数的量化值均为0。步骤402:根据每个子带的位平面的MSB和增强层信息,建立增强层的位平面;具体地,根据每个子带的MSB建立空白的增强层位平面,如图9所示,该增强层位平面为空,将从增强层信息中读取每个子带的位平面的数据,并将读取的位平面的数据顺序填入到空白的增强层位平面对应的位置处。其中,建立的增强层位平面包括多个子带的位平面,子带的位平面包括多个变换系数的位平面。步骤403:根据每个变换系数的位平面,计算出每个变换系数的归一化残差x—enh[k];具体地,将每个变换系数的位平面带入到如下的公式(10)计算出每个变换系数的归一化残差x—enh[k]。<formula>formulaseeoriginaldocumentpage14</formula>(10)其中,x—enh[k]为第k个变换系数的归一化残差,b(k,M+l)为第k个变换系数的归一化残差的符号位,m为第k个变换系数的位平面的MSB值,b(k,M+l-j)为第k个变换系数的第j个比特位。步骤404:利用每个变换系数的归一化残差对解码后得到的每个变换系数的量化值进行修正,得到修正后的每个变换系数的量化值。具体地,将每个变换系数的量化值和归一化残差进行取和,得到修正后的每个变换系数的量化值。步骤405:根据每个变换系数的量化值和其所在的子带的比例因子,获得每个变换系数,即得到重建后的变换系数,对重建的变换系数进行逆变换即可得到解码后的音频信号。具体地,将每个变换系数的修正后的量化值x'i和其所在的子带的比例因子sf_decoder带入到如下的反量化公式(11)中,计算出重建后的每个变换系数x」nvquant(k),对每个变换系数进行逆变换得到解码后的音频信号。rrHCi,丘丄(sfdecoder(n)-SFOFFSET)、x—invquant(k)^x'k3x24——……(11)其中,x'k为修正后的第k个变换系数的量化值,xjnvquant(k)为重建后的第k个变换系数。编码器获取码本号不为零的子带包括的变换系数的量化值,由于存在量化误差,使得变换系数的量化噪声比较大,在本实施例中从增强层码流中获取变换系数的归一化残差,利用每个变换系数的归一化残差对每个变换系数的量化值进行修正,从而利用修正后的变换系数的量化值获得的变换系数能够得到最大限度的修正。另外,在本发明实施例中,在对音频码流进行解码时,不进行利用每个子带的位平面移位量恢复每个子带的位平面的步骤,即可恢复每个变换系数的修正后的量化值,所以能够减少系统的额外码率开销。本发明实施例中,通过解码器对音频码流进行解码,得到每个变换系数的量化值,每个子带的比例因子和每个子带位平面的MSB以及增强层信息,根据每个子带的位平面的MSB和增强层信息,建立增强层位平面,从增强层位平面获取每个变换系数的归一化残差,利用每个变换系数的归一化残差对每个变换系数的量化值进行修正,利用修正的每个变换系数的量化值重建出每个变换系数,对每个变换系数进行逆变换得到音频信号。由于不需要利用每个子带的位平面移位量,就能重建出音频信号,所以能够减少系统额外码率开销。实施例3如图10所示,本发明实施例提供了一种可分级音频编码的装置,包括第一获得模块501,用于通过对音频信号压縮编码,获得基本层码流和每个子带的腿;第二获得模块502,用于获得音频信号的增强层位平面,该增强层位平面由各子带的位平面组成;第三获得模块503,用于根据每个子带的NMR获取每个子带的位平面移位量;平移模块504,用于根据每个子带的位平面移位量,将每个子带的位平面向低比特位平移,得到每个子带的位平面优先级;编码模块505,用于根据每个子带的位平面优先级,对每个子带的位平面进行编码,得到增强层码流;封装模块506,用于对基本层码流和增强层码流进行封装,得到编码后的音频码流。其中,第二获得模块502具体包括第一计算单元,用于根据音频信号的每个变换系数和其所在子带的比例因子,计算每个变换系数的归一化残差;量化单元,用于对每个变换系数的归一化残差做预设数值比特的量化,得到增强层位平面;第三获得模块503具体包括第一查找单元,用于从所有子带的NMR中,查找最大的NMR;比较单元,用于将每个子带的NMR与最大的NMR进行比较,得到每个子带的NMR差值;确定单元,用于确定每个子带的NMR差值所在的NMR差值范围;第二查找单元,用于根据每个子带的NMR差值范围,从位平面移位量与NMR差值范围的对应关系中查找每个子带的位平面移位量。在本发明实施例中,通过对音频信号进行压縮编码,得到基本层码流,根据每个子带的NMR获取每个子带的位平面移位量,根据每个子带的位平面移位量将每个子带的位平面向低比特位平移,得到每个子带的位平面优先级;根据每个子带的位平面优先级,对每个子带的位平面进行编码,得到增强层码流;将基本层码流和增强层码流进行封装,得到编码后的音频码流。由于不需要在编码时记录每个子带的位平面移位量,节省了系统额外码率开销;按照各子带的位平面移位量将各子带位平面向低比特位进行平移后,采取顺序扫描的方式能够使NMR较大的子带的位平面优先编码,保证了解码后的音频信号的音质。实施例4如图11所示,本发明实施例提供了一种对利用实施例3的可分级音频编码的装置得到的音频码流进行解码的装置,包括获取模块601,用于通过对音频码流进行解码,获取每个变换系数的量化值,每个子带的位平面的最高比特位MSB,每个子带的比例因子和增强层信息;建立模块602,用于根据增强层信息和每个子带的位平面的MSB,建立增强层位平面;重建模块603,用于根据增强层位平面、每个子带的比例因子和每个变换系数的量化值,重建音频信号。其中,建立模块602具体包括建立单元,用于根据每个子带的位平面的MSB,建立空白的增强层位平面,所述增强层位平面包括所有变换系数的位平面;填入单元,用于从增强层信息中读取每个变换系数的位平面的数据,将读取的数据顺序填入增强层位平面对应的位置处;重建模块603具体包括第二计算单元,用于从增强层位平面中读取每个变换系数的各比特位,根据每个变换系数的各比特位,计算出每个变换系数的归一化残差;修正单元,用于利用每个变换系数的归一化残差对每个变换系数的量化值进行修正;获得单元,用于根据修正后的每个变换系数的量化值和其所在子带的比例因子,获得到每个变换系数,即得到重建的变换系数,对重建的变换系数进行逆变换即得到解码后的音频信号。本发明实施例中,通过解码器对音频码流进行解码,得到每个变换系数的量化值,每个子带的比例因子和每个子带位平面的MSB以及增强层信息,根据每个子带的位平面的MSB和增强层信息,建立增强层位平面,根据增强层位平面和每个变换系数的量化值,重建音频信号。由于不需要利用每个子带的位平面移位量,就能重建音频信号,可以减少系统额外码率开销。实施例5如图12所示,本发明实施例提供了一种编解码系统,包括可分级音频编码的装置701,用于通过对音频信号压縮编码,获得基本层码流和每个子带的NMR;获得音频信号的增强层位平面,该增强层位平面由各子带的位平面组成;根据每个子带的NMR获取每个子带的位平面移位量;根据每个子带的位平面移位量,将每个子带的位平面向低比特位平移,得到每个子带的位平面优先级;根据每个子带的位平面优先级,对每个子带的位平面进行编码,得到增强层码流;对基本层码流和增强层码流进行封装,得到编码后的音频码流;解码的装置702,用于通过对音频码流进行解码,获取每个变换系数的量化值,每个子带的位平面的最高比特位MSB,每个子带的比例因子和增强层信息;根据增强层信息和每个子带的位平面的MSB,建立增强层位平面;根据增强层位平面、每个子带的比例因子和每个变换系数的量化值,重建音频信号。在本发明实施例中,在编码端,当得到基本层码流和所有子带的NMR后,获得增强层位平面,根据计算得到的NMR获取每个子带的位平面移位量,再根据位平面移位量,将每个子带的位平面向低比特位平移,得到每个子带的位平面优先级,根据位平面优先级对每个子带的位平面进行编码,得到增强层码流,将基本层码流和增强层码流进行封装,得到编码后的音频码流。在解码端,经过解码获得到每个变换系数的量化值,每个子带的比例因子和每个子带位平面的MSB以及增强层信息,根据每个子带的位平面的MSB和增强层信息,建立增强层位平面,根据增强层位平面和每个变换系数的量化值,重建音频信号。由于在编码时,不需要记录每个子带的位平面移位量,节省了系统额外开销;根据每个子带的NMR获取每个子带的位平面移位量,按照所述位平面移位量将各子带的位平面向低比特位进行平移,这样在对平移后的位平面进行顺序扫描时,能够使得NMR较大的子带优先编码保证解码后音频信号的音质。以上实施例提供的技术方案中的全部或部分内容可以通过软件编程实现,其软件程序存储在可读取的存储介质中,存储介质例如计算机中的硬盘、光盘或软盘。以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。权利要求一种可分级音频编码的方法,其特征在于,所述方法包括通过对音频信号压缩编码,获得基本层码流和每个子带的噪声遮蔽比NMR;获得所述音频信号的增强层位平面,所述增强层位平面由各子带的位平面组成;根据每个子带的NMR获取每个子带的位平面移位量;根据每个子带的位平面移位量,将每个子带的位平面向低比特位平移,得到每个子带的位平面优先级;根据每个子带的位平面优先级,对每个子带的位平面进行编码,得到增强层码流;对所述基本层码流和所述增强层码流进行封装,得到编码后的音频码流。2.如权利要求1所述的方法,其特征在于,所述获得所述音频信号的增强层位平面,具体包括根据所述音频信号的每个变换系数和其所在子带的比例因子,计算每个变换系数的归一化残差;对每个变换系数的归一化残差做预设数值比特的量化,得到所述增强层位平面。3.如权利要求l所述的方法,其特征在于,所述根据每个子带的NMR获取每个子带的位平面移位量,具体包括从所有子带的NMR中,查找最大的NMR;将每个子带的NMR与所述最大的NMR进行比较,得到每个子带的NMR差值;确定每个子带的NMR差值所在的NMR差值范围;根据每个子带的NMR差值范围,从位平面移位量与NMR差值范围的对应关系中查找每个子带的位平面移位量。4.一种对利用权利要求1所述的方法得到的音频码流进行解码的方法,其特征在于,所述方法包括通过对所述音频码流进行解码,获取每个变换系数的量化值,每个子带的位平面的最高比特位MSB,每个子带的比例因子和增强层信息;根据增强层信息和每个子带的位平面的MSB,建立增强层位平面;根据所述增强层位平面、每个子带的比例因子和每个变换系数的量化值,重建音频信号。5.如权利要求4所述的方法,其特征在于,所述根据增强层信息和每个子带的位平面的MSB,建立增强层位平面,具体包括根据每个子带的位平面的MSB,建立空白的增强层位平面,所述增强层位平面包括所有子带的位平面;从增强层信息中读取每个子带的位平面的数据,将所述读取的数据顺序填入所述增强层位平面对应的位置处。6.如权利要求4所述的方法,其特征在于,所述根据所述增强层位平面、每个子带的比例因子和每个变换系数的量化值,重建音频信号,具体包括从所述增强层位平面中读取每个变换系数的位平面,根据每个变换系数的位平面,计算出每个变换系数的归一化残差;利用每个变换系数的归一化残差对每个变换系数的量化值进行修正,得到修正后的每个变换系数的量化值;根据修正后的每个变换系数的量化值和其所在子带的比例因子,获得到每个变换系数,对每个变换系数进行逆变换得到所述音频信号。7.—种可分级音频编码的装置,其特征在于,所述装置包括第一获得模块,用于通过对音频信号压縮编码,获得基本层码流和每个子带的噪声遮蔽比NMR;第二获得模块,用于获得所述音频信号的增强层位平面,所述增强层位平面由各子带的位平面组成;第三获得模块,用于根据每个子带的NMR获取每个子带的位平面移位量;平移模块,用于根据每个子带的位平面移位量,将每个子带的位平面向低比特位平移,得到每个子带的位平面优先级;编码模块,用于根据每个子带的位平面优先级,对每个子带的位平面进行编码,得到增强层码流;封装模块,用于对所述基本层码流和所述增强层码流进行封装,得到编码后的音频码流。8.如权利要求7所述的装置,其特征在于,所述第二获得模块具体包括第一计算单元,用于根据所述音频信号的每个变换系数和其所在子带的比例因子,计算每个变换系数的归一化残差;量化单元,用于对每个变换系数的归一化残差做预设数值比特的量化,得到所述增强层位平面。9.如权利要求1所述的装置,其特征在于,所述第三获得模块具体包括第一查找单元,用于从所有子带的NMR中,查找最大的NMR;比较单元,用于将每个子带的NMR与所述最大的NMR进行比较,得到每个子带的NMR差值;确定单元,用于确定每个子带的NMR差值所在的NMR差值范围;第二查找单元,用于根据每个子带的NMR差值范围,从位平面移位量与NMR差值范围的对应关系中查找每个子带的位平面移位量。10.—种对利用权利要求7所述的装置得到的音频码流进行解码的装置,其特征在于,所述装置包括获取模块,用于通过对所述音频码流进行解码,获取每个变换系数的量化值,每个子带的位平面的最高比特位MSB,每个子带的比例因子和增强层信息;建立模块,用于根据增强层信息和每个子带的位平面的MSB,建立增强层位平面;重建模块,用于根据所述增强层位平面、每个子带的比例因子和每个变换系数的量化值,重建音频信号。11.如权利要求10所述的装置,其特征在于,所述建立模块具体包括建立单元,用于根据每个子带的位平面的MSB,建立空白的增强层位平面,所述增强层位平面包括所有子带的位平面;填入单元,用于从增强层信息中读取每个子带的位平面的数据,将所述读取的数据顺序填入所述增强层位平面对应的位置处。12.如权利要求10所述的装置,其特征在于,所述重建模块具体包括第二计算单元,用于从所述增强层位平面中读取每个变换系数的位平面,根据每个变换系数的位平面,计算出每个变换系数的归一化残差;修正单元,用于利用每个变换系数的归一化残差对每个变换系数的量化值进行修正,得到修正后的每个变换系数的量化值;获得单元,用于根据修正后的每个变换系数的量化值和其所在子带的比例因子,获得到每个变换系数,对每个变换系数进行逆变换得到所述音频信号。全文摘要本发明公开了可分级音频编码、解码的方法和装置以及编解码系统,属于信源编码和信号处理
技术领域
。所述方法包括通过对音频信号压缩编码,获得基本层码流和每个子带的NMR;获得所述音频信号的增强层位平面,所述增强层位平面由各子带的位平面组成;根据每个子带的NMR获取每个子带的位平面移位量;根据每个子带的位平面移位量,将每个子带的位平面向低比特位平移,得到每个子带的位平面优先级;根据每个子带的位平面优先级,对每个子带的位平面进行编码,得到增强层码流;对所述基本层码流和所述增强层码流进行封装,得到编码后的音频码流。本发明能够减少系统额外码率开销,提高解码后的音频信号的音质。文档编号G10L19/02GK101710489SQ20091023748公开日2010年5月19日申请日期2009年11月9日优先权日2009年11月9日发明者张波,窦维蓓申请人:清华大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1