一种可分层音频编解码方法及装置的制作方法

文档序号:2829751阅读:333来源:国知局

专利名称::一种可分层音频编解码方法及装置的制作方法
技术领域
:本发明涉及编解码技术,具体涉及一种可分层音频编解码方法及装置。
背景技术
:随着多媒体技术的快速发展,音频编解码被越来越广泛地应用于数字音频广播、因特网上的高质量音频传输、数字电影等。音频编解码系统的一个重要特征是^f吏音频编解码系统能适应于不同的应用环境。音频可分层编码技术正是在此需求下发展起来的,可分层特征意味着音频信号以层的形式组织,将信号分为低质量部分和高质量部分,信号的低质量部分即音频信号的核心层,信号的高质量部分即音频信号的增强层,低质量部分能在没有任何高质量部分信息的情况下被解码。在传输信道不能保障全部带宽来传输完整信号时,可分层特性就显得特别有用。例如,当多个用户通过不同的通信链路接入相同的音频时,通过高速链路接入音频的用户可以适时播放384kbit/s编码的环绕声,而仅有56kbit/s调制解调器的用户则无法享受到此音频。对音频信号分级后,当具有高带宽的用户享受高质量音频时,用56kbit/s码率连接的用户则可以下载信号的核心层部分,欣赏到一个较低质量的音频。参见图la,为现有技术中可分层音频编码装置的结构示意图,该装置包括积分镜像滤波器组(QMF,QuadratureMirrorFilterbanks)101、QMF102、码本线性预测(CELP,CodeExcitedLinearPrediction)编码模块103、CELP解码模块104、加法器105、修正离散余弦变换(MDCT,ModifiedDiscreteCosineTransform)模块106、MDCT模块107、时域混叠消除(TDAC,TimeDomainAliasCancellation)编码模块108、时域带宽扩展(TDBWE,TimeDomainBandwidthExtension)模块109、比特流复用及打包模块IIO。QMF101,对输入的脉码调制(PCM,PulseCodeModulation)信号进行滤波,输出为核心层信号。QMF101的输入为16,000Hz采样频率的PCM输入信号。QMF102,对输入的PCM信号进行滤波,输出为增强层信号。PCM信号经QMF1和QMF2滤波后分为核心层信号和增强层信号。CELP编码模块103,对QMF1输入的核心层信号进行CELP编码,将编码后的数据传送给CELP解码模块104和比特流复用及打包模块110。CELP解码模块104,将CELP编码模块103输入的编码数据进行CELP解码后,传送给加法器105。加法器105,将QMF101输入的核心层信号和CELP解码模块104输入的信号相减,将输出信号传送给MDCT模块106。MDCT模块106,将加法器105输入的信号由时域变换为频域,得到MDCT系数,传送给TDAC编码模块108。MDCT模块107,将QMF102输入的增强层信号由时域变换为频域,得到增强层的MDCT系数,传送给TDAC编码模块108。TDAC编码模块108,对MDCT模块106输入的MDCT系数和MDCT模块107输入的增强层MDCT系数进行TDAC编码,将编码后的数据传送给比特流复用模块IIO。TDAC编码时,将07000Hz的MDCT系数分为18个子带,计算出这18个子带的包络值,按照包络值的大小为各子带分配编码比特位数,根据各子带的编码比特位数对各子带进行量化和编码。TDBWE模块109,对QMF102输入的增强层信号提取高频参数,传送给比特流复用及打包模块l10。比特流复用及打包模块IIO,对CELP编码模块103输入的编码数据、TDAC编码模块108输入的编码数据和TDBWE109输入的数据进行复用和打包。打包时,将编码数据根据各子带包络值从大到小的顺序依次排列。参见图lb,为现有技术中与图la相对应的可分层音频解码装置的结构示意图,该装置包括比特流解复用模块120、CELP解码模块121、TDAC解码模块122、TDBWE解码模块123、加法器124、逆MDCT模块125、逆MDCT模块126、QMF127、QMF128、加法器129。比特流解复用模块120,对接收到的编码数据进行解复用,将解复用得到的核心层编码数据传送给CELP解码模块121,将其他层数据传送给TDAC解码模块122和TDBWE解码模块123。CELP解码模块121,对接收到的核心层编码数据进行解码后,传送给加法器124。TDAC解码模块122,对接收到的编码数据进行解码后,传送给逆MDCT模块125和逆MDCT模块126。TDBWE解码模块123,对接收到的编码数据进行解码后,传送给QMF128。逆MDCT模块125,将接收到的频域信号转换为时域信号,传送给加法器124。逆MDCT模块126,将接收到的频域信号转换为时域信号,传送给QMF128。加法器124,将由CELP解码4莫块121输入的核心层解码数据和由逆MDCT模块125输入的数据进行相加运算,将求和结果传送给QMF127。QMF127,对接收到的信号进行升采样,得到核心层信号。QMF128,对接收到的信号进行升采样,得到增强层信号。加法器129,将由QMF127输入的核心层信号和由QMF128输入的增强层信号进行相加运算,得到解压的PCM码流。现有的可分层编解码方法有以下缺点1)一般说来,人类听觉系统能感觉到20Hz到20,000Hz频率范围内的声音,频率的上限依赖于每个人听觉系统的状况和声音的强度,普通人的听觉系统对2,000Hz到8,000Hz频率范围内的声音比较敏感。现有技术处理的是16,000Hz采样频率的输入信号,根据各子带包络值大小分配编码比特位数,将包络值大的子带编码数据排在前面作为低层信息,这是可行的。然而,对于32,000Hz,44,100Hz或48,000Hz采样频率的输入信号,这种处理方法将会存在^l大的缺陷。例如,某16,000Hz附近的子带具有较大的包络值,但是可能还没有达到人耳可感知的阈值,即人耳不敏感,如果为此子带分配较多的比特位数,将会导致真正重要的子带没有足够的比特位数来编码而影响编码质量。这种方法也可能使人耳敏感的重要子带因为包络值较小而被排在码流的后面,在网络状况不好时被优先丟弃,这将影响用户听觉感受。这就是说,现有技术的可分层音频编解码方法不能有效解决高采样频率信号输入的情况。2)现有技术中采用的QMF增加了编解码算法的复杂度,增长了编解码算法的时延。对核心层信号采用的CELP编码是为适应语音信号特点而设计的,对同是低频的其他类型的信号并不合适,这将影响编解码效果。
发明内容有鉴于此,本发明实施例的一个目的在于提供一种可分层音频编码装置,该装置有效提高了编码质量。本发明实施例的另一目的在于提供一种可分层音频解码装置,该装置有效地提高了解码质量。本发明实施例的又一目的在于提供一种可分层音频编解码方法,该方法有效提高了编解码质量。为了达到上述目的,本发明的技术方案是这样实现的一种可分层音频编码装置,该装置包括基于听觉感知模型的分层模块、听觉感知模型、子带包络计算及编码模块、核心层编码模块、增强层编码模块和比特流复用及打包模块;所述基于听觉感知模型的分层模块,将输入信号经过调制重叠变换(MLT,ModulatedLappedTransform),变换为MLT系数后,根据听觉感知模型,划分为核心层信号和增强层信号;所述听觉感知模型,为基于听觉感知模型的分层模块提供分层依据,为增强层编码模块的子带重要性加权提供依据;所述子带包络计算及编码模块,根据核心层信号和增强层信号,计算出基于听觉感知模型的分层模块输入的核心层信号和增强层信号的各子带的包络值后,将核心层信号和核心层信号各子带的包络值送给核心层编码模块,将增强层信号和增强层信号各子带包络值传送给增强层编码模块;对各子带包络值进行编码,将编码数据传送给比特流复用及打包模块;所述核心层编码模块,根据输入的核心层信号各子带的包络值,对输入的核心层信号进行编码后,传送给比特流复用及打包模块;所述增强层编码模块,根据听觉感知模型和输入的增强层信号各子带的包络值,对输入的增强层信号进行编码后,传送给比特流复用及打包模块;所述比特流复用及打包模块,对核心层编码模块输入的核心层各子带的编码数据、增强层编码模块输入的增强层各子带的编码数据和子带包络计算及编码模块输入的子带包络值编码数据进行复用和打包。一种可分层音频解码装置,该装置包括比特流解复用模块、子带包络解码模块、核心层解码模块、增强层解码模块、听觉感知模型、MLT系数重建及逆变换模块;所述比特流解复用模块,将接收到的编码数据分解为子带包络值编码数据、核心层编码数据和增强层编码数据,传送给子带包络解码模块;所述子带包络解码模块,对子带包络值编码数据进行解码,得到各子带包络值后,将核心层编码数据和核心层各子带的包络值传送给核心层解码模块,将增强层编码数据和增强层各子带的包络值传送给增强层解码模块;所述核心层解码模块,根据输入的核心层各子带的包络值,对输入的核心层编码数据进行解码,得到解压的核心层各子带的MLT系数后,传送给MLT系数重建及逆变换模块;所述增强层解码模块,根据听觉感知模型和输入的增强层各子带的包络值,对输入的增强编码数据进行解码,得到解压的增强层各子带的MLT系数,将增强层各子带的MLT系数和增强层各子带的包络值传送给MLT系数重建及逆变换模块;所述听觉感知模型,为增强层解码模块的子带重要性加权提供依据;所述MLT系数重建及逆变换模块,对核心层各子带的MLT系数和增强层各子带的MLT系数进行逆变换,得到解压的输出信号。一种可分层音频编解码方法,该方法包括A、将输入信号经MLT后,根据听觉感知模型划分为核心层信号和增强层信号,根据核心层信号和增强层信号,得到各子带包络值的编码数据;B、根据核心层信号和核心层信号各子带的包络值得到核心层各子带的编码数据,根据增强层信号、听觉感知模型和增强层信号各子带的包络值,得到增强层各子带的编码数据,将步骤A得到的各子带包络值的编码数据、核心层各子带的编码数据和增强层各子带的编码数据一起复用打包后,传送给解码端。从上述方案可以看出,本发明实施例的可分层音频编解码方案对输入信号进行了MLT,根据听觉感知模型得到复用打包数据后,传送给解码端,这样,提高了编解码的质量,解决了现有技术中不能有效处理高采样率输入信号的问题。图la为现有技术中可分层音频编码装置的结构示意图lb为现有技术中与图la相对应的可分层音频解码装置的结构示意图2为本发明实施例可分层编码装置的结构示意图3为图2中复用及打包后的音频码流结构示意图4为本发明实施例可分层解码装置的结构示意图5为本发明实施例可分层编码方法的流程图6为本发明实施例可分层解码方法的流程图。具体实施例方式为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明进一步详细说明。参见图2,为本发明实施例可分层编码装置的结构示意图,包括基于听觉感知模型的分层模块210、听觉感知模型220、子带包络计算及编码模块230、核心层编码模块240、增强层编码模块250和比特流复用及打包模块260。基于听觉感知模型的分层模块210,根据听觉感知模型220,将PCM信号经过MLT,变换为MLT系数后,划分为核心层信号和增强层信号。其包括MLT模块211、子带划分模块212和频带重要性分层模块213。MLT模块211,对输入的PCM信号进行MLT,变换为MLT系数。子带划分模块212,将每一帧MLT系数划分为多个等间隔子带,或根据听觉感知模型220将每一帧MLT系数划分为多个非等间隔子带。划分为多个非等间隔子带的方法为根据听觉感知模型220,将MLT系数划分为多个非等间隔的子带,子带的带宽与其频镨位置有关,对频率低的MLT系数,划分较窄的子带,对频率高的MLT系数,划分较宽的子带。频带重要性分层模块213,根据听觉感知模型220,将划分为多个子带的MLT系数分为包含敏感信号的核心层信号和包含次敏感信号的增强层信号。这里,根据听觉感知模型220,将人耳敏感的频带范围内的MLT系数划分为核心层信号,将人耳次敏感的频带范围内的MLT系数划分为增强层信号。例如,根据听觉感知模型,人耳对2,000HZ~8,OOOHZ频率范围内的信号较敏感,就可以将0HZ8,OOOHZ频率范围内的MLT系数划分为核心层信号,将8,OOOHZ以上频率范围内的MLT系数划分为增强层信号。这里,核心层信号和增强层信号分别包括多个子带。听觉感知模型220,为子带划分模块212的MLT系数非等间隔划分提供依据,为频带重要性分层模块213的子带分层提供依据,为子带重要性加权模块251的子带重要性加权提供依据。子带包络计算及编码模块230,根据核心层和增强层信号,计算出由频带重要性分层模块213输入的核心层信号和增强层信号的各子带的包络值后,将核心层信号和核心层信号各子带的包络值传送给核心层编码模块240,将增强层信号和增强层信号各子带的包络值传送给增强层编码模块250;对各子带包络值进行编码,将编码数据传送给比特流复用及打包模块260。核心层编码模块240,根据子带包络计算及编码模块230输入的核心层信号各子带的包络值,对输入的核心层信号进行编码后,传送给比特流复用及打包模块260,其包括子带比特分配模块241和量化及编码模块242。子带比特分配模块241,接收子带包络计算及编码模块230输入的核心层信号和核心层信号各子带的包络值,根据核心层信号各子带包络值,为各子带分配比特位数,将各子带信号的比特位数信息和核心层信号传送给量化及编码;f莫块242。核心层信号包括多个子带,即被划分层多个子带的MLT系数。量化及编码模块242,根据核心层各子带的比特位数,对输入的核心层信号的各子带信号进行量化和编码,将核心层各子带的编码数据传送给比特流复用及打包模块260。增强层编码模块250,根据由子带包络计算及编码模块230输入的增强层信号各子带的包络值和听觉感知模型220,对输入的增强层信号进行编码后,传送给比特流复用及打包模块260,其包括子带重要性加权模块251、子带比特分配模块252和量化及编码模块253。子带重要性加权模块251,接收由子带包络计算及编码模块230输入的增强层信号和增强层各子带的包络值,根据输入的增强层各子带的包络值和听觉感知模型220,对增强层信号的各子带的重要性进行加权计算,将计算得到的增强层各子带的重要性加权的结果和增强层信号传送给子带比特分配模块252。因为增强层信号的频率较高,频带较宽,信号的重要性不仅与包络值有关,还与人耳对信号的敏感度有关,所以,本发明根据听觉感知模型220,对增强层信号进行加权计算对人耳敏感的子带,重要性加权的结果为该子带的包络值与一个较大的权重值的乘积;对于人耳次敏感的子带,重要性加权的结果为该子带的包络值与一个较小的权重值的乘积。也就是说,现有技术中,增强层各子带的重要性只是由包络值决定,而在本发明里,增强层各子带的重要性由包络值和人耳敏感度共同决定。子带比特分配模块252,接收由子带重要性加权模块251输入的增强层各子带的重要性加权的结果和增强层信号,根据增强层信号各子带的重要性加权的结果,为增强层信号的各子带信号分配比特位数,将各子带信号的比特位数信息和增强层信号传送给量化及编码模块253。根据增强层信号各子带的重要性加权的结果,对于重要性大的子带信号,分配较多的比特位数,对于重要性小的子带信号,分配较少的比特位数。量化及编码模块253,接收子带比特分配模块252输入的增强层各子带的比特位数信息和增强层信号,根据增强层各子带信号的比特位数,对增强层信号的各子带信号进行量化和编码,将增强层各子带的编码数据传送给比特流复用及打包模块260。比特流复用及打包模块260,对量化及编码模块242输入的核心层各子带的编码数据、量化及编码模块253输入的增强层各子带的编码数据和子带包络计算及编码模块230输入的子带包络值编码数据进行复用和打包。这里,子带包络计算及编码模块230输入的子带包络值编码数据,包括与核心层信号各子带对应的子带包络值、与增强层信号各子带对应的子带包络值。参见图3,为图2中复用及打包后的音频码流结构示意图,包括核心部分和增强部分。核心部分包括帧头、各子带包络值的编码数据和核心层编码数据,核心层编码数据即图中的层O编码数据,由核心层各子带的编码数据按照频率从低到高的顺序排列而成。增强层部分由增强层编码数据组成,分为如图中所示的层1编码数据至层N编码数据。将增强层各子带的编码数据置入码流的方法为将增强层各子带的编码数据按照重要性从大到小的顺序依次置入码流,将增强层某一子带编码数据置入码流之前,先计算出所在帧的码流已用的比特位数与所述某一子带比特位数之和,再与所在帧的可用总比特位数相比较,如果小于或等于总比特位数,则将所述某一子带编码数据置入码流,并将已用比特位数更新为之前已用比特数与所述某一子带编码数据比特位数的和,继续置入下一子带编码数据;否则,停止置入子带编码数据,将剩余可用比特位数用预先设置的值填充,如,"1"或"0",也就是,舍弃所述某一子带编码数据以及比所述某一子带编码数据重要性小的所有子带编码数据。参见图4,为本发明实施例可分层解码装置的结构示意图,包括比特流解复用模块410、子带包络解码模块420、核心层解码模块430、增强层解码模块440、听觉感知模型450、MLT系数重建及逆变换模块460。比特流解复用模块410,将接收到的编码数据解复用为子带包络值编码数据、核心层编码数据和增强层编码数据,传送给子带包络解码模块420。核心层编码数据为由多个核心层子带编码数据组成的一个整体,增强层编码数据为由多个增强层子带编码数据组成的一个整体。子带包络解码模块420,接收比特流解复用模块410输入的核心层编码数据、子带包络值编码数据和增强层编码数据,对子带包络值编码数据进行解码,得到各子带的包络值后,将核心层编码数据和核心层各子带的包络值传送给核心层解码模块430,将增强层编码数据和增强层各子带的包络值传送给增强层解码模块440。对子带包络值编码数据进行解码后得到的各子带包络值,包括核心层各子带的包络值和增强层各子带的包络值。核心层解码模块430,接收子带包络解码模块420输入的核心层编码数据和核心层各子带的包络值,根据核心层各子带的包络值,对核心层编码数据进行解码,得到解压的核心层各子带的MLT系数后,传送给MLT系数重建及逆变换模块460。其包括子带比特分配模块431、子带数据提取模块432和逆量化及解码模块433。子带比特分配模块431,接收子带包络解码模块420输入的核心层编码数据和核心层各子带的包络值,根据核心层各子带的包络值,为各子带分配比特位数,将核心层各子带的比特位数信息和核心层编码数据传送给子带数据提取模块432。子带数据提取模块432,接收子带比特分配模块431输入的核心层各子带的比特位数信息和核心层编码数据,根据核心层各子带所占的比特位数,提取核心层编码数据的各子带的编码数据,将核心层各子带的编码数据传送给逆量化及解码模块433。从子带比特分配模块431输入的核心层编码数据为包括多个核心层子带编码数据的一个整体,经子带数据提取模块432后输出为核心层各个子带的编码数据。逆量化及解码模块433,接收子带数据提取模块432输入的核心层各子带的编码数据,对核心层各子带的编码数据进行逆量化和解码后,得到解压的核心层各子带的MLT系数,传送给MLT系数重建及逆变换模块460。增强层解码模块440,接收子带包络解码模块420输入的增强层编码数据和增强层各子带的包络值,根据增强层各子带的包络值和听觉感知模型450,对增强层编码数据进行解码,得到解压的增强层各子带的MLT系数,将增强层各子带的MLT系数和增强层各子带的包络值传送给MLT系数重建及逆变换模块460,其包括子带重要性加权模块441、子带比特分配模块442、子带数据提取模块443和逆量化及解码模块444。子带重要性加权模块441,接收子带包络解码模块420输入的增强层编码数据和增强层各子带的包络值,根据输入的增强层各子带的包络值和听觉感知模型450,对增强层编码数据的各子带的重要性进行加权计算,将计算得到的增强编码数据的各子带的重要性加权结果、增强层编码数据和增强层各子带的包络值传送给子带比特分配模块442。因为增强层信号的频率较高,频带较宽,信号的重要性不仅与包络值有关,还与人耳对信号的敏感度有关,所以,本发明根据听觉感知模型450,对增强层信号进行加权计算对人耳敏感的子带,重要性加权的结果为该子带的包络值与一个较大的权重值的乘积;对于人耳次敏感的子带,重要性加权的结果为该子带的包络值与一个较小的权重值的乘积。得到的计算结果数值越大,重要性越大,计算结果数值越小,重要性越小。也就是说,现有技术中,增强层子带的重要性只是由包络值决定,而在本发明里,增强层子带的重要性由包络值和人耳敏感度共同决定。子带比特分配模块442,接收子带重要性加权模块441输入的增强层编码数据的各子带的重要性加权结果、增强层编码数据和增强层各子带的包络值,根据增强层编码数据各子带的重要性加权的结果,为增强层各子带的编码数据分配比特位数,将增强层编码数据的各子带的重要性加权结果、各子带的编码数据的比特位数信息、增强层编码数据和增强层各子带的包络值传送给子带数据提取模块443。子带数据提取模块443,接收子带比特分配模块442输入的增强编码数据的各子带的重要性加权结果、增强层各子带的编码数据的比特位数信息、增强层编码数据和增强层各子带的包络值,按照增强编码数据各子带数据的重要性从大到小的顺序,根据增强层各子带所占的比特位数,提取增强层编码数据的各子带的编码数据,将增强层各子带的编码数据和增强层各子带的包络值传送给逆量化及解码模块444。从子带比特分配模块442输入的增强层编码数据为包括多个增强层子带编码数据的一个整体,经子带数据提取模块443后输出为增强层各个子带的编码数据。按照增强编码数据各子带数据的重要性从大到小的顺序,根据相应各子带所占的比特位数,提取出增强层编码数据的各子带编码数据。提取数据时,首先计算出已提取的所在帧的码流的比特位数和即将提取的增强层编码数据的某一子带编码数据所占比特位数的和,然后与所在帧的码流的总比特位数相比较,如果大于总比特位数,则停止提取数据;否则提取所述某一子带的编码,将已提取比特位数更新为之前已提取比特位数与所述某一子带编码所占比特位的和,继续提取增强层编码数据的下一子带编码数据。逆量化及解码模块444,接收子带数据提取模块443输入的增强层各子带的编码数据和增强层各子带的包络值,对增强层各子带的编码数据进行逆量化和解码后,得到解压的增强层各子带的MLT系数,将增强层各子带的MLT系数和增强层各子带的包络值传送给MLT系数重建及逆变换模块460。听觉感知模型450,为增强层解码模块的子带重要性加权提供依据;若编码或传输过程中为适应网络状况而丟掉了重要性较小的增强层某些子带的数据时,则为MLT系数重建模块461提供重建丢失的增强层MLT系数的依据。MLT系数重建及逆变换模块460,接收逆量化及解码模块433输入的核心层各子带的MLT系数,和逆量化及解码模块444输入的增强层各子带的MLT系数、增强层各子带的包络值,对核心层各子带的MLT系数和增强层各子带的MLT系数进行逆变换,得到解压的PCM信号,其包括MLT系数重建模块461和MLT逆变换模块462。MLT系数重建模块461,接收逆量化及解码模块433输入的核心层各子带的MLT系数,和逆量化及解码模块444输入的增强层各子带的MLT系数、增强层各子带的包络值,根据增强层各子带的包络值,按照频带次序重新排列核心层和增强层各子带的MLT系数后,传送给MLT逆变换模块462。重新排列后的MLT系数为包括核心层MLT系数和增强层MLT系数的一个整体。将核心层和增强层各子带的MLT系数按照频率从小到大的顺序依次排列。对于增强层各子带的MLT系数,可能存在编码或传输过程中为适应网络状况而丢掉的重要性较小的增强层某些子带的数据,例如,在比特流复用及打包模块260复用和打包中,可能会丟掉的重要性较小的某些增强层子带的编码数据。此时,得到重新排列的MLT系数后,可以根据增强层各子带的包络值补偿丟失的增强层MLT系数,补偿方法为MLT系数的符号随机选取,可以为正,也可以为负,将相应子带的包络值乘以一比例常数,作为MLT系数的幅度,所述比例常数根据听觉感知模型450确定,对于人耳敏感度大的子带信号,其比例常数值大,对于人耳敏感度度小的信号,其比例常数值小。MLT逆变换模块462,接收MLT系数重建模块461输入的的MLT系数,对MLT系数进行逆MLT,得到解压的PCM信号。参见图5,为本发明实施例可分层编码方法的流程图。此实施例中,输入采样频率为48kHz的PCM信号,帧长为20ms,延时为40ms,码率范围32~64kbits/s,其中核心层码率为32kbits/s,可分层步长为0.8kbits/s。包括以下步骤步骤501,将PCM信号进行MLT,变换为MLT系数。在48kHz采样率下,每帧20ms的样值数目为960,因此每一次MLT的输入是最新的1920个样值x(n),其中,x(O)是最旧的那个样值,且,0《n<1920。MLT输出960个MLT系数,即mlt(m),其中,0《m<960。MLT由下式给出1919T.卩;r人,<formula>formulaseeoriginaldocumentpage23</formula>960MLT可以分解为窗口、重叠和加法运算,然后进行IV型离散余弦变换(DCT,DiscreteCosineTransform)。窗口、重叠和力。法运算按下式完成v(")=w(479-")x(479-")+w(480+");c(480+"),对于02""79v("+480)=w(959-")x(960+")-w(")jc(1919-"),对于0""79<formula>formulaseeoriginaldocumentpage23</formula>将与IV型DCT合并,形成的MLT系数的表达式为:<formula>formulaseeoriginaldocumentpage23</formula>步骤502,将每一帧MLT系数划分为多个等间隔子带或多个非等间隔子带。这里,将0~20kHz频带范围内的MLT系数等间隔划分为40个子带,每个子带的频带宽度为500Hz,包含20个MLT系数。步骤503,根据听觉感知模型,将MLT系数分为包含敏感信号的核心层信号和包含次敏感信号的增强层信号。根据听觉感知模型,人耳对2k~8kHz范围的信号较敏感,因此将0~8kHz范围,即子带015范围划分为核心层信号,并为其分配32kbits/s码率,将子带16~39范围划分为增强层信号,码率为余下的32kbits/s。步骤504,根据核心层信号和增强层信号,计算出核心层信号和增强层信号的各子带的包络值,对各子带包络值进行编码,得到各子带包络值的编码数据,然后执行步骤505和步骤507。子带包络值被定义为该区域中MLT系数的均方根(RMS,RootMeanSquare),其计算式为计算出各子带得包络值之后,用可变字长编码(VLC,VariableLengthCode)方法或其它编码方法对各子带包络值进行编码,得到各子带包络值的编码数据。步骤505,根据核心层信号各子带的包络值,为核心层信号各子带分配比特位数。可以采用G.722.1或G.929EV的比特分配算法,为核心层各子带信号分配比特位。步骤506,根据核心层信号各子带的比特位数,对核心层信号的各子带信号进行量化和编码,得到核心层各子带的编码数据,然后执行步骤510。步骤507,根据听觉感知模型和增强层信号各子带的包络值,对增强层信号各子带的重要性进行加权计算。因为增强层信号的频率较高,频带较宽,信号的重要性不仅与包络值有关,还与人耳对声音的敏感度有关,所以,本发明根据听觉感知模型,对增强层信号进行加权计算对人耳敏感的子带,重要性加权的结果为rms(r)与一个较大的权重值的乘积;对于人耳次敏感的子带,重要性加权的结果为该子带的rms(r)与一个较小的权重值的乘积。也就是说,增强层信号的各子带信号的重要性由包络值和人耳敏感度决定。子带重要性加权计算可以简单地表示为應(16+r)".6709<4應(16+r)".334"<12薩(16+。12^r<24*f"的大小表示增强层信号的各子带信号的重要性的大小。步骤508,根据计算出的增强层信号各子带的重要性加权结果,为各子带信号分配比特位数。根据步骤507计算得到的加权重要性,为增强层信号的各子带信号分配比特位数。对重要性大的子带信号,分配较多的比特位数,对重要性小的子带信号,分配较少的比特位数。步骤509,根据增强层各子带信号的比特位数,对增强层信号的各子带信号进行量化和编码,得到增强层各子带的编码数据。步骤510,对各子带包络值的编码数据、核心层各子带的编码数据和增强层各子带的编码数据进行复用及打包后,传送给解码端。参见图3,为复用及打包后的音频码流结构示意图。复用及打包的方法与比特流复用及打包模块260处的描述相同。参见图6,为本发明实施例可分层解码方法的流程图,此实施例为对图5中编码后得到的码流进行解码的流程,包括以下步骤步骤601,将编码端传送的编码数据解复用为核心层编码数据、子带包络值编码数据和增强层编码数据。核心层编码数据为由多个核心层子带编码数据组成的一个整体,增强层编码数据为由多个增强层子带编码数据组成的一个整体。步骤602,对各子带包络值编码数据进行解码,得到各子带的包络值,然后执行步骤603和步骤606。对子带包络值编码数据进行解码后得到的各子带包络值,包括核心层各子带的包络值和增强层各子带的包络值。步骤603,根据核心层编码数据的各子带包络值,为核心层编码数据的各子带分配比特位数。步骤604,根据核心层编码数据的各子带所占的比特位数,提取核心层编码数据的各子带编码数据。核心层编码数据为由多个核心层编码数据的子带编码数据组成的一个整体,提取后分解为核心层各子带的编码数据。步骤605,对提取的核心层各子带编码数据进行逆量化和解码后,得到解压的核心层各子带的MLT系数,然后执行步骤610。步骤606,根据听觉感知模型和增强层各子带的包络值,对增强层编码数据的各子带的重要性进行加权计算。步骤607,根据增强层编码数据各子带的重要性,为增强层各子带的编码数据分配比特位数。步骤608,按照增强层编码数据各子带数据的重要性从大到小的顺序,根据增强层各子带所占的比特位数,提取增强层编码数据的各子带的编码数据。本步骤所述的方法与子带数据提取模块443处的描述相同,这里不再赘述。步骤609,对所提取的增强层各子带的编码数据进行逆量化和解码,得到解压的增强层MLT系数。采用与编码流程中量化及编码相反的过程对增强层编码数据进行逆量化和解码,得到各子带的20个MLT系数。步骤610,按照频率次序重新排列核心层和增强层各子带的MLT系数。将核心层和增强层各子带的MLT系数按照频率从小到大的顺序依次排列。对于增强层各子带的MLT系数,可能存在编码或传输过程中为适应网络状况而丟掉的重要性较小的增强层某些子带的数据,例如,编码流程中,复用和打包时,可能会丢掉的重要性较小的某些增强层子带的编码数据。根据增强层各子带的包络值可重建丢失的增强层MLT系数,重建方法为MLT系数的符号随机选取,可以为正,也可以为负,将子带的包络值乘以一比例常数作为MLT系数的幅度,所述比例常数根据听觉感知模型确定,对于人耳敏感度大的子带信号,其比例常数值大,对于人耳敏感度度小的信号,其比例常数值小。表1为本实施例中与各子带对应的比例常数。<table>complextableseeoriginaldocumentpage27</column></row><table>表1:MLT系数重建的比例常数步骤611,对核心层和增强层各子带的MLT系数进行逆MLT,得到鲖压的PCM信号。每一次逆MLT运算处理960个MLT系数,产生960个时域音频样值,逆MLT可以分解为IV型DCT、窗口、重叠和加法运算。IV型DCT为<formula>formulaseeoriginaldocumentpage27</formula>,对于0^n〈960窗口、重叠和加法运算使用当前帧DCT输出样值的一半和前一帧DCT输出样值的一半y(n)=w(n)u(479-n)+w(959-n)u—old(n),对于0《n《479y(n+480)=w(480+n)u(n)-w(479—n)u一old(479—n),对于0Sn《479其中<formula>formulaseeoriginaldocumentpage27</formula>u()中未使用的一半存储为u—old,供下一帧使用u—old(n)=u(n+480),对于0^n"79y(n)为PCM信号的表示式。由上述实施例可见,本发明实施例编码方案将输入信号变换为MLT系数后,根据听觉感知模型划分为核心层信号和增强层信号,再根据核心层信号、增强层信号和听觉感知模型,得到复用和打包后的编码数据;解码时,根据听觉感知模型,对增强层各子带的重要性进行加权计算后,对得到的核心层MLT系数和增强层MLT系数进行逆MLT,输出解压码流。与现有的可分层编解码技术相比,本发明实施例对输入信号进行了MLT,根据听觉感知模型对增强层各子带的重要性进行加权计算,这样,提高了编解码的质量,解决了现有技术中不能有效处理高采样率输入信号的问题。并且,本发明不采用QMF以及CELP编码,降低了编解码复杂度,增强了编解码效果。以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。权利要求1.一种可分层音频编码装置,其特征在于,该装置包括基于听觉感知模型的分层模块、听觉感知模型、子带包络计算及编码模块、核心层编码模块、增强层编码模块和比特流复用及打包模块;所述基于听觉感知模型的分层模块,将输入信号经过调制重叠变换MLT,变换为MLT系数后,根据听觉感知模型,划分为核心层信号和增强层信号;所述听觉感知模型,为基于听觉感知模型的分层模块提供分层依据,为增强层编码模块的子带重要性加权提供依据;所述子带包络计算及编码模块,根据核心层信号和增强层信号,计算出基于听觉感知模型的分层模块输入的核心层信号和增强层信号的各子带的包络值后,将核心层信号和核心层信号各子带的包络值送给核心层编码模块,将增强层信号和增强层信号各子带包络值传送给增强层编码模块;对各子带包络值进行编码,将编码数据传送给比特流复用及打包模块;所述核心层编码模块,根据输入的核心层信号各子带的包络值,对输入的核心层信号进行编码后,传送给比特流复用及打包模块;所述增强层编码模块,根据听觉感知模型和输入的增强层信号各子带的包络值,对输入的增强层信号进行编码后,传送给比特流复用及打包模块;所述比特流复用及打包模块,对核心层编码模块输入的核心层各子带的编码数据、增强层编码模块输入的增强层各子带的编码数据和子带包络计算及编码模块输入的子带包络值编码数据进行复用和打包。2、如权利要求l所述的装置,其特征在于,所述基于听觉感知模型的分层模块包括MLT模块、子带划分模块和频带重要性分层模块;所述MLT模块,对输入信号进行MLT,变换为MLT系数;所述子带划分模块,将每一帧MLT系数划分为多个等间隔子带;所述频带重要性分层模块,根据听觉感知模型,将划分为多个子带的MLT系数分为核心层信号和增强层信号。3、如权利要求l所述的装置,其特征在于,所述听觉感知模型为子带划分模块的MLT系数非等间隔划分提供依据;所述基于听觉感知模型的分层模块包括MLT模块、子带划分模块和频带重要性分层模块;所述MLT模块,对输入信号进行MLT,变换为MLT系数;所述子带划分模块,根据所述听觉感知模型将每一帧MLT系数划分为多个非等间隔子带;所述频带重要性分层模块,根据听觉感知模型,将划分为多个子带的MLT系数分为核心层信号和增强层信号。4、如权利要求1所述的装置,其特征在于,所述核心层编码模块包括子带比特分配模块和量化及编码模块;所述子带比特分配模块,接收子带包络计算及编码模块输入的核心层信号和核心层信号各子带的包络值,根据核心层信号各子带包络值,为各子带分配比特位数,将各子带信号的比特位数信息和核心层信号传送给量化及编码模块;所述量化及编码模块,根据核心层各子带的比特位数,对输入的核心层信号的各子带信号进行量化和编码,将核心层各子带的编码数据传送给比特流复用及打包模块。5、如权利要求1至4任一项所述的装置,其特征在于,所述增强层编码模块包括子带重要性加权模块、子带比特分配模块和量化及编码模块;所述子带重要性加权模块,接收由子带包络计算及编码模块输入的增强层信号和增强层各子带的包络值,根据输入的增强层各子带的包络值和听觉感知模型,对增强层信号的各子带的重要性进行加权计算,将计算得到的增强层各子带的重要性加权的结果和增强层信号传送给子带比特分配模块;所述子带比特分配模块,根据增强层信号各子带的重要性加权的结果,为各子带信号分配比特位数,将各子带信号的比特位数信息和增强层信号传送给量化及编码模块;所述量化及编码模块,根据增强层各子带信号的比特位数,对增强层信号的各子带信号进行量化和编码,将增强层各子带的编码数据传送给比特流复用及打包模块。6、一种可分层音频解码装置,其特征在于,该装置包括比特流解复用模块、子带包络解码模块、核心层解码模块、增强层解码模块、听觉感知模型、调制重叠变换MLT系数重建及逆变换模块;所述比特流解复用模块,将接收到的编码数据分解为子带包络值编码数据、核心层编码数据和增强层编码数据,传送给子带包络解码模块;所述子带包络解码模块,对子带包络值编码数据进行解码,得到各子带包络值后,将核心层编码数据和核心层各子带的包络值传送给核心层解码模块,将增强层编码数据和增强层各子带的包络值传送给增强层解码模块;所述核心层解码模块,根据输入的核心层各子带的包络值,对输入的核心层编码数据进行解码,得到解压的核心层各子带的MLT系数后,传送给MLT系数重建及逆变换才莫块;所述增强层解码模块,根据听觉感知模型和输入的增强层各子带的包络值,对输入的增强编码数据进行解码,得到解压的增强层各子带的MLT系数,将增强层各子带的MLT系数和增强层各子带的包络值传送给MLT系数重建及逆变换模块;所述听觉感知模型,为增强层解码模块的子带重要性加权提供依据;所述MLT系数重建及逆变换模块,对核心层各子带的MLT系数和增强层各子带的MLT系数进行逆变换,得到解压的输出信号。7、如权利要求6所述的装置,其特征在于,所述核心层解码模块包括子带比特分配模块、子带数据提取模块和逆量化及解码模块;所述子带比特分配模块,接收子带包络解码模块输入的核心层编码数据和核心层各子的带包络值,根据核心层各子带的包络值,为各子带分配比特位数,将核心层各子带的比特位数信息和核心层编码数据传送给子带数据提取模块;所述子带数据提取模块,根据核心层各子带所占的比特位数,提取核心层编码数据的各子带的编码数据,将核心层各子带的编码数据传送给逆量化及解码模块;所述逆量化及解码模块,对核心层各子带的编码数据进行逆量化和解码后,得到解压的核心层各子带的MLT系数,传送给MLT系数重建及逆变换模块。8、如权利要求6或7所述的装置,其特征在于,所述增强层解码模块包括子带重要性加权模块、子带比特分配模块、子带数据提取模块和逆量化及解码模块;所述子带重要性加权模块,接收子带包络解码模块输入的增强层编码数据和增强层各子带的包络值,根据增强层各子带的包络值和听觉感知模型,对增强层编码数据的各子带的重要性进行加权计算,将计算得到的增强编码数据的各子带的重要性加权结果、增强层编码数据和增强层各子带的包络值传送给子带比特分配模块;所述子带比特分配模块,根据增强层编码数据各子带的重要性加权的结果,为增强层编码数据的各子带的编码数据分配比特位数,将增强层编码数据的各子带的重要性加权结果、各子带的编码数据的比特位数信息、增强层编码数据和增强层各子带的包络值传送给子带数据提取模块;所述子带数据提取模块,按照增强层编码数据各子带编码数据的重要性从大到小的顺序,根据相应各子带所占的比特位数,提取增强层编码数据的各子带的编码数据,将增强层各子带的编码数据和增强层各子带的包络值传送给逆量化及解码模块;所述逆量化及解码模块,对输入的增强层各子带的编码数据进行逆量化和解码后,得到解压的增强层各子带的MLT系数,将增强层各子带的MLT系数和输入的增强层各子带的包络值传送给MLT系数重建及逆变换模块。9、如权利要求8所述的装置,其特征在于,所述MLT系数重建及逆变换模块包括MLT系数重建模块和MLT逆变换模块;所述MLT系数重建模块,根据输入的增强层各子带的包络值,按照频带次序重新排列核心层和增强层各子带的MLT系数后,传送给MLT逆变换模块;所述MLT逆变换模块,对核心层和增强层各子带的MLT系数进行逆MLT变换,得到解压的输出信号。10、如权利要求9所述的装置,其特征在于,所述听觉感知模型,为MLT系数重建模块对丢掉的增强层MLT系数的补偿提供依据;所述MLT系数重建模块,根据所述的听觉感知模型,对丟掉的增强层MLT系数进行补偿。11、一种可分层音频编解码方法,其特征在于,该方法包括A、将输入信号经调制重叠变换MLT后,根据听觉感知模型划分为核心层信号和增强层信号,根据核心层信号和增强层信号,得到各子带包络值的编码数据;B、根据核心层信号和核心层信号各子带的包络值得到核心层各子带的编码数据,根据增强层信号、听觉感知模型和增强层信号各子带的包络值,得到增强层各子带的编码数据,将步骤A得到的各子带包络值的编码数据、核心层各子带的编码数据和增强层各子带的编码数据一起复用打包后,传送给解码端。12、如权利要求11所述的方法,其特征在于,步骤A中所述输入信号进行MLT后之后进一步包括将所述MLT后得到的每一帧MLT系数划分为多个等间隔子带,或根据听觉感知模型将所述MLT后得到的每一帧MLT系数划分为多个非等间隔子带。13、如权利要求12所述的方法,其特征在于,步骤A所述得到各子带包络值的编码数据的方法为计算出核心层信号和增强层信号的各子带的包络值,对各子带包络值进行编码,得到各子带包络值的编码数据;步骤B所述得到核心层各子带的编码数据的方法为根据核心层信号各子带的包络值,为核心层信号各子带分配比特位数;根据核心层信号各子带的比特位数,对核心层信号的各子带信号进行量化和编码,得到核心层各子带的编码数据;步骤B所述得到增强层各子带的编码数据的方法为根据听觉感知模型和增强层信号各子带的包络值,对增强层信号各子带的重要性进行加权计算;根据计算出的增强层信号各子带的重要性加权结果,为各子带信号分配比特位数;根据增强层各子带信号的比特位数,对增强层信号的各子带信号进行量化和编码,得到增强层各子带的编码数据。14、如权利要求11至13任一项所述的方法,其特征在于,步骤B所述复用打包的方法为将各子带包络值的编码数据置于码流的帧头后面,将核心层各子带的编码数据置于各子带包络值的编码数据之后,将增强层各子带的编码数据置于核心层各子带的编码数据之后。15、如权利要求14所述的方法,其特征在于,所述置入增强层编码数据的方法为按照各子带的重要性从大到小的顺序将增强层各子带的编码数据依次置入码流,在将增强层某一子带编码数据置入码流之前,先计算出所在帧的码流已用的比特位数与所述某一子带的比特位数之和,再与所在帧的可用总比特位数相比较,如果小于或等于总比特数,则将当前子带编码数据置入码流,并将已用比特位数更新为之前已用比特数与所述某一子带编码数据比特位数的和,继续置入下一子带编码数据;否则,停止置入子带编码数据。16、如权利要求11所述的方法,其特征在于,所述步骤B之后进一步包括a、对编码端传送的打包数据进行解复用,根据听觉感知模型,计算解复用后的增强层编码数据的各子带的重要性,得到核心层和增强层各子带的MLT系数;b、按照频带次序重新排列核心层和增强层各子带的MLT系数,对MLT系数进行逆MLT,输出解压码流。17、如权利要求16所述的方法,其特征在于,步骤a所述对打包数据进行解复用后进一步包括将解复用后得到的各子带包络值的编码数据进行解码,得到各子带的包络值;步骤a所述得到核心层各子带的MLT系数的方法为根据核心层编码数据的各子带的包络值,为解复用得到的核心层编码数据的各子带分配比特位数;根据核心层编码数据的各子带所占的比特位数,提取核心层编码数据的各子带编码数据;对提取的核心层各子带编码数据进行逆量化和解码后,得到解压的核心层各子带的MLT系数;步骤a所述根据听觉感知模型得到增强层各子带的MLT系数的方法为根据听觉感知模型和增强层各子带的包络值,对增强层编码数据的各子带的重要性进行加权计算;根据增强层编码数据各子带的重要性,为增强层各子带的编码数据分配比特位数;按照增强编码数据各子带数据的重要性从大到小的顺序,根据增强层各子带所占的比特位数,提取增强层编码数据的各子带的编码数据;对所提取的增强层各子带的编码数据进行逆量化和解码,得到解压的增强层MLT系凄史。18、如权利要求13或17所述的方法,其特征在于,所述对各子带的重要性进行加权计算的方法为将增强层各子带的包络值乘以一个加权值,得到增强层各子带的重要性加权结果,所述加权值根据听觉感知模型确定。19、如权利要求18所述的方法,其特征在于,所述提取增强层编码数据的各子带的编码数据的方法为先计算出已提取的所在帧的码流的比特位数和即将提取的增强层编码数据的某一子带编码数据所占比特位数的和,再与所在帧的码流的总比特位数相比较,如果大于总比特位数,则停止提取数据;否则提取所述某一子带的编码,将已提取比特位数更新为之前已提取比特位数与所述某一子带编码所占比特位的和,继续提取增强层编码数据的下一子带编码数据。20、如权利要求19所述的方法,其特征在于,当编码或传输过程中丢失重要性较小的增强层子带数据时,步骤b所述按照频带次序重新排列核心层和增强层各子带的MLT系数之后进一步包括补偿丟失的增强层MLT系数的方法MLT系数的符号随机选取,将包络值乘以比例常数作为MLT系数的幅度,所述比例常数根据听觉感知模型确定。全文摘要本发明公开了一种可分层编解码方法及装置。本发明实施例的可分层音频编码方案将输入信号变换为调制重叠变换(MLT,ModulatedLappedTransform)系数后,根据听觉感知模型划分为核心层信号和增强层信号,得到复用和打包后的编码数据;解码时,根据听觉感知模型,对增强层各子带的重要性进行加权计算后,对得到的核心层MLT系数和增强层MLT系数进行逆MLT,输出解压码流。与现有的可分层编解码技术相比,本发明对输入信号进行了MLT,根据听觉感知模型对增强层各子带的重要性进行加权计算,这样,提高了编解码的质量,解决了现有技术中不能有效处理高采样率输入信号的问题。文档编号G10L19/02GK101206860SQ20061016789公开日2008年6月25日申请日期2006年12月20日优先权日2006年12月20日发明者万华林,军张申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1