可分层音频编解码方法系统及瞬态信号可分层编解码方法

文档序号:2823413阅读:87来源:国知局
专利名称:可分层音频编解码方法系统及瞬态信号可分层编解码方法
技术领域
本发明涉及音频编解码技术,尤其涉及一种可分层音频编解码方法、系统及瞬态信号可分层编解码方法。
背景技术
可分层音频编码是指以分层的方式组织音频编码的码流,一般分成一个核心层和若干个扩展层,解码器可以在没有高层(譬如扩展层)编码码流的情况下实现只对低层 (譬如核心层)编码码流进行解码,解码的层数越多,音质提高得越大。可分层编码技术对于通信网络有非常重要的实用价值。一方面,数据的传输可以由不同信道共同合作完成,而每个信道的丢包率都有可能不同,这时候往往需要对数据进行可分层处理,将数据中重要的部分放在丢包率相对较低的稳定信道中传输,而将数据中次要的部分放在丢包率相对较高的非稳定信道中传输,从而保证当非稳定信道丢包时只会产生相对的音质下降,而不会出现一帧数据完全无法解码的情况。另一方面,某些通信网络 (比如因特网)的带宽很不稳定,不同用户之间的带宽各不相同,不能采用一个固定的码率来兼顾不同带宽用户的需求,而采用可分层的编码方案就可以使得不同用户在各自所拥有的带宽条件下获得最佳的音质享受。传统的可分层音频编码方案,比如ITU(International TelecommunicationUnion,国际电信联合会)的标准G. 729. 1和G. VBR,都没有针对瞬态信号帧实施针对性的处理,因此对于含有较多瞬态成分的信号(比如打击乐信号)编码效果较低,尤其是在中低码率的传输条件下。

发明内容
本发明所要解决的技术问题是,提供一种高效的可分层音频编码、解码方法及系统及瞬态信号可分层编解码方法,以改善可分层音频编解码的质量。为解决上述问题,本发明提供了一种可分层音频编码方法,包括对当前帧的音频信号进行瞬态判决;瞬态判决为稳态信号时,对加窗后的音频信号直接进行时频变换得到总的频域系数;瞬态判决为瞬态信号时,将音频信号分成M个子帧,对每个子帧进行时频变换,变换得到的M组频域系数构成当前帧总的频域系数,对总的频域系数按照编码子带从低频到高频的顺序进行重排,其中,所述总的频域系数包括核心层频域系数和扩展层频域系数,所述编码子带包括核心层编码子带和扩展层编码子带,核心层频域系数构成若干个核心层编码子带,扩展层频域系数构成若干个扩展层编码子带;对核心层编码子带和扩展层编码子带的幅值包络值进行量化和编码,得到核心层编码子带和扩展层编码子带的幅值包络量化指数及其编码比特;其中,若为稳态信号,则对核心层编码子带和扩展层编码子带的幅值包络值进行统一量化;若为瞬态信号,则对核心层编码子带和扩展层编码子带的幅值包络值分别进行单独量化,以及对核心层编码子带的幅值包络量化指数和扩展层编码子带的幅值包络量化指数分别进行重排;根据核心层编码子带的幅值包络量化指数对核心层编码子带进行比特分配,然后对核心层频域系数进行量化和编码得到核心层频域系数的编码比特;对前述核心层中经过矢量量化的频域系数进行反量化,并与原始的经过时频变换后得到的频域系数进行差计算,得到核心层残差信号;根据核心层编码子带的幅值包络量化指数和比特分配数计算核心层残差信号的幅值包络量化指数;根据核心层残差信号的幅值包络量化指数和扩展层编码子带的幅值包络量化指数对扩展层编码信号的编码子带进行比特分配,然后对扩展层编码信号进行量化和编码得到扩展层编码信号的编码比特,其中,所述扩展层编码信号由核心层残差信号和扩展层频域系数构成;将核心层和扩展层编码子带的幅值包络编码比特、核心层频域系数编码比特和扩展层编码信号的编码比特复用打包后,传送给解码端。为解决上述问题,本发明还提供了一种可分层音频解码方法,该方法包括对编码端传送过来的比特流进行解复用,对核心层编码子带和扩展层编码子带的幅值包络编码比特解码,得到核心层编码子带和扩展层编码子带的幅值包络量化指数;若瞬态判决信息表明为瞬态信号,还对核心层编码子带和扩展层编码子带的幅值包络量化指数按照频率从小到大的顺序分别进行重排;根据核心层编码子带的幅值包络量化指数,对核心层编码子带进行比特分配,并由此计算核心层残差信号的幅值包络量化指数,根据核心层残差信号的幅值包络量化指数和扩展层编码子带的幅值包络量化指数对扩展层编码信号的编码子带进行比特分配;根据核心层编码子带和扩展层编码信号的编码子带的比特分配数,分别对核心层频域系数的编码比特和扩展层编码信号的编码比特解码,得到核心层频域系数和扩展层编码信号,将扩展层编码信号按照子带顺序重新排列,并和核心层频域系数相加,得到全体带宽的频域系数;若所述瞬态判决信息表明为稳态信号,则对全体带宽的频域系数直接进行时频逆变换,得到输出的音频信号;若所述瞬态判断信息表明为瞬态信号,则将全体带宽的频域系数进行重排,然后分成M组频域系数,对每一组频域系数进行时频逆变换,根据变换得到的 M组时域信号计算得到最终的音频信号。为解决上述问题,本发明还提供了一种瞬态信号的可分层音频编码方法,该方法包括 将音频信号分成M个子帧,对每个子帧进行时频变换,变换得到的M组频域系数构成当前帧总的频域系数,对总的频域系数按照编码子带从低频到高频的顺序进行重排,其中,所述总的频域系数包括核心层频域系数和扩展层频域系数,所述编码子带包括核心层编码子带和扩展层编码子带,核心层频域系数构成若干个核心层编码子带,扩展层频域系数构成若干个扩展层编码子带; 对核心层编码子带和扩展层编码子带的幅值包络值进行量化和编码,得到核心层编码子带和扩展层编码子带的幅值包络量化指数及其编码比特,其中对核心层编码子带和扩展层编码子带的幅值包络值分别进行单独量化,以及对核心层编码子带的幅值包络量化指数和扩展层编码子带的幅值包络量化指数分别进行重排;根据核心层编码子带的幅值包络量化指数对核心层编码子带进行比特分配,然后对核心层频域系数进行量化和编码得到核心层频域系数的编码比特;对前述核心层中经过矢量量化的频域系数进行反量化,并与原始的经过时频变换后得到的频域系数进行差计算,得到核心层残差信号;根据核心层编码子带的幅值包络量化指数和核心层编码子带的比特分配数计算核心层残差信号编码子带的幅值包络量化指数;根据核心层残差信号的幅值包络量化指数和扩展层编码子带的幅值包络量化指数对扩展层编码信号的编码子带进行比特分配,然后对扩展层编码信号进行量化和编码得到扩展层编码信号的编码比特,其中,所述扩展层编码信号由核心层残差信号和扩展层频域系数构成;将核心层编码子带和扩展层编码子带的幅值包络编码比特、核心层频域系数的编码比特和扩展层编码信号的编码比特复用打包后,传送给解码端。为解决上述问题,本发明还提供了一种瞬态信号的可分层解码方法,该方法包括对编码端传送过来的比特流进行解复用,对核心层编码子带和扩展层编码子带的幅值包络编码比特解码,得到核心层编码子带和扩展层编码子带的幅值包络量化指数,对核心层编码子带和扩展层编码子带的幅值包络量化指数按照频率从小到大的顺序分别进行重排;根据重排后的核心层编码子带的幅值包络量化指数,对核心层编码子带进行比特分配,并由此计算核心层残差信号的幅值包络量化指数;根据核心层残差信号的幅值包络量化指数和重排后的扩展层编码子带的幅值包络量化指数对扩展层编码子带进行比特分配;根据核心层编码子带和扩展层编码信号的编码子带的比特分配数,分别对核心层频域系数编码比特和扩展层编码信号编码比特解码,得到核心层频域系数和扩展层编码信号,将扩展层编码信号按照子带顺序重新排列,并和核心层频域系数相加,得到全体带宽的频域系数;将全体带宽的频域系数进行重排,然后分成M组,对每一组频域系数进行时频逆变换,根据变换得到的M组时域信号计算得到最终的音频信号。为解决上述问题,本发明还提供了一种可分层音频编码系统,该系统包括频域系数生成单元、幅值包络计算单元、幅值包络量化和编码单元、核心层比特分配单元、核心层频域系数矢量量化和编码单元以及比特流复用器;其特征在于,该系统还包括瞬态判决单元、扩展层编码信号生成单元、残差信号幅值包络生成单元、扩展层比特分配单元以及扩展层编码信号矢量量化和编码单元;其中所述瞬态判决单元,用于对当前帧的音频信号进行瞬态判决;所述频域系数生成单元,与所述瞬态判决单元连接,瞬态判决为稳态信号时,用于对加窗后的音频信号直接进行时频变换得到总的频域系数;瞬态判决为瞬态信号时,用于将音频信号分成M个子帧,对每个子帧进行时频变换,变换得到的M组频域系数构成当前帧总的频域系数,对总的频域系数按照编码子带从低频到高频的顺序进行重排,其中,所述总的频域系数包括核心层频域系数和扩展层频域系数,所述编码子带包括核心层编码子带和扩展层编码子带,核心层频域系数构成若干个核心层编码子带,扩展层频域系数构成若干个扩展层编码子带;所述幅值包络计算单元,与所述频域系数生成单元连接,用于计算核心层编码子带和扩展层编码子带的幅值包络值;所述幅值包络量化和编码单元,与所述幅值包络计算单元以及瞬态判决单元连接,用于对核心层编码子带和扩展层编码子带的幅值包络值进行量化和编码,得到核心层编码子带和扩展层编码子带的幅值包络量化指数及其编码比特;其中,若为稳态信号,则对核心层编码子带和扩展层编码子带的幅值包络值进行统一量化;若为瞬态信号,则对核心层编码子带和扩展层编码子带的幅值包络值分别进行单独量化,以及对核心层编码子带的幅值包络量化指数和扩展层编码子带的幅值包络量化指数分别进行重排;所述核心层比特分配单元,与所述幅值包络量化和编码单元连接,用于根据核心层编码子带的幅值包络量化指数对核心层编码子带进行比特分配,得到核心层编码子带的比特分配数;所述核心层频域系数矢量量化和编码单元,与所述频域系数生成单元、幅值包络量化和编码单元及核心层比特分配单元连接,用于使用根据核心层编码子带的幅值包络量化指数重建的核心层编码子带的量化幅值包络值和核心层编码子带的比特分配数对核心层编码子带的频域系数进行归一化、矢量量化和编码,得到核心层频域系数编码比特;所述扩展层编码信号生成单元,与所述频域系数生成单元及核心层频域系数矢量量化和编码单元连接,用于生成核心层残差信号,得到由核心层残差信号和扩展层频域系数构成的扩展层编码信号;所述残差信号幅值包络生成单元,与所述幅值包络量化和编码单元及核心层比特分配单元连接,用于根据核心层编码子带的幅值包络量化指数与对应的核心层编码子带的比特分配数,得到核心层残差信号的幅值包络量化指数;所述扩展层比特分配单元,与所述残差信号幅值包络生成单元及幅值包络量化和编码单元连接,用于根据核心层残差信号幅值包络量化指数和扩展层编码子带的幅值包络量化指数对扩展层编码信号编码子带进行比特分配,得到扩展层编码信号编码子带的比特分配数;所述扩展层编码信号矢量量化和编码单元,与所述幅值包络量化和编码单元、扩展层比特分配单元、残差信号幅值包络生成单元及扩展层编码信号生成单元连接,用于使用根据扩展层编码信号编码子带的幅值包络量化指数重建的扩展层编码信号编码子带的量化幅值包络值和扩展层编码信号编码子带的比特分配数对扩展层编码信号进行归一化、 矢量量化和编码,得到扩展层编码信号编码比特;所述比特流复用器与所述幅值包络量化和编码单元、核心层频域系数矢量量化和编码单元、扩展层编码信号矢量量化和编码单元连接,用于将核心层边信息比特、核心层编码子带的幅值包络的编码比特、核心层频域系数编码比特、扩展层边信息比特,扩展层编码子带的幅值包络的编码比特和扩展层编码信号编码比特进行打包。为解决上述问题,本发明还提供了一种可分层音频解码系统,该系统包括比特流解复用器、幅值包络解码单元、核心层比特分配单元、核心层解码和反量化单元;其特征在于,该系统还包括残差信号幅值包络生成单元、扩展层比特分配单元、扩展层编码信号解码和反量化单元、全体带宽频域系数恢复单元、噪声填充单元和音频信号恢复单元;其中所述幅值包络解码单元,与所述比特流解复用器连接,用于对所述比特流解复用器输出的核心层和扩展层编码子带的幅值包络编码比特进行解码,得到核心层编码子带和扩展层编码子带的幅值包络量化指数;若瞬态判决信息表明为瞬态信号,还对核心层编码子带和扩展层编码子带的幅值包络量化指数按照频率从小到大的顺序进行重排;所述核心层比特分配单元,与所述幅值包络解码单元连接,用于根据核心层编码子带的幅值包络量化指数,对核心层编码子带进行比特分配,得到核心层编码子带的比特分配数;所述核心层解码和反量化单元,与所述比特流解复用器、幅值包络解码单元及核心层比特分配单元连接,用于根据核心层编码子带的幅值包络量化指数计算得到核心层编码子带的量化幅值包络值,使用核心层编码子带的比特分配数和量化幅值包络值对所述比特流解复用器输出的核心层频域系数编码比特进行解码、反量化及反归一化处理,得到核心层频域系数;所述残差信号幅值包络生成单元,与所述幅值包络解码单元及核心层比特分配单元连接,用于根据核心层编码子带的幅值包络量化指数与对应核心层编码子带的比特分配数,查找核心层残差信号幅值包络量化指数的修正值统计表,得到核心层残差信号的幅值包络量化指数;所述扩展层比特分配单元,与所述残差信号幅值包络生成单元及幅值包络解码单元连接,用于根据核心层残差信号的幅值包络量化指数和扩展层编码子带的幅值包络量化指数进行扩展层编码信号编码子带的比特分配,得到扩展层编码信号编码子带的比特分配数;所述扩展层编码信号解码和反量化单元,与比特流解复用器、所述幅值包络解码单元、扩展层比特分配单元及残差信号幅值包络生成单元连接,用于使用扩展层编码信号编码子带的幅值包络量化指数计算得到扩展层编码信号编码子带的量化幅值包络值,使用扩展层编码信号编码子带的比特分配数和量化幅值包络值对所述比特流解复用器输出的扩展层编码信号编码比特进行解码、反量化及反归一化处理,得到扩展层编码信号;所述全体带宽频域系数恢复单元,与所述核心层解码和反量化单元以及扩展层编码信号解码和反量化单元连接,用于根据子带顺序对所述扩展层编码信号解码和反量化单元输出的扩展层编码信号进行重新排序,然后与所述核心层解码和反量化单元输出的核心层频域系数做和计算,得到全体带宽频域系数;所述噪声填充单元,与所述全体带宽频域系数恢复单元及幅值包络解码单元连接,用于对编码过程中未分配编码比特的子带进行噪声填充;所述音频信号恢复单元,与所述噪声填充单元连接,若所述瞬态判决信息表明为稳态信号,用于对全体带宽的频域系数直接进行时频逆变换,得到输出的音频信号;若所述瞬态判决信息表明为瞬态信号,用于将全体带宽的频域系数进行重排,然后分成M组频域系数,对每一组频域系数进行时频逆变换,根据变换得到的M组时域信号计算得到最终的
音频信号。综上所述,本发明通过在可分层音频编解码方法中引入针对瞬态信号帧的处理方法,对瞬态信号帧进行分段时频变换,然后对变换得到的频域系数在核心层和扩展层范围内分别进行重排,以便与稳态信号帧进行相同的比特分配、频域系数编码等后续编码处理, 提高了瞬态信号帧的编码效率,改善了可分层音频编解码的质量。


图1是本发明可分层 奢频编码方法的示意图2是本发明可分层 奢频编码方法实施例的流程图3是本发明矢量量化后进行比特分配修正的方法流程图4是本发明可分层编码码流的示意图5是本发明根据频带范围分层和根据码率分层的关系示意图
图6是本发明可分层 奢频编码系统的结构示意图7是本发明可分层 奢频解码方法的示意图8是本发明可分层 奢频解码方法实施例的流程图9是本发明可分层 奢频解码系统的结构示意图。
具体实施例方式本发明可分层音频编解码方法和系统的主要思想是通过在可分层音频编解码方法中引入针对瞬态信号帧的处理方法,对瞬态信号帧进行分段时频变换,然后对变换得到的频域系数在核心层和扩展层范围内分别进行重排,以便与稳态信号帧进行相同的比特分配、频域系数编码等后续编码处理,提高了瞬态信号帧的编码效率,改善了可分层音频编解码的质量。编码方法及系统如图1所示,基于以上发明思想,本发明可分层音频编码方法包括以下步骤步骤10 对当前帧的音频信号进行瞬态判决;步骤20 根据瞬态判决结果对音频信号进行处理,获得核心层和扩展层频域系数;具体地,瞬态判决为稳态信号时,对加窗后的音频信号直接进行时频变换得到总的频域系数;瞬态判决为瞬态信号时,将音频信号分成M个子帧,对每个子帧进行时频变换,变换得到的M组频域系数构成当前帧总的频域系数,对总的频域系数按照编码子带从低频到高频的顺序进行重排,其中,所述总的频域系数包括核心层频域系数和扩展层频域系数,所述编码子带包括核心层编码子带和扩展层编码子带,核心层频域系数构成若干个核心层编码子带,扩展层频域系数构成若干个扩展层编码子带。当瞬态判决为瞬态信号时,当前帧总的频域系数的获取方法为将当前帧的N点时域采样信号χ (η)与上一帧的N点时域采样信号x。ld(η)组成2Ν 点时域采样信号^>),然后对对…实施加窗和时域抗混叠处理得到N点时域采样信号对《);对时域信号对《)做对称变换,接着在信号两端各添加一段零序列,将加长后的信号分成M个互相交迭的子帧,然后对每个子帧的时域信号实施加窗、时域抗混叠处理和时频变换,得到M组频域系数,构成当前帧总的频域系数。当瞬态判决为瞬态信号时,对频域系数进行重排时,在核心层和扩展层范围内按
16照编码子带从低频到高频的顺序分别进行频域系数重排。步骤30 对核心层编码子带和扩展层编码子带的幅值包络值进行量化和编码,得到核心层编码子带和扩展层编码子带的幅值包络量化指数及其编码比特;具体地,对核心层编码子带和扩展层编码子带的幅值包络值进行量化和编码,得到核心层编码子带和扩展层编码子带的幅值包络量化指数及其编码比特;其中,若为稳态信号,则对核心层编码子带和扩展层编码子带的幅值包络值进行统一量化;若为瞬态信号, 则对核心层编码子带和扩展层编码子带的幅值包络值分别进行单独量化,以及对核心层编码子带的幅值包络量化指数和扩展层编码子带的幅值包络量化指数分别进行重排。所述对幅值包络量化指数进行重排具体包括将同一子帧内的编码子带的幅值包络量化指数按照频率递增或递减的顺序重新排列在一起,在子帧连接处采用分属于两个子帧的代表对等频率的两个编码子带来连接。当瞬态判决为稳态信号时,对量化得到的核心层编码子带的幅值包络量化指数进行霍夫曼编码,若所有核心层编码子带的幅值包络量化指数经过霍夫曼编码后所消耗比特的总数小于所有核心层编码子带的幅值包络量化指数经过自然编码所消耗比特的总数,则使用霍夫曼编码,否则使用自然编码,并设置核心层编码子带的幅值包络霍夫曼编码标识信息;对量化得到的扩展层编码子带的幅值包络量化指数进行霍夫曼编码,若所有扩展层编码子带的幅值包络量化指数经过霍夫曼编码后所消耗比特的总数小于所有扩展层编码子带的幅值包络量化指数经过自然编码所消耗比特的总数,则使用霍夫曼编码,否则使用自然编码,并设置扩展层编码子带的幅值包络霍夫曼编码标识信息。步骤40 根据核心层编码子带的幅值包络量化指数对核心层编码子带进行比特分配,然后对核心层频域系数进行量化和编码得到核心层频域系数的编码比特;得到核心层频域系数编码比特的方法为根据由核心层编码子带的幅值包络量化指数重建的核心层编码子带的量化幅值包络值对核心层频域系数进行归一化,根据编码子带的比特分配数分别使用塔型格型矢量量化方法和球型格型矢量量化方法进行量化和编码,得到核心层频域系数的编码比特;对核心层所有使用塔型格型矢量量化得到的量化索引进行霍夫曼编码;若所有使用塔型格型矢量量化得到的量化索引经过霍夫曼编码后所消耗比特的总数小于所有使用塔型格型矢量量化得到的量化索引经过自然编码所消耗比特的总数,则使用霍夫曼编码,利用霍夫曼编码节省下来的比特、初次比特分配剩余比特数、对单个频域系数所分配到的比特数为1或2的所有编码子带编码所节省比特的总数对核心层编码子带的比特分配数进行修正,以及对修正了比特分配数的核心层编码子带再次进行矢量量化和霍夫曼编码;否则使用自然编码,利用初次比特分配剩余比特数、对单个频域系数所分配到的比特数为1或2的所有编码子带编码所节省比特的总数对核心层编码子带的比特分配数进行修正,以及对修正了比特分配数的核心层编码子带再次进行矢量量化和自然编码。步骤50 对前述核心层中经过矢量量化的频域系数进行反量化,并与原始的经过时频变换后得到的频域系数进行差计算,得到核心层残差信号;步骤60 根据核心层编码子带的幅值包络量化指数和核心层编码子带的比特分配数计算核心层残差信号的幅值包络量化指数;采用如下方法计算核心层残差信号编码子带的幅值包络量化指数
根据核心层编码子带的比特分配数,推算核心层残差信号幅值包络量化指数的修正值;对核心层编码子带的幅值包络量化指数和对应编码子带的核心层残差信号幅值包络量化指数的修正值进行差计算,得到核心层残差信号幅值包络量化指数。各编码子带的核心层残差信号幅值包络量化指数修正值大于等于0,且对应核心层编码子带的比特分配数增加时不减小;当某个核心层编码子带的比特分配数为0时,核心层残差信号幅值包络量化指数修正值为0,当某个核心层编码子带的比特分配数为所限定的最大比特分配数时,对应的核心层残差信号的幅值包络值为零。步骤70 根据核心层残差信号的幅值包络量化指数和扩展层编码子带的幅值包络量化指数对扩展层编码信号的编码子带进行比特分配,然后对扩展层编码信号进行量化和编码得到扩展层编码信号的编码比特,其中,所述扩展层编码信号由核心层残差信号和扩展层频域系数构成;得到扩展层编码信号编码比特的方法为根据由扩展层编码信号编码子带的幅值包络量化指数重建的扩展层编码信号编码子带的量化幅值包络值对扩展层编码信号进行归一化,根据扩展层编码信号各编码子带的比特分配数分别使用塔型格型矢量量化方法和球型格型矢量量化方法进行量化和编码, 得到扩展层编码信号的编码比特。在对核心层频域系数和扩展层编码信号进行量化和编码的过程中,对比特分配数小于分类阈值的编码子带的待量化矢量采用塔型格型矢量量化方法进行量化和编码,对比特分配数大于所述分类阈值的编码子带的待量化矢量采用球型格型矢量量化方法进行量化和编码;比特分配数是一个编码子带中单个系数所分配到的比特数。可理解地,对于扩展层编码信号来说,其是由核心层残差信号及扩展层频域系数构成的,某种意义上核心层残差信号也是由系数构成的。对扩展层所有使用塔型格型矢量量化得到的量化索引进行霍夫曼编码;若所有使用塔型格型矢量量化得到的量化索引经过霍夫曼编码后所消耗比特的总数小于所有使用塔型格型矢量量化得到的量化索引经过自然编码所消耗比特的总数,则使用霍夫曼编码,利用霍夫曼编码节省下来的比特、初次比特分配剩余比特数、对单个频域系数所分配到的比特数为1或2的所有编码子带编码所节省比特的总数对扩展层编码信号编码子带的比特分配数进行修正,以及对修正了比特分配数的扩展层编码信号编码子带再次进行矢量量化和霍夫曼编码;否则使用自然编码,利用初次比特分配剩余比特数、对单个频域系数所分配到的比特数为1或2的所有编码子带编码所节省比特的总数对扩展层编码信号编码子带的比特分配数进行修正,以及对修正了比特分配数的扩展层编码信号编码子带再次进行矢量量化和自然编码。进行核心层编码子带和扩展层编码信号编码子带比特分配时,根据编码子带的幅值包络量化指数对各编码子带进行变步长比特分配;在比特分配过程中,对比特分配数为0的编码子带分配比特的步长是1个比特,比特分配后重要性降低的步长为1,对比特分配数大于0且小于分类阈值的编码子带追加分配比特时的比特分配步长为0. 5个比特,比特分配后重要性降低的步长为0. 5,对比特分配数大于等于所述分类阈值的编码子带追加分配比特时的比特分配步长为1,比特分配后重要性降低的步长为1 ;所述对编码子带的比特分配数进行修正的过程如下计算可用于修正的比特数;在所有编码子带中寻找重要性最大的编码子带,如果该编码子带所分配的比特数已经达到可能分配给与的最大值,则将该编码子带的重要性调整到最低,不再对该编码子带修正比特分配数,否则对该重要性最大的编码子带进行比特分配修正;在比特分配修正过程中,对比特分配数为0的编码子带分配1个比特,比特分配后重要性降低1 ;对比特分配数大于0且小于5的编码子带分配0. 5个比特,比特分配后重要性降低0. 5 ;对比特分配数大于5的编码子带分配1个比特,比特分配后重要性降低1。比特分配数每修正1次,则将比特分配修正迭代次数count加1,当比特分配修正迭代次数count达到预设上限值或可用于修正的剩余比特数小于比特分配修正所需要的比特数时,比特分配修正流程结束。步骤80 将核心层和扩展层编码子带的幅值包络编码比特、核心层频域系数的编码比特和扩展层编码信号的编码比特复用打包后,传送给解码端。按照如下码流格式进行复用打包首先将核心层的边信息比特写入码流的帧头后面,将核心层编码子带的幅值包络编码比特写入比特流复用器MuX(Multiplexer),然后将核心层频域系数的编码比特写入 MUX ;然后将扩展层的边信息比特写入MUX,然后将扩展层频域系数的编码子带的幅值包络编码比特写入MUX,然后将扩展层编码信号的编码比特写入MUX ;根据所要求的码率,将满足码率要求的比特数传送到解码端。下面将结合附图和实施例对本发明进行详细描述。图2是本发明第一实施例可分层音频编码方法的流程图。本实施例中以帧长为 20ms、采样率为32kHz的音频流为例具体说明本发明的可分层音频编码方法。在其它帧长和采样率条件下,本发明的方法同样适用。如图2所示,该方法包括101 对帧长为20ms、采样率为32kHz的音频流进行瞬态判决,判断该帧音频信号是瞬态信号还是稳态信号,当判断该帧信号是瞬态信号时,置瞬态判决标识位Flag_ transient = 1 ;当判断该帧信号是稳态信号时,置瞬态判决标识位Flagjransient = 0 ;本发明采用的瞬态判决技术可以是简单的门限检测,也可以是一些较复杂的技术,包括但不限于感知熵方法、多级判决方法等。102 对帧长为20ms、采样率为32kHz的音频流实施时频变换得到N个频域采样点上的频域系数;本步骤的具体实现方式可以是将当前帧的N点时域采样信号χ (η)与上一帧的N点时域采样信号x。ld(η)组成2Ν 点时域采样信号〒0),2Ν点的时域采样信号可由下式表示
权利要求
1.一种可分层音频编码方法,其特征在于,包括对当前帧的音频信号进行瞬态判决;瞬态判决为稳态信号时,对加窗后的音频信号直接进行时频变换得到总的频域系数; 瞬态判决为瞬态信号时,将音频信号分成M个子帧,对每个子帧进行时频变换,变换得到的 M组频域系数构成当前帧总的频域系数,对总的频域系数按照编码子带从低频到高频的顺序进行重排,其中,所述总的频域系数包括核心层频域系数和扩展层频域系数,所述编码子带包括核心层编码子带和扩展层编码子带,核心层频域系数构成若干个核心层编码子带, 扩展层频域系数构成若干个扩展层编码子带;对核心层编码子带和扩展层编码子带的幅值包络值进行量化和编码,得到核心层编码子带和扩展层编码子带的幅值包络量化指数及其编码比特;其中,若为稳态信号,则对核心层编码子带和扩展层编码子带的幅值包络值进行统一量化;若为瞬态信号,则对核心层编码子带和扩展层编码子带的幅值包络值分别进行单独量化,以及对核心层编码子带的幅值包络量化指数和扩展层编码子带的幅值包络量化指数分别进行重排;根据核心层编码子带的幅值包络量化指数对核心层编码子带进行比特分配,然后对核心层频域系数进行量化和编码得到核心层频域系数的编码比特;对前述核心层中经过矢量量化的频域系数进行反量化,并与原始的经过时频变换后得到的频域系数进行差计算,得到核心层残差信号;根据核心层编码子带的幅值包络量化指数和比特分配数计算核心层残差信号的幅值包络量化指数;根据核心层残差信号的幅值包络量化指数和扩展层编码子带的幅值包络量化指数对扩展层编码信号的编码子带进行比特分配,然后对扩展层编码信号进行量化和编码得到扩展层编码信号的编码比特,其中,所述扩展层编码信号由核心层残差信号和扩展层频域系数构成;将核心层和扩展层编码子带的幅值包络编码比特、核心层频域系数编码比特和扩展层编码信号的编码比特复用打包后,传送给解码端。
2.如权利要求1所述的方法,其特征在于,当瞬态判决为瞬态信号时,当前帧总的频域系数的获取方法为将当前帧的N点时域采样信号x(n)与上一帧的N点时域采样信号x。ld(n)组成2N点时域采样信号玎《),然后对只功实施加窗和时域抗混叠处理得到N点时域采样信号;对时域信号对做对称变换,接着在信号两端各添加一段零序列,将加长后的信号分成M个互相交迭的子帧,然后对每个子帧的时域信号实施加窗、时域抗混叠处理和时频变换,得到M组频域系数,构成当前帧总的频域系数。
3.如权利要求1所述的方法,其特征在于,当瞬态判决为瞬态信号,对频域系数进行重排时,在核心层和扩展层范围内按照编码子带从低频到高频的顺序分别进行频域系数的重排。
4.如权利要求1所述的方法,其特征在于,所述对幅值包络量化指数进行重排具体包括将同一子帧内的编码子带的幅值包络量化指数按照频率递增或递减的顺序重新排列在一起,在子帧连接处采用分属于两个子帧的代表对等频率的两个编码子带来连接。
5.如权利要求1所述的方法,其特征在于,当瞬态判决为稳态信号时,对量化得到的核心层编码子带的幅值包络量化指数进行霍夫曼编码,若所有核心层编码子带的幅值包络量化指数经过霍夫曼编码后所消耗比特的总数小于所有核心层编码子带的幅值包络量化指数经过自然编码所消耗比特的总数,则使用霍夫曼编码,否则使用自然编码,并设置核心层编码子带的幅值包络霍夫曼编码标识信息;对量化得到的扩展层编码子带的幅值包络量化指数进行霍夫曼编码,若所有扩展层编码子带的幅值包络量化指数经过霍夫曼编码后所消耗比特的总数小于所有扩展层编码子带的幅值包络量化指数经过自然编码所消耗比特的总数,则使用霍夫曼编码,否则使用自然编码,并设置扩展层编码子带的幅值包络霍夫曼编码标识信息。
6.如权利要求1所述的方法,其特征在于,采用如下方法计算核心层残差信号编码子带的幅值包络量化指数根据核心层编码子带的比特分配数,推算核心层残差信号幅值包络量化指数的修正值;对核心层编码子带的幅值包络量化指数和对应编码子带的核心层残差信号幅值包络量化指数的修正值进行差计算,得到核心层残差信号幅值包络量化指数;各编码子带的核心层残差信号幅值包络量化指数修正值大于等于0,且对应核心层编码子带的比特分配数增加时不减小;当某个核心层编码子带的比特分配数为0时,核心层残差信号幅值包络量化指数修正值为0,当某个核心层编码子带的比特分配数为所限定的最大比特分配数时,对应的核心层残差信号的幅值包络值为零。
7.如权利要求1所述的方法,其特征在于,所述对核心层频域系数进行量化和编码包括对核心层所有使用塔型格型矢量量化得到的量化索引进行霍夫曼编码; 若所有使用塔型格型矢量量化得到的量化索引经过霍夫曼编码后所消耗比特的总数小于所有使用塔型格型矢量量化得到的量化索引经过自然编码所消耗比特的总数,则使用霍夫曼编码,利用霍夫曼编码节省下来的比特、初次比特分配剩余比特数、对单个频域系数所分配到的比特数为1或2的所有编码子带编码所节省比特的总数对编码子带的比特分配数进行修正,以及对修正了比特分配数的编码子带再次进行矢量量化和霍夫曼编码;否则使用自然编码,利用初次比特分配剩余比特数、对单个频域系数所分配到的比特数为1或2 的所有编码子带编码所节省比特的总数对编码子带的比特分配数进行修正,以及对修正了比特分配数的编码子带再次进行矢量量化和自然编码; 所述对扩展层编码信号进行量化和编码包括对扩展层所有使用塔型格型矢量量化得到的量化索引进行霍夫曼编码; 若所有使用塔型格型矢量量化得到的量化索引经过霍夫曼编码后所消耗比特的总数小于所有使用塔型格型矢量量化得到的量化索引经过自然编码所消耗比特的总数,则使用霍夫曼编码,利用霍夫曼编码节省下来的比特、初次比特分配剩余比特数、对单个频域系数所分配到的比特数为1或2的所有编码子带编码所节省比特的总数对编码子带的比特分配数进行修正,以及对修正了比特分配数的编码子带再次进行矢量量化和霍夫曼编码;否则使用自然编码,利用初次比特分配剩余比特数、对单个频域系数所分配到的比特数为1或2 的所有编码子带编码所节省比特的总数对编码子带的比特分配数进行修正,以及对修正了比特分配数的编码子带再次进行矢量量化和自然编码。
8.一种可分层音频解码方法,其特征在于,该方法包括对编码端传送过来的比特流进行解复用,对核心层编码子带和扩展层编码子带的幅值包络编码比特解码,得到核心层编码子带和扩展层编码子带的幅值包络量化指数;若瞬态判决信息表明为瞬态信号,还对核心层编码子带和扩展层编码子带的幅值包络量化指数按照频率从小到大的顺序分别进行重排;根据核心层编码子带的幅值包络量化指数,对核心层编码子带进行比特分配,并由此计算核心层残差信号的幅值包络量化指数,根据核心层残差信号的幅值包络量化指数和扩展层编码子带的幅值包络量化指数对扩展层编码信号的编码子带进行比特分配;根据核心层编码子带和扩展层编码信号的编码子带的比特分配数,分别对核心层频域系数的编码比特和扩展层编码信号的编码比特解码,得到核心层频域系数和扩展层编码信号,将扩展层编码信号按照子带顺序重新排列,并和核心层频域系数相加,得到全体带宽的频域系数;若所述瞬态判决信息表明为稳态信号,则对全体带宽的频域系数直接进行时频逆变换,得到输出的音频信号;若所述瞬态判断信息表明为瞬态信号,则将全体带宽的频域系数进行重排,然后分成M组频域系数,对每一组频域系数进行时频逆变换,根据变换得到的M 组时域信号计算得到最终的音频信号。
9.如权利要求8所述的方法,其特征在于,计算残差信号的幅值包络量化指数的方法为根据核心层编码子带的比特分配数,推算核心层残差信号幅值包络量化指数的修正值; 对核心层编码子带的幅值包络量化指数和对应编码子带的核心层残差信号幅值包络量化指数的修正值进行差计算,得到核心层残差信号幅值包络量化指数;各编码子带的核心层残差信号幅值包络量化指数修正值大于等于0,且对应核心层编码子带的比特分配数增加时不减小;当某个核心层编码子带的比特分配数为0时,核心层残差信号幅值包络量化指数修正值为0,当某个核心层编码子带的比特分配数为所限定的最大比特分配数时,对应的核心层残差信号的幅值包络值为零。
10.如权利要求8所述的方法,其特征在于,若瞬态判决信息表明为瞬态信号,则将全体带宽的频域系数进行重排,具体指将属于同一子帧的频域系数按照编码子带从低频到高频的顺序排列,得到M组频域系数后,再将M组频域系数按照子帧的顺序排列。
11.如权利要求8所述的方法,其特征在于,若瞬态判决信息表明为瞬态信号,根据变换得到的M组时域信号计算得到最终的音频信号的过程包括对每一组时域信号进行逆时域抗混叠处理,接着对这M组得到的信号进行加窗处理,然后对这M组加窗后信号进行交迭相加,得到N点时域采样信号;对时域信号进行逆时域抗混叠处理和加窗处理,对相邻两帧进行交迭相加,得到最终的音频输出信号。
12.—种瞬态信号的可分层音频编码方法,其特征在于,该方法包括将音频信号分成M个子帧,对每个子帧进行时频变换,变换得到的M组频域系数构成当前帧总的频域系数,对总的频域系数按照编码子带从低频到高频的顺序进行重排,其中,所述总的频域系数包括核心层频域系数和扩展层频域系数,所述编码子带包括核心层编码子 4带和扩展层编码子带,核心层频域系数构成若干个核心层编码子带,扩展层频域系数构成若干个扩展层编码子带;对核心层编码子带和扩展层编码子带的幅值包络值进行量化和编码,得到核心层编码子带和扩展层编码子带的幅值包络量化指数及其编码比特,其中对核心层编码子带和扩展层编码子带的幅值包络值分别进行单独量化,以及对核心层编码子带的幅值包络量化指数和扩展层编码子带的幅值包络量化指数分别进行重排;根据核心层编码子带的幅值包络量化指数对核心层编码子带进行比特分配,然后对核心层频域系数进行量化和编码得到核心层频域系数的编码比特;对前述核心层中经过矢量量化的频域系数进行反量化,并与原始的经过时频变换后得到的频域系数进行差计算,得到核心层残差信号;根据核心层编码子带的幅值包络量化指数和核心层编码子带的比特分配数计算核心层残差信号编码子带的幅值包络量化指数;根据核心层残差信号的幅值包络量化指数和扩展层编码子带的幅值包络量化指数对扩展层编码信号的编码子带进行比特分配,然后对扩展层编码信号进行量化和编码得到扩展层编码信号的编码比特,其中,所述扩展层编码信号由核心层残差信号和扩展层频域系数构成;将核心层编码子带和扩展层编码子带的幅值包络编码比特、核心层频域系数的编码比特和扩展层编码信号的编码比特复用打包后,传送给解码端。
13.如权利要求12所述的方法,其特征在于,当前帧总的频域系数的获取方法为 将当前帧的N点时域采样信号x(n)与上一帧的N点时域采样信号x。ld(n)组成2N点时域采样信号玖,然后对〒(…实施加窗和时域抗混叠处理得到N点时域采样信号对“);对时域信号对《)做对称变换,接着在信号两端各添加一段零序列,将加长后的信号分成M个互相交迭的子帧,然后对每个子帧的时域信号实施加窗、时域抗混叠处理和时频变换,得到M组频域系数,构成当前帧总的频域系数。
14.如权利要求12所述的方法,其特征在于,在核心层和扩展层范围内按照编码子带从低频到高频的顺序分别进行频域系数的重排。
15.如权利要求12所述的方法,其特征在于,所述对幅值包络量化指数进行重排具体包括将同一子帧内的编码子带的幅值包络量化指数按照频率递增或递减的顺序重新排列在一起,在子帧连接处采用分属于两个子帧的代表对等频率的两个编码子带来连接。
16.一种瞬态信号的可分层解码方法,其特征在于,该方法包括对编码端传送过来的比特流进行解复用,对核心层编码子带和扩展层编码子带的幅值包络编码比特解码,得到核心层编码子带和扩展层编码子带的幅值包络量化指数,对核心层编码子带和扩展层编码子带的幅值包络量化指数按照频率从小到大的顺序分别进行重排;根据重排后的核心层编码子带的幅值包络量化指数,对核心层编码子带进行比特分配,并由此计算核心层残差信号的幅值包络量化指数;根据核心层残差信号的幅值包络量化指数和重排后的扩展层编码子带的幅值包络量化指数对扩展层编码子带进行比特分配;根据核心层编码子带和扩展层编码信号的编码子带的比特分配数,分别对核心层频域系数编码比特和扩展层编码信号编码比特解码,得到核心层频域系数和扩展层编码信号, 将扩展层编码信号按照子带顺序重新排列,并和核心层频域系数相加,得到全体带宽的频域系数;将全体带宽的频域系数进行重排,然后分成M组,对每一组频域系数进行时频逆变换, 根据变换得到的M组时域信号计算得到最终的音频信号。
17.如权利要求16所述的方法,其特征在于,将全体带宽的频域系数进行重排具体指将属于同一子帧的频域系数按照编码子带从低频到高频的顺序排列,得到M组频域系数后,再将M组频域系数按照子帧的顺序排列。
18.如权利要求16所述的方法,其特征在于,根据变换得到的M组时域信号计算得到最终的音频信号的过程包括对每一组进行逆时域抗混叠处理,接着对这M组得到的信号进行加窗处理,然后对这M组加窗后信号进行交迭相加,得到N点时域采样信号;对时域信号FO)进行逆时域抗混叠处理和加窗处理,对相邻两帧进行交迭相加,得到最终的音频输出信号。
19.一种可分层音频编码系统,该系统包括频域系数生成单元、幅值包络计算单元、幅值包络量化和编码单元、核心层比特分配单元、核心层频域系数矢量量化和编码单元以及比特流复用器;其特征在于,该系统还包括 瞬态判决单元、扩展层编码信号生成单元、残差信号幅值包络生成单元、扩展层比特分配单元以及扩展层编码信号矢量量化和编码单元;其中所述瞬态判决单元,用于对当前帧的音频信号进行瞬态判决;所述频域系数生成单元,与所述瞬态判决单元连接,瞬态判决为稳态信号时,用于对加窗后的音频信号直接进行时频变换得到总的频域系数;瞬态判决为瞬态信号时,用于将音频信号分成M个子帧,对每个子帧进行时频变换,变换得到的M组频域系数构成当前帧总的频域系数,对总的频域系数按照编码子带从低频到高频的顺序进行重排,其中,所述总的频域系数包括核心层频域系数和扩展层频域系数,所述编码子带包括核心层编码子带和扩展层编码子带,核心层频域系数构成若干个核心层编码子带,扩展层频域系数构成若干个扩展层编码子带;所述幅值包络计算单元,与所述频域系数生成单元连接,用于计算核心层编码子带和扩展层编码子带的幅值包络值;所述幅值包络量化和编码单元,与所述幅值包络计算单元以及瞬态判决单元连接,用于对核心层编码子带和扩展层编码子带的幅值包络值进行量化和编码,得到核心层编码子带和扩展层编码子带的幅值包络量化指数及其编码比特;其中,若为稳态信号,则对核心层编码子带和扩展层编码子带的幅值包络值进行统一量化;若为瞬态信号,则对核心层编码子带和扩展层编码子带的幅值包络值分别进行单独量化,以及对核心层编码子带的幅值包络量化指数和扩展层编码子带的幅值包络量化指数分别进行重排;所述核心层比特分配单元,与所述幅值包络量化和编码单元连接,用于根据核心层编码子带的幅值包络量化指数对核心层编码子带进行比特分配,得到核心层编码子带的比特分配数;所述核心层频域系数矢量量化和编码单元,与所述频域系数生成单元、幅值包络量化和编码单元及核心层比特分配单元连接,用于使用根据核心层编码子带的幅值包络量化指数重建的核心层编码子带的量化幅值包络值和核心层编码子带的比特分配数对核心层编码子带的频域系数进行归一化、矢量量化和编码,得到核心层频域系数编码比特;所述扩展层编码信号生成单元,与所述频域系数生成单元及核心层频域系数矢量量化和编码单元连接,用于生成核心层残差信号,得到由核心层残差信号和扩展层频域系数构成的扩展层编码信号;所述残差信号幅值包络生成单元,与所述幅值包络量化和编码单元及核心层比特分配单元连接,用于根据核心层编码子带的幅值包络量化指数与对应的核心层编码子带的比特分配数,得到核心层残差信号的幅值包络量化指数;所述扩展层比特分配单元,与所述残差信号幅值包络生成单元及幅值包络量化和编码单元连接,用于根据核心层残差信号幅值包络量化指数和扩展层编码子带的幅值包络量化指数对扩展层编码信号编码子带进行比特分配,得到扩展层编码信号编码子带的比特分配数;所述扩展层编码信号矢量量化和编码单元,与所述幅值包络量化和编码单元、扩展层比特分配单元、残差信号幅值包络生成单元及扩展层编码信号生成单元连接,用于使用根据扩展层编码信号编码子带的幅值包络量化指数重建的扩展层编码信号编码子带的量化幅值包络值和扩展层编码信号编码子带的比特分配数对扩展层编码信号进行归一化、矢量量化和编码,得到扩展层编码信号编码比特;所述比特流复用器与所述幅值包络量化和编码单元、核心层频域系数矢量量化和编码单元、扩展层编码信号矢量量化和编码单元连接,用于将核心层边信息比特、核心层编码子带的幅值包络的编码比特、核心层频域系数编码比特、扩展层边信息比特,扩展层编码子带的幅值包络的编码比特和扩展层编码信号编码比特进行打包。
20.如权利要求19所述的系统,其特征在于,所述扩展层编码信号生成单元还包括残差信号生成模块和扩展层编码信号合成模块;所述残差信号生成模块用于对核心层频域系数的量化值进行反量化,并与核心层频域系数进行差计算,得到核心层残差信号;所述扩展层编码信号合成模块用于将核心层残差信号和扩展层的频域系数按频带的顺序合成,得到扩展层编码信号。
21.如权利要求19所述的系统,其特征在于所述残差信号幅值包络生成单元还包括量化指数修正值获取模块和残差信号幅值包络量化指数计算模块;所述量化指数修正值获取模块用于根据核心层编码子带的比特分配数,推算残差信号编码子带的量化指数修正值,各编码子带的量化指数修正值大于等于0,且当对应的核心层编码子带的比特分配数增加时不减,如果核心层的某个编码子带的比特分配数为0,则核心层残差信号在该编码子带的量化指数修正值为0,如果核心层编码子带的比特分配数为所限定的最大比特分配数,则核心层残差信号在该编码子带的幅值包络值为零;所述残差信号幅值包络量化指数计算模块用于将核心层编码子带的幅值包络量化指数与对应编码子带的量化指数修正值进行差计算,得到核心层残差信号编码子带的幅值包络量化指数。
22.如权利要求19所述的系统,其特征在于所述比特流复用器将扩展层编码信号编码比特按照扩展层编码信号编码子带重要性的初始值从大到小的顺序写入码流,对于具有相同重要性的编码子带,低频编码子带的编码比特优先写入码流。
23.如权利要求19所述的系统,其特征在于,所述频域系数生成单元获取当前帧总的频域系数时,用于将当前帧的N点时域采样信号χ (η)与上一帧的N点时域采样信号x。ld(n) 组成2N点时域采样信号玎《),然后对〒(…实施加窗和时域抗混叠处理得到N点时域采样信号对力;以及对时域信号对…做对称变换,接着在信号两端各添加一段零序列,将加长后的信号分成M个互相交迭的子帧,然后对每个子帧的时域信号实施加窗、时域抗混叠处理和时频变换,得到M组频域系数,构成当前帧总的频域系数。
24.如权利要求19所述的系统,其特征在于所述频域系数生成单元对频域系数进行重排时,在核心层和扩展层范围内按照编码子带从低频到高频的顺序分别进行频域系数的重排。
25.如权利要求19所述的系统,其特征在于,所述幅值包络量化和编码单元对幅值包络量化指数进行重排具体指将同一子帧内的编码子带的幅值包络量化指数按照频率递增或递减的顺序重新排列在一起,在子帧连接处采用分属于两个子帧的代表对等频率的两个编码子带来连接。
26.一种可分层音频解码系统,该系统包括比特流解复用器、幅值包络解码单元、核心层比特分配单元、核心层解码和反量化单元;其特征在于,该系统还包括残差信号幅值包络生成单元、扩展层比特分配单元、扩展层编码信号解码和反量化单元、全体带宽频域系数恢复单元、噪声填充单元和音频信号恢复单元;其中所述幅值包络解码单元,与所述比特流解复用器连接,用于对所述比特流解复用器输出的核心层和扩展层编码子带的幅值包络编码比特进行解码,得到核心层编码子带和扩展层编码子带的幅值包络量化指数;若瞬态判决信息表明为瞬态信号,还对核心层编码子带和扩展层编码子带的幅值包络量化指数按照频率从小到大的顺序进行重排;所述核心层比特分配单元,与所述幅值包络解码单元连接,用于根据核心层编码子带的幅值包络量化指数,对核心层编码子带进行比特分配,得到核心层编码子带的比特分配数;所述核心层解码和反量化单元,与所述比特流解复用器、幅值包络解码单元及核心层比特分配单元连接,用于根据核心层编码子带的幅值包络量化指数计算得到核心层编码子带的量化幅值包络值,使用核心层编码子带的比特分配数和量化幅值包络值对所述比特流解复用器输出的核心层频域系数编码比特进行解码、反量化及反归一化处理,得到核心层频域系数;所述残差信号幅值包络生成单元,与所述幅值包络解码单元及核心层比特分配单元连接,用于根据核心层编码子带的幅值包络量化指数与对应核心层编码子带的比特分配数, 查找核心层残差信号幅值包络量化指数的修正值统计表,得到核心层残差信号的幅值包络量化指数;所述扩展层比特分配单元,与所述残差信号幅值包络生成单元及幅值包络解码单元连接,用于根据核心层残差信号的幅值包络量化指数和扩展层编码子带的幅值包络量化指数进行扩展层编码信号编码子带的比特分配,得到扩展层编码信号编码子带的比特分配数;所述扩展层编码信号解码和反量化单元,与比特流解复用器、所述幅值包络解码单元、 扩展层比特分配单元及残差信号幅值包络生成单元连接,用于使用扩展层编码信号编码子带的幅值包络量化指数计算得到扩展层编码信号编码子带的量化幅值包络值,使用扩展层编码信号编码子带的比特分配数和量化幅值包络值对所述比特流解复用器输出的扩展层编码信号编码比特进行解码、反量化及反归一化处理,得到扩展层编码信号;所述全体带宽频域系数恢复单元,与所述核心层解码和反量化单元以及扩展层编码信号解码和反量化单元连接,用于根据子带顺序对所述扩展层编码信号解码和反量化单元输出的扩展层编码信号进行重新排序,然后与所述核心层解码和反量化单元输出的核心层频域系数做和计算,得到全体带宽频域系数;所述噪声填充单元,与所述全体带宽频域系数恢复单元及幅值包络解码单元连接,用于对编码过程中未分配编码比特的子带进行噪声填充;所述音频信号恢复单元,与所述噪声填充单元连接,若所述瞬态判决信息表明为稳态信号,用于对全体带宽的频域系数直接进行时频逆变换,得到输出的音频信号;若所述瞬态判决信息表明为瞬态信号,用于将全体带宽的频域系数进行重排,然后分成M组频域系数, 对每一组频域系数进行时频逆变换,根据变换得到的M组时域信号计算得到最终的音频信号。
27.如权利要求26所述的系统,其特征在于,所述残差信号幅值包络生成单元还包括量化指数修正值获取模块和残差信号幅值包络量化指数计算模块;所述量化指数修正值获取模块用于根据核心层编码子带的比特分配数,推算残差信号编码子带的量化指数修正值,各编码子带的量化指数修正值大于等于0,且当对应的核心层编码子带的比特分配数增加时不减小,如果核心层的某个编码子带的比特分配数为0,则核心层残差信号在该编码子带的量化指数修正值为0,如果某个核心层编码子带的比特分配数为所限定的最大比特分配数,则核心层残差信号在该编码子带的幅值包络值为零;所述残差信号幅值包络量化指数计算模块用于将核心层编码子带的幅值包络量化指数与对应编码子带的量化指数修正值进行差计算,得到核心层残差信号编码子带的幅值包络量化指数。
28.如权利要求26所述的系统,其特征在于所述扩展层编码信号解码和反量化单元对扩展层编码信号的编码子带解码的顺序是根据扩展层编码信号的编码子带重要性的初始值决定的,重要性大的扩展层编码信号的编码子带优先解码,如果有两个扩展层编码信号的编码子带具有相同的重要性,则低频编码子带优先解码,解码过程中计算已解码的比特数,当已解码的比特数满足总比特数要求时停止解码。
29.如权利要求26所述的系统,其特征在于所述音频信号恢复单元对全体带宽的频域系数进行重排具体指将属于同一子帧的频域系数按照编码子带从低频到高频的顺序排列,得到M组频域系数后,再将M组频域系数按照子帧的顺序排列。
30.如权利要求26所述的系统,其特征在于,若瞬态判决信息表明为瞬态信号,所述音频信号恢复单元根据变换得到的M组时域信号计算得到最终的音频信号的过程具体包括对每一组时域信号进行逆时域抗混叠处理,接着对这M组得到的信号进行加窗处理,然后对这M组加窗后信号进行交迭相加,得到N点时域采样信号;对时域信号进行逆时域抗混叠处理和加窗处理,对相邻两帧进行交迭相加,得到最终的音频输出信号。
全文摘要
可分层音频编码、解码方法及系统。编码方法对当前帧的音频信号进行瞬态判决;时域变换得到当前帧总频域系数;对核心层编码子带和扩展层编码子带的幅值包络值进行量化和编码得到核心层编码子带和扩展层编码子带的幅值包络量化指数及其编码比特;对核心层频域系数进行量化和编码得到核心层频域系数的编码比特;对核心层中经过矢量量化的频域系数进行反量化,并与原始的频域系数进行差计算,得到核心层残差信号,计算其幅值包络量化指数;对扩展层编码信号进行量化和编码得到扩展层编码信号的编码比特;将核心层和扩展层编码子带的幅值包络编码比特、核心层频域系数编码比特和扩展层编码信号的编码比特复用打包后,传送给解码端。
文档编号G10L19/24GK102222505SQ20101014553
公开日2011年10月19日 申请日期2010年4月13日 优先权日2010年4月13日
发明者彭科, 江东平, 袁浩, 陈国明, 黎家力 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1