音频信号的编码方法和系统与解码方法和系统的制作方法

文档序号:2837550阅读:331来源:国知局
专利名称:音频信号的编码方法和系统与解码方法和系统的制作方法
技术领域
本发明涉及多媒体信号处理和信源编码领域,特别涉及一种音频信号的编码方法和系统 与解码方法和系统。
背景技术
立体声信号有两个主要来源, 一个是采用双麦克风或多麦克自然录音,另一个是音频工 作室人工混音。前者各通道音频来自同一个音频场景,除了由于麦克风摆位造成的时间差、 强度差等不同,他们记录音频信息基本一致,因此有很强的相关性。后者在大多数情况下力 求营造具有真实感的音频场景,因此声道间也具有很强的相关性。
利用这种相关性降低立体声编码的码率是音频编码领域一个重要的研究课题。较早提出 的是和差立体声(Sum-difference Stereo)。该方法将原始立体声信号中的左声道L与右声道R 在频域对应频率处进行相加和相减处理,分别得到和声道S与差声道D。在理想的情况下,L 等于R,那么D就为0。通常L与R有明显的相关但不会严格一致,因此多数情况下D的能量 非0但明显小于R,可以用较小的比特率进行编码。由于仍需要对变换后的两个声道S与D独 立编码,码率下降有限。该方法用于MP3(MPEG-1 Layer III)和AAC( Advanced Audio Coding)
立体声编码。
为了使码率进一步下降,需要引入心理声学以去除声道间的主观冗余。人的听觉可以用 一个非均匀带宽的滤波器组描述,每个滤波器组通道被称为一个子带,它是最小的听觉单位, 空间感主要来自左右声道对应子带信号的整体特性,如强度差、延时、相关度,而对子带信 号的细节不敏感。基于上面的心理声学原理,MP3和AAC中还采用了强度立体声(Intensity Stereo)。该方法在每个子带,只将其中一个声道的信号,以及另一个声道与之的能量比传送 给解码器。解码器根据和信号与能量比,恢复出和原始立体声信号能量相等但有细节差异的 立体声信号。该方法使码率有明显下降,但由于不能重建频谱细节,它也带来一定的音质损 失,因此主要用于人耳不敏感的较高频率子带。

发明内容
为了进一步降低立体声编码的码率,本发明提供了一种音频信号的编解码方法和系统。 所述技术方案如下
一种音频信号的编码方法,所述方法包括
步骤A:对左右声道的音频信号以极大相关度旋转角为旋转角进行正交旋转变换; 步骤B:对经过所述正交旋转变换的左右声道的音频信号进行编码,形成码流数据。 所述步骤A具体包括
步骤Al:对左右声道的时域音频信号进行时频变换输出左右声道的频域音频信号; 步骤A2:提取所述左右声道的频域音频信号的极大相关度旋转角;
步骤A3:对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换。
所述步骤B具体包括
步骤B1:对经过所述正交旋转变换的左右声道的音频信号进行和差立体声编码,形成和 差音频码流;
步骤B2:对旋转角进行量化熵编码,形成参数码流; 步骤B3:对所述和差音频码流进行量化和熵编码;
步骤B4:将经过量化和熵编码的所述和差音频码流和参数码流组合成编码码流。 所述步骤B具体包括
步骤B1:对经过所述正交旋转变换的左右声道的音频信号进行强度立体声编码,形成强 度音频码流;
步骤B2:对旋转角进行量化熵编码,形成参数码流; 步骤B3:对所述强度音频码流进行量化和熵编码;
步骤B4:将经过量化和熵编码的所述强度音频码流和参数码流组合成编码码流。 所述步骤A1具体为
对左右声道的时域音频信号进行多相滤波器组变换输出左右声道的频域音频信号。 所述步骤A1具体为-
对左右声道的时域音频信号进行快速傅里叶变换输出左右声道的频域音频信号。 所述步骤A具体包括
步骤Al:对左右声道的时域音频信号进行时频变换输出左右声道的频域音频信号; 步骤A2:将所述左右声道的频域音频信号划分为连续无重叠的子带信号; 步骤A3:提取所述左右声道的子带信号的极大相关度旋转角;
步骤A4:对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换。
所述步骤B具体包括
步骤Bl:将所述经过正交旋转变换的两路音频信号下混为一路下混声道的音频信号; 步骤B2:对下混声道的音频信号进行编码,形成编码码流。 所述步骤A1具体为
对左右声道的时域音频信号进行多相滤波器组变换输出左右声道的频域音频信号; 所述步骤A2具体为
将所述左右声道的频域音频信号按照等效矩形带宽划分为连续无重叠的子带信号。 所述步骤A1具体为
对左右声道的时域音频信号进行多相滤波器组变换输出左右声道的频域音频信号; 所述步骤A2具体为
将所述左右声道的频域音频信号按照临界带宽划分为连续无重叠的子带信号。 一种音频信号的解码方法,所述方法包括
步骤A:对接收到的码流数据进行解码输出经过解码的音频信号;
步骤B:对所述经过解码的音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换, 输出左右声道的音频信号。 所述步骤A具体为
步骤Al:将码流分解成音频码流和参数码流;
步骤A2:将音频码流和参数码流分别进行熵解码和反量化得到频谱数据以及旋转角度; 步骤A3:根据编码的模式对所述频谱数据进行解码得到两路音频信号。 所述步骤B具体为
步骤B1:对所述解码得到的两路音频信号以极大相关度旋转角为旋转角进行正交逆旋转 变换;
步骤B2:对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输出左右声道的时
域音频信号。
所述步骤B2具体为
对经过所述正交逆旋转变换的两路音频信号进行多相滤波器组逆变换输出左右声道的时 域音频信号。
所述步骤B2具体为
对经过所述正交逆旋转变换的两路音频信号进行快速傅里叶逆变换输出左右声道的时域 音频信号。
所述步骤A具体为
步骤Al:对所述编码码流进行解码得到下混声道的音频信号;
步骤A2:对下混声道的音频信号进行子带划分,输出连续无重叠的子带;
步骤A3:将下混声道的音频信号进行上混输出所述经过正交旋转变换的两路子带信号;
相应的,所述步骤B具体包括
步骤Bl:对所述经过正交旋转变换的两路子带信号以极大相关度旋转角为旋转角进行正 交逆旋转变换;
步骤B2:对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输出左右声道的时 域音频信号。
所述步骤B2具体为
对经过所述正交逆旋转变换的两路音频信号进行多相滤波器组逆变换输出左右声道的时 域音频信号。
所述步骤A2具体为
对下混声道的音频信号按照等效矩形带宽进行子带划分,输出连续无重叠的子带。 所述步骤A2具体为
对下混声道的音频信号按照临界带宽进行子带划分,输出连续无重叠的子带。 一种音频信号的编码系统,包括极大相关度旋转变换模块、编码模块;
所述极大相关度旋转变换模块,用于对所述左右声道的频域音频信号以极大相关度旋转
角为旋转角进行正交旋转变换;
所述编码模块,用于对所述经过正交旋转变换的音频信号进行编码形成编码码流。 所述极大相关度旋转变换模块具体包括时频分析单元、极大相关度旋转变换单元; 所述时频分析单元,用于对左右声道的时域音频信号进行时频变换输出左右声道的频域
音频信号;
所述极大相关度旋转变换单元,用于对所述左右声道的频域音频信号以极大相关度旋转 角为旋转角进行正交旋转变换;
所述编码模块具体包括编码单元、量化熵编码单元、码流成型单元;
所述编码单元,用于对经过所述正交旋转变换的左右声道的音频信号进行编码,形成码
流;
所述量化熵编码单元,用于对所述音频码流和参数码流分别进行量化和熵编码,去除信 号的主观冗余;
码流成型单元,用于将经过量化和熵编码的所述码流和参数码流组合成编码码流。
所述时频分析单元具体为具体为快速傅里叶变换单元。
所述时频分析单元具体为具体为多相滤波器组变换单元。
所述极大相关度旋转变换模块具体包括快速傅里叶变换单元、极大相关度旋转变换单元; 所述快速傅里叶变换单元,用于对左右声道的时域音频信号进行时频变换输出左右声道 的频域音频信号;
所述极大相关度旋转变换单元,用于对所述左右声道的频域音频信号以极大相关度旋转 角为旋转角进行正交旋转变换;
所述编码模块具体包括下混单元、快速傅里叶逆变换单元、编码单元、矢量量化单元、 复用单元;
所述下混单元,用于将所述经过正交旋转变换的两路音频信号下混为一路下混声道的音 频信号;
所述快速傅里叶逆变换单元,用于将下混后一路音频信号进行快速傅里叶逆变换为时域 的音频信号;
所述编码单元,用于对经过所述正交旋转变换的左右声道的音频信号进行编码,形成音 频码流;
所述矢量量化单元,用于形成量化指标数码流,以便进一步去除旋转角参数的客观冗余, 降低参数码率;
所述复用单元,用于将形成的音频码流和量化指标数码流封装成给定格式的编码码流。
一种音频信号的解码系统,包括解码模块、极大相关度逆旋转变换模块; 所述解码模块,用于对接收到的码流数据进行解码,输出经过解码的音频信号; 所述极大相关度逆旋转变换模块,用于对所述经过解码的音频信号以极大相关度旋转角 为旋转角进行正交逆旋转变换,输出左右声道的音频信号。
所述解码模块具体包括码流解析单元、熵解码反量化单元、解码单元; 所述码流解析单元,用于将码流分解成音频码流和参数码流;所述熵解码反量化单元,用于将音频码流进行熵解码和反量化得到频谱数据以及旋转角度;
所述解码单元,用于根据编码的模式对所述频谱数据进行解码得到两路音频信号;
所述极大相关度逆旋转变换模块,具体包括极大相关度逆旋转变换单元、时频综合单元;
所述极大相关度逆旋转变换单元,用于对所述解码得到的两路音频信号以极大相关度旋 转角为旋转角进行正交逆旋转变换;
所述时频综合单元,用于对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输 出左右声道的时域音频信号。
所述时频综合单元具体为快速傅里叶逆变换单元。
所述时频综合单元具体为多相滤波器组逆变换单元。
所述解码模块具体包括解码单元、快速傅里叶变换单元、上混单元、反矢量量化单元; 所述解码单元,用于根据编码的模式对所述频谱数据进行解码得到两路音频信号; 所述快速傅里叶变换单元,用于将解码单元输出的的音频信号进行快速傅里叶变换输出 频域的音频信号;
所述上混单元,用于将下混声道的音频信号进行上混输出所述经过正交旋转变换的两路 音频信号;
所述反矢量量化单元,用于从量化指标数査找出对应的旋转角参数,以便解码端进行相 应的逆旋转变换;
所述极大相关度逆旋转变换模块,具体包括极大相关度逆旋转变换单元、快速傅里叶逆 变换单元;
所述极大相关度逆旋转变换单元,用于对所述上混得到的两路音频信号以极大相关度旋 转角为旋转角进行正交逆旋转变换;
所述快速傅里叶逆变换单元,用于对经过所述正交逆旋转变换的两路音频信号进行时频 逆变换输出左右声道的时域音频信号。
本发明通过对左右声道的音频信号进行极大相关度旋转变换,然后将两路音频信号进行 编码,解码后再对两路音频信号进行极大相关度逆旋转变换,还原出左右声道的音频信号。 由于对音频信号进行极大相关度旋转与逆旋转变换,改善了信号质量,所以与传统的只对两 路音频信号进行编解码操作的编解码方法与系统相比,通过少量的极大相关度旋转角参数记 录立体声信息,可以用很低的码率实现立体声音频信号的高保真压縮。


图1是本发明实施例1提供的音频信号的编码方法的流程图; 图2是本发明实施例2提供的音频信号的解码方法的流程图; 图3是本发明实施例3提供的音频信号的编码系统的结构示意图; 图4是本发明实施例4提供的音频信号的解码系统的结构示意图5是本发明实施例1提供的音频信号的编码方法中适于和差立体声或强度立体声编码 的两路子带信号示意图6是本发明实施例1提供的音频信号的编码方法中不适于和差立体声或强度立体声编 码的两路子带信号示意图7是本发明实施例1提供的音频信号的编码方法中极大相关度正交旋转对子带信号的 作用示意图8是本发明实施例1提供的音频信号的编码方法中极大相关度正交旋转的空间心理声 学意义示意图9是本发明实施例5提供的音频信号的编码方法的流程图; 图10是本发明实施例6提供的音频信号的解码方法的流程图; 图11是本发明实施例7提供的音频信号的编码系统的结构图; 图12是本发明实施例8提供的音频信号的解码系统的结构图。
具体实施例方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进 一步地详细描述。 实施例1
参见图l,本发明实施例提供了一种音频信号的编码方法,具体包括以下步骤 步骤101:对左右声道时域音频信号进行时频变换;
输入为左右声道时域音频信号,输出为左右声道频域音频信号,这里可以采用FFT(Fast Flourier Transform,快速傅里叶变换),MDCT (Modified Discrete Cosine Transform,修正离 散余弦变换),或是PQMF (Polyphase Quadrature Mirror Filterbank,多相滤波器组)来实现。
步骤102:划分子带;
将左右声道的频域音频信号输出为按照一定带宽划分的连续无重叠的子带,子带的带宽 与人的听觉特性匹配,从低频到高频,带宽不断增大,在理想的情况下与心理声学中的关键
带(Critical Band)或等效矩形带宽(Equivalent Rectangular Bandwidth, ERB) —致。 步骤103:提取两路子带的极大相关度旋转角度;
相对于原始时域音频信号,按照心理声学划分的子带信号的有两个重要特点首先原始 信号中包含的各个声源在子带信号域有一定的分离,而分离声源的子带信号具有相对简单的 空间心理声学描述,即单一的空间位置感;其次,其根据心理声学,每个子带可以作为一个 独立的听觉单元,即便子带包含多个声源,主观听觉是多个声源的整体作用的结果,而不再 区分单独的声源,此时即便不能精确重建信号中各个声源,只要重建整体作用的结果,也可 以达到与原始信号相同的听觉效果。
理想的情况下,立体声左右声道的子带信号是相应频带内某一声源经不同路径直达左右 麦克风,并被采集的相关但是不完全相同的两路信号。声源本身的信息体现在子带的波形(滤 波器组)或频谱(时频变换);而声源的位置则主要体现为左右两路子带信号的强度差和时间 差上。将左右声道的子带信号按时间(滤波器组)或频率(时频变换)排列分别形成向量《 和义,,维数等于子带的数据点数。上面的关系可以表示为对一般的立体声信号,有较大的概
率相关度Re{£wr(%,,^;)}=Re{<A,A>}/p^|p^hi , 幅度l义,hl义」,且
IX,-Al《mm《l,l;^,如图5所示,其中<*,*>是标量积,H是向量的模或长度。此时 和信号;^=(%,+《)/2 %, ^,差信号;^=(%,-^)/2 0,和信号的编码比特数与原来 左右声道子带信号基本一致,差信号可以用较少的比特数进行编码,和差立体声有较高的编 码增益。同时由于Re(cwr(《,A》接近l, X,与A的夹角接近O, 二者主要相差一个比例因 子,因此强度立体声引入的失真较小,编码增益高。
然而实际的立体声信号由于环境噪音,墙体、地面的多次反射、折射和吸收,以及多声 源的影响,左右子带信号的相关性大大降低,甚至出现负相关,如图6所示。由于X,的长度 并不明显小于原始左右信号,和差立体声编码增益不明显;强度立体声重建的左右子带信号 方向相同,在a和;^其中之一的方向上,而a与a的夹角较大,因而引入明显的失真。
从上面的分析可以看出,相关度是与和差立体声或强度立体声的编码效率密切相关相 关度越大,编码增益就越大。本发明提出如下正交旋转变换可以提高原始左右子带信号的相 关度,因而可以提高立体声编码的效率
<formula>formula see original document page 15</formula>
其中0是使Re(coArO;,;^》有最大值旋转角度,不大于-;r/2且不小于;r/2。将变换后的 子带信号以代数式表示有
JY0= cos^T,+sin^ 1 ;=-sin^T,+cos化,
进一步,相关度corK^^)可以表示为
(<formula>formula see original document page 16</formula>则使Re(cwr(l^,j;》有最大值且不超过土;z72的e可以表示为
(<formula>formula see original document page 16</formula>在这个特定旋转角度变换下,子带信号K和K的能量A。和£yi有下述重要而简单的关系
= £v 二一+£V ), 而子带信号&和《有最大的相关度
(<formula>formula see original document page 16</formula>其中£《,和分别为和I,的能量。差信号& = o;-《)/2的能量与原差信号
A)/2的能量^有下面的关系
<formula>formula see original document page 16</formula>
步骤104:对两路子带信号进行极大相关度旋转变换,获得具有正交旋转变换下最大相
关度的两路子带信号;
图7是这种特定的正交旋转变换的示意图。由于采用正交旋转变换,变换前后子带能量 之和不变,即^。+五K-^^,+五^,并且从(6)式看出,变换后的子带信号K和《的能量^。
和五K恒等。对典型的立体声信号,从(7)式看出,变换的两路子带信号K和i;的相关度
Re{cwr(y。,K》大于原信号《和A的相关度Re{cwr(%,从(8)看出,变换后的差信 号^的能量^/J、于原差信号J^的能量^^。如果采用和差立体声处理,由于差信号能量降
低,立体声编码的效率将提高;如果采用强度立体声,首先由于相关度的增加,编码引入的 失真将减小,此外子带能量比例因子恒为1,因此不需要在码流中记录这个参数。
进行这种特定的正交旋转变换,编码器需要向解码器每个子带传送一个旋转角度参数^。 如果对某一子带,这种变换的立体声编码増益远大于传送旋转角度0的编码码流比特数增加, 那么在当前子带应用这种变换的总体编码效率是增加的;否则可以不在当前带进行这种变换。 这样,编码器在大多数情况下,立体声编码的效率将有明显提高,并且在所有情况下,不会 导致立体声编码效率的下降。
图8是极大正交旋转角度与声像空间位置关系的示意图。当旋转角度6 = 0时,此时声源 的空间位置是正前方;当旋转角度P从0逐渐变大时,对应的声源空间位置逐渐右移当 ^ = ^/4时,声源处于正右方,当^ = 7/2时,声源处于正后方;当旋转角度P从O逐渐变小 时,对应的声源位置逐渐左移当^ = -;^/4时,声源出于正左方,当^ = -^/2时,声源处于 正后方。同时,当-;r/4《^^;r/4时,左右声道的信号是同相的,当-;r/2S^< —;r/4禾口 ;r/4^e〈;r/2时,左右声道的信号是反相的。
步骤105:根据码率及两路子带信号特性,选择和差或强度立体声进行编码;
形成和差音频码流或强度音频码流。
步骤106:将输出的信号及旋转角度分别进行量化和熵编码,进一步去除信号的主客观 冗余;
对旋转角进行量化熵编码,形成参数码流。
步骤107:将输出的信号按照给定的格式组合成编码码流。
本实施例通过对左右声道的音频信号进行极大相关度旋转变换,然后将两路音频信号进 行编码。由于对音频信号进行极大相关度旋转变换,改善了信号质量,所以与传统的只对两 路音频信号进行编码操作的编码方法相比,通过少量的极大相关度旋转角参数记录立体声信 息,可以用很低的码率实现立体声音频信号的高保真压縮。
实施例2
参见图2,本发明实施例提供了一种音频信号的解码方法,具体包括以下步骤
步骤lll:将编码码流分解成音频码流和参数码流。
步骤112:将音频码流和参数码流分别进行熵解码和反量化得到频谱数据以及旋转角度。 步骤113:根据立体声编码的模式,进行相应的和差或强度立体声解码得到两路相关子 带信号。
步骤114:对两路子带信号进行极大相关度逆旋转输出左右子带信号。 步骤115:将左右子带信号进行时频综合,重建时域左右声道数字音频信号。 本实施例通过对解码后的两路音频信号进行极大相关度逆旋转变换,还原出左右声道的 音频信号。由于对音频信号进行极大相关度逆旋转变换,改善了信号质量,所以与传统的只 对两路音频信号进行解码操作的解码方法相比,通过少量的极大相关度旋转角参数记录立体 声信息,可以用很低的码率实现立体声音频信号的高保真压縮。
另外,实施例1与实施例2可以结合起来,组成一种音频信号的编解码方法。
实施例3
参见图3,本发明实施例提供了一种音频信号的编码系统,包括时频分析单元501和502, 极大相关度旋转变换单元503、和差或强度立体声编码单元504、量化熵编码单元505和506、 以及码流成型模块单元507。
时频分析单元501和502,用于分别对左右声道的信号进行时频变换,这里可以是FFT, MDCT,或是多相滤波器组;
极大相关度旋转变换单元503是核心单元,通过(3)式所述变换,并且旋转角度由(5)式决 定,获得具有正交旋转变换下最大相关度的两路子带信号;
和差或强度立体声编码单元504根据码率及两路子带信号特性,选择和差或强度立体声 进行编码;
量化熵编码单元505和506将和差或强度立体声编码单元504的输出及旋转角度分别进 行量化和熵编码,进一步去除信号的主客观冗余并对旋转角进行量化熵编码,形成参数码流;
码流成型模块单元507将量化熵编码单元505和506的输出按照给定的格式组合成编码 码流。
本实施例通过对左右声道的音频信号进行极大相关度旋转变换,然后将两路音频信号进 行编码。由于对音频信号进行极大相关度旋转变换,改善了信号质量,所以与传统的只对两 路音频信号进行编码操作的编码系统相比,通过少量的极大相关度旋转角参数记录立体声信 息,可以用很低的码率实现立体声音频信号的高保真压縮。
实施例4
参见图4,本发明实施例提供了一种音频信号的解码系统,具体包括码流解析单元601、 熵解码及反量化单元602和603、和差或强度立体声解码单元604、极大相关度逆旋转单元 605、以及时频综合单元606和607。
码流解析单元601,用于将编码码流分解成后续模块需要音频码流和参数码流;
熵解码及反量化单元602和603,用于将音频码流和参数码流分别进行熵解码和反量化, 得到频谱数据以及旋转角度;
和差或强度立体声解码单元604,用于根据立体声编码的模式,进行相应的和差或强度 立体声解码,得到两路相关子带信号;
极大相关度逆旋转单元605,用于对这两路子带信号进行极大相关度逆旋转,输出左右 子带信号;
时频综合单元606和607,用于分别将左右子带信号进行时频综合,重建时域左右声道 数字音频信号。
本实施例通过对解码后的两路音频信号进行极大相关度逆旋转变换,还原出左右声道的 音频信号。由于对音频信号进行极大相关度逆旋转变换,改善了信号质量,所以与传统的只 对两路音频信号进行解码操作的解码系统相比,通过少量的极大相关度旋转角参数记录立体 声信息,可以用很低的码率实现立体声音频信号的高保真压縮。
另外,实施例3与实施例4可以结合起来,组成一种音频信号的编解码系统。
实施例5
参见图9,本发明实施例提供了一种音频信号的编码方法,具体包括以下步骤 步骤301:对左右声道时域信号进行MDCT,输出左右声道的MDCT频谱; 步骤302:将左右声道的MDCT频谱输出为按照等效矩形带宽ERB或临界带宽划分的连 续无重叠的子带;
步骤303:提取两路子带信号的极大相关度旋转角度;
输入为左右声道的MDCT域子带信号,输出为子带信号的极大相关度旋转角度,由于 MDCT是实变换,旋转角度由下列公式计算
<formula>formula see original document page 19</formula>
其中
<formula>formula see original document page 20</formula>
(10)
这里义,和Xf分别表示MDCT域左右声道的子带信号向量;
步骤304:对两路子带信号进行极大相关度旋转,输出变换后的两路子带信号; 按下面的公式计算
<formula>formula see original document page 20</formula>
(11)
其中K和i;是变换后的两路子带信号;
步骤305:对变换后的两路子带信号进行下混,输出子带信号的平均值,这些子带信号 按频率排列就是下混声道的MDCT频谱;
步骤306:对下混声道的MDCT频谱进行编码形成码流。
本实施例通过对左右声道的音频信号进行极大相关度旋转变换,然后下混,将两路音频 信号变为一路音频信号后再进行编码。由于对音频信号进行极大相关度旋转与逆旋转变换, 改善了信号质量,所以与传统的只对一路音频信号进行编码操作的编码方法相比,通过少量 的极大相关度旋转角参数记录立体声信息,可以用很低的码率实现立体声音频信号的高保真 压縮。
实施例6
参见图10,本发明实施例提供了一种音频信号的解码方法,具体包括以下步骤
步骤311:对码流进行解码输出下混声道的MDCT频谱;
步骤312:将下混声道的MDCT频谱输出为无重叠的MDCT域的一路子带;
步骤313:将MDCT域的一路子带信号进行上混,输出MDCT域的两路子带信号,这两
路信号都是输入子带信号的复制;
步骤314:对MDCT域的两路子带信号进行极大相关度逆旋转,输出左右声道的两路子
带信号;
输入为上混得到的MDCT域的两路子带信号,输出为逆旋转得到的对应左右声道的两路
子带信号A和A;,按下面的公式计算:
<formula>formula see original document page 20</formula>
(12) 其中e是编码端计算得到的极大相关旋转角;
步骤315:对左右声道的两路子带信号进行IMDCT (Inverse Modified Discrete Cosine Transform,修正离散余弦逆变换),输出左右声道时域信号,是步骤301的逆变换。
本实施例通过对解码后的音频信号进行上混,将一路音频信号还原为两路音频信号,再 对两路音频信号进行极大相关度逆旋转变换,还原出左右声道的音频信号。由于对音频信号 进行极大相关度逆旋转变换,改善了信号质量,所以与传统的只对一路音频信号进行解码操 作的解码方法相比,通过少量的极大相关度旋转角参数记录立体声信息,可以用很低的码率 实现立体声音频信号的高保真压縮。
另外,实施例5与实施例6可以结合起来,组成一种音频信号的编解码方法。
实施例7
参见图ll,本发明实施例提供了一种音频信号的编码系统,包括FFT单元、极大相关度 旋转变换单元、矢量量化单元、下混单元、IFFT (Inverse Fast Flourier Transform,快速傅里 叶逆变换)单元、编码单元以及MUX (Multiplexer,复用)单元。编码的输入是左右两路时域 信号,分别经FFT后的两路FFT频谱经极大相关度旋转变换,得到各个子带的旋转角度并进 行矢量量化,输出码字,同时输出两路极大相关变换的子带信号,经下混得到一路FFT域子 带信号,经IFFT得到时域下混信号,最后由编码单元进行编码,输出编码码字,将矢量量化 单元输出的码字与编码单元输出的编码码字一同输入MUX单元,封装成给定格式的码流。
对于极大相关度旋转变换单元,由于FFT是复变换,特别的可以采用每个子带提取一个 参数的模式提取旋转角度,如下所示
其中

相应的旋转变换为
也可以采用每个子带提取两个参数的模式提取旋转角度,分别对应实部和虚部,如下所示:
<formula>formula see original document page 21</formula>(15)
<formula>formula see original document page 22</formula> (16.a)
<formula>formula see original document page 22</formula> (16.b)
θr和θi分别表示实部和虚部的旋转角度,其中θr0和θi0由下面的公式得到
<formula>formula see original document page 22</formula> (17.a)
<formula>formula see original document page 22</formula> (17.b)
相应的实部和虚部的旋转变换为
<formula>formula see original document page 22</formula> (18.a)
<formula>formula see original document page 22</formula> (18.b)
也可以采用将谱线的幅度和相位分别处理的方式,如下所示
<formula>formula see original document page 22</formula> (19.a)
<formula>formula see original document page 22</formula> (19.b)
θA和θp分别表示幅度和相位的旋转角度,其中θA0和θp0。由下面的公式得到
<formula>formula see original document page 22</formula> (20.a)
<formula>formula see original document page 22</formula> (20.b)
本实施例通过对左右声道的音频信号进行极大相关度旋转变换,然后下混,将两路音频 信号变为一路音频信号后再进行编码。由于对音频信号进行极大相关度旋转与逆旋转变换,
改善了信号质量,所以与传统的只对一路音频信号进行编码操作的编码系统相比,通过少量 的极大相关度旋转角参数记录立体声信息,可以用很低的码率实现立体声音频信号的高保真 压縮。
实施例8
参见图12,本发明实施例提供了一种音频信号的解码系统,包括解码单元、FFT单元、 上混单元、反矢量量化单元、极大相关度逆旋转变换单元、IFFT单元以及MUX单元。解码 的输入是MUX单元输出的下混声道的编码码字和各子带旋转角度的矢量量化码字;首先解 码单元根据编码码字解码得到时域下混声道,经FFT得到频域下混信号,上混后成为两路相 关的频域信号,反矢量量化单元,用于从量化指标数查找出对应的旋转角参数,以便解码端 进行相应的逆旋转变换,极大相关解码单元根据这个旋转角度将上混的频域信号按子带进行 逆向旋转,得到两路分别对应左右声道频域信号,最后通过IFFT得到左右两路时域音频信号。
对于极大相关度逆旋转变换单元,与音频编码器对应的,当只提取一个参数时,按照下 面的式子进行逆旋转变换-
<formula>formula see original document page 23</formula>当实部和虚部分别处理,提取两个参数时,按照下面的式子进行逆旋转变换:
<formula>formula see original document page 23</formula>当幅度和相位分别处理时,按照下面的式子进行逆旋转变换:
<formula>formula see original document page 23</formula>本实施例通过对解码后的音频信号进行上混,将一路音频信号还原为两路音频信号,再 对两路音频信号进行极大相关度逆旋转变换,还原出左右声道的音频信号。由于对音频信号 进行极大相关度逆旋转变换,改善了信号质量,所以与传统的只对一路音频信号进行解码操 作的解码系统相比,通过少量的极大相关度旋转角参数记录立体声信息,可以用很低的码率
实现立体声音频信号的高保真压縮。
另外,实施例7与实施例8可以结合起来,组成一种音频信号的编解码系统。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之 内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种音频信号的编码方法,其特征在于,所述方法包括步骤A对左右声道的音频信号以极大相关度旋转角为旋转角进行正交旋转变换;步骤B对经过所述正交旋转变换的左右声道的音频信号进行编码,形成码流数据。
2. 根据权利要求1所述的一种音频信号的编码方法,其特征在于,所述步骤A具体包括步骤Al:对左右声道的时域音频信号进行时频变换输出左右声道的频域音频信号; 步骤A2:提取所述左右声道的频域音频信号的极大相关度旋转角;步骤A3:对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换。
3. 根据权利要求2所述的一种音频信号的编码方法,其特征在于,所述步骤B具体包括步骤B1:对经过所述正交旋转变换的左右声道的音频信号进行和差立体声编码,形成和 差音频码流;步骤B2:对旋转角进行量化熵编码,形成参数码流; 步骤B3:对所述和差音频码流进行量化和熵编码;步骤B4:将经过量化和熵编码的所述和差音频码流和参数码流组合成编码码流。
4. 根据权利要求2所述的一种音频信号的编码方法,其特征在于,所述步骤B具体包括步骤B1:对经过所述正交旋转变换的左右声道的音频信号进行强度立体声编码,形成强 度音频码流;步骤B2:对旋转角进行量化熵编码,形成参数码流; 步骤B3:对所述强度音频码流进行量化和熵编码;步骤B4:将经过量化和熵编码的所述强度音频码流和参数码流组合成编码码流。
5. 根据权利要求3或4所述的一种音频信号的编码方法,其特征在于,所述步骤A1具 体为对左右声道的时域音频信号进行多相滤波器组变换输出左右声道的频域音频信号。
6. 根据权利要求3或4所述的一种音频信号的编码方法,其特征在于,所述步骤A1具 体为对左右声道的时域音频信,行快速傅里叶变换输出左右声道的频域音频信号。
7. 根据权利要求1所述的一种音频信号的编码方法,其特征在于,所述步骤A具体包括步骤Ah对左右声道的时域音频信号进行时频变换输出左右声道的频域音频信号; 步骤A2:将所述左右声道的频域音频信号划分为连续无重叠的子带信号; 步骤A3:提取所述左右声道的子带信号的极大相关度旋转角;步骤A4:对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换。
8. 根据权利要求7所述的一种音频信号的编码方法,其特征在于,所述步骤B具体包括步骤Bl:将所述经过正交旋转变换的两路音频信号下混为一路下混声道的音频信号; 步骤B2:对下混声道的音频信号进行编码,形成编码码流。
9. 根据权利要求8所述的一种音频信号的编码方法,其特征在于,所述步骤A1具体为 对左右声道的时域音频信号进行多相滤波器组变换输出左右声道的频域音频信号;所述步骤A2具体为将所述左右声道的频域音频信号按照等效矩形带宽划分为连续无重叠的子带信号。
10. 根据权利要求8所述的一种音频信号的编码方法,其特征在于,所述步骤Al具体为对左右声道的时域音频信号进行多相滤波器组变换输出左右声道的频域音频信号; 所述步骤A2具体为将所述左右声道的频域音频信号按照临界带宽划分为连续无重叠的子带信号。
11. 一种音频信号的解码方法,其特征在于,所述方法包括 步骤A:对接收到的码流数据进行解码输出经过解码的音频信号;步骤B:对所述经过解码的音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换, 输出左右声道的音频信号。
12. 根据权利要求11所述的一种音频信号的解码方法,其特征在于,所述步骤A具体为步骤A1:将编码码流分解成音频码流和参数码流;步骤A2:将音频码流和参数码流分别进行熵解码和反量化得到频谱数据以及旋转角度; 步骤A3:根据编码的模式对所述频谱数据进行解码得到两路音频信号。
13. 根据权利要求12所述的一种音频信号的解码方法,其特征在于,所述步骤B具体为步骤Bl:对所述解码得到的两路音频信号以极大相关度旋转角为旋转角进行正交逆旋转 变换;步骤B2:对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输出左右声道的时 域音频信号。
14. 根据权利要求13所述的一种音频信号的解码方法,其特征在于,所述步骤B2具体为对经过所述正交逆旋转变换的两路音频信号进行多相滤波器组逆变换输出左右声道的时 域音频信号。
15. 根据权利要求13所述的一种音频信号的解码方法,其特征在于,所述步骤B2具体为对经过所述正交逆旋转变换的两路音频信号进行快速傅里叶逆变换输出左右声道的时域 音频信号。
16. 根据权利要求11所述的一种音频信号的解码方法,其特征在于,所述步骤A具体为步骤Al:对所述编码码流进行解码得到下混声道的音频信号;步骤A2:对下混声道的音频信号进行子带划分,输出连续无重叠的子带;步骤A3:将下混声道的音频信号进行上混输出所述经过正交旋转变换的两路子带信号;相应的,所述步骤B具体包括步骤Bh对所述经过正交旋转变换的两路子带信号以极大相关度旋转角为旋转角进行正 交逆旋转变换;步骤B2:对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输出左右声道的时域音频信号。
17. 根据权利要求16所述的一种音频信号的解码方法,其特征在于,所述步骤B2具体为对经过所述正交逆旋转变换的两路音频信号进行多相滤波器组逆变换输出左右声道的时 域音频信号。
18. 根据权利要求17所述的一种音频信号的解码方法,其特征在于,所述步骤A2具体对下混声道的音频信号按照等效矩形带宽迸行子带划分,输出连续无重叠的子带。
19. 根据权利要求18所述的一种音频信号的解码方法,其特征在于,所述步骤A2具体为对下混声道的音频信号按照临界带宽进行子带划分,输出连续无重叠的子带。
20. —种音频信号的编码系统,其特征在于,包括极大相关度旋转变换模块、编码模块; 所述极大相关度旋转变换模块,用于对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换;所述编码模块,用于对所述经过正交旋转变换的音频信号进行编码形成编码码流。
21. 根据权利要求20所述的一种音频信号的编码系统,其特征在于,所述极大相关度旋 转变换模块具体包括时频分析单元、极大相关度旋转变换单元;所述时频分析单元,用于对左右声道的时域音频信号进行时频变换输出左右声道的频域 音频信号;所述极大相关度旋转变换单元,用于对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换;所述编码模块具体包括编码单元、量化熵编码单元、码流成型单元;所述编码单元,用于对经过所述正交旋转变换的左右声道的音频信号进行编码,形成音频码流;所述量化熵编码单元,用于对所述音频码流和参数码流分别进行量化和熵编码,去除信 号的主观冗余;码流成型单元,用于将经过量化和熵编码的所述音频码流和参数码流组合成编码码流。
22. 根据权利要求21所述的一种音频信号的编码系统,其特征在于,所述时频分析单元具体为具体为快速傅里叶变换单元。
23. 根据权利要求21所述的一种音频信号的编码系统,其特征在于,所述时频分析单元具体为具体为多相滤波器组变换单元。
24. 根据权利要求20所述的一种音频信号的编码系统,其特征在于,所述极大相关度旋 转变换模块具体包括快速傅里叶变换单元、极大相关度旋转变换单元;所述快速傅里叶变换单元,用于对左右声道的时域音频信号进行时频变换输出左右声道 的频域音频信号;所述极大相关度旋转变换单元,用于对所述左右声道的频域音频信号以极大相关度旋转 角为旋转角进行正交旋转变换;所述编码模块具体包括下混单元、快速傅里叶逆变换单元、编码单元、矢量量化单元、 复用单元;所述下混单元,用于将所述经过正交旋转变换的两路音频信号下混为一路下混声道的音 频信号;所述快速傅里叶逆变换单元,用于将下混后一路音频信号进行快速傅里叶逆变换为时域 的音频信号;所述编码单元,用于对经过所述正交旋转变换的左右声道的音频信号进行编码,形成音 频码流;所述矢量量化单元,用于形成量化指标数码流,以便进一步去除旋转角参数的客观冗余, 降低参数码率;所述复用单元,用于将形成的音频码流和量化指标数码流封装成给定格式的编码码流。
25. —种音频信号的解码系统,其特征在于,包括解码模块、极大相关度逆旋转变换模块;所述解码模块,用于对接收到的码流数据进行解码,输出经过解码的音频信号; 所述极大相关度逆旋转变换模块,用于对所述经过解码的音频信号以极大相关度旋转角 为旋转角进行正交逆旋转变换,输出左右声道的音频信号。
26. 根据权利要求25所述的一种音频信号的解码系统,其特征在于,所述解码模块具体 包括码流解析单元、熵解码反量化单元、解码单元;所述码流解析单元,用于将码流分解成音频码流和参数码流;所述熵解码反量化单元,用于将音频码流进行熵解码和反量化得到频谱数据以及旋转角度;所述解码单元,用于根据编码的模式对所述频谱数据进行解码得到两路音频信号;所述极大相关度逆旋转变换模块,具体包括极大相关度逆旋转变换单元、时频综合单元;所述极大相关度逆旋转变换单元,用于对所述解码得到的两路音频信号以极大相关度旋 转角为旋转角进行正交逆旋转变换;所述时频综合单元,用于对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输 出左右声道的时域音频信号。
27. 根据权利要求26所述的一种音频信号的解码系统,其特征在于,所述时频综合单元 具体为快速傅里叶逆变换单元。
28. 根据权利要求26所述的一种音频信号的解码系统,其特征在于,所述时频综合单元具体为多相滤波器组逆变换单元。
29.根据权利要求25所述的一种音频信号的解码系统,其特征在于,所述解码模块具体包括解码单元、快速傅里叶变换单元、上混单元、反矢量量化单元;所述解码单元,用于根据编码的模式对所述频谱数据进行解码得到两路音频信号; 所述快速傅里叶变换单元,用于将解码单元输出的的音频信号进行快速傅里叶变换输出频域的音频信号;所述上混单元,用于将下混声道的音频信号进行上混输出所述经过正交旋转变换的两路 音频信号;所述反矢量量化单元,用于从量化指标数查找出对应的旋转角参数,以便解码端进行相 应的逆旋转变换;所述极大相关度逆旋转变换模块,具体包括极大相关度逆旋转变换单元、快速傅里叶逆 变换单元;所述极大相关度逆旋转变换单元,用于对所述上混得到的两路音频信号以极大相关度旋 转角为旋转角进行正交逆旋转变换;所述快速傅里叶逆变换单元,用于对经过所述正交逆旋转变换的两路音频信号进行时频 逆变换输出左右声道的时域音频信号。
全文摘要
本发明公开了一种音频信号的编码方法和系统与解码方法和系统,属于多媒体信号处理和信源编码领域。编码方法包括对左右声道的音频信号以极大相关度旋转角为旋转角进行正交旋转变换;对经过正交旋转变换的左右声道的音频信号进行编码。解码方法包括对接收到的码流数据进行解码输出经过解码的音频信号;对经过解码的音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换。编码系统包括极大相关度旋转变换模块和编码模块。解码系统包括解码模块和极大相关度逆旋转变换模块。本发明通过少量的极大相关度旋转角参数记录立体声信息,可以用很低的码率实现立体声音频信号的高保真压缩。
文档编号G10L19/00GK101202043SQ20071030448
公开日2008年6月18日 申请日期2007年12月28日 优先权日2007年12月28日
发明者张树华, 窦维蓓 申请人:清华大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1