音频解码器的制作方法

文档序号：2830118阅读：700来源：国知局

专利名称：音频解码器的制作方法
技术领域：
本发明涉及一种音频解码器，其利用(1)对缩混了多个声道的信号而得到的信号进行编码的编码数据；(2)对将该编码数据分离为原来的声道数的信号时所用的信息进行编码的编码数据，将对缩混了多个声道的信号而得到的信号进行编码的编码数据解码为原来的声道数的信号，且本发明尤其涉及MPEG(Moving Picture Expert Group运动图像专家组)音频中的空间音频编解码(Spatial Audio Codec)的解码处理。

背景技术：
近年，在MPEG音频标准中，被称作Spatial Audio Codec(空间音频编解码)的技术正在被标准化。其目的在于要以非常少的信息量来对表现出临场感的多声道信号进行压缩及编码。例如，在作为数字电视的声音方式已被广泛使用的多声道编解码方式的AAC(AdvancedAudio Coding先进音频编码)方式，5.1声道要有512kbps或384kbps的比特率，然而，在Spatial Audio Codec则以用128kbps或64kbps甚至于48kbps这样非常少的比特率来对多声道信号进行压缩及编码为目标(例如参照非专利文献1)。
图1是以往的音频装置的结构框图。
音频装置1000包括音频编码器1100和音频解码器1200，音频编码器1100输出对音频信号的组进行空间音响编码后而得到的编码信号，音频解码器1200对从音频编码器1100输出的编码信号进行解码。
音频编码器1100以由1024个采样或2048个采样等所示出的帧为单位，对音频信号(例如两声道的音频信号L、R)进行处理，且该音频编码器1100包括缩混部1110、双声列(Binaural Cue)检测部1120、编码器1150、以及多路复用部1190。
缩混部1110通过对以谱表示的两声道的音频信号L、R取平均，即通过M＝(L+R)/2，而生成缩混音频信号L、R后而得到的缩混信号。
双声列检测部1120通过按照各个谱带对音频信号L、R以及缩混信号M进行比较，从而生成用于将缩混信号M复原到音频信号L、R的BC信息(双声列)。
BC信息中包含示出声道间强度/强度差(inter-channel1evel/intensity difference)的强度信息IID、示出声道间相干/相关(inter-channel coherence/correlation)的相关信息ICC、以及示出声道间相位延迟差(inter-channel phase/delay difference)的相位信息IPD。
在此，相关信息ICC示出两个音频信号L、R的类似性，强度信息IID示出音频信号L、R的相对强度。一般而言，强度信息IID是用于控制声音的平衡和定位的信息，相关信息ICC是用于控制声音的幅度和扩散性的信息。这些信息均为帮助听者在头脑中构成听觉情景的空间参数。
以谱表示的音频信号L、R以及缩混信号M被划分为由“参数频带(parameter band)”构成的通常的多个组。因此，BC信息是按照各个参数频带被算出的。并且，“BC信息”和“空间参数”会经常被作为同义词语来使用。
编码器1150通过例如MP3(MPEG Audio Layer-3)或AAC(AdvancedAudio Coding先进音频编码)等对缩混信号M进行压缩编码。
多路复用部1190通过对缩混信号M和被量化了的BC信息进行多路复用而生成比特流，并将该比特流作为所述的编码信号来输出。
音频解码器1200包括逆多路复用部1210、解码器1220、以及多声道合成部1240。
逆多路复用部1210获得所述的比特流，并从该比特流中将被量化的BC信息和被编码的缩混信号M分离出来后输出。并且，逆多路复用部1210对被量化的BC信息进行逆量化后输出。
解码器1220将被编码的缩混信号M解码后输出到多声道合成部1240。
多声道合成部1240获得从解码器1220输出的缩混信号M和从逆多路复用部1210输出的BC信息。并且，多声道合成部1240利用所述BC信息，将缩混信号M复原为两个音频信号L、R。
并且，在以上所述中，以对两声道的音频信号进行编码及解码为例对音频装置1000进行了说明，不过，音频装置1000也可以对两声道以上的声道的音频信号(例如构成5.1声道声源的六个声道的音频信号)进行编码及解码。
图2是多声道合成部1240的功能结构框图。
多声道合成部1240例如在将缩混信号M分离为六个声道的音频信号的情况下，包括第一分离部1241、第二分离部1242、第三分离部1243、第四分离部1244、以及第五分离部1245。并且，缩混信号M是对以下的音频信号进行缩混后而得到的，这些音频信号是指与设置在视听者正面的扬声器相对应的中置音频信号C、与设置在视听者左前方的扬声器相对应的前左音频信号Lf、与设置在视听者右前方的扬声器相对应的前右音频信号Rf、与设置在视听者左侧的扬声器相对应的左环绕音频信号Ls、与设置在视听者右侧的扬声器相对应的右环绕音频信号Rs、以及与用于输出低音的重低音扬声器相对应的低音音频信号LFE。
第一分离部1241从缩混信号M中将第一缩混信号M1和第四缩混信号M4分离出来后输出。第一缩混信号M1由中置音频信号C、前左音频信号Lf、前右音频信号Rf、以及低音音频信号LFE缩混而成。第四缩混信号M4由左环绕音频信号Ls和右环绕音频信号Rs缩混而成。
第二分离部1242从第一缩混信号M1中将第二缩混信号M2和第三缩混信号M3分离出来后输出。第二缩混信号M2由前左音频信号Lf和前右音频信号Rf缩混而成。第三缩混信号M3由中置音频信号C和低音音频信号LFE缩混而成。
第三分离部1243从第二缩混信号M2中将前左音频信号Lf和前右音频信号Rf分离出来后输出。
第四分离部1244从第三缩混信号M3中将中置音频信号C和低音音频信号LFE分离出来后输出。
第五分离部1245从第四缩混信号M4中将左环绕音频信号Ls和右环绕音频信号Rs分离出来后输出。
这样，多声道合成部1240通过多阶段的方法在各个分离部将一个信号分离为两个信号，直至分离到单声道的音频信号为止重复进行递归的(recursively)信号分离。
图3是多声道合成部1240的其它功能结构框图。
多声道合成部1240包括全通滤波器1261、运算部1262、以及BCC处理部1263。
全通滤波器1261获得缩混信号M，并对该缩混信号M生成没有相关性的无相关信号Mrev并输出。在听觉上对缩混信号M和无相关信号Mrev进行比较可知它们互不相干。并且，无相关信号Mrev具有与缩混信号M相等的能量，含有能够制作出好像声音被传播得很远这种幻觉的有限时间的混响成分。
BCC处理部1263获得BC信息，并根据该BC信息中所包含的强度信息IID或相关信息ICC等，生成混合系数Hij并输出。
运算部1262获得并利用缩混信号M、无相关信号Mrev、以及混合系数Hij，进行(公式1)所示的运算，并输出音频信号L、R。这样，通过利用混合系数Hij，从而使音频信号L、R间的相关程度或这些信号的方向性成为希望的状态。
(公式1) L＝H11×M+H12×Mrev R＝H21×M+H22×Mrev 图4是多声道合成部1240的详细构成的方框图。
多声道合成部1240包括前矩阵处理部1251、后矩阵处理部1252、第一运算部1253和第二运算部1255、无相关处理部1254、解析滤波器组1256、以及合成滤波器组1257。并且，声道扩展部1270包括前矩阵处理部1251、后矩阵处理部1252、第一运算部1253、第二运算部1255、以及无相关处理部1254。
解析滤波器组1256获得从解码器1220输出的缩混信号M，并将该缩混信号M的表示形式转换为以时间和频率表示的混合表示形式，并作为第一频带信号x来输出。并且，此解析滤波器组1256包括第一阶段和第二阶段。例如，第一阶段和第二阶段分别为QMF(正交镜像滤波器)滤波器组和奈奎斯特滤波器组。在这些阶段中，首先以QMF滤波器(第一阶段)划分为多个频带，进而以奈奎斯特滤波器(第二阶段)将低频侧的子频带分为更窄的子频带，从而可以提高位于低频的子频带的频谱分辨率。
前矩阵处理部1251利用BC信息生成作为比例缩放因子的矩阵R1，所述比例缩放因子示出向各声道的信号强度的分配(比例缩放)。
例如，前矩阵处理部1251利用强度信息IID来生成矩阵R1，所述强度信息IID示出以下的信号强度的比率，即缩混信号M的信号强度和第一缩混信号M1、第二缩混信号M2、第三缩混信号M3以及第四缩混信号M4的信号强度的比率。
第一运算部1253获得从解析滤波器组1256输出的时间-频率混合表示的第一频带信号x，例如(公式2)和(公式3)所示，算出所述第一频带信号x和矩阵R1的乘积。并且，第一运算部1253输出示出矩阵运算结果的中间信号v。即，第一运算部1253从由解析滤波器组1256输出的时间-频率混合表示的第一频带信号x分离四个缩混信号M1～M4。
(公式2) (公式3) M1＝Lf+Rf+C+LFE M2＝Lf+Rf M3＝C+LFE M4＝Ls+Rs 无相关处理部1254具有图3所示的全通滤波器1261所具有的功能，通过对中间信号v施行全通滤波处理，从而如(公式4所示)，生成并输出无相关信号w。并且，无相关信号w的构成要素Mrev以及Mi，rev是对缩混信号M以及Mi施行无相关处理的信号。
(公式4) 后矩阵处理部1252利用BC信息生成矩阵R2，该矩阵R2示出对于各个声道的混响的分配。例如，后矩阵处理部1252通过示出声音的幅度或扩散性的相关信息ICC导出混合系数Hij，并生成由该混合系数Hij构成的矩阵R2。
第二运算部1255算出无相关信号w和矩阵R2的乘积，并输出示出矩阵运算结果的输出信号y。即，第二运算部1255从无相关信号w分离六个音频信号，即Lf、Rf、Ls、Rs、C、以及LFE。
例如，如图2所示，要想从第二缩混信号M2分离前左音频信号Lf，就要在该前左音频信号Lf的分离中利用第二缩混信号M2和与其相对应的无相关信号w的构成要素M2，rev。同样，要想从第一缩混信号M1分离第二缩混信号M2，就要在该第二缩混信号M2的算出中利用第一缩混信号M1和与其相对应的无相关信号w的构成要素M1，rev。
因此，前左音频信号Lf由以下的(公式5)所示出。
(公式5) Lf＝H11，A×M2+H12，A×M2，rev M2＝.H11，D×M1+H12，D×M1，rev M1＝H11，E×M+H12，E×Mrev 在此，(公式5)中的Hij，A是第三分离部1243中的混合系数，Hij，D是第二分离部1242中的混合系数，Hij，E是第一分离部1241中的混合系数。(公式5)中所示出的三个算式可以归纳为以下(公式6)所示出的一个向量乘法算式。
(公式6) Lf＝[H11，AH11，DH11，E H11，AH11，DH12，E H11，AH12，DH12，A 0 0]w＝R2，LFw 除前左音频信号Lf以外，其它的音频信号Rf、C、LFE、Ls、以及Rs也可以通过上述的矩阵和无相关信号w的矩阵的运算来算出。即，输出信号y由以下的(公式7)来表示。
(公式7) 合成滤波器组1257将被复原的各个音频信号的表示形式从时间-频率混合表示转换为时间表示形式，并将以时间表示的多个音频信号作为多声道信号来输出。并且，合成滤波器组1257为了与解析滤波器组1256相匹配，例如可以由两个阶段构成。并且，矩阵R1、R2是按各个上述的参数频带b作为矩阵R1(b)、R2(b)而被生成的。
图5是音频解码器1200的其它构成的方框图。
并且，图5中的双线箭头表示被分割为多个频带的频带信号(所述第一频带信号x以及输出信号y)的流向。
通过逆多路复用部1210而获得的编码信号是通过对编码缩混信号和被量化的BC信息进行多路复用而得到的，所述编码缩混信号是通过将六个声道的音频信号缩混为两个声道的缩混信号M后并被编码而得到的。
逆多路复用部1210将所述编码信号分离为编码缩混信号和BC信息。编码缩混信号例如是以MPEG标准AAC方式被编码的两个声道的编码数据。
解码器1220利用AAC解码器对所述编码缩混信号进行解码。其结果是，解码器1220输出两个声道的PCM信号(时间轴信号)，即输出缩混信号M。
解析滤波器组1256具有两个解析滤波器1256a，各个解析滤波器1256a将从解码器1220输出的缩混信号M转换为第一频带信号x。
声道扩展部1270通过利用BC信息将两个声道的第一频带信号x扩展为六个声道的输出信号y(例如参照专利文献1)。
合成滤波器组1257具有六个合成滤波器1257a，各个合成滤波器1257a将从声道扩展部1270输出的输出信号y转换为作为PCM信号的音频信号。
图6是音频解码器1200的其它构成的方框图。
通过逆多路复用部1210而获得的编码信号是通过对编码缩混信号和被量化的BC信息进行多路复用而得到的，所述编码缩混信号是通过将六个声道的音频信号缩混为一个声道的缩混信号M后并被编码而得到的。
在这样的情况下，解码器1220例如利用AAC解码器对所述编码缩混信号进行解码。其结果是，解码器1220输出一个声道的PCM信号(时间轴信号)，即输出缩混信号M。
解析滤波器组1256具有一个解析滤波器1256a，该解析滤波器1256a将从解码器1220输出的缩混信号M转换为第一频带信号x。
声道扩展部1270通过利用BC信息，将一个声道的第一频带信号x扩展为六个声道的输出信号y。
非专利文献1 118th AES convention，Barcelona，Spain，2005，Convention Paper 6447. 专利文献1专利申请2004-248989号公报然而，在上述以往的音频解码器中所存在的问题是由于运算量过多而造成了电路规模增大。
即，由于图5和图6的双线箭头所示出的频带信号(第一频带信号x以及输出信号y)是以复数来表示的，因此，在解析滤波器组1256、声道扩展部1270以及合成滤波器组1257中的处理所需要的运算量就会增大，并且存储器的容量也会增大。
因此，考虑到可以将以复数表示的频带信号作为实数来处理。但是，如果单纯地将复数处理替换为实数处理，则会产生折叠噪声。即，在特定的频带中存在音调性较强的信号的情况下，通过利用实数处理的合成滤波器1257a的处理，从而在邻接的频带中产生折叠噪声。因此，对各个频带中是否存在音调性较强的信号进行检测，在存在这样的信号的情况下，则需要在合成滤波器1257a的处理之前进行折叠噪声除去处理。
图7是进行实数处理以及折叠噪声除去的音频解码器的构成方框图。
该音频解码器1200’的解析滤波器组1256、声道扩展部1270以及合成滤波器组1257分别对频带信号(第一频带信号x以及输出信号y)进行实数处理。并且，此音频解码器1200’具有折叠噪声检测部1281和六个噪声除去部1282。
折叠噪声检测部1281根据第一频带信号x，对该信号的各个频带中是否存在音调性强的信号进行检测，即对产生折叠噪声的可能性进行检测。
六个噪声除去部1282分别根据折叠噪声检测部1281的检测结果，从声道扩展部1270输出的输出信号y中除去折叠噪声。
然而，在这样的音频解码器中，由于需要具有与输出信号y的声道数相同数量的噪声除去部1282，因此，造成从复数处理替换为实数处理的优点消失，运算量增多并且电路规模增大。

发明内容
因此，本发明鉴于上述问题，目的在于提供一种音频解码器，该音频解码器可以抑制折叠噪声的产生并可以减轻运算量。
为了达成上述目的，本发明所涉及的音频解码器对比特流进行解码并生成N(N≥2)声道的音频信号，所述比特流包括第一编码数据和第二编码数据，所述第一编码数据是对缩混信号进行编码而得到的，所述缩混信号是通过对N声道的音频信号进行缩混而得到的，所述第二编码数据是对参数进行编码而得到的，所述参数用于将所述缩混信号复原为原来的N声道的音频信号，所述音频解码器，其特征在于，包括频带信号生成单元，利用所述第一编码数据，生成针对所述缩混信号的第一频带信号；声道扩展单元，利用所述第二编码数据，将在所述频带信号生成单元生成的第一频带信号转换为针对N声道的音频信号的第二频带信号；频带合成单元，通过对在所述声道扩展单元生成的N声道的第二频带信号进行频带合成，从而转换为时间轴上的N声道的音频信号；以及折叠噪声检测单元，检测所述第一频带信号中的折叠噪声的产生；所述声道扩展单元进一步根据在所述折叠噪声检测单元检测出的信息，来防止在所述第二频带信号中含有折叠噪声。
据此，在估计到会发生在第一频带信号中的折叠噪声的情况下，由于可以在声道扩展单元抑制噪声的产生，因此，与在声道扩展单元的后级设置与声道数相同数量的噪声除去部相比，可以以非常少的处理量来抑制折叠噪声，从而可以实现一种电路规模小或程序大小小的音频解码器。
并且，也可以是，所述频带信号生成单元对于所述第一频带信号中的至少一部分频带，生成以实数表示的所述第一频带信号；所述折叠噪声检测单元检测折叠噪声的产生，所述折叠噪声是因所述第一频带信号由实数表示而产生的。
据此，第一频带信号可以不以复数来表示，而是以实数来表示，因此可以减少运算量，且通过以实数来表示可以回避折叠噪声的发生这一问题。
并且，也可以是，所述频带信号生成单元具有用于提高规定的频带的频带分辨率的奈奎斯特滤波器组，对于该奈奎斯特滤波器组所处理的频带生成以复数表示的频带信号，对于该奈奎斯特滤波器组不处理的频带生成以实数表示的频带信号。
据此，第一频带信号可以在用于提高频带分辨率的滤波器组中被直接进行复数处理，因此，可以在维持高的频带分辨率的同时抑制运算量，从而可以即提高了音质又减少了电路规模。
并且，也可以是，所述折叠噪声检测单元对所述第一频带信号中音调性强的信号所在的频带进行检测，所述音调性强是指强的频率成分的持续状态；所述声道扩展单元输出所述第二频带信号，所述第二频带信号是通过对与所述折叠噪声检测单元检测出的频带邻接的频带的信号强度进行调整而得到的。
据此，折叠噪声在音调性较明显的高频域中，由于信号电平得以调整，因此可以效率良好地除去噪声。
并且，也可以是，所述第二编码数据是通过对空间参数进行编码而得到的数据，所述空间参数包括原来的N声道的音频信号间的强度比和相位差；所述声道扩展单元包括运算单元，以与利用所述空间参数而生成的运算系数相应的比率，对所述第一频带信号和利用该第一频带信号而生成的无相关信号进行混合，从而生成所述第二频带信号；以及调整模块，对与所述折叠噪声检测单元所检测出的频带邻接的频带进行所述运算系数的调整，从而调整所述信号强度。
据此，可以在进行能够展现空间的声音扩展的混响处理的同时抑制折叠噪声，因此，可以实现一种电路规模小且不会影响到空间音响效果的空间音响解码。
并且，也可以是，所述运算单元包括前矩阵模块，利用所述运算系数的一部分，即利用从所述空间参数中所包含的强度比导出的比例缩放系数，对所述第一频带信号进行比例缩放，从而生成中间信号；无相关模块，对在所述前矩阵模块生成的中间信号施行全通滤波处理，从而生成无相关信号；以及后矩阵模块，利用所述运算系数的一部分，即利用从所述空间参数中所包含的相位差导出的混合系数，对所述第一频带信号和所述无相关信号进行混合；所述调整模块通过对所述空间参数进行调整来调整所述运算系数。例如，所述调整模块具有等化器，对所述空间参数进行均衡化，所述空间参数是针对所述折叠噪声检测单元所检测出的频带和与该频带邻接的频带的空间参数。
据此，可以适用于具有前矩阵模块、无相关模块以及后矩阵模块的以往的空间音响解码器，使小型化及高速处理化得以实现。
并且，本发明不仅可以作为以上所述的音频解码器来实现，而且还可以作为集成电路、方法、程序以及存储该程序的记录介质来实现。
本发明的音频解码器所起到的作用效果是，可以抑制折叠噪声的产生并可以减轻运算量。

图1是以往的音频装置的构成方框图。
图2是以往的音频装置的声道扩展部的功能构成方框图。
图3是以往的音频装置的声道扩展部的其它的功能构成的方框图。
图4是以往的音频装置的声道扩展部的详细构成的方框图。
图5是以往的音频解码器的其它构成的方框图。
图6是以往的音频解码器的其它构成的方框图。
图7是进行实数处理以及折叠噪声的除去的音频解码器的构成方框图。
图8是本发明的实施方式中的音频解码器的构成方框图。
图9是本发明的实施方式中的音频解码器的多声道合成部的详细构成的方框图。
图10是本发明的实施方式中的音频解码器的TD部以及EQ部的工作流程图。
图11是本发明的变形例1中所涉及的多声道合成部的详细构成的方框图。
图12是本发明的变形例2中所涉及的多声道合成部的详细构成的方框图。
图13是本发明的变形例3中所涉及的多声道合成部的详细构成的方框图。
图14是本发明的变形例4所涉及的TD部以及EQ部的工作流程图。
符号说明 100 音频解码器 101 逆多路复用部 102 解码器 103 多声道合成部 110 解析滤波器组 120 折叠噪声检测部(TD部) 130 声道扩展部 131 前矩阵处理部 132 后矩阵处理部 133 第一运算部 134 第二运算部 135 实数无相关处理部 136 EQ部 140 合成滤波器组
具体实施例方式 以下，将参照附图对本发明的实施方式中的音频解码器进行说明。
图8是本发明的实施方式中的音频解码器的构成方框图。
本实施方式中的音频解码器100可以抑制折叠噪声的产生并可以减轻运算量，其包括逆多路复用部101、解码器102、以及多声道合成部103。
逆多路复用部101具有与以上所述的以往的逆多路复用部1210相同的功能，获得从音频解码器输出的编码信号，并从所述编码信号中分离被量化的BC信息和编码缩混信号，并输出。并且，逆多路复用部101将被量化的BC信息逆量化后输出。
编码缩混信号可以作为第一编码数据，例如六个声道的音频信号被缩混并以AAC方式被编码。并且，编码缩混信号可以以AAC方式和SBR(Spectral Band Replication频带复制)方式被编码。BC信息以预先规定的形式被编码，可以作为第二编码数据。
解码器102具有与上述以往的解码器1220相同的功能，通过对编码缩混信号进行解码，从而生成作为PCM信号(时间轴信号)的缩混信号M，并输出到多声道合成部103。并且，解码器102也可以将以AAC方式的解码过程所生成的MDCT(Modified Discrete CosineTransform改进的离散余弦变换)系数按照解析滤波器组110的输出形式来转换，从而生成频带信号。
多声道合成部103在从解码器102获得缩混信号M的同时，从逆多路复用部101获得BC信息。并且，多声道合成部103利用所述BC信息，从缩混信号M复原所述六个音频信号。
多声道合成部103包括解析滤波器组110、折叠噪声检测部120、声道扩展部130、以及合成滤波器组140。
解析滤波器组110获得从解码器102输出的缩混信号M，并将该缩混信号M的表示形式转换为时间一频率混合表示，并作为第一频带信号x输出。此第一频带信号x是以实数来表示所有的频带时的频带信号。并且，在本实施方式中，由解码器102和解析滤波器组110构成频带信号生成单元。
折叠噪声检测部120通过对从解析滤波器组110输出的第一频带信号x进行解析，从而可以检测从多声道合成部103输出的六个声道的音频信号中产生折叠噪声的可能性的高低。即，折叠噪声检测部120判断第一频带信号x的各个频带中是否存在音调性强的信号。换而言之，折叠噪声检测部120对存在有音调性强的信号的频带进行检测，所述音调性强是指强的频率成分的持续状态。并且，折叠噪声检测部120在判断为存在有较强信号的情况下，可以检测出邻接的频带中产生折叠噪声的可能性较高。并且，由于在解析滤波器组110中生成了以实数来表示的第一频带信号x，因此，所述折叠噪声的产生可能性高。
声道扩展部130获得BC信息，并根据该BC信息生成用于从第一频带信号x生成六个声道的输出信号y的矩阵。此时，声道扩展部130在折叠噪声检测部120检测出折叠噪声的产生可能性高的情况下，生成能够抑制合成滤波器组140所输出的输出信号y中的折叠噪声的矩阵(运算系数)。并且，声道扩展部130通过对第一频带信号x进行利用所述矩阵的矩阵运算，从而输出作为频带信号(第二频带信号)的六个声道的输出信号y。
即，声道扩展部130在检测出折叠噪声的产生可能性较高的情况下，通过对产生可能性较高的频带信号的振幅进行调整，从而减轻折叠噪声。也就是说，由于BC信息中包含了强度信息IID，因此声道扩展部130在矩阵中对从所述等级信息IID中获得的各个频带的振幅放大系数进行调整，从而可以控制折叠噪声的产生可能性较高的频带信号的大小。
合成滤波器组140包括六个合成滤波器140a。各个合成滤波器140a分别将从声道扩展部130输出的输出信号y的表示形式从时间-频率混合表示转换为时间表示。即，合成滤波器140a是作为频带合成单元而被构成的，该频带合成单元对输出信号y进行频带合成，并将作为频带信号的输出信号y转换为PCM信号(时间轴信号)后输出。据此，由六个声道的音频信号组成的立体信号被输出。
图9是多声道合成部103的详细构成方框图。
解析滤波器组110包括实数QMF部111和实数Nyq部112。
实数QMF部111作为滤波器组由实数系数的QMF(QuadratureMirror Filter正交镜像滤波器)构成，按各个规定的频带对作为PCM信号的缩混信号M进行解析，生成以时间-频率混合表示的实数的第一频带信号x。
像这样的实数QMF部111所利用的不是(公式8)所示出的复数(复数调制系数)Mr(k，n)，而是(公式9)所示出的实数(实数调制系数)Mr(k，n)。
(公式8) (公式9) 实数Nyq部112由实数系数的奈奎斯特滤波器组构成，在所述实数QMF部111被生成的第一频带信号x的低频带中，进一步按照更窄的频带对实数的第一频带信号x进行校正。
像这样的实数Nyq部112的滤波器例如利用(公式11)所示出的实数(实数调制系数)gpq，而不利用(公式10)所示出的复数(复数调制系数)gqn，m。
(公式10) (公式11) TD部120是上述的折叠噪声检测部120，按照(公式12)来导出参数频带m以及处理帧g中的音调性(调性(Tonality))Tg(m)。
(公式12) 在此，Pgpow2(f)表示两个处理帧g以及(g-1)中的信号消耗电量的合计，Pgcob(f)表示上述的处理帧中的相干值。Tg(m)的值为0到1，Tg(m)＝O表示无调性，Tg(m)＝1表示调性高。
针对整体的调性而言，两个处理帧中的上述调性的最小值由(公式13)示出，参数频带m中的调性的最大值GT(m)由(公式14)示出。
(公式13) T(m)＝min(Tg(m)) (公式14) GT(m)＝max(Tg(m)) 声道扩展部130包括EQ部(等化器)136，其为调整模块；前矩阵处理部131、后矩阵处理部132、第一运算部133、第二运算部134、以及实数无相关处理部135。
EQ部136在TD部120检测出在参数频带b产生折叠噪声的可能性高的情况下，对参数频带b中的空间参数p(b)进行校正，以使折叠噪声的产生得以抑制，所述参数频带b中的空间参数p(b)是BC信息中所包含的强度信息IID或相关信息ICC等。
前矩阵处理部131具有与以往的前矩阵处理部1251相同的功能，通过EQ部136获得BC信息，并根据该BC信息生成矩阵R1。即，前矩阵处理部131根据BC信息的空间参数中所包含的强度信息IID，导出比例缩放因子，以此作为上述的运算系数的一部分。
第一运算部133算出以实数表示的第一频带信号x和矩阵R1的乘积，并输出示出所述矩阵运算结果的中间信号v。即，在本实施例中，由前矩阵处理部131以及第一运算部133构成前矩阵模块，该前矩阵模块对第一频带信号进行比例缩放。
实数无相关处理部135通过对以实数表示的中间信号v施行全通滤波处理，从而生成并输出无相关信号w。
像这样的实数无相关处理部135是利用如(公式16)所示的实数(实数矩阵系数)φcn，m，而不是利用(公式15)所示的复数(复数矩阵系数)φcn，m。据此，就可以除去非整数延迟系数。
(公式15)
(公式16) 后矩阵处理部132具有与以往的后矩阵处理部1252相同的功能，通过EQ部136获得BC信息，并根据所述BC信息生成矩阵R2。即，后矩阵处理部132根据BC信息的空间参数中所包含的相关信息ICC或相位信息IPD，导出混合系数来作为上述的运算系数的一部分。
第二运算部134算出以实数表示的无相关信号w和矩阵R2的乘积，并输出作为示出该矩阵运算结果的频带信号的输出信号y。即，在本实施例中，由后矩阵处理部132以及第二运算部134构成后矩阵模块，该后矩阵模块利用混合系数将第一频带信号x和无相关信号w混合。
合成滤波器组140包括实数INyq部141和实数IQMF部142。
实数INyq部141是实数系数的逆奈奎斯特滤波器，实数IQMF部142由实数系数的逆QMF滤波器构成。据此，合成滤波器组140将以实数表示的输出信号y例如转换为由六个声道的音频信号构成的时间信号，并输出。
并且，像这样的实数IQMF部142例如利用如(公式18)所示的的实数(实数调制系数)Nr(k，n)，而不利用(公式17)所示的复数(复数调制系数)Nr(k，n)。
(公式17) (公式18) 图10是TD部120以及EQ部136的工作流程图。
首先，TD部120对从解析滤波器组110输出的第一频带信号x进行解析，据此，参数频带b的范围为从0到PramBand，并算出参数频带b的调性GT(b)和与该参数频带邻接的参数频带(b+1)的调性GT(b+1)的平均值，即平均调性GT’(b)(步骤S700)。
其次，TD部120对参数频带b进行初始设定，即设定为0(步骤S701)，并判断参数频带b是否达到了(ParamBand-1)，即判断参数频带b所示的频带是否为从最后开始第二个频带(步骤S702)。
在此，在TD部120判断为到达(ParamBand-1)时(步骤S702的是)，结束折叠噪声的检测处理。另一方面，在没有到达(ParamBand-1)时(步骤S702的否)，TD部120进一步判断所述平均调性GT’(b)是否比预先规定的阈值TH2大(步骤S703)。
在TD部120判断为比阈值TH2大的情况下(步骤S703的是)，对折叠噪声的产生可能性进行检测，并将检测结果通知给EQ部136。EQ部136在接收了所述检测结果的通知的情况下，将参数频带b的空间参数p(b)和参数频带(b+1)的空间参数p(b+1)替换为它们的平均值，使空间参数p(b)和空间参数p(b+1)相等。并且，TD部120使参数频带b的值增加1(步骤S707)，并反复执行从步骤S702开始的工作。
另一方面，在TD部120判断为平均调性GT’(b)是阈值TH2以下时(步骤S703的否)，进一步判断该平均调性GT’(b)是否比阈值TH1小(步骤S705)。并且，阈值TH1是比阈值TH2小的值。
在此，在TD部120判断为比阈值TH1小时(步骤S705的是)，反复执行从步骤S707的处理，在判断为在阈值TH1以上时(步骤S705的否)，根据此判断结果，将平均调性GT’(b)以及阈值TH1和TH2通知给EQ部136。
EQ部136在接收了上述的通知的情况下，算出参数频带b的空间参数p(b)＝ave×(1-a)+p(b)×a和参数频带(b+1)的空间参数p(b+1)＝ave×(1-a)+p(b+1)×a(步骤S706)。在此，ave＝0.5×(p(b)+p(b+1))，a＝(TH2-GT’(b))/(TH2-TH1)。
即，EQ部136对阈值TH1和阈值TH2之间的所有的平均调性GT’(b)进行空间参数p(b)和p(b+1)的线性插值。即，平均调性GT’(b)离阈值TH1近时，也就是说调性(tonality)小时，空间参数p(b)、p(b+1)分别接近于各自原来的值，平均调性GT’(b)离阈值TH2近时，也就是说调性大时，空间参数p(b)、p(b+1)分别接近于各自的平均值。
像这样在本实施例中，能够在不使折叠噪声产生的情况下，实现了一种电路规模小或程序大小小的音频解码器，由于在该音频解码器的声道扩展部130对空间参数进行了调整，因此，这与在声道扩展部130的后级设置与声道数相等数量的噪声除去部相比，可以以极少的处理量来抑制折叠噪声。其结果是，可以力求实现低耗电量、内存容量的消减以及芯片大小的小型化。
(变形例1) 在此，对本实施例中的第一变形例进行说明。
在所述实施例中，虽然是EQ部136根据TD部120的检测结果对空间参数p进行均衡化的，但在本变形例所涉及的EQ部在对由前矩阵处理部131生成的矩阵R1进行均衡化的同时，还可以对由后矩阵处理部132生成的矩阵R2进行均衡化。
图11是本变形例中所涉及的多声道合成部的详细构成方框图。
在本变形例中，所涉及的多声道合成部103a代替所述实施例中的声道扩展部130的是具有声道扩展部130a。
声道扩展部130a具有与所述实施例的EQ部136相同的功能，包括EQ部136a以及EQ部136b。
即，EQ部136a根据TD部120的检测结果，将从前矩阵处理部131输出的矩阵R1(比例缩放系数)均衡化，EQ部136b根据TD部120的检测结果，将从后矩阵处理部132输出的矩阵R2(混合系数)均衡化。
EQ部136a如(公式19)所示，作为EQ部136的处理对象，不是处理空间参数p(b)而是处理矩阵R1(b)。
(公式19) p(b)＝R1(b) EQ部136b如(公式20)所示，作为EQ部136的处理对象，不是处理空间参数p(b)而是处理矩阵R2(b)。
(公式20) p(b)＝R2(b) 像这样在本实施例中，能够在不使折叠噪声产生的情况下，实现了一种电路规模小或程序大小小的音频解码器，由于在该音频解码器的声道扩展部130对运算系数即矩阵R1和R2直接进行了调整，因此，这与在声道扩展部130的后级设置与声道数相等数量的噪声除去部相比，可以以极少的处理量来抑制折叠噪声。
(实施例2) 在此，对本实施例中的第二变形例进行说明。
在所述实施例中，虽然在频带信号的所有频带中利用了实数，但在本变形例中，在频带信号中的低频带区域利用复数。即，在本变形例中仅对频带信号中的一部分利用实数。
图12是本变形例所涉及的多声道合成部的详细构成的方框图。
本变形例中所涉及的多声道合成部103b包括解析滤波器组110a、多声道扩展部130b、以及合成滤波器组140a。
解析滤波器组110a将缩混信号转换为时间-频率混合表示，并将转换后的信号作为第一频带信号x来输出，且该解析滤波器组110a包括所述的实数QMF部111和复数Nyq部112a。
复数Nyq部112a可以作为复数系数的奈奎斯特滤波器组，在实数QMF部111生成的第一频带信号x的低频带区域中，所述第一频带信号x可以由复数系数的奈奎斯特滤波器来校正。
像这样的解析滤波器组110a生成并输出低频带区域中以实数表示的部分的第一频带信号x。
声道扩展部130b包括所述的前矩阵处理部131、后矩阵处理部132、第一运算部133、第二运算部134、以及部分的实数无相关处理部135a。
部分的实数无相关处理部135a根据以实数表示的部分的第一频带信号x，对从第一运算部133输出的中间信号v进行全通滤波处理，从而生成并输出无相关信号w。
合成滤波器组140a将从声道扩展部130b输出的输出信号y的表示形式从时间-频率混合表示转换为时间表示，所述合成滤波器组140a包括所述的实数IQMF部142和复数INyq部141a。复数INyq部141a是复数系数的逆奈奎斯特滤波器，在低频带区域生成复数的第一频带信号x。并且，实数IQMF部142对于复数INyq部141a处理的结果，由实数系数的逆QMF进行合成滤波处理，从而输出多声道的时间信号。
像这样在本变形例中，由于在低频带所进行的处理是复数处理，因此，可以维持高频带区域的分辨率并可以抑制运算量，还可以既使音质提高又可以使电路规模缩小。
(变形例3) 在此，对本实施例中的变形例3进行说明。
本变形例所涉及的多声道合成部具备上述变形例1和变形例2双方的特征。
图13是本变形例所涉及的多声道合成部的详细构成的方框图。
本变形例所涉及的多声道合成部103c包括变形例2的解析滤波器组110a、声道扩展部130c、以及变形例2的合成滤波器组140a。
声道扩展部130c包括变形例1的EQ部136a、136b以及变形例2的部分的实数无相关处理部135a。
即，本变形例所涉及的多声道合成部103c对在前矩阵处理部131生成的矩阵R1进行均衡化，与此同时对在后矩阵处理部132生成的矩阵R2进行均衡化。而且，本变形例所涉及的多声道合成部103c仅对频带信号中的一部分利用实数。
(变形例4) 在此，对本实施例中的变形例4进行说明。
所述实施例中的TD部120以及EQ部136在彼此邻接的参数频带对空间参数p(b)进行平均化，本变形例中所涉及的TD部120以及EQ部136在由多个连续的参数频带组成的组合中对空间参数p(b)进行平均化。
图14是本变形例所涉及的TD部120以及EQ部136的工作流程图。
首先，TD部120进行初始设定，即参数频带b＝0，计数值cnt＝0，平均值ave＝0(步骤S1100)。并且，TD部120判断参数频带b是否达到了(ParamBand-1)，即判断参数频带b所表示的频带是否为从最后开始的第二个频带(步骤S1101)。
在此，在TD部120判断为达到了(ParamBand-1)时(步骤S1101的是)，结束折叠噪声的检测处理。另一方面，在判断为没有达到(ParamBand-1)时(步骤S1101的否)，则TD部120进一步判断所述平均调性GT’(b)是否比预先规定的阈值TH3大(步骤S1102)。
在TD部120判断为比阈值TH3大时(步骤S1102的是)，检测出有折叠噪声产生的可能性，并将此检测结果通知给EQ部136。EQ部136在接收了所述检测结果的的通知的情况下，将参数频带b的空间参数p(b)与平均值ave相加从而更新此平均值ave，并使计数值cnt增加1(步骤S1103)。并且，TD部120使参数频带b的值仅增加1(步骤S1108)，并反复执行从步骤S1101开始的工作。
这样，在连续的各个参数频带b中的平均调性GT’(b)比阈值TH3大的情况下，所述各个参数频带b的空间参数p(b)被累加。
另一方面，在TD部120判断为平均调性GT’(b)为阈值TH3以下的情况下(步骤S1102的否)，则进一步判断现在的计数值cnt是否比1大(步骤S1104)。在TD部120判断为计数值cnt比1大的情况下(步骤S1104的是)，则用所述计数值cnt来除平均值ave，从而更新所述平均值ave(步骤S1106)。并且，TD部120将被更新的平均值ave通知给EQ部136。
EQ部136为了使从(b-cnt)到(b-1)这个范围的参数频带i的空间参数p(i)成为从TD部120通知的平均值ave，而更新这些空间参数p(i)(步骤S1107)。
在TD部120判断为计数值cnt为1以下的情况下(步骤S1104的否)，或在EQ部136在所述的步骤S1107中更新空间参数p(i)的情况下，将计数值cnt以及平均值ave设定为0(步骤S1105)。并且，TD部120反复执行从步骤S1108开始的工作。
像这样在本变形例中，在由具有比阈值TH3大的平均调性GT’(b)的连续的参数频带组成的组合中，空间参数p(b)被平均化。
并且，在所述的实施例以及实施例中变形例中的音频解码器的全部或一部分的构成要素，可以作为LSI(Large Scale Integration)等集成电路来实现，并且，也可以将这些处理工作作为使计算机执行的程序来实现。
本发明的音频解码器可以抑制折叠噪声的产生并可以减轻运算量，尤其可以适用于广播等低比特率的应用中，例如可以适用于家庭影院系统、车载音像系统以及电子游戏系统等。
权利要求
1.一种音频解码器，对比特流进行解码并生成N(N≥2)声道的音频信号，所述比特流包括第一编码数据和第二编码数据，所述第一编码数据是对缩混信号进行编码而得到的，所述缩混信号是通过对N声道的音频信号进行缩混而得到的，所述第二编码数据是对参数进行编码而得到的，所述参数用于将所述缩混信号复原为原来的N声道的音频信号，所述音频解码器，其特征在于，包括
频带信号生成单元，利用所述第一编码数据，生成针对所述缩混信号的第一频带信号；
声道扩展单元，利用所述第二编码数据，将在所述频带信号生成单元生成的第一频带信号转换为针对N声道的音频信号的第二频带信号；
频带合成单元，通过对在所述声道扩展单元生成的N声道的第二频带信号进行频带合成，从而转换为时间轴上的N声道的音频信号；以及
折叠噪声检测单元，检测所述第一频带信号中的折叠噪声的产生；
所述声道扩展单元进一步根据在所述折叠噪声检测单元检测出的信息，来防止在所述第二频带信号中含有折叠噪声。
2.如权利要求1所述的音频解码器，其特征在于，
所述频带信号生成单元对于所述第一频带信号中的至少一部分频带，生成以实数表示的所述第一频带信号；
所述折叠噪声检测单元检测折叠噪声的产生，所述折叠噪声是因所述第一频带信号由实数表示而产生的。
3.如权利要求2所述的音频解码器，其特征在于，
所述频带信号生成单元具有用于提高规定的频带的频带分辨率的奈奎斯特滤波器组，对于该奈奎斯特滤波器组所处理的频带生成以复数表示的频带信号，对于该奈奎斯特滤波器组不处理的频带生成以实数表示的频带信号。
4.如权利要求2所述的音频解码器，其特征在于，
所述折叠噪声检测单元对所述第一频带信号中音调性强的信号所在的频带进行检测，所述音调性强是指强的频率成分的持续状态；
所述声道扩展单元输出所述第二频带信号，所述第二频带信号是通过对与所述折叠噪声检测单元检测出的频带邻接的频带的信号强度进行调整而得到的。
5.如权利要求4所述的音频解码器，其特征在于，
所述第二编码数据是通过对空间参数进行编码而得到的数据，所述空间参数包括原来的N声道的音频信号间的强度比和相位差；
所述声道扩展单元包括
运算单元，以与利用所述空间参数而生成的运算系数相应的比率，对所述第一频带信号和利用该第一频带信号而生成的无相关信号进行混合，从而生成所述第二频带信号；以及
调整模块，对与所述折叠噪声检测单元所检测出的频带邻接的频带进行所述运算系数的调整，从而调整所述信号强度。
6.如权利要求5所述的音频解码器，其特征在于，
所述运算单元包括
前矩阵模块，利用所述运算系数的一部分，即利用从所述空间参数中所包含的强度比导出的比例缩放系数，对所述第一频带信号进行比例缩放，从而生成中间信号；
无相关模块，对在所述前矩阵模块生成的中间信号施行全通滤波处理，从而生成无相关信号；以及
后矩阵模块，利用所述运算系数的一部分，即利用从所述空间参数中所包含的相位差导出的混合系数，对所述第一频带信号和所述无相关信号进行混合；
所述调整模块通过对所述空间参数进行调整来调整所述运算系数。
7.如权利要求5所述的音频解码器，其特征在于，
所述调整模块具有等化器，通过对所述比例缩放系数进行均衡化来调整所述运算系数，所述比例缩放系数是针对所述折叠噪声检测单元所检测出的频带和与该频带邻接的频带的比例缩放系数。
8.如权利要求5所述的音频解码器，其特征在于，
所述调整模块具有等化器，通过对所述混合系数进行均衡化来调整所述运算系数，所述混合系数是针对所述折叠噪声检测单元所检测出的频带和与该频带邻接的频带的混合系数。
9.如权利要求6所述的音频解码器，其特征在于，
所述调整模块具有等化器，对所述空间参数进行均衡化，所述空间参数是针对所述折叠噪声检测单元所检测出的频带和与该频带邻接的频带的空间参数。
10.如权利要求7到9中的任一项所述的音频解码器，其特征在于，
所述等化器通过对作为均衡化对象的各要素分别以该各要素的平均值来替换，从而进行所述均衡化。
11.一种音频信号的解码方法，对比特流进行解码并生成N(N≥2)声道的音频信号，所述比特流包括第一编码数据和第二编码数据，所述第一编码数据是对缩混信号进行编码而得到的，所述缩混信号是通过对N声道的音频信号进行缩混而得到的，所述第二编码数据是对参数进行编码而得到的，所述参数用于将所述缩混信号复原为原来的N声道的音频信号，所述音频信号的解码方法，其特征在于，包括
频带信号生成步骤，利用所述第一编码数据，生成针对所述缩混信号的第一频带信号；
声道扩展步骤，利用所述第二编码数据，将在所述频带信号生成步骤生成的第一频带信号转换为针对N声道的音频信号的第二频带信号；
频带合成步骤，通过对在所述声道扩展步骤生成的N声道的第二频带信号进行频带合成，从而转换为时间轴上的N声道的音频信号；以及
折叠噪声检测步骤，检测所述第一频带信号中的折叠噪声的产生；
所述声道扩展步骤进一步根据在所述折叠噪声检测步骤检测出的信息，来防止在所述第二频带信号中含有折叠噪声。
全文摘要
本发明提供一种能够抑制折叠噪声的产生并能够减轻运算量的音频解码器。音频解码器包括解码器(102)以及解析滤波器组(110)，根据所述编码缩混信号，对缩混信号(M)生成第一频带信号(x)；声道扩展部(130)，利用BC信息将通过解析滤波器组(110)生成的第一频带信号(x)转换为针对N声道的信频信号的输出信号(y)；合成滤波器组(140)通过对在声道扩展部(130)生成的N声道的输出信号(y)进行频带合成，从而转换为时间轴上的N声道的音频信号；以及折叠噪声检测部(120)，检测第一频带信号(x)中的折叠噪声的产生；且，声道扩展部(130)进一步根据折叠噪声检测部(120)检测出的信息，来防止输出信号(y)中含有折叠噪声。
文档编号G10L19/02GK101223821SQ20068002591
公开日2008年7月16日申请日期2006年7月11日优先权日2005年7月15日
发明者高木良明, 张国成, 则松武志, 宫阪修二, 川村明久, 小野耕司郎申请人:松下电器产业株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高木良明;张国成;则松武志;宫阪修二;川村明久;小野耕司郎
技术所有人：松下电器产业株式会社
我是此专利的发明人