声信号处理系统、声信号解码设备、该系统和设备中的处理方法、以及程序的制作方法

文档序号：2824708阅读：230来源：国知局

专利名称：声信号处理系统、声信号解码设备、该系统和设备中的处理方法、以及程序的制作方法
技术领域：
本发明涉及一种声信号处理系统，并且具体地涉及对经编码的声信号进行向下混合(downmix)的声信号处理系统、声信号解码设备、该系统和设备中的处理方法、以及使计算机执行该方法的程序。
背景技术：
常规地，作为声信号编码设备，通常使用以下设备该设备通过将多个输入信道的声信号变换到频域并对通过该变换获得的频域信号进行编码来生成经编码的声数据。因此，对经编码的声数据进行解码从而将频域信号变换成时域信号并输出这些信号作为输出声信号的声信号解码设备已经变得普遍。许多这样的声信号解码设备具有以下功能基于用于将输出声信号的输出信道的数目减小到输入信道的数目以下的加权系数，输出与小于输入信道的数目的输出信道的数目相对应的输出声信号。例如，已提出了一种编码音频解码设备，其通过在将各输入信道的频域信号变换成时域信号之前利用加权系数执行加权加法来输出与输出信道的数目相对应的经解码的音频(例如参见PTL1)。在该编码音频解码设备中，基于示出关于各频域信号的变换长度的变换函数选择信息，通过根据其变换长度使输入信道的频域信号彼此相关联来执行加权加法。这是因为，除非对各输入信道的频域信号执行的窗口化处理是相同的，否则无法对输入信道的频域信号执行加权加法(混合)。引用文献列表专利文献PTLl 日本专利第3279228号(图1)

发明内容
技术问题在上述相关技术中，对频域信号执行加权加法，由此可将频域信号的信道的数目减小到输入信道的数目之下。因此，可减少用于将频域信号变换成时域信号的计算处理。然而，仅根据关于各信道的频域信号的变换长度的类型来确定是否可执行频域上的加权加法，并且因此，如果频域信号的变换长度是相同的，即使施加于频域信号的窗口形状彼此不同，仍可以混合频域信号。例如，在AAC(高级音频编码)方法中，基于输入声信号的特性，既可改变变换长度，又可改变窗口形状的类型。因此，如果仅基于频域信号的变换长度来确定是否可执行频域上的混合，则可能将具有不同窗口形状的频域信号混合到一起，使得在某些情况下无法生成适当的输出声信号。鉴于这种情况，做出了本发明，并且其目的是在实现适当的输出声信号的生成的同时，对于从频域到时域的信号变换处理，减少声信号解码设备的计算量。问题的解决方案做出了本发明以解决上述问题，并且本发明的第一方面是一种声信号解码设备、用于该设备的处理方法以及使计算机执行该方法的程序，该声信号解码设备包括输出控制单元，其被配置成基于窗口信息来执行控制以同时输出具有相同窗口信息的频域信号，该窗口信息包括示出窗口函数类型的窗口形状，该窗口函数类型与通过对多个输入信道的声信号执行窗口化处理获得的频域信号有关；频域混合单元，其被配置成基于向下混合信息来混合具有相同窗口信息的输入信道的频域信号，并且输出这些信号作为与小于输入信道的数目的输出信道的数目相对应的频域信号；以及输出声音生成单元，其被配置成通过将从频域混合单元输出的输出信道的频域信号变换成时域信号并通过对通过该变换获得的时域信号执行窗口化处理来生成输出信道的声信号。因此，提供了以下操作基于向下混合信息，将具有包括示出窗口函数类型的窗口形状的相同窗口信息的频域信号混合，由此将与小于输入信道的数目的输出信道的数目相对应的频域信号变换成时域信号，以生成对应于输出信道的数目的声信号。另外，在第一方面中，针对多条窗口信息中的各个组合，频域混合单元可以基于向下混合信息来混合输入信道的频域信号，并且输出声音生成单元可以通过将已对其执行窗口化处理的各个组合的时域信号相加来生成输出信道的声信号。因此，提供了以下操作针对多条窗口信息中的各个组合，由频域混合单元基于向下混合信息将频域信号相加，从而生成输出信道的声信号。在这种情况下，在多条窗口信息中的组合的数目与输出信道的数目的乘积值小于输入信道的数目的情况下，输出控制单元可以将输入信道的频域信号同时输出到频域混合单元。因此，仅在窗口信息中的组合的数目与输出信道的数目的乘积值小于输入信道的数目的情况下，可以基于向下混合信息，通过混合输入信道的频域信号来生成输出信道的频域信号。另外，在第一方面中，输出控制单元可以基于窗口信息来控制频域信号的输出，该窗口信息是基于输入信道的声信号设置的并且包括示出窗口类型的窗口化形式，并且输出声音生成单元可以基于窗口信息中示出的窗口化形式和窗口函数类型，通过对输出信道的频域信号执行窗口化处理来生成输出信道的声信号。因此，提供了以下操作基于窗口信息中的窗口化形式和窗口形状的组合来混合各信道的频域信号以生成输出信道的频域信号，将所生成的频域信号变换成时域信号，并且基于窗口信息对这些时域信号执行窗口化处理，从而生成声信号。在这种情况下，输出控制单元可以基于针对窗口化形式中的前半部分和后半部分示出窗口形状的窗口信息来控制频域信号的输出。因此，提供了以下操作由输出控制单元基于针对窗口化形式中的变换长度的前半部分和后半部分示出窗口形状的窗口信息来切换频域信号的输出。另外，本发明的第二方面是一种声信号处理系统，其包括声信号编码设备，该声信号编码设备包括窗口化处理单元，其被配置成对多个输入信道的声信号执行窗口化处理并生成包括示出窗口化处理中的窗口函数类型的窗口形状的窗口信息；以及频率转换单元，其被配置成将从窗口化处理单元输出的声信号变换到频域，从而生成频域信号，并且该声信号处理系统包括声信号解码设备，该声信号解码设备包括输出控制单元，其被配置成执行控制以同时输出频域信号，这些频域信号是从声信号编码设备输出的并且具有相同的
5与输入信道的频域信号有关的窗口信息；频域混合单元，其被配置成基于向下混合信息来混合具有相同窗口信息的输入信道的频域信号，并且输出这些信号作为与小于输入信道的数目的输出信道的数目相对应的频域信号；以及输出声音生成单元，其被配置成通过将从频域混合单元输出的输出信道的频域信号变换成时域信号并通过对通过该变换获得的时域信号执行窗口化处理来生成输出信道的声信号。因此，提供了以下操作将对应于输出信道的数目的频域信号变换成时域信号，这些频域信号是通过基于向下混合信息来混合由声信号编码设备生成的输入信道的频域信号之中的具有相同窗口信息的频域信号而生成的，并且对通过该变换获得的时域信号执行窗口化处理，从而生成输出通道的声信号。发明的有益效果根据本发明，能够获得以下有益效果在实现适当的输出声信号的生成的同时，对于从频域到时域的信号变换处理，可以减小声信号解码设备中的计算量。

图1是示出了根据本发明的第一实施例的声信号处理系统的配置示例的框。图2是示出了根据本发明的第一实施例的声信号编码设备200的配置示例的框图。图3是示出了由根据本发明的第一实施例的窗口化处理单元211至215生成的窗口信息中的组合的示例的图。图4是示出了根据本发明的第一实施例的声信号解码设备300的配置示例的框图。图5是示出了由根据本发明的第一实施例的声信号解码设备300执行的用于对代码串进行解码的方法的处理步骤示例的流程图。图6是示出了根据本发明的第二实施例的声信号解码设备的配置示例的框图。图7是示出了由根据本发明的第二实施例的第一至第五输出选择单元711至715 选择输出目标的示例的图。图8是示出了由根据本发明的第二实施例的第一至第十六IMDCT/窗口化处理单元731至733和741至743执行的窗口化处理的示例的图。图9是示出了由根据本发明的第二实施例的声信号解码设备600执行的用于对代码串进行解码的方法的处理步骤示例的流程图。图10是示出了根据本发明的第三实施例的声信号解码设备的配置示例的框图。图11是示出了由根据本发明的第三实施例的声信号解码设备800执行的用于对代码串进行解码的方法的处理步骤示例的流程图。
具体实施例方式在下文中，将描述用于实施本发明的实施例(下文中称作实施例)。将按照以下顺序进行描述。1.第一实施例(向下混合控制基于窗口信息，在时域上的向下混合处理与频域上的向下混合处理之间切换的示例)2.第二实施例(向下混合控制基于窗口信息，仅利用频域信号执行向下混合处理的示例)3.第三实施例(向下混合控制基于窗口信息的组合的数目，在时域上的向下混合处理与频域上的向下混合处理之间切换的示例)<1.第一实施例>[声信号编码设备的配置示例]图1是示出了根据本发明的第一实施例的声信号处理系统的配置示例的框。声信号处理系统100包括声信号编码设备200，其对与多个输入信道的数目相对应的声信号进行编码；以及声信号解码设备300，其对经编码的声信号进行解码并以小于输入信道的数目的输出信道的数目将其输出。另外，声信号处理系统100包括两个扬声器以声波形式输出从声信号解码设备300输出的两个信道的声信号的右信道扬声器110和左信道扬声器 120。声信号编码设备200将从输入端子101至105输入的五个信道的声信号变换成数字信号，并且对通过该变换获得的数字信号进行编码。向声信号编码设备200提供来自输入端子101的右环绕信道(Rs)的声信号，提供来自输入端子102的右信道(R)的声信号，并提供来自输入端子103的中央信道(C)的声信号。此外，向声信号编码设备200提供来自输入端子104的左信道(L)的声信号，并提供来自输入端子105的左环绕信道(Ls)的声信号。声信号编码设备200对从输入端子101至105提供的、输入信道的数目为五的各声信号执行编码。另外，声信号编码设备200复用(multiplex)各经编码的声信号和关于该编码的信息，从而将其作为经编码的声数据经由代码串传输线301提供给声信号解码设备 300。声信号解码设备300对从代码串传输线301提供的经编码的声数据进行解码，从而生成与小于输入信道的数目的输出信道的数目相对应的两个信道的声信号。声信号解码设备300从经编码的声数据中提取经编码的声信号，并且对所提取的五个信道的经编码的声数据进行解码，从而生成两个信道的声信号。另外，声信号解码设备300经由信号线111将所生成的两个信道的声信号之一 (即右信道的声信号)输出到右信道扬声器110。另外，声信号解码设备300经由信号线 121将另一信号(即左信道的声信号)输出到左信道扬声器120。以这种方式，在声信号处理系统100中，由声信号解码设备300对被声信号编码设备200编码的五个信道的声信号进行解码，使得两个信道的声信号输出到扬声器110和 120。注意，声信号处理系统100是权利要求中描述的声信号处理系统的示例。注意，尽管这里在假定输入信道的数目和输出信道的数目分别是五和二的情况下已给出描述作为示例，但是本发明并不局限于此。在本发明的实施例中，输出信道的数目可以小于输入信道的数目。例如，输入信道的数目可以为三，并且输出信道的数目可以为一。接下来，下面将参照附图描述声信号编码设备200的具体配置示例。[声信号编码设备200的配置示例]图2是示出了根据本发明的第一实施例的声信号编码设备200的配置示例的框图。这里，作为示例，假定通过AAC标准实现声信号编码设备200。声信号编码设备200包括窗口化处理单元211至215、MDCT单元231至235、量化单元241至M5、代码串生成单元250、以及向下混合信息接收单元沈0。根据各输入信道的声信号的特性，窗口化处理单元211至215分别对从输入端子 101至105输入的各输入信道的声信号执行窗口化处理。也就是，窗口化处理单元211对右环绕信道的声信号执行窗口化处理，窗口化处理单元212对右信道的声信号执行窗口化处理，并且窗口化处理单元213对中央信道的声信号执行窗口化处理。另外，窗口化单元214 对左信道的声信号执行窗口化处理，并且窗口化单元215对左环绕信道的声信号执行窗口化处理。具体地，窗口化处理单元211至215以特定周期对声信号进行采样，并生成时域信号作为帧，该时域信号是通过该采样获得的2048个样本的离散信号。窗口化处理单元211 至215使前一帧位移半帧(10M个样本)，以生成下一帧。也就是，窗口化处理单元211至215生成下一帧，使得前一帧的后半部分(半帧) 与下一帧的前半部分重叠。因此，可以抑制在MDCT单元231至235中通过MDCT (修正离散余弦变换)生成的频域信号的数据量。另外，窗口化处理单元211至215对帧执行窗口化处理，以抑制通过将声信号划分成帧而出现的失真。具体地，根据AAC的规定，基于各信道的时域信号的特性，窗口化处理单元211至215针对一个帧从表示四种窗口类型的窗口化形式之中选择窗口化形式。窗口化处理单元211至215针对所选择的窗口化形式中的前半部分和后半部分中的每一个，选择表示两种窗口函数类型的窗口形状中的任一个。此时，窗口化处理单元211 至215选择与前一帧的后半部分相同的窗口形状作为当前帧的前半部分的窗口形状，以消除当前帧与前一帧之间的连接失真。也就是，窗口化处理单元211至215针对在当前帧与前一帧之间的重叠部分选择相同的窗口形状。基于所选择的窗口化形式和关于该形式的前半部分和后半部分的窗口形状，窗口化处理单元211至215对时域信号执行窗口化处理，并生成示出窗口化形式和窗口形状的组合的窗口信息。另外，窗口化处理单元211至215将已对其执行窗口化处理的各时域信号提供给 MDCT单元231至235。另外，窗口化处理单元211至215经由窗口信息线221至225将各个输入信道的窗口信息提供给代码串生成单元250，以在声信号解码设备300中生成声信号。注意，窗口化处理单元211至215是权利要求中描述的声信号编码设备中的窗口化处理单元的示例。MDCT单元231至235将从各个窗口化处理单元211至215提供的时域信号变换成频域信号。也就是，MDCT单元231至235将从窗口化处理单元211至215输出的声信号变换到频域，从而生成频域信号。具体地，MDCT单元231至235利用MDCT处理来变换时域信号，从而生成作为MDCT系数的频域信号(频谱)。另外，MDCT单元231至235将作为所生成的频域信号的、已对其执行窗口化处理的各个频域信号提供给量化单元241至M5。注意，MDCT单元231至235是权利要求中描述的声信号编码设备中的频率转换单元的示例。量化单元241至245对从MDCT单元231至235提供的、对应于各个输入信道的各个频域信号进行量化。例如，量化单元241至245基于人类的听觉特性来执行量化，并鉴于由该听觉特性引起的遮蔽效应来控制量化噪声。另外，量化单元241至245将各个量化频域信号提供给代码串生成单元250。向下混合信息接收单元260接收用于使输出信道的数目小于输入信道的数目的向下混合信息。例如，向下混合信息接收单元260接收用于对每个输入信道设置加权系数的向下混合系数的值。向下混合信息接收单元260将所接收的向下混合信息输出到代码串生成单元250。注意，虽然这里描述了在声信号编码设备200中设置向下混合信息的示例，但是可以在声信号解码设备300中设置向下混合信息。代码串生成单元250对从量化单元241至245提供的量化频域信号、从窗口化处理单元211至215提供的窗口信息、以及从向下混合信息接收单元260提供的向下混合信息进行编码，从而生成一个代码串。代码串生成单元250通过分别对各输入信道的经量化的频域信号进行编码来生成经编码的声数据。另外，编码串生成单元250将各输入信道的经编码的窗口信息和向下混合信息复用为经编码的声数据，从而将其作为一个代码串(比特流)提供给代码串传输线301。以这种方式，声信号编码设备200基于各输入信道的声信号，从MDCT变换中的多个组合的窗口化处理之中选择一个窗口化处理，并且对时域信号执行所选择的窗口化处理。另外，声信号编码设备200经由代码串传输线301将经编码的声数据传输到声信号解码设备300，在该经编码的声数据中复用已对其执行窗口化处理的频域信号和关于这些频域信号的窗口信息。现在，下面将参照附图简要描述由各个窗口化处理单元211至215生成的窗口信息的组合。[由窗口化处理单元211至215生成的窗口信息的示例]图3是示出了由根据本发明的第一实施例的窗口化处理单元211至215生成的窗口信息中的窗口化形式和窗口形状的组合的示例的图。这里，作为窗口信息270中的组合，示出了窗口化形式271和关于窗口化形式271的前半部分和后半部分的窗口形状272的组
I=I ο窗口化形式271示出了四种窗口化形式(长窗口、开始窗口、短窗口和停止窗口) 作为窗口类型。另外，窗口化形式271在概念上表示关于一个帧的窗口化形式。这里，窗口化形式271中的实线部分对应于窗口形状272中的前半部分，并且窗口化形式271中的虚线部分对应于窗口形式272中的后半部分。在窗口化形式271中，基本上，基于输入信道的声信号的特性来选择长窗口和短窗口中的任一个。窗口化形式271中的长窗口是具有2048个样本的变换长度(作为MDCT 的变换区间)的窗口化形式，并且在声信号的水平的波动小的情况下选择该长窗口。另一方面，窗口化形式271中的短窗口具有256个样本的MDCT的变换长度，并且在声信号的水平突然改变的情况(如在起声(attack sound)中那样)下选择该短窗口。这里，示出了八个短窗口。这是因为在选择短窗口的情况下，利用关于一个帧的八个短窗口生成频域信号。因此，与在长窗口中相比，可以准确地生成输入信道的声信号的频率分量，并且由此甚至在声信号的信号水平急剧改变的帧中也可以抑制听觉噪声。另外，在窗口化形式271中，选择开始窗口或停止窗口，以根据长窗口与短窗口之间的切换来抑制相邻帧之间的连接失真。窗口化形式271中的开始窗口是具有2048个样本的MDCT的变换长度的窗口化形式，并且当执行从长窗口到短窗口的切换时选择该开始窗口。例如，在检测到起声的情况下，紧接在选择短窗口之前选择开始窗口。
另外，窗口化形式271中的停止窗口是具有2048个样本的MDCT的变换长度的窗口化形式，并且当执行从短窗口到长窗口的切换时选择该停止窗口。也就是，在起声部分结束之后，紧接在选择长窗口之前选择停止窗口。在窗口形状272中的前半部分和后半部分中，示出两种窗口形状(正弦和KBD)，作为施加到窗口化形式的窗口函数类型。对于这里的窗口形状272中的前半部分和后半部分，关于窗口化形式271中的当前变换区间，在时间轴上与前一变换区间重叠的区间是前半部分，并且与下一变换区间重叠的区间是后半部分。窗口形状272中的正弦表示已选择正弦窗口作为窗口函数。窗口形状272中的 KBD表示已选择KBD(Kaiser-Bessel推导)窗口作为窗口函数。另外，在MDCT处理中，对于当前帧中的与前一变换区间重叠的部分(前半部分或后半部分)，需要选择与施加到前一变换区间相同的窗口形状，以抑制连接失真。以这种方式，在窗口信息270中，基于四种窗口化形式和施加到这些窗口化形式中的前半部分和后半部分的两个窗口形状来选择窗口化处理，并且由此存在最大的十六个组合281至四6。这里，由于输入信道是五个信道，所以窗口信息270中的组合的数目最大为五。接下来，下面将参照附图描述声信号解码设备300的配置示例。[声信号解码设备300的配置示例]图4是示出了根据本发明的第一实施例的声信号解码设备300的配置示例的框图。声信号解码设备300包括代码串分离单元310、解码/去量化单元320、输出控制单元340、输出开关单元351至355、加法单元361和362、时域合成单元400以及频域合成单元500。另外，时域合成单元400包括IMDCT/窗口化处理单元411至415和时域混合单元 420。此外，频域合成单元500包括频域混合单元510和输出声音生成单元520。输出声音生成单元520包括IMDCT/窗口化处理单元521和522。代码串分离单元310使从代码串传输线301提供的代码串分离。代码串分离单元 310基于从代码串传输线301提供的代码串将代码串分离成输入信道的经编码的声数据、各输入信道的窗口信息以及向下混合信息。另外，代码串分离单元310将各输入信道的经编码的声数据和窗口信息提供给解码/去量化单元320。也就是，代码串分离单元310将右环绕信道的经编码的声数据提供给信号线321，将右信道的经编码的声数据提供给信号线322，并且将中央信道的经编码的声数据提供给信号线323。此外，代码串分离单元310将左信道的经编码的声数据提供给信号线324，并且将左环绕信道的经编码的声数据提供给信号线325。此外，代码串分离单元310经由窗口信息线311将各输入信道的窗口信息提供给输出控制单元340。另外，代码串分离单元310经由向下混合信息线312将向下混合信息提供给时域混合单元420和频域混合单元510。解码/去量化单元320对各输入信道的经编码的声数据进行解码和去量化，从而生成作为MDCT系数的频域信号。解码/去量化单元320根据输出控制单元340的控制将各输入信道的所生成的频域信号和窗口信息提供给时域合成单元400和频域合成单元500 中的任一个。
10
具体地，解码/去量化单元320分别将各输入信道的所生成的频域信号提供给输出开关单元351至355。也就是，解码/去量化单元320将右环绕信道的频域信号提供给信号线331，将右信道的频域信号提供给信号线332，并且将中央信道的频域信号提供给信号线333。此外，解码/去量化单元320将左信道的频域信号提供给信号线334，并且将左环绕信道的频域信号提供给信号线335。输出开关单元351至355是用于根据输出控制单元340的控制将从信号线331至 335提供的频域信号输出到时域合成单元400和频域合成单元500中的任一个的开关。输出开关单元351至355根据输出控制单元340的控制同时将所有输入信道的频域信号输出到IMDCT/窗口化处理单元411至415或频域混合单元510。输出控制单元340基于包括在从窗口信息线311提供的各输入信道的窗口信息中的窗口化形式和窗口形状来切换输出开关单元351至355的连接。也就是，输出控制单元 340基于图3中示出的窗口信息中的窗口化形式与窗口化形式中的前半部分和后半部分的窗口形状的组合来控制输入信道的频域信号的输出目标。输出控制单元340确定各输入信道的窗口信息是否彼此匹配。于是，如果所有窗口信息匹配，则输出控制单元340控制输出开关单元351至355，以将信号线331至335连接到频域混合单元510。另一方面，如果所有窗口信息不匹配，则输出控制单元340控制输出开关单元351 至355，以将信号线331至335连接到IMDCT/窗口化处理单元411至415。也就是，输出控制单元340基于包括表示窗口函数类型的窗口形状的窗口信息来控制输出开关单元351至 355，使得具有相同窗口信息的频域信号同时输出到频域混合单元510。注意，输出控制单元 340是权利要求中描述的输出控制单元的示例。时域合成单元400将输入信道的各频域信号变换成时域信号，并且随后基于从代码串分离单元310提供的向下混合信息将输入信道的时域信号合成为输出信道的时域信号。也就是，时域合成单元400将五个信道的频域信号变换成频域信号，并且然后基于向下混合信息将五个信道的时域信号合成为两个信道的时域信号。IMDCT/窗口化处理单元411至415基于窗口信息和从信号线331至335提供的频域信号来生成输入信道的时域信号。IMDCT/窗口化处理单元411至415基于包括在窗口信息中的窗口化形式，利用IMDCT(逆MDCT)将各频域信号变换成时域信号。另外，IMDCT/窗口化处理单元411至415基于从代码串分离单元310提供的窗口信息对通过该变换获得的时域信号执行窗口化处理。另外，IMDCT/窗口化处理单元411至 415将已对其执行窗口化处理的各时域信号提供给时域混合单元420。时域混合单元420基于从代码串分离单元310提供的向下混合信息来混合从 IMDCT/窗口化处理单元411至415提供的五个信道的时域信号，从而生成两个信道的时域信号。也就是，时域混合单元420基于从代码串分离单元310提供的向下混合信息和输入信道的时域信号来生成比输入信道少的输出信道的时域信号。例如，根据AAC的规定，时域混合单元420通过基于以下等式混合五个信道的时域信号来生成两个信道的时域信号。[数1]
权利要求
1.一种声信号解码设备，包括输出控制单元，其被配置成基于窗口信息来执行控制以同时输出具有相同的所述窗口信息的频域信号，所述窗口信息包括示出窗口函数类型的窗口形状，所述窗口函数类型与通过对多个输入信道的声信号执行窗口化处理获得的所述频域信号有关；频域混合单元，其被配置成基于向下混合信息来混合具有相同的所述窗口信息的所述输入信道的频域信号，并且输出所述信号作为与小于所述输入信道的数目的输出信道的数目相对应的频域信号；以及输出声音生成单元，其被配置成通过将从所述频域混合单元输出的所述输出信道的频域信号变换成时域信号并通过对通过所述变换获得的时域信号执行所述窗口化处理来生成所述输出信道的声信号。
2.根据权利要求1所述的声信号解码设备，其中，针对所述多条窗口信息中的各个组合，所述频域混合单元基于所述向下混合信息来混合所述输入信道的频域信号，以及其中，所述输出声音生成单元通过将已对其执行所述窗口化处理的所述各个组合的所述时域信号相加来生成所述输出信道的所述声信号。
3.根据权利要求2所述的声信号解码设备，其中，在所述多条窗口信息中的所述组合的数目与所述输出信道的数目的乘积值小于所述输入信道的数目的情况下，所述输出控制单元将所述输入信道的所述频域信号同时输出到所述频域混合单元。
4.根据权利要求1所述的声信号解码设备，其中，所述输出控制单元基于所述窗口信息来控制所述频域信号的输出，所述窗口信息是基于所述输入信道的声信号设置的并且包括示出窗口类型的窗口化形式，以及其中，所述输出声音生成单元基于所述窗口信息中示出的所述窗口化形式和所述窗口函数类型，通过对所述输出信道的所述频域信号执行所述窗口化处理来生成所述输出信道的所述声信号。
5.根据权利要求4所述的声信号解码设备，其中，所述输出控制单元基于针对所述窗口化形式中的前半部分和后半部分示出所述窗口形状的所述窗口信息来控制所述频域信号的输出。
6.一种声信号处理系统，包括声信号编码设备，其包括窗口化处理单元，其被配置成对多个输入信道的声信号执行窗口化处理，并生成包括示出所述窗口化处理中的窗口函数类型的窗口形状的窗口信息；以及频率转换单元，其被配置成将从所述窗口化处理单元输出的所述声信号变换到频域从而生成频域信号；以及声信号解码设备，其包括输出控制单元，其被配置成执行控制以同时输出所述频域信号，所述频域信号是从所述声信号编码设备输出的并且具有相同的与所述输入信道的所述频域信号有关的所述窗口信息；频域混合单元，其被配置成基于向下混合信息来混合具有相同的所述窗口信息的所述输入信道的频域信号，并且输出所述信号作为与小于所述输入信道的数目的输出信道的数目相对应的频域信号；以及输出声音生成单元，其被配置成通过将从所述频域混合单元输出的所述输出信道的频域信号变换成时域信号并通过对通过所述变换获得的时域信号执行所述窗口化处理来生成所述输出信道的声信号。
7.一种声信号解码方法，包括输出控制步骤，其基于窗口信息来执行控制以同时输出具有相同的所述窗口信息的频域信号，所述窗口信息包括示出窗口函数类型的窗口形状，所述窗口函数类型与通过对多个输入信道的声信号执行窗口化处理获得的所述频域信号有关；频域混合步骤，其基于向下混合信息来混合具有相同的所述窗口信息的所述输入信道的频域信号，并且输出所述信号作为与小于所述输入信道的数目的输出信道的数目相对应的频域信号；以及输出声音生成步骤，其通过将所述频域混合步骤输出的所述输出信道的频域信号变换成时域信号并通过对通过所述变换获得的时域信号执行所述窗口化处理来生成所述输出信道的声信号。
8.一种程序，使计算机执行输出控制步骤，其基于窗口信息来执行控制以同时输出具有相同的所述窗口信息的频域信号，所述窗口信息包括示出窗口函数类型的窗口形状，所述窗口函数类型与通过对多个输入信道的声信号执行窗口化处理获得的所述频域信号有关；频域混合步骤，其基于向下混合信息来混合具有相同的所述窗口信息的所述输入信道的频域信号，并且输出所述信号作为与小于所述输入信道的数目的输出信道的数目相对应的频域信号；以及输出声音生成步骤，其通过将所述频域混合步骤输出的所述输出信道的频域信号变换成时域信号并通过对通过所述变换获得的时域信号执行所述窗口化处理来生成所述输出信道的声信号。
全文摘要
在实现适当的输出声信号的生成的同时，对于从频域到时域的信号变换处理，减小声信号解码设备中的计算量。输出控制单元340从代码串分离单元310接收窗口信息，并且如果所有窗口信息相同，则将输出开关单元351至355的连接切换到频域混合单元510，这些窗口信息包括示出与输入信道的窗口化处理有关的窗口函数类型的窗口形状。基于使输出信道的数目小于输入信道的数目的向下混合信息，频域混合单元510混合从解码/去量化单元320提供的五个信道的频域信号。IMDC/窗口化处理单元521和522将从频域混合单元510输出的两个信道的频域信号变换成时域信号，从而输出这些信号作为两个信道的声信号。
文档编号G10L19/00GK102119413SQ201080002207
公开日2011年7月6日申请日期2010年6月3日优先权日2009年6月23日
发明者知念彻, 辻实申请人:索尼公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：辻实;知念彻
技术所有人：索尼公司
我是此专利的发明人