多声道音频编码器和解码器的制作方法

文档序号：2831934阅读：182来源：国知局

专利名称：多声道音频编码器和解码器的制作方法
技术领域：
本发明涉及用于编码和解码的装置，并且具体地但不仅限于用于音频和语音信号的编码和解码。
背景技术：
空间音频处理是从音频源发出的音频信号通过不同传播路径到达聆听者的左耳和右耳的效果。由于这种效果，左耳处的信号与到达右耳的相应信号相比通常具有不同的到达时间和信号水平。时间和信号水平之间的差异取决于音频信号为了分别到达左耳和右耳所经过的路径的差异。聆听者的大脑继而解译这些差异，以便给出所接收的音频信号由位于相对于聆听者的特定距离和方向处的音频源生成的感觉。因此，可以将听觉场景视为同时收听位于相对于聆听者的不同位置处的一个或多个音频源生成的音频信号的合成串音。人类大脑可以处理双声道输入信号，以便确定声源的位置和方向的简单事实可以用于编码和合成听觉场景。空间听觉编码的一种典型方法由此可以通过有目的地修改来自一个或多个不同源(声道)的音频信号来试图建模音频场景的显著特征。这可以在被定义为左音频信号和右音频信号的耳机组中使用。左音频信号和右音频信号可以统称为双声道信号。继而可以生成所产生的双声道信号，使得其给出改变位于相对于聆听者的不同位置处的音频源的感觉。双声道信号与立体声信号的区别在于两个方面。首先，双声道信号已经并入了左声道与右声道之间的时间差，其次，双声道信号采用“头影效应”(其中，建模了特定频带的音量的减小)。最近，已经结合多声道音频再现而使用空间音频技术。多声道音频再现的目的是提供对包括多个独立音频声道或者声源的多声道音频信号的有效编码。多声道音频信号的编码的最近解决方案集中于参量立体声(PS)和双声道线索编码(BCC)。BCC通常通过将输入音频信号下混频为单(“合量”)声道或者传送该“合量”信号的较小数目的声道来编码多声道音频信号。同时，从输入声道中提取最显著的声道间线索并且将其编码为边信息，该最显著的声道间线索另外也称为空间线索，其描述多声道声像或者音频场景。合量信号和边信息二者形成经编码的参数集，其继而可以作为通信链的一部分来传输，或者存储在存储和转发类型设备中。BCC技术的多数实现通常采用低比特率音频编码方案来进一步编码合量信号。最终，BCC解码器根据所传输或者存储的合量信号和空间线索信息来生成多声道输出信号。通常，使用低比特率知觉音频编码技术(诸如AAC)来附加地编码空间音频编码系统中采用的下混频信号，以进一步减少所需的比特率。迄今为止，其中存在不止两个源的多声道音频编码仅用于家庭影院应用，其中带宽通常不视为主要限制。然而，多声道音频编码可以在多种移动设备上的新出现的多麦克风实现中使用，以帮助挖掘这些多麦克风技术的全部潜能。例如，多麦克风系统可以用于例如通过使得音频在接收机处缩放而在较差的音频环境中产生较好的信噪比，其中接收机具有集中于所接收的信号的特定源或者方向的能力。这一集中继而可以根据需要由接收机改进的源而改变。上文提到的多声道系统具有以下固有问题，S卩，N声道/麦克风源系统在被直接编码时产生的比特流大约需要单声道带宽N倍的带宽。该多声道带宽需求对于无线通信系统通常是禁止的。已知通过假设每个声道记录了相同的源信号，但是具有不同的时间延迟和频率相关放大特性，可以建模多声道/多源系统。在用于减少带宽需求的一些解决方案(诸如上文描述的双声道编码解决方案)中，已证实可以将N个声道组合到单个声道中，该单个声道是水平(强度)和时间对齐的。然而，这产生了一个问题，即水平和时间对齐针对不同的时间和频率元素是不同的。另外，通常存在若干源信号占用相同的时间-频率位置，每个源信号需要不同的时间和水平对齐。已经提出的一种单独解决方案已经解决了将所有音频源(换言之，随后由麦克风检测的音频信号的原始源)与信号分离并且建模由麦克风定义的原始源和空间的方向和音响效果的问题。然而，这在计算上较困难，并且需要大量的处理功率。另外，这一解决方案需要对所有原始源进行单独编码，并且原始源的数目可能超过原始声道的数目。换言之，所建模的原始源的数目可能大于用于记录音频环境的麦克风声道的数目。因此，目前系统通常仅将多声道系统编码为单个声道或者较小数目的声道，并且将其他声道编码为与最近声道的水平或者强度差值。例如，在两个(左和右)声道系统中，通常，通过平均左声道和右声道来创建单个单声道，并且继而对两个声道系统中的左声道和右声道二者的频带中的信号能量水平进行量化和编码，并且进行存储/发送至接收机。在接收机/解码器处，将单信号复制到两个声道，并且将左声道和右声道的信号水平设置为与两个重新创建的声道二者中每个频带中所接收的能量信息相匹配。这一类型的系统由于编码而产生了并非最优的声像，并且无法产生多声道系统可以产生的音频深度。

发明内容
本发明出于以下考虑，即通过将声道之间的时间差以及水平差纳入考虑而期望利用比先前允许的更高的质量来编码多声道信号。本发明的实施方式旨在解决以上问题。根据本发明的第一方面，提供了一种装置，配置用于确定第一信号与第二信号之间的至少一个时间延迟；根据至少一个时间延迟从第二信号生成第三信号；以及将第一信号与第三信号组合以生成第四信号。由此，本发明的实施方式可以编码音频信号并且产生具有较好定义的声道分离而不需要分离的声道编码。该装置可以进一步配置用于使用以下至少一个来编码第四信号MPEG_2AAC和 MPEG-I层 III(mp3)。该装置可以进一步配置用于将第一信号和第二信号划分为多个频带，并且其中优选地针对每个频带确定至少一个时间延迟。该装置可以进一步配置用于将第一信号和第二信号划分为多个时间帧，并且其中针对每个时间帧确定至少一个时间延迟。
该装置可以进一步配置用于将第一信号和第二信号划分为以下中的至少一个多个非重叠时间帧；多个重叠时间帧；以及多个加窗重叠时间帧。该装置可以进一步配置用于针对每个时间帧确定与第一信号的时间帧的开始相关联的第一时间延迟，以及与第一信号的时间帧的末尾相关联的第二时间延迟。第一帧和第二帧可以包括多个采样，并且该装置可以进一步配置用于在定义为开始于时间帧的开始与第一时间延迟的组合处，并且结束于时间帧的末尾与第二时间延迟的组合处的块中，从第二信号中选择至少一个采样；以及将所选择的至少一个采样伸展为等于第一帧的采样的数目。该装置可以进一步配置用于通过以下来确定至少一个时间延迟针对第一信号与第二信号相关生成相关值；以及选择具有最高相关值的时间值。该装置可以进一步配置用于生成第五信号，其中该第五信号包括以下中的至少一个至少一个时间延迟值；以及第一信号与第二信号之间的能量差。该装置可以进一步配置用于将第五信号与第四信号复用以生成编码音频信号。根据本发明的第二方面，提供了一种装置，配置用于将第一信号划分为至少第一部分和第二部分；解码第一部分以形成第一声道音频信号；以及从根据第二部分修改的第一声道音频信号生成第二声道音频信号，其中第二部分包括时间延迟值，并且该装置配置用于根据对第一声道音频信号的时间延迟值、通过应用至少一个时移来生成第二声道音频信号。第二部分还可以包括能量差值，并且其中该装置进一步配置用于通过根据能量差值向第一声道音频信号应用增益来生成第二声道音频信号。该装置可以进一步配置用于将第一声道音频信号划分为至少两个频带，其中第二声道音频信号的生成优选地修改第一声道音频信号的每个频带。第二部分可以包括至少一个第一时间延迟值和至少一个第二时间延迟值，第一声道音频信号可以包括从帧开始时间的第一采样到帧结束时间的末尾采样定义的至少一个帧，并且该装置优选地进一步配置用于在由第一声道音频信号的帧开始时间和第一时间延迟值所定义的时刻，将第一声道音频信号帧的第一采样复制到第二声道音频信号；以及在第一声道音频信号的帧结束时间和第二时间延迟值定义的时刻，将第一声道音频信号的末尾采样复制到第二声道音频信号。该装置可以进一步配置用于复制第一采样时刻与末尾采样时刻之间的任何其他第一声道音频信号帧采样。该装置可以进一步配置用于重新采样第二声道音频信号以与第一声道音频信号同步。一种电子设备可以包括如上所述的装置。一种芯片集可以包括如上所述的装置。一种编码器可以包括如上所述的装置。一种解码器可以包括如上所述的装置。根据本发明的第三方面，提供了一种方法，包括确定第一信号与第二信号之间的至少一个时间延迟；根据至少一个时间延迟、从第二信号生成第三信号；以及组合第一信号和第三信号以生成第四信号。
该方法可以进一步包括使用以下至少一个来编码第四信号MPEG_2AAC，以及 MPEG-I 层 III(mp3)。该方法可以进一步包括将第一信号和第二信号划分为多个频带，并且针对每个频带确定至少一个时间延迟。该方法可以进一步包括将第一信号和第二信号划分为多个时间帧，并且针对每个时间帧确定至少一个时间延迟。该方法可以进一步包括将第一信号和第二信号划分为以下中的至少一个多个非重叠时间帧；多个重叠时间帧；以及多个加窗重叠时间帧。该方法可以进一步包括针对每个时间帧确定与第一信号的时间帧的开始相关联的第一时间延迟以及与第一信号的时间帧的末尾相关联的第二时间延迟。第一帧和第二帧可以包括多个采样，并且该方法可以进一步包括在定义为开始于时间帧的开始与第一时间延迟的组合处，并且结束于时间帧的末尾与第二时间延迟的组合处的块中，从第二信号中选择至少一个采样；以及将所选择的至少一个采样伸展为等于第一帧的采样的数目。确定至少一个时间延迟可以包括针对第一信号与第二信号相关生成相关值；以及选择具有最高相关值的时间值。该方法可以进一步包括生成第五信号，其中该第五信号包括以下中的至少一个至少一个时间延迟值；以及第一信号与第二信号之间的能量差。该方法可以进一步包括将第五信号与第四信号复用以生成编码音频信号。根据本发明的第四方面，提供了一种方法，包括将第一信号划分为至少第一部分和第二部分；解码第一部分以形成第一声道音频信号；以及从根据第二部分修改的第一声道音频信号生成第二声道音频信号，其中第二部分包括时间延迟值，并且其中通过应用至少一个时移来生成第二声道音频信号取决于对第一声道音频信号的时间延迟值。第二部分还可以包括能量差值，并且其中该方法可以进一步包括通过根据能量差值向第一声道音频信号应用增益来生成第二声道音频信号。该方法可以进一步包括将第一声道音频信号划分为至少两个频带，其中生成第二声道音频信号可以包括修改第一声道音频信号的每个频带。第二部分可以包括至少一个第一时间延迟值和至少一个第二时间延迟值，第一声道音频信号可以包括从帧开始时间的第一采样到帧结束时间的末尾采样定义的至少一个帧，并且该方法可以进一步包括在由第一声道音频信号的帧开始时间和第一时间延迟值所定义的时刻，将第一声道音频信号帧的第一采样复制到第二声道音频信号；以及在第一声道音频信号的帧结束时间和第二时间延迟值定义的时刻，将第一声道音频信号的末尾采样复制到第二声道音频信号。该方法可以进一步包括复制第一采样时刻与末尾采样时刻之间的任何其他第一声道音频信号帧采样。该方法可以进一步包括重新采样第二声道音频信号以与第一声道音频信号同步。根据本发明的第五方面，提供了一种计算机程序产品，配置用于执行包括以下的方法确定第一信号与第二信号之间的至少一个时间延迟；根据至少一个时间延迟、从第二信号生成第三信号；以及组合第一信号和第三信号以生成第四信号。根据本发明的第六方面，提供了一种计算机程序产品，配置用于执行包括以下的方法将第一信号划分为至少第一部分和第二部分；解码第一部分以形成第一声道音频信号；以及从根据第二部分修改的第一声道音频信号生成第二声道音频信号，其中第二部分包括时间延迟值；并且其中通过应用至少一个时移来生成第二声道音频信号取决于对第一声道音频信号的时间延迟值。根据本发明的第七方面，提供了一种装置，包括处理装置，用于确定第一信号与第二信号之间的至少一个时间延迟；信号处理装置，用于根据至少一个时间延迟从第二信号生成第三信号；以及组合装置，用于组合第一信号和第三信号以生成第四信号。

根据本发明的第八方面，提供了一种装置，包括处理装置，用于将第一信号划分为至少第一部分和第二部分；解码装置，用于解码第一部分以形成第一声道音频信号；以及信号处理装置，用于从根据第二部分修改的第一声道音频信号生成第二声道音频信号，其中第二部分包括时间延迟值；并且其中信号处理装置配置用于根据对第一声道音频信号的时间延迟值、通过应用至少一个时移来生成第二声道音频信号。

为了更好地理解本发明，现在通过示例的方式参考附图，其中图1示意性地示出了采用本发明的实施方式的电子设备；图2示意性地示出了采用本发明的实施方式的音频编解码器系统；图3示意性地示出了图2所示的本发明的实施方式中采用的音频编码器；图4示出了说明编码多声道信号的本发明的实施方式的操作的流程图；图5更加详细地示出了从图4所示的多个多声道带块生成下混频信号的操作；图6示出了根据本发明的实施方式正在进行编码的信号的示意图；图7示意性地示出了根据本发明的实施方式的采样伸展；图8示出了本发明的实施方式中采用的帧窗；图9示出了根据本发明的实施方式的加窗(重叠和非重叠)以及非重叠组合之间的差异；图10示意性地示出了根据本发明的实施方式的在解码器中将单音信号解码到声道中；图11示意性地示出了利用重叠和非重叠窗对单音声道的解码；图12示出了根据本发明的实施方式的解码器；图13示意性地示出了根据本发明的实施方式的声道化合成器；以及图14示出了详细描述根据本发明的实施方式的解码器的操作的流程图。
具体实施例方式下面进一步详细地描述为音频编解码器提供增强的编码效率和信号保真度适当装置和可能的机制。就这一点而言，首先参考图1，其示出了示例性装置或者电子设备10的示意框图，其可以并入根据本发明的实施方式的编解码器。电子设备10例如可以是无线通信系统的移动终端或者用户设备。
电子设备10包括麦克风11，其经由模拟数字转换器14链接到处理器21。处理器 21进一步经由数字模拟转换器32链接到扬声器33。处理器21进一步链接至收发机(TX/ RX) 13、用户接口(UI) 15和存储器22。处理器21可以配置用于执行各种程序代码。所实现的程序代码可以包括编码代码例程。所实现的程序代码23可以进一步包括音频解码代码。所实现的程序代码23例如可以存储在存储器22中，以便由处理器21在需要时获取。存储器22可以进一步提供部分 24以用于存储数据，例如已经根据本发明进行编码的数据。在本发明的实施方式中，编码和解码代码可以在硬件或者固件中实现。用户接口 15可以使得用户能够例如经由小键盘向电子设备10输入命令，和/或例如经由显示器从电子设备10获得信息。收发机13使得能够例如经由无线通信网络与其他电子设备通信。在本发明的一些实施方式中，收发机13可以配置用于通过有线连接与其他电子设备通信。还可以理解，电子设备10的结构可以按照多种方式进行补充和改变。电子设备10的用户可以使用麦克风11来输入语音，该语音将要传输至一些其他电子设备，或者将要存储在存储器22的数据段24中。为此，用户已经经由用户接口 15激活了相应的应用。该应用可以由处理器21运行，使得处理器21执行存储在存储器22中的编码代码。模拟数字转换器14可以将输入的模拟音频信号转换为数字音频信号，并且向处理器21提供数字音频信号。处理器21继而可以按照相同的方式处理数字音频信号，如参考以下描述所描述的。将产生的比特流提供至收发机13，以便向另一电子设备传输。备选地，编码的数据可以存储在存储器22的数据段24中，例如用于随后的传输或者由相同的电子设备10随后呈现。电子设备10也可以经由收发机13、从另一电子设备接收具有相应的编码数据的比特流。在这种情况下，处理器21可以执行存储在存储器22中的解码程序代码。处理器 21因此可以解码所接收的数据，并且将解码的数据提供至数字模拟转换器32。数字模拟转换器32可以将数字解码数据转换为模拟音频数据，并且将模拟信号输出至扬声器33。也可以由用户已经经由用户接口 15调用的应用来触发解码程序代码的执行。所接收的编码数据也可以存储在存储器22的数据段24中，而不是经由扬声器33 立即呈现，例如，用于使得能够随后呈现，或者向又一电子设备转发。在本发明的一些实施方式中，可以由耳机组对扬声器33进行补充或者将其替换，该耳机组可以与电子设备10或者装置例如通过蓝牙协议经由收发机13无线地通信，或者使用传统的有线连接来通信。可以理解，图3、图12和图13中描述的示意结构以及图4、图5和图14中的方法步骤仅呈现了图1所示的电子设备实现的完整音频编解码器的操作的一部分。图2示出了本发明的实施方式采用的音频编解码器的一般操作。一般音频编码/ 解码系统包括编码器和解码器，如图2示意性示出的。示出了具有编码器104、存储或者媒体声道106和解码器108的系统102。
编码器104压缩产生比特流112的输入音频信号110，其可以被存储或者通过媒体声道106传输。比特流112可以在解码器108内接收。解码器108解压缩比特流112，并且产生输出音频信号114。与输入信号110有关的比特流112的比特率以及输出音频信号 114的质量是主要特征，其定义了编码系统102的性能。图3示意性地示出了根据本发明第一实施方式的编码器104。编码器104绘出为包括被划分为N个声道{A，C2，...，CN}的输入302。可以理解，输入302可以布置为接收N 个声道的音频信号，或者备选地，接收来自N个单独音频源的N个音频信号，其中N是等于或者大于2的整数。在图4中通过步骤401示出了 N个声道的接收。在下文描述的实施方式中，并行处理每个声道。然而，本领域技术人员可以理解，根据特定实施方式以及相关联的并行/串行处理成本/益处分析，可以串行地或者部分串行地和部分并行地处理每个声道。由滤波器组301接收N个声道。滤波器组301包括N个滤波器组元件303中的多个。每个滤波器组元件303接收声道之一并且输出每个声道的一系列频带分量。如图3中所看到的，用于第一声道C1的滤波器组元件是滤波器组元件FBJC^i，其输出B个声道带C11 到〔Λ类似地，滤波器组元件FBn303n输出用于第N个声道的一系列B个带分量Cn1到Cnb。这些声道中每一个的B个带从滤波器组301输出，并且被传送至分隔器和加窗器305。在本发明的实施方式中，滤波器组可以是不一致的。在不一致的滤波器组中，带不一致地分布。例如，在一些实施方式中，带针对较低频率可能较窄，而针对高频率可能较宽。在本发明的一些实施方式中，带可以重叠。在图4中通过步骤403示出了向每个声道应用滤波器组以生成针对每个声道的
市ο分隔器和加窗器305接收每个声道带采样值，并且将声道的每个带分量的采样划分为采样值的块(另外称为帧)。从分隔器和加窗器向单音块编码器307输出这些块或者帧。在本发明的一些实施方式中，块或者帧在时间上重叠。在这些实施方式中，可以应用加窗函数，以使得具有相邻块或者帧的任何重叠部分合计值为1。图8示出了加窗函数的一个示例，并且可以根据以下公式来数学地描述。
_ π 1 /win — tmp =--—) + 1 2，k 二 Q,…,wtl-\
wtl 2/
0,k = O5,.,,ζ/
win — tmp(k - (zl +1))， k 二 zl +1，.·., zl + wtl
/7、1’ k = zl + wtl,"”wl/2
win(k) = <t
1， w//2 + l，".’w//2 + o/
win _ tmp{wl(wl/2 + o/ +1))) ， k = wl/2 + o/ + Iv.., wl-zl-\ 0，k-wl -z/5...,w/-l
其中wtl是窗的正弦部分的长度，zl是窗中的前导零的长度，而ol是窗中间的1 的长度的一半。为了使加窗重叠合计为1，以下等式必须成立
权利要求
1.一种装置，配置用于确定第一信号与第二信号之间的至少一个时间延迟；根据所述至少一个时间延迟从所述第二信号生成第三信号；以及将所述第一信号与所述第三信号组合以生成第四信号。
2.根据权利要求1所述的装置，进一步配置用于使用以下至少一个来编码所述第四信号MPEG-2AAC,以及 MPEG-I 层 III(mp3)。
3.根据权利要求1到2所述的装置，进一步配置用于将所述第一信号和所述第二信号划分为多个频带，并且其中针对每个频带确定至少一个时间延迟。
4.根据权利要求1到3所述的装置，进一步配置用于将所述第一信号和所述第二信号划分为多个时间帧，并且其中针对每个时间帧确定至少一个时间延迟。
5.根据权利要求4所述的装置，进一步配置用于将所述第一信号和所述第二信号划分为以下中的至少一个多个非重叠时间帧；多个重叠时间帧；以及多个加窗重叠时间帧。
6.根据权利要求4和5所述的装置，进一步配置用于针对每个时间帧确定与所述第一信号的时间帧的开始相关联的第一时间延迟，以及与所述第一信号的时间帧的末尾相关联的第二时间延迟。
7.根据权利要求6所述的装置，其中第一帧和第二帧包括多个采样，并且所述装置进一步配置用于在定义为开始于时间帧的开始与所述第一时间延迟的组合处，并且结束于时间帧的末尾与所述第二时间延迟的组合处的块中，从所述第二信号中选择至少一个采样；以及将所选择的至少一个采样伸展为等于所述第一帧的采样的数目。
8.根据权利要求1到7所述的装置，进一步配置用于通过以下来确定至少一个时间延迟针对所述第一信号与所述第二信号相关生成相关值；以及选择具有最高相关值的时间值。
9.根据权利要求1到8所述的装置，进一步配置用于生成第五信号，其中所述第五信号包括以下中的至少一个至少一个时间延迟值；以及所述第一信号与所述第二信号之间的能量差。
10.根据权利要求9所述的装置，进一步配置用于将所述第五信号与所述第四信号复用以生成编码音频信号。
11.一种装置，配置用于将第一信号划分为至少第一部分和第二部分；解码所述第一部分以形成第一声道音频信号；以及从根据第二部分修改的所述第一声道音频信号生成第二声道音频信号，其中所述第二部分包括时间延迟值，并且所述装置配置用于根据对所述第一声道音频信号的时间延迟值、通过应用至少一个时移来生成所述第二声道音频信号。
12.根据权利要求11所述的装置，其中所述第二部分还包括能量差值，并且其中所述装置进一步配置用于通过根据所述能量差值向所述第一声道音频信号应用增益来生成所述第二声道音频信号。
13.根据权利要求11和12所述的装置，进一步配置用于将所述第一声道音频信号划分为至少两个频带，其中所述第二声道音频信号的生成通过修改所述第一声道音频信号的每个频带。
14.根据权利要求11到13所述的装置，其中所述第二部分包括至少一个第一时间延迟值和至少一个第二时间延迟值，所述第一声道音频信号包括从帧开始时间的第一采样到帧结束时间的末尾采样定义的至少一个帧，并且所述装置进一步配置用于在由所述第一声道音频信号的帧开始时间和第一时间延迟值所定义的时刻，将所述第一声道音频信号帧的第一采样复制到所述第二声道音频信号；以及在所述第一声道音频信号的帧结束时间和第二时间延迟值定义的时刻，将所述第一声道音频信号的末尾采样复制到所述第二声道音频信号。
15.根据权利要求14所述的装置，进一步配置用于复制第一采样时刻与末尾采样时刻之间的任何其他第一声道音频信号帧采样。
16.根据权利要求15所述的装置，进一步配置用于重新采样所述第二声道音频信号以与所述第一声道音频信号同步。
17.一种电子设备，包括如权利要求1到16所述的装置。
18.一种芯片集，包括如权利要求1到16所述的装置。
19.一种编码器，包括如权利要求1到10所述的装置。
20.一种解码器，包括如权利要求11到16所述的装置。
21.一种方法，包括确定第一信号与第二信号之间的至少一个时间延迟；根据所述至少一个时间延迟、从所述第二信号生成第三信号；以及组合所述第一信号和所述第三信号以生成第四信号。
22.根据权利要求21所述的方法，进一步包括使用以下至少一个来编码第四信号MPEG-2AAC,以及MPEG-I 层 III(mp3)。
23.根据权利要求21到22所述的方法，进一步包括将所述第一信号和所述第二信号划分为多个频带，并且针对每个频带确定至少一个时间延迟。
24.根据权利要求21到23所述的方法，进一步包括将所述第一信号和所述第二信号划分为多个时间帧，并且针对每个时间帧确定至少一个时间延迟。
25.根据权利要求M所述的方法，进一步包括将所述第一信号和所述第二信号划分为以下中的至少一个多个非重叠时间帧；多个重叠时间帧；以及多个加窗重叠时间帧。
26.根据权利要求M和25所述的方法，进一步包括针对每个时间帧确定与所述第一信号的时间帧的开始相关联的第一时间延迟以及与所述第一信号的时间帧的末尾相关联的第二时间延迟。
27.根据权利要求沈所述的方法，其中第一帧和第二帧包括多个采样，并且所述方法进一步包括在定义为开始于时间帧的开始与所述第一时间延迟的组合处，并且结束于时间帧的末尾与所述第二时间延迟的组合处的块中，从所述第二信号中选择至少一个采样；以及将所选择的至少一个采样伸展为等于所述第一帧的采样的数目。
28.根据权利要求21到27所述的方法，其中确定所述至少一个时间延迟包括针对所述第一信号与所述第二信号相关生成相关值；以及选择具有最高相关值的时间值。
29.根据权利要求21到观所述的方法，进一步包括生成第五信号，其中所述第五信号包括以下中的至少一个至少一个时间延迟值；以及所述第一信号与所述第二信号之间的能量差。
30.根据权利要求四所述的方法，进一步包括将所述第五信号与所述第四信号复用以生成编码音频信号。
31.一种方法，包括将第一信号划分为至少第一部分和第二部分；解码所述第一部分以形成第一声道音频信号；以及从根据所述第二部分修改的第一声道音频信号生成第二声道音频信号，其中所述第二部分包括时间延迟值，并且其中通过应用至少一个时移来生成所述第二声道音频信号取决于对所述第一声道音频信号的时间延迟值。
32.根据权利要求31所述的方法，其中所述第二部分还包括能量差值，并且其中所述方法进一步包括通过根据所述能量差值向所述第一声道音频信号应用增益来生成所述第二声道音频信号。
33.根据权利要求31和32所述的方法，进一步包括将所述第一声道音频信号划分为至少两个频带，其中生成所述第二声道音频信号包括修改所述第一声道音频信号的每个频市ο
34.根据权利要求31到33所述的方法，其中所述第二部分包括至少一个第一时间延迟值和至少一个第二时间延迟值，所述第一声道音频信号包括从帧开始时间的第一采样到帧结束时间的末尾采样定义的至少一个帧，并且所述方法进一步包括在由所述第一声道音频信号的帧开始时间和第一时间延迟值所定义的时刻，将所述第一声道音频信号帧的第一采样复制到所述第二声道音频信号；以及在所述第一声道音频信号的帧结束时间和第二时间延迟值定义的时刻，将所述第一声道音频信号的末尾采样复制到所述第二声道音频信号。
35.根据权利要求34所述的方法，进一步包括复制第一采样时刻与末尾采样时刻之间的任何其他第一声道音频信号帧采样。
36.根据权利要求35所述的方法，进一步包括重新采样所述第二声道音频信号以与所述第一声道音频信号同步。
37.一种计算机程序产品，配置用于执行包括以下的方法确定第一信号与第二信号之间的至少一个时间延迟；根据至少一个时间延迟从所述第二信号生成第三信号；以及组合所述第一信号和所述第三信号以生成第四信号。
38.一种计算机程序产品，配置用于执行包括以下的方法将第一信号划分为至少第一部分和第二部分；解码所述第一部分以形成第一声道音频信号；以及从根据所述第二部分修改的所述第一声道音频信号生成第二声道音频信号，其中所述第二部分包括时间延迟值；并且其中通过应用至少一个时移来生成所述第二声道音频信号取决于对所述第一声道音频信号的时间延迟值。
39.一种装置，包括处理装置，用于确定第一信号与第二信号之间的至少一个时间延迟；信号处理装置，用于根据所述至少一个时间延迟从所述第二信号生成第三信号；以及组合装置，用于组合所述第一信号和所述第三信号以生成第四信号。
40.一种装置，包括处理装置，用于将第一信号划分为至少第一部分和第二部分；解码装置，用于解码第一部分以形成第一声道音频信号；以及信号处理装置，用于从根据所述第二部分修改的所述第一声道音频信号生成第二声道音频信号，其中所述第二部分包括时间延迟值；并且其中所述信号处理装置配置用于根据对所述第一声道音频信号的时间延迟值、通过应用至少一个时移来生成所述第二声道音频信号。
全文摘要
一种装置，配置用于确定第一信号与第二信号之间的至少一个时间延迟；根据至少一个时间延迟从第二信号生成第三信号；以及将第一信号与第三信号组合以生成第四信号；将第一信号和第二信号划分为多个时间帧；针对每个时间帧确定与第一信号的时间帧的开始相关联的第一延迟以及与第一信号的时间帧的末尾相关联的第二时间延迟；在定义为开始于时间帧的开始与第一时间延迟的组合处，并且结束于时间帧的末尾与第二时间延迟的组合处的块中，从第二信号中选择至少一个采样；以及将所选择的至少一个采样伸展为等于第一帧的采样的数目。
文档编号G10L19/00GK102160113SQ200880131232
公开日2011年8月17日申请日期2008年8月11日优先权日2008年8月11日
发明者M·T·塔米, M·T·维勒莫申请人:诺基亚公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：M·T·维勒莫;M·T·塔米
技术所有人：诺基亚公司
我是此专利的发明人

上一篇：用于输送对齐的多通道音频的方法和设备的制作方法
上一篇：噪音抑制装置以及声音解码装置的制作方法