信号合成的制作方法

文档序号:2821037阅读:415来源:国知局
专利名称:信号合成的制作方法
技术领域
本发明涉及来自于一个输入信号的第一和第二输出信号的合成。
背景技术
在音频编码领域,参数音频编码器已经赢得了越来越多的注意。已经表明发送表述音频信号的(量化)参数仅需要很少的传输容量,并且它们允许在接收端解码,这将使所得到的信号与原始的信号相比在感觉上没有很大的差别。因此,通过仅传送一个音频通道以及与之组合的一个参数比特流能够获得比特率的节省,该参数比特流描述立体声信号的空间特征并且允许解码器再现立体声信号的空间特性。
上述的一个空间参数对于包括L声道和R声道的立体声信号的编码很重要,空间参数之一是L和R声道之间的通道间互相关。因此,在很多系统中,编码器所分析的一个信号参数是通道间互相关。然后确定的互相关与一个单信号一起从编码器传送到相应的解码器。
在解码端,具有期望的互相关的两个输出信号被重建。而且,期望重建仅引入相对于原始立体声信号来说较小的非自然信号。
已知多种对信号去相关的方法,例如附图1中示出了所谓的劳里德森(Lauridsen)去相关器。劳里德森去相关器包括一个全通滤波器101,例如一个延迟器,其产生并且可能削弱输入信号x的波形的延迟版本。滤波器101的输出Hx接下来被加入到输入端,产生左声道L,并且从产生右声道R的输入中减去。
只要两个输出信号非常接近,或者电平恰好相等,上述现有技术的去相关器是非常合适的。但是,参数音频编码器也将电平差应用到输出信号中,即所谓的幅度摇摆。上述的去相关涉及到如果电平很大,产生的信号的感知质量将会劣化的问题。

发明内容
上述的和其他的问题将通过一种合成来自于一个输入信号的第一和第二输出信号的方法来解决,该方法包括滤波输入信号,以产生一个滤波后的信号;获得一个表示第一和第二输出信号之间的期望相关性的相关参数;获得一个表示第一和第二输出信号之间的期望电平差的电平参数;以及通过矩阵操作将输入信号和滤波后的信号转换成第一和第二输出信号,其中矩阵操作取决于相关参数和电平参数。
因此,通过执行取决于期望的相关以及期望的电平差的矩阵操作,能够获得参数解码器的输出信号的感知质量的显著提高。
在一个优选实施例中,矩阵操作包括在输入信号和滤波后的输入信号生成的空间内将第一和第二输出信号共同旋转预定的角度;并且其中预定的角度取决于电平参数。
因此,通过在合成操作中加入一个附加的旋转,输出信号的相关电平可以被控制,而不会影响输出信号之间的互相关。
在一个进一步的优选实施例中,选择预定的角度以把输入信号对第一和第二输出信号的总的贡献最大化。已经意识到如果输出信号中存在的滤波后的信号的总量最小,并且原始信号的数量最大,信号的可感知的质量就会提高。
当该方法进一步包括将每个第一和第二输出信号按比例缩放成第一和第二输出信号之间的所述的期望电平差时,能够确保输出信号的相对电平根据编码器所确定的电平参数与期望的电平相应。
在一个优选实施例中,输入信号的滤波包括对输入信号进行全通滤波,例如一个梳状滤波器。梳状滤波器的频谱间距在频率上均匀分布。因此能够在低频获得波峰和波谷的期望的密集间距,劳里德森去相关器的延迟应当很大。但是,这在高频存在缺陷,对于瞬态的输入信号能够察觉出回波。
当全通滤波器包括一个基于频率的延迟时,这一问题能够得到解决。在高频处,使用相对较小的延迟,产生粗糙的频率分辨率。在低频处,较大的延迟产生梳状滤波器的密集间距。
可以在信号的全部带宽上执行滤波。或者,滤波可以与频带限制滤波器组合使用,从而为一个或者多个选定的频带提供去相关。
术语矩阵操作指的是将输入的多声道信号转换成输出的多声道信号,其中输出多声道信号的分量是输入的多声道信号分量的线性组合。
本发明可以通过多种方法来实现,包括上面描述的方法以及下面的编码和解码的装置,以及进一步的产品装置,每个都具有结合首先提到的方法而描述的好处和优点,并且每个都具有与首先提到的方法结合描述的优选实施例相对应的一个或者多个优选实施例,并且在从属权利要求中进行描述。
应当注意上面以及下面所描述的方法的特征可以利用软件来实现并且在一个数据处理系统或者其他的执行计算机可执行指令的处理装置中执行。该指令可以是通过计算机网络从存储媒体或者其他的计算机装载到存储器,例如RAM中的程序代码装置。此外,所描述的特征也可以利用硬件电路来代替软件来实现,或者将硬件电路与软件结合来实现。
本发明进一步涉及用于合成来自于一个输入信号的第一和第二输出信号的设备,该设备包括用于滤波输入信号以产生一个滤波信号的滤波装置;用于获得一个表示第一和第二输入信号之间的期望相关性的相关参数的装置;用于获得一个表示第一和第二输入信号之间的期望电平差的电平参数的装置;通过矩阵操作将输入信号和滤波信号转换成第一和第二输出信号的装置,其中矩阵操作取决于相关参数和电平参数。
本发明还涉及一种用于提供一个解码的音频信号的装置,该装置包括一个用于接收一个编码音频信号的输入单元;一个用于解码所编码的音频信号的解码器,该解码器包括一个用于如上和如下所述合成第一和第二音频信号的设备;以及用于提供解码的第一和第二音频信号的输出单元。
本发明还涉及一个解码的多声道信号,包括通过利用矩阵操作将输入信号和滤波信号转换成第一和第二信号分量而从输入信号合成的第一和第二信号分量,其中通过滤波输入信号而产生滤波后的信号,并且矩阵操作取决于表示第一和第二输入信号之间的期望相关性的相关参数和表示第一和第二输入信号之间的期望电平差的电平参数。
本发明还涉及存储媒体,其上存储了这样一个解码的多声道信号。


本发明的这些和其他方面将从下面参照附图进行描述的实施例中变得清楚明了,其中附图1表明了现有技术的劳里德森去相关器;附图2表明了根据本发明的一个实施例的去相关器;附图3a-c表明了根据本发明的一个实施例的信号产生;附图4示意性地表明了空间音频编码系统;以及附图5表明了传送多声道音频信号的系统的示意图。
具体实施例方式
附图2表明了根据本发明一个实施例的去相关器。该去相关器包括一个从例如一个参数音频编码器接收输入信号x的全通滤波器201,该参数音频编码器产生一个单声道音频信号x以及包括通道间互相关ρ和表示通道差c的参数在内的一组参数P。最好,全通滤波器包括一个基于频率的延迟,其在高频处提供一个比低频处相对较小的延迟。这可以通过利用包括一个Schroeder-phase合成周期(参见例如M.R.Schroeder,“低峰值参数信号和具有低自动相关的二进制序列的合成”,IEEE通信学报Inf.Theor.,1685-89,1970)的全通滤波器代替全通滤波器的固定延迟来实现。去相关器进一步包括一个分析电路202,从解码器接收空间参数并且抽取通道间互相关ρ和通道差c。电路202确定合成矩阵M(α,β),这将结合附图3a-c进行描述。合成矩阵的分量被传送到转换电路203,其进一步接收输入信号x和滤波后的信号Hx。电路203根据下式执行合成操作从而产生输出信号L和R。
LR=M(α,β)·xH⊗x---(1)]]>附图3a-c表明了根据本发明的一个实施例的信号产生。在附图3a中,输入信号x利用水平轴表示,而滤波后的信号Hx利用垂直轴表示。由于两个信号不相关,它们可以表示为构成一个二维空间的正交矢量。
输出信号L和R分别用矢量301和302表示。在该表示法中,根据ρ=cos(α),即矢量301和302之间的角距离α,通过矢量301和302之间的角度α给出信号L和R之间的相关性。结果,展现出正确的角距离的任何矢量对都具有特定的相关性。
因此,利用预定的相关性ρ将信号x和Hx转换成信号L和R的合成矩阵M可以表示为M=cos(α/2)sin(α/2)cos(-α/2)sin(-α/2)---(2)]]>这样,全通滤波信号的总量就取决于期望的相关性。而且,全通信号分量的能量在两个输出声道中都相同(但是相位偏移180度)。
应当注意附图1所示的劳里德森去相关器相应于矩阵M利用下式给出的情况M=2·111-1---(3)]]>即α=90°,相应于不相关的输出信号(ρ=0)。
为了表示等式(3)所表示的矩阵的问题,我们假设幅度向左声道摇摆的极端情况,即特定的信号仅出现在左声道的情况。我们还假定输出之间的期望相关为零。在这种情况下,具有等式(3)的合成矩阵的等式(1)的转换的左声道输出产生L=1/2(x+H⊗x).]]>这样,输出包括原始信号x以及其全通滤波后的版本Hx。
但是,这是一个不期望的情况,因为全通滤波通常会劣化信号的感知质量。而且,原始信号与滤波后的信号的相加将产生梳状滤波效果,例如输出信号的可感知的着色。在这种假设的极端情况下,最好的解决方式是左输出信号由输入信号构成。这样,两个输出信号之间的相关性仍然为零。
在具有多个适中的电平差的情况下,最好的情况是更高的输出通道包含相对较多的原始信号,更轻柔的输出通道包括相对较多的滤波后的信号。因此,通常,最好使出现在两个输出端的原始信号的数量最大,并且使滤波后的信号的数量最小。
根据本发明,这通过引入包括附加共同旋转的一个不同合成矩阵来实现M=C·cos(β+α/2)sin(β+α/2)cos(β-α/2)sin(β-α/2)---(4)]]>
这里β是附加旋转,C是保证输出信号之间的相对电平差等于c的缩放矩阵,即C=c1+c0011+c]]>在等式(1)中插入等式(4)所示的矩阵可以获得根据本发明由矩阵操作所产生的输出信号LR=c1+c0011+c·cos(β+α/2)sin(β+α/2)cos(β-α/2)sin(β-α/2)·xH⊗x]]>这种情况在附图3b中表示。输出信号L和R仍然具有角度差α,即信号L和R之间的相关性不会根据期望的电平差以及L和R信号角度β的附加旋转而受到信号L和R的缩放的影响。
如上所述,最好,L和R的总的输出中的原始信号x的总量应当被最大化。该条件可以用于根据下式确定角度β∂(L+R)∂x=0]]>其得到了条件tan(β)=1-c1+c·tan(α/2)]]>这种情况在附图3c中表示,其中L和R分量的总和与x的方向排成一行。
附图4示意性的表明了空间音频编码的系统。该系统包括一个编码器401以及一个相应的解码器405。编码器401通过指定耳间(interaural)电平差,耳间时间(或者相位)差,以及作为时间和频率函数的最大相关性来描述多声道音频信号的空间特性,如2002年4月22日提交的欧洲专利申请02076588.9所述。编码器401接收立体声信号的L和R成分作为输入。起初,通过时间/频率切分电路402和403分别将L和R成分分成几个时间/频率间隙,例如通过转换操作之后的时间窗处理。
在一个实施例中,左和右输入信号被分成几个时间帧(例如以44.1kHz采样频率采样的2048个样本)和具有平方跟汉明窗的窗。接下来,计算FFT。负的FFT频率被舍弃,并且产生的FFT被分成FFT频段(bin)的组(子带)。合并到一个子带中的FFT频段的数目取决于频率高频处比低频处组合更多的频段。例如,相应于大约1.8ERB(等价矩形带宽)的FFT频段可以组成一组,产生例如20个子带,来表示整个听得见的频率范围。
接下来,在分析电路404中,对于每个时间/频率间隙,分析输入信号的下述特性耳间电平差,或者ILD,由来自于两个输入的相应的带宽限制信号的相对电平定义,耳间时间(或相位)差(ITD或者IPD),由相应于耳间互相关函数的峰值的耳间延迟(或者相位偏移)定义,以及不能由ITD或者ILD说明的波形的相似性(或不一致性),其能够由互相关函数的最大值(即在最大峰值处位置处的互相关函数的值)来确定参数。
上述的三种参数都随时间变化;但是,由于已知立体声听觉系统在处理中非常缓慢,这些特性的更新速度是非常低的(通常是几十毫秒)。
分析电路404进一步产生一个包括左右信号的组合的和(或者占优势的)信号S。因此,左右信号被编码为和信号S和作为频率和时间的函数的一组参数P,参数P包括ILD,ITD/IPD,以及互相关函数的最大值。
应当注意在本实施例中参数ILD涉及附图2所示的实施例中的通道差参数c,ILD=k·log(c),其中k是一个常数,即ILD与c的对数成正比。
在一个实施例中,为每个子带计算相应的ILD,ITD以及相关性ρ。通过将属于其他组的所有FFT频段设置为零,将左右声道产生的(带宽受限)FFT相乘,接下来进行反FFT变换来简单的计算ITD和相关性。在-64和+63个抽样的通道间延迟内扫描产生的互相关函数的峰值。与该峰值相应的内延迟被用作ITD值,在该峰值处的互相关函数的值被用作该子带的耳间相关。最后,通过取每个子带的左右声道的功率比来简便的计算ILD。
和信号S可以通过在相位校正(时间排列)之后将左右子带相加来产生。该相位校正发生在为该子带计算ITD之后,并且包括延迟左通道子带ITD/2,延迟右通道子带-ITD/2。延迟可以在频域通过合适的修改每个FFT频段的相位角度来执行。接下来,通过将左右子带信号的相位修改版本相加来计算和信号。最后,为了补偿未校正的或者已校正的相加,和信号的每个子带都与sqrt(2/(1+ρ))相乘,其中ρ是相应的子带的相关性。如果需要,可以通过(1)在负频率处插入复共轭,(2)反FFT,(3)加窗,以及(4)叠加将和信号转换到时间域。
最好,为了它们的传输要量化空间参数从而降低所需的比特率。
和信号S和参数P都传送到解码器405。解码器405包括一个去相关电路406,其按照结合附图2所述的方式修改左右信号之间的相关性。解码器进一步包括延迟电路407和408,根据该子带给定(量化的)ITD,其分别将左信号的每个子带延迟-ITD/2,将右信号的每个子带延迟ITD/2。解码器进一步包括电路409,其根据该子带的IID缩放该子带,并且例如通过下面的步骤(1)在负频率处插入复共轭,(2)反FFT,(3)加窗,以及(4)叠加将输出信号转换到时间域。
附图5表明了根据本发明的一个实施例的用于传送立体声音频信号的系统的示意图。该系统包括一个编码设备501,用于产生一个编码的音频信号以及一个解码设备505,用于将接收到的编码信号解码为一个立体声信号。编码设备501和解码设备505可以是任何电子设备或者此类电子设备的一部分。
这里,术语电子设备包括计算机,例如固定以及便携式PC,固定以及便携式无线通信设备和其他手持或者便携式设备,例如移动电话,寻呼机,音频播放器,多媒体播放器,发报机,即电子组织者,智能电话,个人数字助理(PDA),手持计算机等。应当注意编码设备501和解码设备可以组合在一个电子设备当中,其中音频信号存储在一个计算机可读的介质上用于以后再生。
编码设备501包括一个输入单元511用于接收一个立体声信号,一个编码器502用于编码包括左信号成分L和右信号成分R的立体声音频信号。编码器502通过输入单元511接收两个信号成分并产生编码的信号T。立体声信号可以来自于一组麦克风,例如,通过一个诸如混合设备等的电子设备。可以进一步从其它的音频播放器的输出端,通过无线信号的电波,或者任何其他合适的装置接收信号。这样的编码器的一个例子在上面结合附图4进行了描述。
根据一个实施例,编码器502连接到发射机503用于通过通信信道509向解码设备505发射编码的信号T。发射机503还包括适于例如通过有线或者无线数据链路509进行数据通信的电路。这样发射机的例子包括一个网络接口,一个网卡,一个无线发射机,一个用于其他合适的电磁信号的发射机,例如用于通过一个IrDa端口发射红外线的LED,通过蓝牙无线电收发机进行无线通信的设备,等。合适的发射机的进一步的例子包括一个线缆调制解调器,一个电话调制解调器,一个集成服务数字网络(ISDN)适配器,一个数字用户线(DSL)适配器,一个卫星收发机,一个以太网适配器,等。相应的,通信信道509可以是任何合适的有线或者无线数据链路,例如,基于包的通信网络,例如互联网或者其他的TCP/IP网络,小范围通信链路,例如红外链路,蓝牙连接或者其他的基于无线的链接。
通信信道的进一步的例子包括计算机网络和无线电通讯网络,例如峰窝数字分组数据(CDPD)网,全球移动通信系统(GSM)网,码分多址(CDMA)网络,时分多址(TDMA)网络,通用分组无线电业务(GPRS)网络,第三代通信网络,例如UMTS网络等。
可选择的或者附加的,编码设备可以包括一个或者多个其他接口504,用于将编码的立体声信号T传送到解码设备505。这样接口的例子包括一个用于在计算机可读介质510上存储数据的盘驱动器,例如一个软盘驱动器,一个读/写CD-ROM驱动器,一个DVD驱动器等。其他的例子包括一个存储器卡的插槽,一个磁卡读/写器,一个用于访问智能卡的接口等。
相应的,解码设备505包括一个相应的接收机508,用于接收发射机发射的信号,和/或其他的接口506,用于接收通过接口504和计算机可读介质510传送的编码立体声信号。解码设备进一步包括一个解码器507,其接收接收到的信号T并且将其解码为解码的立体声信号的相应的成分L’和R’。根据本发明的这样解码器的一个优选实施例在上面结合附图4进行了描述。解码设备进一步包括一个输出单元512,用于输出解码的信号,解码信号接下来被传送到音频播放器,用于通过一组扬声器等再生。
应当注意上述的装置可以利用通用或者专用可编程的微处理器,数字信号处理器(DSP),专用集成电路(ASIC),可编程逻辑阵列(PLA),现场可编程门阵列(FPGA),专用目的电子电路,等或者它们的组合来实现。
应用注意上述的实施例仅是为了说明本发明,而不是对本发明进行限制,本领域的技术人员在不背离附加权利要求的范围内可以做出多种变形实施例。
例如,本发明不局限于立体声信号,也可以适用于其他的具有两个或者多个输入声道的多声道输入信号。这样多声道信号的例子包括从一个数字通用盘(DVD)或者一个超级音频小型盘等接收的信号。
在权利要求中,括号内的任何参考符号都不应视为对本发明的限制。词语“包括”并不排除权利要求中没有列出的元件或者步骤的出现。词语“一个”不排除多个这样元件的出现。
本发明可以通过包括几个分离元件的硬件来实现,可以通过合适编程的计算机来实现。在设备权利要求中列举的几个装置中,几个这样的装置可以在一个相同的硬件中实现。在多个不同的从属权利要求中引用特定步骤的事实并不表示不能够使用这些步骤的组合。
权利要求
1.一种合成来自于输入信号的第一和第二输出信号的方法,该方法包括步骤滤波输入信号,以产生一个滤波后的信号;获得一个表示第一和第二输出信号之间的期望的相关性的相关参数;获得一个表示第一和第二输出信号之间的期望电平差的电平参数;以及通过矩阵操作将输入信号和滤波后的信号转换成第一和第二输出信号,其中矩阵操作取决于相关参数和电平参数。
2.根据权利要求1所述的一种方法,其中矩阵操作包括在由输入信号和滤波后的输入信号构成的空间内将第一和第二输出信号公共旋转一个预定的角度;并且预定的角度取决于电平参数。
3.根据权利要求2所述的一种方法,其中选择预定角度使输入信号对第一和第二输出信号的总的贡献最大。
4.根据权利要求1所述的一种方法,进一步包括将每个第一和第二输出信号按比例缩放成第一和第二输出信号之间的所述的期望的电平差。
5.根据权利要求1所述的一种方法,其中输入信号的滤波包括对输入信号进行全通滤波。
6.根据权利要求5所述的一种方法,其中全通滤波包括一个基于频率的延迟。
7.一种用于合成来自于输入信号的第一和第二输出信号的设备,该设备,包括用于滤波输入信号以产生一个滤波后的信号的滤波装置;用于获得一个表示第一和第二输出信号之间的期望相关性的相关参数的装置;用于获得一个表示第一和第二输出信号之间的期望的电平差的电平参数的装置;用于通过矩阵操作将输入信号和滤波后的信号转换成第一和第二输出信号的装置,其中矩阵操作取决于相关参数和电平参数。
8.一种用于提供一个解码的音频信号的装置,该装置包括一个输入单元,用于接收一个编码的音频信号;一个解码器,用于解码编码的音频信号,该解码器包括一个用于根据权利要求7来合成第一和第二音频信号的设备;以及一个输出单元,用于提供解码的第一和第二音频信号。
9.一种解码的多声道信号,包括通过利用矩阵操作将输入信号和滤波后的信号转换成第一和第二信号成分而从输入信号合成的第一和第二信号成分,其中滤波所述输入信号来产生滤波后的信号,并且矩阵操作取决于表示第一和第二输出信号之间的期望相关性的相关参数和表示第一和第二输出信号之间的期望的电平差的电平参数。
10.一种其上存储了权利要求9所述的解码的多声道信号的存储介质。
全文摘要
一种合成来自于输入信号(x)的第一(L)和第二(R)输出信号的方法。该方法包括滤波(201)输入信号以产生一个滤波后的信号;获得一个表示第一和第二输出信号之间的期望相关性的相关参数;获得一个表示第一和第二输入信号之间的期望电平差的电平参数(c);以及通过矩阵操作(203)将输入信号和滤波后的信号转换成第一和第二输出信号,其中矩阵操作取决于相关参数和电平参数。
文档编号G10L19/24GK1647157SQ03808978
公开日2005年7月27日 申请日期2003年4月22日 优先权日2002年4月22日
发明者D·J·布里巴亚尔特 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1