音频信号带宽扩展的制作方法

文档序号：2819681阅读：474来源：国知局

专利名称：音频信号带宽扩展的制作方法
技术领域：
本发明涉及一种用于从窄带音频信号产生宽带音频信号的带宽扩展器，其中窄带音频信号具有一第一带宽，宽带音频信号具有一第二带宽，其中第二带宽大于第一带宽，其中带宽扩展器包括用于接收窄带音频信号的输入端和用于提供宽带音频信号的输出端，其中带宽扩展器还包括与输入端耦合的频谱折叠(spectral folding)装置，其中频谱折叠装置用于通过对窄带音频信号的至少一部分进行频谱折叠来产生频谱折叠后的音频信号。
本发明还涉及一种接收器，用于通过传输信道来接收窄带音频信号，该接收器包括一用于从窄带音频信号产生宽带音频信号的带宽扩展器，还涉及一种接收窄带音频信号的方法，以及用于从窄带音频信号产生宽带信号的方法。
2001年5月8-11日在尤他州盐湖城举行的2001 IEEE国际声学、语音学以及信号处理论坛纪要中，由S.Chennoukh，A.Gerrits，G.Miet以及R.Sluihter所作的论文“通过利用线频谱频率的频率带宽扩展来提高语音”描述了一种带宽扩展器，该带宽扩展器可以例如用于音频信号，该音频信号可以是从传输介质例如广播频道、同轴电缆或光纤中接收到的如语音信号或音乐信号等。其他可能的应用还有自动应答机、录音机、(移动)电话、MP3播放器和语音书。
在目前电话网络中使用的窄带语音的带宽为3100Hz(300-3400Hz)。如果带宽增加到大约7kHz(50-7000Hz)，则语音声音会更加自然。具有这种带宽的语音被称为宽带语音，它具有附加的低带宽(50-300Hz)和高带宽(3400-7000Hz)。从该窄带语音信号，可以通过外插法产生一高带宽和一低带宽。所产生的语音信号被称为伪宽带语音信号。目前已知多种用于扩展窄带信号的带宽的技术，例如1999年6月20-23日于芬兰举行的IEEE语音编码专题研讨会中的论文“用于编码后窄带语音的带宽增加的新技术”。这些技术用于在不改变网络的前提下，提高窄带网络例如电话网络中的语音质量。在接收侧(例如移动电话或电话应答机)，可以将窄带语音扩展为伪宽带语音。
图5示出了在公知传输系统中使用的带宽扩展器18的方块图。首先利用上采样器60将输入的窄带语音信号成对地上采样(即，在输入的窄带语音信号的连续采样之间插入零)，该输入的窄带语音信号是以8kHz进行采样，且它被提供到带宽扩展器18的输入端20上。以16kHz对所获得的上采样后信号61进行采样。该上采样后信号61在低带宽即0-4kHz范围内的频谱与输入信号和它的折叠后变型在高带宽即4-8kHz范围内的频谱相同。然后为了恢复与输入信号相同但以16kHz采样的频谱特性，在低通滤波器62对信号61进行低通滤波，从而去除折叠后变型。将低通滤波后信号63提供到LPC综合型滤波器70以及下采样器64。
下采样器64对低通滤波后信号63成对地进行下采样。然后，利用LPC综合型滤波器66使用自回归LPC模型对产生的下采样后信号65(以8kHz进行采样)进行模仿(modeled)。该LPC综合型滤波器66从下采样后信号65得到LPC系数67。这些LPC系数67代表输入的窄带语音信号的频谱。然后，包络扩展器68使用窄带LPC系数67来扩展窄带信号的频谱包络并得到宽带LPC系数69。这种频谱包络的扩展是通过将低频带线性频谱频率(LSF)映射为宽带LSF而执行的。通过一组映射矩阵来执行这种映射。
然后，利用扩展后LPC综合型滤波器70根据宽带LPC系数69来分析该低通滤波器62的输出信号63。然后在频谱折叠装置30中对分析剩余量71成对地进行下采样和上采样(即每隔一个采样就置零)，该分析剩余量具有平坦的频谱。连续的下采样和上采样可以实现频谱折叠。所产生的频谱折叠后信号73是稀疏的(sparse)信号，为了获得宽带语音信号，它可用于激励宽带综合型滤波器72，该宽带语音信号将被提供到宽带扩展器18的输出端22。宽带综合型滤波器72根据宽带LPC系数69来操作，它是综合型滤波器70的逆向滤波器。
现有宽带扩展器18的缺点是输入的窄带信号的频谱折叠将引入谐波位移(即高频带的谐波分量并不是精确的位于它们应当处于的频率上)，这种谐波位移将导致再现时产生噪声或金属类声音。这些谐波位移的产生是由于当使用谐波采样时高频带的谐波分量是仅有的与低频带信号的谐波分量相关的谐波(通常不是这种情况)。
本发明的一个目的是提供一种可以避免上述缺点的带宽扩展器。本发明目的的实现是通过使该带宽扩展器还包括一噪声整形器，它根据频谱折叠后音频信号的至少一部分对噪声信号整形从而产生整形后的噪声信号，其中带宽扩展器还包括一合并器，该合并器用于将整形后噪声信号和频谱折叠后音频信号合并为宽带音频信号。已经发现可以通过将频谱折叠后音频信号与整形后噪声信号合并，来有效地掩盖(masked)该频谱折叠后音频信号的谐波位移。随着谐波位移被掩盖，当再现宽带音频信号时，就不会再出现不希望的噪声/金属类声音。
可以通过根据(至少一部分)频谱折叠后音频信号的属性，例如根据频谱折叠后音频信号的幅度或相位来对(白)噪声信号进行整形，产生整形后噪声信号。最好地，按照频谱折叠后音频信号的至少一部分的包络(例如时间包络)的比例，来对噪声信号整形。监听试验已经表明这种整形后噪声信号和频谱折叠后音频信号的合并可以产生非常好质量的宽带音频信号。
这种根据频谱折叠后音频信号的包络而整形的整形后噪声最好通过噪声整形器来产生，该噪声整形器包括一包络分离器，该包络分离器(envelope extractor)用于从频谱折叠后音频信号中分离出一包络信号，其中噪声整形器还包括一混频器，用于通过将噪声信号与包络信号混频而产生该整形后噪声信号。
包络分离器最好包括一Hibert变换器，该Hibert变换器可包括级联的下述部分傅立叶变换器，用于将频谱折叠后信号的时域表示转换为它的频域表示；用于将频域表示的负频率调零的装置；一逆傅立叶变换器，用于将调零后的频域表示变换为其时域表示；以及一整流器，用于通过对调零后的时域表示进行整流来产生包络信号。
本发明由独立权利要求进行限定。从属权利要求限定了最佳实施例。
从下面参照附图的最佳实施例描述中可以更清楚地看到本发明的目的和特征，附图如下

图1示出包括具有本发明带宽扩展器18的接收器14的传输系统10的实施例的方块图；图2示出根据本发明的带宽扩展器18的实施例的方块图；图3示出根据本发明在传输系统10中使用的噪声整形器32的实施例的方块图；图4示出在根据本发明的传输系统10中使用的包络分离器/Hilbert变换器40的实施例的方块图；图5示出现有技术带宽扩展器18的方块图；图6示出图5的带宽扩展器18的部分74的方块图，该部分74在本发明中被采用；在这些附图中，相同的部分具有相同的附图标记。
图1示出根据本发明的传输系统10的一实施例的方决图。传输系统10包括一发射器12，该发射器12用于通过传输信道16向接收器14发送窄带音频信号，例如窄带语音信号或窄带音乐信号。传输系统10可以是一电话通信系统，其中发射器可以是(移动)电话，接收器可以是(移动)电话或应答机。接收器14包括用于根据窄带音频信号产生宽带音频信号的带宽扩展器18。窄带音频信号的带宽小于宽带音频信号的带宽。带宽扩展器18包括一输入端20和一输出端22，该输入端20用于接收窄带音频信号，输出端22用于向接收器14的附加信号处理部分(未示出)提供宽带音频信号，该附加信号处理部分用于对宽带音频信号进行放大、再现和/或存储。
图2示出根据本发明的带宽扩展器18的一实施例的方块图，其中带宽扩展器18可用于本发明的传输系统10中。带宽扩展器18包括输入端20、频谱折叠装置30、噪声整形器32、合并器34和输出端22。频谱折叠装置30设置成与输入端20耦合，从而可以将通过输入端20接收到的窄带音频信号提供到频谱折叠装置30。频谱折叠装置30用于通过对窄带音频信号的至少一部分进行频谱折叠来产生频谱折叠后音频信号33。频谱折叠装置30将频谱扩展后音频信号33提供给噪声整形器32和合并器34。噪声整形器32设置成用于根据频谱折叠后音频信号33的至少一部分，通过对(白)噪声信号31进行整形来产生整形后噪声信号35。噪声整形器32向合并器34提供整形后噪声信号35。合并器34用于将整形后噪声信号35和频谱折叠后音频信号33合并为宽带音频信号。宽带音频信号的带宽大于窄带音频信号的带宽。最后，带宽音频信号被提供给输出端22。
最佳地，噪声整形器32用于按照频谱折叠后音频信号33的至少一部分的包络成比例地对噪声信号21进行整形，产生整形后噪声信号35。这种噪声整形器32如图3所示。图3示出在本发明传输系统10中使用的噪声整形器32的实施例的方块图。噪声整形器32包括一包络分离器40和一混频器42。包络分离器40用于从频谱折叠后音频信号33中分离出包络信号41并向混频器42提供该包络信号41。该混频器42用于通过将该噪声信号31与包络信号41相乘来产生整形后噪声信号35。
图4示出在本发明接收器14中使用的包络分离器/Hilbert变换器40的一实施例的方块图。包络分离器40最好包括一Hilbert变换器40。该Hilbert变换器40包括级联的快速傅立叶变换器50、调零单元52、逆快速傅立叶变换器54和整流器56。快速傅立叶变换器50将频谱折叠后信号33的时域表示变换为它的频域表示51。该调零单元52用于将该频域表示51的负频率调零。逆傅立叶变换器54用于将调零后频域表示53变换为其时域表示55。整流器56用于通过对调零后时域表示55进行整流(即，取其绝对值)来产生包络信号41。
频谱折叠后音频信号33的频域表示51是复数信号。实部信号可以由具有不同相位、幅度和频率的正弦曲线的总和来表示。快速傅立叶变换(FFT)是多个复数e幂的总和。由于正弦可以被描述为两个e幂的和，其中一个e幂具有正频率，另一个具有负频率，FFT频谱相对于零(DC)对称。通过在调零装置52中去除负频率，可以产生复数信号(解析信号)的频谱，它是多个独立的e幂的总和。当从该解析信号的IFFT得到绝对值时(即通过整流器56)，可以得到原始输入信号的时域包络(由于复数e幂的绝对值等于一)。
图5示出2001年5月8-11日在尤他州盐湖城举行的2001 IEEE国际声学、语音学以及信号处理论坛纪要中，由S.Chennoukh，A.Gerrits，G.Miet以及R.Sluihter所作的论文“通过利用线频谱频率的频率带宽扩展来提高语音”中描述的现有技术带宽扩展器18的方块图。首先利用上采样器60将输入的窄带语音信号成对地上采样(即，在连续采样之间插入零)，输入的窄带语音信号是以8kHz进行采样，且它被提供到带宽扩展器18的输入端20上。以16kHz对所获得的上采样后信号61进行采样。该上采样后信号61在低带宽即0-4kHz范围内的频谱与输入信号和它的折叠后变型在高带宽即4-8kHz范围内的频谱相同。然后为了恢复与输入信号相同但以16kHz采样的频谱特性，在低通滤波器62对信号61进行低通滤波，从而去除折叠后变型。将低通滤波后信号63提供到LPC综合型滤波器70以及下采样器64。
下采样器64对低通滤波后信号63成对地进行下采样。然后，利用LPC综合型滤波器66使用自回归LPC模型对产生的下采样后信号65(以8kHz进行采样)进行模仿(modeled)。该LPC综合型滤波器66从下采样后信号65得到LPC系数67。这些LPC系数67代表输入的窄带语音信号的频谱。然后，包络扩展器68使用窄带LPC系数67来扩展窄带信号的频谱包络并得到宽带LPC系数69。这种频谱包络的扩展是通过将低频带线性频谱频率(LSF)映射为宽带LSF而执行的。通过一组映射矩阵来执行这种映射。
然后，利用扩展后LPC综合型滤波器70根据宽带LPC系数69来分析该低通滤波器62的输出信号63。然后在频谱折叠装置30中对分析剩余量71成对地连续进行下采样和上采样(即每隔一个采样就置零)，该分析剩余量具有平坦的频谱。连续的下采样和上采样可以实现频谱折叠。所产生的频谱折叠后信号73是稀疏的信号，为了获得宽带语音信号，它可用于激励宽带综合型滤波器72，该宽带语音信号将被提供到宽带扩展器18的输出端22。宽带综合型滤波器72根据宽带LPC系数69来操作，它是综合型滤波器70的逆向滤波器。
图6示出图5的带宽扩展器18的部分74的方块图，该部分74采用本发明的原理。除了如图5所示的部分74，图6所示的部分74包括噪声整形器32、合并器86、88和多个增益级80、82、84和92。该噪声整形器32包括一包络分离器40、一混频器42和一带通滤波器90。合并器86相当于图2中的合并器34。
如果增益级92的增益系数a被设为0，增益级84的增益系数b被设为2，增益级80的增益系数c被设为0，则可以由图6所示的部分74来描述图5所示的带宽扩展器18的部分74。请注意，在图5中没有示出增益级84。
频谱折叠后信号73包括低频带信号分量和高频带信号分量。当仅仅频谱折叠后信号73的高频带部分受到谐波位移是，不必分离低频带部分的包络。因此，可以利用增益级82和合并器88来从频谱折叠后信号73中去除低频带信号分量。频谱折叠后信号73的幅度等于分析剩余信号71的幅度的一半(由于频谱折叠器30的属性，该频谱折叠器30包括成对下采样器和成对上采样器的级联)。通过增益级82，分析剩余信号71被衰减并被反向，该增益级82向分析剩余信号71提供-0.5的增益系数。然后，利用合并器88使所产生的衰减后分析剩余信号73与频谱折叠后信号73相加，从而从频谱折叠后信号73中去除低频带信号部分。所产生的合并后信号85仅包括高频带信号部分，并被提供给包络分离器40(与图3中的信号33相似)。
包络分离器40从信号85中分离出包络信号87并将信号87提供给混频器42。混频器42通过将带宽滤波后噪声信号89与包络信号87相乘来产生整形后噪声信号91(与图3中的信号35相似)。通过利用带通滤波器90过滤(白)噪声信号31来获得带通滤波后噪声信号89，该带通滤波器90仅允许噪声信号31的高频带分量通过。
增益级92对整形后噪声信号91进行放大/衰减，所产生的信号93被提供给合并器86。增益级84对频谱折叠后信号73进行放大/衰减，所产生的信号95也被提供给合并器86。另外，增益级80对分析剩余信号71进行放大/衰减，所产生的信号也被提供给合并器86。合并器86通过将信号93、95和81相加为合成后信号97来合并这些信号，该合并后信号97被提供给宽带合成滤波器72。
为了使宽带合成滤波器72能够恢复低频带宽，增益铝b和c必须满足下述关系0.5b+c＝1(这些低频带信号100％相关，且幅度可以累计)。对于高频带宽，增益系数a和b必须满足下述关系(a/2)2+(b/2)2＝1即a2+b2＝4(这是因为这些信号彼此不相关，因此只能累计能量)。当例如a=b=2]]>时，c=1-21/2≈0.3.]]>但是可以进行调节从而提供比所计算出的结果更好的合并。利用下面的设定a＝1.2，b＝1.1和c＝0.45可以得到满意的结果。
可以通过数字硬件或由数字信号处理器或通用微处理器执行的软件来实现带宽扩展器18。
本发明的范围并不局限于示例性分开的实施例。本发明具体体现在每一新的特征和这些特征的组合。任何附图标记都不对权利要求的范围进行限定。词语“包括”并不排除除权利要求中所列之外的其他元件或步骤的存在。元件前使用的词汇“一个”并不排除多个这种元件出现的可能。可以利用包括多个分离元件的硬件或适当编程的计算机来实现本发明。在列举多个装置的装置权利要求中，这些装置中的多个都可以由一个或硬件相同项目来实现。
权利要求
1.一种用于从窄带音频信号产生宽带音频信号的带宽扩展器(18)，其中窄带音频信号具有第一带宽，宽带音频信号具有第二带宽，第二带宽大于第一带宽，其中带宽扩展器(18)包括一用于接收窄带音频信号的输入端(20)和一用于提供宽带音频信号的输出端(22)，其中带宽扩展器(18)还包括与输入端(20)耦合的频谱折叠装置(30)，其中频谱折叠装置(30)设置成用于通过对窄带音频信号的至少一部分进行频谱折叠来产生频谱折叠后的音频信号(33)，其特征在于该带宽扩展器(18)包括一噪声整形器(32)，它通过根据频谱折叠后音频信号(33)的至少一部分对噪声信号(31)整形从而产生整形后的噪声信号(35)，其中带宽扩展器(18)还包括一合并器(42)，该合并器(42)用于将整形后噪声信号(35)和频谱折叠后音频信号(33)合并为宽带音频信号。
2.如权利要求1所述的带宽扩展器(18)，其特征在于噪声整形器(32)设置成用于按照频谱折叠后音频信号(33)的至少一部分的包络成比例地对噪声信号(31)整形，从而产生整形后噪声信号(35)。
3.如权利要求2所述的带宽扩展器(18)，其特征在于噪声整形器(32)包括一包络分离器(40)，该包络分离器(40)用于从频谱折叠后音频信号(33)中分离出一包络信号(41)，其中噪声整形器(32)还包括一混频器(42)，该混频器(42)用于通过将噪声信号(31)与包络信号(41)混频而产生该整形后噪声信号(35)。
4.如权利要求3所述的带宽扩展器(18)，其特征在于包络分离器(40)包括一Hibert变换器。
5.如权利要求4所述的带宽扩展器(18)，其特征在于该Hibert变换器包括级联的下述部分傅立叶变换器(50)，用于将频谱折叠后信号(33)的时域表示转换为它的频域表示(51)；用于将频域表示(51)的负频率调零的装置(52)；一逆傅立叶变换器(54)，用于将调零后的频域表示(53)变换为其时域表示(55)；以及一整流器(56)，用于通过对调零后的时域表示(55)进行整流来产生包络信号(41)。
6.一种用于从传输信道(16)接收窄带音频信号的接收器(14)，其中接收器(14)包括如权利要求1所述的带宽扩展器(18)。
7.一种用于从窄带音频信号产生宽带音频信号的方法，其中窄带音频信号具有第一带宽，宽带音频信号具有第二带宽，第二带宽大于第一带宽，该方法包括-通过对窄带音频信号的至少一部分进行频谱折叠来产生频谱折叠后的音频信号(33)，其特征在于该方法还包括-通过根据频谱折叠后音频信号(33)的至少一部分对噪声信号(31)整形从而产生整形后的噪声信号(35)，-将整形后噪声信号(35)和频谱折叠后音频信号(33)合并为宽带音频信号。
8.如权利要求7所述的从窄带音频信号产生宽带音频信号的方法，其特征在于按照频谱折叠后音频信号(33)的至少一部分的包络成比例地对噪声信号(31)整形，从而产生整形后噪声信号(35)。
9.如权利要求8所述的从窄带音频信号产生宽带音频信号的方法，其特征在于该方法还包括-从频谱折叠后音频信号(33)中分离出一包络信号(41)，-通过将噪声信号(31)与包络信号(41)混频而产生该整形后噪声信号(35)。
全文摘要
描述了一种传输系统，该传输系统包括用于通过传输信道向接收机发送窄带音频信号的发射器。该接收机包括用于从窄带音频信号产生宽带音频信号的带宽扩展器(18)。带宽扩展器(18)包括频谱折叠装置(30)，该频谱折叠装置(30)用于通过对窄带音频信号的至少一部分进行频谱折叠来产生频谱折叠后音频信号(33)。本发明的传输系统特征在于带宽扩展器(18)包括噪声整形器(32)，该噪声整形器(32)用于通过根据频谱折叠后音频信号(33)的至少一部分对噪声信号(31)进行整形来产生整形后噪声信号(35)，其中带宽扩展器(18)还包括一合并器(34)，该合并器用于将整形后噪声信号(35)和频谱折叠后音频信号(33)合并为宽带音频信号。这样就可以通过将整形后噪声信号(35)与频谱折叠后信号(33)合并来屏蔽由频谱折叠引入的金属声音。
文档编号G10L21/02GK1589469SQ02823280
公开日2005年3月2日申请日期2002年10月30日优先权日2001年11月23日
发明者J·斯米特斯, S·L·J·D·E·范德帕申请人:皇家飞利浦电子股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：J.斯米特斯;S.L.J.D.E.范德帕
技术所有人：皇家飞利浦电子股份有限公司
我是此专利的发明人

上一篇：用于极端气候条件的超声波换能器的制作方法
上一篇：感觉噪声替换的制作方法