带宽扩展的方法和设备的制作方法

文档序号:2825615阅读:275来源:国知局
带宽扩展的方法和设备的制作方法
【专利摘要】本发明提供了一种扩展语音或音频信号的信号带宽的方法和设备。该带宽扩展方法包括步骤:通过使输入信号经受MDCT(修正的离散余弦变换来产生第一变换信号;基于第一变换信号来产生第二变换信号和第三变换信号;从第一变换信号、第二变换信号和第三变换信号来产生相应正常分量和能量分量;从相应正常分量产生扩展的正常分量,以及从相应能量分量产生扩展的能量分量;基于扩展的正常分量和扩展的能量分量来产生扩展的变换信号;以及使扩展的变换信号经受IMDCT(逆MDCT)。
【专利说明】带宽扩展的方法和设备
【技术领域】
[0001]本发明涉及一种语音信号的编码和解码,并且更具体而言,涉及信号带变换技术。 【背景技术】
[0002]随着无所不在的时代的出现,对基于其上的高质量语音和音频服务的需要已经增 长得越来越多。为了满足增长需求,存在对有效语音和/或音频编解码器的需要。
[0003]随着网络的进步,为语音和音频服务提供的带宽已经扩展,并且已经考虑以高比 特速率提供高质量音频、以及以低比特速率提供语音或者中等质量或者低质量音频的可缩 放的语音和音频编码/解码方法。
[0004]在可缩放的编码/解码中,通过可变地提供带宽以及比特速率,服务的质量可以 改善,并且编码/解码效率可以提高。例如,当输入信号是SWB信号时,通过从超宽带(SWB) 信号再现宽带(WB)信号,或者当输入信号是WB信号时,从WB信号再现SWB信号。
[0005]因此,已经研究了从WB信号产生SWB信号的方法。

【发明内容】

[0006]技术问题
[0007]本发明的技术目的是在音频/语音信号的编码和解码中提供有效的带宽扩展方 法和设备。
[0008]本发明的另一技术目的是在音频/语音信号的编码和解码中提供基于WB信号重 建SWB信号的方法和设备。
[0009]本发明的另一个技术目的是在音频/语音信号的编码和解码中在没有从编码级 传输附加信息的情况下在解码级中提供扩展带的方法和设备。
[0010]本发明的另一个技术目的是在音频/语音信号的编码和解码中在不考虑处理带 中的增长的情况下提供不导致性能退化的带宽扩展方法和设备。
[0011]本发明的另一个技术目的是在音频/语音信号的编码和解码中提供在低带和扩 展的较高带之间的边界处能够有效地防止噪声出现的带宽扩展方法和设备。
[0012]技术的解决方案
[0013]按照本发明的方面,提供了一种带宽扩展方法,包括步骤:对输入信号执行修正 的离散余弦变换(MDCT)过程以产生第一变换信号;基于第一变换信号来产生第二变换 信号和第三变换信号;从其产生第一变换信号、第二变换信号和第三变换信号的规格化 (Normalized)分量和能量分量;从规格化分量来产生扩展的规格化分量,以及从能量分量 产生扩展的能量分量;基于扩展的规格化分量和扩展的能量分量来产生扩展的变换信号; 以及对扩展的变换信号执行逆MDCT (MDCT)过程。这里,第二变换信号可以是通过频谱地 扩展第一变换信号为较高频带所获得的信号,以及第三变换信号可以是通过相对于第一基 准频带反射第一变换信号获得的信号。
[0014]具体地,第二变换信号可以是通过将第一变换信号的信号带加倍扩展为较高的频带所获得的信号。
[0015]第三变换信号可以是通过相对于第一变换信号的最上面的频率而反射第一变换 信号所获得的信号,以及第三变换信号可以被定义在集中于第一变换信号的最上面的频率 的重迭带宽中。这里,第三变换信号可以在重迭带宽中与第一变换信号合成。
[0016]第一变换信号的能量分量在第一频率部分中可以是第一变换信号的平均绝对值, 第二变换信号的能量分量在第二频率部分中可以是第二变换信号的平均绝对值,第三变换 信号的能量分量在第三频率部分中可以是第三变换信号的平均绝对值,第一频率部分可以 存在于其中定义第一变换信号的频率部分中,第二频率部分可以存在于其中定义第二变换 信号的频率部分中,以及第三频率部分可以存在于其中定义第三变换信号的频率部分中。
[0017]第一至第三频率部分的宽度可以对应于其中定义第一至第三变换信号的频带的 10个连续的频带,其中定义第一变换信号的频率部分可以对应于从其中定义第一变换信号 的最下面的频带开始的连续的280个较高频带,其中定义第二变换信号的频率部分可以对 应于从其中定义第一变换信号的最下面的频带开始的连续的560个较高频带,以及
[0018]其中定义第三变换信号的频率部分可以对应于集中于其中定义第一变换信号的 最上面的频带的140个频带。
[0019]另一方面,第一变换信号的规格化信号可以是第一变换信号比第一变换信号的能 量分量,第二变换信号的规格化信号可以是第二变换信号比第二变换信号的能量分量,以 及第三变换信号的规格化信号可以是第三变换信号比第三变换信号的能量分量。
[0020]扩展的能量分量可以是在具有其中定义第一变换信号的K的频率带宽的第一能 量部分中的第一变换信号的能量分量,可以是在第二能量部分中第二变换信号的能量分量 和第三变换信号的能量分量的重迭,第二能量部分是具有从第一能量部分的最上面的频带 开始的带宽K/2的较高部分,以及可以是在第三能量部分中的第二变换信号的能量分量, 第三能量部分是具有从第二能量部分的最上面的频带开始的带宽K/2的较高部分。这里, 权重可以在第二能量部分的第一半中被赋予给第三变换信号的能量分量,以及权重可以在 第二能量部分的下半中被赋予给第二变换信号的能量分量。
[0021]扩展的规格化分量可以是在低于第二基准频带的频带中的第一变换信号的规格 化分量,以及可以是在高于第二基准频带的频带中的第二变换信号的规格化分量,以及第 二基准频带可以是其中在第一变换信号和第二变换信号之间的互相关是最大的频带。
[0022]产生扩展的规格化分量和扩展的能量分量的步骤可以包括在其中定义扩展的能 量分量的最上面的频带中平滑扩展的能量分量。
[0023]按照本发明的另一方面,提供了一种带宽扩展设备,其包括:变换单元,其对输入 信号执行修正的离散余弦变换(MDCT)以产生第一变换信号;信号产生单元,其基于第一变 换信号来产生信号;信号合成单元,其将来自第一变换信号的扩展频带信号和由信号产生 单元产生的信号合成;以及逆变换单元,其对扩展的变换信号执行逆MDCT (IMDCT)过程。 这里,信号产生单元通过频谱地扩展第一变换信号为较高频带来产生第二变换信号,通过 相对于第一基准频带而反射第一变换信号来产生第三变换信号,以及从第一至第三变换信 号中提取规格化分量和能量分量,以及信号合成单元基于第一变换信号和第二变换信号的 规格化分量来合成扩展的规格化分量,以及基于第一至第三变换信号的能量分量来合成扩 展的能量分量,以及基于扩展的规格化分量和扩展的能量分量来产生扩展的带信号。[0024]第一变换信号的能量分量在第一频率部分中可以是第一变换信号的平均绝对值, 第二变换信号的能量分量在第二频率部分中可以是第二变换信号的平均绝对值,以及第三 变换信号的能量分量在第三频率部分中可以是第三变换信号的平均绝对值。
[0025]第一变换信号的规格化信号可以是第一变换信号比第一变换信号的能量分量,第 二变换信号的规格化信号可以是第二变换信号比第二变换信号的能量分量,以及第三变换 信号的规格化信号可以是第三变换信号比第三变换信号的能量分量。
[0026]扩展的能量分量可以是在具有其中定义第一变换信号的K的频率带宽的第一能 量部分中的第一变换信号的能量分量,可以是在第二能量部分中第二变换信号的能量分量 和第三变换信号的能量分量的重迭,所述第二能量部分是具有从第一能量部分的最上面的 频带开始的带宽K/2的较高部分,以及可以是在第三能量部分中的第二变换信号的能量分 量,所述第三能量部分是具有从第二能量部分的最上面的频带开始的带宽K/2的较高部 分。
[0027]权重可以在第二能量部分的第一半中被赋予给第三变换信号的能量分量,以及权 重可以在第二能量部分的第二半中被赋予给第二变换信号的能量分量。
[0028]扩展的规格化分量可以是在低于第二基准频带的频带中的第一变换信号的规格 化分量,以及可以是在高于第二基准频带的频带中的第二变换信号的规格化分量,以及第 二基准频带可以是在第一变换信号和第二变换信号之间的互相关是最大的频带。
[0029]有益效果
[0030]按照本发明,可以在音频/语音信号的编码和解码中有效地扩展带宽。
[0031]按照本发明,可以在音频/语音信号的编码和解码中扩展输入WB信号的带宽以重 建SWB信号。
[0032]按照本发明,可以在音频/语音信号的编码和解码中在没有从编码级传输附加信 息的情况下在解码级中扩展带宽。
[0033]按照本发明,在音频/语音信号的编码和解码中,在不考虑处理频带增长的情况 下,可以扩展带宽而没有性能退化。
[0034]按照本发明,可以在音频/语音信号的编码和解码中在低带和扩展的较高带之间 的边界处有效地防止噪声出现。
【专利附图】

【附图说明】
[0035]图1是示意地示出按照本发明的语音编码器的配置示例的示意图。
[0036]图2是示出按照本发明实施例的语音解码器的概念示意图。
[0037]图3是示意地示出基于码本的频谱包络预测和划分带激励信号预测应用作为ABE 方法的示例的示意图。
[0038]图4是示意地示出基于带宽扩展技术来应用ABE的示例的示意图。
[0039]图5是示意地示出按照本发明的扩展带的方法的流程图。
[0040]图6是示意地示出按照本发明的由带宽扩展设备执行的带宽扩展方法的另一方 法的流程图。
[0041]图7是示意地示出按照本发明的合成SWB信号的能量分量的方法的示意图。【具体实施方式】
[0042]在下文中,本发明的实施例将参考附图来具体地描述。当其确定在本发明中涉及 的已知的配置或者功能的详细说明使本发明的要点模糊时,将不对其进行详细说明。
[0043]如果其提及组件被“连接到”或者“耦合到”另一组件,则应该理解的是,再一个组 件可以插入在其间,以及该组件可以直接连接或者耦合到另一组件。
[0044]诸如第一和第二的术语能够用于描述各种单元,但是该组件不必限于该术语。例 如,在本发明的技术精神内被称作第一组件的组件可以称作第二组件,以及可以执行相同 的功能。
[0045]图1是示意地示出按照本发明的语音编码器的配置示例的示意图。
[0046]参考图1,语音编码器100包括带宽检查单元105、采样转换单元125、预处理单元 130、带划分单元110、线性预测分析单元115和135、线性预测量化单元140、150和175、变 换单元145、逆变换单元155和180、基音检测单元160、自适应码本搜索单元165、固定码本 搜索单元170、模式选择单元185、带预测单元190以及补偿增益预测单元195。
[0047]带宽检查单元105确定输入语音信号的带宽信息。语音信号可以根据带宽被分类 为具有在公共交换电话网络(PSTN)中广泛使用的大约4kHz带宽的窄带信号、具有比窄带 语音信号或者AM无线电更加自然的广泛使用的高质量语音的大约7kHz带宽的宽带信号、 以及具有在声音质量加强的领域,诸如数字广播中广泛地使用的14kHz带宽的超宽带信 号。带宽检查单元105将输入语音信号变换为频率域,以及确定是否输入语音信号是窄带 信号,或者宽带信号,或者超宽带信号。带宽检查单元105可以将输入语音信号变换为频率 域,以及可以检查和确定存在和/或频谱的较高带容量(bin)的分量。当根据实施,要输入 的语音信号的带宽是固定时,带宽检查单元105可以不必分开地提供。
[0048]带宽检查单元105将超宽带信号传送给带划分单元110,以及根据输入语音信号 的带宽,将窄带信号或者宽带信号传送给采样转换单元125。
[0049]带划分单元110改变输入信号的采样速率,以及将输入信号分为较高带信号和较 低带信号。例如,32kHz的语音信号的频率被变换为25.6kHz的采样频率,以及该语音信号 通过12.SkHz被分为较高带和较低带。带划分单元110将较低带信号传送给预处理单元 130,以及将较高带信号传送给线性预测分析单元115。
[0050]采样转换单元125接收输入窄带信号或者宽带信号,以及改变采样速率。例如, 当输入窄带语音信号的采样速率是8kHz时,采样转换单元将采样速率改变为12.8kHz,以 及产生较高带信号,以及当输入宽带语音信号的采样速率是16kHz时,将采样速率改变为
12.8kHz,以及产生较低带信号。采样转换单元125输出其的采样速率改变的较低带信号。 内部采样频率可以是除了 12.8kHz以外的采样频率。
[0051]预处理单元130对从采样转换单元125和带划分单元110输出的较低带信号执行 预处理操作。预处理单元130产生语音参数。重要的带的频率分量可以例如使用诸如高通 滤波方法或者预加重滤波方法的滤波处理来提取。参数的提取可以通过根据语音带宽将截 止频率设置为不同以及高通滤波非常低的频带(其是相对次要的信息被采集的频带)来集 中在重要的带上。例如,通过使用预加重滤波方法来升高输入信号的高频带,较低频带和高 频带的能量可以被缩放。因此,可以提高线性预测分析的分辨率。
[0052]线性预测分析单元115和135计算线性预测系数(LPC)。线性预测分析单元115和135可以建模表示语音信号的频谱的整个形状的共振峰。线性预测分析单元115和135计 算LPC值,使得误差值的均方误差是最小的,所述误差值是在使用由线性预测分析单元135 计算的线性预测系数产生的预测语音信号和初始语音信号之间的差。诸如自相关方法或者 协方差方法的各种方法用于计算LPC。
[0053]与用于低带信号的线性预测分析单元135不同,线性预测分析单元115能够提取 高阶LPC。
[0054]线性预测量化单元120和140转变提取的LPC以在频率域中产生变换系数,诸如 线性频谱对(LSP)或者线性频谱(LSF),以及在频率域中量化产生的变换系数。LPC具有宽 的动态范围。因此,当LPC被传送而没有任何变化时,其压缩速率被降低。因此,LPC信息 可以通过将LPC变换为频率域并且量化变换系数来以少量的信息产生。
[0055]线性预测量化单元120和140通过对量化的LPC去量化、使用变换为时间域的LPC 来产生线性预测残留信号。线性预测残留信号是通过从语音信号去除预测共振峰分量所获 得的信号,以及包括基音信息和随机信号。
[0056]线性预测量化单元120使用量化的LPC、通过以初始较高带信号滤波来产生线性 预测残留信号。产生的线性预测残留信号被传送给补偿增益预测单元195,以便计算具有较 高带预测激励信号的补偿增益。
[0057]线性预测量化单元140使用量化的LPC、通过以初始较低带信号滤波来产生线性 预测残留信号。产生的线性预测残留信号被输入给变换单元145和基音检测单元160。
[0058]在图1中,变换单元145、量化单元150和逆变换单元155可以用作执行变换编译 的激励(TCX)模式的RCX模式执行单元。基音检测单元160、自适应码本搜索单元165和固 定码本搜索单元170可以用作执行码激励线性预测(CELP)模式的CELP模式执行单元。
[0059]变换单元145基于诸如离散傅里叶变换(DFT)或者快速傅里叶变换(FFT)的变换 功能来将输入线性预测残留信号变换为频率域。变换单元145将变换系数信息传送给量化 单元150。
[0060]量化单元150量化从变换单元145产生的变换系数。量化单元150以各种方法执 行量化。量化单元150可以根据频带来有选择地执行量化,或者可以使用AbS (综合分析) 方法来计算最佳频率组合。
[0061]逆变换单元155基于量化的信息来执行逆变换处理,以及在时间域中产生线性预 测残留信号的重建的激励信号。
[0062]量化和逆变换的线性预测残留信号,即重建的激励信号,被经由线性预测重建为 语音信号。重建的语音信号被传送给模式选择单元185。以TCX模式重建的语音信号被与 稍后描述的以CELP模式量化和重建的语音信号相比。
[0063]另一方面,在CELP模式中,基音检测单元160使用诸如自相关方法的开环方法来 计算线性预测残留信号的基音。例如,基音检测单元160通过将合成的语音信号与实际的 语音信号比较来计算基音周期和峰值,以及此时使用AbS (综合分析)方法等。
[0064]自适应码本搜索单元165基于通过基音检测单元所计算的基音信息来提取自适 应码本索引和增益。自适应码本搜索单元165基于自适应码本索引和增益信息、使用AbS 方法等从线性预测残留信号来计算基音结构。自适应码本搜索单元165将自适应码本的贡 献数据,例如线性预测残留信号(有关基音结构的信息从其中排除)传送给固定码本搜索单元 170。
[0065]固定码本搜索单元170基于从自适应码本搜索单元165接收的线性预测残留信号 来提取和编码固定码本索引和增益。
[0066]量化单元175量化参数,诸如从基音检测单元160输出的基音信息、从自适应码本 搜索单元165输出的自适应码本索引和增益、以及从固定码本搜索单元170输出的固定码 本索引和增益。
[0067]逆变换单元180产生激励信号,所述激励信号是使用由量化单元175量化的信息 所重建的线性预测残留信号。逆变换单元基于激励信号、通过线性预测的逆处理来重建语 音信号。
[0068]逆变换单元180将以CELP模式所重建的语音信号传送给模式选择单元185。
[0069]模式选择单元185将以TCX模式所重建的TCX激励信号和以CELP模式所重建的 CELP激励信号互相比较,以及选择更类似于初始线性预测残留信号的激励信号。模式选择 单元185还编码有关选择的激励信号以什么模式重建的信息。模式选择单元185将有关重 建的语音信号和激励信号的选择的选择信息作为比特流传送给带预测单元190。
[0070]带预测单元190使用从模式选择单元185传送的选择信息和重建的激励信号来产 生较高带的预测激励信号。
[0071]补偿增益预测单元195将从带预测单元190传送的较高带预测激励信号和从线性 预测量化单元120传送的较高带预测残留信号互相比较,以及在频谱中补偿增益。
[0072]另一方面,在图1示出的示例中组成单元可以作为单个模块来操作,或者多个组 成单元可以作为单个模块来操作。例如,量化单元120、140、150和175可以作为单个模块 来操作,或者量化单元120、140、150和175可以在处理中作为单个模块被设置在必要的位 置处。
[0073]图2是示出按照本发明实施例的语音解码器的示意图。
[0074]参考图2,语音解码器200包括去量化单元205和210、带预测单元220、增益补偿 单元225、逆变换单元215、线性预测合成单元230和235、采样转换单元240、带合成单元 250和后处理滤波单元245和255。
[0075]去量化单元205和210从语音编码器接收量化的参数信息,以及去量化接收的参
数信息。
[0076]逆变换单元215逆变换以TCX模式或者CELP模式编码的语音信息以重建激励信 号。逆变换单元215基于从语音编码器接收的参数来产生重建的激励信号。此时,逆变换 单元215可以仅逆变换由语音编码器选择的部分带。逆变换单元215将重建的激励信号传 送给线性预测合成单元235和带预测单元220。
[0077]线性预测合成单元235使用从逆变换单元215传送的激励信号和从语音编码器传 送的线性预测系数来重建较低带信号。线性预测合成单元235将重建的较低带信号传送给 采样转换单元240和带合成单元250。
[0078]带预测单元220基于从逆变换单元215接收的重建的激励信号来产生较高带预测 激励信号。
[0079]增益补偿单元225基于从带预测单元220接收的较高带预测激励信号和从语音编 码器接收的补偿增益、在SWB语音信号的频谱中来补偿增益。[0080]线性预测合成单元230从增益补偿单元225来接收补偿的较高带预测激励信号, 以及基于补偿的较高带预测激励信号和从语音编码器接收的线性预测系数来重建较高带 信号。
[0081]带合成单元250从线性预测合成单元235接收重建的较低带信号,从线性预测合 成单元435接收重建的较高带信号,以及合成接收的较高带信号和接收的较低带信号的 带。
[0082]采样转换单元240将内部采样频率转换为初始采样频率。
[0083]后处理滤波单元245和255执行为重建信号所必需的后处理。例如,后处理滤波 单元245和255包括去加重滤波器,所述去加重滤波器可以在预处理单元中执行预加重滤 波器的逆滤波。除了滤波处理之外,后处理滤波单元245和255可以执行各种后处理,诸如 量化误差最小化过程和加重频谱的谐振峰和去加重谷的过程。后处理滤波单元245输出重 建的窄带或者宽带信号,以及后处理滤波单元255输出重建的超宽带信号。
[0084]如上所述,在图1和2中示出的语音编码器和语音解码器仅是本发明的示例,以及 在不脱离本发明的技术精神的情况下可以不同地改变。
[0085]另一方面,可缩放的编码/解码方法被认为提供有效的语音和/或音频服务。
[0086]通常,可缩放的语音和音频编码器/解码器可变地提供带宽以及比特速率。例如, 以当输入语音/音频信号是SWB信号时从SWB信号再现WB信号以及当输入语音/音频信 号是SB信号时从WB信号再现SWB信号的方式,可变地提供带宽。
[0087]将WB信号转换为SWB信号的过程通过重新采样来执行。
[0088]然而,当上采样过程简单地用于将WB信号转换为SWB信号时,采样速率是SWB信 号的采样速率,但是信号实际地存在其中的带宽与WB信号相同。因此,由于上采样,信息量 (也就是说,数据速率)增加,但是声音质量没有改善。
[0089]在这方面,在没有提高比特速率的情况下从WB信号或者窄带(NB)信号来重建SWB 信号的方法被称为人工带宽扩展(ABE)。
[0090]在本说明书中,下面将详细地描述接收WB信号或者较低带信号以及在没有提高 比特速率的情况下从其重建SWB信号的带宽扩展方法,例如宽带到超宽带重新采样方法。
[0091]在本发明中,SWB信号在修正的离散余弦变换(MDCT)域中使用WB信号的反射带信 息和预测带信息来重建,修正的离散余弦变换(MDCT)域是可缩放的语音和音频编码器的处 理域。
[0092]作为初始语音编解码器,由于对网络的带宽和算法处理速率的限制,诸如以少量 计算处理窄带的G.711的编解码器已经被主要地开发。换句话说,已经使用提供适用于具 有少量计算的语音通信的声音质量的方法,而不是通过采用具有高的比特速率的复合方法 来提供好的声音质量的编解码器。
[0093]随着信号处理技术和网络的进步,已经开发了具有高复杂度和好的声音质量的编 解码器技术。例如,已经开发了仅仅处理3.4kHz或者更小的带宽的窄带语音编解码器和处 理高达7kHz的带宽的宽带语音编解码器。
[0094]然而,当如上所述考虑对于高质量语音服务的需求增加时,可以考虑使用能够支 持等于或者大于基于宽带语音编解码器的宽带的带宽的可缩放的编解码器的方法。此时, G729.UG718等可以用作宽带语音编解码器。[0095]支持基于宽带语音编解码器的超宽带的可缩放的编解码器能够在各种情形中使 用。例如,假设使用呼叫服务的互相通信的2个用户中的一个具有能够仅处理WB信号的终 端,以及另一个具有能够处理SWB信号的终端。在这种情况下,会出现基于WB信号而不是 SffB信号的语音信号被提供给具有能够处理SWB信号的终端的用户的问题以保持在2个用 户之间通信。当SWB信号可以基于WB信号被重新采样和重建时,这个问题能够被解决。
[0096]按照本发明的语音编解码器可以处理WB信号和SWB信号这两者,以及能够基于WB 信号、通过重新采样来重建SWB信号。
[0097]用于重新采样技术的ABE技术迄今通常已经以基于NB信号重建WB信号这样的方 式研究。
[0098]ABE技术可以划分为频谱包络预测技术和激励信号预测技术。激励信号可以经由 调制等来预测。频谱包络可以使用模式识别技术来预测。用于预测频谱包络的模式识别技 术的示例包括高斯混合模型(GMM)和隐藏马尔可夫(Markov)模型(HMM)。
[0099]作为预测WB信号的ABE方法,利用使用语音识别特征矢量的MFCC(美尔倒谱系数 (Mel-Frequency Cepstral Coefficient)),或者利用用于量化MFCC等的矢量量化(VQ)索 引的方法已经被研究。
[0100]图3是示意地示出基于码本的频谱包络预测和划分带激励信号预测应用作为ABE 方法的示例的示意图。
[0101]参考图3,关于频率扩展,宽带码本被基于窄带(电话带)码本来预测。同时,激励 信号单独地经历低带扩展和高带扩展,然后在合成级中,扩展的信号被经由线性预测编译 (LPC)来合成。线性预测编译的结果与频率扩展的结果结合。
[0102]另一方面,基于在图3中示出的示例的方法需要大量的计算,并且因此其难以用 作语音编码器的组件技术。例如,由于特征矢量随处理带的增加而增加,所以性能退化可能 出现。根据训练数据库的特征,性能偏离可以提高。其还难以基于在图3中示出的示例使 用该方法以预测在MDCT域中处理的SWB信号。
[0103]图4是示意地示出基于带宽扩展技术应用ABE的示例的示意图。基于频谱包络预 测技术的ABE方法和激励信号预测方法以及在图4中示出的ABE方法基于现有的带宽扩展 技术来被应用。
[0104]参考图4,在时间域中的包络信息与在频率域中的包络信息一起被沿着时间轴预 测。例如,GMM被使用从低带信号提取的MFCC应用作为特征矢量,以便预测为高带信号的 合成所必需的参数。
[0105]按照参考在图4中示出的示例描述的方法,ABE可以仅通过预测在现有带宽扩展 方法中定义的参数以及重新使用用于为预测其它参数所必需的结构的现有方法来被执行。
[0106]然而,在图4中示出的方法一般是差的。例如,由于与该激励信号相对应的部分被 预先预测和使用,要预测的信息是相对有限的。
[0107]在图4中示出的带宽扩展方法难以与忽略的带特征来一起使用。也就是说,在图 4中示出的带宽扩展方法已经被开发用于带宽扩展为宽频带,该方法难以应用于从WB信号 重建SWB信号。具体地,这个方法是当基线带的信号被充分地重建时保证性能的方法。因 此,当基线带的信号可以仅在编码器中重建时,其难以获得期望的效果。
[0108]因此,需要考虑在不引起大量计算的情况下以及在非常依赖于数据库的特征的情况下能够保持普遍性的带宽扩展技术。
[0109]在本发明中,在不使用任何附加比特的情况下,带宽被扩展。也就是说,在不使用任何附加比特的情况下,输入WB信号(例如,以16kHz的采样频率输入的信号)可以作为SWB信号(例如,具有32kHz采样频率的信号)输出。
[0110]按照本发明的带宽扩展方法也可以应用于(移动、无线)通信。除了 MDCT变换以外,带宽可以在没有额外的延迟的情况下被扩展。
[0111]按照本发明的带宽扩展方法可以在考虑到普遍性的情况下使用与基线编码器/解码器的帧相同长度的帧。例如,当G.718用作基线编码器时,帧的长度可以设置为20ms。在这种情况下,基于32kHz的信号,20ms对应于640个采样。
[0112]表I示意地示出当使用按照本发明的带宽扩展方法时说明的示例。
[0113]表I
【权利要求】
1.一种带宽扩展方法,包括下列步骤:对输入信号执行修正的离散余弦变换(MDCT)过程以产生第一变换信号;基于所述第一变换信号产生第二变换信号和第三变换信号;从其产生所述第一变换信号、所述第二变换信号和所述第三变换信号的能量分量和规格化分量;从所述规格化分量产生扩展的规格化分量,以及从所述能量分量产生扩展的能量分量;基于所述扩展的规格化分量和所述扩展的能量分量来产生扩展的变换信号;以及对所述扩展的变换信号执行逆MDCT (IMDCT)过程,其中,所述第二变换信号是通过将所述第一变换信号频谱地扩展为较高频带而获得的信号,以及其中,所述第三变换信号是通过相对于第一基准频带反射所述第一变换信号获得的信号。
2.根据权利要求1所述的带宽扩展方法,其中,所述第二变换信号是通过将所述第一变换信号的信号带加倍扩展为较高频带所获得的信号。
3.根据权利要求1所述 的带宽扩展方法,其中,所述第三变换信号是通过相对于所述第一变换信号的最上面频率反射所述第一变换信号所获得的信号,以及其中,所述第三变换信号被定义在集中于所述第一变换信号的最上面频率的重迭带宽中。
4.根据权利要求3所述的带宽扩展方法,其中,所述第三变换信号在重迭带宽中与所述第一变换信号合成。
5.根据权利要求1所述的带宽扩展方法,其中,所述第一变换信号的能量分量在第一频率部分中是所述第一变换信号的平均绝对值,其中,所述第二变换信号的能量分量在第二频率部分中是所述第二变换信号的平均绝对值,其中,所述第三变换信号的能量分量在第三频率部分中是所述第三变换信号的平均绝对值,其中,所述第一频率部分存在于其中定义所述第一变换信号的频率部分中,其中,所述第二频率部分存在于其中定义所述第二变换信号的频率部分中,以及其中,所述第三频率部分存在于其中定义所述第三变换信号的频率部分中。
6.根据权利要求5所述的带宽扩展方法,其中,所述第一至第三频率部分的宽度对应于所述第一至第三变换信号的频带的10个连续频带,其中,所述第一变换信号被定义的频率部分对应于从所述第一变换信号被定义的最下面频带开始的连续的280个较高频带,其中,所述第二变换信号被定义的频率部分对应于从所述第一变换信号被定义的最下面频带开始的连续的560个较高频带,以及其中,所述第三变换信号被定义的频率部分对应于集中于所述第一变换信号被定义的最上面频带的140个频带。
7.根据权利要求1所述的带宽扩展方法,其中,所述第一变换信号的规格化信号是所述第一变换信号比所述第一变换信号的能量分量,其中,所述第二变换信号的规格化信号是所述第二变换信号比所述第二变换信号的能量分量,以及其中,所述第三变换信号的规格化信号是所述第三变换信号比所述第三变换信号的能量分量。
8.根据权利要求1所述的带宽扩展方法,其中,所述扩展的能量分量是在具有所述第一变换信号被定义的K的频率带宽的第一能量部分中的第一变换信号的能量分量,是在第二能量部分中所述第二变换信号的能量分量和所述第三变换信号的能量分量的重迭,所述第二能量部分是具有从所述第一能量部分的最上面频带开始的带宽K/2的较高部分,以及是在第三能量部分中的第二变换信号的能量分量,所述第三能量部分是具有从所述第二能量部分的最上面频带开始的带宽K/2的较高部分。
9.根据权利要求8所述的带宽扩展方法,其中,权重被在所述第二能量部分的第一半中赋予给所述第三变换信号的能量分量,以及权重被在所述第二能量部分的第二半中赋予给所述第二变换信号的能量分量。
10.根据权利要求1所述的带宽扩展方法,其中,扩展的规格化分量是在低于所述第二基准频带的频带中的第一变换信号的规格化分量,以及是在高于所述第二基准频带的频带中的第二变换信号的规格化分量,以及其中,所述第二基准频带是在所述第一变换信号和所述第二变换信号之间的互相关是最大的频带。
11.根据权利要求1所述的带宽扩展方法,其中,产生所述扩展的规格化分量和所述扩展的能量分量的步骤包括在所述扩展的能量分量被定义的最上面频带中平滑所述扩展的能量分量。
12.一种带宽扩展设备,包括:变换单元,所述变换单元对输入信号执行修正的离散余弦变换(MDCT)以产生第一变换信号;信号产生单元,所述信号产生单元基于所述第一变换信号产生信号;`信号合成单元,所述信号合成单元将来自所述第一变换信号的扩展带信号和由所述信号产生单兀产生的信号合成;逆变换单元,所述逆变换单元对所述扩展的变换信号执行逆MDCT (IMDCT)过程,其中,所述信号产生单元通过将所述第一变换信号频谱地扩展为较高频带来产生第二变换信号,通过相对于第一基准频带反射所述第一变换信号来产生第三变换信号,以及从所述第一至第三变换信号提取规格化分量和能量分量,以及其中,所述信号合成单元基于所述第一变换信号和所述第二变换信号的规格化分量来合成扩展的规格化分量,以及基于所述第一至第三变换信号的能量分量来合成扩展的能量分量,以及基于扩展的规格化分量和扩展的能量分量来产生扩展带信号。
13.根据权利要求12所述的带宽扩展设备,其中,所述第一变换信号的能量分量在第一频率部分中是所述第一变换信号的平均绝对值,其中,所述第二变换信号的能量分量在第二频率部分中是所述第二变换信号的平均绝对值,以及其中,所述第三变换信号的能量分量在第三频率部分中是所述第三变换信号的平均绝对值。
14.根据权利要求12所述的带宽扩展设备,其中,所述第一变换信号的规格化信号是所述第一变换信号比所述第一变换信号的能量分量,其中,所述第二变换信号的规格化信号是所述第二变换信号比所述第二变换信号的能量分量,以及其中,所述第三变换信号的规格化信号是所述第三变换信号比所述第三变换信号的能量分量。
15.根据权利要求12所述的带宽扩展设备,其中,所述扩展的能量分量是在具有所述第一变换信号被定义的K的频率带宽的第一能量部分中的第一变换信号的能量分量,是在第二能量部分中所述第二变换信号的能量分量和所述第三变换信号的能量分量的重迭,所述第二能量部分是具有从所述第一能量部分的最上面频带开始的带宽K/2的较高部分,以及是在第三能量部分中的第二变换信号的能量分量,所述第三能量部分是具有从所述第二能量部分的最上面频带开始的带宽K/2的较高部分。
16.根据权利要求15所述的带宽扩展设备,其中,在所述第二能量部分的第一半中将权重赋予给所述第三变换信号的能量分量,以及在所述第二能量部分的 第二半中将权重赋予给所述第二变换信号的能量分量。
17.根据权利要求12所述的带宽扩展设备,其中,所述扩展的规格化分量是在低于所述第二基准频带的频带中的第一变换信号的规格化分量,以及是在高于所述第二基准频带的频带中的第二变换信号的规格化分量,以及其中,所述第二基准频带是在所述第一变换信号和所述第二变换信号之间的互相关是最大的频带。
【文档编号】G10L19/02GK103460286SQ201280015425
【公开日】2013年12月18日 申请日期:2012年2月8日 优先权日:2011年2月8日
【发明者】郑奎赫, 李英汉, 田惠晶, 金洪国, 姜仁圭, 金洛榕 申请人:Lg电子株式会社, 光州科学技术院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1