改进的谐波转置的制作方法

文档序号:2818925阅读:252来源:国知局
专利名称:改进的谐波转置的制作方法
技术领域
本发明涉及在频率上对信号进行转置和/或在时间上对信号进行扩展/压缩,并且尤其涉及音频信号的编码。换言之,本发明涉及时标修改和/或频标修改。更具体地,本发明涉及包括频域谐波转置器(transpose!·)的高频重建(HFR)方法。
背景技术
HFR技术(例如谱带复制(SBR)技术)使得显著改进传统感知音频编解码器的编码效率。与MPEG-4高级音频编码(AAC)组合,它形成非常有效的音频编解码器,已将其用在 XM卫星无线电系统和全球数字无线电系统(Digital Radio Mondiale)中,而且还在3GPP、 DVD论坛等中将其标准化。AAC和SBR的组合被称为aacPlus。这是MPEG-4标准的一部分, 其中,它被称作高效AAC规格(High Efficiency AAC Profile,HE-AAC)。通常,HFR技术可以通过后向和前向兼容的方式与任何感知音频编解码器组合,因此提供使已经建立的广播系统(类似于Eureka DAB系统中使用的MPEG层-2)升级的可能性。HFR转置方法也可以与语音编解码器组合以允许超低比特率的宽带语音。HRF之后的基本构思是观测到通常存在信号的高频率范围的特性与同一信号的低频率范围的特性之间的强相关性。因此,通过从低频率范围到高频率范围的信号转置可以实现对于信号的原始输入高频率范围的表示的良好近似。在通过引用而合并的WO 98/57436中建立了这种转置的构思,以作为用于从音频信号的较低频带重建高频带的方法。通过在音频编码和/或语音编码中使用该构思可以获得比特率的大量节省。下文中,将提到音频编码,但应注意描述的方法和系统同样可应用于语音编码并且可应用在统一的语音和音频编码(USAC)中。在基于HFR的音频编码系统中,低带宽信号被提供给用于编码的核心波形编码器,使用通常以非常低的比特率被编码的并且描述目标谱形状的附加边信息和低带宽信号的转置在解码器侧再生较高频率。对于低比特率,其中核心编码的信号的带宽窄,再现或合成具有感知愉悦特性的高带(即音频信号的高频率范围)变得愈加重要。在现有技术中,存在一些使用例如谐波转置、或时间扩展的高频重建的方法。一种方法基于在以足够高的频率解析度执行频率分析的原则下运行的相位音码器。在重合成信号之前在频域中执行信号修改。信号修改可为时间扩展操作或转置操作。这些方法存在的潜在问题之一是,为了获得稳态声音的高质量转置、和瞬变声音或冲击声音的系统时间响应而对预期的高频解析度进行相反的约束。换言之,尽管使用高频解析度对稳态信号有利,但是这样的高频解析度通常要求大的窗尺寸,而当处理信号的瞬变部分时,大的窗尺寸是有害的。处理该问题的一个方法可根据输入信号特性、例如通过使用窗切换来自适应地改变转置器的窗。通常,为了实现高频解析度将对信号的稳态部分使用长窗,而为了实现转置器的良好的瞬变响应、即良好的时间解析度将对信号的瞬变部分使用短窗。但是,该方法具有的缺点在于,不得不将诸如瞬变检测等信号分析措施合并到转置系统中。这样的信号分析措施经常涉及触发信号处理的切换的判定步骤,例如对瞬变的存在的判定。另外,这样的措施通常影响系统的可靠性,以及当切换信号处理时,例如当在窗尺寸之间切换时,这样的措施可引入信号伪像。本发明解决有关谐波转置的瞬变性能的前述问题,而不需要窗切换。另外,以低的附加复杂度实现了改进的谐波转置。

发明内容
本发明涉及谐波转置的改进的瞬变性能的问题,还涉及匹配的、对谐波转置的已知方法的改进。另外,本发明概述了如何在保留所提出的改进的同时可将附加的复杂度保
持在最小。其中,本发明可包括以下方面中的至少一个-通过这样的因子在频率中进行过采样该因子是转置器的操作点的转置因子的函数;-对分析窗和合成窗的组合进行适当选择;以及-对于组合不同的转置的信号的情况,确保不同的转置的信号的时间对齐。根据本发明的方面,描述了一种用于使用转置因子T从输入信号生成转置的输出信号的系统。转置的输出信号可为输入信号的时间扩展的版本和/或频移的版本。相对于输入信号,可通过转置因子T在时间上扩展转置的输出信号。可替选地,可通过转置因子T 将转置的输出信号的频率分量向上移位。该系统可包括长度L的分析窗,其提取输入信号的L个样本。通常,输入信号的L 个样本是时域中的输入信号的样本,例如音频信号的样本。所提取的L个样本被称为输入信号的帧。系统还包括M = F*L阶的分析变换单元,其利用作为频率过采样因子的F将L 个时域样本变换成M个复数系数。M个复数系数通常是频域中的系数。分析变换可为傅立叶变换、快速傅立叶变换、离散傅立叶变换、小波变换或(可能调制的)滤波器组的分析阶段。过采样因子F基于转置因子T或是转置因子T的函数。过采样操作也可被称为通过附加的(F_1)*L个零对分析窗进行零填充(zero padding)。过采样操作还可被视为通过因子F来选择大于分析窗的尺寸的分析变换的尺寸 M0该系统还可包括非线性处理单元,其通过使用转置因子T来改变复数系数的相位。相位的改变可包括将复数系数的相位乘以转置因子T。另外,该系统可包括M阶的合成变换单元,其将改变的系数变换成M个改变的样本;以及长度L的合成窗,其生成输出信号。合成变换可为逆傅立叶变换、逆快速傅立叶变换、逆离散傅立叶变换、逆小波变换、或 (可能)调制的滤波器组的合成阶段。通常,例如为了当转置因子T =1时实现输入信号的完美重建,分析变换和合成彼此相关。根据本发明的另一方面,过采样因子F与转置因子T成比例。特别地,过采样因子 F可大于或等于(T+l)/2。过采样因子F的该选择确保合成窗拒绝可由转置引起的、不期望的信号伪像,例如前回声和后回声。应当注意,更一般而言,分析窗的长度可为La,而合成窗的长度可为Ls。还是在这样的情况下,可有利的是,基于转置阶τ、即根据转置阶T来选择变换单元的阶Mo另外,可有利的是,将M选择成大于分析窗和合成窗的平均长度,即大于(La+Ls)/2。在实施例中,变换单元的阶M与平均窗长度之间的差与(T-I)成比例。在另一实施例中,将M选择成大于或等于(TLa+Ls)/2。应当注意,分析窗和合成窗的长度相等、即La = Ls = L的情况是以上一般情况的特殊情况。对于一般情况,过采样因子F可为
权利要求
1.一种用于使用转置因子τ从输入信号(312)生成输出信号的系统,包括-分析窗单元(602),其应用长度La的分析窗(311),从而提取所述输入信号(312)的帧;-M阶(301)的分析变换单元(603),其将所述样本变换成M个复数系数; -非线性处理单元(604),其通过使用所述转置因子T来改变所述复数系数的相位; -M阶的合成变换单元(60 ,其将所述改变的系数变换成M个改变的样本;以及 -合成窗单元(606),其将长度Ls的合成窗(321)应用于所述M个改变的样本,从而生成所述输出信号的帧;其中,M基于所述转置因子T。
2.如权利要求1所述的系统,其中,M与所述分析窗(311)和所述合成窗(321)的平均长度之间的差与(T-I)成比例。
3.如权利要求2所述的系统,其中,M大于或等于(TLa+Ls)/2。
4.如任一项前述权利要求所述的系统,其中,-所述分析变换单元(60 执行傅立叶变换、快速傅立叶变换、离散傅立叶变换、小波变换之一;以及-所述合成变换单元(60 执行对应的逆变换。
5.如任一项前述权利要求所述的系统,还包括-分析步幅单元(601),其沿所述输入信号以Sa个样本的分析步幅将所述分析窗移位, 从而生成所述输入信号的帧的序列;-合成步幅单元(607),其以&个样本的合成步幅将所述输出信号的相继帧移位;以及 -交叠相加单元(608),其将所述输出信号的相继的移位帧交叠和相加,从而生成所述输出信号。
6.如权利要求5所述的系统,其中,-所述合成步幅是所述分析步幅的T倍;以及-通过所述转置因子T进行时间扩展,所述输出信号对应于所述输入信号。
7.如任一项前述权利要求所述的系统,其中,从所述分析窗和所述分析步幅导出所述合成窗。
8.如权利要求7所述的系统,其中,所述合成窗由以下公式给出
9.如任一项前述权利要求所述的系统,其中,所述分析窗和/或所述合成窗为以下之窗窗窗斯弦明高余汉-汉宁窗; -矩形窗; -巴特里特窗; -布莱克曼窗;
10.如权利要求5所述的系统,还包括收缩单元(609),-其通过所述转置阶T来增加所述输出信号的采样率;和/或 -其在保持所述采样率不变的同时,通过所述转置阶T来对所述输出信号进行下采样; 从而产生转置的输出信号。
11.如权利要求10所述的系统,其中,-所述合成步幅是所述分析步幅的T倍;以及-通过所述转置因子T进行频移,转置的输出信号对应于所述输入信号。
12.如权利要求1所述的系统,其中,所述相位的改变包括将所述相位乘以所述转置因子T。
13.如权利要求10所述的系统,还包括-第二非线性处理单元(604),其通过使用第二转置因子T2来改变所述复数系数的所述相位,从而产生第二输出信号的帧;以及-第二合成步幅单元(607),其通过第二合成步幅将所述第二输出信号的相继帧移位, 从而在所述交叠相加单元(608)中生成所述第二输出信号。
14.如权利要求13所述的系统,还包括-第二收缩单元阳09),其使用所述第二转置阶T2,从而产生第二转置的输出信号;以及-组合单元(502),其合并所述第一转置的输出信号和所述第二转置的输出信号。
15.如权利要求14所述的系统,其中,所述第一转置的输出信号和所述第二转置的输出信号的合并包括将所述第一转置的输出信号的样本和所述第二转置的输出信号的样本相加。
16.如权利要求14所述的系统,其中,-所述组合单元(50 在合并之前对所述第一转置的输出信号和所述第二转置的输出信号进行加权;以及-执行加权,使得所述第一转置的输出信号的能量或每带宽能量、以及所述第二转置的输出信号的能量或每带宽能量分别对应于所述输入信号的能量或每带宽能量。
17.如权利要求14所述的系统,还包括-对齐单元,其在进入所述组合单元之前对所述第一转置的输出信号和所述第二转置的输出信号进行时间偏移。
18.如权利要求17所述的系统,其中,所述时间偏移是所述转置阶T和/或所述窗口的长度L的函数,其中L = La = LS。
19.如权利要求18所述的系统,其中,所述时间偏移被确定为
20.如任一项前述权利要求所述的系统,其中,所述分析窗(311)和所述合成窗(321) 彼此不同以及相对于彼此而双正交。
21.如权利要求20所述的系统,其中,所述分析窗(311)的ζ变换具有单位圆上的双零。
22.一种用于使用转置因子T从输入信号(312)生成输出信号的系统,包括 -分析窗单元(602),其应用长度L的分析窗(311),从而提取所述输入信号(312)的帧;-M阶(301)的分析变换单元(603),其将所述样本变换成M个复数系数; -非线性处理单元(604),其通过使用所述转置因子T来改变所述复数系数的相位; -M阶的合成变换单元(60 ,其将所述改变的系数变换成M个改变的样本;以及 -合成窗单元(606),其将长度L的合成窗(321)应用于所述M个改变的样本,从而生成所述输出信号的帧;其中,所述分析窗(311)和所述合成窗(321)彼此不同以及相对于彼此而双正交。
23.一种用于解码所接收的包括音频信号的多媒体信号的系统,所述系统包括根据权利要求1至22中任一项所述的转置单元G02),其中,所述输入信号是所述音频信号的低频分量,而所述输出信号是所述音频信号的高频分量。
24.如权利要求23所述的系统,还包括用于解码所述音频信号的所述低频分量的核心解码器(401)。
25.如权利要求M所述的系统,其中,所述核心解码器G01)基于杜比E、杜比数字、 AAC之一的编码方案。
26.一种用于解码所接收的包括音频信号的多媒体信号的机顶盒,所述机顶盒包括根据权利要求1至22中任一项所述的转置单元G02),所述转置单元(40 用于从所述音频信号生成转置的输出信号。
27.一种用于通过转置因子T对输入信号(31 进行转置的方法,包括步骤 -使用长度La的分析窗(311),来提取所述输入信号(312)的样本的帧;-将所述输入信号的所述帧从时域变换到频域以产生M个复数系数; -利用所述转置因子T来改变所述复数系数的相位; -将所述M个改变的复数系数变换到时域以产生M个改变的样本;以及 -使用长度Ls的合成窗(321),来生成输出信号的帧; 其中,M基于所述转置因子T。
28.如权利要求27所述的方法,还包括步骤-沿所述输入信号以&个样本的分析步幅将所述分析窗移位,从而产生所述输入信号的帧的序列;-以&个样本的合成步幅将所述输出信号的相继帧移位;以及 -将所述输出信号的相继的移位帧交叠和相加,从而生成所述输出信号。
29.如权利要求观所述的方法,其中,所述合成步幅是所述分析步幅的T倍。
30.如权利要求四所述的方法,还包括步骤-通过所述转置阶T执行所述输出信号的比率转换,从而产生转置的输出信号。
31.如权利要求四所述的方法,还包括步骤-在保持所述采样率不变的同时,通过所述转置阶T来执行所述输出信号的下采样,从而产生转置的输出信号。
32.如权利要求28至31中任一项所述的方法,还包括步骤-通过使用第二转置因子T2来改变所述复数系数的所述相位,从而生成第二输出信号的帧;以及-通过第二合成步幅将所述第二输出信号的相继帧移位,从而通过将所述第二输出信号的移位的帧交叠和相加来生成所述第二输出信号。
33.如权利要求32所述的方法,还包括步骤-通过所述第二转置阶T2来执行所述第二输出信号的比率转换,从而产生第二转置的输出信号;以及-合并所述第一转置的输出信号和所述第二转置的输出信号以产生合并的输出信号。
34.一种用于通过转置因子T对输入信号(31 进行转置的方法,包括步骤 -使用长度L的分析窗(311),来提取所述输入信号(312)的样本的帧;-将所述输入信号的所述帧从时域变换到频域以产生M个复数系数; -利用所述转置因子T来改变所述复数系数的相位; -将所述M个改变的复数系数变换到时域以产生M个改变的样本;以及 -使用长度L的合成窗(321),来生成输出信号的帧;其中,所述分析窗(311)和所述合成窗(321)彼此不同以及相对于彼此而双正交。
35.如权利要求34所述的方法,其中,所述合成窗(321)Vs (η)由下式给出
36.如权利要求34至35所述的方法,其中,所述分析窗(311)的ζ变换具有单位圆上的双零。
37.如权利要求36所述的方法,其中,所述分析窗是平方正弦窗。
38.如权利要求36所述的方法,其中,通过以下步骤来确定长度L的所述分析窗 -将长度L的两个正弦窗交织,以产生长度2L-1的平方正弦窗;-将零追加到所述平方正弦窗,以产生长度2L的基窗;以及-使用线性插值来对所述基窗进行重采样,以将长度L的偶对称窗产生为所述分析窗。
39.一种软件程序,用于在处理器上执行,以及当在计算装置上被执行时用于执行权利要求27至38中任一项所述的方法的步骤。
40.一种包括软件程序的存储介质,所述软件程序用于在处理器上执行,以及当在计算装置上被执行时用于执行权利要求27至38中任一项所述的方法的步骤。
41. 一种包括可执行指令的计算机程序产品,所述可执行指令当在计算机上被执行时用于执行权利要求27至38中任一项所述的方法。
全文摘要
本发明涉及在时间上和/或频率上对信号进行转置,尤其涉及音频信号的编码。更具体地,本发明涉及包括频域谐波转置器的高频重建(HFR)方法。描述了用于使用转置因子T从输入信号生成转置的输出信号的方法和系统。该系统包括长度La的分析窗,其提取输入信号的帧;以及M阶的分析变换单元,其将样本变换成M个复数系数。M是转置因子T的函数。该系统还包括非线性处理单元,其通过使用转置因子T来改变复数系数的相位;M阶的合成变换单元,其将改变的系数变换成M个改变的样本;以及长度Ls的合成窗,其生成输出信号的帧。
文档编号G10L19/02GK102318004SQ201080005580
公开日2012年1月11日 申请日期2010年3月12日 优先权日2009年9月18日
发明者佩尔·埃克斯特兰德, 拉尔斯·法尔克·维尔默斯 申请人:杜比国际公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1