改进的谐波转置的制作方法

文档序号:2826326阅读:207来源:国知局
改进的谐波转置的制作方法
【专利摘要】本发明涉及在时间上和/或频率上对信号进行转置,尤其涉及音频信号的编码。更具体地,本发明涉及包括频域谐波转置器的高频重建(HFR)方法。描述了用于使用转置因子T从输入信号生成转置的输出信号的方法和系统。该系统包括:长度La的分析窗,其提取输入信号的帧;以及M阶的分析变换单元,其将样本变换成M个复数系数。M是转置因子T的函数。该系统还包括:非线性处理单元,其通过使用转置因子T来改变复数系数的相位;M阶的合成变换单元,其将改变的系数变换成M个改变的样本;以及长度Ls的合成窗,其生成输出信号的帧。
【专利说明】改进的谐波转置[0001]本发明申请是 申请日期:为2010年3月12日、申请号为“201080005580.3”、发明名称为“改进的谐波转置”的发明专利申请的分案申请。【技术领域】[0002]本发明涉及在频率上对信号进行转置和/或在时间上对信号进行扩展/压缩,并 且尤其涉及音频信号的编码。换言之,本发明涉及时标修改和/或频标修改。更具体地,本 发明涉及包括频域谐波转置器(transposer)的高频重建(HFR)方法。【背景技术】[0003]HFR技术(例如谱带复制(SBR)技术)使得显著改进传统感知音频编解码器的编 码效率。与MPEG-4高级音频编码(AAC)组合,它形成非常有效的音频编解码器,已将其用在 XM卫星无线电系统和全球数字无线电系统(Digital Radio Mondiale)中,而且还在3GPP、 DVD论坛等中将其标准化。AAC和SBR的组合被称为aacPlus。这是MPEG-4标准的一部分, 其中,它被称作高效AAC规格(High Efficiency AAC Profile, HE-AAC)。通常,HFR技术可 以通过后向和前向兼容的方式与任何感知音频编解码器组合,因此提供使已经建立的广播 系统(类似于Eureka DAB系统中使用的MPEG层_2)升级的可能性。HFR转置方法也可以 与语音编解码器组合以允许超低比特率的宽带语音。[0004]HRF之后的基本构思是观测到通常存在信号的高频率范围的特性与同一信号的低 频率范围的特性之间的强相关性。因此,通过从低频率范围到高频率范围的信号转置可以 实现对于信号的原始输入高频率范围的表示的良好近似。[0005]在通过引用而合并的W098/57436中建立了这种转置的构思,以作为用于从音频 信号的较低频带重建高频带的方法。通过在音频编码和/或语音编码中使用该构思可以获 得比特率的大量节省。下文中,将提到音频编码,但应注意描述的方法和系统同样可应用于 语音编码并且可应用在统一的语音和音频编码(USAC)中。[0006]在基于HFR的音频编码系统中,低带宽信号被提供给用于编码的核心波形编码 器,使用通常以非常低的比特率被编码的并且描述目标谱形状的附加边信息和低带宽信号 的转置在解码器侧再生较高频率。对于低比特率,其中核心编码的信号的带宽窄,再现或合 成具有感知愉悦特性的高带(即音频信号的高频率范围)变得愈加重要。[0007]在现有技术中,存在一些使用例如谐波转置、或时间扩展的高频重建的方法。一种 方法基于在以足够高的频率解析度执行频率分析的原则下运行的相位音码器。在重合成信 号之前在频域中执行信号修改。信号修改可为时间扩展操作或转置操作。[0008]这些方法存在的潜在问题之一是,为了获得稳态声音的高质量转置、和瞬变声音 或冲击声音的系统时间响应而对预期的高频解析度进行相反的约束。换言之,尽管使用高 频解析度对稳态信号有利,但是这样的高频解析度通常要求大的窗尺寸,而当处理信号的 瞬变部分时,大的窗尺寸是有害的。处理该问题的一个方法可根据输入信号特性、例如通过 使用窗切换来自适应地改变转置器的窗。通常,为了实现高频解析度将对信号的稳态部分使用长窗,而为了实现转置器的良好的瞬变响应、即良好的时间解析度将对信号的瞬变部 分使用短窗。但是,该方法具有的缺点在于,不得不将诸如瞬变检测等信号分析措施合并到 转置系统中。这样的信号分析措施经常涉及触发信号处理的切换的判定步骤,例如对瞬变 的存在的判定。另外,这样的措施通常影响系统的可靠性,以及当切换信号处理时,例如当 在窗尺寸之间切换时,这样的措施可引入信号伪像。[0009]本发明解决有关谐波转置的瞬变性能的前述问题,而不需要窗切换。另外,以低的 附加复杂度实现了改进的谐波转置。
【发明内容】
[0010]本发明涉及谐波转置的改进的瞬变性能的问题,还涉及匹配的、对谐波转置的已 知方法的改进。另外,本发明概述了如何在保留所提出的改进的同时可将附加的复杂度保持在最小。[0011]其中,本发明可包括以下方面中的至少一个:[0012]-通过这样的因子在频率中进行过采样:该因子是转置器的操作点的转置因子 的函数;[0013]-对分析窗和合成窗的组合进行适当选择;以及[0014]-对于组合不同的转置的信号的情况,确保不同的转置的信号的时间对齐。[0015]根据本发明的方面,描述了一种用于使用转置因子T从输入信号生成转置的输出 信号的系统。转置的输出信号可为输入信号的时间扩展的版本和/或频移的版本。相对于 输入信号,可通过转置因子T在时间上扩展转置的输出信号。可替选地,可通过转置因子T 将转置的输出信号的频率分量向上移位。[0016]该系统可包括长度L的分析窗,其提取输入信号的L个样本。通常,输入信号的L 个样本是时域中的输入信号的样本,例如音频信号的样本。所提取的L个样本被称为输入 信号的帧。系统还包括M=F*L阶的分析变换单元,其利用作为频率过采样因子的F将L个 时域样本变换成M个复数系数。M个复数系数通常是频域中的系数。分析变换可为傅立叶 变换、快速傅立叶变换、离散傅立叶变换、小波变换或(可能调制的)滤波器组的分析阶段。 过采样因子F基于转置因子T或是转置因子T的函数。[0017]过采样操作也可被称为通过附加的(F_1)*L个零对分析窗进行零填充(zero padding)。过采样操作还可被视为通过因子F来选择大于分析窗的尺寸的分析变换的尺寸 M0[0018]该系统还可包括非线性处理单元,其通过使用转置因子T来改变复数系数的相 位。相位的改变可包括将复数系数的相位乘以转置因子T。另外,该系统可包括:M阶的合 成变换单元,其将改变的系数变换成M个改变的样本;以及长度L的合成窗,其生成输出信 号。合成变换可为逆傅立叶变换、逆快速傅立叶变换、逆离散傅立叶变换、逆小波变换、或 (可能)调制的滤波器组的合成阶段。通常,例如为了当转置因子T=I时实现输入信号的完 美重建,分析变换和合成彼此相关。[0019]根据本发明的另一方面,过采样因子F与转置因子T成比例。特别地,过采样因子 F可大于或等于(T+l)/2。过采样因子F的该选择确保合成窗拒绝可由转置引起的、不期望 的信号伪像,例如前回声和后回声。[0020]应当注意,更一般而言,分析窗的长度可为La,而合成窗的长度可为Ls。还是在这样的情况下,可有利的是,基于转置阶T、即根据转置阶T来选择变换单元的阶M。另外,可有利的是,将M选择成大于分析窗和合成窗的平均长度,即大于(La+Ls)/2。在实施例中,变换单元的阶M与平均窗长度之间的差与(T-1)成比例。在另一实施例中,将M选择成大于或等于(TLa+Ls)/2。应当注意,分析窗和合成窗的长度相等、即La=Ls=L的情况是以上一般情况的特殊情况。对于一般情况,过采样因子F可为:
【权利要求】
1.一种用于使用转置因子T执行输入信号(312)的谐波转置的系统,所述系统包括: -分析阶段(601,602,603),用于提取所述输入信号(312)的L个时域样本的帧,以及用于将所述L个时域样本变换成M个复数频域系数;-非线性处理单元(604),用于使用所述转置因子T来改变所述复数频域系数;-合成变换单元(605),用于将所改变的频域系数变换成M个改变的时域样本;以及 -合成窗单兀(606),用于从所述M个改变的时域样本提取L个时域输出样本;其中,M=F*L,F是基于所述转置因子T的频域过采样因子。
2.如权利要求1所述的系统,其中,所述过采样因子F大于或等于(T+l)/2。
3.如任一在前权利要求所述的系统,其中,所述非线性处理单元(604)被配置成使用所述转置因子T来改变所述复数频域系数的相位。
4.如权利要求3所述的系统,其中,所述相位的改变包括将所述相位乘以所述转置因子To
5.如任一在前权利要求所述的系统,其中,所述分析阶段(601,602,603)包括分析窗单元(602),其用于将分析窗(311)应用于所述输入信号(312),其中,所述分析窗(311)具有通过附加的(F-1) *L个零进行零填充的长度L。
6.如权利要求5所述的系统,其中,所述合成窗单兀(606)应用合成窗(321),并且其中所述分析窗(311)和所述合成窗(321)具有相等的长度。
7.如权利要求1至5中任一项所述的系统,其中,所述分析阶段(601,602,603)包括大小为M的分析变换单元(603),其用于将所述L个时域样本变换成M个复数频域系数。
8.如任一在前权利要求所述的系统,还包括:-分析步幅单元(601),其沿所述输入信号以Sa个样本的分析步幅将分析窗移位,从而生成所述输入信号的帧的序列;-合成步幅单元(607),其以Ss个样本的合成步幅将L个时域输出样本的相继帧移位;以及-交叠相加单元(608),其将L 个时域输出样本的相继的移位帧交叠和相加,从而生成输出信号。
9.如权利要求8所述的系统,还包括收缩单元(609),其通过转置阶T来增加所述输出信号的采样率;由此产生转置的输出信号。
10.如权利要求9所述的系统,其中-所述合成步幅是所述分析步幅的T倍;以及-通过所述转置因子T进行变调,所述转置的输出信号对应于所述输入信号。
11.一种用于通过转置因子T对输入信号(312)进行转置的方法,所述方法包括:-提取所述输入信号(312)的L个时域样本的帧;-将所述L个时域样本变换成M个复数频域系数;-使用所述转置因子T来改变所述复数频域系数;-将所改变的频域系数变换成M个改变的时域样本;以及 -从所述M个改变的时域样本提取L个时域输出样本;其中,M=F*L,F是基于所述转置因子T的频域过采样因子。
12.如权利要求11所述的方法,其中,将所述L个时域样本变换成M个复数频域系数包括执行傅立叶变换、快速傅立叶变换、离散傅立叶变换、小波变换之一。
13.如权利要求11至12中任一项所述的方法,其中,所述过采样因子F大于或等于 (T+l)/2。
14.如权利要求11至13中任一项所述的方法,其中,所述输入信号(312)包括音频信号的低频分量。
15.一种包括软件程序的存储介质,所述软件程序用于在处理器上执行,以及当在计算装置上被执行时用于执行权利要求11至14中任一项所述的方法的步 骤。
【文档编号】G10L21/038GK103559891SQ201310475634
【公开日】2014年2月5日 申请日期:2010年3月12日 优先权日:2009年9月18日
【发明者】佩尔·埃克斯特兰德, 拉尔斯·法尔克·维尔默斯 申请人:杜比国际公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1