音频信号编码的方法和装置的制作方法

文档序号:2837009阅读:288来源:国知局
专利名称:音频信号编码的方法和装置的制作方法
音频信号编码的方法和装置本发明涉及一种用于进行音频信号编码的方法和装置。本发明尤 其是涉及用于构成音频信号的方法和音频信号解码器以及涉及音频信 号编码器。在许多当代的通信系统中并且尤其是在移动通信系统中,只有有 限的传输带宽可供实时音频传输(诸如语音传输或者音乐传输)使用。 为了经过具有有限带宽的传输线路(诸如经过无线电网络)实时传输尽可能多的音频信道,因此经常规定通过有实时能力的或者有准实 时能力的音频编码方法压缩要传输的音频信号并且在传输之后解压这 些要传输的音频信号。在下面,概念"音频"尤其是也应被理解为语 音。在这种音频编码方法中,通常力求尽可能地减少要传输的数据量 并且由此尽可能地减小传输速率,而不会过分地损害主观的收听印象 (Hoereindruck)或在语音传输时过分地损害可理解性。基本的观点是,音频信号的有效压缩也与音频信号的存储或存档 相关联。以下编码方法被证明为特别有效的其中通过优化滤波器参数来 使由音频合成滤波器合成的音频信号逐个时帧地与要传输的音频信号 相适应。这样的方法方式常常也^皮称为综合分析(Analysis-by -Synthesis)。音频合成滤波器在此通过优选地同样要优化的激励信 号来激励。该滤波常常也被称为共振峰合成。例如所谓的LPC系数(LPC: 线性预测编码(Linear Predictive Coding))和/或详细i兌明了音频 信号的谱包络和/或时间包络的参数可以被用作滤波器参数。于是,优 化过的滤波器参数以及详细说明了激励信号的参数可以逐个时帧地被 传输到接收机,以便在那里借助设置在接收机侧的音频信号解码器来 形成合成的音频信号,该合成的音频信号在主观的收听印象方面尽可 能地类似于原始的音频信号。这种音频编码方法由ITU-T-推荐G. 729公知。借助在那里描述的 音频编码方法可以将带宽为4kHz的实时音频信号减小到8kbit/s的传 输速率上。此外,目前还力求利用较高的带宽来合成要传输的音频信号,以改善收听印象。在G. 792推荐中的目前讨论的扩展G. 729EV中尝试将 音频带宽从4kHz扩展到8kHz。可实现的传输带宽和音频合成质量基本上取决于产生适当的激励 信号。在带宽扩展的情况下,其中激励信号u^(k)已经处于低的子频带 中(例如在50Hz至3.4kHz的频率范围中),进行带宽扩展的激励信 号uhb (k)可以在高的子频带中(例如在3. 4 - 7kHz的频率范围中)被 构成为窄带的激励信号Unb(k)的频谱副本。(通过索引k在这里并且 在下面来指示激励信号或其他信号的采样值。)在这种情况下,副本 可以通过对窄带的激励信号unb ( k )进行频谱平移或者通过对窄带的激 励信号unb ( k )进行频谱镜像来构成。可是,通过这种频谱平移或者镜 像,激励信号的频镨非谐地失真和/或引起频谱中的明显的、可听到的 相位误差。可是,这导致音频信号的可听见的质量损失。本发明的任务在于说明一种用于构成音频信号的方法,该方法允 许改善听质量,其中传输带宽没有或者仅仅相对少地被提高。此外, 本发明的任务还在于说明一种用于执行该方法的音频信号解码器以及 音频信号编码器。该任务通过具有权利要求1所述的特征的方法、通过具有权利要 求14所述的特征的音频信号解码器以及通过具有权利要求15所述的 特征的音频信号编码器来解决。在根据本发明的用于构成音频信号的方法中,音频信号的分配到 第一子频带上的频率分量借助子频带解码器基于所输送的、分别说明 该音频信号的基本周期的基本周期值来构成。音频信号的分配到第二 子频带上的频率分量通过借助对于该第二子频带特定的激励信号来激 励音频合成滤波器而被构成。为了产生对于该第二子频带特定的激励 信号,通过激励信号发生器从基本周期值中导出基本周期参数。基于 所述基本周期参数,通过激励信号发生器以由基本周期参数所确定的 时间间隔构成具有取决于所述基本周期参数的脉冲波形的脉冲,并且 所述脉冲与噪声信号混合。借助本发明,可以基于基本周期值来合成音频信号的分配到其它 的第二子频带上的频率分量,其已经被供给对于该第一子频带特定的子频带解码器使用。因为为了产生噪声信号通常也不必需附加的音频 参数,所以激励信号的产生通常不要求附加的传输带宽。通过添加该 其它的第二子频带的频率分量,音频信号的收听质量可以在此期间显 著地被改善,尤其是因为由基本周期值确定的、谐波含量在第二子频 带中可以被复制。本发明的有利的实施形式和改进方案在从属权利要求中被说明。 根据本发明的有利实施形式,基本周期参数可以说明音频信号的 除了一小部分分配给子频带解码器的第一采样间隔以外的基本周期。通过除了一小部分(优选为1/N,其中N为整数)第一采样间隔之外进 行精确说明的基本周期参数,这些脉冲可以以相对于子频带解码器更 高的精度被间隔开,由此音频信号的谐波频谱能在第二子频带中更精 细地纟皮模拟。此外,相应脉冲的脉冲波形可以根据以第一采样间隔为单位的基 本周期参数的非整数部分而从被存储在查找表中的不同脉冲波形中被 选出。从查找表中能通过简单的调用以小的电路花费、处理花费或计 算花费实时地调用完全不同的脉冲波形。要存储的脉冲波形可以事先 在尽可能逼真的音频再现方面被优化。实际上,能事先计算出多个滤 波器、抽取滤波器(Dezimator)和/或调制器的累加效果或者累加的 脉冲响应,并且这些累加效果或者累加的脉冲响应在所有情况下作为 相对应成形的脉冲被存储在查找表中。在这一点,以下的转换器被称 为抽取滤波器通过丢弃除了每第m个采样值以外的所有采样值,该 转换器将信号的采样间隔乘以抽取因数m。调制器被理解为滤波器,该 滤波器将信号的单个采样值与预先给定的单个因数相乘并且输出相应 的乘积。此外,脉冲的时间间隔还可以通过以第一采样间隔为单位的基本 周期参数的整数部分来确定。才艮据本发明的另一有利的实施形式,所述脉冲可以由预先给定的 脉冲波形(例如矩形脉沖)通过采样值来构成,这些采样值具有第二 采样间隔,该第二采样间隔比第一采样间隔小了带宽扩展因数。以第 二采样间隔为单位的、所述脉冲的时间间隔于是可以通过与该带宽扩 展因数相乘的基本周期参数来确定。优选地,可以选择对应于以第一 采样间隔为单位的基本周期参数的精度的那个分数1/N的倒数N作为带宽扩展因数。优选地,所述脉冲通过具有以第二采样间隔预先给定的滤波器系 数的脉冲成形滤波器来成形。此外,在与噪声信号混合之前或之后,所述脉冲通过至少一个高 通滤波器、低通滤波器和/或带通滤波器来滤波和/或通过至少一个抽 取滤波器来抽取。按照本发明的另一有利的实施形式,基本周期参数可以逐个时帧 地由一个或多个基本周期值导出。在此,基本周期参数尤其是可以由多个时帧的、波动补偿地(优 选地非线性地)链接的基本周期值导出。通过这种方式可以避免,可 能例如由干扰噪声引起地错误测量音频基频所导致的基本周期值波动 或跳跃对基本周期参数产生不利的影响.在这一点,可以确定当前的基本周期值与较早的基本周期值或者 与由此导出的量的相对偏差,并且该相对偏差可以在导出基本周期参 数的范围内被衰减。按照本发明的另 一有利的实施形式,脉冲和噪声信号之间的混合 比通过至少一个混合参数来确定。该混合参数可以逐个时帧地由存在于子频带解码器中的、第一子频带的声调的(tonal)音频信号部分和 无调的(atonal)音频信号部分之间的电平关系来导出。通过这种方 式,可以将存在于子频带解码器中的、涉及第一子频带中的谐波噪声 比的电平参数用于构成第二子频带中的音频信号分量。此外,在导出混合参数的范围内,电平关系被转换来使得在无调 的音频信号部分占优势的情况下进一步降低声调的音频信号部分。因 为在自然的音频源中,无调的音频信号部分在较高的频带中(尤其是 从6kHz起往上)越来越占优势,因此通常可以通过这种降低来改善再 现质量。本发明的有利的实施例随后借助附图被详细阐述。在此,分别以示意图图l示出了音频信号解码器,图2示出了激励信号发生器的第一实施变形方案,图3a示出了脉冲成形滤波器的滤波器系数,图3b示出了滤波器系数的能量谱,图4示出了激励信号发生器的第二实施变形方案,以及 图5示出了事先计算出的脉冲波形。

图1以示意图示出了音频信号解码器,该音频信号解码器由所输 送的被编码的音频数据AD的数据流产生合成的音频信号SAS。合成的 音频信号SAS的产生被划分到不同的子频带上。这样,合成的音频信 号SAS的分配到低的第一子频带上的频率分量与合成的音频信号SAS 的分配到高的第二子频带上的频率分量分开地被产生。在随后的实施 例中示例性地假设低的子频带包括频率范围f = 0-4kHz,而高的子 频带包括频率范围f-4-8kHz。该低子频带在下面也被称为窄带的。在低的子频带中,所输送的音频数据AD由对于该低的子频带特定 的低频带解码器LBD(即具有基本上仅仅包含该低的子频带的带宽的解 码器)来解码。为此,利用尤其是在音频数据AD中所包含的、对于该 4氐的子频带特定的辅助信息(Nebeninformation),即利用无调的混 合参数gm、声调的混合参数g^以及基本周期值入uP。低频带解码器 (例如按照ITU推荐G. 729的语音编解码器)在此以f s = 8kHz的采样 率在频率范围f = 0 - 4kHz中产生窄带的音频信号NAS。在高的子频带中,由高频带激励信号发生器HBG基于由低频带解 码器LBD逐个时帧地提取的辅助信息gFIX、 gu-和XLTP来构成合成的激 励信号u(k)。变量k在这里以及在下面表示索引,通过该索引指出 激励信号或其它信号的数字采样值。该激励信号u (k)由激励信号发 生器HBG输送给音频合成滤波器ASYN,该激励信号u ( k )由此被激励 用于在频率范围f = 4-8kHz中产生合成的高频带音频信号HAS。高频 带音频信号HAS与窄带的音频信号MS组合,以便最后在频率范围f =0 — 8kHz中产生并且输出宽带的合成的音频信号SAS。借助音频信号解码器也可以以简单的方式实现音频信号编码器, 为此目的,合成的音频信号SAS要被馈送给比较装置(未示出),该 比较装置将合成的音频信号SAS与要编码的音频信号进行比较。通过 改变音频数据AD并且尤其是改变辅助信息gFIX、 gm和入ltp来使合成的 音频信号SAS与要编码的音频信号相适应。本发明可以有利地被用于通常的音频编码、用于子频带音频合成 以及用于音频信号的人为的带宽扩展。在这种情况下,后者可以被解 释为子频带音频合成的特殊情况,其中使用关于某个子频带的信息,以便重建或者估计另一子频带的缺失的频率分量。前面所提到的应用可能性基于适当构成的激励信号U(k)。代表音频信号的频谱精细结构的激励信号u (k)可以通过音频合成滤波器ASYN 以不同的方式(例如通过使其时间变化曲线和/或频率变化曲线成形) 被转换。为了使合成构成的激励信号u(k)尽可能精确地与原始的、由(子 频带-)音频信号编码器所使用的激励信号(未示出) 一致,所述合成 的激励信号u(k)优选地应具有下面的特征-合成的激励信号u(k)通常应具有平的频谱。在无调的声音(即 清音)的情况下,合成的激励信号u(k)为此可以由白噪声来构成。-对于声调的声音(即浊音),合成的激励信号u(k)应具有谐波 的信号分量,即为音频基频F。的整数倍的谱峰。然而,在实践中几乎不会出现纯粹的声调的音频信号或者纯粹的 无调的音频信号。相反,实际的音频信号通常包含声调的分量和无调 的分量的混合。合成的激励信号u(k)优选地被产生来以致原始的音频 信号的声调的分量和无调的分量的谐波噪声比(即能量比或强度比) 而尽可能精确地被复制。在声调的声音中,宽带的噪声部分通常被加到音频基频F。的谐波。 该噪声部分在频率较高时尤其是从6kHz起的情况下经常是占主导的。下面详细阐述适于音频编码、适于子频带音频合成以及适于音频 信号的人为带宽扩展的激励信号u(k)的构成。激励信号u(k)作为以预先给定的、例如为16kHz或8kHz的采样率 来采样的子频带信号被产生。该子频带信号u(k)代表4 - 8kHz的高子 频带的频率分量,窄带的音频信号MS的带宽通过所述频率分量被扩 展。窄带的音频信号NAS延伸在0-4kHz的频率范围上并且以8kHz的 采样率被采样。所构成的激励信号u(k)激励音频合成滤波器ASYN并且由此被成 形为高频带音频信号HAS。最后通过将所成形的高频带音频信号HAS 与具有较高的采样率(例如16kHz )的窄带的音频信号NAS进行组合来 产生合成的、宽带的音频信号SAS。激励信号u(k)的构成基于音频产生模型,其中声调的声音(即浊 音)通过脉冲序列来激励,而无调的声音(即清音)优选地通过白噪声来激励。规定了不同的修改方案,以便允许所混合的激励形式,通 过所述激励形式能实现改善的收听印象。激励信号U(k)的声调分量的产生基于音频产生模型的两个音频参数,即音频基频F。以及低子频带中的声调的音频分量与无调的音频分量之间的能量比或强度比y 。后者常常也被称为谐波噪声比 (Harmonics to Noise Ratio),简称为證。该音频基频F。在专业术语中也被称为"基本语音频率"。可以在所传输的音频信号的接收机中提取两个音频参数F。和y; 优选地(例如在带宽扩展的情况下)直接由音频信号的低频带或者(例 如在子频带音频合成的情况下)由所基于的低频带音频编解码器的低 频带解码器来提取这两个音频参数F。和y ,其中这种音频参数通常是 可支配的。音频基频F。常常由基本周期值来代表,该基本周期值通过用音频 基频F。除采样率来给出。基本周期值常常也被称为"变距摆振(pitch lag )"。基本周期值是以下音频参数该音频参数通常在诸如按照G. 729 推荐的标准音频编解码器中为了所谓的"长期预测(long-term prediction)"(简称LTP)而被传送。如果这种标准音频编解码器被 用于低的子频带,则音频基频F。可以基于由该音频编解码器所提供的 LPT音频参数来确定或者来估计。在许多标准音频编解码器(诸如按照G. 729推荐)中,LTP基本周 期值随着时间分辨率(即精度)被传送,该时间分辨率为该音频编解 码器所使用的采样间隔的一小部分1/N。在按照G. 729推荐的音频编解 码器中,提供了精度为采样间隔的1/3的LTP基本周期值.以该采样 间隔为单位,所述基本周期值因此也可以取非整数值。这种精度可以 由所涉及的音频编码器例如通过一系列所谓的"开环(open-loop)" 和"闭环(closed-loop)"搜索来实现。在这种情况下,音频编码器 尝试发现其中LTP剩余信号的强度或能量被最小化的那个基本周期值。 可是,通过这种方式所确定的LTP基本周期值尤其是在附加噪声强烈 的情况下可偏离对应于声调的音频分量的实际音频基频F。的基本周期 值,并且因此损害该声调的音频分量的精确复制。作为典型的偏差, 出现周期加倍误差(Periodenverdoppelungsfehler )和周期减半误差 (Periodenhalbierungsfehler )。也就是说,对应于偏离的1/TP基本周期值的频率是声调的音频分量的实际音频基频F。的一半或一倍。在将这种LTP基本周期值用来合成高子频带中的声调的音频分量 的情况下,应该避免这样大的频率偏差。为了最小化通常的周期加倍 误差和周期减半误差的影响,可以在本发明的范围内采用下面阐述的 后处理技术以入ltp( M )表示由低频带解码器LBD当前提取的LTP基本周期值, 其中y为分别被处理的时帧或子帧的索引。基本周期值入m( M )以低 频带解码器LBD的采样间隔为单位来给出并且也可以取非整数值。首先由当前的基本周期值入ltp(卩)和在前帧的被滤波的基本周期 值入p。st ( n - 1)之间的关系计算出整数因数f为<formula>formula see original document page 12</formula>
在这种情况下,函数round将其自变量映射到最接近的整数。 是否要修改当前的基本周期值入LTP( H )的决定根据下面的相对误 差来作出<formula>formula see original document page 12</formula>。如果相对误差e在预先给定的阈值s (例如1/10)之下,则假设,当 前的基本周期值入m( M )是具有周期加倍误差或周期减半误差的开始 相位的结果。在这种情况下,当前的基本周期值?utp ( P )通过除以因 数f被校正或被滤波,使得被滤波的基本周期值入p。" ( n )基本上持 续表现在多个时帧li上。被证明为有利的是,按照下式来确定被滤波 的基本周期值入一 (H ):<formula>formula see original document page 12</formula>否则通过在round函数的自变量中乘以因数N (例如N = 3),所得到的基 本周期值入p。" ( M )除了低频带解码器LBD的采样间隔的分数1/N以 外再次是精确的。最后,通过用于进一步平滑的基本周期值入—(M )来构成滑动 平均。该滑动平均对应于低通滤波的类型。利用例如对两个彼此相继 的基本周期值入—(P )进行滑动平均得到基本周期参数 )"Hi)+;i )。基于该基本周期参数导出用于高的子频带的激励信号u (k)。由于两 个值的平均值构成,基本周期参数入p ( y )具有高出两倍的分辨率, 该分辨率对应于低频带解码器LBD的采样间隔的小部分1/ (2N)。通过前面所阐述的、非线性的滤波过程,可以避免大多数的周期 加倍误差或通常的周期倍增误差。这导致再现质量得到明显改善。下面阐述,如何逐个时帧地由对于低子频带特定的、低频带解码 器LBD的混合参数gLTP ( n )和gFIX ( m )导出声调的混合参数gv ( p ) 和无调的混合参数guv( m ),用于在高的子频带中对激励信号u(k)的 相对应的声调的分量和无调的分量进行混合。在这种情况下假设,低 频带解码器LBD是所谓的CELP解码器(CELP:码本激励线性预测 (Codebook Excited Linear Prediction)),该CELP解码器具有所 谓的自适应的或者LTP码本和所谓的固定码本。在实际的音频信号中出现的声调声音几乎从来不会没有无调的信 号分量的贡献。为了估计在声调的信号贡献和无调的信号贡献之间的 能量比或强度比,按模型方式(modellhaft )假设自适应的码本仅 仅对在低子频带中的声调分量作出贡献,而固定码本仅仅对在低子频 带中的无调分量作出贡献。此外,还假设,这两种贡献彼此正交。基于该假设,可以由低频带解码器LBD的混合参数gm和gm重建 声调的信号分量和无调的信号分量之间的强度比。两个混合参数gw、 gm可以逐个时帧地从低频带解码器LBD中被提取。对于每个时帧或子 帧(通过h来指出)可以确定在自适应码本的贡献与固定码本的贡献 之间的瞬时强度比,也就是说,通过除自适应码本和固定码本的能量贡献来确定谐波噪声比Y 。混合参数gm ( h )说明自适应码本的信号的放大因数,而混合参 数gm ( P )说明固定码本的信号的放大因数。如果由自适应码本所输 出的码本矢量用( m )表示,而由固定码本所输出的码本矢量用 xFIX ( n )表示,则得到谐波噪声比Y为<formula>formula see original document page 13</formula>为了更好地模拟高子频带中的无调音频分量,按照下式通过维纳(Wiener )滤波器来转换由低子频带所导出的谐波噪声比Y :通过该"维纳"滤波,进一步降低了小的Y (无调的音频段), 而Y的大的值(声调占优势的音频段)几乎不被改变。通过这种降低, 更好地接近了自然的音频信号。由被滤波的谐波噪声比最后可以将高子频带中的激励信号U(k)的声调的分量或无调的分量的放大因数(即混合参数)gv和guv确定为因为在实践中几乎不出现纯粹的声调的音频信号或纯粹的无调的 音频信号,所以两个混合参数gv ( H )或guv ( H )通常(同时)具有不 为零的值。通过前面的计算规则保证了混合参数gv和guv的平方和(即 混合的激励信号u(k)的总能量)基本上恒定。在下面,以激励信号发生器HBG的两个实施变形方案为例详细地 阐述基于由低频带解码器LBD导出的音频参数gv、 g^和入p来产生激励 信号u(k)。在这种情况下,出于清楚的原因,假设以低频带解码器LBD 的采样间隔为单位的基本周期值的精度通过其中N - 3的1/N来给出。 随后的实施方案自然可以容易地套用到N的任意值。在图2中示意性示出了激励信号发生器HBG的笫一实施变形方案。 在图2中示出的实施变形方案具有脉冲发生器PG1、噪声发生器N0ISE、 具有截止频率f。 = 8kHz的低通滤波器LP、具有抽取因数m = 3 (或一般 地m-N)的抽取滤波器D3、具有截止频率f。 = 4kHz的高通滤波器HP 以及具有抽取因数111= 2的抽取滤波器D2。噪声发生器NOISE优选地产 生白噪声。脉冲发生器PG1在其侧包括矩形脉冲发生器SPG和具有预 先给定的有限长度的滤波器系数组P (k)的脉冲成形滤波器SF.噪声 发生器NOISE用于产生激励信号u (k)的无调的分量,而脉冲发生器PG1 贡献于产生激励信号u(k)的声调分量。逐个时帧地以连续的顺序由低频带解码器LBD的音频参数导出和 匹配音频参数gv、 和入P或者借助适当的音频参数提取块导出和匹配 音频参数gv、 g^和入p。滤波器操作针对以低频带解码器LBD的采样间隔为单位的、具有1/ (2N)(这里等于1/6)的精度的分数的 (fraktionalen)的基本周期参数入p并且针对对应于低频带解码器 LBD的带宽的目标带宽来设计。因为低频带解码器LBD根据其0-4kHz的带宽使用8kHz的采样率, 并且借助激励信号u (k)应该产生4 - 8kHz (即具有4kHz带宽)的音频 分量,所以对于脉冲发生器PG1设置了至少8kHz的采样率。可是,根 据在本实施例中的、基本周期参数"的高了 2N-6倍的时间分辨率, 不仅对于脉冲发生器PG1而且对于噪声发生器NOISE设置了采样率fs =2*N*8 kHz=6*8kHz = 48kHz。为了产生激励信号的声调部分,基本周期参数入p乘以倍数2N = 6, 并且将乘积6*入1)输送给矩形脉冲发生器SPG。因此,矩形脉冲发生器 SPG以通过6*入p(以矩形脉冲发生器SPG的采样间隔1/48000s为单位) 所给出的时间间隔产生单个矩形脉冲。这些单个矩形脉冲具有幅度 ^pi;,以致长的脉冲序列的平均能量基本上等于1。由矩形脉冲发生器SPG所产生的矩形脉冲与"声调的"混合参数 gv相乘并且被馈送给脉冲成形滤波器SF。在脉冲成形滤波器SF中,矩 形脉沖通过巻积或者与滤波器系数p (k)相关而在一定程度上在时间 上#皮"涂抹(verschmiert)"。通过这种滤波,可以明显减少所谓的 峰值(Crest)因数(即采样值峰值与采样值平均值的比),并且明显 改善所合成的音频信号SAS的收听质量。此外,矩形脉冲可以通过脉 冲成形滤波器SF以有利的方式在频谙上成形。优选地,脉冲成形滤波 器SF为此可以具有带通特性,该带通特性的过渡区为4kHz并且朝较 高和较低的频率方向的衰减增加基本上均匀。通过这种方式可以实现, 激励信号u(k)的较高的频率较少地具有谐波分量,并且因此噪声部分 随着频率的升高而上升。滤波器系数p (k)的示例性选择在图3a和3b中被示意性示出。 图3a示出了相对于其采样值索引k所绘出的滤波器系数p (k),而在 图3b中相对于频率绘出了滤波器系数p(k)的能量谱。在滤波器系数 P(k)中,对于在本实施例中的决定性的目标频率范围,基本上仅仅 频谱范围4-8kHz是相关的。该频率范围在图3b中通过加宽的线条来 示出。如在图2中所示的那样,将通过脉冲成形滤波器SF "涂抹的"矩形脉冲加到由噪声发生器NOISE产生的、与"无调的"混合参数guv相 乘的噪声信号上,并且将所得到的总和信号馈送给低通滤波器LP。直至该方法步骤都使用提高的采样率fs-48kHz。在图2中所示出 的剩余的处理块现在用于将在目标频率范围4-8kHz之外的频率范 围滤除,并且在代表该目标频率范围的表达(采样率为fs-8kHz)中 产生激励信号u(k)。出于该目的,首先由低通滤波器LP对总和信号进行滤波,并接着 将被滤波的信号通过抽取滤波器D3从48kHz的采样率转换到fs = 16kHz的采样率。紧接着将转换过的信号输送给高通滤波器HP,该高 通滤波器HP将高通滤波过的信号馈送给抽取滤波器D2,该抽取滤波器 D2由所输送的、具有16kHz的采样率的信号最后产生目标采样率为fs -SkHz的激励信号u(k)。所产生的激励信号u(k)包含为了进行频带扩展必要的频率分量。 可是,这作为在4kHz频率周围镜像的频谱存在。为了将该频谱倒转, 可以用调制因数(-1)'对激励信号u(k)进行调制。因为按照图1的音频信号解码器的组件基本上是线性的和时间不 变的,所以激励信号u(k)的声调部分和无调部分可以彼此独立地被处 理。因此,在按照图2的实施变形方案中所设置的、声调的音频分量 的滤波器操作和抽取操作也可以被概括在唯一的处理块中。实际上, 所有在图2中为声调的音频分量而设置的滤波操作、抽取操作和调制 操作的脉冲相应也可以事先被计算出,并且以适当的形式被存储在查 找表中。激励信号发生器HBG的、这样构造的第二实施变形方案在图4中 被示意性示出并在下面被阐述。在图4中示出的实施变形方案具有脉 冲发生器PG2以及优选地产生白噪声的噪声发生器N0ISE。该脉冲发生 器PG2在其侧包括脉冲定位装置PP以及查找表LOOKUP,其中存储了预 先给定的脉沖波形Vj (k)。噪声发生器NOISE用于产生激励信号u(k) 的无调分量,而脉沖发生器PG2贡献于产生激励信号u (k)的声调分量。 不仅噪声发生器NOISE而且脉冲发生器PG2都直接使用目标采样率fs =8kHz。逐个时帧地以连续的顺序将音频参数gv、 guv和入p馈送给激励信号 发生器。音频参数gv、 guv和入p的导出在上面已经阐述过。分数的基本周期参数入p如上所述地利用精度1/ (2N)(这里等于1/6)以低频带 解码器LBD的采样率为单位来给出。对于激励信号u(k)的声调分量,所有通过图2示出的滤波器操作、 抽取操作和调制操作的脉冲响应也可以事先被计算出,并且以一定的 脉冲波形Vj (k)的形式被存储在查找表LOOKUP中。只要(如在本实 施例中那样)也应该考虑非整数的基本周期参数入p,就要在查找表 LOOKUP中维持多个脉冲波形Vj (k)。在此,要维持的脉冲波形Vj (k) 的数量优选地通过基本周期参数"的精度的倒转(这里即通过2N)来 给出。索引j由此例如为从0至2N-1。在本情况下,相对应地将6个 事先计算出的脉冲波形Vj(k) (j = 0,…,5 )维持在查找表LOOKUP 中。在脉冲发生器PG2工作时,相应的基本周期参数入p的分数部分 、-L、」被输送给查找表L00KUP。在这种情况下,括号L」表示有理数或者实数的整数部分。基于所输送的分数部分、-[>P」,从所存储的脉冲 波形Vj (k)中选出脉冲波形并且由查找表LOOKUP输出相对应成形的 脉冲。在本实施例中,、-L、」可以取值0、 1/6、 2/6、 3/6、 4/6和5/6,优选地,选出其索引j对应于所涉及的分数的相应计数器的那个脉冲 波形Vj (k)。所存储的脉冲波形Vj (k)中的每一个相应于在图2中所示的、由 滤波器SF、 LP、 D3、 HP和D2 (以及必要时的调制器)构成的链的对于 基本周期参数入p的某个分数部分、-[\」的脉冲响应。图5以示意图示出了示例性地计算出的脉冲波形Vj (k) , j = 0,…,5。对于为1/6的人p的分数分辨率(在采样率为8kHz的情况下), 构建了所示出的脉冲波形Vj (k)并且将其相对于其采样索引k绘出。 将相应脉冲波形Vj (k)分配到所属的分数部分、-L、」的分配能从图5 的图例得知。如在图4中所示的那样,由查找表LOOKUP所输出的脉冲(该脉冲 具有基于分数部分、-L、」所选出的脉冲波形)与"声调的"混合参数 gv相乘并且被馈送给脉冲定位装置PP。通过后者,所馈送的脉冲根据 基本周期参数Xp的整数部分L、」在时间上被定位。在这种情况下,这 些脉冲由脉冲定位装置PP以对应于基本周期参数入P的整数部分L、」的 时间间隔来输出。这些脉冲可以被调制,其方式是脉冲波形Vj(k)或所涉及的脉冲的相应符号或者对于L、」的偶数值或者对于L、」的奇数值被倒转。最后,将噪声发生器NOISE的与"无调的"混合参数g^相乘的噪 声信号加到由脉冲定位装置PP输出的脉冲上,以便获得激励信号 u(k)。在图4中所示的实施变形方案通常能以比在图2中所示的实施变 形方案更少的花费来实施。实际上,利用按照图4的激励信号发生器, 通过预给定适当的脉冲波形Vj (k)能有效地生成与利用按照图2的激 励信号发生器效果相同的激励信号u(k)。因为所输出的脉冲具有相对 大的间隔(通常为20 - 134个采样间隔),所以用于按照图4的根据 本发明的激励信号发生器的计算花费相对较小。因此,本发明可以借 助有利的数字信号处理器以在存储器需求和计算功率方面相对较小的 要求被实施。
权利要求
1.用于构成音频信号(SAS)的方法,其中a)该音频信号的分配到第一子频带上的频率分量(NAS)借助子频带解码器(LBD)基于所输送的、分别说明该音频信号(SAS)的基本周期的基本周期值(λLTP)来构成,b)该音频信号的分配到第二子频带上的频率分量(HAS)通过借助对于该第二子频带特定的激励信号(u(k))激励音频合成滤波器(ASYN)来构成,并且c)为了产生激励信号(u(k)),通过激励信号发生器(HBG)-由基本周期值(λLTP)导出基本周期参数(λp),以及-以通过该基本周期参数(λp)确定的时间间隔构成具有取决于该基本周期参数(λp)的脉冲波形的脉冲,并且所述脉冲与噪声信号进行混合。
2. 按照权利要求1所述的方法,其特征在于,对于所述第一子频带特定的第一采样间隔被分配给所述子频带解 码器(LBD),并且基本周期参数(入p)说明音频信号(SAS)的除了 第一采样间隔的小部分以外的基本周期。
3. 按照权利要求2所述的方法,其特征在于,相应脉冲的脉冲波形(Vj (k))根据以第一采样间隔为单位的基 本周期参数(入p)的非整数部分(、-L、」)而从不同的、存储在查找 表中的预先给定的脉冲波形(Vj (k))中被选出。
4. 按照权利要求2或3所述的方法,其特征在于,所述脉冲的时间间隔通过以第一采样间隔为单位的基本周期参数 (入p)的整数部分(L、」)来确定,
5. 按照权利要求2或3所述的方法,其特征在于, 所述脉冲由预先给定的脉冲波形通过具有第二采样间隔的采样值来构成,其中第二采样间隔比第一采样间隔小带宽扩展因数(N),并 且以第二采样间隔为单位的、所述脉冲的时间间隔通过与该带宽扩 展因数(N)相乘的基本周期参数(入p)来确定。
6. 按照权利要求5所述的方法,其特征在于, 所述脉冲通过具有在第二采样间隔中预先给定的滤波器系数(p(k))的脉冲成形滤波器(SF)来成形
7. 按照权利要求5或6所述的方法,其特征在于, 在与噪声信号混合之前或之后,所述脉冲通过至少一个抽取滤波器(D2, D3)被抽取.
8. 按照前述权利要求之一所述的方法,其特征在于, 在与噪声信号混合之前或之后,所述脉冲通过至少一个高通滤波器、低通滤波器和/或带通滤波器来滤波。
9. 按照前述权利要求之一所述的方法,其特征在于, 所述基本周期参数(入p)逐个时帧地由一个或多个基本周期值(X LTP ) 出。
10. 按照前述权利要求之一所述的方法,其特征在于, 所述基本周期参数(入p)由多个时帧的、波动补偿地链接的基本周期值(入w)导出。
11. 按照前述权利要求之一所述的方法,其特征在于,当前的基本周期值(入ltp)与较早的基本周期值或者与由此导出的量(入p。")的相对偏差(e)被确定,并且所述相对偏差(e)在导出基本周期参数(入p)的范围内被衰减。
12. 按照前述权利要求之一所述的方法,其特征在于, 所述脉冲与所述噪声信号之间的混合比通过至少一个混合参数(gv, guv)来确定,所述混合参数逐个时帧地由存在于子频带解码器 (LBD)中的、第一子频带的声调的音频信号分量与无调的音频信号分 量之间的电平比(y)来导出。
13. 按照权利要求12所述的方法,其特征在于, 在导出所述混合参数(gv, guv)的范围内,电平比(y)被转换来使得在无调的音频信号部分占优势的情况下降低声调的音频信号部 分。
14. 用于构成音频信号(SAS)的音频信号解码器,其具有a) 子频带解码器(LBD),用于基于所输送的、分别说明该音频 信号(SAS)的基本周期的基本周期值(?Utp)来构成该音频信号的分 配到笫一子频带上的频率分量(NAS),b) 音频合成滤波器(ASYN),以及c) 激励信号发生器(HBG),用于生成激励信号(u(k)),以通过激励音频合成滤波器来构成音频信号的分配到第二子频带上的频率分量(HAS),其中,该激励信号发生器(HBG)具有-用于由基本周期值(>UTP)导出基本周期参数(入p)的导出装置-用于构成噪声信号的噪声发生器(NOISE),-脉冲发生器(PG1, PG2),用于以由该基本周期参数(入p)确 定的时间间隔构成具有取决于该基本周期参数(入p)的脉冲波形的脉 冲,以及-用于将所述脉冲与所述噪声信号进行混合的混合装置。
15.音频信号编码器,其具有根据权利要求14所述的音频信号解码器以及具有比较装置,该比较装置用于使由音频信号解码器所构成的音频信号与要传输的音频信号相适应。
全文摘要
为了构成音频信号(SAS),该音频信号的分配到第一子频带上的频率分量(NAS)借助子频带解码器(LBD)基于所输送的、分别说明该音频信号的基本周期的基本周期值(λ<sub>LTP</sub>)来构成。该音频信号的分配到第二子频带上的频率分量(HAS)通过借助对于该第二子频带特定的激励信号(u(k))来激励音频合成滤波器(ASYN)被构成。为了产生激励信号(u(k)),通过激励信号发生器(HBG)由基本周期值(λ<sub>LTP</sub>)导出基本周期参数(λ<sub>p</sub>)。基于基本周期参数(λ<sub>p</sub>),通过激励信号发生器(HBG)以由该基本周期参数(λ<sub>p</sub>)确定的时间间隔构成具有取决于该基本周期参数(λ<sub>p</sub>)的脉冲波形的脉冲,并且将所述脉冲与噪声信号进行混合。
文档编号G10L19/02GK101336451SQ200680052128
公开日2008年12月31日 申请日期2006年1月31日 优先权日2006年1月31日
发明者B·盖瑟, H·塔戴, M·加特纳, P·瓦里, P·贾克斯, S·尚德尔 申请人:西门子企业通讯有限责任两合公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1