用于编码音频信号的编码器、音频发送系统和用于确定校正值的方法

文档序号:9932717阅读:439来源:国知局
用于编码音频信号的编码器、音频发送系统和用于确定校正值的方法
【技术领域】
[0001] 本发明设及用于编码音频信号的编码器、音频发送系统、用于确定校正值的方法、 W及计算机程序。本发明还设及导谱频率/线谱频率加权。
【背景技术】
[0002] 在如今的语音和音频编解码中,通过线性预测提取语音或音频信号的频谱包络并 进一步对线性预测系数化PC)的变换进行量化和编码是最新技术。运样的变换例如是线谱 频率化S巧或导谱频率(ISF)。
[0003] 由于性能的增强,对于LPC量化而言,矢量量化(VQ)通常要优于标量量化。然而,已 经观察到,最优LPC编码针对LSF或ISF的矢量的每个频率表现出不同的标量敏感性。作为直 接结果,将经典的欧氏距离作为量化步长的度量将会导致非最优的系统。运可通过W下事 实来解释:通常通过距离(如,对数谱距离化SD)或加权对数谱距离(WLSD))来测量LPC量化 的性能,运些距离与欧氏距离没有直接的比例关系。
[0004] LSD被定义为原始LPC系数及其量化版本的频谱包络的欧氏距离的对数。WLSD是考 虑到低频相比于高频在感知上更相关的加权版本。
[0005] LSD和WLSD二者都太复杂,W至于不能在LPC量化方案中计算。因此,多数LPC编码 方案使用简单欧氏距离或其加权版本(WED),定义为:
[0006]
[0007]其中,Isfi是要量化的参数,且qlsfi是已量化参数。W是给予某些系数更多的失真 并给予其他系数较少失真的权重。
[000引 Laroia等[1]呈现了被称为反调和平均的启发式方案,W计算向靠近共振峰区域 的LSF给予更多重要性的权重。如果两个LSF参数靠近在一起,预期信号频谱包括接近该频 率的尖峰。因此,靠近其相邻LSF之一的LSF具有较高的标量敏感性,并应被给予较高的权
重。
[0009]
[0010] 利用该伪LSF来计算第一个加权系数和最后一个加权系数:
[00川 Isf日=OW及lsfp+i = 3i,其中,P是LP模型的阶数。对于WSkHz采样的语音信号而 言,阶数通常是10,且对于W16曲Z采样的语音信号而言,阶数通常是16。
[0012] Gardner和Rao [2]根据高速近似推导出了LSF的单独的标量敏感性(例如,在使用 具有30个或更多比特的VQ时)。在运样的情况下,推导出的权重是最优的,且最小化了LSD。 标量权重形成W下给出的所谓敏感性矩阵的对角线:
[0013]
[0014] 其中,Ra是根据LPC分析的原始预测性系数推导出的合成滤波器1/A(z)的脉冲响 应的自相关矩阵。Ju( ?)是将LSF变换为LPC系数的化CObian矩阵。
[0015] 该解决方案的主要缺陷是计算敏感性矩阵的计算复杂度。
[0016] ITU推荐G.718[3]通过添加一些屯、理声学考虑扩展了 Gardner的方案。替代考虑矩 阵Ra,其考虑感知加权合成滤波器W( Z)的脉冲响应:
[0017] W(Z) =^(z)/(A(z)
[0018] 其中,Wb(Z)是对向低频给出更多重要性的Bark加权滤波器进行近似的IIR滤波 器。然后,通过将IA(Z)替换为W(Z)来计算敏感性矩阵。
[0019] 虽然G. 718中使用的加权是理论上的接近最佳方案,其从Gardner的方案继承了非 常高的复杂度。如今的音频编解码是在复杂度有限的情况下标准化的,并因此关于该方案, 复杂度与感知质量的增益的折衷不令人满意。
[0020] Laroia等呈现的方案可产生非最佳的权重,但具有较低复杂度。该方案生成的权 重平等地对待整个频率范围,然而人类耳朵敏感度是高度非线性的。与较高频率中的失真 相比,较低频率中的失真要容易听得到的多。
[0021] 因此,存在改进编码方案的需求。

【发明内容】

[0022] 本发明的目标是提供考虑到算法的计算复杂度和/或考虑到其精确度增加且同时 维持对编码音频信号进行解码时的良好音频质量的编码方案。
[0023] 该目标是通过根据权利要求1所述的编码器、根据权利要求10所述的音频发送系 统、根据权利要求11所述的方法W及根据权利要求15所述的计算机程序来实现的。
[0024] 发明人已发现:通过使用包括低计算复杂度的方法确定频谱加权因子,并通过使 用预先计算的校正信息来至少部分地校正所获得的频谱加权因子,所获得的已校正频谱加 权因子可允许在维持编码精确度的同时W较低的计算量来编码和解码音频信号,和/或降 低减少的线谱距离化SD)。
[0025] 根据本发明的实施例,一种用于编码音频信号的编码器包括:分析器,用于分析所 述音频信号,W及用于根据所述音频信号确定分析预测系数。编码器还包括:变换器,被配 置为根据所述分析预测系数推导已变换预测系数,W及存储器,被配置为存储一定数量的 校正值。编码器还包括计算器和比特流形成器。计算器包括处理器、组合器和量化器,其中, 处理器被配置为处理所述已变换预测系数,W获得频谱加权因子。组合器被配置为将所述 频谱加权因子与所述数量的校正值进行组合,W获得已校正加权因子。量化器被配置为:使 用所述已校正加权因子量化所述已变换预测系数,W获得所述已变换预测系数的量化表 示,例如与数据库中的预测系数的条目有关的值。比特流形成器被配置为:基于与所述已变 换预测系数的所述量化表示有关的信息并基于所述音频信号,形成输出信号。本实施例的 优点是处理器可通过使用包括低计算复杂度的方法和/或概念来获得频谱加权因子。通过 应用一定数量的校正值,可至少部分地校正与其他概念或方法有关的可能获得的误差。在 与基于[3]的确定规则相比时,运实现了权重导出的降低的计算复杂度,且与根据[1]的确 定规则相比时,运实现了降低的LSD。
[0026] 其他实施例提供了一种编码器,其中,组合器被配置为:将所述频谱加权因子、所 述数量的校正值W及与所述输入信号有关的另一信息进行组合,W获得所述已校正加权因 子。通过使用所述与输入信号有关的另一信息,在维持较低计算复杂度的同时,可实现对所 获得的已校正加权因子的进一步增强,具体地,当在其他编码步骤期间至少部分地获得所 述与输入信号有关的另一信息时,使得所述另一信息可循环使用。
[0027] 其他实施例提供了一种编码器,其中,组合器被配置为:在每个周期中循环获得所 述已校正加权因子。计算器包括:平滑器,被配置为对针对先前周期获得的第一量化加权因 子和针对所述先前周期之后的周期获得的第二量化加权因子进行加权组合,W获得平滑的 已校正加权因子,所述平滑的已校正加权因子包括所述第一量化加权因子的值与所述第二 量化加权因子的值之间的值。运使得可降低或防止转变失真,特别是在两个连续周期的已 校正加权因子被确定为使得它们在彼此进行比较时包括较大差异的情况下。
[0028] 其他实施例提供了一种音频发送系统,包括:编码器,W及解码器,被配置为接收 所述编码器的输出信号或根据所述输出信号推导出的信号,且解码接收到的信号,W提供 合成音频信号,其中,所述编码器的输出信号是经由传输介质(例如,有线介质或无线介质) 发送的。该音频发送系统的优点在于解码器可基于未改变的方法来分别解码所述输出信号 和所述音频信号。
[0029] 其他实施例提供一种用于确定针对第一数量的第一加权因子的校正值的方法。每 个加权因子适于加权音频信号的例如被表示为线谱频率或导谱频率的部分。针对每个音频 信号,第一数量的第一加权因子是基于第一确定规则来确定的。针对音频信号组中的每个 音频信号,第二数量的第二加权因子是基于第二确定规则来确定的。第二数量的加权因子 中的每一个与第一加权因子有关,即,可基于第一确定规则并基于第二确定规则,针对音频 信号的一部分确定加权因子,W获得可能不同的两个结果。计算第=数量的距离值,所述距 离值具有与第一加权因子和第二加权因子之间的距离有关的值,所述第一加权因子和所述 第二加权因子二者与所述音频信号的所述部分有关。计算第四数量的校正值,所述校正值 适于在与所述第一加权因子组合时减少所述距离,使得当将所述第一加权因子与所述第四 数量的校正值组合时,与所述第二加权因子相比,减少了已校正的第一加权因子之间的距 离。运允许基于训练数据来计算加权因子,训练数据一次基于包括高计算复杂度和/或高精 确度的第二确定规则且另一次基于可包括较低计算复杂度并可具有较低精确度的第一确 定规则来设置,其中,通过校正来至少部分地补偿或降低该较低精确度。
[0030] 其他实施例提供通过适配多项式来降低所述距离的方法,其中,多项式系数与校 正值有关。其他实施例提供一种计算机程序。
【附图说明】
[0031] 现在参考附图来详细描述本发明的优选实施例,在附图中:
[0032] 图1示出了根据实施例的用于对音频信号进行编码的编码器的示意性框图;
[0033] 图2示出了根据实施例的计算器的示意性框图,其中,与图1示出的计算器相比,对 计算器进行了改良;
[0034] 图3示出了根据实施例的编码器的示意性框图,该编码器附加地包括频谱分析器 和频谱处理器;
[0035] 图4a示出了根据实施例的矢量,该矢量包括变换器基于所确定的预测系数获得的 16个线谱频率值;
[0036] 图4b示出了根据实施例的由组合器执行的确定规则;
[0037] 图4c示出了根据实施例的示例性确定规则,用于示出获得已校正加权因子的步 骤;
[0038] 图5a描绘了根据实施例的示例性确定方案,该确定方案可由量化器实现,W确定 已变换预测系数的量化表示;
[0039] 图5b示出了根据实施例的量化值的示例性矢量,该量化值可被组合为量化值的集 合;
[0040] 图6示出了根据实施例的音频发送系统的示意性框图;
[0041] 图7示出了推导校正值的实施例;W及
[0042] 图8示出了根据实施例的用于编码音频信号的方法的示意性流程图。
【具体实施方式】
[0043] 在下面的描述中,即使在不同的图中出现,同样的或等同的元素或者具有同样的 或等同的功能的元素也由同样的或等同的附图标记来表示。
[0044] 在下面的描述中阐述众多细节,W提供对本发明实施例的更透彻的解释。然而,对 本领域技术人员将显而易见的是,可W在没有运些特定细节的情况下实践本发明的实施 例。在其他实例中,W框图形式而非细节示出了公知的结构和设备,W避免模糊本发明的实 施例。此外,除非特别指出,可将之后描述的不同实施例的特征彼此组合。
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1