用于通过应用分布量化和编码建模累积和表示的音频信号包络编码、处理和解码的装置...的制作方法

文档序号:9673127阅读:319来源:国知局
用于通过应用分布量化和编码建模累积和表示的音频信号包络编码、处理和解码的装置 ...的制作方法
【技术领域】
[0001] 本发明涉及一种用于音频信号包络编码、处理和解码的装置和方法,尤其涉及,一 种用于应用分布量化和编码的音频信号包络编码、处理和解码的装置和方法。
【背景技术】
[0002] 线性预测编码(LPC)为用于在语音编解码器中对核心带宽的谱包络进行建模的 典型工具。用于对LPC模型进行量化的最常见域为线谱频率(LSF)域。它基于LPC多项式 到两个多项式的分解,其根在单位圆上,从而可以仅通过它们的角度或频率对它们进行描 述。

【发明内容】

[0003] 本发明的目的在于提供用于音频信号包络编码和解码的改进构思。通过根据权利 要求1的装置、根据权利要求9的装置、根据权利要求15的方法、根据权利要求16的方法 以及根据权利要求17的计算机程序实现本发明的目的。
[0004] 提供一种用于从一个或多个编码值生成音频信号包络的装置。该装置包括:用于 接收一个或多个编码值的输入接口;以及用于依据一个或多个编码值生成音频信号包络的 包络生成器。包络生成器用于依据一个或多个编码值生成聚合函数,其中聚合函数包括多 个聚合点,其中聚合点中的每个包括参数值和聚合值,其中聚合函数单调递增,其中一个或 多个编码值中的每个指示聚合函数的聚合点中的一个的参数值和聚合值中的至少一个。此 外,包络生成器用于生成音频信号包络,以使得音频信号包络包括多个包络点,其中包络点 中的每个包括参数值和包络值,并且其中音频信号包络的包络点被分配给聚合函数的聚合 点中的每个,以使得该包络点的参数值等于该聚合点的参数值。此外,包络生成器用于生成 音频信号包络,以使得音频信号包络的包络点中的每个的包络值取决于聚合函数的至少一 个聚合点的聚合值。
[0005] 根据一个实施例,包络生成器可以,例如,用于通过为一个或多个编码值中的每个 依据该编码值确定聚合点中的一个以及通过依据一个或多个编码值中的每个的聚合点应 用插值以获得聚合函数来确定聚合函数。
[0006] 在一个实施例中,包络生成器可以,例如,用于在聚合函数的多个聚合点处确定聚 合函数的一阶导数。
[0007] 根据一个实施例,包络生成器可以,例如,用于依据编码值生成聚合函数,以便聚 合函数具有连续的一阶导数。
[0008] 在一个实施例中,包络生成器可以,例如,用于通过应用
以确定音频信号包络;
[0009] 其中tilt(k)指示聚合的信号包络在第k个编码值处的导数,其中c(k)为聚合函 数的第k个聚合点的聚合值,以及其中f(k)为聚合函数的第k个聚合点的参数值。
[0010] 根据一个实施例,输入接口可以用于接收一个或多个分裂值作为一个或多个编码 值。包络生成器可以用于依据一个或多个分裂值生成聚合函数,其中一个或多个分裂值中 的每个指示聚合函数的聚合点中的一个的聚合值。此外,包络生成器可以用于生成重建的 音频信号包络,以使得一个或多个分裂点将重建的音频信号包络划分成两个或更多个音频 信号包络部分,其中预定义的分配规则为两个或更多个信号包络部分中的每个信号包络部 分,依据该信号包络部分,定义信号包络部分值。此外,包络生成器可以用于生成重建的音 频信号包络,以使得对于两个或更多个信号包络部分中的每个,其信号包络部分值的绝对 值大于其他信号包络部分中的每个的信号包络部分值的绝对值的一半。
[0011] 此外,提供一种用于确定用于对音频信号包络进行编码的一个或多个编码值的装 置。该装置包括:用于为多个参数值中的每个确定聚合值的聚合器,其中对多个参数值排 序,以使得当多个参数值中的第二参数值与多个参数值中的第一参数值不同时,该第一参 数值在第二参数值之前或之后,其中包络值被分配给参数值中的每个,其中参数值中的每 个的包络值取决于音频信号包络,并且其中聚合器用于为多个参数值中的每个参数值,依 据该参数值的包络值并依据在该参数值之前的多个参数值中的每个的包络值,确定聚合 值。此外,该装置包括用于依据多个参数值的聚合值中的一个或多个确定一个或多个编码 值的编码单元。
[0012] 根据一个实施例,聚合器可以,例如,用于为多个参数值中的每个参数值,通过对 该参数值的包络值和在该参数值之前的参数值的包络值进行相加以确定聚合值。
[0013] 在一个实施例中,参数值中的每个的包络值可以,例如,指示以音频信号包络作为 信号包络的音频信号包络的能量值。
[0014] 根据一个实施例,参数值中的每个的包络值可以,例如,指示以音频信号包络作为 信号包络的音频信号包络的谱值的η次幂,其中η为大于0的偶数。
[0015] 在一个实施例中,参数值中的每个的包络值可以,例如,指示时域中表示的并以音 频信号包络作为信号包络的音频信号包络的幅值的η次幂,其中η为大于0的偶数。
[0016] 根据一个实施例,编码单元可以,例如,用于依据参数值的聚合值中的一个或多个 并依据指示多少个值将被编码单元确定作为一个或多个编码值的编码值数,确定一个或多 个编码值。
[0017] 在一个实施例中,编码单元可以,例如,用于根振 确定一个或多个编码值;
[0018] 其中c(k)指示待被编码单元确定的第k个编码值,其中j指示多个参数值中的第j个参数值,其中a(j)指示被分配给第j个参数值的聚合值,其中max(a)指示作为被分配 给参数值中的一个的聚合值中的一个的最大值,其中被分配给参数值中的一个的聚合值均 不大于最大值,并且
[0019] 其中
指示作为参数值中的一个的最小值,为此 勺最小。
[0020] 此外,提供一种用于从一个或多个编码值生成音频信号包络的方法。该方法包 括:
[0021] -接收一个或多个编码值;以及
[0022] -依据一个或多个编码值生成音频信号包络。
[0023] 通过依据一个或多个编码值生成聚合函数,执行生成音频信号包络,其中聚合函 数包括多个聚合点,其中聚合点中的每个包括参数值和聚合值,其中聚合函数单调递增,并 且其中一个或多个编码值中的每个指示聚合函数的聚合点中的一个的参数值和聚合值中 的至少一个。此外,生成音频信号包络被执行,以使得音频信号包络包括多个包络点,其中 包络点中的每个包括参数值和包络值,并且其中音频信号包络的包络点被分配给聚合函数 的聚合点中的每个,以使得该包络点的参数值等于该聚合点的参数值。此外,生成音频信号 包络被执行,以使得音频信号包络的包络点中的每个的包络值取决于聚合函数的至少一个 聚合点的聚合值。
[0024] 此外,提供一种用于确定用于对音频信号包络进行编码的一个或多个编码值的方 法。该方法包括:
[0025] -为多个参数值中每个确定聚合值,其中对多个参数值排序,以使得当多个参数 值中的第一参数值与多个参数值中的第二参数值不同时,该第一参数值在第二参数值之前 或之后,其中包络值被分配给参数值中的每个,其中参数值中的每个的包络值取决于音频 信号包络,并且其中聚合器用于为多个参数值中的每个参数值,依据该参数值的包络值并 依据在该参数值之前的多个参数值中的每个的包络值,确定聚合值;以及
[0026] -依据多个参数值的聚合值中的一个或多个确定一个或多个编码值。
[0027] 此外,提供一种计算机程序,当其被在计算机或信号处理器上执行时,实现上述方 法中的一个。
[0028] 提供一种用于解码以获得重建的音频信号包络的装置。该装置包括:用于依据一 个或多个分裂点生成重建的音频信号包络的信号包络重建器;以及用于输出重建的音频信 号包络的输出接口。信号包络重建器用于生成重建的音频信号包络,以使得一个或多个分 裂点将重建的音频信号包络划分成两个或更多个音频信号包络部分,其中预定义的分配规 则为两个或更多个信号包络部分中的每个信号包络部分,依据该信号包络部分,定义信号 包络部分值。此外,信号包络重建器用于生成重建的音频信号包络,以使得对于两个或更多 个信号包络部分中的每个,其信号包络部分值的绝对值大于其他信号包络部分中的每个的 信号包络部分值的绝对值的一半。
[0029] 根据一个实施例,信号包络重建器可以,例如,用于生成重建的音频信号包络,以 使得对于两个或更多个信号包络部分中的每个,其信号包络部分值的绝对值大于其他信号 包络部分中的每个的信号包络部分值的绝对值的90%。
[0030] 在一个实施例中,信号包络重建器可以,例如,用于生成重建的音频信号包络,以 使得对于两个或更多个信号包络部分中的每个,其信号包络部分值的绝对值大于其他信号 包络部分中的每个的信号包络部分值的绝对值的99%。
[0031] 在另一个实施例中,信号包络重建器110可以,例如,用于生成重建的音频信号包 络,以使得两个或更多个信号包络部分中的每个的信号包络部分值等于两个或更多个信号 包络部分中的其他信号包络部分中的每个的信号包络部分值。
[0032] 根据一个实施例,两个或更多个信号包络部分中的每个信号包络部分的信号包络 部分值可以,例如,取决于该信号包络部分的一个或多个能量值或一个或多个功率值。或 者,两个或更多个信号包络部分中的每个信号包络部分的信号包络部分值取决于适于重建 信号包络部分的原始或目标电平的任意其他值。
[0033] 可以以多种方式实现包络的缩放(scaling)。具体的,它可以与信号能量或谱质量 或类似相对应(绝对大小),或它可以是比例因子或增益因子(相对大小)。因此,可将其 编码为绝对值或相对值,或可通过差值将其编码为在先值或在先值的组合。在一些情况下, 缩放也可以是与其他可用数据不相关的,或可从其他可用数据中推论得出。包络应被重建 至其原始或目标电平。因此,通常的,信号包络部分值取决于适于重建音频信号包络的原始 或目标电平的任意值。
[0034] 在一个实施例中,该装置可以,例如,进一步包括:用于根据解码规则,对一个或多 个编码点进行解码以获得一个或多个分裂点中的每个的位置的分裂点解码器。分裂点解码 器可以,例如,用于分析指示可能的分裂点位置的总数的总位置数、指示一个或多个分裂点 的数量的分裂点数以及分裂点状态数。此外,分裂点解码器可以,例如,用于使用总位置数、 分裂点数以及分裂点状态数生成一个或多个分裂点中的每个的位置的指示。
[0035] 根据一个实施例,信号包络重建器可以,例如,用于依据指示重建的音频信号包络 的总能量的总能量值或依据适于重建音频信号包络的原始或目标电平的任意其他值,生成 重建的音频信号包络。
[0036] 此外,提供根据另一个实施例的用于解码以获得重建的音频信号包络的装置。该 装置包括:用于依据一个或多个分裂点生成重建的音频信号包络的信号包络重建器;以及 用于输出重建的音频信号包络的输出接口。信号包络重建器用于生成重建的音频信号包 络,以使得一个或多个分裂点将重建的音频信号包络划分成两个或更多个音频信号包络部 分,其中预定义的分配规则为两个或更多个信号包络部分中的每个信号包络部分,依据该 信号包络部分,定义信号包络部分值。预定义的包络部分值被分配给两个或更多个信号包 络部分中的每个。信号包络重建器用于生成重建的音频信号包络,以使得对于两个或更多 个信号包络部分中的每个信号包络部分,该信号包络部分的信号包络部分值的绝对值大于 被分配给该信号包络部分的预定义的包络部分值的绝对值的90%,并使得该信号包络部分 的信号包络部分值的绝对值小于被分配给该信号包络部分的预定义的包络部分值的绝对 值的110%。
[0037] 在一个实施例中,信号包络重建器用于生成重建的音频信号包络,以使得两个或 更多个信号包络部分中的每个的信号包络部分值等于被分配给该信号包络部分的预定义 的包络部分值。
[0038] 在一个实施例中,至少两个信号包络部分的预定义的包络部分值彼此不同。
[0039] 在另一个实施例中,信号包络部分中的每个的预定义的包络部分值与其他信号包 络部分中的每个的预定义的包络部分值不同。
[0040] 此外,提供一种用于重建音频信号的装置。该装置包括:根据上述实施例中的一个 的用于解码以获得音频信号的重建的音频信号包络的装置,以及用于依据音频信号的音频 信号包络并依据音频信号的其他信号特征,生成音频信号的信号生成器。其他信号特征与 音频信号包络不同。
[0041] 此外,提供一种用于对音频信号包络进行编码的装置。该装置包括:用于接收音频 信号包络的音频信号包络接口;以及用于依据预定义的分配规则,为用于至少两个分裂点 配置中的每个的两个或更多个音频信号包络部分中的至少一个音频信号包络部分,确定信 号包络部分值的分裂点确定器。至少两个分裂点配置中的每个包括一个或多个分裂点,其 中两个或更多个分裂点配置中的每个的一个或多个分裂点将音频信号包络划分成两个或 更多个音频信号包络部分。分裂点确定器用于选择至少两个分裂点配置中的一个的一个或 多个分裂点作为一个或多个选择的分裂点以对音频信号包络进行编码,其中分裂点确定器 用于依据至少两个分裂点配置中的每个的两个或更多个音频信号包络部分中的至少一个 音频信号包络部分中的每个的信号包络部分值选择一个或多个分裂点。
[0042] 根据一个实施例,两个或更多个信号包络部分中的每个信号包络部分的信号包络 部分值可以,例如,取决于该信号包络部分的一个或多个能量值或一个或多个功率值。或 者,两个或更多个信号包络部分中的每个信号包络部分的信号包络部分值取决于适于重建 音频信号包络的原始或目标电平的任意其他值。
[0043]正如已提及的,可以以多种方式实现包络的缩放。具体的,它可以与信号能量或谱 质量或类似相对应(绝对大小),或它可以是比例因子或增益因子(相对大小)。因此,可 将其编码为绝对值或相对值,或可通过差值将其编码为在先值或在先值的组合。在一些情 况下,缩放也可以是与其他可用数据不相关的,或可从其他可用数据中推论得出。包络应被 重建至其原始或目标电平。因此,通常的,信号包络部分值取决于适于重建音频信号包络的 原始或目标电平的任意值。
[0044]在一个实施例中,该装置可以,例如,进一步包括:用于对一个或多个分裂点中的 每个的位置进行编码以获得一个或多个编码点的分裂点编码器。分裂点编码器可以,例如, 用于通过对分裂点状态数进行编码以对一个或多个分裂点中的每个的位置进行编码。此 外,分裂点编码器可以,例如,用于提供指示可能的分裂点位置的总数的总位置数以及指示 一个或多个分裂点的数量的分裂点数。分裂点状态数、总位置数以及分裂点数一起指示一 个或多个分裂点中的每个的位置。
[0045]根据一个实施例,该装置可以,例如,进一步包括:用于确定音频信号包络的总能 量并对音频信号包络的总能量进行编码的能量确定器。或者,该装置可以,例如,进一步用 于确定适于重建音频信号包络的原始或目标电平的任意其他值。
[0046]此外,提供一种用于对音频信号进行编码的装置。该装置包括:根据上述实施例中 的一个的用于对音频信号的音频信号包络进行编码的用于编码的装置;以及用于对音频信 号的其他信号特征进行编码的次级信号特征编码器,其他信号特征与音频信号包络不同。 [0047]此外,提供一种用于解码以获得重建的音频信号包络的方法。该方法包括:
[0048]-依据一个或多个分裂点生成重建的音频信号包络;以及[0049]-输出重建的音频信号包络。
[0050]生成重建的音频信号包络被执行,以使得一个或多个分裂点将重建的音频信号包 络划分成两个或更多个音频信号包络部分,其中预定义的分配规则为两个或更多个信号包 络部分中的每个信号包络部分,依据该信号包络部分,定义信号包络部分值。此外,生成重 建的音频信号包络被执行,以使得对于两个或更多个信号包络部分中的每个,其信号包络 部分值的绝对值大于其他信号包络部分中每个的信号包络部分值的绝对值的一半。
[0051] 此外,提供一种用于解码以获得重建的音频信号包络的方法。该方法包括:
[0052] -依据一个或多个分裂点生成重建的音频信号包络;以及
[0053] -输出重建的音频信号包络。
[0054] 生成重建的音频信号包络被执行,以使得一个或多个分裂点将重建的音频信号包 络划分成两个或更多个音频信号包络部分,其中预定义的分配规则为两个或更多个信号包 络部分中的每个信号包络部分,依据该信号包络部分,定义信号包络部分值。预定义的包络 部分值被分配给两个或更多个信号包络部分中的每个。此外,生成重建的音频信号包络被 执行,以使得对于两个或更多个信号包络部分中的每个信号包络部分,该信号包络部分的 信号包络部分值的绝对值大于被分配给该信号包络部分的预定义的包络部分值的绝对值 的90%,并使得该信号包络部分的信号包络部分值的绝对值小于被分配给该信号包络部分 的预定义的包络部分值的绝对值的110%。
[0055] 此外,提供一种用于对音频信号包络进行编码的方法。该方法包括:
[0056]-接收音频信号包络;
[0057] -依据预定义的分配规则,为用于至少两个分裂点配置中的每个的两个或更多个 音频信号包络部分中的至少一个音频信号包络部分,确定信号包络部分值,其中至少两个 分裂点配置中的每个包括一个或多个分裂点,其中两个或更多个分裂点配置中的每个的一 个或多个分裂点将音频信号包络划分成两个或更多个音频信号包络部分;
[0058] 以及
[0059] -选择至少两个分裂点配置中的一个的一个或多个分裂点作为一个或多个选择 的分裂点以对音频信号包络进行编码,其中依据至少两个分裂点配置中的每个的两个或更 多个音频信号包络部分中的至少一个音频信号包络部分中的每个的信号包络部分值,执行 选择一个或多个分裂点。
[0060] 此外,提供一种计算机程序,当其被在计算机或信号处理器上执行时,用于实现上 述方法中的一个。
[0061] 线谱频率5 (LSF5)的探索式但稍不准确的描述如此,它们描述信号能量沿频率轴 线的分布。存在很高的可能性,LSF5将驻留在信号具有大量能量的频率处。实施例基于此 发现以在学术上采取该探索式的描述并对信号能量的实际分布进行量化。由于LSF仅近似 地应用这种思想,根据实施例,省略LSF构思,反之对频率的分布进行量化,如此可以从此 分布创建平滑的包
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1