用于通过应用分布量化和编码分裂音频信号包络的音频信号包络编码、处理和解码的装...的制作方法_2

文档序号:9583663阅读:来源:国知局
在一方面具有平滑而精确的谱包络,在另一方面可以以少 量的比特位(可选地,以固定的比特率)而被编码并进一步地以合理的计算复杂度而被实 现。
【附图说明】
[0065] 下面,参考附图更详细地描述本发明的实施例,其中:
[0066] 图1示出根据一实施例的用于解码以获得重建的音频信号包络的装置;
[0067]图2示出根据另一实施例的用于解码的装置,其中该装置还包括分裂点解码器;[0068]图3示出根据一实施例的用于对音频信号包络进行编码的装置;
[0069]图4示出根据另一实施例的用于对音频信号包络进行编码的装置,其中该装置还 包括分裂点编码器;
[0070] 图5示出根据另一实施例的用于对音频信号包络进行编码的装置,其中用于对音 频信号包络进行编码的装置还包括能量确定器;
[0071] 图6示出根据实施例的通过恒定能量块描述的三个信号包络;
[0072] 图7示出根据实施例的图6的谱的累积表示;
[0073] 图8示出原始表示和累积质量域表示的插值谱质量包络;
[0074] 图9示出根据一实施例的用于对分裂点位置进行解码的解码过程;
[0075] 图10示出根据一实施例的实现分裂点位置的解码的伪代码;
[0076] 图11示出根据一实施例的用于对分裂点进行编码的编码过程;
[0077]图12描述根据本发明的一实施例的实现分裂点位置的编码的伪代码;
[0078] 图13示出根据一实施例的分裂点解码器;
[0079] 图14示出根据一实施例的用于对音频信号进行编码的装置;
[0080] 图15示出根据一实施例的用于重建音频信号的装置;
[0081] 图16示出根据一实施例的用于从一个或多个编码值生成音频信号包络的装置;
[0082] 图17示出根据一实施例的用于确定用于对音频信号包络进行编码的一个或多个 编码值的装置;
[0083] 图18示出根据第一示例的聚合函数;以及
[0084] 图19示出根据第二示例的聚合函数。
【具体实施方式】
[0085] 图3示出根据一实施例的用于对音频信号包络进行编码的装置。
[0086] 该装置包括:用于接收音频信号包络的音频信号包络接口210。
[0087] 此外,该装置包括分裂点确定器220,分裂点确定器220用于依据预定义的分配规 贝1J,为用于至少两个分裂点配置中的每个的两个或更多个音频信号包络部分中的至少一个 音频信号包络部分,确定信号包络部分值。
[0088] 至少两个分裂点配置中的每个包括一个或多个分裂点,其中两个或更多个分裂点 配置中的每个的一个或多个分裂点将音频信号包络划分成两个或更多个音频信号包络部 分。分裂点确定器220用于选择至少两个分裂点配置中的一个的一个或多个分裂点作为一 个或多个选择的分裂点以对音频信号包络进行编码,其中分裂点确定器220用于依据至少 两个分裂点配置中的每个的两个或更多个音频信号包络部分中的至少一个音频信号包络 部分中的每个的信号包络部分值,选择一个或多个分裂点。
[0089] 分裂点配置包括一个或多个分裂点,且由其分裂点进行限定。例如,音频信号包 络可以包括20个样本:0,......,19,可以由位于样本3的位置处的第一分裂点和位于样本 8的位置处的第二分裂点限定具有两个分裂点的配置,如可通过元组(3 ;8)指示分裂点配 置。如果仅应确定一个分裂点,则单个分裂点指示分裂点配置。
[0090] 合适的一个或多个分裂点应被确定为一个或多个选择的分裂点。为此,考虑至少 两个分裂点配置,其中每个分裂点配置包括一个或多个分裂点。选择最合适的分裂点配置 的一个或多个分裂点。依据根据预定义的分配规则确定的信号包络部分值确定一个分裂点 配置是否比另一个分裂点配置更合适。
[0091] 在分裂点配置具有N个分裂点的实施例中,可以考虑具有分裂点的每个可能的分 裂点配置。然而,在一些实施例中,并非考虑所有可能的分裂点配置,而仅考虑两个分裂点 配置。最合适的分裂点配置的分裂点被选为一个或多个选择的分裂点。
[0092] 在仅应确定单个分裂点的实施例中,每个分裂点配置仅包括单个分裂点。在应确 定两个分裂点的实施例中,每个分裂点配置包括两个分裂点。类似地,在应确定N个分裂点 的实施例中,每个分裂点配置包括N个分裂点。
[0093] 具有单个分裂点的分裂点配置将音频信号包络划分成两个音频信号包络部分。具 有两个分裂点的分裂点配置将音频信号包络划分成三个音频信号包络部分。具有N个分裂 点的分裂点配置将音频信号包络划分成N+1个音频信号包络部分。
[0094] 存在预定义的分配规则,该预定义的分配规则将信号包络部分值分配给音频信号 包络部分中的每个。预定义的分配规则依赖于音频信号包络部分。
[0095] 在一些实施例中,确定分裂点,以使得由一个或多个分裂点划分音频信号包络得 来的音频信号包络部分中的每个具有由预定义的分配规则分配的大体相等的信号包络部 分值。因此,由于一个或多个分裂点依赖于音频信号包络和分配规则,如果在解码器处分配 规则和分裂点是已知的,则可在解码器处估计音频信号包络。例如,如图6所示。
[0096] 在图6(a)中,应确定用于信号包络610的单个分裂点。因此,在此示例中,由单个 分裂点限定不同的可能的分裂点配置。在图6(a)的实施例中,找到分裂点631作为最佳分 裂点。分裂点631将音频信号包络610划分成两个信号包络部分。矩形块611表示由分裂 点631限定的第一信号包络部分的能量。矩形块612表示由分裂点631限定的第二信号包 络部分的能量。在图6(a)的示例中,块611和612的上边缘表示信号包络610的估计。可 在解码器处形成此估计,例如,使用分裂点631的信息(例如,如果仅有的分裂点具有值s =12,则分裂点s位于位置12处)、关于信号包络从何处开始的信息(此处,点638)以及关 于信号包络在何处结束的信息(此处,点639)。信号包络可以在固定值处开始和结束,且此 信息可在接收器处作为固定信息而被获取。或者,此信息可被传输至接收器。在解码器侧, 解码器可以重建信号包络的估计,以使得由分裂点631分裂音频信号包络而得到的信号包 络部分获得预定义规则分配的相同值。在图6(a)中,由块611和612的上边缘限定的信号 包络的信号包络部分获得分配规则分配的相同值,并表示信号包络610的良好估计。除了 使用分裂点631,值621也可用作分裂点。此外,除了开始值638,值628也可用作开始值, 且除了结束值639,结束值629也可用作结束值。然而,不仅对横坐标值进行编码,对纵坐标 值也进行编码,这需要更多的编码资源,并且这并非是必须的。
[0097] 在图6(b)中,应确定用于信号包络640的三个分裂点。因此,在此示例中,由三个 分裂点限定不同的可能的分裂点配置。在图6(b)的实施例中,发现分裂点661、662、663作 为最佳分裂点。分裂点661、662、663将音频信号包络640划分成四个信号包络部分。矩形 块641表示由分裂点限定的第一信号包络部分的能量。矩形块642表示由分裂点限定的第 二信号包络部分的能量。矩形块643表示由分裂点限定的第三信号包络部分的能量。矩形 块644表示由分裂点限定的第四信号包络部分的能量。在图6(b)的示例中,块641、642、 643、644的上边缘表示信号包络640的估计。可在解码器处形成此估计,例如,使用分裂点 661、662、663的信息、关于信号包络从何处开始的信息(此处,点668)以及关于信号包络部 分在何处结束的信息(此处,点669)。信号包络可以在固定值处开始和结束,且此信息在 接收器处作为固定信息可被获取。或者,此信息可被传输至接收器。在解码器侧,解码器可 以重建信号包络的估计,以使得由分裂点661、662、663分裂音频信号包络得到的信号包络 部分获得预定义的分配规则分配的相同值。在图6(b)中,由块641、642、643、644的上边缘 限定的信号包络的信号包络部分获得由分配规则分配的相同值,并表示信号包络640的良 好估计。除了使用分裂点661、662、663,值651、652、653也可用作分裂点。此外,除了开始 值668,值658也可用作开始值,且除了结束值669,结束值659可被用作结束值。然而,不 仅对横坐标值进行编码,对纵坐标值也进行编码,这需要更多的编码资源,并且这并非是必 须的。
[0098] 在图6(c)中,应确定用于信号包络670的四个分裂点。因此,在此示例中,由四个 分裂点限定不同的可能的分裂点配置。在图6(c)的实施例中,发现分裂点691、692、693、 694作为最佳分裂点。分裂点691、692、693、694将音频信号包络670划分成五个信号包络 部分。矩形块671表不由分裂点限定的第一信号包络部分的能量。矩形块672表不由分裂 点限定的第二信号包络部分的能量。矩形块673表示由分裂点限定的第三信号包络部分的 能量。矩形块674表示由分裂点限定的第四信号包络部分的能量。矩形块675表示由分裂 点限定的第五信号包络部分的能量。在图6(c)的示例中,块671、672、673、674、675的上边 缘表示信号包络670的估计。可在解码器处形成此估计,例如,使用分裂点691、692、693、 694的信息、关于信号包络从何处开始的信息(此处,点698)以及关于信号包络部分在何处 结束的信息(此处,点699)。信号包络可以在固定值处开始和结束,且此信息在接收器处作 为固定信息可获取。或者,此信息可被传输至接收器。在解码器侧,解码器可以重建信号包 络的估计,以使得由分裂点691、692、693、694分裂音频信号包络得到的信号包络部分获得 预定义的分配规则分配的相同值。在图6(c)中,由块671、672、673、674、675的上边缘限定 的信号包络的信号包络部分获得由分配规则分配的相同值,并表不信号包络670的良好估 计。除了使用分裂点691、692、693、694,值681、682、683、684也可用作分裂点。此外,除了 开始值698,值688可被用作开始值,且除了结束值699,结束值689可被用作结束值。然而, 不仅对横坐标值进行编码,对纵坐标值也进行编码,这需要更多的编码资源,并且这并非是 必须的。
[0099] 至于另外的特定实施例,可以考虑以下示例:
[0100] 应对在谱域中表示的信号包络进行编码。信号包络可以,例如,包括η个谱值(如, η= 33) 〇
[0101] 此时可以考虑不同的信号包络部分。例如,第一信号包络部分可以包括前10个谱 值乂1(1 = 0,…,9,以i作为谱值的索引),以及第二信号包络部分可以包括后23个谱值(i=10,…,32) 〇
[0102] 在一个实施例中,预定义的分配规则可以是,例如,具有谱值V(]、Vl、……、vsl的谱 信号包钦部;m的佶号包钦部;值p(m)为谱信号包络部分的能量,如:
[0103]
[0104] 其中下限为信号包络部分m的下限值,并且其中上限为信号包络部分m的上限值。
[0105] 信号包络部分值确定器110可以根据此公式为一个或多个音频信号包络部分分 配信号包络部分值。
[0106] 此时,分裂点确定器220用于根据预定义的分配规则,确定一个或多个信号包络 部分值。特别地,分裂点确定器220用于依据分配规则,确定一个或多个信号包络部分值, 以使得两个或更多个信号包络部分中的每个的信号包络部分值(近似)等于两个或更多个 信号包络部分中的其他信号包络部分中的每个的信号包络部分值。
[0107] 例如,在特定的实施例中,分裂点确定器220可以用于确定仅有的单个分裂点。在 此实施例中,例如,根据公?1
由分裂点s限定两个信号包络部 分,如信号包络部分1(m= 1)和信号包络部分2(m= 2);
[0108] 其中η指示音频信号包络的样本的数量,如音频信号包络的谱值的数量。在以上 示例中,η可以为,例如,η= 33。
[0109] 信号包络部分值确定器110可以将此信号包络部分值P(l)分配给音频信号包络 部分1并将此信号包络部分值Ρ(2)分配给音频信号包络部分2。
[0110] 在一些实施例中,确定信号包络部分值ρ(1)和Ρ(2)。然而,在一些实施例中,仅考 虑两个信号包络部分值中的一个。例如,如果总能量是已知的,则,足以确定分裂点,以使得 P(l)大体为总能量的50%。
[0111] 在一些实施例中,可以从可能值的集合(例如,从整数索引值的集合,如{0 ;1 ; 2;…;32})中选择s(k)。在其他实施例中,可以从可能值的集合(例如,从指示频率带的 集合的频率值的集合)中选择s(k)。
[0112] 在应确定多于一个分裂点的实施例中,可以考虑表示累积能量(直到分裂点s之 前累积的样本能量)的公式:
[0113]
[0114] 如果应确定N个分裂点,则确定分裂点s(1)、s(2)、……、s(N),以使得:
[0115] ?;.υ
* J ' *
[0116] 其中totalenergy为信号包络的总能量。
[0117] 在一个实施例中,可以选择分裂点s(k),以使$
:小。
[0118] 因此,根据一个实施例,分裂点确定器220可以,例如,用于确定一个或多个分裂 点s(k),以使?
t小;
[0119] 其中totalenergy指示总能量,且其中k指示一个或多个分裂点的第k个分裂点, 并且其中N指示一个或多个分裂点的数量。
[0120] 在另一个实施例中,如果分裂点确定器220用于选择仅单个分裂点s,则分裂点确 定器220可以测试所有可能的分裂点s= 1,…,32。
[0121] 在一些实施例中,分裂点确定器220可以选择用于分裂点s的最佳值,如
卜小的分裂点s。
[0122] 根据一个实施例,两个或更多个信号包络部分中的每个信号包络部分的信号包络 部分值可以,例如,取决于该信号包络部分的一个或多个能量值或一个或多个功率值。或 者,两个或更多个信号包络部分中的每个信号包络部分的信号包络部分值可以,例如,取决 于适于重建音频信号包络的原始或目标电平的任意其他值。
[0123] 根据一个实施例,音频信号包络可以,例如,在谱域或时域中表示。
[0124] 图4示出根据另一实施例的用于对音频信号包络进行编码的装置,其中该装置还 包括用于对一个或多个分裂点进行编码(例如,根据编码规则)以获得一个或多个编码点 的分裂点编码器225。
[0125] 分裂点编码器225可以,例如,用于对一个或多个分裂点中的每个的位置进行编 码以获得一个或多个编码点。分裂点编码器225可以,例如,用于通过对分裂点状态数进行 编码以对一个或多个分裂点中的每个的位置进行编码。此外,分裂点编码器225可以,例 如,用于提供指示可能的分裂点位置的总数的总位置数以及指示一个或多个分裂点的数量 的分裂点数。分裂点状态数、总位置数以及分裂点数一起指示一个或多个分裂点中的每个 的位置。
[0126] 图5示出根据另一实施例的用于对音频信号包络进行编码的装置,其中用于对音 频信号包络进行编码的装置还包括能量确定器230。
[0127] 根据一个实施例,该装置可以,例如,还包括用于确定音频信号包络的总能量并用 于对音频信号包络的总能量进行编码的能量确定器(230)。
[0128] 然而,在另一实施例中,该装置可以,例如,用于确定适于重建音频信号包络的原 始或目标电平的任意其他值。除了总能量,多个其他值适于重建音频信号包络的原始或目 标电平。例如,如已经提及的,可以以多种方式实现包络的缩放,它可以与信号能量或谱质 量或类似相对应(绝对大小),或它可以是比例因子或增益因子(相对大小),因此,可将其 编码为绝对值或相对值,或可通过差值将其编码为在先值或在先值的组合。在一些情况下, 缩放也可以是与其他可用数据不相关的,或可从其他可用数据中推论得出。包络应被重建 至其原始或目标电平。
[0129] 图14示出用于对音频信号进行编码的装置。该装置包括:根据上述实施例中的一 个的用于编码的装置1410,以通过生成一个或多个分裂点来对音频信号的音频信号包络进 行编码;以及用于对音频信号的其他信号特征进行编码的次级信号特征编码器1420。其他 信号特征与音频信号包络不同。本领域的技术人员意识到,可从音频信号的信号包络和从 音频信号其他信号特征,重建音频信号本身。例如,信号包络可以,例如,指示音频信号的样 本的能量。其他信号特征可以,例如,指示对于时域音频信号中的每个样本,该样本具有正 值还是负值。
[0130] 图1示出根据一实施例的用于解码以获得重建的音频信号包络的装置。
[0131] 该装置包括用于依据一个或多个分裂点生成重建的音频信号包络的信号包络重 建器110。
[0132] 此外,该装置包括用于输出重建的音频信号包络的输出接口 120。
[0133] 信号包络重建器110用于生成重建的音频信号包络,以使得一个或多个分裂点将 重建的音频信号包络划分成两个或更多个音频信号包络部分。
[0134] 预定义的分配规则为两个或更多个信号包络部分中的每个信号包络部分,依据该 信号包络部分,定义信号包络部分值。
[0135] 此外,信号包络重建器110用于生成重建的音频信号包络,以使得对于两个或更 多个信号包络部分中的每个,其信号包络部分值的绝对值大于其他信号包络部分中的每个 的信号包络部分值的绝对值的一半。
[0136] 至于信号包络部分值X的绝对值a表示为:
[0137] 如果X彡0,则a=x;
[0138] 如果x〈0,则a= -χ。
[0139] 如果所有的信号包络部分值都是正值,此上述构思意味着,生成重建的音频信号 包络,以使得对于两个或更多个信号包络部分中的每个,其信号包络部分值大于其他信号 包络部分中的每个的信号包络部分值的一半。
[0140] 在特定的实施例中,信号包络部分中的每个的信号包络部分值等于两个或更多个 信号包络部分中的其他信号包络部分中的每个的信号包络部分值。
[0141] 然而,在图1的更一般的实施例中,音频信号包络被重建,以便信号包络部分的信 号包络部分值不必完全相等。反之,允许某种程度的误差(某个范围)。
[0142] 该构思"以使得对于两个或更多个信号包络部分中的每个,其信号包络部分值的 绝对值大于其他信号包络部分中的每个的信号包络部分值的绝对值的一半"可以,例如,被 理解为意味着,只要所有的信号包络部分值的最大绝对值不是所有的信号包络部分值的最 小绝对值的2倍,即满足需求的条件。
[0143] 例如,四个信号包络部分值的集合{0. 23 ;0.
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1