谱峰位置的编码与解码的制作方法

文档序号:10494464阅读:322来源:国知局
谱峰位置的编码与解码的制作方法
【专利摘要】提供一种编码器和解码器及其方法,用于音频编码中谱峰位置的编码和解码。根据第一方面,提供了一种音频信号段编码方法,用于编码谱峰位置。该方法包括确定出自两个无损谱峰位置编码方案中的哪一个要求最少位数量来编码音频信号段的谱峰位置;并且选择要求最少位数量来编码音频信号段的谱峰位置的谱峰位置编码方案。两个无损谱峰位置编码方案中的第一个适合于周期性的或半周期性的谱峰位置分布;以及两个无损谱峰位置编码方案中的第二个适合于稀疏谱峰位置分布。
【专利说明】
谱峰位置的编码与解码
技术领域
[0001]提出的技术一般涉及音频信号段编码/解码,以及具体涉及谱峰位置编码/解码。
【背景技术】
[0002] 许多音频编码技术采用了人类的听觉特性。例如,可以不需要编码强音调附近的 弱音调,这是由于人的听觉系统对这种弱音调更不敏感。传统的,所谓的感知音频编码,不 同频率数据的量化是基于人类听觉模型的。例如,分配更多位给可感知的重要频率数据并 因此更精细量化,反之亦然。
[0003] 音频编码的一种类型是所谓的变换编码。在变换编码中,输入音频样本块被变换 (例如,经由修改的离散余弦变换)、处理和量化。基于感知的重要性执行变换系数的量化。 其中需要译码的一个音频参数是谱峰位置。图Ia中示出了变换域中音频段的谱峰位置的示 例。通常使用无损编码方案(诸如霍夫曼(Huffman)编码)来译码谱峰位置。然而,现有技术 解决方案在谱峰译码上消耗大量位。

【发明内容】

[0004] 以比现有技术解决方案更有效率的方式译码谱峰位置将是所期望的。
[0005] 根据第一方面,提供了用于编码谱峰位置的一种音频信号段编码方法。该方法包 括确定出自两个无损谱峰位置编码方案中的哪一个要求最少位数量来编码音频信号段的 谱峰位置;并且选择要求最少位数量来编码音频信号段的谱峰位置的谱峰位置编码方案。 两个无损谱峰位置编码方案的第一个适于周期性或半周期性谱峰位置分布;以及两个无损 谱峰位置编码方案的第二个适于稀疏谱峰位置分布。这也对于下面描述的所有方面有效。
[0006] 根据第二方面,提供了一种音频信号段编码器,用于编码谱峰位置。编码器配置成 确定出自两个无损谱峰位置编码方案中的哪一个要求最少位数量来编码音频信号段谱峰 位置;并且进一步选择要求最少位数量来编码音频信号段的谱峰位置的谱峰位置编码方 案。
[0007] 根据第三方面,提供了一种用户终端,其包括根据第二方面的音频信号段编码器。
[0008] 根据第四方面,提供了一种音频信号段解码方法,用于解码谱峰位置。该方法包 括:接收音频信号段的编码的谱峰位置;并还接收出自两个无损编码方案中的被选择用来 编码谱峰位置的无损编码方案的指示符。该方法还包括一致于指示的编码方案来解码谱峰 位置。
[0009] 根据第五方面,提供了一种音频信号段解码器,用于解码谱峰位置。该解码器配置 成接收音频信号段的编码的谱峰位置;并进一步接收出自两个无损编码方案的被选择用来 编码谱峰位置的无损编码方案的指示符。该解码器进一步配置成一致于指示的编码方案来 解码谱峰位置。
[0010] 根据第六方面,提供了 一种移动终端,其包括根据第五方面的音频信号段解码器。
【附图说明】
[0011] 实施例,连同其进一步的目的及其优点,可以通过参考下面的描述连同附图而最 佳理解,其中:
[0012] 图Ia和Ib是谱峰位置分布的示例。
[0013]图2-4是示出了所提出技术的编码方法的示例性实施例的流程图。
[0014] 图5-9是示出了所提出编码器的示例性实施例的框图。
[0015] 图10是示出了所提出用户终端的一实施例的框图。
[0016] 图11是示出了所提出技术的解码方法的一实施例的流程图。
[0017] 图12-15是示出了所提出解码器的示例性实施例的框图。
[0018] 图16是示出了所提出用户终端的一实施例的框图。
【具体实施方式】
[0019] 贯穿附图,相同的附图标记可用于类似或对应的元素。
[0020] 所提出技术涉及谱峰位置的无损编码,如从音频信号的短时段(例如10-40ms)提 取。所提出技术还涉及根据此技术已经编码的谱峰位置的解码。
[0021] 发明人认识到译码谱峰位置的常规方法失败于致力于以下事实:音频信号中的峰 位置可以在分布中具有非常突然的变化,这使得通过单一编码方案编码峰位置的低效率。 在某些情况下,频谱能够是半周期的,这使得差分或delta编码方案非常高效。在其他情况 下,谱峰能够是聚集的,留下大的稀疏区域。
[0022] 所提出技术的主要思想是对不同峰位置分布使用指定的编码方案,并且以闭环方 式在编码方案之间切换。不同的编码方案中的每个应该适合于具体峰位置分布。适合意味 着例如编码方案对于某一类谱峰分布特别高效。当在本文中陈述编码方案A适合于峰分布C 以及编码方案B适合于峰分布D,可以假定对于峰分布C,A-般比B更高效,而对于峰分布D,B 一般比A更高效。
[0023] 假设我们具有N个谱峰位置(PhP2J3, ...,PN}的集合,其必须以无损方式压缩和 传送。峰的数量以及它们的分布随时间变化。图Ia和图Ib中示出了谱峰位置的两个不同集 合的示例。
[0024]图Ia示出了接近周期的谱峰分布。这种情况可由例如以下所描述的delta编码来 高效地处理。
[0025]图Ib示出了稀疏的并且在两个相邻峰之间具有较大距离的谱峰分布。由于峰之间 大的delta,这种情况很难通过delta编码处理。
[0026]发明人已经发现峰数量和它们的分布的大的变化可(具有益处地)通过采用备选 性压缩或编码方案来处理。在此,集中在两个示例性编码方案,其可表示为delta编码和稀 疏编码,并且在下面描述。delta编码能够备选地表示为周期编码。然而,使用多于两个的适 合于不同谱峰位置分布的编码方案也是可行的。
[0027] delta 编码
[0028] 此编码方案适合于像图Ia中所示的那个峰分布,其可以是特征为周期或半周期或 接近周期的。delta编码的思想是在音频信号段中的连续谱峰位置匕或(PhP 2J3, ...,PN}之 间形成差值,本文表示为d或△,如下:
[0029] di = Pi-Po
[0030] d2 = P2~Pi
[0031]
[0032] dN=Pn-Pn-I (I)
[0033] 所述差值(也表示为delta)然后使用适合的编码方法译码。差值的优选编码方法 是霍夫曼编码。假设我们具有M个不同大小的delta。它们映射到可变长度的代代码字,例如
[0034] {d(l),d(2),d(3),· · ·,d(M)} - {0,10,ll,111110} (2)
[0035] 这里,d(l)是最常出现的差值或步长山并且因此映射至最短代码字"0",而d(M)非 常稀少并且因此映射至最长代码字"111110"。在此示例中,最长代码字要求6位,但是较长 或较短的代码字也是可行的。通过映射最频繁的delta至最短代码字和映射最稀少的delta 至最长代码字,用于译码delta的位数量将被最小化。这种编码方法是高效的,只要没有太 多太频繁出现的不同步长。换句话说:不同的步长越多,代码字越长,并且当映射至长代码 字的步长出现频繁时,编码方法的效率降低。
[0036] 霍夫曼代码字被传送至解码器,并且解码器提取对应的delta。通过已知山和Ph, 解码器能够通过迭代重构Pj。
[0037]除了delta,解码器还需要知道初始位置Po。由于,峰之间最少距离上施加的约束, Po被认为作为特殊情况。例如,可以存在限制:相邻峰必须被2个空位置分离。因为在这种情 况下不存在比3更短的delta,在剩下的段或帧期间,不需要霍夫曼代码字用于这种delta。 然而,音频信号段Po中的绝对第一峰能够出现在刻度(频谱)的起始,其距〇的偏移小于3。为 了避免这个问题,而不必须对于这些可能的小于3的初始delta添加多个霍夫曼代码字,使 用从-3确定的偏移替代从0确定的偏移。因此,当Po位于例如位置1时,使用代码字△ =4。这 种简单操作的结果是限制使用的霍夫曼代码字的数量是可能的。这将最少化所使用的霍夫 曼代码字的长度,因为在一般情况下,更少的霍夫曼代码字给予更短的霍夫曼代码字。 [0038] 稀疏编码
[0039]此编码方案适合于像图Ib中所示的那个峰分布,其可以是特征为稀疏。稀疏被认 为意味着连续峰之间可以存在大距离以及峰不必需是周期性的。假设谱峰位置向量的以下 示例,其中那些一 "Γ表示峰的存在以及零"〇"指示峰的缺失:
[0040] {01000000000000000100} (3)
[0041 ] 在delta编码中,这将意味着{Pi = 2和P2 = 18},)。以上的示例性峰位置向量应该示 出了频谱峰相对于其他峰的差值相隔很远,甚至在更真实的向量中,不认为距离16是相隔 很远的。
[0042] 此稀疏编码方案的第一步是要形成例如5位的相等大小的组,如下:
[0043] {01000,00000,00000,00100} (4)
[0044] 然后检查每个组的非零元素,例如通过对每个组内的元素进行或运算。结果存储 在第二位向量,其长度缩短为1/5。此位向量下面以粗体示出以便更容易区分:
[0045] {01000,〇〇〇〇〇,〇〇〇〇〇,〇〇1〇〇}^{ 1001} (5)
[0046] 在此示例性实施例中,应该传送至解码器的位流将看起来像:
[0047] {1001,01000,00100} (6)
[0048] 解码器从位流读取信令层"1001"。这些4位指示位流中将跟随的是第1和第4组的 描述,而第2和第3组必须填0。
[0049] 由于上面提及的两个连续峰之间最小允许距离中的约束,上面的方案可修改以实 现进一步的(仍然无损的)压缩增益。因为对于每个5-dim向量只有8个可能的级别,由于峰 应该至少分开两个位置的约束,这些向量能够只有3位的索引,见下面的表1。在此实施例 中,位流看上去如下:
[0050] {1〇〇1,〇〇1,〇1〇} (7)
[0051] 而不是如更上面的示例中的5位,只要求3个位标识每个非零位组。
[0052]表l:5-dim向量的索引。从位流提取3-位索引,并且重构在上面组和表中表示的对 应5-dim向量。
[0054]表 1
[0055]备选的无损稀疏谱峰位置编码方案能够基于或运算位的逻辑操作,如[1 ]中所描 述的。
[0056] 上述每个编码方案都具有对于某些峰位置分布的问题:
[0057] ?稀疏编码方案的问题是如果输入不够稀疏,其能够实际增加数据量。
[0058] #delta编码方案的问题是对于异常值它是非常低效率的,例如当距离多数是小 的时,有非常大的delta步长。
[0059]然而,上述两种编码方案能够看作是互补的,并且发明人已实现通过组合它们的 优势,能够形成非常高效的编码系统。闭环判定逻辑的示例概述如下:
[0060] 如果 Ld > Ls
[0061] 使用稀疏编码
[0062] 否则
[0063] 使用delta 编码 (8)
[0064] 其中
[0065] Ld是delta编码方案所消耗的位总数量,
[0066] 匕是稀疏编码方案所消耗的位总数量。
[0067] 判定逻辑(8)要求两种编码方案都是实际可执行的。在一些情况下,当两个连续峰 之间的最大距离CUx比对于delta编码可能的最大距离T更大时,基于预存储的霍夫曼表, delta编码方案消耗的位总数量Ld不能明确计算。为了适合这种情况,判定逻辑(8)可稍微 修改成:
[0068] 如果{(dmax>T)或(Ld>Ls)}
[0069] 使用稀疏编码
[0070] 否则
[0071] 使用delta 编码 (9)
[0072]判定逻辑(9)中的或语句的第一部分可认为是捷径,因为如果距离dmax>T,delta 编码不必须明确执行。以不同方式表达:当对于音频信号段或帧,满足准则dmax>T时,应不 执行delta编码,并且可决定使用稀疏编码而不比较两编码方法的结果。也就是说,在这种 情况下,Ld可以被默认大于L s,并且只需要执行稀疏编码。
[0073]图2和图3是流程图,示出了根据至少一个实施例的提出的技术的方法。该方法意 在由音频编码器(coder)执行,其也可表示为音频译码器(encoder),可操作于译码音频信 号段。在此实施例中,判定逻辑(9)被实现,并且无损编码方案的示例数量为二。方法包括 201确定出自两个无损谱峰位置编码方案中的哪一个要求最少位数量来编码音频信号段的 谱峰位置;以及202选择要求最少位数量来编码音频信号段的谱峰位置的谱峰位置编码方 案。此实施例也能够参考图3来更详细的描述。在步骤301中,确定d max(或者备选地表示为 Δ max)大于T; (dmax>T)。该条件能够(明显地)备选地被用公式表示例如为dmax彡Τ'。当d max大 于T时,稀疏编码被选择304,并且可以使用稀疏编码方案编码谱峰位置。这能够实现当dmax >Τ时,在译码谱峰位置前,作出关于使用哪个编码方案的判定。delta编码能够配置用于高 效地编码小于T的delta,而不必要处理大于T的delta。换句话说,霍夫曼表的大小可连同稀 疏峰位置编码方案来被优化,以便对于在某一大小以上的delta而稀疏编码方案的效率被 实现(通过此类delta在霍夫曼表中没有被表示)。这种优化导致了霍夫曼表中的整体短代 码字大小,其对编码效率非常有利。稀疏编码方案是对于d max> T要求最少位数的编码方案。 [0074]当dmax不大于T时,即当不满足条件301时;使用两个编码方案译码谱峰位置302。 即,相应地使用delta编码和稀疏编码译码谱峰位置,呈现两个不同结果。每个编码方案要 求一定位数量以译码当前谱峰位置的集合,参见上面的Ld和L s。可观察到该位数量并且可比 较该数量以确定对于当前峰分布,哪个编码方案最高效。基于不同方法要求的相应位数量, 可以确定哪个编码方案要求最少的位数量以译码当前谱峰位置的集合,并且要求最少位数 量的编码方案可以被选择303。所述确定,即在这种情况下的所要求位数量的比较,能够认 为并入步骤303中或步骤302中。所选择的编码方案(在步骤304中或步骤303中选择)可然后 被指示306至编码器(与译码的谱峰位置关联)。也就是说,与用所选编码方案译码的编码的 谱峰位置的版本的传送相关联。未选择的其它编码方案译码的版本将不被使用并且可被丢 弃。
[0075] delta编码,其也可表示为两个无损谱峰位置编码方案的第一个,适合于周期性或 半周期性谱峰位置分布的译码;和稀疏编码,也还能够表示为两个无损谱峰位置编码方案 的第二个,适合于稀疏谱峰位置分布。如上所述,delta编码优选的包括峰位置的delta编码 和delta代码的霍夫曼编码。这能够可备选地称为delta-霍夫曼编码。
[0076] 如上所述,稀疏谱峰位置编码方案可包括将表示谱峰位置的位向量分成连续相等 大小的位组(见公式(4));或运算每个位组中的位以形成组位向量(见公式(5));通过采用 两个连续峰之间最小允许距离中的约束来压缩非零位组(见公式(6)和表1);并且通过将该 组位向量和已压缩非零位组连结以进一步形成压缩位向量(见公式(7))。术语"或运算"在 此也认为包括变体,其中组中的位以一些其他方式检查一"1",呈现与或运算相同的结果。 例如,能够逐一检查该组的位,以及如果检测到"1",则确定该组是非零位组。
[0077] 图4是流程图,示出了根据一实施例的实现至少上述判定逻辑(8)的提出的技术的 方法。步骤401根据至少两个适合于不同谱峰位置分布的无损谱峰位置编码方案来编码音 频信号段的谱峰位置。步骤402选择要求最少位数量来编码音频信号段谱峰位置的谱峰位 置编码方案。步骤401和402能够与图3中步骤302和303相同。
[0078] 本文描述的步骤、功能、规程、模块、单元和/或块可以使用任何常规技术在硬件中 实现,诸如离散电路或集成电路技术,包括通用电子电路和专用电路。
[0079] 具体的示例包括一个或多个适合地配置的数字信号处理器和其他已知电子电路, 例如执行特定功能的离散逻辑门互连,或专用集成电路。
[0080] 备选的,至少一些上述步骤、功能、规程、模块、单元和/或块可以在软件中实现,诸 如用于由包含一个或多个处理单元的适当处理电路执行的计算机程序。
[0081] 当由一个或多个处理器执行时,本文示出的流程图或图可认为是计算机流程图或 图。对应的设备可被定义为一组功能模块,其中由处理器执行的每个步骤对应一个功能模 块。在此情况下,功能模块实现为处理器上运行的计算机程序。
[0082] 处理电路的示例包括,但不限于,一个或多个微处理器、一个或多个数字信号处理 器,DSP,一个或多个中央处理单元,CPU,视频加速硬件和/或任何适当的可编程逻辑电路诸 如一个或多个现场可编程门阵列,FPGA,或一个或多个可编程逻辑控制器,PLC。
[0083] 也应当理解,可以可能重使用任何常规装置或单元(在其中提出的技术被实现)的 一般处理能力。还可以重使用已有软件,例如通过重新编程已有软件或通过增加新的软件 组件。
[0084] 本文描述的实施例还涉及对译码音频信号可操作的译码器。编码器配置成执行通 过上述编码器执行的方法的至少一个实施例。编码器关联于如图3所示和如上所述方法的 相同技术特征、目的和优点。编码器将简要描述以避免不必要的重复。
[0085] 下面将参照图5描述配置成启用上述方法的执行以用于谱峰位置编码的示例性编 码器500。编码器可包含在用户终端中或包含在网络节点中,诸如网关。如上所述,可以假设 编码器500配置成具有执行两个无损谱峰位置编码方案的功能性。
[0086]图5是示出了所提出编码器10的一实施例的框图。此实施例包括存储器24和处理 器22形式的处理部件。该存储器包括指令,例如采用计算机程序形式,当其由处理部件执行 时使得编码器10确定出自两个无损谱峰位置编码方案的哪一个要求最少位数量来编码音 频信号段的谱峰位置。优选的,编码器10配置成应用如上所述的判定逻辑(9)。可执行确定 参数Cl max是否超出阈值,以及如果没有超出,在用两个编码方案译码谱峰位置之后,比较由 两个编码方案编码谱峰位置所要求的位数量。指令的执行进一步使得编码器10选择要求最 少位数量来编码音频信号段谱峰位置的谱峰位置编码方案。编码器10配置两个编码方案, 其也可以是存储在存储器24中指令的部分,或备选的在编码器的一些其他部分中存储或实 现(未示出)。如之前,两个无损谱峰位置编码方案中的第一个适合于周期性或半周期性谱 峰位置分布;以及两个无损谱峰位置编码方案中的第二个适合于稀疏谱峰位置分布。这也 能够描述为,编码器10以两种不同编码模式有效地译码谱峰。
[0087] 该指令可存储为计算机可读媒体(有形非易失性媒体)上的计算机程序产品20并 且可被传送至存储器24,如在图左侧由虚线箭头所指示。音频信号段通过输入单元IN转发 至处理器22,并且所编码的谱峰位置通过输出单元OUT转发至解码器。所选编码方案可明确 通知解码器,如图5中虚线箭头指示的,或作为备选的,通过以可能的解码模式对已接收的 位流的试解码,可以在解码器检测方案并选择成功的那个方案。第一种备选的复杂度小,但 要求更多的带宽。第二种备选要求较小的带宽,但是更复杂。以下描述了应用至其他实施例 的其他类似备选。
[0088] 图6示出了编码器10的一备选实施例。图6示出了编码器10,可操作以译码音频信 号。编码器10包括确定单元603,其配置成确定出自两个无损谱峰位置编码方案中的哪一个 要求最少的位数量来编码音频信号段谱峰位置。编码器10进一步包括选择单元604,配置成 选择要求最少位数量来编码音频信号段谱峰位置的谱峰位置编码方案。
[0089] 图7是示出了所提出编码器10的示例性实施例的框图。编码器10配置成执行实现 至少如上所述判定逻辑(8)的用于谱峰位置编码的方法。转发音频信号段至信号分析单元 16,其分析段以用于编码目的。从该分析提取的特征之一是谱峰位置的集合。可以通过使用 适和的现有技术方法来执行此分析。这些谱峰位置被转发至谱峰位置编码器12,其配置成 根据至少两个适合于不同谱峰位置分布的无损谱峰位置编码方案来编码音频信号段的谱 峰位置。每个编码方案总的位数量,即用于译码谱峰位置的相应方法所要求的位数量,被转 发至编码方案选择器14,其配置成选择要求最少位数量来编码音频信号段的谱峰位置的谱 峰位置编码方案。所选编码的谱峰位置被转发至输出单元18并转发至解码器。
[0090] 图8是示出了所提出编码器10的另一实施例的框图。谱峰位置的集合被转发至编 码器10,其包括谱峰位置编码模块12,用于根据至少两个适合于不同谱峰位置分布的无损 谱峰位置编码方案来编码音频信号段的谱峰位置。编码器10还包括编码方案选择模块14, 用于选择要求最少位数量来编码音频信号段谱峰位置的谱峰位置编码方案。所选编码的谱 峰位置被转发至解码器。所选编码方案也可被指示给如上所述的解码器。
[0091] 当编码器10配置成支持上述判定逻辑(9),编码方案选择模块14应进一步配置成 确定出自至少两个无损谱峰位置编码方案中的哪一个要求最少位数量来编码谱峰位置,这 还取决于与两个连续峰位置之间最大距离相关的准则。也就是说,在谱峰位置译码之前,编 码方案选择模块14应配置成确定最大距离Cl max是否超出预定阈值,并根据结果采取措施(参 看图3)。
[0092]图9示出了所提出编码器10的另一实施例的框图。此实施例基于处理器22,例如微 处理器,其执行计算机程序30用于编码音频信号段的谱峰位置。计算机程序存储在存储器 24中。处理器22与存储器通过系统总线通信。输入音频信号段由与处理器22和存储器24连 接的控制I/O总线的输入/输出(I/O)控制器26接收。从软件30获得的编码的谱峰位置通过 I/O总线由I/O控制器26的从存储器24输出。计算机程序30包括编码单元32(其用于根据适 合于不同谱峰位置分布的两个无损谱峰位置编码方案来编码音频信号段的谱峰位置)和编 码单元34(用于确定和选择要求最少位数量来编码音频信号段的谱峰位置的谱峰位置编码 方案)。
[0093]存在于存储器中的计算机程序可组织成适当功能模块,当由处理器执行时,配置 成执行上述步骤和/或任务的至少部分。图8中示出了这种功能模块的示例。软件或计算机 程序可被实现为计算机程序产品,其通常装载或存储在计算机-可读媒体上(有形非易失性 媒体)。计算机可读媒体可包括一个或多个可移动或非可移动存储装置,包括但不限于只读 存储器ROM、随机存取存储器RAM、光盘⑶、数字多用途盘DVD、通用串行总线USB、存储器、硬 盘驱动器HDD存储装置、闪存或任何其他常规存储装置。计算机程序可因此加载至计算机的 操作存储器或等效处理装置中以用于通过其处理电路执行。
[0094]例如,计算机程序包括可由处理电路执行的指令,由此处理电路能够或可操作来 执行本文描述的步骤、功能、规程和/或块。计算机或处理电路不必专用于执行本文描述的 步骤、功能、规程和/或块,而还可执行其他任务。
[0095] 本发明也包括用户终端,其包括如上所述的音频信号段编码器。用户终端可以是 有线或无线装置。
[0096] 如本文使用的,术语"无线装置"可指用户装备UE、移动电话、蜂窝电话、装配有无 线电通信能力的个人数字助理PDA、智能电话、装配有内部或外部移动宽带调制解调器的笔 记本电脑或个人电脑PC、具有无线电通信能力的平板PC、便携式电子无线电通信装置、装配 有无线电通信能力的传感器装置或类似的。具体地,术语"UE"应理解为非限制性术语,其包 括装配有无线电电路的任何装置,用于根据任何相关通信标准进行无线通信。
[0097] 如在本文使用的,术语"有线装置"可指的是当配置成有线连接至网络时的至少一 些上述装置,具有或不具有无线通信能力,例如PC。
[0098] 图10是示出了所提出用户终端50的一实施例的框图。该示例示出了 UE。来自麦克 风的音频信号被转发至模拟/数字转换器A/D,并且根据所提出技术通过编码器10处理数字 信号。具体地,编码器10编码如上所述的音频信号段的谱峰位置(通常编码器可执行其他任 务,诸如音频信号段的频率转换和编码描述段的其他参数,但由于这些任务是本领域众所 周知的并且不构成所提出技术的重要部分,因此没有描述它们)。所编码谱峰位置(和其他 参数)被转发至无线电单元40以用于传输至解码器。可选地,所选编码方案也可被转发至如 上所述的解码器。
[0099] 本文描述的实施例也涉及音频信号段解码方法用于谱峰位置的解码。此方法是与 前述编码方法对应的方法。
[0100] 图11是示出了所提出技术的解码方法的一实施例的流程图。在步骤1101中,接收 音频信号段的编码的谱峰位置。在步骤1102中,接收已选择用于编码的编码方案指示符。在 步骤1103中,以与指示的编码方案对应的解码模式解码谱峰位置。这也可表示为根据指示 的编码方案解码谱峰位置,即使用与指示的编码方案对应的解码方案。指示的编码方案是 出自两个无损谱峰编码方案中的一个,其中,如之前所述的,两个无损谱峰位置编码方案的 第一个适于周期性或半周期性谱峰位置分布;以及两个无损谱峰位置编码方案的第二个适 于稀疏谱峰位置分布。
[0101] 当适合于稀疏谱峰位置分布的编码方案被指示时,所编码谱峰位置以组位向量和 由组位向量压缩的非零位组的形式被接收。这与前面描述的稀疏编码方案对应。该组位向 量中的相应位置可然后表示位的连续相等大小组。此外,包含谱峰的相等大小组应与不包 括谱峰的相等大小组分开。包括谱峰的相等大小组也可表示为非零位组,并在该组位向量 中与不包括谱峰的相等大小组相比被不同地指示。例如,在组位向量中,非零位组能够由 "Γ指示,和不包括谱峰的组能够由"〇"指示,如上面的表达(5)-(7)。
[0102] 非零位组(如果其任何在组位向量中指示),可然后基于两个连续峰之间最小允许 距离中的约束来被解压缩。也就是说,以压缩形式可以连结至组位向量的非零位组可以通 过使用表(如上述表1)重映射来解压缩。由于与峰之间最小允许距离有关的约束或限制,不 是所有的序列是可能的非零位组,以及因此每个可能序列可映射至更短序列,即被压缩,如 前所述。
[0103] "零位"组,即不包含任何谱峰的组,如果在组位向量中被指示,能够通过生成零序 列解压缩。这种零序列应与解压缩的非零位组的大小相同,因为组应是相等大小的。假设稀 疏编码方案或模式用于稀疏谱峰位置,通常将有零位组在组位向量中被指示。
[0104] 当已指示的谱峰位置编码方案是适合于周期或半周期谱峰位置分布的编码方案 时,所接收的谱峰位置的解码可包括对应前述译码的霍夫曼解码或delta解码。用于霍夫曼 解码的霍夫曼表的大小可连同前述第二谱峰位置编码方案来优化。
[0105] 在备选实施例中,在译码器并没有将选择的编码方案指示给解码器的情况下,所 提出技术的解码方法可包括适于不同谱峰位置分布的两个谱峰位置解码模式中谱峰位置 的所谓的试解码。导致谱峰位置的集合被成功解码的解码方案或模式被认为与所选编码方 案对应。
[0106] 本文描述的实施例也涉及可操作来解码音频信号的解码器。解码器配置成执行用 于上述谱峰位置的解码的音频信号段解码方法的至少一个实施例。解码器相关联于与用于 上述谱峰位置编码和解码对应的编码器和方法相同的技术特征、目的和优点。解码器将被 简要描述以避免不必要的重复。
[0107] 图12示出了提出的音频信号段解码器110的一实施例的框图。输入单元116接收编 码的谱峰位置和编码方案指示符。解码器110包括谱峰位置解码器112,其配置成以解码模 式解码谱峰位置,该解码模式对应指示的适合于不同谱峰位置分布的出自两个谱峰位置编 码模式中的一个。输出单元118输出已解码的谱峰位置。以某种"解码模式"解码能够备选地 被表示为使用与某种指示的编码方案对应的解码方案以解码接收到的编码的谱峰位置。
[0108] 在一个实施例中,谱峰位置解码器112配置成接收音频信号段的编码的谱峰位置; 接收选择用于编码谱峰位置的编码方案的指示符;并以与指示的编码方案对应的解码模式 解码谱峰位置。后者能够备选地表示为如基于指示的编码方案解码谱峰位置,或表示为根 据指示的编码方案解码谱峰位置。图13是示出了所提出音频信号段解码器110的另一实施 例的框图。编码的谱峰位置和编码方案指示符被转发至谱峰位置解码模块112,其输出所解 码的谱峰位置。
[0109] 在一个实施例中,图13的解码器110包括谱峰位置解码模块112,用于将已接收的 音频信号段的编码的谱峰位置以解码模式解码成谱峰位置,该解码模式与已选择用于编码 谱峰位置的编码方案的接收的指示符对应。
[0110] 在另一实施例中,图13的解码器110包括谱峰位置解码模块112,用于将音频信号 段的已接收的编码的谱峰位置以适合于不同谱峰位置分布的至少两个谱峰位置解码模式 试解码成谱峰位置,并输出成功解码的谱峰位置的集合。
[0111] 图14是示出了所提出解码器的一实施例的框图。此实施例包括处理器22和存储器 24,其中存储器包含由处理器可执行的指令。指令的执行使得解码器110可操作用于以解码 模式解码谱峰位置,该解码模式对应适合于不同谱峰位置分布的至少两个谱峰位置编码模 式中的一个。该指令可存储为计算机可读媒体上的计算机程序产品120并且被传送至存储 器24,如图右侧虚线箭头所示。编码的谱峰位置和编码方案通过输入单元IN转发至处理器 22,并且已解码谱峰位置通过输出单元OUT输出。
[0112] 在一个实施例中,由处理器的指令执行使图14的解码器可操作用于接收音频信号 段的编码的谱峰位置;接收编码谱峰位置的所选择的编码方案的指示符;以及以与指示的 编码方案对应的解码模式解码谱峰位置。
[0113] 图14是示出了所提出解码器110的另一实施例的框图。此实施例基于处理器22,例 如微处理器,其执行计算机程序130用于解码音频信号段的谱峰位置。计算机程序存储在存 储器24中。处理器22通过系统总线与存储器通信。输入的编码的谱峰位置和编码方案指示 符由与处理器22和存储器24连接的控制I/O总线的输入/输出(I/O)控制器26接收。从软件 130获取的(已解码)谱峰位置由I/O控制器26通过I/O总线从存储器24输出。计算机程序130 包括编码单元132用于接收音频信号段的编码的谱峰位置;编码单元134用于接收编码谱峰 位置的所选择的编码方案的指示符;以及编码单元136用于以与指示的编码方案对应的解 码模式解码谱峰位置。后者也能够表示为:用于根据指示的编码方案解码谱峰位置。
[0114] 存在于存储器中的计算机程序可组织成适当功能模块,当由处理器执行时,配置 成执行上述步骤和/或任务的至少部分。图15中示出了这种功能模块的示例。
[0115] 图16是示出了所提出用户终端的一实施例的框图。该示例示出了UE。来自天线的 无线电信号被转发至无线电单元160,以及来自无线电单元的数字信号由解码器110根据所 提出的技术来处理。特别的,解码器110解码如上所述的音频信号段的编码的谱峰位置(通 常解码器可执行其他任务,如描述段的其它参数的解码,但由于这些任务是在本领域众所 周知的并且不形成所提出技术的重要部分,因此没有描述这些任务)。已解码的谱峰位置 (和其他参数)被转发至与扬声器连接的信号重构单元142。也可在解码器接收所选编码方 案,如上所述。
[0116] 如上所述的实施例仅仅作为示例给出,并且应当理解所提出的技术并不局限于 此。本领域技术人员将理解在不脱离本发明的范围的情况下可对实施例可作出各种修改、 组合和改变。具体地,当技术上可能时,不同实施例中不同部分的解决方案能够与其他配置 组合。
[0117] 缩写
[0118] ASIC专用集成电路
[0119] CPU中央处理器 [0120] DSP数字信号处理器 [0121 ] FPGA现场可编程门阵列
[0122] PLC可编程逻辑控制器
[0123] 参考文献
[0124] [I]D·Salomon,G.Motta/'Handbook of Data Compression",Fifth Edition, 2010,p.1111.
【主权项】
1. 一种用于编码谱峰位置的音频信号段编码方法,所述方法包括: -确定(301、302、401)出自两个无损谱峰位置编码方案中的哪一个要求最少位数量来 编码音频信号段的所述谱峰位置;以及 -选择(303、304、402)(52)要求最少位数量来编码所述音频信号段的所述谱峰位置的 谱峰位置编码方案, 其中所述两个无损谱峰位置编码方案中的第一个适合于周期性的或半周期性的谱峰 位置分布;以及两个无损谱峰位置编码方案中的第二个适合于稀疏谱峰位置分布。2. 根据权利要求1所述的方法,其中所述确定是基于所述音频信号段中两个谱峰之间 最大距离dmax(301)和/或基于在使用所述两个方案编码(302、401)所述音频信号段之后相 应方案所要求的位数量的比较。3. 根据权利要求1或2所述的方法,其中所述确定包括: 当所述音频信号段中两个谱峰之间最大距离dmax超出阈值T时: -确定适合于稀疏谱峰位置分布的所述编码方案是要求最少位数量来编码所述谱峰位 置的编码方案;以及 当所述最大距离dmax没有超出所述阈值T时: -通过在使用所述两个方案编码所述音频信号段之后比较由相应编码方案来编码而所 要求的位数量,确定要求最少位数量来编码所述谱峰位置的编码方案。4. 如权利要求1-3中任一所述的方法,其中所述第一无损谱峰位置编码方案包括: -峰位置的delta编码; -delta代码的霍夫曼编码。5. 如权利要求4所述的方法,其中霍夫曼表的大小连同所述第二谱峰位置编码方案来 被优化。6. 如权利要求1-5中任一所述的方法,其中所述第二无损谱峰位置编码方案包括以下 步骤: -将表示所述谱峰位置的位向量分成连续相等大小位组; -或运算每个位组中的位以形成组位向量; -通过采用两个连续峰之间最小允许距离中的约束来压缩非零位组; -通过将所述组位向量和所压缩的非零位组连结以形成压缩的位向量。7. -种用于编码谱峰位置的音频信号段编码器(10),所述编码器配置成: -确定出自两个无损谱峰位置编码方案中的哪一个要求最少的位数量来编码音频信号 段的所述谱峰位置;以及 -选择要求最少位数量来编码所述音频信号段的所述谱峰位置的谱峰位置编码方案, 其中所述两个无损谱峰位置编码方案中的第一个适合于周期性的或半周期性的谱峰位置 分布;以及所述两个无损谱峰位置编码方案中的第二个适合于稀疏谱峰位置分布。8. 根据权利要求7所述的音频信号段编码器,被进一步配置成基于所述音频信号段中 两个谱峰之间最大距离dmax和/或基于在使用所述两个方案来编码所述音频信号段之后相 应方案所要求位数量的比较来确定出自所述两个无损谱峰位置编码方案的哪一个要求最 少位数量。9. 根据权利要求7或8所述的音频信号段编码器,被配置成: 当所述音频信号段中两个谱峰之间的最大距离dmax超出阈值T时: -确定适合于稀疏谱峰位置分布的所述编码方案是要求最少位数量来编码所述谱峰位 置的编码方案;以及配置成 当所述最大距离dmax没有超出所述阈值Τ时: -通过在使用所述两个方案编码所述音频信号段之后比较由相应编码方案来编码而所 要求的位数量,确定要求最少位数量来编码所述谱峰位置的编码方案。10. 根据权利要求7-9中任一所述的音频信号段编码器,被配置以第一无损谱峰位置编 码方案,其中所述第一无损谱峰位置编码方案包括: -谱峰位置的delta编码; -delta代码的霍夫曼编码。11. 根据权利要求10所述的音频信号段编码器,其中霍夫曼表的大小连同所述第二谱 峰位置编码方案来被优化。12. 根据权利要求7-11中任一所述的音频信号段编码器,被配置以第二无损谱峰位置 编码方案,所述第二无损谱峰位置编码方案包括: -将表示所述谱峰位置的位向量分成连续相等大小位组; -或运算每个位组中的位以形成组位向量; -通过采用两个连续峰之间最小允许距离中的约束来压缩非零位组; -通过将所述组位向量和所压缩的非零位组连结以形成压缩的位向量。13. -种用户终端,包括根据权利要求7-12中任一所述的音频信号段编码器(10)。14. 一种用于解码谱峰位置的音频信号段解码方法,所述方法包括: -接收(1101)音频信号段的编码的谱峰位置; -接收(1102)出自两个无损编码方案的被选择来编码所述谱峰位置的无损编码方案的 指示符;以及 -一致于指示的编码方案来解码(1103)所述谱峰位置; 其中所述两个无损谱峰位置编码方案中的第一个适合于周期性的或半周期性的谱峰 位置分布;以及所述两个无损谱峰位置编码方案中的第二个适合于稀疏谱峰位置分布。15. 根据权利要求14所述的方法,其中当所指示的谱峰位置编码方案是适合于稀疏编 码谱峰位置分布的编码方案时,所述编码的谱峰位置以组位向量和由所述组位向量指示的 压缩的非零位组的形式被接收。16. 根据权利要求15所述的方法,其中所述组位向量中的相应位置表示连续相等大小 组,以及其中包括谱峰的相等大小组,即非零位组,与不包含谱峰的相等大小组相比在所述 组位向量中不同地被指示。17. 根据权利要求15或16所述的方法,进一步包括: -基于两个连续峰之间最小允许距离中的约束来解压缩任何非零位组,以及 -通过生成零序列来解压缩不包括谱峰的任何组。18. 根据权利要求14-17任一所述的方法,其中当所述指示的谱峰位置编码方案是适合 于周期性的或半周期性的谱峰位置分布的编码方案时,峰位置的解码包括霍夫曼解码和 delta解码。19. 根据权利要求18所述方法,其中霍夫曼表的大小连同所述第二谱峰位置编码方案 来被优化。20. -种用于解码谱峰位置的音频信号段解码器(110),所述解码器配置成: -接收音频信号段的编码的谱峰位置; -接收出自两个无损编码方案的被选择来编码所述谱峰位置的无损编码方案的指示 符;以及被配置成 -一致于指示的编码方案来解码所述谱峰位置; 其中所述两个无损谱峰位置编码方案中的第一个适合于周期性的或半周期性的谱峰 位置分布;以及所述两个无损谱峰位置编码方案中的第二个适合于稀疏谱峰位置分布。21. 根据权利要求20所述的音频信号段解码器,被配置成当所指示的谱峰位置编码方 案是适合于稀疏编码谱峰位置分布的编码方案时,所述编码的谱峰位置以组位向量和由所 述组位向量指示的压缩的非零位组的形式被接收。22. 根据权利要求21所述的音频信号段解码器,其中所述组位向量中的相应位置表示 连续相等大小组,以及其中包括谱峰的相等大小组,即非零位组,与不包含谱峰的相等大小 组相比在所述组位向量中不同地被指示。23. 根据权利要求21或22所述的音频信号段解码器,被配置成: -基于两个连续峰之间最小允许距离中的约束来解压缩任何非零位组,以及配置成 -通过生成零序列来解压缩不包括谱峰的任何组。24. 根据权利要求21-23中任一所述的音频信号段解码器,被配置成当所述指示的谱峰 位置编码方案是适合于周期性的或半周期性的谱峰位置分布的编码方案时,由霍夫曼解码 和delta解码来解码峰位置。25. 根据权利要求24所述音频信号段解码器,其中霍夫曼表的大小连同所述第二谱峰 位置编码方案来被优化。26. -种用户终端,包括根据权利要求22-25中任一所述的音频信号段解码器(110)。
【文档编号】G10L19/22GK105849803SQ201480057361
【公开日】2016年8月10日
【申请日】2014年10月10日
【发明人】V·格兰查罗夫, S·斯维里斯森
【申请人】瑞典爱立信有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1