音频编码器和音频解码器及对应的方法与流程

文档序号：28969764发布日期：2022-02-19 15:18阅读：518来源：国知局

音频编码器和音频解码器及对应的方法
1.本技术是申请人为弗朗霍夫应用科学研究促进协会、申请日为2016年3月7日、申请号为201680015022.2、发明名称为“音频编码器和音频解码器及对应的方法”的分案申请。
技术领域
2.实施例涉及音频编码，尤其涉及一种使用预测编码对音频信号进行编码的方法和装置以及涉及一种使用预测解码对经编码的音频信号进行解码的方法和装置。优选的实施例涉及用于音高-自适应性频谱预测的方法和装置。更优选的实施例涉及使用频域帧间预测工具借助于变换编码的音调音频信号的感知编码。

背景技术：

3.为了改进特别是在低比特率下的经编码的音调信号的质量，现代音频变换编码器采用非常长的变换和/或长期预测或预滤波/后滤波。然而，长的变换意味着长的演算延迟，其对于低延迟通讯情景来说是不被期望的。因此，基于瞬时基本音高的具有非常低的延迟的预测器近来受到欢迎。ietf(因特网工程任务组)opus编解码器在其频域celt(受限能量重叠变换)编码路径中利用音高自适应性预滤波和后滤波[j.m.valin,k.vos,and t.terriberry,“definition of the opus audio codec(opus音频编解码器的定义)”2012,ietf rfc 6716.http://tools.ietf.org/html/rfc67161.]，并且3gpp(第三代合作伙伴计划)evs(增强语音服务)编解码器提供用于经变换解码的信号的感知改进的长期谐波后滤波器[3gpp ts 26.443,“codec for enhanced voice services(evs),”release 12,dec.2014.]。这两种方法在时域中对经完全解码的信号波形进行操作，使得频率选择性地应用它们是困难和/或运算上昂贵的(两种方案仅提供简单的低通滤波器用于一些频率选择性)。因此，通过如在mpeg-2aac中受支持的频域预测(fdp)，提供对时域长期预测(ltp)或预滤波/后滤波(ppf)的受欢迎的替代方案[iso/iec13818-7,“information technology
–
part 7:advanced audio coding(aac)(信息技术-第7部分：高级音频编码)”2006.]。虽然促进频率选择性，此方法具有其本身缺点，如下文所述。
[0004]
如上所介绍的fdp方法对其他工具有两个缺点。第一，该fdp方法要求高运算复杂度。详细地说，在所有比例因子带中的预测的最坏情况下，对于用于每个帧和通道的数百个频谱仓(spectral bins)应用至少二阶(即来自上两个帧的通道变换仓)的线性预测编码[iso/iec 13818-7,“information technology
–
part 7:advanced audio coding(aac),”2006.]。第二，fdp方法包括受限总体预测增益。更精确地，因为可预测谐波、音调频谱部分之间的噪声分量也受到预测，预测的效率被限制，并由于这些噪声部分通常是不可预测的而引入误差。
[0005]
此高复杂度归因于预测器的后向自适应性。此代表针对每个仓的预测系数必须基于先前传送的仓(bin)而计算。因此，编码器与解码器之间的数值不准确可导致归因于发散预测系数的重建误差。为了克服此问题，必须保证比特完全相同适应。此外，即使预测器的
群组在某些帧中被停用，为了保持预测系数是最新的，必须一直执行适应。

技术实现要素：

[0006]
因此，本发明的目的在于提供用于编码音频信号和/或解码经编码的音频信号的概念，其避免前述问题中的至少一个(例如，两者)并导致更有效且运算上低廉的实施。
[0007]
通过独立权利要求实现此目的。
[0008]
由从属权利要求提出有益的实施。
[0009]
实施例提供一种用于编码音频信号的编码器。编码器用于在变换域或滤波器组域中编码音频信号，其中编码器用于为当前帧和至少一个先前帧确定音频信号的频谱系数，其中编码器用于将预测编码选择性地应用于多个个别频谱系数或频谱系数的群组，其中编码器用于确定间距值，其中编码器用于基于可作为旁侧信息连同经编码的音频信号被传送的间距值对应用预测编码的多个个别频谱系数或频谱系数的群组进行选择。
[0010]
其他实施例提供一种用于对经编码的音频信号(例如，由上述的编码器编码的)进行解码的解码器。解码器用于在变换域或滤波器组域中对经编码的音频信号进行解码，其中解码器用于解析经编码的音频信号以为当前帧和至少一个先前帧获得音频信号的经编码的频谱系数，并且其中解码器用于将预测解码选择性地应用于多个个别经编码的频谱系数或经编码的频谱系数的群组，其中解码器可用于基于经传送的间距值对应用预测解码的多个个别经编码的频谱系数或经编码的频谱系数的群组进行选择。
[0011]
根据本发明的概念，预测编码(仅)应用于所选频谱系数。可依据信号特性对应用预测编码的频谱系数进行选择。举例而言，通过不将预测编码应用于噪声信号分量，避免了前述由对不可预测的噪声信号分量进行预测所引入的误差。同时，运算复杂度可因为仅将预测编码应用于所选频谱分量而被减少。
[0012]
举例而言，可利用导引/自适应性频谱域帧间预测方法借助于变换编码(例如，由编码器)执行音调音频信号的感知编码。通过将预测仅应用于(例如)位于基本频率或音高的整数倍(其可在适合的比特流中从编码器被信号发送至解码器(例如)作为间距值)处的谐波信号分量周围的频谱系数，可增加频域预测(fdp)的效率且可降低运算复杂度。本发明的实施例可优选地被实施或整合进mpeg-h 3d音频编解码器中，但也可应用于诸如，例如mpeg-2aac的任何音频变换编码系统。
[0013]
其他实施例提供一种用于在变换域或滤波器组域中编码音频信号的方法，该方法包括：
[0014]-为当前帧和至少一个先前帧确定音频信号的频谱系数；
[0015]-确定间距值；以及
[0016]-将预测编码选择性地应用于多个个别频谱系数或频谱系数的群组，其中基于间距值对应用预测编码的多个个别频谱系数或频谱系数的群组进行选择。
[0017]
其他实施例提供一种用于在变换域或滤波器组域中对经编码的音频信号进行解码的方法，该方法包括：
[0018]-对经编码的音频信号进行解析以为当前帧和至少一个先前帧获得音频信号的经编码的频谱系数；
[0019]-获得间距值；以及
[0020]-将预测解码选择性地应用于多个个别经编码的频谱系数或经编码的频谱系数的群组，其中应用预测解码的多个个别经编码的频谱系数或经编码的频谱系数的群组是基于间距值而被选择的。
附图说明
[0021]
在此，参照附图描述本发明的实施例，其中：
[0022]
图1展示根据实施例的用于编码音频信号的编码器的示意性框图；
[0023]
图2在图中展示根据实施例的针对当前帧关于频率绘制的音频信号的幅度和对应的应用预测编码的所选频谱系数；
[0024]
图3在图中展示根据实施例的针对当前帧关于频率绘制的音频信号的幅度和对应的根据mpeg-2aac受到预测的频谱系数；
[0025]
图4展示根据实施例的用于对经编码的音频信号进行解码的解码器的示意性框图；
[0026]
图5展示根据实施例的用于编码音频信号的方法的流程图；
[0027]
图6展示根据实施例的用于对经编码的音频信号进行解码的方法的流程图。
具体实施方式
[0028]
在下面的描述中，相等或等效的元件或是具有相等或等效功能的元件被标记有相等或等效的附图标记。
[0029]
在下面的描述中，阐述多个细节以提供本发明的实施例的更详尽的解释。然而，对本领域技术人员显而易见的是，可在没有这些特定的细节的情况下实践本发明的实施例。在其他示例中，为了避免模糊本发明的实施例，公知的结构和设备是以框图形式而非详细地示出。此外，除非另外有特别注明，之后描述的不同的实施例的特征可互相组合。
[0030]
图1展示根据实施例的用于编码音频信号102的编码器100的示意性框图。编码器100用于在变换域或滤波器组域104(例如，频域或频谱域)中编码音频信号102，其中编码器100用于为当前帧108_t0确定音频信号102的频谱系数106_t0_f1至106_t0_f6以及为至少一个先前帧108_t-1确定音频信号的频谱系数106_t-1_f1至106_t-1_f6。另外，编码器100用于将预测编码选择性地应用于多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组，其中编码器100用于确定间距值，其中编码器100用于基于间距值选择应用预测编码的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组。
[0031]
换句话说，编码器100用于将预测编码选择性地应用于基于作为旁侧信息被传送的间距值所选择的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组。
[0032]
间距值可对应于频率(例如，(音频信号102的)谐波音调的基本频率)，该频率与其整数倍一起定义了应用预测的所有频谱系数的群组的中心：第一群组可以以此频率为中心、第二群组可以以此频率的两倍为中心、第三群组可以以此频率的三倍为中心，以此类推。对这些中心频率的了解能够实现用来预测对应的正弦信号分量(例如，谐波信号的基音与泛音)的预测系数的计算。因此，不再需要复杂且易出错的预测系数的后向自适应。
[0033]
在实施例中，编码器100可用于每帧地确定一个间距值。
[0034]
在实施例中，多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组可被至少一个频谱系数106_t0_f3分隔。
[0035]
在实施例中，编码器100可用于将预测编码应用于由至少一个频谱系数分隔的多个个别频谱系数，如应用于由至少一个频谱系数分隔的两个个别频谱系数。另外，编码器100可用于将预测编码应用于由至少一个频谱系数分隔的频谱系数的多个群组(每个群组包括至少两个频谱系数)，如应用于由至少一个频谱系数分隔的两组频谱系数。另外，编码器100可用于将预测编码应用于由至少一个频谱系数分隔的多个个别频谱系数和/或频谱系数的群组，如应用于由至少一个频谱系数分隔的至少一个个别频谱系数和至少一组频谱系数。
[0036]
在图1展示的示例中，编码器100用于为当前帧108_t0确定六个频谱系数106_t0_f1至106_t0_f6以及为先前帧108_t-1确定六个频谱系数106_t-1_f1至106_t-1_f6。由此，编码器100用于将预测编码选择性地应用于当前帧的个别第二频谱系数106_t0_f2以及应用于由当前帧108_t0的第四和第五频谱系数106_t0_f4和106_t0_f5组成的频谱系数的群组。正如可见到的，个别第二频谱系数106_t0_f2及由第四和第五频谱系数106_t0_f4和106_t0_f5组成的频谱系数的群组由第三频谱系数106_t0_f3彼此分隔。
[0037]
应注意的是，此处使用的术语“选择性”是指将预测编码(仅)应用于所选频谱系数。换句话说，预测编码不必应用于所有频谱系数，而是仅应用于所选择的个别频谱系数或频谱系数的群组，所选择的个别频谱系数和/或频谱系数的群组可由至少一个频谱系数互相分隔。换句话说，对于对所选择的多个个别频谱系数或频谱系数的群组进行分隔的至少一个频谱系数，可停用预测编码。
[0038]
在实施例中，编码器100可用于基于先前帧108_t-1的至少多个对应的个别频谱系数106_t-1_f2或频谱系数106_t-1_f4和106_t-1_f5的群组将预测编码选择性地应用于当前帧108_t0的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组。
[0039]
举例而言，编码器100可用于通过对当前帧108_t0的多个经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组与当前帧的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组(或其量化版本)之间的预测误差进行编码，对当前帧108_t0的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组进行预测编码。
[0040]
在图1中，编码器100通过对当前帧108_t0的经预测的个别频谱系数110_t0_f2与当前帧108_t0的个别频谱系数106_t0_f2之间的预测误差以及当前帧的经预测的频谱系数110_t0_f4和110_t0_f5的群组与当前帧的频谱系数106_t0_f4和106_t0_f5的群组之间的预测误差进行编码，对个别频谱系数106_t0_f2及由频谱系数106_t0_f4与106_t0_f5组成的频谱系数的群组进行编码。
[0041]
换句话说，第二频谱系数106_t0_f2是通过对经预测的第二频谱系数110_t0_f2与(实际的或确定的)第二频谱系数106_t0_f2之间的预测误差(或差异)进行编码而被编码的，其中第四频谱系数106_t0_f4是通过对经预测的第四频谱系数110_t0_f4与(实际的或确定的)第四频谱系数106_t0_f4之间的预测误差(或差异)进行编码而被编码的，且其中第五频谱系数106_t0_f5是通过对经预测的第五频谱系数110_t0_f5与(实际的或确定的)第五频谱系数106_t0_f5之间的预测误差(或差异)进行编码而被编码的。
[0042]
在实施例中，编码器100可用于借助于先前帧108_t-1的多个个别频谱系数106_t-1_f2或频谱系数106_t-1_f4和106_t-1_f5的群组的对应实际版本，为当前帧108_t0确定多个经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组。
[0043]
换句话说，在上述的确定过程中，编码器100可直接地使用先前帧108_t-1的多个实际个别频谱系数106_t-1_f2或实际频谱系数106_t-1_f4和106_t-1_f5的群组(其中106_t-1_f2、106_t-1_f4和106_t-1_f5分别代表原始的、尚未被量化的频谱系数或频谱系数的群组)，因为它们被编码器100获得以使得所述编码器可在变换域或滤波器组域104中进行操作。
[0044]
举例来说，编码器100可用于基于先前帧108_t-1的第二频谱系数106_t-1_f2的对应的尚未被量化的版本确定当前帧108_t0的第二经预测的频谱系数110_t0_f2、基于先前帧108_t-1的第四频谱系数106_t-1_f4的对应的尚未被量化的版本确定当前帧108_t0的经预测的第四频谱系数110_t0_f4，以及基于先前帧的第五频谱系数106_t-1_f5的对应的尚未被量化的版本确定当前帧108_t0的经预测的第五频谱系数110_t0_f5。
[0045]
通过此方法，预测编码和解码方案可呈现一种量化噪声的谐波成形，因为对应的解码器(关于图4在下文中描述其实施例)在上述确定步骤中仅可以运用先前帧108_t-1的多个个别频谱系数106_t-1_f2或频谱系数106_t-1_f4和106_t-1_f5的多个群组的经传输的量化版本来用于预测解码。
[0046]
虽然此谐波噪声成形，因为其是例如传统上在时域中由长期预测(ltp)所执行的而可主观地对预测编码有利，而在某些情况下其可能是不被期望的因为会导致不想要的、过量的音调被引入经解码的音频信号。由于此原因，下文描述与对应的解码完全同步、并同样地仅利用任何可能的预测增益但却不会导致量化噪声成形的替代预测编码方案。根据此替代编码实施例，编码器100可用于使用先前帧108_t-1的多个个别频谱系数106_t-1_f2或频谱系数106_t-1_f4和106_t-1_f5的群组的对应的量化版本，为当前帧108_t0确定多个经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组。
[0047]
举例而言，编码器100可用于基于先前帧108_t-1的第二频谱系数106_t-1_f2的对应的量化版本确定当前帧108_t0的第二经预测的频谱系数110_t0_f2、基于先前帧108_t-1的第四频谱系数106_t-1_f4的对应的量化版本确定当前帧108_t0的经预测的第四频谱系数110_t0_f4，及基于先前帧108_t-1的第五频谱系数106_t-1_f5的对应的量化版本确定当前帧108_t0的经预测的第五频谱系数110_t0_f5。
[0048]
另外，编码器100可用于从间距值得出预测系数112_f2、114_f2、112_f4、114_f4、112_f5及114_f5，并使用至少两个先前帧108_t-1和108_t-2的多个个别频谱系数106_t-1_f2和106_t-2_f2或频谱系数106_t-1_f4、106_t-2_f4、106_t-1_f5和106_t-2_f5的群组的对应的量化版本及使用得出的预测系数112_f2、114_f2、112_f4、114_f4、112_f5及114_f5，为当前帧108_t0计算多个经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组。
[0049]
举例而言，编码器100可用于：为第二频谱系数106_t0_f2从间距值得出预测系数112_f2和114_f2、为第四频谱系数106_t0_f4从间距值得出预测系数112_f4和114_f4，以及为第五频谱系数106_t0_f5从间距值得出预测系数112_f5和114_f5。
[0050]
举例而言，预测系数的得出可以以下述方式得出：若间距值或其经编码的版本对
应于频率f0，则启用预测的第k组频谱系数的中心频率为fc＝k*f0。若取样频率为fs且变换跃程大小(在连续帧间的移位)为n，则假设具有频率fc的正弦信号的理想预测器系数在第k组中为：
[0051]
p1＝2*cos(n*2*pi*fc/fs)且p2＝-1。
[0052]
若，例如，频谱系数106_t0_f4和106_t0_f5在此群组内，则预测系数为：
[0053]
112_f4＝112_f5＝2*cos(n*2*pi*fc/fs)且114_f4＝114_f5＝-1
[0054]
出于稳定性原因，可引入阻尼因数d以导致修改的预测系数：
[0055]
112_f4’＝112_f5’＝d*2*cos(n*2*pi*fc/fs),114_f4’＝114_f5’＝d2。
[0056]
由于间距值是在经编码的音频信号120中传输，解码器可得出完全相同的预测系数212_f4＝212_f5＝2*cos(n*2*pi*fc/fs)且114_f4＝114_f5＝-1。若使用阻尼因数，则系数可被相应地修改。
[0057]
如同图1中所表示，编码器100可用于提供经编码的音频信号120。由此，编码器100可被配置为对于应用预测编码的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组将预测误差的量化版本包括于经编码的音频信号120中。另外，编码器100可被配置为不将预测系数112_f2至114_f5包括于经编码的音频信号120中。
[0058]
因此，编码器100可仅使用预测系数112_f2至114_f5以计算多个经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组以及来自于其的当前帧的经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组与个别频谱系数106_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组之间的预测误差，但在经编码的音频信号120中将不会提供个别频谱系数106_t0_f4(或其量化版本)或频谱系数106_t0_f4和106_t0_f5的群组(或其量化版本)也不会提供预测系数112_f2至114_f5。因此，解码器(之后关于图4描述其实施例)可以从间距值得出用于为当前帧计算多个经预测的个别频谱系数或经预测的频谱系数的群组的预测系数112_f2至114_f5。
[0059]
换句话说，编码器100可被配置为，为应用预测编码的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组提供包括预测误差的量化版本而不是多个个别频谱系数106_t0_f2的或频谱系数106_t0_f4和106_t0_f5的群组的量化版本的经编码的音频信号120。
[0060]
另外，编码器100可用于提供包括对多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组进行分隔的频谱系数106_t0_f3的量化版本的经编码的音频信号120，使得存在频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组(对于其，预测误差的量化版本包括在经编码的音频信号120中)与频谱系数106_t0_f3或频谱系数的群组(对于其，不使用预测编码而提供量化版本)的交替。
[0061]
在实施例中，编码器100还可用于对预测误差的量化版本以及将多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组进行分隔的频谱系数106_t0_f3的量化版本进行熵编码，以及将经熵编码的版本(而不是其未经熵编码的版本)包括于经编码的音频信号120中。
[0062]
图2在图中展示针对当前帧108_t0关于频率绘制的音频信号102的幅度。另外，在图2中，表示了由编码器100为音频信号102的当前帧108_t0确定的变换域或滤波器组域中的频谱系数。
[0063]
如图2中所示，编码器100可用于将预测编码选择性地应用于由至少一个频谱系数所分隔的频谱系数的多个群组116_1至116_6。详细地说，在图2所示的实施例中，编码器100将预测编码选择性地应用于频谱系数的六个群组116_1至116_6，其中频谱系数的前五个群组116_1至116_5的每个包括三个频谱系数(例如，第二群组116_2包括频谱系数106_t0_f8、106_t0_f9及106_t0_f10)，其中频谱系数的第六个群组116_6包括两个频谱系数。因此，频谱系数的此六个群组116_1至116_6是由不应用预测编码的频谱系数的(五个)群组118_1至118_5所分隔。
[0064]
换句话说，如图2中所表示，编码器100可用于将预测编码选择性地应用于频谱系数的群组116_1至116_6，使得存在应用预测编码的频谱系数的群组116_1至116_6与不应用预测编码的频谱系数的群组118_1至118_5的交替。
[0065]
在实施例中，编码器100可用于确定间距值(由箭头122_1和122_2表示于图2中)，其中编码器100可用于基于间距值选择应用预测编码的频谱系数的多个群组116_1至116_6(或多个个别频谱系数)。
[0066]
该间距值可为，例如，音频信号102的两个特征频率如音频信号的尖峰124_1及124_2之间的间距(或距离)。另外，该间距值可为近似于音频信号的两个特征频率之间的间距的频谱系数的整数编号(或频谱系数的索引)。自然地，间距值还可以是描述音频信号的两个特征频率之间的间距的频谱系数的整数编号(integer number of)的实值或分数或倍数。
[0067]
在实施例中，编码器100可用于确定音频信号(102)的瞬时基本频率并从瞬时基本频率或其分数或倍数得出间距值。
[0068]
举例而言，音频信号102的第一尖峰124_1可以是音频信号102的瞬时基本频率(或音高、或第一谐波)。因此，编码器100可用于确定音频信号102的瞬时基本频率并从瞬时基本频率或其分数或倍数得出间距值。在此情况下，间距值可以是近似于音频信号102的瞬时基本频率124_1与第二谐波124_2之间的间距的频谱系数的整数编号(或其分数或倍数)。
[0069]
自然地，音频信号102可包括两个以上的谐波。例如，展示于图2中的音频信号102包括频谱上分布的六个谐波124_1至124_6使得音频信号102在每个整数倍的瞬时基频上包括谐波。自然地，音频信号102还可能不包括所有但只包括一些谐波，如第一、第三和第五谐波。
[0070]
在实施例中，编码器100可用于选择根据由间距值定义的谐波栅(harmonic grid)而频谱布置的频谱系数的群组116_1至116_6(或个别频谱系数)以用于预测编码。由此，由间距值定义的谐波栅描述音频信号102中的谐波的周期性频谱分布(等距间距)。换句话说，由间距值定义的谐波栅可以是描述音频信号的谐波的等距间距的间距值的序列。
[0071]
另外，编码器100可用于选择频谱系数(例如，仅那些频谱系数)，其频谱索引与基于间距值得出的多个频谱索引相等或位于基于间距值得出的多个频谱索引周围的范围(例如，预先确定或可变的)内，以用于预测编码。
[0072]
代表音频信号102的谐波的频谱系数的索引(或编号)可从间距值得出。例如，假设第四频谱系数106_t0_f4代表音频信号102的瞬时基本频率且假设间距值为五，则基于间距值可得出具有索引九的频谱系数。如可在图2中见到的，所得出的具有索引九的频谱系数(即，第九个频谱系数106_t0_f9)代表第二个谐波。同样地，具有索引14、19、24及29的频谱
系数可得出，代表第三至第六个谐波124_3至124_6。然而，不仅具有与基于间距值得出的多个频谱索引相等的索引的频谱系数可被预测编码，具有在基于间距值得出的多个频谱索引周围的给定范围内的索引的频谱系数也可被预测编码。举例来说，如图2中所示，该范围可为三，以使得不是多个个别频谱系数而是频谱系数的多个群组被选择用于预测编码。
[0073]
另外，编码器100可用于选择应用预测编码的频谱系数的群组116_1至116_6(或多个个别频谱系数)使得在应用预测编码的频谱系数的群组116_1至116_6(或多个个别频谱系数)与分隔应用预测编码的频谱系数的群组(或多个个别频谱系数)的频谱系数之间存在周期性交替，其以+/-1频谱系数的容差为周期。当音频信号102的两个谐波之间的距离不等于整数间距值(关于频谱系数的索引或编号的整数)而是其分数或倍数时，可能需要+/-1频谱系数的容差。此也可于图2中所见，因为箭头122_1至122_6并不总是完全指向对应频谱系数的中心或中间。
[0074]
换句话说，音频信号102可包括至少两个谐波信号分量124_1至124_6，其中编码器100可用于将预测编码选择性地应用于代表音频信号102的至少两个谐波信号分量124_1至124_6或至少两个谐波信号分量124_1至124_6周围的频谱环境的频谱系数的多个群组116_1至116_6(或个别频谱系数)。至少两个谐波信号分量124_1至124_6周围的频谱环境可为，例如，+/-1、2、3、4或5个频谱分量。
[0075]
由此，编码器100可用于不将预测编码应用于不代表音频信号102的至少两个谐波信号分量124_1至124_6或至少两个谐波信号分量124_1至124_6的频谱环境的频谱系数的那些群组118_1至118_5(或多个个别频谱系数)。换句话说，编码器100可用于不将预测编码应用于属于信号谐波124_1至124_6之间的非音调背景噪声的频谱系数的多个群组118_1至118_5(或个别频谱系数)。
[0076]
另外，编码器100可用于确定指示音频信号102的至少两个谐波信号分量124_1至124_6之间的频谱间距的谐波间距值，该谐波间距值指示代表音频信号102的至少两个谐波信号分量124_1至124_6的多个个别频谱系数或频谱系数的多个群组。
[0077]
此外，编码器100可用于提供经编码的音频信号120使得经编码的音频信号120包括间距值(例如，每帧一个间距值)或(可选地)可直接得出间距值的参数。
[0078]
本发明实施例通过将谐波间距值引入fdp过程解决了前述fdp方法的两个问题，该谐波间距值从编码器(发射器)100被信号发送至各个解码器(接收器)使得二者可以以完全同步的方式操作。所述谐波间距值可作为与待编码的帧相关联的一个或多个频谱的瞬时基本频率(或音高)的指示器，并识别哪些频谱仓(频谱系数)应被预测。更明确地，只有位于(关于其索引)基本音高的整数倍(如由谐波间距值定义)处的谐波信号分量周围的那些频谱系数应受到预测。图2和3借助于简单示例示出此音高自适应性预测方法，其中图3展示mpeg-2aac中的当前技术水平的预测器的操作，其不只在谐波栅周围预测，还使低于一定停止频率的每个频谱仓受到预测，且其中图2绘示具有根据实施例的修改被整合以仅在最接近谐波间距栅的那些“音调”仓上执行预测的相同的预测器。
[0079]
比较图2与图3揭示根据实施例的修改的两个优点，即：(1)非常少的频谱仓被包括于预测过程中，减少了复杂度(在所给的例子中由于仅预测五分之三的仓而减少大约40％)，以及(2)属于谐波信号之间的非音调背景噪声的仓不受预测影响，其应该会增加预测的效率。
[0080]
应注意的是，谐波间距值不一定需要对应于输入信号的实际瞬时音高，其也可代表真实音高的分数或倍数，只要可对预测过程的效率产生整体改进。此外，必须强调的是，谐波间距值不一定要反映仓索引或带宽单位的整数倍，而可包括所述单位的分数。
[0081]
随后将描述mpeg式音频编码器的优选实施。
[0082]
音高自适应性预测被优选地整合至mpeg-2aac中[iso/iec 13818-7,“information technology
–
part 7:advanced audio coding(aac),”2006.]或，利用如在aac中的相似预测器而被整合至mpeg-h 3d音频编解码器中[iso/iec 23008-3,“information technology
–
high efficiency coding,part 3:3d audio(信息技术-高效率编码，第三部分：3d音频)”2015.]。特别地，针对非独立编码的每个帧和通道，一比特旗标可被写入至、且读取自各个比特流(对于独立帧通道，因为可停用预测以确保独立性，旗标可不被传输)。若将旗标设置为一，则其他8比特可被写入和读取。此8比特代表用于给定帧和通道的谐波间距值的量化版本(例如索引)。采用使用线性或非线性映射函数而从量化版本得出的谐波间距值，可以以根据图2所示的实施例的方式实现预测过程。优选地，只有位于谐波栅周围的1.5仓的最大距离内的仓受到预测。例如，若谐波距离值指示在仓索引47.11处的谐波线，则只有在索引46、47及48的仓会受到预测。然而，所述最大距离可被不同地指定，对于所有通道和帧为固定先验的或基于谐波间距值分别用于每个帧及通道。
[0083]
图4展示用于对经编码的信号120进行解码的解码器200的示意性框图。解码器200用于在变换域或滤波器组域204中对经编码的音频信号120进行解码，其中解码器200用于对经编码的音频信号120进行解析以为当前帧208_t0获得音频信号的经编码的频谱系数206_t0_f1至206_t0_f6以及为至少一个先前帧208_t-1获得经编码的频谱系数206_t-1_f0至206_t-1_f6，及其中解码器200用于将预测解码选择性地应用于由至少一个经编码的频谱系数分隔的多个个别经编码的频谱系数或经编码的频谱系数的群组。
[0084]
在实施例中，解码器200可用于将预测解码应用于由至少一个经编码的频谱系数分隔的多个个别经编码的频谱系数，如应用于由至少一个经编码的频谱系数分隔的两个个别经编码的频谱系数。另外，解码器200可用于将预测解码应用于由至少一个经编码的频谱系数分隔的经编码的频谱系数的多个群组(每个群组包括至少两个经编码的频谱系数)，诸如应用于由至少一个经编码的频谱系数分隔的经编码的频谱系数的两个群组。另外，解码器200可用于将预测解码应用于由至少一个经编码的频谱系数分隔的多个个别经编码的频谱系数和/或经编码的频谱系数的群组，诸如应用于由至少一个经编码的频谱系数分隔的至少一个个别经编码的频谱系数及经编码的频谱系数的至少一个群组。
[0085]
在图4展示的示例中，解码器200可用于为当前帧208_t0确定六个经编码的频谱系数206_t0_f1至206_t0_f6以及为先前帧208_t-1确定六个经编码的频谱系数206_t-1_f1至206_t-1_f6。由此，解码器200用于将预测解码选择性地应用于当前帧的个别第二经编码的频谱系数206_t0_f2以及应用于由当前帧208_t0的第四及第五经编码的频谱系数206_t0_f4与206_t0_f5组成的经编码的频谱系数的群组。如可见，个别第二经编码的频谱系数206_t0_f2及由第四和第五经编码的频谱系数206_t0_f4与206_t0_f5组成的经编码的频谱系数的群组是通过第三经编码的频谱系数206_t0_f3而彼此分隔的。
[0086]
应注意的是，此处使用的术语“选择性”是指将预测解码(仅)应用于所选择的经编码的频谱系数。换句话说，预测解码不必要应用于所有经编码的频谱系数，而是仅应用于所
选择的个别经编码的频谱系数或经编码的频谱系数的群组，所选择的个别经编码的频谱系数和/或经编码的频谱系数的群组通过至少一个经编码的频谱系数而互相分隔。换句话说，预测解码不应用于分隔所选择的多个个别经编码的频谱系数或经编码的频谱系数的群组的至少一个经编码的频谱系数。
[0087]
在实施例中，解码器200可用于不将预测解码应用于分隔个别经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组的至少一个经编码的频谱系数206_t0_f3。
[0088]
解码器200可用于对经编码的频谱系数进行熵解码，以为待应用预测解码的频谱系数206_t0_f2、206_t0_f4及206_t0_f5获得量化预测误差，及为将不应用预测解码的至少一个频谱系数获得量化频谱系数206_t0_f3。由此，解码器200可用于将量化预测误差应用于多个经预测的个别频谱系数210_t0_f2或经预测的频谱系数210_t0_f4及210_t0_f5的群组，以为当前帧208_t0获得与应用预测解码的经编码的频谱系数206_t0_f2、206_t0_f4及206_t0_f5相关联的经解码的频谱系数。
[0089]
举例而言，解码器200可用于为第二量化频谱系数206_t0_f2获得第二量化预测误差及将第二量化预测误差应用于经预测的第二频谱系数210_t0_f2，以获得与第二经编码的频谱系数206_t0_f2相关联的第二经解码的频谱系数，其中解码器200可用于为第四量化频谱系数206_t0_f4获得第四量化预测误差及将第四量化预测误差应用于经预测的第四频谱系数210_t0_f4，以获得与第四经编码的频谱系数206_t0_f4相关联的第四经解码的频谱系数，以及其中解码器200可用于为第五量化频谱系数206_t0_f5获得第五量化预测误差及将第五量化预测误差应用于经预测的第五频谱系数210_t0_f5，以获得与第五经编码的频谱系数206_t0_f5相关联的第五经解码的频谱系数。
[0090]
另外，解码器200可用于基于先前帧208_t-1的对应的多个个别经编码的频谱系数206_t-1_f2(例如，使用与多个个别经编码的频谱系数206_t-1_f2相关联的多个先前解码的频谱系数)或经编码的频谱系数206_t-1_f4及206_t-1_f5的群组(例如，使用与经编码的频谱系数206_t-1_f4和206_t-1_f5的群组相关联的先前解码的频谱系数的群组)，为当前帧208_t0确定多个经预测的个别频谱系数210_t0_f2或经预测的频谱系数210_t0_f4及210_t0_f5的群组。
[0091]
举例而言，解码器200可用于使用与先前帧208_t-1的第二经编码的频谱系数206_t-1_f2相关联的先前解码(量化)的第二频谱系数确定当前帧208_t0的第二经预测的频谱系数210_t0_f2、使用与先前帧208_t-1的第四经编码的频谱系数206_t-1_f4相关联的先前解码(量化)的第四频谱系数确定当前帧208_t0的第四经预测的频谱系数210_t0_f4、及使用与先前帧208_t-1的第五经编码的频谱系数206_t-1_f5相关联的先前解码(量化)的第五频谱系数确定当前帧208_t0的第五经预测的频谱系数210_t0_f5。
[0092]
此外，解码器200可用于从间距值得出预测系数，且其中解码器200可用于使用至少两个先前帧208_t-1及208_t-2的对应的多个先前解码的个别频谱系数或先前解码的频谱系数的群组及使用得出的预测系数，为当前帧208_t0计算多个经预测的个别频谱系数210_t0_f2或经预测的频谱系数210_t0_f4和210_t0_f5的群组。
[0093]
举例而言，解码器200可用于：从间距值得出用于第二经编码的频谱系数206_t0_f2的预测系数212_f2及214_f2、从间距值得出用于第四经编码的频谱系数206_t0_f4的预
测系数212_f4及214_f4，以及从间距值得出用于第五经编码的频谱系数206_t0_f5的预测系数212_f5及214_f5。
[0094]
应注意的是，解码器200可用于解码经编码的音频信号120从而为应用预测解码的多个个别经编码的频谱系数或经编码的频谱系数的群组获得量化预测误差而不是多个个别量化频谱系数或量化频谱系数的群组。
[0095]
另外，解码器200可用于对经编码的音频信号120进行解码从而获得分隔多个个别频谱系数或频谱系数的群组的量化频谱系数，使得存在经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组(为其获得了量化预测误差)以及经编码的频谱系数206_t0_f3或经编码的频谱系数的群组(为其获得了量化频谱系数)的交替。
[0096]
解码器200可用于使用与应用预测解码的经编码的频谱系数206_t0_f2、206_t0_f4及206_t0_f5相关联的经解码的频谱系数及使用与不应用预测解码的经编码的频谱系数206_t0_f1、206_t0_f3及206_t0_f6相关联的经熵解码的频谱系数提供经解码的音频信号220。
[0097]
在实施例中，解码器200可用于获得间距值，其中解码器200可用于基于间距值选择应用预测解码的多个个别经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组。
[0098]
如以上关于对应的编码器100的描述提及的，间距值可以是，例如，在音频信号的两个特征频率之间的间距(或距离)。另外，间距值可以是近似于音频信号的两个特征频率之间的间距的频谱系数的整数编号(或频谱系数的索引)。自然地，间距值还可以是描述音频信号的两个特征频率之间的间距的频谱系数的整数编号的分数或倍数。
[0099]
解码器200可用于选择根据由间距值定义的谐波栅而频谱布置的个别频谱系数或频谱系数的群组以用于预测解码。由间距值定义的谐波栅可描述音频信号102中的谐波的周期性频谱分布(等距间距)。换句话说，由间距值定义的谐波栅可以是描述音频信号102的谐波的等距间距的间距值的序列。
[0100]
另外，解码器200可用于选择频谱系数(例如，仅那些频谱系数)，其频谱索引与基于间距值得出的多个频谱索引相等或位于基于间距值得出的多个频谱索引周围的范围(例如，预先确定或可变的范围)内，以用于预测解码。由此，解码器200可用于依据间距值而设定该范围的宽度。
[0101]
在实施例中，经编码的音频信号可包括间距值或其经编码的版本(例如，可从其直接得出间距值的参数)，其中解码器200可用于从经编码的音频信号提取间距值或其经编码的版本以获得间距值。
[0102]
可选地，解码器200可用于由其自身确定间距值，即，经编码的音频信号不包括间距值。在此情况下，解码器200可用于确定(代表音频信号102的经编码的音频信号120的)瞬时基本频率并从瞬时基本频率或其分数或倍数得出间距值。
[0103]
在实施例中，解码器200可用于选择应用预测解码的多个个别频谱系数或频谱系数的群组使得在应用预测解码的多个个别频谱系数或频谱系数的群组与分隔应用预测解码的多个个别频谱系数或频谱系数的群组的频谱系数之间存在周期性交替，其以+/-1频谱系数的容差为周期。
[0104]
在实施例中，由经编码的音频信号120代表的音频信号102包括至少两个谐波信号
分量，其中解码器200用于将预测解码选择性地应用于代表音频信号102的至少两个谐波信号分量或至少两个谐波信号分量周围的频谱环境的那些多个个别经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组。至少两个谐波信号分量周围的频谱环境可为，例如，+/-1、2、3、4或5个频谱分量。
[0105]
由此，解码器200可用于识别至少两个谐波信号分量，并将预测解码选择性地应用于与(例如，代表经识别的谐波信号分量或环绕经识别的谐波信号分量的)经识别的谐波信号分量相关联的那些多个个别经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组。
[0106]
可选地，经编码的音频信号120可包括识别至少两个谐波信号分量的信息(例如，间距值)。在此情况下，解码器200可用于将预测解码选择性地应用于与(例如，代表经识别的谐波信号分量或环绕经识别的谐波信号分量的)经识别的谐波信号分量相关联的那些多个个别经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组。
[0107]
在前述提及的替代方案中，解码器200可用于不将预测解码应用于不代表音频信号102的至少两个谐波信号分量或至少两个谐波信号分量的频谱环境的那些多个个别经编码的频谱系数206_t0_f3、206_t0_f1及206_t0_f6或经编码的频谱系数的群组。
[0108]
换句话说，解码器200可用于不将预测解码应用于属于音频信号102的信号谐波之间的非音调背景噪声的那些多个个别经编码的频谱系数206_t0_f3、206_t0_f1、206_t0_f6或经编码的频谱系数的群组。
[0109]
图5展示根据实施例的用于编码音频信号的方法300的流程图。方法300包括：为当前帧或至少一个先前帧确定音频信号的频谱系数的步骤302，以及将预测编码选择性地应用于由至少一个频谱系数分隔的多个个别频谱系数或频谱系数的群组的步骤304。
[0110]
图6展示根据实施例的用于对经编码的音频信号进行解码的方法400的流程图。方法400包括：对经编码的音频信号进行解析以为当前帧及至少一个先前帧获得音频信号的经编码的频谱系数的步骤402，以及将预测解码选择性地应用于由至少一个经编码的频谱系数分隔的多个个别经编码的频谱系数或经编码的频谱系数的群组的步骤404。
[0111]
虽然已在装置的上下文中描述一些方面，显然，这些方面还代表对应方法的描述，其中区块或设备对应于方法步骤或方法步骤的特征。类似地，在方法步骤的上下文中描述的方面也代表对应装置的对应区块或条目或特征的叙述。可由(或使用)硬件装置(例如，微处理器、可编程计算机或电子电路)执行方法步骤的一些或全部。在一些实施例中，可由此类装置执行一个或多个最重要的方法步骤。
[0112]
本发明的经编码的音频信号可储存于数字储存媒介上或可在如无线传输媒介的传输媒介或如因特网的有线传输媒介上被传输。
[0113]
依据某些实施需求，可以以硬件或软件方式实施本发明的实施例。可使用具有储存于其上的电子可读控制信号的数字储存媒介(例如，软式磁盘、dvd、蓝光、cd、rom、prom、eprom、eeprom或闪存)执行此实施，其与可编程计算机系统协作(或能够协作)以执行各自的方法。因此，数字储存媒介可以是计算机可读的。
[0114]
根据本发明的一些实施例包括具有电子可读控制信号的数据载体，其能够与可编程计算机系统协作，以执行本文所描述的方法的一个。
[0115]
一般地，本发明的实施例可被实施为带有程序代码的计算机程序产品，当该计算
机程序产品在计算机上运行时，该程序代码可被操作为执行方法的一个。程序代码可例如储存于机器可读载体上。
[0116]
其他实施例包括用于执行本文所描述的方法的一个的计算机程序，其储存于机器可读载体上。
[0117]
换句话说，所发明方法的实施例因此是具有程序代码的计算机程序，当该计算机程序在计算机上运行时，用于执行本文描述的方法的一个。
[0118]
本发明方法的其他实施例因此是数据载体(或数字储存媒介或计算机可读媒介)，其包括，记录于其上的用于执行本文所描述的方法的一个的计算机程序。数据载体、数字储存媒介或计算机可读媒介通常是有形和/或非瞬时的。
[0119]
本发明方法的其他实施例因此是代表用于执行本文所描述的方法的一个的计算机程序的数据串流或信号序列。数据串流或信号序列可例如用于经由数据通讯连接(例如，经由因特网)而传输。
[0120]
其他实施例包括运算构件，例如计算机、或可编程逻辑设备，用于或适用于执行本文所描述的方法的一个。
[0121]
其他实施例包括用于执行本文所描述的方法的一个的计算机，该计算机具有安装于其上的计算机程序。
[0122]
根据本发明的其他实施例包括用于将用于执行本文所描述的方法的一个的计算机程序传送(例如，电子或光学地)至接收器的装置或系统。该接收器，例如，可以是计算机、行动设备、内存设备或类似装置。该装置或系统可，例如，包括用于将计算机程序传送至接收器的文件服务器。
[0123]
在一些实施例中，可编程逻辑设备(例如现场可编程门阵列)可用来执行本文所描述的方法的一些或所有功能。在一些实施例中，现场可编程门阵列可与微处理器协作从而执行本文所描述的方法的一个。一般地，优选地由任何硬件装置执行此方法。
[0124]
可使用硬件装置、或使用计算机、或使用硬件装置及计算机的组合来实施本文所描述的装置。
[0125]
可使用硬件装置、或使用计算机、或使用硬件装置及计算机的组合来执行本文所描述的方法。
[0126]
以上描述的实施例仅用于说明本发明的原理。应理解的是，本文所描述的布置及细节的修改和变形对本领域技术人员是显而易见的。因此，此意图为仅由所附权利要求的范围而不是由本文的实施例的说明和描述的方式所呈现的具体细节限制。

当前第1页1 2

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：贝恩德
技术所有人：弗劳恩霍夫应用研究促进协会
我是此专利的发明人

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！