用于对降混合矩阵进行解码及编码的方法、用于呈现音频内容的方法、用于降混合矩阵的...的制作方法

文档序号：9932715阅读：354来源：国知局

用于对降混合矩阵进行解码及编码的方法、用于呈现音频内容的方法、用于降混合矩阵的 ...的制作方法
【技术领域】
[0001]本发明设及音频编码/解码的领域，尤其设及空间音频编码及空间音频对象编码，例如，设及3D音频编解码器系统的领域。本发明的实施例设及用于对用于将音频内容的多个输入声道映射至多个输出声道的降混合矩阵进行编码及解码的方法、设及用于呈现音频内容的方法、设及用于对降混合矩阵进行编码的编码器、设及用于对降混合矩阵进行解码的解码器、设及音频编码器W及设及音频解码器。
【背景技术】
[0002]在本技术领域中，空间音频编码工具是众所周知的并且，例如，在MPEG-surround 标准中已被标准化。空间音频编码从诸如在再现装备（setup)中通过其布置而识别的五个或屯个声道（即左声道、中间声道、右声道、左环绕声道、右环绕声道W及低频增强声道）的原始输入声道开始。空间音频编码器可从原始声道得到一个或多个降混合声道，且此外可得到关于空间线索（cues)参数化数据，例如在声道相干数值中的声道间水平差异、声道间相位差异、声道间时间差异等等。一个或多个降混合声道与指示空间线索的参数化旁侧信息一起被传输至用于对降混合声道及相关联的参数化数据进行解码W最终获得原始输入声道的近似版本的输出声道的空间音频解码器。声道在输出装备的布置可为固定的，例如， 5.1格式、7.1格式等等。
[0003]同样，空间音频对象编码工具在此技术领域中是众所周知的，且（例如）在MPEG SA0C(SA0C=空间音频对象编码)标准中被标准化。相比于空间音频编码从原始声道开始，空间音频对象编码从音频对象开始，该音频对象不自动专用于某个擅染再现装备。相反，音频对象在再现场景中的布置是灵活的且可由用户（例如)通过将某些擅染信息输入至空间音频对象编码解码器中而设定。可选地或此外地，擅染信息可作为附加旁侧信息或元数据而被传输，擅染信息可包括某个音频对象在再现设置中（例如，随时间）待被放置的位置处的信息。为获得某个数据压缩，使用SAOC编码器对多个音频对象进行编码，SAOC编码器通过根据某个降混合信息对对象进行降混合W从输入对象计算一个或多个传输声道。此外， SAOC编码器计算表示对象间线索(诸如，对象水平差异(OLD)、对象相干值等)的参数化旁侧信息。如在SAC(SAC =空间音频编码）中，针对个别时间/频率平铺(time/打equency tiles) 计算对象间参数化数据。对于音频信号的某个帖(例如，1024或2048个样本），考虑多个频带 (例如，24、32或64个频带），W便为每个帖及每个频带提供参数化数据。举例而言，当音频片段具有20个帖且当每个帖被细分成32个频带时，时间/频率平铺的数目为640。
[0004] 在3D音频系统中，可能期望使用扩音器（loudspeaker)或扬声器(speaker)配置在接收器处提供音频信号的空间印象，因为扩音器或扬声器配置在接收器处是可用的，但可不同于用于原始音频信号的原始扬声器配置。在此情形下，根据哪些输入声道依据音频信号的原始扬声器配置而被映射至根据接收器的扬声器配置定义的输出声道，需要进行转换，该转换亦被称作"降混合"。

【发明内容】

[0005] 本发明的目标在于提供用于为接收器提供降混合矩阵的改良方法。
[0006] 此目标由根据权利要求1、2及20的方法、根据权利要求24的编码器、根据权利要求 26的解码器、根据权利要求28的音频编码器及根据权利要求29的音频解码器实现。
[0007] 本发明基于W下发现:可通过利用对称性实现稳定的降混合矩阵的更有效率的编码，可在关于与各个声道相关联的扬声器的放置的输入声道配置及输出声道配置中发现该对称性。本发明的发明者已发现，利用此对称性允许将对称地布置的扬声器(例如，具有关于收听者位置的具有相同仰角及具有相同绝对值但带有不同正负号的方位角的位置的那些扬声器)组合至降混合矩阵的共同行/列。此允许生成具有减小的尺寸的紧密降混合矩阵，因此，当与原始降混合矩阵相比时，可更容易且更有效率地对该紧密降混合矩阵进行编码。
[000引根据实施例，不仅定义了对称扬声器组，且实际上创建了=类扬声器组（即，上述的对称扬声器、中屯、扬声器及不对称扬声器），然后其可用于生成紧密表示。此方法为有利的，因为它允许不同地且因此更有效率地处置来自各个类别的扬声器。
[0009] 根据实施例，对紧密降混合矩阵进行编码包含:对与关于实际的紧密降混合矩阵的信息分开的增益值进行编码。通过创建紧密显著性(significance)矩阵来对关于实际的紧密降混合矩阵的信息进行编码，通过将输入及输出对称扬声器对中的每个并入一个组，该紧密显著性矩阵关于紧密输入/输出声道配置指示非零增益的存在。此方法为有利的，因为它允许基于行程长度方案的显著性矩阵的有效率的编码。
[0010] 根据实施例，可提供模板矩阵，该模板矩阵类似于紧密降混合矩阵，其中模板矩阵的矩阵元素中的条目大体上对应于紧密降混合矩阵中的矩阵元素中的条目。大体而言，在编码器及解码器处提供此模板矩阵，且此模版矩阵与紧密降混合矩阵的不同之处仅在于矩阵元素的减少的数目，从而通过利用此模板矩阵将逐元素地XOR应用至紧密显著性矩阵，将大幅减少矩阵元素的数目。此方法为有利的，因为它允许再次使用（例如)行程长度方案更进一步地增大对显著性矩阵进行编码的效率。
[0011] 根据又一实施例，编码进一步基于正常扬声器是否仅混合至正常扬声器且WE扬声器仅混合至LFE扬声器的指示。此为有利的，因为它进一步改良了显著性矩阵的编码。
[0012] 根据又一实施例，至于行程长度编码所应用于的一维向量，提供紧密显著性矩阵或上述XOR运算的结果W将其转换为成串的零，其中一跟随其后，此为有利地，因为它提供用于对信息进行编码的极有效率的可能性。为实现更有效率的编码，根据实施例，将有限哥伦布-莱斯编码应用于行程长度值。
[0013] 根据另一实施例，对于每个输出扬声器组，指示对称性及可分离性的属性是否适用于生成其的所有对应的输入扬声器组。此为有利的，因为它指示在(例如）由左扬声器及右扬声器组成的扬声器组中，输入声道组中的左扬声器仅被映射至对应的输出扬声器组中的左声道，输入声道组中的右扬声器仅被映射至输出声道组中的右扬声器，且不存在自左声道至右声道的混合。此允许由单一增益值替换原始降混合矩阵的2X2子矩阵中的四个增益值，该单一增益值可被引入至紧密矩阵中，或在紧密矩阵为显著性矩阵的情况下可被单独地编码。在任何情况下，待编码的增益值的总数减少。因此，对称性及可分离性的信号发送的（signaled)属性为有利的，因为它们允许对与输入及输出扬声器组中的每对相对应的子矩阵进行有效率地编码。
[0014] 根据实施例，为了对增益值进行编码，使用信号发送的最小及最大增益W及信号发送的期望精度W特定次序创建可能增益的列表。W常用增益位于列表或表格的开始处的此次序创建增益值。此为有利的，因为它允许通过将用于对增益值进行编码的最短码字应用于最频繁使用的增益而对增益值进行有效率地编码。
[0015] 根据实施例，可在列表中提供生成的增益值，列表中的每个条目具有与其相关联的索引。当对增益值进行编码而非对实际值进行编码时，增益的索引被编码。此可(例如)通过应用有限哥伦布-莱斯编码方法来进行。此增益值的处置为有利的，因为它允许对其进行有效率地编码。
[0016] 根据实施例，可连同降混合矩阵一起传输均衡器化Q)参数。
【附图说明】
[0017] 将关于附图描述本发明的实施例，其中：
[0018] 图1示出3D音频系统的3D音频编码器的概述；
[0019] 图2示出3D音频系统的3D音频解码器的概述；
[0020] 图3示出可在图2的3D音频解码器中实施的立体声擅染器的实施例；
[0021] 图4示出如在本技术领域中已知的用于从22.2输入配置映射至5.1输出配置的例示性降混合矩阵；
[0022] 图5示意性地示出用于将图4的原始降混合矩阵转换成紧密降混合矩阵的本发明的实施例；
[0023] 图6示出根据本发明的实施例的图5的紧密降混合矩阵，该紧密降混合矩阵具有经转换的输入及输出声道配置，其中矩阵条目表示显著性值；
[0024] 图7示出用于使用模板矩阵对图5的紧密降混合矩阵的结构进行编码的本发明的又一实施例;及
[0025] 图8(a)至图8(g)示出根据输入及输出扬声器的不同组合可从图4中所示的降混合矩阵得出的可能子矩阵。
【具体实施方式】
[0026] 将描述本发明方法的实施例。W下描述将从可实施本发明方法的3D音频编解码器系统的系统概述开始。
[0027] 图1及图2示出根据实施例的3D音频系统的算法区块。更具体地，图1示出3D音频编码器100的概述。音频编码器100在可选地提供的预擅染器/混合器电路102处接收输入信号，更具体地，在提供至音频编码器100的多个输入声道处接收多个声道信号104、多个对象信号106及对应的对象元数据108。由预擅染器/混合器102处理的对象信号106(参见信号 110)可被提供至SAOC编码器112(SA0C =空间音频对象编码）"SA0C编码器112生成被提供至 USAC编码器116 (USAC =统一语音及音频编码)的SAOC传输声道114。此外，信号SAOC-SI 118 (SAOC-SI = SAOC旁侧信息）也被提供至USAC编码器116 dUSAC编码器116进一步直接从预擅染器/混合器接收对象信号120, W及声道信号与预擅染的对象信号122。对象元数据信息 108应用于用于将经压缩的对象元数据信息126提供至USAC编码器的OAM编码器124(OAM = 对象相关联的元数据KUSAC编码器116基于上述输入信号生成如在128处所示的经压缩的输出信号mp4。
[00%]图2示出3D音频系统的3D音频解码器200的概述。在音频解码器200处，更具体地在 USAC解码器202处接收由图1的音频编码器100生成的经编码的信号128(mp4KUSAC解码器 202将接收的信号128解码成声道信号204、预擅染的对象信号206、对象信号208及SAOC传输声道信号210。另外，经压缩的对象元数据信息212及信号SAOC-SI 214由USAC解码器202输出。对象信号208被提供至输出擅染的对象信号218的对象擅染器216"SA0C传输声道信号 210被供应至输出擅染的对象信号222的SAOC解码器220。经压缩的对象元信息212被供应至 OAM解码器224,该OAM解码器224将各个控制信号输出至对象擅染器216及SAOC解码器220W 用于生成擅染的对象信号218及擅染的对象信号222。解码器进一步包含接收（如图2中所示)输入信号204、206、218及222W用于输出声道信号228的混合器226。声道信号可被直接输出至扩音器，如，如在230处所指示的32声道扩音器。信号228可被提供至格式转换电路 232,该格式转换电路232接收指示声道信号228待被转换的方式的再现布局信号作为控制输入。在图2中描绘的实施例中，假设W信号可被提供至如在234处所指示的5.1扬声器系统的方式进行转换。同样，声道信号228可被提供至生成（例如）用于如在238处所指示的耳机的两个输出信号的立体声擅染器236。
[0029] 在本发明的实施例中，图1及图2中所描绘的编码/解码系统基于用于声道及对象信号（参见信号104及106)的编码的MPEG-D USAC编解码器。为增加对大量对象进行编码的效率，可使用MPEG SAOC技术。S种类型的擅染器可执行将对象擅染至声道、将声道擅染至耳机或将声道擅染至不同扩音器装备（参见图2,附图标记230、234及238)的任务。当使用 SAOC明确地传输或参数化地编码对象信号时，对应的对象元数据信息108被压缩(参见信号 126)且被多工至3D音频比特流128。
[0030] W下将进一步详细描述图1及图2中所示的总体3D音频系统的算法区块。
[0031] 可选地提供预擅染器/混合器102W在编码前将声道加对象输入场景转换成声道场景。该预擅染器/混合器102在功能上与W下将描述的对象擅染器/混合器相同。可期望对象的预擅染W确保在编码器输入端处确定性信号赌，该确定性信号赌基本上独立于多个同时活跃的对象信号。利用对象的预擅染，无需对象元数据

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：弗洛林·基多;阿希姆·孔茨;伯恩哈德·格里尔;
技术所有人：弗朗霍夫应用科学研究促进协会;
我是此专利的发明人