多通道信号的甜点操纵的制作方法

文档序号:7678937阅读:129来源:国知局
专利名称:多通道信号的甜点操纵的制作方法
技术领域
本发明涉及多通道信号的甜点(sweet point)操纵,更具体但不 唯一地涉及对于MPEG环绕声多通道信号的甜点操纵。
背景技术
过去几十年来,随着数字信号表示和通信日益取代模拟表示和通 信,各种源信号的数字编码变得日益重要。例如,如视频和音乐的媒 体内容的分发正日益基于数字内容编码。
此外,在过去十年中,已经有倾向于多通道音频、尤其倾向于扩 展到常规的立体声信号之外的空间音频的趋势。例如,传统的立体声 记录仅包括两个通道,而现代的高级音频系统典型地使用五个或六个 通道,如在流行的5.1环绕声系统中那样。这提供了用户可能被各音 源环绕的更沉浸的收听体验。
已经为这样的多通道信号的通信开发了各种技术和标准。例如, 可根据如高级音频编码(AAC)或杜比数字标准的标准发送表示5. 1环 绕系统的六个分立的通道。
然而,为了提供向后兼容性,已知将较高数量的通道下混频为较 低数量,并且具体地,其经常被用于将5.1环绕声信号下混频为立体 声信号,从而允许通过传统的(立体声)解码器来再现立体声信号并 且通过环绕声解码器来再现5. 1信号
一个示例是MPEG2向后兼容的编码方法。多通道信号被下混频为 立体声信号。在辅助数据部分中编码额外的信号,以允许MPEG2多通 道解码器产生多通道信号的表示。MPEG1解码器将忽视辅助数据,并且 因此仅解码下混频的立体声。MPEG2中应用的编码方法的主要缺点在于 该额外信号所需的额外数据率与编码立体声信号所需的数据率处于同 一量级。因此用于将立体声扩展到多通道音频的额外比特率是相当大 的。
不需要额外的多通道信息而进行向后兼容的多通道传输的其他现 有方法通常可以体现为矩阵环绕方法。矩阵环绕声编码的示例包括如杜比Prologic II和Logic-7的方法。这些方法的共同原理在于它们 将输入信号的多个通道与适当的非二次矩阵进行矩阵乘法,从而产生 具有降低数量的通道的输出信号。具体地,矩阵编码器在将环绕通道 与前通道和中心通道混频之前,通常向环绕通道施加相移。
通道转换的另一原因是编码效率。已经发现,例如环绕声音频信 号可以编码为与描述音频信号的空间属性的参数比特流组合的立体声 通道音频信号。解码器可以以非常令人满意的精确度再现立体声音频 信号。这样,可以获得很大的比特率节约。
因此,在(参数)空间音频编码器中,从原始音频信号提取参数, 以便产生具有减少的数量的通道(例如仅仅单个通道)的音频信号加 上描述原始音频信号的空间属性的参数集。在(参数)空间音频解码 器中,由所发送的空间参数描述的空间属性用于重新创建原始的空间 多通道信号。存在可用于描述音频信号的空间属性的若干参数。 一个 这样的参数是通道间互相关,如立体声信号的左通道和右通道之间的 互相关。另一参数是通道的功率比。
这样的技术的具体示例是用于有效编码多通道音频信号的MPEG环 绕方法。
MPEG环绕编码器将M通道输入信号下混频为N通道下混频信号, 其中N〈M,并且提取空间参数。下混频信号典型地使用如例如MP3或 AAC编码器的传统编码器编码。以向后兼容的方式编码空间参数并将其 嵌入到比特流中,使得传统的解码器仍然能够解码底层的下混频信号。
在MPEG环绕解码器中,首先使用传统的解码器解码下混频信号。 然后通过从比特流提取的空间参数重构多通道信号。
与上述典型的多通道编码不同,MPEG环绕提供了丰富的额外特征 集,例如
非导引解码一当上述空间侧面信息不可用时,MPEG环绕解码器能 够创建立体声信号的多通道上混频。在此模式下,解码器计算立体声 信号的功率比和相关性,并且将这些特性用于通过查找表获得所需的 空间参数。
矩阵兼容性一MPEG环绕编码器能够产生可使用现有矩阵解码方案 解码的下混频。创建矩阵环绕下混频,使得它可以通过MPEG环绕解码 器反转(invert),而不会造成解码器性能在感觉上的退步。此外,矩阵环绕下混频改进了非导引模式的性能。
双耳解码一MPEG环绕解码器能够使用空间参数将单声道或立体声 下混频信号直接变换为3D双耳立体声信号,而不用作为中间步骤计算 多通道信号。
人工(artistic)下混频一MPEG环绕允许传输手动创建的下混频 而不是自动的MPEG环绕下混频。
任意树一MPEG环绕比特流支持任意上混频结构的定义,允许任意 数量的输出通道。
MPEG环绕编码器旨在对于预定义的扬声器设置(如,例如5. l设 置)尽可能精确地表示原始的多通道信号。然而,它不允许关于如典 型地在家庭或车辆中存在的不同收听位置和环境的任何灵活性。
通过甜点的操纵(例如,移动和/或拓宽)可以改进可选的收听位 置和环境的再现。然而,尽管已知甜点操纵,但是常规的方法趋于不 是最佳的,并且通常被应用为需要各个输出通道的高复杂度处理的后 处理步骤。
因此,用于操纵甜点的改进的系统将是有利的,并且特别地,允 许增加的灵活性、改进的质量、改进的收听体验、降低的复杂度、便 利的处理和/或改进的性能的系统将是有利的。

发明内容
因此,本发明寻求优选地单独或以任何组合减轻、减緩或消除一 个或多个上述缺点。
根据本发明的第一方面,提供了一种用于修改空间M通道音频信 号的甜点的装置,所述装置包括接收机,用于接收N通道音频信号, N〈M;参数装置,用于确定将所述N通道音频信号与所述空间M通道音 频信号相关的空间参数;修改装置,用于通过修改至少一个所述空间 参数来修改所述空间M通道音频信号的所述甜点;产生装置,用于通 过使用所述至少一个修改的空间上混频参数将所述N通道音频信号上 混频来产生所述空间M通道音频信号。
本发明可提供改进的收听体验。本发明可允许通过作为解码过程 的一部分直接修改空间参数来进行降低复杂度的甜点操纵。可实现便 利的和降低计算需要的处理。所述装置具体地可以是解码器。本发明可允许通过以有利的方式结合解码和甜点操纵来得到改进的性能。
N通道信号具体可以是单声道或立体声信号,而M通道信号具体可 以是5.1、 6. 1或7. 1环绕声信号。空间参数具体可以是将空间M通道 音频信号与N通道信号的各信号(反之亦然)的不同通道的特性相关 的时间和频率变化参数。例如,空间参数可包括各个时间频率块的级 别和/或相关性参数。N通道音频信号到空间M通道音频信号的上混频 可以是级联的上混频。
根据本发明的任选特征,所述修改装置被布置为通过修改第 一 空 间参数来修改前后平衡,所述第一空间参数指示所述空间M通道音频 信号的至少一个前通道和至少一个后通道之间的强度差。
这可以提供改进的收听体验和/或便利的甜点操纵。特别地,该特 征可允许通过简单和低复杂度的处理来改进(前/后)非中心收听位置 的收听体验。
根据本发明的任选特征,所述第一空间参数是所述至少一个前通 道和所述至少 一个后通道之间的通道间强度差。
这可以允许尤其低的复杂度和/或有效的实现。特别地,可使用在 解码操作中已经使用的空间参数的简单修改来修改甜点。
根据本发明的任选特征,所述修改装置被布置为修改所述通道间 强度差的量化索引。
这可允许尤其低的复杂度和/或有效的实现,并且尤其可允许在反 映人类音频感觉的同时进行便利的和对用户而言更友好的操纵。可在 解码之前修改所述量化索引。
根据本发明的任选特征,所述修改装置还被布置为缩放至少一个 前通道,使得降低通过修改所述第一参数导致的所述空间M通道音频 信号的前侧通道与中心通道能量比的变化。
这可允许改进的收听体验,并且在许多情况下可允许以最小的感 觉失真操纵甜点。具体地,所述修改装置可以基本上维持参数修改后 与修改前相同的前侧通道与中心通道能量比。具体地,所述修改装置 可以缩放中心通道,或可以例如相对于中心通道基本上相等地缩放侧 面通道和/或可以不同地缩放側面通道。
根据本发明的任选特征,所述修改装置被布置为通过修改第一空 间参数来修改中心频散,所述第一空间参数指示所述N通道音频信号的至少一个通道的信号在中心通道和至少一个侧面通道之间的相对分 布。
这可提供改进的收听体验和/或便利的甜点操纵。具体地,该特征
可允i午增加的空间收听体验。
在一些实施例中,所述修改装置被布置为通过修改第一空间参数 来修改中心频散,所述第一空间参数指示所述N通道音频信号的至少 一个通道和所述空间M通道音频信号的至少一个前通道之间的缩放值。
N通道音频信号的上混频可具体包括通过对于N通道信号的信号值 的(K,N)上混频矩阵乘法,将N通道音频信号上混频到K通道信号 (N<K<=M),并且所述第一空间参数可以是上混频矩阵的矩阵系数。
根据本发明的任选特征,所述第 一 空间参数是通道预测系数。
这可允许尤其低的复杂度和/或有效的实现。特别地,可使用已经 在解码操作中典型地使用的空间参数的简单修改来修改甜点。
根据本发明的任选特征,所述修改装置被布置为通过修改第一空 间参数来修改左右平衡,所述第一空间参数指示所述N通道音频信号 的至少一个通道的信号在至少一个右侧通道和至少一个左侧通道之间 的相对分布。
这可提供改进的收听体验和/或便利的甜点操纵。特别地,该特征 可允许通过简单和低复杂度的处理来改进(左/右)非中心收听位置的 收听体验。
根据本发明的任选特征,所述第一空间参数是通道预测系数。 这可允许尤其低的复杂度和/或有效的实现。特别地,可使用已经 在解码操作中使用的空间参数的简单修改来修改甜点。
根据本发明的任选特征,所述修改装置被布置为通过修改第一空 间参数来修改前后频散,所述第一空间参数指示所述空间M通道音频 信号的至少一个前通道和至少一个后通道之间的相对相关性。
这可提供改进的收听体验和/或便利的甜点操纵。特别地,该特征 可允i午增加的空间收听体验。
根据本发明的任选特征,所述第一空间参数是所述至少一个前通 道和所述至少 一个后通道之间的通道间相关性系数。
这可允许尤其低的复杂度实现。特别地,可使用已经在解码操作 中使用的空间参数的简单修改来修改甜点。根据本发明的任选特征,所述N通道音频信号对应于所述空间M 通道音频信号的下混频,并且所述接收机被布置为接收将所述下混频 的N通道音频信号与所述空间M通道音频信号相关的编码器空间参数, 并且所述参数装置被布置为根据所述编码器空间参数确定所述空间参 数。
这可允许改进的收听体验和/或便利的甜点操纵。特别地,在包括 产生N通道音频信号的参数编码器的系统中该特征可允许改进的收听 体验。
所述编码器在将空间M通道音频信号下混频为N通道音频信号时 可产生空间参数数据。该空间参数数据可发送到所述装置,并且可通 过修改该数据来修改甜点。所述空间参数可具体包括编码器空间参数。 所述N通道音频信号具体可以是包括参数数据的MPEG环绕信号。
根据本发明的任选特征,所述参数装置被布置为根据所述N通道 音频信号的所述通道的信号特性确定所述空间参数。
这可提供改进的收听体验和/或便利的甜点操纵。特别地,在不使 用显式参数编码器的系统中该特征可允许改进的收听体验,所述不使 用显式参数编码器的系统不发送空间M通道音频信号的参数数据。所 述N通道音频信号具体可以是非导引MPEG环绕信号,如矩阵兼容的下 混频信号。所述N通道音频信号还可以是传统的立体声信号,例如立 体声MP3解码信号或立体声FM信号。
根据本发明的另一方面,提供了一种用于接收空间M通道音频信 号的接收机,所述接收机包括接收器,用于接收N通道音频信号, N<M;参数装置,用于确定将所述N通道音频信号与所述空间M通道音 频信号相关的空间参数;修改装置,用于通过修改至少一个所述空间 参数来修改所述空间M通道音频信号的甜点;产生装置,用于通过使 用所述至少一个修改的空间参数将所述N通道音频信号上混频来产生 所迷空间M通道音频信号。
根据本发明的另一方面,提供了一种用于传输音频信号的传输系 统,所述传输系统包括布置为发送N通道音频信号的发送机;以及 接收机,包括接收器,用于接收所述N通道音频信号;参数装置, 用于确定将所述N通道音频信号与空间M通道音频信号相关的空间参 数,N〈M;修改装置,用于通过修改至少一个所述空间参数来修改所述空间M通道音频信号的甜点;产生装置,用于通过使用所述至少一个 修改的空间参数将所述N通道音频信号上混频来产生所述空间M通道 音频信号。
根据本发明的另一方面,提供了一种用于播放空间M通道音频信 号的音频播放设备,所述音频播放设备包括接收机,用于接收N通 道音频信号,N〈M;参数装置,用于确定将所述N通道音频信号与所述 空间M通道音频信号相关的空间参数;修改装置,用于通过修改至少 一个所述空间参数来修改所述空间M通道音频信号的甜点;产生装置, 用于通过使用所述至少一个修改的空间参数将所述N通道音频信号上 混频来产生所述空间M通道音频信号。
根据本发明的另一方面,提供了一种用于修改空间M通道音频信 号的甜点的方法,所述方法包括接收N通道音频信号,N<M;确定将 所述N通道音频信号与所述空间M通道音频信号相关的空间参数;通 过修改至少一个所述空间参数来修改所述空间M通道音频信号的所述 甜点;通过使用所述至少一个修改的空间参数将所述N通道音频信号 上混频来产生所述空间M通道音频信号。
根据本发明的另一方面,提供了一种接收空间M通道音频信号的 方法,所述方法包括接收N通道音频信号,N<M;确定将所述N通道 音频信号与所述空间M通道音频信号相关的空间参数;通过修改至少 一个所述空间参数来修改所述空间M通道音频信号的甜点;通过使用 所述至少一个修改的空间参数将所述N通道音频信号上混频来产生所 述空间M通道音频信号。
根据本发明的另一方面,提供了一种发送和接收音频信号的方法, 所述方法包括发送N通道音频信号的发送机;以及接收机,执行下 述步骤接收所述N通道音频信号;确定将所述N通道音频信号与空 间M通道音频信号相关的空间参数,N〈M;通过修改至少一个所述空间 参数来修改所述空间M通道音频信号的甜点;通过使用所述至少一个 修改的空间参数将所述N通道音频信号上混频来产生所述空间M通道 音频信号。
本发明的这些和其他方面、特征和优点将从下面(各)实施例变 得清楚并且参照(各)实施例进行说明。


仅通过示例参照附图描述本发明的实施例,附图中
图1是根据本发明一些实施例的用于传送音频信号的传输系统的
图示;
图2是根据本发明一些实施例的能够修改空间M通道音频信号的 甜点的解码器的图示;
图3是MPEG环绕声系统的扬声器设置的图示;
图4是MPEG环绕解码器的结构的图示;以及
图5是根据本发明一些实施例的修改空间M通道音频信号的甜点 的方法的图示。
具体实施例方式
下面的描述集中于可应用到MPEG环绕声音频系统的本发明的各实 施例。然而,将认识到,本发明不限于该应用,且可应用到许多其他 多通道音频系统和标准。
图1图示了根据本发明一些实施例的用于传送音频信号的传输系 统100。传输系统100包括通过网络105耦合到接收机103的发送机 101,所述网络105具体地可以是因特网。
在具体示例中,发送机101是信号记录设备,并且接收机103是 信号播放设备,但是将认识到,在其他实施例中,发送机和接收机可 用于其他应用和其他目的。例如,发送机101和/或接收机103可以是 转码功能的一部分,并且可以例如提供到其他信号源或目的地的接口。
在支持信号记录功能的具体示例中,发送机101包括接收模拟多 通道信号的数字转换器107,所述模拟多通道信号通过采样和模数转换 而被转换为数字PCM (脉沖编码调制)信号。
数字转换器107耦合到图1的编码器109,所述编码器109根据编 码算法编码PCM信号。在该示例中,编码器109是将M通道信号编码 为N通道信号的MPEG环绕编码器,其中M〉N。 MPEG环绕解码器由此产 生N通道信号以及允许解码器产生M通道信号的空间参数数据。编码 器109可以例如将5. 1、 6. 1或7. 1环绕声信号编码为立体声信号和空 间参数数据。下面的描述将集中于其中将5.1立体声信号编码为立体 声信号以及空间参数数据的场景。lll,所述网络发送机lll接收编码 信号并与因特网105接口。网络发送机可以通过因特网105发送编码 信号到接收机103。
接收机103包括网络接收机113,所述网络接收机113与因特网 105接口并且被布置为从发送机101接收编码信号。
网络接收机113耦合到解码器115。解码器115接收编码信号并且 根据解码算法解码该信号。在该示例中,解码器在已经修改所接收的 参数数据以便修改原始信号的甜点之后,使用所述接收的参数数据从N 通道信号解码M通道信号。空间多通道信号的甜点是其中空间感觉不 明显偏离于预期空间感觉(例如,如工作室工程师对于标准化的多通 道扬声器设置所预期的空间感觉)的区域/位置。
具体地,在该示例中,解码器115是在导引模式下操作的MPEG环 绕解码器,在导引模式中,解码是基于由编码器109产生的空间参数 数据的。然而,将认识到,在其他实施例中,空间参数数据可由解码 器自身产生,并且解码器115具体可以是在非导引模式下操作的MPEG 环绕解码器。
在支持信号播放功能的具体示例中,接收机103还包括信号播放 器117,所述信号播放器117从解码器115接收解码的音频信号并且将 其呈现给用户。具体地,信号播放器117可包括输出解码音频信号所 需要的数模转换器、放大器和扬声器。
图2更详细地图示解码器115。
解码器115包括从网络接收机113接收比特流的接收机单元no。
该接收机包括编码立体声信号和参数数据两者。
接收机单元201耦合到参数单元203,所述参数单元203确定要用 于从立体声信号产生环绕信号的空间参数。空间参数因此是描述M通 道信号的通道信号的特性相对于N通道信号的通道信号的特性的参数 数据。参数数据可以具体指示应当如何处理N通道信号以产生M通道 信号。
在主要示例中,简单地通过从接收的比特流中提取这些参数来产 生空间参数,即,使用由编码器109产生的空间参数。然而,将认识 到,在其他实施例中,空间参数可例如由解码器自身确定,例如通过 根据接收的信号估计这些参数。具体地,解码器115可以是以非导引模式操作的MPEG环绕解码器,因此可从N通道信号的某些特性产生空 间参数,所述特性如所接收的立体声信号的通道强度差和相关性特性。
接收机单元201还耦合到解码单元205,所述解码单元205解码立 体声信号并将其上混频以产生5.1通道环绕信号。在示例中,上混频 按照MPEG环绕标准执行并且基于所确定的空间参数。然而,不直接使 用空间参数,而是解码器115包括修改单元207,所述修改单元207 耦合到参数单元203和解码单元205,并且改变一个或多个空间参数以 便修改所产生的环绕信号的甜点。
因此,图2的解码器115允许通过直接修改在解码/上混频处理中 使用的一个或多个空间参数而对输出环绕声信号的甜点进行简单、有 效、高性能和低复杂度的操纵。因此,通过整合甜点操纵和解码/上混 频,可以实现大大便利和改进的性能。
该方法可用于有效地修改甜点的形状和位置。这对于听者的位置 与原始甜点位置不同的情况下的家用和车用应用特别有用。这对于为 在不同位置的多个听者创建类似的声音图像感觉也是有用的。因此, 该方法允许对用于包括下述的声音阶段控制的最期望的特征进行容易 的操纵
-前后平衡控制可用于逐渐加强到前面或到后面的空间图像。 -中心频散控制可用于创建中心通道的较少(或较多)方向性的感觉。
-左右平衡控制可用于提供强调左边或右边的逐渐偏移。
-相关性或前后频散控制可用于允许对前后相关性进行控制,所述 前后相关性有助于所感觉的声音的宽度。
该方法导致对于操纵甜点的非常低的复杂度的解决方案,并且有 利地,该方法可用于MPEG环绕的所有操作模式。此外,如下面将描述 的,还可能在解码如FM和AM无线电广播中的有限质量的下混频信号 时增强空间图像。
在下面,将参照5. 1 MPEG环绕系统描述不同甜点操纵的更详细的 示例。
图3图示MPEG环绕算法的6通道输出配置所依据的扬声器设置。 图4图示用于根据接收的立体声信号和空间参数产生5.1环绕声 信号的MPEG环绕上混频结构。在MPEG环绕中,以级联处理执行上混频,其中最初使用两个通道预测系数(CPC),以便在第一上混频阶段 使用下面给出的3x2预增益矩阵创建左、中和右信号(L、 C和R):
然后,将三个中间通道的每个转换为两个另外的通道。具体地,
使用通道间强度差UID)空间参数将中间的中心通道分离为中心通道 和低频增强(LFE)通道。此外,使用两个IID和两个通道间相关性系 数UCC),以便通过5x5混合矩阵(其中使用去相关的信号来引入 由ICC所指示的相关性水平)将中间的左和右信号的每一个分为前通 道和环绕通道(Lf、 Rf和Ls、 Rs)。
在一些实施例中,修改单元207可以通过修改空间参数来修改前 后平衡,所述空间参数指示空间M通道音频信号的至少一个前通道和 至少一个后通道之间的相对强度差。具体地,修改单元可修改一个或 多个IID参数。
下面描述如何设置简单的调谐参数以便将空间图像的重点(甜点) 在前面和后面之间逐渐前后移动。因此,可使用简单的调谐参数来将
感觉到最佳环绕效果的位置/区域移动到听者的位置。这在听者位于扩 音器的中心位置的前面或后面的情况下(如典型的家用和车用应用中)
特别有用。
在图2的实施例中,通过修改IID参数实现前后平衡控制,以实 现期望的效果。IID参数通常以对数dB标度表示,并且指示前通道和 环绕通道之间的相对能量分布。
在下面的具体示例中,为了简要和清楚,将认为左侧和右侧的ICC 和IID参数相等。对于MPEG环绕非导引模式通常是这样。对于MPEG 环绕导引模式,左侧和右側的ICC和IID参数典型地是不同的,并且 将认识到,所述方法可以容易地扩展到这样的情况。具体地,所述方 法可以使用相同的调谐参数SpB独立地应用到两侧。
在所述方法中,使用IID参数来改变信号的前后分布。具体地, 增加IDD在前侧通道设置更多能量,而减小IID给环绕通道分配更多
能量。 , 以dB表示的IID可以通过加上偏移值来更新。可以从例如由用户或操作者手动设置的简单的调谐参数SFB确定该
偏移但Afb。例如,包括解码器115的播放设备103可包括用于在不同 声音环境仿真设置之间进行选择的输入,其中每个设置具有若干相关 联的预定甜点调谐参数。
人类听觉系统对于IID的变化的灵敏度随着参考值(正的以及负 的)增加而降低。例如,下面的表格图示了 IID变化的最小可觉差(Just Noticeable Differences, JND):
参考IID (dB)層(dB)
00. 5-1
91. 2
151, 5-2
为了对IID的整个范围实现类似的加强效果,该非线性效应可以 并入到IID更新中
因为听觉系统的非线性行为还反映在MPEG环绕中使用的、用于将 索引值映射到IID参数的IID量化矢量中,所以可以通过在索引域的 线性更新来实现IID修改。令ln。,。rg是与1ID。rg对应的索引,则可通过 计算与该索引对应的新的IID来更新IID,如下给出
f 一 f + V
J /JD'wew — J //D,org 丁 。FS ,
因此,可设置具有前后平衡偏移的线性关系的简单的调谐参数SFB, 以修改环绕声信号的甜点的前后平衡。
如果直接使用IID索引不实际(例如,因为其对修改单元不可用), 则可以通过将二阶多项式与IID的MPEG环绕量化矢量(的非负部分)
拟合来切换到索引域并从索引域切换回来
77£ = a0《+a, J皿+a2
其中
a。 =0,1444, a, =1,1056, a2 = 0,8272.
因此,可通过下式将IID映射回到索引域- q + - 4a。. (a2 - abs(/ZD))
,皿= ^ 2a。
然后,可通过加上sfb参数来确定新的索引,由此IID参数可确定
为 ,/ / 、2
可选地,可使用基于量化矢量的插值来确定修改的IID。 减小IID值导致在维持相干性和整体能量的同时能量从前通道向 环绕通道偏移。然而,该修改不改变中心(以及LFE)通道的能量,因 此可能在一定程度上使空间图像变形。增加IID值可能类似地使空间 图像变形。
为了降低该影响,优选地,保持前侧通道和中心通道之间的能量 比。将中心通道的能量混合到側面通道中(反之亦然)可能导致内容 (例如,声音)无意地泄漏到側面通道,并因此改变空间图像。下面 描述了通过缩放中心通道基本上保持前侧和中心能量比、并且防止中 心内容泄漏到侧面通道的方法。
在该方法中,在保持前侧通道和中心通道之间的能量比的约束下 缩放前通道
+ £V+ E。
缩放中心信号对整体能量有影响,并且因此左侧和右側信号应当
同时缩放以补偿能量损失。因此,优选地还应当使总体能量不变
其中通过下式表示缩放
丄,=a . A L,尺
在示例中,通过相同的因子缩放左右通道,这是因为假定对于两 侧信号空间参数是相等的(对应于MPEG环绕非导引模式),因此,它 们都通过相同的空间参数进一步处理。缩放因子n和人可通过将缩放
等式插入到能量守恒要求中来计算。这得到
#2丄2 +//27 2 +/l2C2 =丄2 +i 2 +C2
导致3 "+A2〖'2、丄,
并且
皿, /JD腳 HD //D
2f2 2d2 p10百 d2 10孖
"--^ + --^丄--^ + W--^
1 + 10 io 1 + 10 10 — 1 + 1010 1 + 1010
;i2c2 c2
重写得到
皿腳
l + 10i ^
A2 皿 l + 10i
以及因此,
〃2 —五础。+ 1 〃 一
其中
rari。 c 2

] 川i //D歸-"D
"~^T100 1 + 10 10
因此,p和入的表达式通过下式给出
I £一 +1
为了维持整体空间图像而进行的能量分布补偿可通过相对低复杂
度的处理执行。具体地,MPEG环绕上混频算法以某个更新速率T更新 参数。因此,对每T个采样计算新的上混频矩阵,并且将这些插入各 采样之间。上混频信号的缩放可与预增益矩阵结合,因此仅需要对每T 个采样确定一次缩放值。
在参数范围为
30,...,+30]的情况下,
在感觉上有意义的程度将图像完全向后偏移(-30)和完全向前偏 移(+30),并且在调谐参数值和前/后平衡的感觉偏移之间具有适当 线性关系。此外,从E^。的值确定缩放值,E,ati。是中间信号L、 R和C的能量
比。出于稳定性的原因,可以使这些能量平滑(经低通滤波)。然而,
对于MPEG环绕非导引模式,下混频信号Ldmx和Rdmx的这种低通滤波的能 量已经是可得到的,因为它们被用于确定下混频信号的IID和ICC参
数。这些可与预增益矩阵结合使用,所述预增益矩阵定义为
「 C尸C,+2CPC广1 、 /7 = C尸C' -1CFG + 2 、(卜C尸C')V^ (1-CTCjV^
因此,Era,i。可被写为
ft。— C2 _三.(or, —2.c尸C,+lj《+(C尸C22-2.CPC2+1)《+ . (2. C尸C, ' CTC2 + C尸C, + CPC2 - 4). £献'^
从而消除了对于前后平衡控制的任何预采样计算的需要。
可以例如通过使用各种等式的查找表或使用低复杂度的近似函数 来获得进一步的复杂度降低。
在示例性实施例中,解码器115还可调整中心频散从而增加甜点。 具体地,中心频散调谐参数用于将中心通道的图像分散到侧面,以获 得较少方向性的中心。因此,该方法允许通过调整空间参数增加感觉 到的中心宽度,并且因此空间参数被用于操纵甜点的大小。
在MPEG环绕中,第一上混频阶段使用预增益矩阵(参见例如图4) 创建了三个中间信号L、 C和R:
f/ =C户C-1 CPC2 + 2
为了增加中心宽度,中心信号C的一部分可以被混频到侧面通道L 和R。具体地,可以操纵该第一上混频阶段的空间参数CPd和CPC2, 使得中心信号与左右信号混合。如可以从预增益矩阵看到的,CPC参数
指示每个立体声信号的能量到每个中间通道的相对分布。因此,调整
CPC参数允许能量从中心通道逐渐偏移到侧面通道(或从侧面通道逐渐
偏移到中心通道)。当改变中心频散时,通常对称地执行修改,因此
相同地改变CPC值。
如由预增益矩阵所证明的,如果CPC参数都等于1,则较低的行仅包含零,因此不产生中心信号。而且,对于该设置,左右信号的增益 因子(矩阵系数)增加,并且因此整个中心信号完全分散到左右通道
中。相反,当降低CPC时,在左右信号的能量减少的同时中心能量增加。
因此,可通过将CPC参数值向1增加而增加中心频散。这样,中
心信号(部分地)混合到侧面通道,导致中心通道信号的更宽的空间 图像。
具体地,可根据下式从调谐参数SeD确定新的CPC值
广尸c =JH"CD).(i-c尸c;), fo"c"o,
'卿1(l + ^).(l + C尸C,)—1, fo"CD <0,
对于Se。的负值,cpc值朝-i移动,从而缩窄环绕信号的感觉宽度。 调谐参数s③的范围可优选地设置为[-1, i]。
在示例性实施例中,解码器115还可将空间声音图像向左或向右
移动,从而允许相应地移动甜点。当听者位于原始甜点的左边或右边 时,这可能特别有用。
在第一上混频步骤中获得信号能量的左右分布,其中使用预测参
数CPd和CPC2产生信号L、 C和R。平衡控制使用这些预测参数来实现 甜点位置的低复杂度操纵。
具体地,由于CPd参数控制左边的下混频通道的贡献,而CPC2参 数控制右边的下混频通道的贡献,所以通过相对于彼此减小各参数, 可以将平衡向左或向右偏移。因此,减小CPC,将使平衡向右偏移,而 减小CPC2将使平衡向左偏移。
具体地,用于平衡控制的CPC参数的调整可以与通过中心频散控
制参数进行中心宽度减少的方式类似的方式执行。取决于平衡控制调
谐参数S^的符号,这些参数或者朝-1的CPC值偏移,或者保持不变:
—Jc尸q 对于S^〈0, C尸C,.卿— &) (1 + c尸q) —!对于& ^ o,
参数范围
提供了合理的平衡控制量,而不会不利地影响与中心能量相关联对预增益矩阵的评估表明,不可能在不增加中心信号的能量的情
况下通过筒单地修改CPC参数来创建绝对的平衡尺度。然而,降低的
平衡控制通常就足够了 ,因为多数典型的甜点位置仅相对较小地偏移 中心收听位置。
在示例性实施例中,解码器115还可修改前后频散,从而允许控 制感觉到的声音宽度,并因此增加甜点。
具体地,修改在上混频的第二阶段中用来产生左右侧的前通道和 环绕通道的IIC参数,以增加或减少相关性,从而影响前/后频散。
具体地,ICC参数的调整类似于用于控制中心频散的CPC参数的调 整,除了所调整的ICC参数被限制为从0到1的范围。因此,使用前 后频散调谐参数S吣新的相关性参数可确定为
J (l + ^:J'/CC fo《<0,
(1 —^).(1一/CC) fo"^0.
其中
4 e[—1,…,+l]
下面的表格提供了被修改以实现不同的甜点操纵的具体空间参数
的概述
调谐参数影响的空间参数调谐参 数参数范围
前/后频散ICCSen[-1,...,+ 1]
中心频散CPd和CPC2ScD[-1,"., + 1]
左-右平衡控制CPd或CPC2[-1".., + 1]
前-后平衡控制IID (+ L + C + R)Sfb[-30,…, + 30]
在具体实施例中,同时使用所有的调谐参数。然而,应用修改的 顺序可能影响实现的质量。
具体地,中心频散和左右平衡控制彼此影响,因为它们使用相同的空间参数。平衡控制维持中心通道中的一些能量,而中心频散调整 将中心能量(的一部分)混合到左右两侧。因此,在平衡控制后执行 中心频散时,应当由平衡控制衰减的很多能量在側面通道中结束。因 此,可首先执行中心频散调整,允许平衡控制适当地操作。
前后平衡控制在缩放因子的计算中使用CPC参数。典型地,将在
上混频处理中使用的实际参数应当用于计算。因此,前后平衡控制的 计算可以在中心频散和左右平衡控制的计算后执行。
前/后频散调整的计算不受任何其他给出的调谐参数的影响。相关 性调整也不影响其他调谐参数。因此,可在其他计算内中任意命令该 参数的修改。
将认识到,所述原理可应用到在导引模式和非导引模式下操作的
MPEG环绕解码器。当在非导引模式下操作时,基于接收的立体声信号
的特性通过解码器自身确定空间参数,而在导引模式下时,从编码器
产生和接收空间参数。
所述方法可提供与非导引模式操作相关的改进的收听体验的具体
示例是在接收到没有非常明显的左右通道的立体声信号(例如,常规 的立体声信号)的情况下。为了优化该类信号的环绕体验,可通过算
法提供具体的收听设置或模式。
常规地,无线电台的不良接收可能导致对于接收机的双通道输出 的两类影响(两者的组合也是普遍的)
-有噪声音。
-非立体声再现或在立体声和单声道之间切换。
实验已经显示,具有静态噪声的立体声信号不显著影响空间图像。 噪声在所有输出中终止,如同其对于立体声输出那样。
然而,更动态的噪声更明显地影响接收机输出的空间特性。通常 这类噪声导致在无线电接收机中立体声和单声道再现的快速切换。利 用标准的MPEG环绕非导引算法,这样的信号导致空间不稳定性,其中 当输入切换到单声道时完整的声音跌为中心扬声器。
这对于基于单声道的FM站和所有AM站也是不利的,因为单声道 信号(LdBX=Rdrax)没有通道间强度差,并且全相关性以及因此的空间参 数是恒定的。CPC参数的结果值将大量信号能量置入中心通道,并提供 不良的环绕声体验。此外,由于发送FM立体声信号的方式(单声道(和)信号和差分 信号),下混频的空间性质可能降低,这是因为对于不良接收首先劣 化的是差分信号。因此,通过MPEG环绕非导引算法的空间重构比常规 的立体声信号远远更容易趋于定向到中心。
因此,对于非导引MPEG环绕系统将无线电信号作为源的主要缺点 是操纵算法的空间特性可能丢失、导致信号会聚在前中心扬声器的高 概率。
然而,所述解码器提供了可以改进所提供的环绕声体验的低复杂 度的甜点操纵。具体地,实现令人满意的单声道信号的空间图像的低 复杂度的解决方案可以使用中心频散调谐参数。将该参数设置为例如 0.5,导致应置入中心信号的一部分能量分散到侧面信号L和R。对于 单声道信号,OdB的IID导致前后扬声器之间的均匀分布。
结果,即使对于单声道输入,该算法也可以有效地将信号分布到 所有输出通道上。对于立体声信号,展宽创建了增强的空间图像。
图5图示修改空间M通道音频信号的甜点的方法。该方法在步骤 501开始,其中接收N通道音频信号,N〈M。
步骤501后是步骤503,其中确定将N通道音频信号与空间M通道 音频信号相关的空间参数。
步骤503后是步骤505,其中通过修改至少一个空间参数来修改空 间M通道音频信号的甜点。
步骤505后是步骤507,其中通过使用该至少一个修改的空间参数 将N通道音频信号上混频来产生空间M通道音频信号。
将认识到,为了描述清楚,参照不同的功能单元和处理器描述了 本发明的实施例。然而,显而易见,可使用不同功能单元或处理器之 间的任何适当的功能的分布而不背离本发明。例如,图示为由单独的 处理器或控制器执行的功能可由相同的处理器或控制器执行。因此, 对于具体功能单元的指代仅被视为指代用于提供所述功能的适当装 置,而非指示严格的逻辑或物理的结构或组织。
本发明可以以包括硬件、软件、固件或其任何组合的任何适当形 式实现。本发明任选地可以至少部分地实现为在一个或多个数据处理 器和/或数字信号处理器上运行的计算机软件。本发明的实施例的元件 和组件可以以任何适当方式物理地、功能地和逻辑地实现。实际上,功能可以单个单元、多个单元或作为其他功能单元的一部分实现。这 样,本发明可以以单个单元实现,或可以是物理和功能地分布在不同 单元和处理器之间。
尽管已经关于一些实施例描述了本发明,但是不意图将本发明限 制为这里提出的具体形式。相反,本发明的范围仅由所附权利要求书 限定。此外,尽管特征可能好像被描述为与特定实施例相关,但是本 领域技术人员将认识到,所述实施例的各种特征可以根据本发明进行 组合。在权利要求书中,术语包括不排除其他元件或步骤的存在。
此外,尽管各个列出,但是多个装置、元件或方法步骤可通过例 如单个单元或处理器实现。此外,尽管各个特征可包括在不同的权利 要求中,但是这些可以有利地组合,并且包含在不同权利要求中不意 味着特征的组合不可行和/或不利。而且,将特征包含在一类权利要求 中不意味着限制于该类别,而是指示适当时该特征可同等地应用于其 他权利要求类别。此外,权利要求中特征的顺序不意味着必须操作各 特征的任何特定顺序,特别是,方法权利要求中的各个步骤的顺序不 意味着各步骤必须以此顺序执行。而是,各步骤可以以任何适当的顺 序执行。此外,单数指代不排除复数。因此,对"一,,、"一个"、
"笫一"、"第二"等的指代不排除复数。权利要求中的参考标号仅 提供为说明示例,不应以任何方式解释为限制权利要求的范围。
权利要求
1.一种用于修改空间M通道音频信号的甜点的装置,所述装置包括接收机(201),用于接收N通道音频信号,N<M;参数装置(203),用于确定将所述N通道音频信号与所述空间M通道音频信号相关的空间参数;修改装置(207),用于通过修改至少一个所述空间参数来修改所述空间M通道音频信号的所述甜点;产生装置(205),用于通过使用所述至少一个修改的空间参数将所述N通道音频信号上混频,来产生所述空间M通道音频信号。
2. 如权利要求1所述的装置,其中所述修改装置(207 )被布置 为通过修改第 一 空间参数来修改前后平衡,所述第 一 空间参数指示所 述空间M通道音频信号的至少一个前通道和至少一个后通道之间的强 度差。
3. 如权利要求2所述的装置,其中所述第一空间参数是所述至少 一个前通道和所述至少一个后通道之间的通道间强度差。
4. 如权利要求3所述的装置,其中所述修改装置(207 )被布置 为修改所述通道间强度差的量化索引。
5. 如权利要求2所述的装置,其中所述修改装置(207 )还被布 置为缩放至少一个前通道,使得减少通过修改所述第一参数导致的所 述空间M通道音频信号的前侧通道与中心通道能量比的变化。
6. 如权利要求1所述的装置,其中所述修改装置(207 )被布置 为通过修改第 一空间参数来修改中心频散,所述第 一空间参数指示所 述N通道音频信号的至少一个通道的信号在中心通道和至少一个侧面 通道之间的相对分布。
7. 如权利要求6所述的装置,其中所述第一空间参数是通道预测 系数。
8. 如权利要求1所述的装置,其中所述修改装置(207 )被布置 为通过修改第 一 空间参数来修改左右平衡,所述第 一 空间参数指示所 述N通道音频信号的至少一个通道的信号在至少一个右侧通道和至少 一个左侧通道之间的相对分布。
9. 如权利要求8所述的装置,其中所述第一空间参数是通道预测系数。
10. 如权利要求l所述的装置,其中所述修改装置(207 )被布置 为通过修改第 一空间参数来修改前后频散,所述第 一空间参数指示所 述空间M通道音频信号的至少一个前通道和至少一个后通道之间的相 对相关性。
11. 如权利要求10所述的装置,其中所述第一空间参数是所述至 少一个前通道和所述至少一个后通道之间的通道间相关性系数。
12. 如权利要求1所述的装置,其中所述N通道音频信号对应于 所述空间M通道音频信号的下混频,并且所述接收机(201)被布置为 接收将所述下混频的N通道音频信号与所述空间M通道音频信号相关 的编码器空间参数,并且所述参数装置(203 )被布置为根据所述编码 器空间参数确定所述空间参数。
13. 如权利要求l所述的装置,其中所述参数装置(203 )被布置 为根据所述N通道音频信号的所述通道的信号特性确定所述空间参数。
14. 如权利要求l所述的装置,其中所述N通道音频信号是MPEG 环绕信号。
15. —种用于接收空间M通道音频信号的接收机(103),所述接 收才几(103)包括接收器(201),用于接收N通道音频信号,N<M;参数装置(203),用于确定将所述N通道音频信号与所述空间M 通道音频信号相关的空间参数;修改装置(207 ),用于通过修改至少一个所述空间参数来修改所 述空间M通道音频信号的甜点;产生装置(205 ),用于通过使用所述至少一个修改的空间参数将 所述N通道音频信号上混频,来产生所述空间M通道音频信号。
16. —种用于传输音频信号的传输系统(100),所述传输系统包括布置为发送N通道音频信号的发送机(101);以及 接收机(103),其包括接收器(201),用于接收所述N通道音频信号; 参数装置(203 ),用于确定将所述N通道音频信号与空间M 通道音频信号相关的空间参数,N〈M;修改装置(207 ),用于通过修改至少一个所述空间参数来修 改所述空间M通道音频信号的甜点;产生装置(205 ),用于通过使用所述至少一个修改的空间参 数将所述N通道音频信号上混频,来产生所述空间M通道音频信号。
17. —种用于播放空间M通道音频信号的音频播放设备(103), 所述音频播放设备包括接收机(201),用于接收N通道音频信号,N<M;参数装置(203 ),用于确定将所述N通道音频信号与所述空间M 通道音频信号相关的空间参数;修改装置(207 ),用于通过修改至少一个所述空间参数来修改所 述空间M通道音频信号的甜点;产生装置(205 ),用于通过使用所述至少一个修改的空间参数将 所述N通道音频信号上混频,来产生所述空间M通道音频信号。
18. —种用于修改空间M通道音频信号的甜点的方法,所述方法 包括接收(501) N通道音频信号,N<M;确定(503 )将所述N通道音频信号与所述空间M通道音频信号相 关的空间参数;通过修改至少一个所述空间参数来修改(505 )所述空间M通道音 频信号的所述甜点;通过使用所述至少一个修改的空间参数将所述N通道音频信号上 混频,来产生(507 )所述空间M通道音频信号。
19. 一种接收空间M通道音频信号的方法,所述方法包括 接收(501) N通道音频信号,N<M;确定(503 )将所述N通道音频信号与所述空间M通道音频信号相 关的空间参数;通过修改至少一个所述空间参数来修改(505 )所述空间M通道音 频信号的甜点;通过使用所述至少一个修改的空间参数将所述N通道音频信号上 混频,来产生(507 )所述空间M通道音频信号。
20. —种发送和接收音频信号的方法,所述方法包括 发送N通道音频信号的发送机(101);以及接收机(103),其执行下述步骤 接收(501 )所述N通道音频信号;确定(503 )将所述N通道音频信号与空间M通道音频信号相关的 空间参数,N<M;通过修改至少一个所述空间参数来修改(505 )所述空间M通道音 频信号的甜点;通过使用所述至少一个修改的空间参数将所述N通道音频信号上 混频,来产生(507 )所述空间M通道音频信号。
21. —种用于执行权利要求18、 19和20中的任一的方法的计算 机程序产 品。
全文摘要
如解码器的装置被布置为通过修改空间参数来修改空间M通道音频信号的甜点。具体地,接收机(201)接收N通道音频信号,其中N<M。所述M通道信号具体可以是MPEG环绕声信号,而N通道信号可以是立体声信号。参数单元(203)确定将所述N通道音频信号与所述空间M通道音频信号相关的空间参数,并且修改单元(207)通过修改至少一个所述空间参数来修改所述空间M通道音频信号的所述甜点。产生单元(205)通过使用所述至少一个修改的空间参数将所述N通道音频信号上混频来产生所述空间M通道音频信号。通过甜点操纵和多通道产生的结合实现了有效的和/或低复杂度的甜点操纵。
文档编号H04S7/00GK101518103SQ200780034093
公开日2009年8月26日 申请日期2007年9月10日 优先权日2006年9月14日
发明者E·G·P·舒杰斯, J·G·H·科彭斯 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1