多信道信号的非线性逆编码的制作方法

文档序号:9476319阅读:464来源:国知局
多信道信号的非线性逆编码的制作方法
【专利说明】多信道信号的非线性逆编码
【背景技术】
[0001] 从低阶信号(信道数量较少)获取高阶信号(输出信道数量较高)是音频技术的 重要部分,将其称作"上混"OJpmixing)。
[0002] 对于属于现有技术的屯、理声学编码方法来说,高带宽多信道信号的高效编码是一 大挑战。尤其如日本NHK电台开发的=维系统Hamasaki22. 2之类的格式需要很高的持久 空间比特率(SpatialBitrates)。
[0003] 如果要将此类S维系统嵌入到现有的数据之中,或者对解码系统运算性能 的要求使得只有很少容量可供音频数据的解码和播放使用(低计算复杂度系统,Low ComputationalComplexitySystems),那么属于现有技术的屯、理声学编码方法就会失灵。
[0004] 关于屯、理声学编码方法尤其是关于空间编码方法的专利申请和公开说明书数不 胜数,因此不必予W寶述。共同特征仍然是持久的空间比特率,必须将其传输给解码器,W 便能够提取相应的多信道信号。
[0005] 本发明能为音频编码提供仅仅根据少量参数有效定义空间音频信号的扩展方法, 与已知的屯、理声学编码方法尤其是空间编码方法相比,不必将运些参数连续添加到数据流 之中。
[0006] 系统工作尤其不依赖于选择适合于压缩音频数据的编解码器("基音频编码器 度aseAudioCoder)")。此类编解码器可W改写例如有效的或者正在工作的标准,运些标 准均为众所周知的MP3、AAC、肥-AAC或者USAC。
[0007]W下将"逆编码"理解为利用了EP1850629、W02009138205、W02011009649、 W02011009650、W02012016992或者W02012032178专利申请书的权利要求所述的一种或多 种方法或者一种或多种装置的技术过程。在此引用上述文献作为参考。
[0008] 所谓"逆编码"尤其是通过功能相关的增益和延迟的特殊应用而生成空间音频信 号的技术过程。
[0009]EP1850629、W02009138205、W02011009649、W02011009650、W02012016992 或 者W02012032178中所述的系统尤其基于有效产生虚幻声源的均匀能量密度原理。尤 其在EP1850629、W02009138205、W02011009649、W02011009650、W02012016992 或者 W02012032178中可生成各个信道没有不同调制的空间音频信号。需要运种均匀调制来实现 均匀形成虚幻声源。运例如与W02012032178的附图6F、附图7F和附图8F针对5. 1环绕声 信号所示的一样也适用于多信道信号的逆编码。
[0010] 例如从口U-RBS. 775-1可知所谓的下混方法(参见附图21)。所设及的是一种用 来减少信道数量的加法方案,可部分减小特定信道的电平,例如减小-3地(相当于将信号 电平乘W因数1/V^或者乘W0. 7071)或减小-6地(相当于将信号电平乘W因数0. 5000)。
[0011] 此类加法方案可W具有用于特殊信道的其它电平,也可W根据信号分析(属于现 有技术的卡洛变换化arhunen-Loeve-l'ransformation化LT))或者主成分分析(Principal ComponentAnalysis(PCA))或者利用EP1850629、W02009138205、W02011009649、 W02011009650、W02012016992和W02012032178所述的代数不变式确定或优化运些电平,或 者也可w给其充实更多的特殊技术部件:
[0012] 例如如I^aller和Schillebeeckx就在 13〇thAESConventioninLondonin P4-5(Imp;rovednUandMatrixSurroundDownmixing)建议使用现有技术已知的90。滤 波器。
[0013] 总的来说,此类下混方法就是在音频信道数量较少("低阶信号")的播放系统上 播放音频信道数量较高的信号("高阶信号")的基础,并且还可提供减小音频信号带宽的 前提条件,正如MPEGSurround之类标准的音频编码中已知的音频信号一样。
[0014] 此类下混方法可W是自适应的,其方法是使得特殊信道的电平随时间变化而变化 ("自适应下混"),或者使得特殊信道的电平随时间变化保持不变并且因此是非自适应的 ("自动下混")。
[0015] 尤其可W优化用于直接播放下混信号的此类下混方法,运些下混方法纯粹用于减 小音频信号的带宽。
[0016] 与市面上常见的与5. 1或7. 1-样将扬声器排列在一个平面中的环绕声布置相 比,文献中也公开了将扬声器设置在该平面之外的扬声器布置布置。运些均部分表达了自 己的标准,如日本饥取电台开发的S维系统Hamasaki22. 2,大多数当今已知的多信道方法 源自于此。总体来看所设及的均为高度复杂的系统,可观察到相邻扬声器之间会形成无数 的虚幻声源。
[0017] 诸如5. 1或7. 1之类的环绕声信号或者S维系统的逆编码总体上必然导致通常具 有均匀调制并且因此而具有不自然高能量密度的扬声器信号。当然按照现有技术,需要有 运样的能量密度才能形成相应的虚幻声源。因此我们将运样的方法称作"线性逆编码"。
[0018]W02011009649尤其描述了一种在线性逆编码装置或方法的范围内将两个全景电 位器连接在MS-矩阵(MS-Matrix)后面,其中每个全景电位器均可形成两个母线信号。运 种布置结构允许任意提高或降低相关度,并且可导致扬声器之间立体基线上的听觉声源宽 度提高或降低。当然,如果第一全景电位器起作用,就会W之前确定的比例将MS-矩阵的第 一输出信号提供给第一母线信号的两个信道。同样,如果第二全景电位器起作用,就会W之 前确定的比例将MS-矩阵的第二输出信号提供给第二母线信号的两个信道。

【发明内容】

[0019] 出乎意料而且与先前的经验相反,根据本发明发现一方面可W从音频信号或者从 利用任意技术部件产生的下混信号得出的信号中选择用于线性逆编码的输入信号,W便产 生附加信道W及相对于基本信号或者下混信号产生高阶信号("上混"或者"编码"),另一 方面可W播放通过线性逆编码产生的具有不同电平的音频信道,其中运些电平可W完全或 者部分从所用音频信道的电平或者从用于下混的电平中得出,或者也可W完全或部分独立 于运些进行确定。可选择根据不同调制的输出信道进行逆编码。在运两者情况下,如果发 生此类技术步骤,我们谈到的就是"非线性逆编码"。
[0020] 因此非线性逆编码在形成略有变化的虚幻声源时没有均匀的能量密度,运与用来 产生虚幻声源的相邻扬声器之间的立体基线应当尽可能均匀的要求相矛盾。
[0021] 当然运种不均匀的能量密度有助于产生自然的听觉印象,该听觉印象在输入信道 数量增多时逐渐近似于透明。人的听觉在输入信道数量增多时对透明度的判断很少设及虚 幻声源的绝对位置,而是设及所生成的声场的能量密度。因此本发明有针对性地利用运一 原理。
[0022] 当播放信道数量逐渐增多时,扬声器(也就是近似于点状的声源)的直接屯、理声 学定位尤其胜于扬声器之间虚拟声源的感觉。非线性逆编码因此可保证也能针对运种情况 实现运些点状声源W及扬声器之间形成的虚幻声源的正确分布或加权。
[0023] 此外尽管使用下混方法,仍然可W感知虚幻声源的深度层次,在基于虚幻声源的 信号的情况下深度层次基本上取决于扬声器信号的响度W及察觉的空间感。可W直接通过 逆编码控制察觉的空间感,不需要例如人工混响之类的附加技术部件。
[0024]如果利用头部相关传输函数化RT巧或者偶尔有很大空间感损失的双耳空间脉冲 (双耳空间脉冲响应BRIR)通过耳机虚拟化播放信道,则非线性逆编码尤其可W通过适当 选择逆编码输出信号电平的方式获得空间感。
[0025] 逆编码输出信号电平可W随时间变化,例如自适应下混方法就是运种情况,或者 也可W随时间变化保持不变,例如非自适应下混方法就是运种情况。相反的情况(在自适 应下混方法的情况下不改变逆编码输出信号电平,或者在非自适应下混方法的情况下改变 逆编码输出信号电平)原则上也可W出现在运些示例中,W便尽可能正确形成感觉的点状 声源W及在扬声器之间形成虚幻声源。
[0026] 与W02011009649相比,本发明所描述的系统并非一定是形成两个母线信号的系 统,假设根据某个不等于1的增益因数调节电平。运些增益因数仅仅作用于所应用的信道。 因此技术作用并不是任意提高或减小两个相同权重信道的相关度。即使采用非线性逆编 码,假设至少一个输出信号的最终电平修正的增益因数收敛至0,不同于W02011009649,那 么该信号的音频信息也必然会丢失,因此所设及的不再是无损提高或减小两个扬声器之间 立体基线上的听觉声源宽度,而是设及所感知的点状声源(扬声器)W及运些扬声器之间 形成的虚幻声源的简单可靠、定向的均匀加权。
[0027] 应将两个全景电位器(按照W02011009649所述将其连接在MS-矩阵后面,其中每 个全景电位器均可形成两个母线信号)看成是线性逆编码的一部分,在至少一种情况下还 可按照非线性编码将增益因数应用于其输出信号-因此总体上可实现单纯依据运两个全 景电位器无法实现的加权形式。
[0028]-种实施例所示为用于音频信号非线性逆编码的装置/方法,其特征在于,要么 将一个增益连接在两个输出信号的其中一个的后面,或者在两个输出信号的每一个后面连 接一个增益,其中运两个增益不同。
[0029]一种实施例所示为用于音频信号非线性逆编码的装置/方法,其特征在于,要么 将一个增益连接在两个输出信号的其中一个的后面,或者在两个输出信号的每一个后面连 接一个增益,其中运两个增益不同。
[0030]-种实施例所示为用于音频信号非线性逆编码的装置/方法,其特征在于,要么 一个增益巧0001)具有因数0. 5或者因数1/V^ ,或者两个增益化0001,60002)的至少其 中一个具有因数0.5或者因数1/V^。
[0031] 一种实施例所示为用于音频信号非线性逆编码的装置/方法,其特征在于,根据 下混信号进行非线性逆编码。
[0032] 一种实施例所示为用于音频信号非线性逆编码的装置/方法,其特征在于,根据 具有因数0. 5或者因数1/V^的一个增益或多个增益形成下混。
[0033] -种实施例所述为用于音频信号非线性逆编码的装置/方法,其特征在于,除了 形成和信号的部件之外,还借助更多技术部件形成下混信号。
[0034] -种实施例所示为用于音频信号非线性逆编码的装置/方法,其特征在于,使用 在扬声器上直接播放下混信号的部件。
[0035] -种实施例所示为用于音频信号非线性逆编码的装置/方法,其特征在于,使用 从之前存在的或者形成的信号中获得更多信号的部件。
[0036] -种实施例所示为用于音频信号非线性逆编码的装置/方法,其特征在于,使用 对信号求和的部件。
[0037] -种实施例所示为用于音频信号非线性逆编码的装置/方法,其特征在于,使用 减去信号的部件。
[0038] -种实施例所示为用于音频信号非线性逆编码的装置/方法,其特征在于,使用 信号的相关比较的部件。
[0039] -种实施例所示为用于音频信号非线性逆编码的装置/方法,其特征在于,使用 借助从之前存在的或者形成的信号的电平将信号归一化的部件。
[0040] -种实施例所示为用于音频信号非线性逆编码的装置/方法,其特征在于,使用 对具有不相邻扬声器信道的信号求和的部件。
[0041] 一种实施例所示为用于音频信号非线性逆编码的装置/方法,其特征在于,使用 形成虚拟扬声器的部件。
[0042] -种实施例所示为用于音频信号非线性逆编码的装置/方法,其特征在于,使用 利用基础音频编码器对下混信号进行编码的部件。
[0043] -种实施例所示为用于音频信号非线性逆编码的装置/方法,其特征在于,使用 形成用于Hamasaki22. 2形式的扬声器布置或者用于运种扬声器布置的部分的信号的部 件。
[0044] -种实施例所示为用于音
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1