用于产生向下兼容的音频格式的方法

文档序号：7737410阅读：377来源：国知局

专利名称：用于产生向下兼容的音频格式的方法
用于产生向下兼容的音频格式的方法在无线电广播、互联网和家庭领域中，目前除了两个声道立体声和单声道之外，也支持5. 1音频格式的输入。通过增加可用的音频格式，因此也增加声频制作费用，也就是记录和混合成相应的音频格式的费用。同样地，必须保证相对于播放装置的兼容性，以便它们能与声道的数量无关地仍然播放任意的音频格式，所述声道能够播放所述相应的音频格式。其中一种可能性是发射具有最大数量声道的音频格式并且如有必要通过将信号在接收机侧自动转换成具有较少数量声道的音频格式(自动向下混合)。已经在声频制作中也可以以所有的格式制作材料，并且所述材料被同时发射(联播)。在这种情况下，每个音频格式都能分开地产生。然而，这种混合方式要求相当大的制作费用。在大多数情况下，在此需要额外的人力、明显更多的时间耗费或者多组设备(例如，在直播传输的情况下)。因此，由此合成的制作规模几乎难以接受。可供选择地-如上述方法中那样-能进行自动向下混合。这种用于自动转换的方法已经存在，但必需进一步改进，以便对于尽可能宽的频谱的原始材料提供质量令人满意的结果。自动向下混合法能粗略地分成主动(active)法和被动(passive)法。主动法根据基础原料适应于自动变换，其中被动法与信号无关地工作。已知的被动向下混合法是无线电广播基准ITU-R BS. 775的基础并在

图1中说明。基于5个声道的音频格式具有下列声道-左声道(L)-右声道(R)-中心声道(C)-左后侧声道(Ls)-右后侧声道(Rs)，已知的向下混合法设计用来通过衰减功能50，60或70使中心声道(C)，及左后侧声道(Ls)和右后侧声道(Rs)的电平各降低_3dB。对_3dB，降低的中心声道通过加和功能 10或20分配给左声道和右声道，而形成第一加和信号(输出加和功能10)和第二加和信号 (输出加和功能20)。对_3dB，降低的后面和右后侧信号(Ls)和(Rs)的电平通过加和功能 30和40分配给第一和第二加和信号并形成所需的双声道音频格式的左和右声道(L' 0) 和(R' 0)。对主动法来说，图1的方框图的加和功能对加和的声频信号的性能进行检验，并在校正的情况下以便避免不想要的声结果。因此，Coding Technology公司提出一种向下混合算法，该算法基于图1的ITU(国际电信联盟)向下混合，分析观个频带/部分频带中所有加和信号的能量程度并与5声道音频格式进行比较。这样能量程度的增加和减少能通过校正所实施的部分频带中的振幅确定和补偿。这样能限制音色通过梳状滤波效应的变化。校正只进行到合理水平，因为后缀(Suffixing)信号会产生无限的校正因子。在用向下混合算法的地方，Coding Technology公司能在双声道音频格式的最终左和右声道之间产生隐含声源的偏移和尤其是与5声道声材料中隐含声源的原始位置无关。为了减少隐含声源的这种偏移，Lexicon公司提出了方法Logic 7，此处在向下混合附近也有向上混合的可能性。多声道声音能向下混合到单声及主体声信号。另外能例如从立体声向下混合中解码高达8个声道。因此中心声道向下混合的份额通过可变系数控制，且此处部分右后侧声道和左后侧声道采用另外的系数。对左声道来说，将左后侧声道的 0.91份额与右后侧声道的-0.38份数一起使用。因此进行右声道的混合。用这种方法，两个后面声道的电平保持不变。尽管面偏移(faCeShift)90°，稍后两个后声道与左和右声道分开也是可行的。但从面偏移的梳状滤波效应不能用方法Logic 7控制时起，音调改变。本发明的目的是大量补偿隐含声源的偏移、相干的信号部分和不相干的信号部分之间电平差的改变、及音调改变。上述目的的解决方案由按照权利要求1的特征得出。下面本发明的思想是当形成第一(L')加和信号和第二(R')加和信号时，用左声道(L)和右声道(R)的k个采样值分别进行重叠时间窗口的谱值的动态校正。另外当形成第三和第四加和信号时，用第一(L')加和信号和第二(R')加和信号的k个采样值分别进行重叠时间窗口的谱值的动态校正。借助于在图2-6中所示的实施例其中之一进一步说明本发明。它示出图2是用于实施本发明的方法的装置的总体的方框图；图3-6是设置用于分析和校正模块的功能的流程图。在图2中所示的方框图类似于图1的方框图构成，但有显著的差别是在用于形成第一和第二加和信号L'和R'的加和功能100和200中以及在用于形成双声道音频格式的左信号Likt和右信号Rikt的加和功能300和400中，除了加和之外，还进行分析和校正 1-4。实施将中心信号C及右后侧信号Rs和左后侧信号Ls的电平在方框图2中与图1的方框图一致地通过衰减功能50，60或70下降例如_3dB。然而，不同于_3dB的衰减也是可以考虑的，尤其是根据5声道源信号的类型或内容。在图2的分析和校正方框100，200，300和400的功能结构对于方框100借助于图 3，对于方框200借助于图4，对于方框300借助于图5，和对于方框400借助于图6来进行说明。图3中所示的方框100设定首先例如通过FFT (快速傅里叶变换)101输入侧的左信号L和中心信号C转换成谱值。将所形成的谱值l(k)、c(k)在加和功能102中累加。谱值的绝对值紧接着在下面通过判定菱形方框103根据它们评价它是否大于额定值 Asoll, !(k).额定值Ast5llil (k)根据下面公式求得
权利要求
1.用于产生向下兼容的音频格式的方法，尤其是由多声道音频格式、尤其是5声道音频格式制成具有右声道(Rikt)和左声道(Likt)的双声道音频格式，所述5声道音频格式具有下列声道-左声道(L) -右声道00 -中心声道(C) -左后侧声道(Ls) -右后侧声道(Rs)，其中-使中心声道(C)的电平降低(例如-3dB)-将电平已降低的中心声道(C)分配到左声道(L)上，以便形成第一加和信号(L') -使左后侧声道(Ls)的电平降低(例如_3dB)，-将电平已降低的左后侧声道(Ls)分配到第一加和信号上，以便形成第三加和信号，该第三加和信号对应于双声道音频格式的左声道(Lim)-将电平已降低的中心声道(C)分配到右声道(R)上，以便形成第二加和信号(R')， -使右后侧声道(Rs)的电平降低(例如_3dB)-将电平已降低的右后侧声道(Rs)分配到第二加和信号上，以便形成第四加和信号，该第四加和信号对应于双声道音频格式的右声道(Rikt)，其特征在于，当形成第一加和信号(L')和第二加和信号(R')时，分别用左声道(L) 和右声道(R)的k个采样值进行重叠时间窗口的谱值的动态校正，当形成第三加和信号和第四加和信号时，分别用第一加和信号(L')和第二加和信号道(R')的k个采样值进行重叠时间窗口的谱值的动态校正，在左声道(L)和右声道(R)的谱值的各次动态校正之前，将各个谱值之和与额定值 (As。u，其中As。u e R)进行比较，所述额定值从下面关系式得到
全文摘要
为了将多声道音频格式尤其是5声道音频格式转换成向下可兼容的音频格式，尤其是转换成具有右声道和左声道的双声道音频格式，所述5声道音频格式具有下列声道左声道(L)、右声道(R)、中心声道(C)、右后侧声道(LS)和右后侧声道(RS)，按照ITU-R BS.775提出下列步骤降低中心声道(C)的电平(例如-3dB)，将电平已降低的中心声道(C)分配到左声道(L)上，以便形成第一加和信号(L)；降低左后侧声道(LS)的电平(例如-3dB)，将电平已降低的左后侧声道(LS)分配到第一加和信号上，以便形成与双声道音频格式的左声道(LIRT)相对应的第三加和信号，将电平已降低的中心声道(C)分配到右声道(R)上，以便形成第二加和信号(R′)；降低右后侧声道(RS)的电平(例如-3dB)，将电平已降低的右后侧声道(RS)分配到第二加和信号上，以便形成与双声道音频格式的右声道(RIRT)相对应的第四加和信号。为了尽可能补偿隐含声源的偏移、在相干的和不相干的信号分量和音色变化之间电平差的变化，本发明规定当形成第一加和信号(L′)和第二加和信号(R′)时，分别用左声道(L)和右声道(R)的k个采样值进行重叠时间窗口的谱值动态校正；当形成第三加和信号和第四加和信号时，分别用第一加和信号(L′)和第二加和信号道(R′)的k个采样值进行重叠时间窗口的谱值的动态校正；在左声道(L)和右声道(R)的谱值的各次动态校正之前，将各个谱值之和与额定值(Asoll，其中Asoll∈R)进行比较。
文档编号H04S3/00GK102217330SQ200980144785
公开日2011年10月12日申请日期2009年11月7日优先权日2008年11月11日
发明者B·鲁诺, G·施脱尔, J·戴格默勒, J·格罗, M·凯尔, M·林克申请人:无线电技术研究学院有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：Ｇ·施脱尔
技术所有人：无线电技术研究学院有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。