用于确定空间输出多声道音频信号的装置的制作方法

文档序号:7851017阅读:226来源:国知局
专利名称:用于确定空间输出多声道音频信号的装置的制作方法
技术领域
本发明属于音频处理领域,特别地,涉及空间音频属性的处理。
背景技术
音频处理和/或编码已经在很多方面进步。对于空间音频应用,产生越来越多的需求。在很多应用中,利用音频信号处理来解相关或渲染信号。这种应用可实现,例如,单声至立体声的升混、单声/立体声至多声道的升混、人工混响、立体声扩展或用户交互式混频/渲染。对于某些类的信号,例如噪声状信号,例如掌声状信号,传统的方法和系统或者忍受不合要求的感知性能,或者如果采用面向对象的方法,由于需模化或处理的听觉事件的数目较大,忍受高计算复杂性。不确定的音频资料的其他例子通常为环境声音资料,例如, 由一群鸟、海岸、奔驰的马群、行进的士兵等发出的噪声。传统的思想采用例如参数立体声或MPEG-环绕编码(MPEG =动态影像压缩标准)。 图6示出了单声至立体声的升混器中的解相关器的典型应用。图6示出了提供至解相关器 610的单声输入信号,解相关器610在其输出端提供解相关的输入信号。原始输入信号和解相关信号一起提供至升混矩阵620。根据升混控制参数630,渲染立体声输出信号。信号解相关器610产生解相关信号D,解相关信号D随干单声信号M提供至矩阵化阶段620。在混合矩阵620中,根据混合矩阵H形成立体声声道L(L =左立体声声道)和R(R =右立体声声道)。矩阵H中的系数可为固定的、信号相关的或通过用户控制的。可选地,矩阵可通过边信息控制,边信息随降混一起传输,包含说明如何升混降混的信号以形成所需求的多声道输出的参数描述。这个空间边信息通常由在升混处理之前的信号编码器产生。这典型地在参数空间音频编码中完成,例如,在参数立体声中,参见J. Breekiart, S. van de Par, A. Kohlrausch, Ε. Schuijers, "High-Quality Parametric Spatial Audio Coding at Low Bitrates"in AES 116th Convention, Berlin,Preprint 6072, May 2004, 和在 MPEG 环绕中,参见 J. Herre, K. Kjorling, J. Breebaart, et. al.,"MPEG Surround-the ISO/MPEG Standard forEfficient and Compatible Multi-Channel Audio Coding,,in Proceedings of the 122nd AES Convention, Vienna, Austria, May 2007。
7 数立体声解码器的典型结构。在这个例子中,解相关处理在变换域中进行,通过分析滤波器组710表示,分析滤波器组710将输入单声信号变换至变换域,例如,就许多频带而言的频域。在频域中,解相关器720产生相应的解相关信号,所述解相关信号将在升混矩阵 730中升混。升混矩阵730考虑升混参数,所述升混参数由参数修改框740提供,参数修改框740被提供有空间输入参数并连接至参数控制阶段750。在图7示出的例子中,空间参数可通过用户修改或通过附加工具,例如用于双耳渲染/呈现的后处理,修改。在这种情况下,升混参数可与来自双耳滤波器的输入参数合并以形成用于升混矩阵730的输入参数。可通过参数修改块740执行参数的测定。然后,将升混矩阵730的输出提供至合成滤波器组760,合成滤波器组760确定立体声输出信号。 如上所述,混合矩阵H的输出L/R可由单声输入信号M和解相关信号D例如根据下式计算得到
权利要求
1.一种用于基于输入音频信号确定空间输出多声道音频信号的装置(100),包括分解器(110),用于分解所述输入音频信号以获得具有第一语义属性的第一分解信号和具有第二语义属性的第二分解信号,所述第二语义属性与所述第一语义属性不同;渲染器(120),用于采用第一渲染特性渲染所述第一分解信号以获得具有所述第一语义属性的第一渲染信号,并用于采用第二渲染特性渲染所述第二分解信号以获得具有所述第二语义属性的第二渲染信号,其中所述第一渲染特性和所述第二渲染特性彼此不同;以及处理器(130),用于处理所述第一渲染信号和所述第二渲染信号以获得所述空间输出多声道音频信号。
2.如权利要求1所述的装置(100),其中所述第一渲染特性基于所述第一语义属性,所述第二渲染特性基于所述第二语义属性。
3.如权利要求1或2所述的装置(100),其中所述渲染器(120)适于渲染所述第一分解信号,以便所述第一渲染特性不具有延迟引入特性或者以便所述第一渲染特性具有带有第一延迟量的延迟引入特性,且其中所述第二渲染特性具有第二延迟量,所述第二延迟量比所述第一延迟量大。
4.如权利要求1至3中任一项所述的装置(100),其中所述渲染器(120)适于通过作为第一渲染特性的振幅平移渲染所述第一分解信号,并用于解相关所述第二分解信号以获得作为第二渲染特性的第二解相关信号。
5.如权利要求1至4中的任一项所述的装置(100),其中所述渲染器(120)适于渲染每个都具有与所述空间输出多声道音频信号中的声道一样多的分量的所述第一渲染信号和所述第二渲染信号,且所述处理器(130)适于组合所述第一渲染信号和所述第二渲染信号的分量以获得所述空间输出多声道音频信号。
6.如权利要求1至4中的任一项所述的装置(100),其中所述渲染器(120)适于渲染每个都具有比所述空间输出多声道音频信号少的分量的所述第一渲染信号和所述第二渲染信号,且其中所述处理器(130)适于升混所述第一渲染信号和所述第二渲染信号的分量以获得所述空间输出多声道音频信号。
7.如权利要求1至6中的任一项所述的装置(100),其中所述渲染器(120)适于根据作为第一渲染特性的前景音频特性渲染所述第一分解信号,并用于根据作为第二渲染特性的背景音频特性渲染所述第二分解信号。
8.如权利要求4至7中的任一项所述的装置(100),其中所述渲染器(120)适于通过全通滤波所述第二信号来渲染所述第二分解信号以获得所述第二解相关信号。
9.如权利要求1所述的装置(100),其中所述分解器(110)适于从所述输入音频信号确定作为控制参数的输入参数。
10.如权利要求4至9中的任一项所述的装置(100),其中所述渲染器(120)适于通过应用宽带振幅平移来获得所述第一渲染信号或所述第二渲染信号的空间分布。
11.如权利要求1至10中的任一项所述的装置(100),其中所述渲染器(120)适于基于不同的时间网格渲染所述第一分解信号和所述第二分解信号。
12.如权利要求1至11中的任一项所述的装置(100),其中所述分解器(110)适于基于瞬态分离方法确定所述第一分解信号和/或所述第二分解信号。
13.如权利要求12所述的装置(100),其中所述分解器(110)适于通过瞬态分离方法确定所述第一分解信号或所述第二分解信号的一个,而基于所述一个分解信号和所述输入音频信号之间的区别来确定另一个。
14.如权利要求1至13中的任一项所述的装置(100),其中所述分解器(110)和/或所述渲染器(120)和/或所述处理器(130)包括DirAC单声合成阶段和/或DirAC合成阶段和/或DirAC合并阶段。
15.如权利要求1至14中的任一项所述的装置(100),其中所述分解器(110)适于分解所述输入音频信号,所述渲染器(120)适于渲染所述第一分解信号和/或所述第二分解信号,和/或所述处理器(130)适于根据不同的频带处理所述第一渲染信号和/或所述第二渲染信号。
16.一种用于基于输入音频信号和输入参数确定空间输出多声道音频信号的方法,包括以下步骤分解所述输入音频信号以获得具有第一语义属性的第一分解信号和具有第二语义属性的第二分解信号,所述第二语义属性与所述第一语义属性不同;采用第一渲染特性渲染所述第一分解信号以获得具有所述第一语义属性的第一渲染信号;采用第二渲染特性渲染所述第二分解信号以获得具有第二语义属性的第二渲染信号, 其中所述第一渲染特性和所述第二渲染特性彼此不同;以及处理所述第一渲染信号和所述第二渲染信号以获得所述空间输出多声道音频信号。
17.一种具有程序代码的计算机程序,用于当所述程序代码在计算机或处理器上运行时,执行如权利要求16所述的方法。
全文摘要
一种用于基于输入音频信号和输入参数确定空间输出多声道音频信号的装置(100)。装置(100)包括分解器(110),分解器(110)用于基于输入参数分解输入音频信号以获得彼此不同的第一分解信号和第二分解信号。此外,装置(100)包括渲染器(110),渲染器(110)用于渲染第一分解信号以获得具有第一语义属性的第一渲染信号,并用于渲染第二分解信号以获得具有与第一语义属性不同的第二语义属性的第二渲染信号。装置(100)包括处理器(130),处理器(130)用于处理第一渲染信号和第二渲染信号以获得空间输出多声道音频信号。
文档编号H04S7/00GK102165797SQ200980131419
公开日2011年8月24日 申请日期2009年8月11日 优先权日2008年8月13日
发明者库姆尔·厄库特, 米可-维利·莱迪南, 维利·普尔基, 萨沙·迪施 申请人:弗朗霍夫应用科学研究促进协会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1