修改多个音频信号的空间图像的制作方法

文档序号:7547030阅读:293来源:国知局
专利名称:修改多个音频信号的空间图像的制作方法
技术领域
本发明涉及音频处理,更具体涉及修改多个音频信号的空间图像。
背景技术
人类听觉系统非常适于根据声源的位置关注声源。这有时候被称为“鸡尾酒会效应在嘈杂拥挤的房间中可以进行会谈,因为听者可以排除大部分的来自除其正在交谈的人之外的方向的干扰声音。
对于听者来说,分离来自相同方向的声音难得多。例如,当通过耳机听立体音乐时,声音并不是表现为来自单个位置而是在宽的声场上扫描。在该情况中,如果将语音重叠在音乐上而没有任何将二者空间分离的措施,将难于理解对话。这在使用例如移动电话时可能存在问题。现代的移动终端包括允许通过耳机收听高质量音乐再现的特征。然而,如果在音乐再现期间接听电话呼叫,或者关闭音乐或者在音乐上叠加电话呼叫。从而,无法将电话呼叫或语音消息与立体音乐音轨混合而不降低可理解性。从而希望能够空间修改音频流,从而在仍播放音轨时容易理解对话。

发明内容
本发明提出了ー种改善的方法和实施该方法的技术设备,通过本发明在对话或其它音频信号与另ー个音频信号混合时增加了对话或其它音频信号的可理解性。本发明内容包括ー种方法、设备和计算机程序,其特征在于独立权利要求中的陈述。在从属权利要求中公开了本发明各个实施例。根据第一方面,根据本发明的方法基于这样的构思修改包括两个或更多个音频信道的输入音频信号所产生的声场,使得对于ー个或多个附加声源释放(relieve)空间空位(spatial room);以及将所述ー个或多个附加声源插入到所述输入音频信号的修改声场的释放空间空位中,而不引入与输入音频信号的修改声场的空间干渉。根据实施例,输入音频信号包括两信道立体信号,所述方法还包括通过对输入音频信号施加幅度平移(panning)处理而窄化通过两信道立体信号产生的声场;以及在窄化的声场的至少任ー侧插入一个附加声源。根据实施例,根据以下对所述两信道立体信号的输入信号分量施加幅度平移处理
. .. Pぐ)
UJ..I.. I- JuJ*其中L入、R入和Ra分别是左和右侧立体信道的输入和输出信号分量,并且O << 0.5。根据实施例,如果ー个或多个附加声源基于语音信号,则□的值被调节为约O. 3或更高。根据实施例,其中输入音频信号包括两信道立体信号,所述方法还包括基于立体信号共有的音频分量确定中心信道音频分量;通过除去中心信道音频分量而窄化通过两信道立体信号产生的声场;以及在声场的极值之间的非干涉空间中插入附加声源。根据实施例,分别根据因子l-α和α相互成比例地进行所述除去中心信道音频分量和所述插入附加声源。根据实施例,α的值被随时间变化地调节。根据实施例,一旦确定附加声源应包括在由两信道立体信号产生的声场中,该方法还包括在第一预定时段(例如一秒)中将α的值逐渐増加到预定值,诸如其最大值。根据实施例,该方法还包括延迟对附加声源的馈给所述第一预定时段。根据实施例,一旦确定在第二预定时段中未检测到产生所述附加声源的活跃附加信号,该方法还包括将α的值逐渐减小到零。 根据实施例,输入音频信号包括双耳线索编码下混信号,所述方法还包括通过选择信道间时间差參数在将抑制的预定范围内的子带,抑制从至少一个虚拟声源到达的音频信号;以及在所述双耳线索编码下混信号中插入所述ー个或多个附加声源代替所述抑制的
音频信号。根据实施例,输入音频信号包括定向音频编码信号,所述方法还包括通过选择方位角和/或高度參数在将抑制的预定范围内的子带,抑制从至少一个虚拟音源到达的音频信号;以及在所述定向音频编码信号中插入ー个或多个附加声源代替所述抑制的音频信号。根据实施例,输入音频信号包括定向音频编码(DirAC)信号或双耳线索编码(BCC)下混信号,所述方法还包括对所述输入音频信号施加重新平移处理,以将ー个或多个预定DirAC或BCC信号的能量重新分配到新的空间位置;以及将所述ー个或多个附加声源插入在由所述ー个或多个预定DirAC或BCC信号释放的空间位置中。根据本发明的配置提供多个优点。它使得在由原始输入音频信号产生的声场中能够包括基于音频信号(例如语音信号)的一个或多个附加声源,使得即使属于声场的原始音频信号(例如立体音乐)仍在被再现,附加声源也是可理解的。尤其在立体声场的情况中,提供了直接的方法,针对有待可理解地与底层声场混合的ー个或两个语音信号,释放非干渉空间空位。这对于例如社会音乐服务提供了令人愉悦的特征,其中在“现在收听”页面上可获得“ー键通”特征,从而用户的朋友可以立即评论听到的音乐。根据第二方面,提供了一种设备,其包括至少ー个处理器和至少ー个存储计算机程序代码的存储器,其中所述至少一个存储器和存储的计算机程序代码被配置为,通过所述至少一个处理器,使得所述设备至少修改包括两个或更多个音频信道的输入音频信号所产生的声场,使得对于ー个或多个附加声源释放空间空位;以及在不引入与输入音频信号的修改声场空间干渉的情况下,将所述一个或多个附加声源插入到所述输入音频信号的修改声场的释放空间空位中。根据第三方面,提供了ー种用于处理音频信号的计算机程序产品,其被存储在计算机可读介质中并可在数据处理装置中被执行,该计算机程序产品包括用于修改包括两个或更多个音频信道的输入音频信号所产生的声场,使得对于ー个或多个附加声源释放空间空位的计算机程序代码部分;以及用于将所述ー个或多个附加声源插入到所述输入音频信号的修改声场的释放空间中而不引入与输入音频信号的修改声场空间干渉的计算机程序代码部分。通过对下面的实施例的详细公开,本发明的这些和其它方面以及与其相关的实施例将变得显而易见。


在下文中,将參考附图更详细地描述本发明的各个实施例,其中图la、lb示出分别在没有空间处理和有空间处理的情况下,听者在通过耳机播放立体音乐时可以感知到的立体音乐的空间特性;图2a示出立体拓宽的声场;图2b示出图2a的立体拓宽声场如何被窄化以对附加信号提供空位;

图3示出根据实施例的用于产生图2b的空间效应所需的处理部件的简化框图;图4a示出用于立体信号的中心信道共用音频分量的特征;图4b示出图4a的声场如何通过除去中心信道共用音频分量而被窄化,以为附加信号提供空位;图5示出根据实施例的用于产生图4b的空间效应所需的处理部件的简化框图;图6a、6b示出基于重新平移的实施例,其用于释放多个虚拟音源之间的空间空位;以及图7示出根据实施例的设备的简化框图。
具体实施例方式下面,通过以(立体)音乐作为源材料说明本发明,其中形成用于插入基于语音信号的附加声源的空间空位。然而,应注意,本发明不仅限于作为源材料的音乐,而是可以在任何类型的具有空间内容的多信道音频中实施,所述多信道音频包括电影音轨、电视广播以及游戏。另外,可由其他类型的材料代替语音信号,所述材料具有相比于空间音轨的优先权,例如UI声音和警报。基于两信道(立体)输入音频信号描述第一实施例,但是基本方面还可以应用于多信道输入音频信号,如在之后的实施例中所述。通常已知的是,可以这样修改立体信号所形成的声场,使得听者将声场感知为在两侧延伸超过扬声器的位置。该处理通常被称为立体拓宽,其中通常通过从左侧输入向右侧扩音器引入串音、且从右侧输入向左侧扩音器引入串音而形成该拓宽效应。已知用于扩音器播放和耳机播放的立体拓宽方案。下面,使用耳机播放作为实例,然而在使用两个近距离隔开的扩音器的情况中,原理是相同的。在两种情况中,可以假设声源的位置沿直线或弧线分布,以与在坐在传统立体设备(其中,扩音器展开相对于听者的60度角)前的经历类似地,绕子午面对称地,相对于听者从左侧延伸到右側。在附图中,从上方绘制听者的头部,三角形表示听者的鼻子,两个半球形表示听者的耳朵,并且通过椭圆区域绘制由听者感知的声场。图la、lb示出听者在通过耳机播放立体音乐时可以感知到的立体音乐的空间特性。在没有空间处理的情况下(图la),声场的所有声源穿过头部中心从左耳延伸到右耳。在存在通过立体拓宽产生的空间效应的情况下(图lb),声场的极值被外部化,从而ー些声源表现为从头部的外部听到。无论是否使用空间处理,典型立体音轨的声场(即空间图像)是密集的,没有用于塞入附加声源的间隙。这通过实线椭圆区域绘制出。现在根据尤其应用于立体信号的实施例,原始立体输入信号的空间图像被修改,使得基于例如一个或多个附加信号为ー个或多个附加音频声源释放空间空位,从而可以在不引入与原始立体信号的修改的空间图像的空间干涉的情况下在释放的空间空位中插入一个或多个附加声源。从而,通过从原始声场(包括,例如音乐)释放空间空位,可以在原始两信道立体信号的声场中包括ー个或多个例如语音信号的附加音频信号的内容作为附加声源,从而即使仍在再现例如音乐的立体信号,附加声源也是可理解的。根据实施例,声场被窄化,从而在空间图像中在两侧存在用于附加(例如语音)信号的空间。当左信道L的音频与右信道R的相同时,立体拓宽对立体信号具有较少或没有影响。因此,通过将左信道与右信道混合在一起,从而使得输入到立体拓宽网络的立体信号的两个信道比在原始记录中更加相似,可以人为地窄化声场。这是通常称为幅度平移的标准操作。当根据以下公式对两个信道应用幅度平移吋,实现对声场宽度的控制
YLΛ (I)
、及IH J V a I八及入J其中α为在0-0. 5之间变化的參数。如公式(I)中所示,当α =0,对立体输入没有影响;即L出=L入,且R出=R入。冋样,当α = 0.5时,使得两个输出イ目号相冋;即,L出=R出=O. 5*L入+O. 5*R入。实验示出,当α的值变为大于约O. 3时,平均立体信号的声场被充分窄化以在听者的左侧和右侧都增加语音信号。这使得例如两个呼叫者或语音消息被同时听到,并且在存在声场的底层音频信号时仍可被理解。这在图2a和2b中示出,其中图2a的(立体拓宽)声场被窄化,以在听者两侧为语音信号SI和S2提供空位。应注意,根据将作为声源被添加到声场的附加音频信号(例如非语音信号)的特性,可以利用显著小于O. 3的α在听者的ー侧或两侧添加一个或多个附加声源。对于ー些类型的附加音频信号,例如各种警报或用户界面声音,即使小于O. I的α值可以是足够的。图3示出用于产生图2b的空间效应所需的处理部件的示例框图的实施例。首先,在幅度平移単元300中馈给两个立体输入信道L入和R入,所述幅度平移単元300如上所述地通过α的值控制幅度平移处理。利用合适的α值,从幅度平移単元300输出的声场被充分窄化,使得可以在窄化声场的ー侧或两侧插入基于音频信号SI、S2的附加声源。然后将从两个立体输入信道La和R入产生的窄化声场和基于音频信号S1、S2的一个或两个附加声源馈给到空间处理単元302中。空间处理単元302然后产生将经由耳机播放再现的通过左侧L和右侧R音频信号表示的3D空间音频图像。根据另ー个实施例,通过在声场中间提供空位可以窄化声场。通过在立体输入中减去两个信道共有的分量,可以在声场的中间而不是两侧中的ー侧添加基于例如语音信号的声源。图4a示出这样的实例,其中已经根据中心信道提取算法确定声场的共同分量C。已知很多可用于中心信道提取的算法,并且其通常依赖于使用的环境声处理。在声场中,左耳分量L-C/2和右耳分量R-C/2与中心信道(共同分量)C至少部分重叠。通常,不能完全提取中心信道,以避免处理伪像,优选通过适当调节中心信道提取算法的參数允许共同分量相对较宽(如图4a所示)。如图4a所示,应用中心信道提取算法的结果为,如果将中心信道(共同)分量C除去,左耳分量L-C/2与右耳分量R-C/2彼此不空间干渉,而是在它们之间存在空间空位。这在图4b中示出,其中通过将声场分割为之间具有空间空位的两个部分L-C/2和R-C/2而窄化该声场,从而可将附加音频信号S作为附加声源插入声场而不与原始立体信号的修改空间图像空间干涉,同时仍允许所 述附加音频信号被可理解地听到。根据实施例,优选将同时出现的声源的数目限制为一,因为通常在声场的中心仅存在用于仅仅单个附加声源的空间空位。例如在附加声源基于语音信号的情况中,如果几个人同时说话,则难于识别活跃的说话者,即与常规的具有单声道播放的远程电信会议设备类似的现象。图5示出用于产生图4b的空间效应所需的处理部件的示例框图的实施例。首先,将两个立体输入信道L入和1 入馈入中心信道提取单元500,其产生基本表示图4a所示的声场的输出信号分量Lc、C和Re。相互非干涉的左耳分量Lc和右耳分量Re被这样馈入空间处理单元504,但是在将中心信道(共同)分量C和附加音频信号S馈入求和単元502之前,将中心信道(共同)分量C乘以l-α,并将附加音频信号S乘以α。从而,通过调节α的值,可以确定中心信道分量C,基于音频信号S的附加声源或所述信号C和S的混合是否被馈入空间处理単元504。空间处理単元504然后产生将经由耳机播放再现的通过左侧L和右侧R音频信号表示的3D空间音频图像。本领域技术人员容易理解,通过图3中的空间处理单元302和图5中的空间处理単元504施加的空间处理方法可以根据使用的应用而变化。而且,由于基本方面还可以应用于扩音器播放,在扩音器播放中施加的空间处理方法优选与耳机播放不同。从而,如此应用的空间处理方法与这里描述的实施例不是相关的。在上述窄化声场的实施例中,如果没有有待包括的基于音频信号S的附加声源,听者以简化的从而不满意的方式感知例如音乐的原始音频信号的空间内容。从而,有利的是,仅当存在具有可听内容的附加信号时修改声场并为附加声源提供空位,例如,在有待引入的附加声源所基于的附加信号是语音信号的情况中,仅当在各个信号中存在语音活动时,可以修改声场以对附加声源提供空位。根据实施例,这通过使得參数α随时间变化而实施。在參考图3和5描述的实施例中,当α=ο时,在声场中没有用于附加声源的空位,并且有待引入的附加声源所基于的语音信道S被静音。根据实施例,一旦确定应该在声场中包括附加声源,在例如一秒的第一预定时段内α的值被逐渐增加到预定值,提供用于原始音频信号的希望宽度的声场。从而,获得舒适和愉悦的空间效应。应注意,α的最大值为用于窄化声场的O. 5和用于除去中心信道的I。根据另ー个实施例,将基于信号S的附加声源的馈给延迟(第一)预定时段,该时段与将α増加到预定值花费的时长相同。这允许可以在例如语音的附加声源被听到之前修改声场。根据实施例,当在第二预定时段(例如5秒冲已经没有活跃的附加信号吋,则使用与増加α时相同的逐渐更新方案但是当然以相反地方式将α的值减小到零。已经结合两信道(立体)输入音频信号描述了上述实施例,但是如上所述,基本方面也可应用于多信道输入音频信号。本领域技术人员可以了解,可以使用不同方法进行空间处理,并且例如可以将立体拓宽仅仅看作对两信道输入起作用的特定例子。从而,所述实施例的基本方面可以概括为修改包括两个或更多个音频信道的输入音频信号的空间图像,使得对于基于例如ー个或多个附加音频信号的一个或多个附加声源释放空间空位,从而可以将所述ー个或多个附加声源插入到释放的空间空位中,而不引入与原始输入信号的修改空间图像的空间干渉,并在输入音频信号的修改空间图像的释放空间空位中插入所述ー个或多个附加声源。从而,在具有两个以上信道的多信道输入音频的情况中,同样,可以将ー个或多个附加声源插入声场,使得即使在仍然再现所述多信道音频信号的情况下,仍可理解所述附加声源。多个称为“虚拟环绕”的音频处理算法利用人类听觉系统的特性产生由多于实际存在的声源所产生的声场的感觉。这些算法可以基于对以下各项的使用头相关传输函数(HRTF)、參数音频编码技术(如双耳线索编码(BCC))、反射或散射声源或其组合。这些算法 中的多个至少在ー些处理阶段可以包括两个以上的信道信号。在双耳线索编码(BCC)中,编码器利用例如傅立叶变换或QMF过滤带技术将输入信号变换为频域,并且然后进行空间分析。对于每个输入帧中的每个频率子带估计信道间级别差(ILD)和时间差(ITD)參数以及附加參数。与通过组合输入信号产生的下混音频信号一起,这些參数被传输为边信息(side information)ο在定向音频编码(DirAC)中,通过将输入信号分割到频带中而分析来自空间传声器系统(诸如B格式声场传声器)的信号。对于每个时刻和频带独立地估计到达方向和扩散。以全方向传声器信号传输由每个频带的方位角、高度和扩散值构成的空间边信息。 根据实施例,如果音频信号已经被BCC或DirAC编码,有可能抑制来自特定(虚拟)空间方向的声音。例如,从N个空间方向,可以抑制一个或多个空间方向以对将混合在其中的一个或多个附加声源提供空间空位,然后可以插入基于例如附加音频信号的附加声源代替所抑制的虚拟声源。在实践中,这可以通过在參数域中处理边信息而实施。例如,在BCC编码信号中,可以抑制具有处于特定范围的ITD的子帯。在DirAC编码信号中,可以抑制具有特定方位角和/或高度值的子帯。重新平移是ー种基本应用于立体音轨的音频处理方法,其将特定空间位置中的能量映射到新的空间位置。根据实施例,对BCC或DirAC编码信号施加重新平移。从而,通过将特定BCC或DirAC编码信号的能量重新分配到新的空间位置,可以从声场释放空间空位,以允许在声场中包括一个或多个附加声源,同时仍可以理解原始信号中的基本全部内容。图6a和6b示出该实施例的原理。在图6a中,在声场中等距地分布以数字I至7表示的声场的虚拟音源。在图6b中,作为重新平移处理的結果,将虚拟音源I至3和4至7分别挤压到一起并分开放入两组中,从而为位于听者的略靠左的附加音频信号S提供空位。在专利申请公开US2008/0298610 “Parameter Space Re-Panning for SpatialAudio”中更详细地描述了用于通过重新平移提供空间空位的处理,其整体内容在此引入作为參考。根据实施例,声场不限于位于听者的前方/側面,如果使用例如头部跟踪的高级渲染技术,声场也可以延伸到听者的后方。
本领域技术人员可以理解,上述任一实施例可以与ー个或多个其他实施例组合地实施,除非清楚地或明确地陈述特定实施例仅是相互可替换的。图7示出设备(即数据处理装置(TE))的简化结构,其中可以实施根据实施例的声场修改方法。该数据处理装置(TE)例如可以是移动终端、PDA装置或个人计算机(PC)。数据处理单元(TE)包括I/O装置(I/O)、中央处理单元(CPU)和存储器(MEM)。存储器(MEM)包括只读存储器ROM部分和可重写部分,诸如随机存取存储器RAM和闪存。通过I/O装置(I/O)向/从中央处理单元(CPU)传输用于与不同的外部方(例如⑶-ROM、附加装置和用户)通信的信息。如果数据处理装置被实施为移动站,其通常包括收发器Tx/Rx,该收发器Tx/Rx通常通过天线(ANT)与无线网络(通常与收发器基站(BTS))通信。用户界面(UI)设备通常包括显示器、键盘、传声器和用于耳机的连接装置。数据处理装置还可以包括连接装置MMC,诸如标准形式插槽,用于各个硬件模块或集成电路1C,其可以提供将在数据处理装置中运行的各个应用。·因此,可以在中央处理单元CPU或数据处理装置的专用数字信号处理器DSP (參数编码处理器)、以及存储计算机程序代码的至少ー个存储器MEM中执行根据实施例的声场修改方法,其中所述至少一个存储器和存储的计算机程序代码被配置为,通过至少ー个处理器,使得所述设备至少修改两个或更多个音频信号的空间图像,使得对于ー个或多个附加音频信号释放空间空位,所述空间空位在所述两个或更多个音频信号之间没有空间干渉,然后将所述ー个或多个附加音频信号插入到两个或更多个音频信号的空间图像的释放空间空位中。从而,可以在诸如移动站的设备中将实施例的功能实施为计算机程序,所述计算机程序当在中央处理单元CPU或专用数字信号处理器DSP中被执行吋,使得終端装置进行本发明的过程。计算机程序SW的功能可以被分布到彼此连接的几个分离的程序构件中。计算机软件可以被存储到任何存储器装置中,诸如PC的硬盘或CD-ROM盘,从该存储器装置可以将计算机软件装载到移动终端的存储器中。还可以通过网络,例如利用TCP/IP协议栈装载计算机软件。还可以使用硬件方案或硬件和软件方案的组合来实现本发明装置。相应地,上述计算机程序产品可以在硬件模块中至少部分被实现为硬件方案,例如ASIC或FPGA电路,所述硬件模块包括用于将该模块连接到电子装置的连接装置,或者被至少部分地实现为ー个或多个集成电路1C,该硬件模块或IC还包括用于进行所述程序代码任务的各个装置,所述装置被实现为硬件和/或软件。显然,本发明不仅仅限于上述实施例,而是可以在所附权利要求的范围内修改。
权利要求
1.一种方法,包括 修改包括两个或更多个音频信道的输入音频信号所产生的声场,使得对于一个或多个附加声源释放空间空位;以及 在不引入与输入音频信号的修改声场空间干涉的情况下,将所述一个或多个附加声源插入到所述输入音频信号的修改声场的释放的空间空位中。
2.根据权利要求I所述的方法,其中所述输入音频信号包括两信道立体信号,所述方法还包括 通过对输入音频信号施加幅度平移处理而窄化两信道立体信号所产生的声场;以及 在所窄化的声场的至少任一侧插入一个附加声源。
3.根据权利要求2的方法,其中根据以下公式对所述两信道立体信号的输入信号分量施加幅度平移处理
4.根据权利要求3所述的方法,其中如果一个或多个附加声源基于语音信号,则α的值被调节为约O. 3或更高。
5.根据权利要求I所述的方法,其中输入音频信号包括两信道立体信号,所述方法还包括 基于立体信号共有的音频分量确定中心信道音频分量; 通过除去中心信道音频分量而窄化所述两信道立体信号所产生的声场;以及 在声场的极值之间的非干涉空间中插入附加声源。
6.根据权利要求5所述的方法,其中分别根据因子l-α和α相互成比例地进行所述除去中心信道音频分量和所述插入附加声源。
7.根据权利要求3或6所述的方法,其中α的值被随时间变化地调节。
8.根据权利要求7所述的方法,其中一旦确定应该在两信道立体信号产生的声场中包括附加声源,该方法还包括 在第一预定时段,例如一秒,中将α的值逐渐增加到预定值,诸如其最大值。
9.根据权利要求8所述的方法,还包括 将附加声源的馈给延迟所述第一预定时段。
10.根据权利要求8或9所述的方法,其中一旦确定在第二预定时段中未检测到产生所述附加声源的活跃附加信号,该方法还包括 将α的值逐渐减小到零。
11.根据权利要求I的方法,其中输入音频信号包括双耳线索编码下混信号,所述方法还包括 通过选择信道间时间差参数在将抑制的预定范围内的子带,抑制从至少一个虚拟音源到达的音频信号;以及 在所述双耳线索编码下混信号中插入所述一个或多个附加声源代替所述抑制的音频信号。
12.根据权利要求I所述的方法,其中所述输入音频信号包括定向音频编码信号,所述方法还包括 通过选择方位角和/或高度参数在将抑制的预定范围内的子带,抑制从至少一个虚拟音源到达的音频信号;以及 在所述定向音频编码信号中插入所述一个或多个附加声源代替所述抑制的音频信号。
13.根据权利要求I所述的方法,其中输入音频信号包括定向音频编码(DirAC)信号或双耳线索编码(BCC)下混信号,所述方法还包括 对所述输入音频信号施加重新平移处理,以将一个或多个预定DirAC或BCC信号的能量重新分配到新的空间位置;以及 在由所述一个或多个预定DirAC或BCC信号释放的空间位置中插入所述一个或多个附加声源。
14.一种设备,其包括至少一个处理器和至少一个存储计算机程序代码的存储器,其中所述至少一个存储器和存储的计算机程序代码被配置为,通过所述至少一个处理器,使得所述设备至少 修改包括两个或更多个音频信道的输入音频信号所产生的声场,使得对于一个或多个附加声源释放空间空位;以及 在不引入与输入音频信号的修改声场空间干涉的情况下,将所述一个或多个附加声源插入到所述输入音频信号的修改声场的释放的空间空位中。
15.根据权利要求14所述的设备,其中所述输入音频信号包括两信道立体信号,其中所述至少一个存储器和存储的计算机程序代码还被配置为,通过所述至少一个处理器,使得所述设备至少 通过对输入音频信号施加幅度平移处理而窄化所述两信道立体信号所产生的声场;以及 在所窄化的声场的至少任一侧插入一个附加声源。
16.根据权利要求15所述的设备,其中所述幅度平移处理被配置为根据以下公式被施加到所述两信道立体信号的输入信号分量
17.根据权利要求16所述的设备,其中如果一个或多个附加声源基于语音信号,则α的值被设置为被调节为约O. 3或更高。
18.根据权利要求14所述的设备,其中所述输入音频信号包括两信道立体信号,其中所述至少一个存储器和存储的计算机程序代码还被配置为,通过所述至少一个处理器,使得所述设备至少 基于立体信号共有的音频分量确定中心信道音频分量; 通过除去中心信道音频分量而窄化两信道立体信号产生的声场;以及 在声场的极值之间的非干涉空间中插入附加声源。
19.根据权利要求18所述的设备,其中所述除去中心信道音频分量和所述插入附加声源被配置为分别根据因子I-α和α相互成比例地进行。
20.根据权利要求16或19所述的设备,其中α的值被配置为随时间变化地被调节。
21.根据权利要求20所述的设备,其中一旦确定应该在两信道立体信号产生的声场中包括附加声源,所述至少一个存储器和存储的计算机程序代码进一步配置为,经由至少一个处理器,使得所述设备至少 在第一预定时段,例如一秒,中将α的值逐渐增加到预定值,诸如其最大值。
22.根据权利要求21所述的设备,还包括 将附加声源的馈给延迟所述第一预定时段。
23.根据权利要求21或22所述的设备,其中一旦确定在第二预定时段中未检测到产生所述附加声源的活跃附加信号,所述至少一个存储器和存储的计算机程序代码被进一步配置为,经由至少一个处理器,使得所述设备至少 将α的值逐渐减小到零。
24.根据权利要求14所述的设备,其中所述输入音频信号包括双耳线索编码下混信号,所述至少一个存储器和存储的计算机程序代码进一步配置为,经由至少一个处理器,使得所述设备至少 通过选择信道间时间差参数在将抑制的预定范围内的子带,抑制从至少一个虚拟音源到达的音频信号;以及 在所述双耳线索编码下混信号中插入所述一个或多个附加声源代替所述抑制的音频信号。
25.根据权利要求14所述的设备,其中所述输入音频信号包括定向音频编码信号,所述至少一个存储器和存储的计算机程序代码进一步配置为,经由至少一个处理器,使得所述设备至少 通过选择方位角和/或高度参数在将抑制的预定范围内的子带,抑制从至少一个虚拟音源到达的音频信号;以及 在所述定向音频编码信号中插入所述一个或多个附加声源代替所述抑制的音频信号。
26.根据权利要求14所述的设备,其中所述输入音频信号包括定向音频编码(DirAC)信号或双耳线索编码(BCC)下混信号,所述至少一个存储器和存储的计算机程序代码进一步配置为,经由至少一个处理器,使得所述设备至少 对所述输入音频信号施加重新平移处理,以将一个或多个预定DirAC或BCC信号的能量重新分配到新的空间位置;以及 在由所述一个或多个预定DirAC或BCC信号释放的空间位置中插入所述一个或多个附加声源。
27.一种用于处理音频信号的计算机程序产品,其被存储在计算机可读介质中并可在数据处理装置中被执行,该计算机程序产品包括 用于修改包括两个或更多个音频信道的输入音频信号所产生的声场,使得对于一个或多个附加声源释放空间空位的计算机程序代码部分;以及 用于在不引入与输入音频信号的修改声场空间干涉的情况下,将所述一个或多个附加声源插入到所述输入音频信号的修改声场的释放的空间空位中的计算机程序代码部分。
全文摘要
一种方法,包括修改包括两个或更多个音频信道的输入音频信号所产生的声场,使得对于一个或多个附加声源释放空间空位;以及在不引入与输入的音频信号的修改声场空间干涉的情况下,将所述一个或多个附加声源插入到所述输入音频信号的修改声场的释放空间空位中。
文档编号H04S7/00GK102860048SQ201080064811
公开日2013年1月2日 申请日期2010年2月26日 优先权日2010年2月26日
发明者O·柯克比, J·维罗莱宁 申请人:诺基亚公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1