用于音频再现的子带空间和串扰消除的制作方法

文档序号:16054879发布日期:2018-11-24 11:36阅读:261来源:国知局
本发明根据35u.s.c.§119(e)要求于2016年1月18日提交的题为”sub-bandspatialandcross-talkcancellationalgorithmforaudioreproduction”的第62/280,119号共同未决的美国临时专利申请以及于2016年1月29日提交的题为“sub-bandspatialandcross-talkcancellationalgorithmforaudioreproduction”的第62/388,366号共同未决的美国临时专利申请的优先权,所有上述申请文件的全部内容通过引用并入本文。本公开内容的实施方式一般地涉及音频信号处理领域,并且更特别地,涉及串扰干扰减少和空间增强。
背景技术
立体声声音再现涉及编码和再现包含声场的空间特性的信号。立体声声音使得收听者能够感知声场中的空间感。例如,在图1中,位于固定位置处的两个扬声器110a和110b将立体声信号转换成声波,该声波被朝向收听者120引导以产生从各个方向听到的声音的印象。在例如图1所示的常规的近场扬声器装置中,在左耳125l与右耳125r之间略微延迟以及存在由收听者120的头部引起滤波的情况下,在收听者120的左耳125l和右耳125r两者处接收由两个扬声器110产生的声波。由两个扬声器生成的声波产生串扰干扰,这可能妨碍收听者120确定虚拟声源160的感知空间位置。技术实现要素:音频处理系统基于扬声器的参数和收听者相对于扬声器的位置自适应地产生具有增强的空间可检测性和减少的串扰干扰的用于再现的两个或更多个输出声道。音频处理系统将双声道输入音频信号应用于多个音频处理流水线,所述多个音频处理流水线自适应地控制收听者感知在扬声器的物理边界之外呈现的音频信号的声场扩展程度以及在所扩展的声场内的声音分量的位置和强度。音频处理流水线包括用于处理双声道输入音频信号(例如,用于左声道扬声器的音频信号和用于右声道扬声器的音频信号)的声场增强处理流水线和串扰消除处理流水线。在一个实施方式中,声场增强处理流水线在执行串扰消除处理之前对输入音频信号进行预处理以提取空间分量和非空间分量。预处理调整输入音频信号的空间分量和非空间分量中能量的强度和平衡。空间分量对应于两个声道之间的非相关部分(“侧面分量”),而非空间分量对应于两个声道之间的相关部分(“中间分量”)。声场增强处理流水线还使得能够控制输入音频信号的空间分量和非空间分量的音色和频谱特性。在所公开的实施方式的一方面,声场增强处理流水线通过将输入音频信号的每个声道划分成不同的频率子带并且在每个频率子带中提取空间分量和非空间分量来对输入音频信号执行子带空间增强。然后,声场增强处理流水线独立地调整每个频率子带中的空间分量或非空间分量中的一个或更多个中的能量,并且调整空间分量和非空间分量中的一个或更多个分量的频谱特性。通过根据不同的频率子带划分输入音频信号以及通过针对每个频率子带相对于非空间分量调整空间分量的能量,经子带空间增强的音频信号在被扬声器再现时获得更好的空间定位。相对于非空间分量调整空间分量的能量可以通过将空间分量调整第一增益系数、将非空间分量调整第二增益系数或通过前述二者来执行。在所公开的实施方式的一方面,串扰消除处理流水线对从声场处理流水线输出的经子带空间增强的音频信号执行串扰消除。由在收听者的头部的相同侧的扬声器输出并且由收听者的该侧的耳朵接收的信号分量(例如,118l、118r)在本文中被称为“同侧声音分量”(例如,左耳处接收的左声道信号分量和右耳处接收的右声道信号分量),以及由在收听者的头部的相对侧的扬声器输出的信号分量在本文中被称为“对侧声音分量”(右耳处接收的左声道信号分量和左耳处接收的右声道信号分量)。对侧声音分量引起串扰干扰,这导致对空间性的感知减弱。串扰消除处理流水线预测对侧声音分量,并且识别输入音频信号的引起对侧声音分量的信号分量。然后,串扰消除处理流水线通过将声道的所识别的信号分量的反相加至经子带空间增强的音频信号的另一声道来修改经子带空间增强的音频信号的每个声道,以生成用于再现声音的输出音频信号。因此,所公开的系统可以降低引起串扰干扰的对侧声音分量,并且改善输出声音的感知空间性。在所公开的实施方式的一方面,根据扬声器相对于收听者的位置的参数,通过声场增强处理流水线自适应地处理输入音频信号并且随后通过串扰消除处理流水线进行处理来获得输出音频信号。扬声器的参数的示例包括收听者与扬声器之间的距离、两个扬声器相对于收听者形成的角度。另外的参数包括扬声器的频率响应,并且可以包括可以在流水线处理之前或期间实时测量的其他参数。串扰消除处理是使用该参数来执行的。例如,可以将与串扰消除相关联的截止频率、延迟和增益确定为扬声器的参数。此外,可以估计由于与扬声器的参数相关联的相应串扰消除而导致的任何频谱缺陷。此外,可以通过声场增强处理流水线来针对一个或更多个子带执行相应的串扰补偿以补偿所估计的频谱缺陷。因此,声场增强处理例如子带空间增强处理和串扰补偿改善了后续串扰消除处理的整体感知效率。因此,收听者可以感知到声音从大的区域而不是与扬声器的位置相对应的空间中的特定点被引导至收听者,从而为收听者产生更加身临其境的收听体验。附图说明图1示出了相关技术的立体声音频再现系统。图2a示出了根据一个实施方式的用于再现具有减小的串扰干扰的增强声场的音频处理系统的示例。图2b示出了根据一个实施方式的图2a中所示的音频处理系统的详细实现。图3示出了根据一个实施方式的用于处理音频信号以减小串扰干扰的示例信号处理算法。图4示出了根据一个实施方式的子带空间音频处理器的示例图。图5示出了根据一个实施方式的用于执行子带空间增强的示例算法。图6示出了根据一个实施方式的串扰补偿处理器的示例图。图7示出了根据一个实施方式的用于对串扰消除执行补偿的示例方法。图8示出了根据一个实施方式的串扰消除处理器的示例图。图9示出了根据一个实施方式的执行串扰消除的示例方法。图10和图11示出了用于演示由于串扰消除引起的频谱伪像的示例频率响应曲线。图12和13示出了用于演示串扰补偿效果的示例频率响应曲线。图14示出了用于演示改变图8中所示的频带划分器的转角频率的效果的示例频率响应。图15和图16示出了用于演示图8中所示的频带划分器的效果的示例频率响应。具体实施方式说明书中描述的特征和优点并非包括一切,并且特别地,鉴于附图、说明书和权利要求书,许多附加特征和优点对于本领域普通技术人员而言将是明显的。此外,应当注意的是,说明书中使用的语言主要是出于可读性和指导的目的而选择的,并且可能未被选择以划出或限制本发明的主题。附图(图)和以下描述仅通过说明的方式涉及优选实施方式。应当注意的是,根据以下讨论,在不偏离本发明的原理的情况下,本文所公开的结构和方法的替选实施方式将容易地被认识作为可以采用的可行的替选方案。现在将详细参照本发明的若干实施方式,其示例在附图中示出。注意,在可行的情况下,可以在附图中使用相似或相同的附图标记,并且可以指示相似或相同的功能。附图仅出于说明的目的来描绘实施方式。本领域技术人员根据以下描述将容易地认识到,可以在不偏离本文所描述的原理的情况下,采用本文所示的结构和方法的替选实施方式。示例音频处理系统图2a示出了根据一个实施方式的用于再现具有减小的串扰干扰的增强空间场的音频处理系统220的示例。音频处理系统220接收包括两个输入声道xl、xr的输入音频信号x。在每个输入声道中,音频处理系统220预测将导致对侧信号分量的信号分量。在一方面,音频处理系统220获得描述扬声器280l、280r的参数的信息,并且根据描述扬声器的参数的信息来估计将导致对侧信号分量的信号分量。音频处理系统220通过针对每个声道将导致对侧信号分量的信号分量的反相加至另一声道以从每个输入声道移除所估计的对侧信号分量来生成包括两个输出声道ol、or的输出音频信号o。此外,音频处理系统220可以将输出声道ol、or耦合至输出设备例如扬声器280l、280r。在一个实施方式中,音频处理系统220包括声场增强处理流水线210、串扰消除处理流水线270和扬声器配置检测器202。音频处理系统220的部件可以在电子电路中实现。例如,硬件部件可以包括被配置成执行本文所公开的特定操作的专用电路或逻辑(例如,被配置成专用处理器,例如数字信号处理器(dsp)、现场可编程门阵列(fpga)或者专用集成电路(asic))。扬声器配置检测器202确定扬声器280的参数204。扬声器的参数的示例包括扬声器的数目、收听者与扬声器之间的距离、由两个扬声器相对于收听者形成的对向收听角度(“扬声器角度”)、扬声器的输出频率、截止频率以及可以预定义或实时测量的其他量。扬声器配置检测器202可以从用户输入或系统输入(例如,耳机插孔检测事件)获得描述(例如,电话中的内置扬声器、个人计算机的内置扬声器、便携式扬声器、音箱等)类型的信息,并且根据扬声器280的类型或型号确定扬声器的参数。可替选地,扬声器配置检测器202可以向扬声器280中的每一个输出测试信号并且使用内置麦克风(未示出)对扬声器输出进行采样。根据每个所采样的输出,扬声器配置检测器202可以确定扬声器距离和响应特性。扬声器角度可以由用户(例如,收听者120或其他人)通过选择角度的量或者基于扬声器类型来提供。可替选地或另外地,可以通过解析的用户捕获或系统生成的传感器数据例如麦克风信号分析、拍摄扬声器的图像的计算机视觉分析(例如,使用焦距来估计扬声器内部距离,然后估计扬声器内部距离的一半与焦距的比率的反正切以获得一半的扬声器角度)、系统集成的陀螺仪或加速度计数据来确定扬声器角度。声场增强处理流水线210接收输入音频信号x,并且对输入音频信号x执行声场增强以生成包括声道tl和tr的预补偿信号。声场增强处理流水线210使用子带空间增强来执行声场增强,并且可以使用扬声器280的参数204。特别地,声场增强处理流水线210适应性地(i)对输入音频信号x执行子带空间增强以针对一个或更多个频率子带增强输入音频信号x的空间信息,以及(ii)根据扬声器280的参数执行串扰补偿以补偿由于串扰消除处理流水线270进行的后续串扰消除而导致的任何频谱缺陷。声场增强处理流水线210的详细实现方式和操作在下面关于图2b、图3至图7来提供。串扰消除处理流水线270接收预补偿信号t,并且对预补偿信号t执行串扰消除以生成输出信号o。串扰消除处理流水线270可以根据参数204自适应地执行串扰消除。串扰消除处理流水线270的详细实现方式和操作在下面关于图3以及图8至图9来提供。在一个实施方式中,声场增强处理流水线210和串扰消除处理流水线270的配置(例如,中心频率或截止频率、品质因数(q)、增益、延迟等)是根据扬声器280的参数204确定的。在一方面,声场增强处理流水线210和串扰消除处理流水线270的不同配置可以存储为一个或更多个查找表,可以根据扬声器参数204来访问该一个或更多个查找表。可以通过一个或更多个查找表来识别基于扬声器参数204的配置,并且可以应用该扬声器参数204的配置用于执行声场增强和串扰消除。在一个实施方式中,可以通过描述扬声器参数204与声场增强处理流水线210的相应配置之间的关联的第一查找表来识别声场增强处理流水线210的配置。例如,如果扬声器参数204指定收听角度(或范围),并且还指定扬声器的类型(或者频率响应范围(例如,针对便携式扬声器为350hz至12khz)),则可以通过第一查找表来确定声场增强处理管线210的配置。可以通过模拟在各种设置下串扰消除的频谱伪像(例如,改变用于执行串扰消除的截止频率、增益或延迟)以及预确定声场增强的设置以补偿相应的频谱伪像来生成第一查找表。此外,可以根据串扰消除来将扬声器参数204映射至声场增强处理流水线210的配置。例如,用于校正特定串扰消除的频谱伪像的声场增强处理流水线210的配置可以存储在用于与该串扰消除相关联的扬声器280的第一查找表中。在一个实施方式中,通过描述各种扬声器参数204与串扰消除处理流水线270的相应配置(例如,截止频率、中心频率、q、增益和延迟)之间的关联的第二查找表来识别串扰消除处理流水线270的配置。例如,如果特定类型的扬声器280(例如,便携式扬声器)以特定角度进行布置,则可以通过第二查找表来确定用于对扬声器280执行串扰消除的串扰消除处理流水线270的配置。可以通过测试在各种扬声器280的各种设置(例如,距离、角度等)下生成的声音的经验试验来生成第二查找表。图2b示出了根据一个实施方式的图2a中所示的音频处理系统220的详细实现方式。在一个实施方式中,声场增强处理流水线210包括子带空间(sbs)音频处理器230、串扰补偿处理器240和组合器250,并且串扰消除处理流水线270包括串扰消除(ctc)处理器260。(扬声器配置检测器202未在该图中示出。)在一些实施方式中,串扰补偿处理器240和组合器250可以被省略,或者可以与sbs音频处理器230集成在一起。sbs音频处理器230生成包括两个声道例如左声道yl和右声道yr的空间增强的音频信号y。图3示出了如由根据一个实施方式的音频处理系统220执行的用于处理音频信号以减少串扰干扰的示例信号处理算法。在一些实施方式中,音频处理系统220可以并行地执行步骤、以不同顺序执行步骤或者执行不同的步骤。子带空间音频处理器230接收370包括两个声道例如左声道xl和右声道xr的输入音频信号x,并且对输入音频信号x执行372子带空间增强以生成包括两个声道例如左声道yl和右声道yr的空间增强的音频信号y。在一个实施方式中,子带空间增强包括将左声道yl和右声道yr应用于交叉网络,该交叉网络将输入音频信号x的每个声道划分成不同的输入子带信号x(k)。交叉网络包括如参照图4所示的频带划分器410所讨论的以各种电路拓扑布置的多个滤波器。交叉网络的输出被矩阵化为中间分量和侧面分量。将增益应用于中间分量和侧面分量以调整每个子带的中间分量与侧面分量之间的平衡或比率。可以根据第一查找表或者函数来确定应用于中间子带分量和侧面子带分量的相应增益和延迟。因此,相对于输入子带信号x(k)的每个非空间子带分量xn(k)中的能量来调整输入子带信号x(k)的每个空间子带分量xs(k)中的能量以针对子带k生成增强的空间子带分量ys(k)和增强的非空间子带分量yn(k)。基于增强的子带分量ys(k)、yn(k),子带空间音频处理器230执行解矩阵操作以针对子带k生成空间增强的子带音频信号y(k)的两个声道(例如,左声道yl(k)和右声道yr(k))。子带空间音频处理器将空间增益应用于两个解矩阵的声道以对能量进行调整。此外,子带空间音频处理器230将每个声道中的空间增强的子带音频信号y(k)进行组合以生成空间增强的音频信号y的相应声道yl和yr。频率划分和子带空间增强的细节在下面关于图4进行描述。串扰补偿处理器240执行374串扰补偿以补偿由串扰消除产生的伪像。在串扰消除处理器260中主要由延迟且反相的对侧声音分量与它们相应的同侧声音分量的求和产生的这些伪像为最终呈现的结果引入类似梳状滤波器的频率响应。基于串扰消除处理器260中应用的特定延迟、放大或滤波,子奈奎斯特(sub-nyquist)梳状滤波器峰和谷的量值和特性(例如,中心频率、增益和q)在频率响应中上下移动,导致频谱的特定区域中的能量的可变的放大和/或衰减。在串扰消除处理器260执行串扰消除之前,串扰补偿可以作为通过针对扬声器280的给定参数来针对特定频带将输入音频信号x延迟且放大的预处理步骤来执行。在一个实现中,对输入音频信号x执行串扰补偿,以与由子带空间音频处理器230执行的子带空间增强并行地生成串扰补偿信号z。在该实现中,组合器250将串扰补偿信号z与两个声道yl和yr中的每一个进行组合376以生成包括两个预补偿声道tl和tr的预补偿信号t。可替选地,在子带空间增强之后顺序地执行串扰补偿、在串扰消除之后顺序地执行串扰补偿或者将串扰补偿与子带空间增强相结合。串扰补偿的细节在下面关于图6进行描述。串扰消除处理器260执行378串扰消除以生成输出声道ol和or。更具体地,串扰消除处理器260从组合器250接收预补偿声道tl和tr,并且对预补偿声道tl和tr执行串扰消除以生成输出声道ol和or。对于声道(l/r),串扰消除处理器260根据扬声器参数204估计由于预补偿声道t(l/r)引起的对侧声音分量,并且识别预补偿声道t(l/r)的导致对侧声音分量的部分。串扰消除处理器260将所识别的预补偿声道t(l/r)的部分的反相加至另一预补偿声道t(r/l)以生成输出声道o(r/l)。在该配置中,到达耳朵125(r/l)处的由扬声器280(r/l)根据输出声道o(r/l)输出的同侧声音分量的波前可以抵消由另一扬声器280(l/r)根据输出声道o(l/r)输出的对侧声音分量的波前,从而有效地去除由于输出声道o(l/r)引起的对侧声音分量。可替选地,串扰消除处理器260可以对来自子带空间音频处理器230的空间增强的音频信号y执行串扰消除或者替代地对输入音频信号x执行串扰消除。串扰消除的细节在下面参照图8进行描述。图4示出了根据采用中间/侧面处理方法的一个实施方式的子带空间音频处理器230的示例图。子带空间音频处理器230接收包括声道xl、xr的输入音频信号,并且对输入音频信号执行子带空间增强以生成包括声道yl、yr的空间增强的音频信号。在一个实施方式中,子带空间音频处理器230包括:频带划分器410;用于一组频率子带k的左/右音频到中间/侧面音频转换器420(k)(“l/r到m/s转换器420(k)”)、中间/侧面音频处理器430(k)(“中间/侧面处理器430(k)”或“子带处理器430(k)”)、中间/侧面音频到左/右音频转换器440(k)(“m/s到l/r转换器440(k)”或“反向转换器440(k)”);以及频带组合器450。在一些实施方式中,图4所示的子带空间音频处理器230的部件可以以不同的顺序布置。在一些实施方式中,子带空间音频处理器230包括与图4所示不同的、附加的或更少的部件。在一种配置中,频带划分器410或滤波器组是包括以例如串联、并联或衍生的各种电路拓扑中的任一种拓扑布置的多个滤波器的交叉网络。交叉网络中包括的示例滤波器类型包括无限脉冲响应(iir)或者有限脉冲响应(fir)带通滤波器、iir峰值和搁置滤波器、linkwitz-riley或者音频信号处理领域的普通技术人员已知的其他滤波器类型。滤波器针对每个频率子带k将左输入声道xl划分成左子带分量xl(k),并且将右输入声道xr划分成右子带分量xr(k)。在一种方法中,采用四个带通滤波器、或者采用低通滤波器、带通滤波器和高通滤波器的任意组合来近似人耳的临界频带。临界频带对应于第二音调能够掩蔽现有主音调的带宽。例如,每个频率子带可以对应于统一的bark标度以模仿人类听觉的临界频带。例如,频带划分器410将左输入声道xl划分成分别对应于0至300hz、300hz至510hz、510hz至2700hz以及2700hz至奈奎斯特频率的四个左子带分量xl(k),并且类似地,将右输入声道xr针对相应的频带划分为右子带分量xr(k)。确定一组统一的临界频带的处理包括使用来自各种音乐类型的音频样本的语料库,并且从样本中确定24个bark标度临界频带上的中间分量与侧面分量的长期平均能量比率。然后将具有类似长期平均比率的连续频带分组在一起以形成该组临界频带。在其他实现中,滤波器将左输入声道和右输入声道分成少于或多于四个子带。频带范围可以是可调节的。频带划分器410将一对左子带分量xl(k)和右子带分量xr(k)输出至相应的l/r到m/s转换器420(k)。在每个频率子带k中,l/r到m/s转换器420(k)、中间/侧面处理器430(k)以及m/s到l/r转换器440(k)一起操作以在其相应的频率子带k中相对于非空间子带分量xn(k)(也称为“中间子带分量”)来增强空间子带分量xs(k)(也称为“侧面子带分量”)。具体地,每个l/r到m/s转换器420(k)接收给定频率子带k的一对子带分量xl(k)、xr(k),并且将这些输入转换成中间子带分量和侧面子带分量。在一个实施方式中,非空间子带分量xn(k)对应于左子带分量xl(k)与右子带分量xr(k)之间的相关部分,因此,包括非空间信息。此外,空间子带分量xs(k)对应于左子带分量xl(k)与右子带分量xr(k)之间的非相关部分,因此,包括空间信息。非空间子带分量xn(k)可以被计算为左子带分量xl(k)与右子带分量xr(k)的和,而空间子带分量xs(k)可以被计算为左子带分量xl(k)与右子带分量xr(k)之间的差。在一个示例中,l/r到m/s转换器420根据以下等式获得该频带的空间子带分量xs(k)和非空间子带分量xn(k):xs(k)=xl(k)-xr(k),针对子带k等式(1)xn(k)=xl(k)+xr(k),针对子带k等式(2)每个中间/侧面处理器430(k)相对于所接收的非空间子带分量xn(k)增强所接收的空间子带分量xs(k)以针对子带k生成增强的空间子带分量ys(k)和增强的非空间子带分量yn(k)。在一个实施方式中,中间/侧面处理器430(k)通过相应的增益系数gn(k)调整非空间子带分量xn(k),并且通过相应的延迟函数d[]延迟放大的非空间子带分量gn(k)*xn(k)以生成增强的非空间子带分量yn(k)。类似地,中间/侧面处理器430(k)通过相应的增益系数gs(k)调整所接收的空间子带分量xs(k),并且通过相应的延迟函数d延迟放大的空间子带分量gs(k)*xs(k)以生成增强的空间子带分量ys(k)。增益系数和延迟量可以是可调节的。增益系数和延迟量可以根据扬声器参数204确定,或者可以针对假定的一组参数值是固定的。每个中间/侧面处理器430(k)将非空间子带分量xn(k)和空间子带分量xs(k)输出至相应频率子带k的相应的m/s到l/r转换器440(k)。频率子带k的中间/侧面处理器430(k)根据以下等式生成增强的非空间子带分量yn(k)和增强的空间子带分量ys(k):yn(k)=gn(k)*d[xn(k),k],针对子带k等式(3)ys(k)=gs(k)*d[xs(k),k],针对子带k等式(4)下面的表1中列出了增益和延迟系数的示例。表1.中间/侧面处理器的示例配置每个m/s到l/r转换器440(k)接收增强的非空间分量yn(k)和增强的空间分量ys(k),并且将它们转换成增强的左子带分量yl(k)和增强的右子带分量yr(k)。假定l/r到m/s转换器420(k)根据上面的等式(1)和等式(2)生成非空间子带分量xn(k)和空间子带分量xs(k),m/s到l/r转换器440(k)根据以下等式生成频率子带k的增强的左子带分量yl(k)和增强的右子带分量yr(k):yl(k)=(yn(k)+ys(k))/2,针对子带k等式(5)yr(k)=(yn(k)-ys(k))/2,针对子带k等式(6)在一个实施方式中,等式(1)和等式(2)中的xl(k)和xr(k)可以互换,在这种情况下,等式(5)和等式(6)中的yl(k)和yr(k)也互换。频带组合器450根据以下等式将来自m/s到l/r转换器440的不同频带中的增强的左子带分量进行组合以生成左空间增强的音频声道yl,以及将来自m/s到l/r转换器440的不同频带中的增强的右子带分量进行组合以生成右空间增强的音频声道yr:yl=∑yl(k)等式(7)yr=∑yr(k)等式(8)尽管在图4的实施方式中,输入声道xl、xr被划分成四个频率子带,但是如上所述,在其他实施方式中,输入声道xl、xr可以被划分成不同数目的频率子带。图5示出了如由根据一个实施方式的子带空间音频处理器230执行的用于执行子带空间增强的示例算法。在一些实施方式中,子带空间音频处理器230可以并行地执行步骤、以不同顺序执行步骤、或者执行不同的步骤。子带空间音频处理器230接收包括输入声道xl、xr的输入信号。子带空间音频处理器230根据k(例如,k=4)个频率子带例如分别包括0至300hz、300z至510hz、510hz至2700hz和2700hz至奈奎斯特频率的子带将输入声道xl划分510成xl(k)子带分量,例如xl(1)、xl(2)、xl(3)、xl(4),以及将输入声道xr(k)划分510成子带分量,例如xr(1)、xr(2)、xr(3)、xr(4)。子带空间音频处理器230针对每个频率子带k对子带分量执行子带空间增强。具体地,子带空间音频处理器230例如根据上面的等式(1)和等式(2)针对每个子带k基于子带分量xl(k)、xr(k)生成515空间子带分量xs(k)和非空间子带分量xn(k)。另外,子带空间音频处理器230例如根据上面的等式(3)和等式(4)针对每个子带k基于空间子带分量xs(k)和非空间子带分量xn生成520增强的空间分量ys(k)和增强的非空间分量yn(k)。此外,子带空间音频处理器230例如根据上面的等式(5)和等式(6)针对子带k基于增强的空间分量ys(k)和增强的非空间分量yn(k)生成525增强的子带分量yl(k)、yr(k)。子带空间音频处理器230通过组合所有增强的子带分量yl(k)来生成530空间增强的声道yl,并且通过组合所有增强的子带分量yr(k)来生成空间增强的声道yr。图6示出了根据一个实施方式的串扰补偿处理器240的示例图。串扰补偿处理器240接收输入声道xl和xr,并且执行预处理以预补偿由串扰消除处理器260执行的后续串扰消除中的任何伪像。在一个实施方式中,串扰补偿处理器240包括左和右信号组合器610(也称为“l&r组合器610”)和非空间分量处理器620。l&r组合器610接收左输入音频声道xl和右输入音频声道xr,并且生成输入声道xl、xr的非空间分量xn。在所公开的实施方式的一方面,非空间分量xn对应于左输入声道xl与右输入声道xr之间的相关部分。l&r组合器610可以将左输入声道xl与右输入声道xr加起来以生成相关部分,该相关部分对应于如下面的等式所示的输入音频声道xl、xr的非空间分量xn:xn=xl+xr等式(9)非空间分量处理器620接收非空间分量xn,并且对非空间分量xn执行非空间增强以生成串扰补偿信号z。在所公开的实施方式的一方面,非空间分量处理器620对输入声道xl、xr的非空间分量xn执行预处理以补偿后续串扰消除中的任何伪像。可以通过仿真来获得后续串扰消除的非空间信号分量的频率响应曲线。另外,通过分析频率响应曲线,可以估计作为串扰消除的伪像发生的在频率响应图中超过预定阈值(例如,10db)的任何频谱缺陷例如峰或谷。这些伪像主要是由串扰消除处理器260中对延迟且反相的对侧信号与它们对应的同侧信号的求和产生的,从而有效地将类似梳状滤波器的频率响应引入最终的呈现结果。可以由非空间分量处理器620生成串扰补偿信号z以补偿所估计的峰或谷。具体地,基于在串扰消除处理器260中应用的特定延迟、滤波频率和增益,峰和谷在频率响应中上下移动,从而引起频谱的特定区域中的能量的可变放大和/或衰减。在一个实现中,非空间分量处理器620包括放大器660、滤波器670和延迟单元680来生成串扰补偿信号z以补偿串扰消除的估计的频谱缺陷。在一个示例实现中,放大器660将非空间分量xn放大增益系数gn,并且滤波器670对放大后的非空间分量gn*xn执行二阶峰值eq滤波器f[]。延迟单元680可以通过延迟函数d将滤波器670的输出延迟。滤波器、放大器和延迟单元可以以任何顺序级联布置。滤波器、放大器和延迟单元可以以可调节的配置(例如,中心频率、截止频率、增益系数、延迟量等)来实现。在一个示例中,非空间分量处理器620根据下面的等式生成串扰补偿信号z:z=d[f[gn*xn]]等式(10)如上面参照图2所描述的,用于对串扰消除进行补偿的配置可以例如根据下面作为第一查找表的下面的表2和表3通过扬声器参数204来确定:表2.用于小型扬声器(例如,输出频率范围在250hz至14000hz之间)的串扰补偿的示例配置表3.用于大型扬声器(例如,输出频率范围在100hz至16000hz之间)的串扰补偿的示例配置扬声器角度(°)滤波器中心频率(hz)滤波器增益(db)品质因数(q)1105018.00.251070012.00.42055010.00.45304508.50.45404007.50.45503357.00.45603006.50.45702666.50.45802506.50.45902336.00.451002106.50.451102007.00.451201907.50.451301858.00.45在一个示例中,对于特定类型的扬声器(小型/便携式扬声器或大型扬声器),可以根据两个扬声器280之间相对于收听者形成的角度来确定滤波器670的滤波器中心频率、滤波器增益和品质因数。在一些实施方式中,扬声器角度之间的值用于内插其他值。在一些实施方式中,非空间分量处理器620可以集成到子带空间音频处理器230(例如,中间/侧面处理器430)中,并且针对一个或更多个频率子带补偿后续串扰消除的频谱伪像。图7示出了由根据一个实施方式的串扰补偿处理器240执行的用于对串扰消除执行补偿的示例方法。在一些实施方式中,串扰补偿处理器240可以并行地执行步骤、以不同顺序执行步骤、或者执行不同的步骤。串扰补偿处理器240接收包括输入声道xl和xr的输入音频信号。串扰补偿处理器240例如根据上面的等式9生成710输入声道xl与xr之间的非空间分量xn。串扰补偿处理器240确定720用于执行如上面参照图6所描述的串扰补偿的配置(例如,滤波器参数)。串扰补偿处理器240生成730串扰补偿信号z以补偿应用于输入信号xl和xr的后续串扰消除的频率响应中的估计频谱缺陷。图8示出了根据一个实施方式的串扰消除处理器260的示例图。串扰消除处理器260接收包括输入声道tl、tr的输入音频信号t,并且对声道tl、tr执行串扰消除以生成包括输出声道ol、or(例如,左声道和右声道)的输出音频信号o。输入音频信号t可以从图2b的组合器250被输出。可替选地,输入音频信号t可以是来自子带空间音频处理器230的空间增强的音频信号y。在一个实施方式中,串扰消除处理器260包括:频带划分器810;反相器820a、820b;对侧估计器825a,825b;以及频带组合器840。在一种方法中,这些部件一起操作以将输入声道tl、tr划分成带内分量和带外分量,并且对带内分量执行串扰消除以生成输出声道ol、or。通过将输入音频信号t划分成不同的频带分量并且通过对选择性分量(例如,带内分量)执行串扰消除,可以针对特定频带执行串扰消除,同时避免其他频带中的劣化。如果在不将输入音频信号t划分成不同频带的情况下执行串扰消除,则在这样的串扰消除之后的音频信号可能在低频(例如,低于350hz)、更高频率(例如,高于12000hz)或者在这二者处的非空间分量和空间分量中表现出明显的衰减或放大。通过选择性地执行针对带内(例如,在250hz与14000hz之间)的串扰消除,在绝大多数有效的空间线索(cue)所在的位置处,可以保持在混音的频谱上平衡的总能量,特别是保持非空间分量中平衡的总能量。在一种配置中,频带划分器810或滤波器组将输入声道tl、tr分别划分成带内声道tl,in、tr,in和带外声道tl,out、tr,out。具体地,频带划分器810将左输入声道tl划分成左带内声道tl,in和左带外声道tl,out。类似地,频带划分器810将右输入声道tr划分成右带内声道tr,in和右带外声道tr,out。每个带内声道可以包含与包括例如250hz至14khz的频率范围相对应的相应的输入声道的一部分。频带范围可以是例如根据扬声器参数204可调节的。反相器820a和对侧估计器825a一起操作来生成对侧消除分量sl以补偿由于左带内声道tl,in引起的对侧声音分量。类似地,反相器820b和对侧估计器825b一起操作来生成对侧消除分量sr以补偿由于右带内声道tr,in引起的对侧声音分量。在一种方法中,反相器820a接收带内声道tl,in,并且将所接收的带内声道tl,in的极性反转以生成反相的带内声道tl,in'。对侧估计器825a接收反相的带内声道tl,in',并且通过滤波提取反相的带内声道tl,in'的与对侧声音分量相对应的部分。因为滤波是对反相的带内声道tl,in'执行的,所以由对侧估计器825a提取的部分变为带内声道tl,in的导致对侧声音分量的部分的反相。因此,由对侧估计器825a提取的部分变为对侧消除分量sl,该对侧消除分量sl可以被加至对方带内声道tr,in以减少由于带内声道tl,in引起的对侧声音分量。在一些实施方式中,反相器820a和对侧估计器825a以不同的顺序实现。反相器820b和对侧估计器825b执行关于带内声道tr,in类似的操作以生成对侧消除分量sr。因此,为了简洁起见,本文省略对其的详细描述。在一个示例实现方式中,对侧估计器825a包括滤波器852a、放大器854a和延迟单元856a。滤波器852a接收反相的输入声道tl,in',并且通过滤波函数f提取反相的带内声道tl,in'的与对侧声音分量相对应的部分。示例滤波器实现方式是具有选自5000hz与10000hz之间的中心频率和选自0.5与1.0之间的q的notch或highshelf滤波器。分贝增益(gdb)可以根据下面的公式得出:gdb=-3.0-log1.333(d)等式(11)其中,d是采样中延迟单元856a/b例如在48khz的采样率下的延迟量。替选实现方式是具有选自5000hz与10000hz之间的转角频率和选自0.5与1.0之间的q的低通滤波器。此外,放大器854a将所提取的部分放大相应的增益系数gl,in,并且延迟单元856a根据延迟函数d将来自放大器854a的放大后的输出延迟以生成对侧消除分量sl。对侧估计器825b对反相的带内声道tr,in'执行类似的操作以生成对侧消除分量sr。在一个示例中,对侧估计器825a、825b根据以下等式生成对侧抵消分量sl、sr:sl=d[gl,in*f[tl,in']]等式(12)sr=d[gr,in*f[tr,in']]等式(13)如上面关于图2a所描述的,串扰消除的配置可以例如根据下面作为第二查找表的下面的表4通过扬声器参数204确定:表4.串扰消除的示例配置扬声器角度(°)延迟(ms)放大器增益(db)滤波器增益10.00208333-0.25-3.0100.0208333-0.25-3.0200.041666-0.5-6.0300.0625-0.5-6.875400.08333-0.5-7.75500.1041666-0.5-8.625600.125-0.5-9.165700.1458333-0.5-9.705800.1666-0.5-10.25900.1875-0.5-10.51000.208333-0.5-10.751100.2291666-0.5-11.01200.25-0.5-11.251300.27083333-0.5-11.5在一个示例中,可以根据两个扬声器280之间相对于收听者形成的角度来确定滤波器中心频率、延迟量、放大器增益和滤波器增益。在一些实施方式中,扬声器角度之间的值用于内插其他值。组合器830a将对侧消除分量sr组合至左带内声道tl,in以生成左带内补偿声道cl,并且组合器830b将对侧消除分量sl组合至右带内声道tr,in以生成右带内补偿声道cr。频带组合器840将带内补偿声道cl、cr与带外声道tl,out、tr,out组合以分别生成输出音频声道ol、or。因此,输出音频声道ol包括对侧消除分量sr,该对侧消除分量sr与带内声道tr,in的导致对侧声音的部分的反相相对应,以及输出音频声道or包括对侧消除分量sl,该对侧消除分量sl与带内声道tl,in的导致对侧声音的部分的反相相对应。在这种配置中,由扬声器280r根据到达右耳处的输出声道or输出的同侧声音分量的波前可以抵消由扬声器280l根据输出声道ol输出的对侧声音分量的波前。类似地,由扬声器280l根据到达左耳处的输出声道ol输出的同侧声音分量的波前可以抵消由扬声器280r根据输出声道or输出的对侧声音分量的波前。因此,可以减少对侧声音分量以增强空间可检测性。图9示出了将由根据一个实施方式的串扰消除处理器260执行的执行串扰消除的示例方法。在一些实施方式中,串扰消除处理器260可以并行地执行步骤、以不同顺序执行步骤、或者执行不同的步骤。串扰消除处理器260接收包括输入声道tl、tr的输入信号。输入信号可以是来自组合器250的输出tl、tr。串扰消除处理器260将输入声道tl划分910成带内声道tl,in和带外声道tl,out。类似地,串扰消除处理器260将输入声道tr划分915成带内声道tr,in和带外声道tr,out。输入声道tl、tr可以通过如上面参照图8所描述的频带划分器810被划分成带内声道和带外声道。串扰消除处理器260例如根据上面的表4和等式(12)基于带内声道tl,in的导致对侧声音分量的部分生成925串扰消除分量sl。类似地,串扰消除处理器260例如根据表4和等式(13)基于带内声道tr,in的所识别的部分生成935导致对侧声音分量的串扰消除分量sr。串扰消除处理器260通过组合940带内声道tl,in、串扰消除分量sr和带外声道tl,out来生成输出音频声道ol。类似地,串扰消除处理器260通过组合945带内声道tr,in、串扰消除分量sl和带外声道tr,out来生成输出音频声道or。可以将输出声道ol、or提供至相应的扬声器以再现具有减少的串扰和改善的空间可检测性的立体声声音。图10和11示出了用于演示由串扰消除引起的频谱伪像的示例频率响应曲线。在一方面,串扰消除的频率响应呈现出梳状滤波器伪像。这些梳状滤波器伪像在信号的空间分量和非空间分量中呈现出反相的响应。图10示出了在48khz的采样率下采用1个采样延迟的串扰消除所产生的伪像。图11示出了在48khz的采样速率下采用6个采样延迟的串扰消除所产生的伪像。曲线1010是白噪声输入信号的频率响应;曲线1020是采用1个采样延迟的串扰消除的非空间(相关)分量的频率响应;以及曲线1030是采用1个采样延迟的串扰消除的空间(非相关)分量的频率响应。曲线1110是白噪声输入信号的频率响应;曲线1120是采用6个采样延迟的串扰消除的非空间(相关)分量的频率响应;以及曲线1130是采用6个采样延迟的串扰消除的空间(非相关)分量的频率响应。通过改变串扰补偿的延迟,可以改变在奈奎斯特频率以下发生的峰和谷的数目和中心频率。图12和13示出了用于演示串扰补偿效果的示例频率响应曲线。曲线1210是白噪声输入信号的频率响应;曲线1220是在没有串扰补偿的情况下采用1个采样延迟的串扰消除的非空间(相关)分量的频率响应;以及曲线1230是在串扰补偿的情况下采用1个采样延迟的串扰消除的非空间(相关)分量的频率响应。曲线1310是白噪声输入信号的频率响应;曲线1320是在没有串扰补偿的情况下采用6个采样延迟的串扰消除的非空间(相关)分量的频率响应;以及曲线1330是在串扰补偿的情况下采用6个采样延迟的串扰消除的非空间(相关)分量的频率响应。在一个示例中,串扰补偿处理器240将峰值滤波器应用于具有谷值的频率范围的非空间分量,并且针对另一频率范围将陷波滤波器应用于具有峰的频率范围的非空间分量,以如曲线1230和曲线1330所示使频率响应平坦化。因此,可以产生对中心平坦的音乐要素的更稳定的感知存在。其他参数例如串扰消除的中心频率、增益和q可以根据扬声器参数204通过第二查找表(例如,上面的表4)来确定。图14示出了用于演示改变图8中所示的频带划分器的转角频率的效果的示例频率响应。曲线1410是白噪声输入信号的频率响应;曲线1420是采用350hz至12000hz的带内转角频率的串扰消除的非空间(相关)分量的频率响应;以及曲线1430是采用200hz至14000hz的带内转角频率的串扰消除的非空间(相关)分量的频率响应。如图14所示,改变图8的频带划分器810的截止频率影响串扰消除的频率响应。图15和16示出了用于演示图8中所示的频带划分器810的效果的示例频率响应。曲线1510是白噪声输入信号的频率响应;曲线1520是在48khz采样率和350hz至12000hz的带内频率范围下采用1个采样延迟的串扰消除的非空间(相关)分量的频率响应;以及曲线1530是在没有频带划分器810的情况下针对整个频率在48khz采样率下采用1个采样延迟的串扰消除的非空间(相关)分量的频率响应。曲线1610是白噪声输入线号的频率响应;曲线1620是在48khz采样率和250hz至14000hz的带内频率范围下采用6个采样延迟的串扰消除的非空间(相关)分量的频率响应;以及曲线1630是在没有频带划分器810的情况下针对整个频率在48khz采样率下采用6个采样延迟的串扰消除的非空间(相关)分量的频率响应。通过在没有频带划分器810的情况下应用串扰消除,曲线1530在低于1000hz示出了显著的抑制并且在高于10000hz示出了纹波。类似地,曲线1630在低于400hz示出了显著的抑制并且在高于1000hz示出了纹波。通过实现频带划分器810并且对所选择的频带选择性地执行串扰消除,如曲线1520和曲线1620所示,可以减少低频区域(例如,低于1000hz)处的抑制和高频区域(例如,高于10000hz)处的波纹。在阅读本公开内容后,本领域技术人员将通过本文所公开的原理理解另外的替选实施方案。因此,虽然已经示出和描述了特定实施方式和应用,但是应当理解的是,所公开的实施方式不限于本文所公开的精确构造和部件。在不偏离本文所描述的范围的情况下,可以对本文所公开的方法和装置的布置、操作和细节进行将对本领域技术人员而言明显的各种修改、改变和变化。本文描述的任何步骤、操作或过程可以单独地或者与其他设备结合地执行或者使用一个或更多个硬件模块或软件模块实现。在一个实施方式中,软件模块使用包括含计算机程序代码的计算机可读介质(例如,非暂态计算机可读介质)的计算机程序产品实现,所述计算机程序代码可以由计算机处理器执行以用于执行所描述的步骤、操作或处理中的任一者或全部。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1