大量听众的声音再现的制作方法

文档序号:12822850阅读:262来源:国知局
大量听众的声音再现的制作方法与工艺

本公开涉及声音再现系统和方法。



背景技术:

有听力障碍的人经常会错失例如电视节目或电影的乐趣,因为他们无法理解节目材料中的对话。这些障碍可能足够显著而需要助听器,或他们可能较不严重且仅仅伴有与年龄相关联的轻微的听力损伤或听力损失。不管听力损失的原因如何,与其他人共享时间的乐趣可能会受显著影响。调高音量可能使同一区域中的其他人不舒服。一些个人与房间内其他人相比可能更喜欢较安静的收听体验。为单个人调低音量对于看电影的其他人来说可能不可接受。因此,需要用于大量听众的个人化的声音再现。



技术实现要素:

一种声音再现系统包括:扬声器布置,其被配置用来视声场位置控制信号而定在某一位置从定制的音频信号产生声学隔离的声场,以及听众评估块,其被配置用来提供表示听众的位置的收听位置信号和表示所述听众的身份的听众标识信号。所述系统进一步包括音频控制块,所述音频控制块被配置用来接收和处理所述收听位置信号、所述听众标识信号和音频信号;所述音频控制块被进一步配置用来视所述收听位置信号而定经由所述声场位置控制信号控制所述声场的所述位置,使得所述声场的所述位置处于所述听众的所述位置处,且根据音频设置视所述听众的所述身份而定处理所述音频信号以提供所述定制的音频信号。

一种声音再现方法包括视声场位置控制信号而定在某一位置从定制的音频信号产生声学隔离的声场,提供表示听众的位置的收听位置信号和表示所述听众的身份的听众标识信号,以及处理所述收听位置信号、所述听众标识信号和音频信号。所述方法进一步包括视所述收听位置信号而定经由所述声场位置控制信号控制所述声场的所述位置,使得所述声场的所述位置处于所述听众的所述位置处,以及根据音频设置视所述听众的所述身份而定处理所述音频信号以提供所述定制的音频信号。

在审查以下图式和详细描述后,其它系统、方法、特征和优点对本领域技术人员来说将为或将变得显而易见。希望所有这类额外系统、方法、特征和优点包括在这个描述内且受所附权利要求书保护。

附图说明

参看以下图式和描述可较好地理解系统和方法。图式中的组件未必按比例绘制,而是将重点放在说明本发明的原理上。此外,在图式中,相似的参考数字指示所有不同视图中的对应部分。

图1是图示具有四个收听位置和声音再现系统的示例性收听环境的示意图,所述声音再现系统为位于这些位置的听众提供个人化的声音再现。

图2是图示基于三个高阶扬声器组合件的示例性条形音箱的示意性俯视图,所述条形音箱用于在房间内的所要位置产生二维声场。

图3是图示图2中所示的条形音箱的示意性侧视图。

图4是图示具有两个收听位置和声音再现系统的另一示例性收听环境的示意图,所述声音再现系统为位于这些位置的听众提供个人化的声音再现。

图5是图示采用加权矩阵以进行矩阵化的示例性模态波束形成器的信号流程图。

图6是图示采用多输入多输出块以进行矩阵化的示例性模态波束形成器的信号流程图。

图7是图示用于姿势评估和任选收听位置评估的示例性光学检测器的示意图。

图8是图示为大量听众提供个人化的声音再现的示例性声音再现方法的图。

图9是图示图1中所示的示例性收听环境的修改的示意图;以及

图10是图示示例性远场麦克风系统的示意图。

具体实施方式

参看图1,示例性声音再现系统100使用个别地定制的音频波束形成来执行个人化的声音控制功能,诸如例如均衡调节、音量调节、动态范围压缩调节等中的一个或多个,所述个人化的声音控制功能为位于四个收听位置101-104的个别听众调节响度。“记住”那些调节(在以下内容中也称作音频设置)以用于未来参考,使得下一次系统可定位例如房间内的同一听众,并自动使用他的/她的定制声场,例如仅向他/她发送经过个别地调节的音频的声区。这得以在不使用头戴受话器或耳机的情况下实现。图1所示的示例性系统允许在四个收听位置101-104进行个别响度调节并包括扬声器布置105,扬声器布置105从定制的音频信号106产生三个声学隔离的声场(例如分别处于收听位置101、103和104处的声区107、108和109)和至少包括收听位置102的一般声区110,所述声学隔离的声场可以是从扬声器布置105定向至收听位置101、103和104的声束。可以借助声区位置控制信号111操纵声区的位置101-104。

声音再现系统100可以包括用于执行某些功能的各种块,其中块可以是硬件、软件或其组合。举例来说,听众评估块112、113和114(每个具有专用声音调节的听众一个)提供无线信号115,无线信号115包括表示每个具有专用声音调节的听众的位置的收听位置信号和识别每个被指定进行专用声音调节的听众的听众标识信号。声音再现系统100需要允许确定特定听众坐在例如房间内哪个位置的信息。这可以通过使用从房间的一侧扫描至另一侧的音调和靠近个别听众以识别扫描经过他们的时间的麦克风来实现。这类麦克风无线地连接至或通过线连接至其它系统组件,而且可以是例如设置在听众身上或听众附近的有线的独立麦克风(图1中未示出),或借助无线wi-fi或蓝牙连接集成在智能电话中的麦克风。当特定音调(诸如频率>16khz的听不见的音调)使用单独的定向声束116扫描房间时,至少一个麦克风检测在麦克风的位置处获得最大音量的时间;在那时可以定位特定听众。可以同时定位若干听众,只要他们具有其自己的清晰可辨识的和可分配的麦克风。在图1所示的示例性声音再现系统中,听众评估块112、113和114由具有内置麦克风的智能电话结合软件应用程序(app)提供,所述软件应用程序可以评估来自内置麦克风的信号,执行听众识别并建立无线连接。在另一选项中,具有内置麦克风的遥控可以提供听众识别并控制个别声区中的音频的个别调节。

然而,可以应用任何其它定位系统,诸如室内定位系统(ips)。室内定位系统是使用无线电波、磁场、声信号或由移动装置收集的其它感觉信息来定位建筑物内的物体或人的系统。示例性技术包括基于相机的监测、蓝牙位置服务或全球定位系统(gps)位置服务。室内定位系统可以使用不同的技术,包括与附近的锚节点(即,具有已知位置的节点,例如wifi接入点)的距离测量、磁性定位或航位推算。它们主动地定位移动装置或标记或提供将被感测的装置的环境位置或环境背景。室内定位系统可以利用各种技术,包括光学、无线电或甚至声学技术(即,来自其它系统的额外处理信息)来处理物理模糊并实现误差补偿。

一旦通过听众评估块112、113和114定位,听众接着可以将音频设置配置为他们的特定偏好。这个配置可以借助对声音再现系统100的手动控制或遥控,或借助智能电话、平板或计算机上的应用程序来实现。听众还可以配置声束的宽度以覆盖他们所坐的区域。接着可以通过声音再现系统100“记住”配置并使所述配置与用户的姓名或某一其它类型的标识相关联。在图1所示的声音再现系统中,示例性音频控制块117被设计用来接收和处理无线信号115,具体来说是其中含有的收听位置信号和听众标识信号,以及来自音频源119的音频信号118。音频控制块117接着可以视收听位置信号而定经由声场位置控制信号111控制声场的位置,使得声场的位置处于听众的位置处,且根据所调节的音频设置各自视对应的听众的身份而定来处理音频信号118以提供定制的音频信号106。然而,替代于追踪听众和重新定位声束,可以采用例如与固定收听位置相关的一个或多个固定声束。听众的身份可以对应于收听位置且可以从收听位置获得,或可以用任何其它合适的方式确定。

根据个别音频设置处理音频信号118可以包括以下中的至少一项:借助可控的均衡器120调节音频信号的频谱分量之间的平衡,借助可控的音量控制121调节音频信号的音量以及借助可控的动态范围压缩器122调节音频信号118的动态。均衡是调节电子信号内的频率分量之间的平衡的过程。然而,术语“均衡”(eq)出于实践或美学原因已包括对频率响应的调节,从而经常导致并非真正均衡的净响应。音量控制(vol)用于将声级调节为预定等级。动态范围压缩(drc)或仅仅压缩是通过使音频信号的动态范围变窄或压缩音频信号的动态范围来降低响亮的声音的音量和/或放大安静的声音的信号处理操作。举例来说,音频压缩可以降低在某一阈值以上的响亮的声音而使安静的声音不受影响。将定制的音频信号106(各自为相应地处理的音频信号118)供应至波束形成(bf)处理器123,波束形成(bf)处理器123又将经过波束形成的信号124供应至扬声器布置105以产生用于声区107-110的波束和扫描波束(即声场116)。

示例性音频控制块117可以进一步包括控制块(cu)125,控制块(cu)125连接至存储器(m)126、无线收发器(wt)127和波束扫描音调产生器(bs)128。存储器126存储表示大量听众的身份和对应的音频设置,以及任选地波束设置(诸如波束位置、波束宽度等)的数据。控制块125基于听众标识信号从存储器126中选择对应的音频设置以便处理音频信号118,并基于收听位置信号操纵对应的声束的方向。收听位置信号和听众标识信号由无线收发器127从无线信号115产生。波束扫描音调产生器128向波束形成处理器123提供用于扫描波束116的信号,而且也受控制块125控制。

音频控制块117可以进一步包括视频处理器(vp)129,视频处理器(vp)129连接至相机130,而且允许结合相机130辨识听众的姿势并根据所辨识的姿势控制处理音频信号118和配置相应声区(例如,对应声束的形状或宽度)中的至少一者。相机130定向至可包括听众的位置(即,收听位置101-104)的区域。听众可以从这个接口使用姿势来使声束变宽或变窄和/或将声束移动至左侧或右侧和/或动态地追踪个别区中的听众的移动。选择特定声束将允许用户调节那个声束的声音设置参数。这个接口还可允许较有经验的听众为对系统不熟悉的另一个较没经验的听众配置声束和相关的声音设置。另外,听众可能够提高在他的/她的“声束”内的音量以掩盖其它环境噪音,或降低他的/她的“声束”内的音量,使得他/她可以与坐在他/她旁边的某人进行对话,收听智能电话上的语音邮件等。

示例性声音再现系统可以设置在房间131内。如果特定听众离开房间131,那么系统可以停用对应的专用声束(例如,声束107-109中的一者)且普通声场(例如,由声束110所提供)将取代这个听众的波束形成区域,使得占用那个特定座位的下一个听众将听到在整个房间131的其余地方所听到的内容。也可以在不需要声区时使用普通声场。当特定听众重新进入房间131时,可以重新启用对应的专用声束。听众可以选择在欣赏节目的同时调节配置参数,以及删除那些参数或将那些参数保存为他们的新的个人默认值。听众的配置信息可以由系统存储并例如通过听众的用户名或面部辨识数据(如果采用相机的话)来识别。举例来说,下一次这个听众在与扬声器布置105相关联的屏幕132上看电影时,他/她可以选择他的/她的配置并在他的/她的当前座位立即恢复相关联的定制声束。系统可以在听众进入房间131时例如经由入侵防护系统(ips)和智能电话接近来识别他/她,并自动加载定制的配置。

如已经提到,声场可以借助波束形成,例如声束107-110和116而产生。波束形成或空间滤波是用于扬声器或麦克风阵列中以用于定向信号发射或接收的信号处理技术。这通过将元件以一种方式组合在相控阵列中而实现,在所述方式中特定角度下的信号经历相长干涉而其它信号经历相消干涉。与全向接收/发射相比的改进称作元件的指向性。

声场也可以使用声场描述借助称作高阶环境立体学声的技术实现。环境立体学声是除了水平平面之外还可覆盖听众上方和下方的声源的球形环绕声技术。不同于其它多声道环绕格式,其传输声道不携载扬声器信号。替代地,它们含有声场的扬声器独立表示,其接着被解码为听众的扬声器设置。这就用于回放的扬声器的布局和数目来说向听众提供了相当大的灵活程度。可以将环境立体学声理解为中/侧(m/s)立体声的三维扩展,加上高度和深度的不同的额外声道。就一阶环境立体学声来说,所得信号集称作b格式。一阶环境立体学声的空间分辨率相当低。实际上,这个转化为略微模糊的源,而且也转化为比较小的可使用的收听区域(也称作甜蜜点或甜蜜区域)。

通过将更多选择性的定向分量的群组添加至b格式,分辨率可以增大且所要声场(也称作声区)扩大。就二阶环境立体学声来说,这些不再对应于常规麦克风极性图案,而是看起来像例如三叶草叶片。所得信号集接着称作二阶、三阶或总地来说高阶环境立体学声(hoa)。然而,视处理的是二维(2d)还是三维(3d)声场而定,hoa技术的常见应用需要特定空间配置而不管对声场进行了测量(编码/写码)还是再现(解码):2d声场的处理需要圆柱形配置且3d声场的处理需要球形配置,每一配置具有麦克风或扬声器的规则或准规则分布,以便将实现某一阶所必要的传感器数目保持为尽可能小的。

图2和3图示了声音再现系统200,其包括三个(或适当时仅两个)紧密间隔的可操纵的(高阶)扬声器组合件201、202、203,扬声器组合件201、202、203在此处例如按水平线性阵列布置(其在本文中称作高阶条形音箱)。具有全向指向性特性、偶极指向性特性和/或任何高阶极性响应的扬声器组合件在本文中也称作高阶扬声器。每一高阶扬声器201、202、203具有可调节的、可控的或可操纵的指向性特性(极性响应),如下文进一步概述。每一高阶扬声器201、202、203可以包括低阶扬声器的水平圆形阵列(例如,全向扬声器)。举例来说,圆形阵列可以各自包括例如四个低阶扬声器211至214、221至224、231至234(诸如常见扬声器且因此也称作扬声器),在这个实例中,四个低阶扬声器211至214、221至224、231至234各自定向于径向平面内的四个垂直方向中的一个方向上。高阶扬声器201、202、203的阵列可以设置在任选底板204上且在顶部可以具有任选顶板301(例如,以承载平面屏幕电视机)。或者,替代于四个低阶扬声器,每个高阶扬声器组合件可以仅采用三个低阶扬声器以使用环境立体学声技术形成一阶的二维高阶扬声器。

替代地使用多输入多输出技术以代替环境立体学声技术允许甚至借助仅仅两个低阶扬声器来形成一阶的二维高阶扬声器。其它选项包括借助规则地分布在球面上的四个低阶扬声器(例如,安装在四面体的四个面的中心,四面体是总共五个正多面体的第一代表)使用环境立体学声技术和借助规则地分布在球面上的四个低阶扬声器使用多输入多输出技术形成三维高阶扬声器。此外,高阶扬声器组合件可以不是按直线而是按距彼此成对数改变的距离布置在例如任意曲线上或以完全任意的三维布置而布置在房间内。

四个低阶扬声器211至214、221至224、231至234必须为基本上相同大小,且具有外围前表面,以及具有空心的圆柱形主体和端盖的外壳。圆柱形主体和端盖可以由不透空气的材料制成。圆柱形主体可以在其中包括开口。开口可以被设计大小和形状以对应于低阶扬声器211至214、221至224、231至234的外围前表面,且具有中心轴线。开口的中心轴线可以包含在一个径向平面内,且相邻轴线之间的角度可以相同。低阶扬声器211至214、221至224和231至234可以设置在开口中且密封地紧固至圆柱形主体。然而,额外扬声器可以设置在一个以上这类径向平面内,例如设置在上述径向平面上方和/或下方的一个或多个额外平面内。任选地,低阶扬声器211至214、221至224、231至234各自可以在单独的声学封闭的体积215至218、225至228、235至238中操作,以便减少或甚至防止特定高阶扬声器组合件的低阶扬声器之间的任何声交互。另外,低阶扬声器211至214、221至224、231至234可以各自布置在凹痕、孔、凹口等中。另外或替代地,波导结构(诸如但不限于喇叭、倒喇叭、声学透镜等)可以布置在低阶扬声器211至214、221至224、231至234前方。

控制块240接收例如三个环境立体学声信号244、245、246以根据操纵信息247处理环境立体学声信号244、245、246,并基于环境立体学声信号244、245、246驱动和操纵高阶扬声器201、202、203,使得视操纵信息而定至少在一个位置产生至少一个声场。控制块240包括驱动低阶扬声器211至214、221至224、231至234的波束形成器块241、242、243。下文进一步描述波束形成器块的实例。

图4示出如何使用高阶扬声器的水平线性阵列(本文中也称作水平高阶条形音箱或仅仅高阶条形音箱)以便在家庭娱乐中实现虚拟声源的可能性。举例来说,这样的线性阵列可以设置在电视(tv)机下方以用于再现例如家庭影院的常用布局的前声道,5.1环绕声。5.1音响系统的前声道包括前置左(lf)声道、前置右(rf)声道和中置(c)声道。将单个高阶扬声器替代于水平高阶条形音箱布置在tv机下方将意谓c声道可以定向至tv机的前方且lf和rf声道可以定向至其侧面,使得lf和rf声道将不会直接传送至坐在tv机前方的听众(在甜蜜点或甜蜜区域),而只是经由侧壁间接地传送,从而构成传送路径,传送路径视众多未知参数而定,且因此可能很难被控制。因此,在具有至少两个将要被再现的声道的多声道系统中,具有(至少)两个按水平线布置的高阶扬声器的高阶条形音箱允许直接传送前声道(例如,lf和rf声道)直接至甜蜜区域,即听众应该在的区域。

此外,中置声道(例如,c声道)可以借助两个高阶扬声器在甜蜜区域再现。替代地,设置在两个高阶扬声器之间的第三个高阶扬声器可用以单独地将lf和rf声道以及c声道定向至甜蜜区域。由于对于三个高阶扬声器,每个声道由单独的块再现,因此可以进一步改进处于甜蜜区域的听众的空间声音印象。此外,对于添加至高阶条形音箱的每个额外高阶扬声器,可以实现较扩散的声音印象且其它声道(诸如,例如效果声道)可以从高阶条形音箱的后侧辐射,此在本实例中为从tv机的后侧到例如后壁,由效果声道提供的声音在后壁处扩散。

与其中低阶扬声器成一直线布置的常见条形音箱相比,高阶条形音箱对定向声源(例如)在侧面和后方的定位提供更多选项,使得在常见的收听环境(诸如起居室)中,可借助高阶条形音箱实现始终与空间方向无关的指向性特性。举例来说,具有在70cm的距离内成一直线等距离地分布的十四个低阶扬声器的常见侧栏仅可在距离前方方向最大±90°(度)的区域内产生虚拟声源,而高阶条形音箱允许在±180°的区域内产生虚拟声源。

图4图示了关于包括三个高阶扬声器410、411、422的高阶条形音箱的示例性设置。音频控制块401驱动目标房间413(例如,常见起居室)内的三个高阶扬声器410、411、422,音频控制块401接收一个或多个音频信号402且包括控制块,诸如图2所示的控制块240。在由处于甜蜜点414处的麦克风阵列表示的收听位置(甜蜜点、甜蜜区域)处,可接着产生至少一个所要虚拟源的声场。在目标房间413内,布置了其它高阶扬声器,例如用于左环绕(ls)声道的高阶扬声器424、用于低频效应(sub)声道的低阶重低频扬声器423,和用于右环绕(rs)声道的高阶扬声器412。目标房间413在声学上非常不利,因为它在左侧墙壁中包括窗户417和法式门418且在右侧墙壁中包括门419,其呈不平衡的配置。此外,沙发421设置在右侧墙壁处且大致延伸至目标房间413的中心且桌子420布置在沙发421前方。

电视机416布置在前方墙壁处(例如,在高阶条形音箱上方)且在沙发421的视线中。前置左(lf)声道高阶扬声器410和前置右(rf)声道高阶扬声器411布置在电视机416的左侧角落和右侧角落下方且中置(c)高阶扬声器422布置在电视机416的中间下方。低频效应(sub)声道扬声器423设置在前方墙壁与右侧墙壁之间的角落处。后方墙壁上的扬声器布置(包括左环绕(ls)声道高阶扬声器424和右环绕(rs)声道高阶扬声器412)与前方墙壁上的扬声器布置(包括前置左(lf)声道扬声器410、前置右(rs)声道扬声器411和低频效应(sub)声道扬声器423)并不共享同一中心线。示例性甜蜜区域414可以在沙发421上,而桌子420和电视机416在前方。如可见,图4所示的扬声器设置并不基于圆柱形或球形基本配置且不采用规则分布。在图4所示的示例性设置中,甜蜜区域414和425可以从条形音箱接收直接声束以在那些甜蜜区域414和425允许预置的个别声音印象。

如果在甜蜜区域后面和在后方墙壁前方或条形音箱的水平面上方某处(未示出)使用其它(高阶)扬声器,例如用于环绕声道ls和rs,那么可以进一步增强环绕印象。此外,已发现可显著减少(低阶)扬声器的数目。举例来说,在甜蜜区域周围有五个4阶虚拟源的情况下,声场可以近似地类似于借助甜蜜区域周围的四十五个低阶扬声器,或在图4所示的示例性环境中,借助具有三个高阶扬声器的高阶条形音箱实现的声场,高阶条形音箱由总共十二个低阶扬声器建立,且与具有成一直线的十四个低阶扬声器的常见条形音箱相比展现较好的空间声音印象,两个条形音箱的尺寸相当。

对于条形音箱的高阶扬声器(和其它高阶扬声器)中的每一者,可以采用如图5或6中所示的波束形成器块500或600(例如,可应用为图2和3中的波束形成器241、242、243)。图5所示的波束形成块500视n个(环境立体学声)输入信号502而定控制具有q个扬声器501的扬声器组合件(或q个扬声器群组,每一群组具有大量扬声器,诸如高频扬声器、中频范围扬声器和/或低频扬声器),输入信号502也称作输入信号x(n)或环境立体学声信号其中对于二维n是n2d=(2m+1)且对于三维n3d=(m+1)2。波束形成块500可以进一步包括模态加权子块503、动态波场操控子块505、正则化子块509和矩阵化子块507。向模态加权子块503供应输入信号502[x(n)],在模态加权子块503中用模态加权系数(即,滤波系数c0(ω),c1(ω)…cn(ω))对输入信号502进行加权以基于n个球谐函数提供所要波束图案,即辐射图案从而递送n个经过加权的环境立体学声信号504,也称作通过动态波场操控子块505使用n×1加权系数对经过加权的环境立体学声信号504进行变换,例如以将所要波束图案旋转至所要位置因此,通过动态波场操控子块505输出n个经过修改的(例如,经过旋转的、经过聚焦的和/或经过缩放的)且经过加权的环境立体学声信号506,也称作

接着将n个经过修改的且经过加权的环境立体学声信号506输入至正则化子块509中,正则化子块509包括正则化的径向均衡滤波器以用于考虑回放装置高阶扬声器(hol)的易感性,从而防止例如给定白噪声增益(wng)阈值被削弱。接着通过矩阵化子块507使用如图5所示的n×q加权矩阵例如通过伪逆y+=(yty)-1yt将正则化子块509的输出信号510变换为q个扬声器信号508[y1(n),…,yq(n)],如果q个低阶扬声器以规则方式布置在高阶扬声器的主体处,那么所述伪逆简化为替代地,可通过多输入多输出子块601使用如图6中所示的n×q滤波矩阵从n个正则化的、经过修改的且经过加权的环境立体学声信号510产生q个扬声器信号508。图5和6所示的系统可用以使用声场描述(诸如高阶环境立体学声)实现二维或三维音频。

简单的环境立体学声声相调节器(panner)(或解码器)采用输入信号,例如源信号s和两个参数,即水平角θ和仰角它通过在具有不同增益的环境立体学声分量内针对对应的环境立体学声信号分布信号来按所要角度定位源:

作为全向的,w声道始终递送相同信号,而不管收听角度如何。为了使其可具有与其它声道差不多相同的平均能量,使w衰减w,即约3db(精确地说,除以二的平方根)。x、y、z的项可产生八字形的极性图案。在角度θ和下取其所要加权值,且将结果乘以对应的环境立体学声信号(x,y,z),输出总和现在以指向所要方向的八字形辐射图案结束,所述输出总和由方位角θ和仰角给出,用于计算加权值x、y和z,且具有可处理用w加权的w分量的能量含量。可组合b格式分量以导出可处理任何三维方向上的任何一阶极性图案(全向的、心形、超心形、八字形或介于其之间的任何图案)和点的虚拟辐射图案。可以同时导出具有不同参数的若干这类波束图案以形成重合的立体声对或环绕阵列。类似于上文结合图2至图4所描述的高阶扬声器或扬声器组合件(包括诸如图5和图6所示的波束形成器块)允许通过叠加基本函数(即,球谐函数)而近似任何所要指向性特性。

矩阵化块601可以实施为多输入多输出系统,所述系统提供对高阶扬声器的输出信号的调节,使得辐射图案尽可能地近似所要球谐函数。为了在利用若干高阶扬声器的房间内的某个位置或区域产生所要声场,在调适过程中仅仅调适所采用的个别高阶扬声器的模态权数(即,在波域中直接进行调适)可能为足够的。因为声场(波场)域中的这个调适,这个过程称作波域自适应滤波(wdaf)。wdaf是同样已知的频域自适应滤波(fdaf)的已知的有效的时空一般化。通过并入有声场的数学基础,wdaf甚至适合于具有高度交叉相关的宽带输入信号的大量多输入多输出系统。借助波域自适应滤波,自适应地确定高阶扬声器的方向特性,使得甜蜜区域中的个别声束的叠加近似所要声场。

为了按照特定房间条件和扬声器设置(其包括高阶条形音箱和可能其它(高阶)扬声器)的甜蜜区域的特定要求来调节或(特别地或永久地)调适由条形音箱再现的声音,需要测量和量化声场。这可以借助麦克风的阵列(麦克风阵列)和能够对给定声场进行解码的信号处理块实现,麦克风的阵列和信号处理块例如形成高阶环境立体学声系统以确定三维下的声场,或,这在许多情况下可能为足够的,确定二维下的声场,这需要较少麦克风。对于二维声场的测量,需要s个麦克风来测量高达m阶的声场,其中s≥2m+1。相比之下,对于三维声场,需要s≥(2m+1)2个麦克风。此外,在许多情况下,将麦克风(等距离地)设置在圆形线上为足够的。麦克风可以设置在刚性的或开放的球体或圆柱体上,且在需要时可以结合环境立体学声解码器操作。在替代实例中,处于甜蜜点414处的麦克风阵列可以集成在高阶扬声器(未示出)中的一者中。类似于甜蜜点414处的麦克风阵列的麦克风阵列可以设置在甜蜜点425处。甜蜜点414和425处的麦克风或麦克风阵列可以用于定位甜蜜点414和425处的听众。

相机(诸如图1所示的相机130)不仅可用以辨识听众的姿势,而且可用以检测听众的位置并通过操纵高阶扬声器的方向来重新定位声区。图7中示出示例性光学检测器。如所示,具有镜头702的相机701可以设置在镜像半球703上方(或下方)的适当距离处,其中镜头702指向半球703的弯曲的镜像表面,而且可以在水平平面内提供360°视野704。举例来说,当这种检测器安装(例如)在房间的天花板上时,可以发现在房间内任何地方的听众的位置。替代地,可以使用在水平平面内也提供360°视野的所谓的鱼眼镜头(作为镜头702),使得可以省略镜像半球703。

图8示出示例性声音再现方法,其中视声场位置控制信号而定在某一位置从定制的音频信号产生声学隔离的声场(程序801)。提供表示听众的位置的收听位置信号和表示听众的身份的听众标识信号(程序802)。处理收听位置信号、听众标识信号和音频信号以提供定制的音频信号(程序803),从而视收听位置信号而定经由声场位置控制信号控制声场的位置,使得声场的位置处于听众的位置处(程序804),且根据音频设置视听众的身份而定处理音频信号以提供定制的音频信号(程序805)。

上述技术使用个别定制的音频波束形成来执行(基本的)声音设置功能,所述功能为个别听众调节(例如)某些频率的响度。将“记住”那些调节以用于未来参考,使得下一次那个个人坐下来时,系统可以在房间内定位那个人,并自动使用他们定制的“声束”,所述定制的“声束”仅向那个听众发送经过调节的音频。这都可在不使用头戴受话器或耳机的情况下实现。

通过使用例如高阶扬声器的阵列(例如,呈高阶条形音箱的形式),高阶扬声器中的每一者具有通用指向性,可甚至在反射性场地(诸如通常安装了家庭音频系统的起居室)近似任意声场。这是可能的,因为可因为使用高阶扬声器而形成通用指向性,从而仅在无反射表面存在的方向上辐射声音,或在证明某些反射积极地促成将被近似的所要的包络声场的形成时故意利用这些反射。因此,在目标房间内的所要位置(例如,在起居室的长沙发椅处的某个区)的所要声场的近似可以通过使用(例如)由多样fxlms滤波输入最小均方(多样fxlms)算法给出的自适应方法(诸如自适应多输入多输出(mimo)系统)来实现,所述算法不仅可在时域或谱域中操作,而且可在所谓的波域中操作。

利用波域自适应滤波(wdaf)令人特别感兴趣,因为这在所要声场的近似方面保证非常好的结果。如果记录装置实现某些要求,那么可以使用wdaf。举例来说,在表面配备有规则地或准规则地分布的麦克风的圆形(针对2d)或球形麦克风阵列(3d)可以用以记录声场,从而视必须记录的声场的所要次序而定分别再现了必须被相应地选择的最小数目的麦克风。然而,如果使用例如mimo系统计算波束形成滤波,那么具有不同形状和麦克风分布的任意麦克风阵列也可以用以测量声场,从而导致记录装置的高灵活性。记录装置可以集成在完整的新的声学系统的主块中。因此,它不仅可用于已经提到的记录任务,而且可用于其它所需目的,诸如使声学系统的语音控制能够口头地控制例如音量、标题的切换等等。此外,麦克风阵列所附接至的主块也可用作独立装置,例如作为电话会议集线器或作为便携式音乐装置,其能够依靠听众与装置的相对位置而调节声音,这只有在视频相机也集成在主块中时才为可能的。

具有可调节的、可控的或可操纵的指向性特性的扬声器布置包括至少两个相同的或类似的扬声器,所述扬声器可以布置在一个、两个或两个以上扬声器组合件中,例如,一个扬声器组合件具有两个扬声器或两个扬声器组合件各自具有一个扬声器。扬声器组合件可以分布在例如房间内的显示器周围的某个地方。借助于高阶扬声器的阵列,有可能形成具有相同质量的声场,但与普通扬声器相比使用的装置较少。高阶扬声器的阵列可以用以在真实的,例如反射性环境中形成任意声场。

参看图9,图1所示的系统可以被更改以使用麦克风阵列901以作为相机130的替代物(或外加相机130),麦克风阵列901位于例如扬声器布置105处且能够检测声音的到达方向(doa)。扬声器布置105可以具有大量定向麦克风和/或可以包括(麦克风)波束形成功能。智能电话112、113和114可以具有能够发送听不见的音调902、903和904的扬声器,所述音调902、903和904由麦克风阵列901拾取。麦克风阵列901可以是远场麦克风系统的一部分且结合doa处理块905识别音调来自的方向,doa处理块905取代图1所示的无线收发器127。音调可以进一步包括允许识别与特定智能电话相关联的听众的信息。举例来说,音调的不同频率可以与不同听众相关联。也可以使用经过相应地调适的遥控块以代替智能电话。此外,音调还可包括关于相关联的听众的特定声音设置的信息或更改对应的声音设置的指令。如果与语音辨识块906耦合,那么麦克风阵列901允许在听众在收听位置中的一个位置处讲话时检测个别听众或收听位置。因此,如果利用不同关键字(例如,用户的姓名),那么在房间131内的任何声区处可获得经过个别地调节的音频。语音辨识可以进一步用以更改对应的声音设置。

参看图10,在可应用于图9所示的系统中的示例性远场麦克风系统中,来自所要声源1007的声音经由一个扬声器或多个扬声器而辐射,行进通过借助对应的房间脉冲响应(rir)1001对所述声音进行滤波所在的房间,且可最终在对应的信号被远场麦克风系统的m个麦克风1011拾取之前被噪声破坏。图10所示的远场麦克风系统进一步包括声学回声消除(aec)块1002、随后的固定波束形成器(fb)块1003、随后的波束操纵块1004、随后的自适应阻塞滤波器(abf)块1005、随后的自适应干扰消除器块1006,和随后的自适应后置滤波器块1010。如从图10中可见,通过rir(h1,…,hm)滤波且最终被噪声覆盖的n个源信号用作aec块1002的输入。固定ds波束形成器块1003的输出信号用作波束操纵(bs)块1004的输入bi(n),其中i=1,2,…b。来自固定波束形成器块1003的每一信号来自不同的房间方向且可具有不同的snr等级。

bs块1004递送表示固定波束形成器块1003的指向房间方向的具有最佳/最高当前snr值的信号的输出信号b(n)(称作正波束)和表示固定波束形成器块1003的具有最小/最低snr值的当前信号的信号bn(n)(称作负波束)。自适应阻塞滤波器(abf)块1005基于这两个信号b(n)和bn(n)计算输出信号e(n),输出信号e(n)理想地仅含有当前噪声信号,而不再含有有用的信号部分。表达“自适应阻塞滤波器”来自于其目的,其按自适应方式阻塞负波束的信号bn(n)中仍然含有的有用的信号部分。输出信号e(n)与任选地通过延迟(d)线1008得到的表示正波束的延迟信号b(n-γ)一起进入aic块1006,aic块1006从结构角度还包括减法器块1009。aic块1006基于这两个输入信号e(n)和b(n-γ)产生输出信号,所述输出信号一方面用作相继的自适应后置滤波器(pf)块1010的输入信号,且另一方面被反馈至aic块1006,从而用作调适过程的误差信号,调适过程也采用aic块1006。这个调适过程的目的在于从延迟的正波束信号产生信号,所述信号在从延迟的正波束信号减去时主要减小谐波噪声信号。另外,aic块1006还产生用于自适应pf块1010的随时间变化的滤波器系数,自适应pf块1010被设计用来从减法器块1009的输出信号主要去除统计噪声分量并最终产生总输出信号y(n)。

已出于说明和描述的目的呈现了对实施方案的描述。可鉴于以上描述对实施方案执行合适的修改和变化。所描述的组合件、系统和方法本质上是示例性的,且可包括额外元件或步骤和/或省略元件或步骤。如本申请中所使用,以单数叙述且接在单词“一”之后的元件或步骤应理解为不排除多个所述元件或步骤,除非声明此排除。此外,对本公开的“一个实施方案”或“一个实例”的提及无意解释为排除也并入有所述特征的额外实施方案的存在。术语“第一”、“第二”和“第三”等仅用作标签,且无意对其对象施加数字要求或特定位置次序。单个流程图可以视实现的类型而定将系统、方法或实施所述方法的软件描述(例如)为硬件、软件或其组合。可以将块实施为硬件、软件或其组合。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1