基于系统状态来调节音频波束形成设置的制作方法

文档序号:2827167阅读:120来源:国知局
基于系统状态来调节音频波束形成设置的制作方法
【专利摘要】音频波束形成是一种技术,其中对从两个或更多个麦克风接收的声音进行组合以从背景噪声隔离声音。存在多种音频波束形成空间方向图。方向图可以随时间是固定的或自适应的,甚至可以随频率而变化。不同的方向图可针对不同类型的声音实现不同程度的成功。为了改善音频波束形成的性能,一种系统可基于所检测到的运行应用和/或设备设置来选择模式波束方向图。该系统可使用模式波束方向图来配置音频波束形成算法。可以使用经配置的音频波束形成算法从多个音频信号生成经处理的音频数据。该系统然后可向运行应用发送经处理的音频数据。
【专利说明】基于系统状态来调节音频波束形成设置
[0001]相关申请的交叉引用
[0002]本申请要求2012年6月8日提交的名称为“ADJUSTING AUD1 BEAMFORMINGSETTINGS BASED ON SYSTEM STATE”(基于系统状态调节音频波束形成设置)的美国临时专利申请N0.61/657,624的权益,该美国临时专利申请全文以引用方式并入本文。

【技术领域】
[0003]本公开涉及音频波束形成,更具体地,涉及基于系统状态调节音频波束形成设置。

【背景技术】
[0004]运行于计算设备上的许多应用涉及需要音频输入的功能。遗憾的是,在典型的环境条件下,由于存在各种背景声音,单个麦克风对感兴趣声音的捕获可能并不理想。为了解决这一问题,许多计算设备常依赖于噪声降低、噪声抑制、和/或噪声消除技术。改善信噪比的一种常用技术是音频波束形成。
[0005]音频波束形成是一种技术,其中组合从两个或更多个麦克风接收的声音以便使得能够优先捕获来自特定方向的声音。使用音频波束形成的计算设备可包括连接到处理器的两个或更多个密集分布的全向麦克风的阵列。于是处理器可组合由不同麦克风捕获的信号以生成单个输出,以便将声音与背景噪声隔离开。例如,在延迟求和波束形成中,每个麦克风独立地接收声音信号,并且对接收的声音信号求和以确定声音的方向角。当信号源自垂直于阵列的信号源时,实现最大的输出振幅。即,当声源垂直于阵列时,信号全都同时到达,并且因此高度相关。然而,如果声源不垂直于阵列,则信号将在不同时间到达,并且因此将不太相关,这将导致更小的输出振幅。各种声音的输出振幅使得可能辨识从与感兴趣声音方向不同的方向到达的背景声音。
[0006]存在多种不同的麦克风形状,并且每种形状都具有不同的噪声降低能力。因此,存在多种音频波束形成空间响应方向图。方向图可随时间是固定的或自适应的,甚至可随频率而变化。然而,不同方向图对于不同类型的声音实现的成功水平不同,这可能导致非最优效果。


【发明内容】

[0007]本公开的附加特征和优点将在随后的描述中进行阐述,并且部分地将从该描述显而易见,或者可以通过实践本文所公开的原理而获知。本公开的特征和优点可借助于所附权利要求中特别指出的器械和组合来实现并获得。本公开的这些和其他特征将通过以下描述和所附权利要求变得更加充分地明显,或者可以通过本文所阐述的原理的实践而获知。
[0008]本发明公开了用于基于系统状态配置音频波束形成设置的系统、方法和非暂态计算机可读存储介质。音频波束形成算法可具有多个不同设置,包括模式和/或波束方向图。为了改善噪声降低效果,可基于计算设备的当前状态配置音频波束形成算法。为了配置音频波束形成设置,计算系统可检测预先确定的积极运行的应用,诸如语音输入应用、语音识别应用、音频通信应用、视频聊天应用、音频录制应用、或音乐播放应用。此外,在一些情况下,该系统可检测至少一个预先确定的设备设置,诸如风扇速度、当前音频路由、或麦克风和扬声器放置的配置。
[0009]基于所检测到的应用和/或设备设置,该系统可选择模式波束方向图。模式波束方向图可指定模式,诸如固定或自适应。此外,模式波束方向图可指定波束方向图,诸如全向、心形、超心形、亚心形、或8字形。该系统可使用模式波束方向图来配置音频波束形成算法。例如,波束形成器可基于模式波束方向图中指定的值加载模式和/或波束方向图。在配置波束形成算法之后,该系统可利用波束形成算法处理从阵列麦克风接收的音频数据。该系统可向运行的应用发送经处理的数据。在一些实施例中,在向运行的应用发送经处理的数据之前,该系统可应用噪声抑制算法。在一些情况下,也可基于所检测到的运行的应用和/或至少一个预先确定的设备设置来配置噪声抑制算法。

【专利附图】

【附图说明】
[0010]为了描述可获得本公开的上述和其他优点及特征的方式,将通过参考附图中示出的具体实施例来呈现以上简述的原理的更为具体的描述。理解这些附图仅示出了本公开的示例性实施例,并且因此不被视为是对本公开范围的限制,将通过使用附图以另外的特异性和细节来描述和解释本文的原理,其中:
[0011]图1示出了一种示例性系统实施例;
[0012]图2示出了一种具有麦克风阵列的示例性计算设备;
[0013]图3示出了示例性空间响应方向图;
[0014]图4示出了一种示例性音频波束形成器配置过程;
[0015]图5示出了系统信息的四种示例性表示;
[0016]图6不出了一种不例性混合式固定-自适应波束方向图方案;以及
[0017]图7示出了一种示例性方法实施例。

【具体实施方式】
[0018]下面详细论述本公开的各个实施例。虽然论述了具体实施例,但应当理解这仅仅为了说明目的而进行。相关领域的技术人员将认识到,在不脱离本公开的实质和范围的情况下可以使用其他组件和配置。
[0019]本公开解决了在本领域中针对改善音频信号处理以从背景噪声隔离声音的需求。利用本发明的技术,可通过基于计算设备的一个或多个属性值调节音频波束形成算法来改善噪声降低效果。在返回到音频波束形成的更详细描述之前,本公开首先阐述了可用于实践本文所公开的概念的图1中的基本通用系统或计算设备的论述。
[0020]参照图1,示例性系统100包括通用计算设备100,所述通用计算设备100包括处理单元(CPU或处理器)120以及将各种系统组件耦接到处理器120的系统总线110,这些系统组件包括诸如只读存储器(ROM) 140和随机存取存储器(RAM) 150的系统存储器130。系统100可包括直接与处理器120连接的、与处理器120紧邻的、或作为处理器120整体的一部分的高速缓存122。系统100将数据从存储器130和/或存储设备160复制到高速缓存122,用于处理器120快速访问。通过这种方式,高速缓存122提供避免处理器120在等待数据时延迟的性能提升。这些和其他模块可以控制或被配置为控制处理器120以执行各种动作。其他系统存储器130也可供使用。存储器130可包括具有不同性能特性的多个不同类型的存储器。可以理解,本公开可以在具有不止一个处理器120的计算设备100上或者在联网在一起以提供更大处理能力的计算设备的群组或群集上操作。处理器120可包括任何通用处理器和硬件模块或软件模块,诸如存储在存储设备160中的模块1162、模块2164、和模块3166,所述任何通用处理器和硬件模块或软件模块被配置为控制处理器120以及在软件指令并入实际处理器设计中的情况下的专用处理器。处理器120基本上可以是完全独立成套的计算系统,包含多个核或处理器、总线、存储器控制器、高速缓存等。多核处理器可以是对称的或非对称的。
[0021]系统总线110可以是若干类型的总线结构中的任一种,包括存储器总线或存储器控制器、外围总线,以及使用多种总线架构中任一种的局域总线。存储在ROM 140等中的基本输入/输出(B1S)可以提供基本例程,其有助于在诸如启动期间在计算设备100内的元件之间传输信息。计算设备100还包括存储设备160,诸如硬盘驱动器、磁盘驱动器、光盘驱动器、磁带驱动器等。存储设备160可包括软件模块162、164、166,用于控制处理器120。可以设想其他硬件或软件模块。存储设备160由驱动接口连接到系统总线110。驱动器和相关联的计算机可读存储介质为计算设备100提供计算机可读指令、数据结构、程序模块和其他数据的非易失性存储。在一个方面,执行特定功能的硬件模块包括存储在与必要的硬件组件(诸如处理器120、总线110、输出设备170等)相连的非暂态计算机可读介质中的软件组件来执行功能。基本组件是本领域的技术人员已知的,并且根据设备类型(诸如,设备100是否为小型的手持式计算设备、台式计算机、或计算机服务器)设想到适当的变型。
[0022]虽然本文所描述的示例性实施例采用了硬盘160,但本领域的技术人员应当理解,在示例性操作环境中也可以使用其他类型的计算机可读介质(其可以存储可由计算机访问的数据),诸如磁卡带、闪存卡、数字通用光盘、磁盒、随机存取存储器(RAM) 150、只读存储器(ROM) 140、包含比特流的线缆或无线信号等。非暂态计算机可读存储介质明确地排除诸如能量、载波信号、电磁波、和信号本身这样的介质。
[0023]为了使得用户能够与计算设备100进行交互,输入设备190代表任何数量的输入机构,诸如用于语音的麦克风、用于手势或图形输入的触摸屏、键盘、鼠标、运动输入、语音等。在一些情况下,麦克风可以是麦克风的阵列。输出设备170也可以是本领域的技术人员已知的多个输出机构中的一个或多个。在一些情况下,多模系统允许用户提供多种输入类型以与计算设备100通信。通信接口 180通常支配和管理用户输入和系统输出。没有将操作限制在任何特定硬件布置上,因此,本文的基本特征可以容易地在开发出改进的硬件或固件布置之后替换为这些硬件或固件布置。
[0024]为了清楚地说明,示例性系统实施例被呈现为包括各个功能块,这些块包括标记为“处理器”或处理器120的功能块。这些块代表的功能可以通过使用共享的或专用的硬件(包括但不限于能够执行软件和硬件的硬件,诸如处理器120,其按照目的进行构建以作为执行在通用处理器上的软件的等同物操作)来提供。例如,可以由单个共享的处理器或多个处理器提供图1中给出的一个或多个处理器的功能。(术语“处理器”的使用不应当解释为唯一地指代能够执行软件的硬件。)示例性实施例可包括微处理器和/或数字信号处理器(DSP)硬件、用于存储执行下文论述的操作的软件的只读存储器(ROM) 140、以及用于存储结果的随机存取存储器(RAM) 150。也可以提供超大规模集成(VLSI)硬件实施例以及结合通用DSP电路的定制VLSI电路。
[0025]各种实施例的逻辑操作被实现为:(I)运行于通用计算机内的可编程电路上的一系列计算机实施的步骤、操作、或过程;(2)运行于专用可编程电路上的一系列计算机实施的步骤、操作、或过程;和/或(3)可编程电路内互连的机器模块或程序引擎。图1中示出的系统100可以实践所陈述方法的全部或一部分,可以是所陈述系统的一部分,和/或可以根据所陈述非暂态计算机可读存储介质中的指令进行操作。此类逻辑操作可以实现为被配置为控制处理器120以根据模块的编程执行特定功能的模块。例如,图1示出了三个模块Modll62、Mod2164和Mod3166,它们是被配置为控制处理器120的模块。这些模块可以存储在存储设备160上,并且在运行时加载到RAM 150或存储器130中,或者可以如本领域中已知的那样存储在其他计算机可读存储器位置中。
[0026]在公开本发明技术的详细描述之前,本公开转到如何使用音频波束形成来处理音频信号的简要介绍性描述方面。音频波束形成是一种技术,其中组合从两个或更多个麦克风接收的声音以便使得能够优先捕获来自特定方向的声音。使用音频波束形成的计算设备可包括连接到处理器的两个或更多个全向麦克风的阵列。例如,图2示出了具有两个麦克风202和204的阵列的示例性计算系统200,诸如类似图1中的系统100的通用计算设备。麦克风阵列中麦克风的数量、间距、和/或放置可能随着计算设备的配置而改变。在一些情况下,更大数量的麦克风可提供更准确的空间噪声降低。然而,更大数量的麦克风也可能增加处理成本。尽管图2中绘示了移动计算设备,但可以将音频波束形成用于包括麦克风阵列的任何计算设备上,诸如台式计算机;移动计算机;手持式通信设备,例如移动电话、智能电话、平板电脑;智能电视;机顶盒;和/或配备有麦克风阵列的任何其他计算设备。此夕卜,可以配置麦克风阵列,使得仅有这些麦克风的一个子集是活动的。即,可以停用这些麦克风的一个子集,例如,在准确度不那么重要且处理成本较高时。
[0027]如上所述,麦克风可以是全向的。然而,存在多种不同的麦克风形状,每种形状都可具有基于噪声方向的不同噪声降低能力。例如,可以使用不同的形状以降低来自特定方向的噪声。为了利用不同麦克风形状的优点,可以向麦克风应用空间响应或波束方向图以创建虚拟麦克风。例如,图3示出了四种可能的空间响应方向图:8字形302、心形304、超心形306、和亚心形308。在每个图形302、304、306和308中,外圈表示全向麦克风在每个波束方向的增益。内部形状表示应用对应方向图时在每个方向的增益。例如,图形302表示应用8字形方向图时的增益。图形302还示出可以使用8字形方向图来降低来自90度和270度方向的噪声。也可以使用另外的波束方向图。此外,应用的方向图可以是固定的或自适应的。就基于固定方向图的音频波束形成而言,不论频率如何,都可以应用相同的方向图。然而,当音频波束形成基于自适应方向图时,方向图可根据噪声方向而改变。在一些情况下,方向图也可以基于频率变化。例如,当噪声方向跨不同频率变化时,方向图可从亚心形转变为心形。在另一个实例中,方向图可从第一加权心形转变为第二加权心形。
[0028]在从每个活动的麦克风接收信号之后,处理器可组合信号以生成背景噪声降低的单个输出。在一些情况下,信号可以应用自适应和/或固定的波束方向图。此外,可以应用多个不同的波束方向图。
[0029]已经公开了可以如何利用音频波束形成来处理音频信号的介绍性描述,本公开现在返回到基于计算设备的一个或多个属性值来选择音频波束形成算法属性的论述。音频波束形成技术的一个可能局限性可以在于,尽管音频波束形成可以是自适应的,但就随着频率变化而可以应用不同波束方向图而言,音频波束形成未考虑到在计算设备环境之内的变化。这可能导致非最优的噪声降低效果。即,可以通过合并另外的计算环境特性来改善方向性噪声降低效果。例如,基于自适应方向图的音频波束形成可产生具有可能是人耳可察觉的人为噪声的音频结果,但产生的音频数据可能非常适合自动化的语音识别。
[0030]为了解决这一局限性并产生改善的噪声降低效果,可以动态调节音频波束形成器,使得其适应计算设备的当前状态。可以配置音频波束形成器以加载自适应或固定模式和/或加载不同的预定义的空间响应方向图。这些配置选项可以基于活动的应用和/或系统状态。例如,如果已知将由语音识别应用使用输入信号,则音频波束形成算法可使用自适应方向图。在另一个实例中,如果已知将由方便一个或多个用户间音频和/或视频通信的应用使用输入信号,则音频波束形成算法可使用固定方向图。此外,可以基于系统的另外属性,诸如风扇速度和/或当前音频路由,例如耳机、内置扬声器等,来选择应用于自适应或固定算法的方向图。也可以利用另外的系统属性,诸如风扇和/或扬声器相对于麦克风阵列的放置。
[0031 ] 图4示出了一示例性音频波束形成器配置过程400,其可发生于诸如图2中计算设备200的计算设备上。计算设备200可以正在运行一个或多个应用,诸如语音输入应用、音频通信应用、视频聊天应用、音频录制应用、音乐播放应用等。在一些情况下,一个应用可以是活动的,同时其他应用正运行于后台中和/或被暂停。此外,在一些情况下,活动的或主应用可以使用可利用音频波束形成处理的输入音频数据。
[0032]计算系统200可接收麦克风阵列音频数据404,该麦克风阵列音频数据404可以作为输入被提供到波束形成器402。响应于计算系统200接收到麦克风阵列音频数据404,计算系统200之内的控制模块408可检测关于计算系统200状态的系统信息410。在一些情况下,系统信息410可指示什么应用当前是活动的,诸如语音输入应用,例如由Apple Inc.(Cupertino, CA)发布的Siri应用;音频和/或视频通信应用,例如由Apple Inc.发布的FaceTime应用;音频录制应用;或音乐播放应用。此外,系统信息410可包括其他系统状态,诸如风扇是否是活动的或风扇的速度。
[0033]系统信息410的表示可随着系统配置和/或信息类型而变化。例如,系统信息410可以被表示为列出应用类型分类和活动水平的表格。活动水平可以是表示特定类型应用是否是活动的二进制值。在一些情况下,活动水平可具有多个状态,诸如活动的、非活动的、后台、暂停等。在另一个实例中,系统信息410可以被表示为列出应用标识符和活动水平的表格,应用标识符诸如是特定应用的名称或某种其他唯一标识符。同样,活动水平可以是二进制值或者可具有多个可能值。图5示出了特定于运行于计算系统200上的应用的状态的系统信息410的四种示例性表示。系统信息410的其他表示也是可能的,诸如针对应用信息的单个变量。可以将该变量设置为表示特定应用或应用类型的唯一标识符。可以利用类似技术表示其他系统状态。例如,可以使用二进制值来指示系统风扇打开还是关闭。或者,可以使用诸如整数的数值来表示风扇速度。
[0034]重新参照图4,在处理音频数据404时,控制模块408可使用系统信息410来选择要用于波束形成器402中的模式和/或方向图。在一些情况下,控制模块408可使用关于什么应用类型或特定应用是活动的信息来在固定和自适应模式之间进行选择。例如,如果应用类型是音频通信,则控制模块408可选择固定模式。在另一个实例中,如果应用类型是语音识别,则控制模块408可选择完全自适应。在一些情况下,控制模块408可在选择模式时额外地或替代地使用其他系统状态,诸如风扇速度。
[0035]除选择模式之外,控制模块408还可使用系统信息410来任选地选择特定方向图或方向图序列。例如,如果应用类型是音频通信,则控制模块408可选择心形方向图。在另一个实例中,如果应用类型是音频通信且计算系统具有特定配置的麦克风阵列和扬声器放置,则控制模块408可选择超心形方向图。在另一个实例中,如果风扇运行于高于预定义的风扇速度,则控制模块408可选择亚心形方向图。另外和/或替代的方向图选择也是可以的。
[0036]控制模块408还可以选择将由波束形成器402在自适应模式中使用的方向图序列,自适应模式是固定和自适应方向图的混合。图6示出了一示例性混合式固定-自适应波束方向图方案600。如图所示,随着信号频率的变化,波束方向图可在三种方向图,即全向、心形和8字形之间变化。在该实例中,每个频带都在两个方向图类型之间变化。倾斜线,诸如线条602,可表示随着频率增大,可以使用自适应模式,其可在两种方向图之间改变方向图。例如,线条602表示随着频率增大,方向图从全向转变为心形。非倾斜线,诸如线条604,可表示随着频率增大,方向图可保持固定。例如,线条604表示随着频率增大,使用固定的心形方向图。用于混合式固定-自适应模式的序列中的方向图数量可随着系统配置而变化和/或可基于系统?目息410。另外,方向图保持固定的适应率和/或频率范围可随着系统配置而变化和/或可基于系统信息410。
[0037]重新参照图4,在基于系统信息410做出选择之后,控制模块408可向波束形成器402发送模式和/或波束方向图406。然后波束形成器402可处理音频数据404。在处理音频数据404之后,波束形成器402可任选地向噪声抑制模块414发送经处理的音频数据404。控制模块408也可以利用系统信息410生成抑制强度噪声轮廓412,控制模块408可将其提供到噪声抑制模块414。噪声抑制模块414可使用抑制强度噪声轮廓412处理接收的音频数据404。在完成所有处理之后,可以将经处理的音频数据404发送到活动的应用416。
[0038]图7是示出了用于基于系统设置来配置音频波束形成算法的一示例性方法700的流程图。为了清楚起见,根据诸如图2中所示的示例性系统200来论述该方法。虽然图7中示出了具体步骤,但在其他实施例中,方法可具有比所示出的更多或更少的步骤。在系统200从麦克风阵列接收到音频数据(702)时,可以开始音频波束形成算法的配置。在接收到数据之后,系统200可检测第一预先确定的运行应用(704)。在一些情况下,第一预先确定的运行应用可以是语音输入应用、语音识别应用、音频通信应用、视频聊天应用、或音频录制应用。在一些实施例中,系统还可检测至少一个预先确定的设备设置。所述至少一个预先确定的设备设置可以是风扇速度、当前音频路由、和/或麦克风和扬声器放置的配置。
[0039]系统200可检查第一预先确定的运行应用,以及任选的所述至少一个预先确定的设备设置,是否对应于模式波束方向图(706)。如果系统200可辨识对应的模式波束方向图,则系统200可选择所辨识的模式波束方向图(708)。模式波束方向图可指定模式(例如固定或自适应)和/或波束方向图(例如,全向、心形、超心形、亚心形、8字形等)。基于所选择的模式波束方向图,该系统可配置音频波束形成算法(710)。在一些情况下,该配置可使波束形成器加载模式波束方向图中指定的模式和/或波束方向图。在一些情况下,该系统可具有默认模式和/或方向图,使得如果在模式波束方向图中未指定模式和/或方向图或不能找到对应的模式波束方向图,则可以使用默认值来配置音频波束形成算法。如果系统200无法辨识对应的模式波束方向图,则系统200可继续处理音频数据而不对音频波束形成算法做出任何配置调节。或者,系统200可利用默认值配置音频波束形成算法。
[0040]在配置音频波束形成算法之后,该系统可利用经配置的波束形成算法来处理音频数据。此外,该系统可向第一预先确定的运行应用发送经处理的数据(712)。在一些实施例中,在向第一预先确定的运行应用发送经处理的音频数据之前,系统可向经处理的音频数据应用噪声抑制算法。另外,该系统可使用第一预先确定的运行应用和/或所述至少一个预先确定的设备设置来生成抑制强度噪声轮廓。该系统可在噪声抑制算法中使用抑制强度噪声轮廓。在一些情况下,抑制强度噪声轮廓可以是噪声基底。在完成步骤712之后,系统200可重新开始先前的处理,这可包括重复方法600。
[0041]本公开的范围内的实施例也可包括有形和/或非暂态计算机可读存储介质,其用于承载或具有存储在其上的计算机可执行指令或数据结构。此类非暂态计算机可读存储介质可以是可由通用或专用计算机访问的任何可用介质,包括上文论述的任何专用处理器的功能设计。以举例而非限制的方式,此类非暂态计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储、磁盘存储或其他磁性存储设备,或任何其他介质,其可用来承载或存储呈计算机可执行指令、数据结构或处理器芯片设计形式的所需程序代码装置。当信息经由网络或另一通信连接(硬连线的、无线的,或它们的组合)传送或提供至计算机时,计算机适当地将该连接视为计算机可读介质。因此,任何这种连接被适当地称为计算机可读介质。上述的组合也应该包括在计算机可读介质的范围内。
[0042]计算机可执行指令包括例如使得通用计算机、专用计算机、或专用处理设备执行某些功能或一组功能的指令和数据。计算机可执行指令也包括由计算机在独立或网络环境中执行的程序模块。通常,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构、对象、和专用处理器设计中固有的功能等。计算机可执行指令、相关联的数据结构、和程序模块代表用于执行本文所公开的方法的步骤的程序代码装置的实例。此类可执行指令或相关联的数据结构的特定序列代表用于实现在此类步骤中描述的功能的对应动作的实例。
[0043]本领域的技术人员将会理解,本公开的其他实施例可以在具有许多类型的计算机系统配置的网络计算环境中实践,包括个人计算机、手持设备、多处理器系统、基于微处理器的或可编程的消费电子产品、网络PC、微型计算机、大型计算机等。实施例也可在分布式计算环境中实践,其中任务由通过通信网络(要么由硬连线链路、无线链路,要么由它们的组合)连接的本地和远程处理设备来执行。在分布式计算环境中,程序模块可位于本地存储器存储设备和远程存储器存储设备两者中。
[0044]上文描述的各实施例仅仅以例示方式提供,而不应解释为限制本公开的范围。本领域的技术人员将容易认识到,在不遵从本文举例说明和描述的示例性实施例和应用且不脱离本公开的实质和范围的情况下,可以对本文所描述的原理做出各种修改和变更。
【权利要求】
1.一种计算机实现的方法,包括: 经由麦克风阵列接收多个音频信号; 检测第一预先确定的运行应用; 基于所检测到的第一预先确定的运行应用来配置音频波束形成算法;以及向所述第一预先确定的运行应用发送经处理的音频数据,其中所述经处理的音频数据是通过向所述多个音频信号应用所配置的音频波束形成算法而生成的。
2.根据权利要求1所述的计算机实现的方法,其中配置所述音频波束形成算法还包括基于所检测到的第一预先确定的运行应用来设置模式波束方向图,其中所述模式波束方向图是自适应模式。
3.根据权利要求1所述的计算机实现的方法,还包括: 检测至少一个预先确定的设备设置。
4.根据权利要求1所述的计算机实现的方法,还包括: 在向所述第一预先确定的运行应用发送所述经处理的音频数据之前,向所述经处理的音频数据应用噪声抑制算法,其中所述噪声抑制算法包括预先确定的噪声基底。
5.根据权利要求3所述的计算机实现的方法,其中所述第一预先确定的运行应用是语音输入应用、音频通信应用、视频聊天应用、或音频录制应用,并且其中所述预先确定的设备设置是高于阈值的风扇速度或活动的音频输出的通知。
6.一种系统,包括: 处理器; 麦克风阵列; 计算机可读存储介质,其存储用于控制所述处理器以执行包括如下的步骤的指令:基于所检测到的第一预先确定的运行应用,通过设置模式波束方向图来配置音频波束形成算法; 通过向从所述麦克风阵列接收的多个音频信号应用所配置的音频波束形成算法来生成经处理的音频数据;以及 向所述第一预先确定的运行应用发送所述经处理的音频数据。
7.根据权利要求6所述的系统,所述步骤还包括: 检测至少一个预先确定的系统设置;以及 基于所述至少一个预先确定的系统设置来配置所述音频波束形成算法。
8.根据权利要求7所述的系统,其中所述至少一个预先确定的系统设置是风扇速度、当前音频路由、或所述麦克风阵列的配置和扬声器放置中的至少一者。
9.根据权利要求6所述的系统,其中所述模式波束方向图能够指定模式和波束方向图。
10.根据权利要求9所述的系统,其中所述模式是自适应模式、固定模式、或混合式固定-自适应模式。
11.根据权利要求9所述的系统,其中所述波束方向图是全向、心形、超心形、亚心形、8字形、或它们的序列。
12.—种存储指令的非暂态计算机可读存储介质,所述指令在由计算设备执行时,使所述计算设备执行包括如下的步骤: 基于所检测到的预先确定的运行应用来选择模式波束方向图; 使用所选择的模式波束方向图来配置音频波束形成算法;以及 向所述预先确定的运行应用发送经处理的音频数据,其中所述经处理的音频数据是通过向从麦克风阵列接收的多个音频信号应用所配置的音频波束形成算法而生成的。
13.根据权利要求12所述的非暂态计算机可读存储介质,其中选择所述模式波束方向图还基于至少一个检测到的当前设备设置。
14.根据权利要求13所述的非暂态计算机可读存储介质,还包括: 在向所述预先确定的运行应用发送所述经处理的音频数据之前,向所述经处理的音频数据应用噪声抑制算法。
15.根据权利要求14所述的非暂态计算机可读存储介质,其中基于所述预先确定的运行算法或所述至少一个检测到的当前设备设置中至少一者来配置所述噪声抑制算法。
16.根据权利要求12所述的非暂态计算机可读存储介质,其中所检测到的预先确定的运行应用是语音输入应用、音频通信应用、视频聊天应用、或音频录制应用。
17.—种计算机实现的方法,包括: 经由麦克风阵列接收多个音频信号; 检测预先确定的运行应用和至少一个预先确定的设备设置; 基于所检测到的预先确定的运行应用和所述至少一个预先确定的设备设置,通过设置模式波束方向图来配置音频波束形成算法; 向所述多个音频信号应用所配置的音频波束形成算法以生成经处理的音频数据;以及 向所检测到的预先确定的运行应用发送所述经处理的音频数据。
18.根据权利要求17所述的计算机实现的方法,其中所检测到的预先确定的运行应用是语音识别应用,并且其中所述模式波束方向图指定自适应模式。
19.根据权利要求17所述的计算机实现的方法,其中所检测到的预先确定的运行应用是音频通信应用,并且其中所述模式波束方向图指定固定模式。
20.根据权利要求19所述的计算机实现的方法,其中所述模式波束方向图指定心形波束方向图。
【文档编号】G10L21/0208GK104335273SQ201380029700
【公开日】2015年2月4日 申请日期:2013年5月13日 优先权日:2012年6月8日
【发明者】A·M·林达尔, R·艾萨克 申请人:苹果公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1