用于语音质量改进的用户特定的噪声抑制的制作方法

文档序号:2832757阅读:403来源:国知局
专利名称:用于语音质量改进的用户特定的噪声抑制的制作方法
技术领域
背景技术
本发明大体上涉及用于噪声抑制的技术,且更确切地说涉及用于用户特定的噪声抑制的技术。本部分意在向读者介绍可能与下文描述及/或主张的本发明的各个方面有关的技术的各个方面。相信本论述有助于为读者提供背景技术资料,便于更好地理解本发明的各个方面。因此,应当理解这些陈述要在此意义上理解,而并不是承认现有技术。许多电子装置使用与语音有关的特征,其涉及记录及/或传输用户的语音。举例来说,语音备忘录记录特征可以记录用户所说的语音备忘录。类似地,电子装置的电话特征可以将用户的语音传输到另一个电子装置。然而,当电子装置获得用户的语音时,可以同时 获得环境声音或背景噪声。这些环境声音可能会让用户的语音模糊不清,而且在有些情况下,会妨碍电子装置的与语音有关的特征正常运行。为了在使用与语音有关的特征时减少环境声音的影响,电子装置可以应用各种噪声抑制方案。装置制造商可以对此些噪声抑制方案进行编程,使其根据经计算会被大多数用户良好接收的某些预定通用参数来操作。然而,某些语音可能不太适合这些通用噪声抑制参数。此外,一些用户可能偏爱更强或更弱的噪声抑制。

发明内容
下文阐述本文中揭示的某些实施例的概述。应当理解,呈现这些方面只是为了向读者提供对这些特定实施例的简要概述,并且这些方面并不希望限制本发明的范围。实际上,本发明可以涵盖下文可能未阐述的多个方面。本发明的实施例涉及用于用户特定的噪声抑制的系统、方法及装置。举例来说,当在使用电子装置的与语音有关的特征时,电子装置可能会接收到包含用户语音的音频信号。因为此时例如环境声音等噪声也可能会被电子装置接收,所以电子装置可以抑制音频信号中的此噪声。确切地说,电子装置经由用户特定的噪声抑制参数可以抑制音频信号中的噪声,同时实质上保留用户语音。这些用户特定的噪声抑制参数可以至少部分地基于用户噪声抑制偏好或用户语音简档或其组合。


在阅读了下文的具体实施方式
且在参阅图式之后,可以更好地理解本发明的各个方面,在图式中图I是根据实施例的能够执行本文中揭示的技术的电子装置的框图;图2是表示图I的电子装置的一个实施例的手持装置的示意图;图3是表示根据一实施例可以使用图I的电子装置的与语音有关的特征的各种场合的示意性框图4是根据一实施例可以在图I的电子装置中发生的噪声抑制的框图;图5是表示根据一实施例的用户特定的噪声抑制参数的框图;图6是描述用于在图I的电子装置中应用用户特定的噪声抑制参数的方法的实施例的流程图;图7是根据一实施例在图2的手持装置被激活时起始语音训练序列的示意图;
图8是根据一实施例用于使用图2的手持装置选择起始语音训练系列的一系列屏眷的不意图;图9是描述用于经由语音训练序列确定用户特定的噪声抑制参数的方法的实施例的流程图;图10及11是根据一实施例的用于获得用于语音训练的用户语音样本的方式的示意图;图12是说明根据一实施例在语音训练序列期间获得噪声抑制用户偏好的方式的示意图;图13是描述用于在语音训练序列期间获得噪声抑制用户偏好的方法的实施例的流程图;图14是描述用于执行语音训练序列的另一方法的实施例的流程图;图15是描述用于获得高信噪比(SNR)用户语音样本的方法的实施例的流程图;图16是描述用于经由分析用户语音样本来确定用户特定的噪声抑制参数的方法的实施例的流程图;图17是描述根据一实施例在执行图16的方法时可以考虑的用户语音样本的特性的因数图;图18是表示根据一实施例可以在图2的手持装置上显示以经由用户可选设置来获得用户特定的噪声参数的一系列屏幕的示意图;图19是根据一实施例用于在使用手持装置的与语音有关的特征时实时获得用户特定的噪声抑制参数的图2的手持装置上的屏幕的示意图;图20及21是表示根据一实施例的可形成用户特定的噪声抑制参数的各种子参数的不意图;图22是描述用于基于检测到的环境声音来应用用户特定的参数的某些子参数的方法的实施例的流程图;图23是描述用于基于电子装置的使用场合来应用噪声抑制参数的某些子参数的方法的实施例的流程图;图24是表示根据一实施例可用于图23的方法的各种装置场合因数的因数图;图25是描述用于获得用户语音简档的方法的实施例的流程图;图26是描述用于基于用户语音简档应用噪声抑制的方法的实施例的流程图;图27到29是描绘根据一实施例基于用户语音简档执行音频信号的噪声抑制的方式的图表;图30是描述用于经由涉及预先记录的语音的语音训练序列获得用户特定的噪声抑制参数的方法的实施例的流程图;图31是描述用于向从另一电子装置接收的音频应用用户特定的噪声抑制参数的方法的实施例的流程图;图32是描述根据一实施例用于基于第一电子装置的用户特定的噪声参数使另一电子装置参与噪声抑制的方法的实施例的流程图;及图33是根据一实施例用于基于与另一电子装置相关联的用户特定的噪声抑制参数对两个电子装置执行噪声抑制的系统的示意性框图。
具体实施例方式下文将描述一个或一个以上特定实施例。为了提供对这些实施例的简要描述,说明书中未描述实际实施方案的所有特征。应当理解,在研发任何此实际实施方案时,如在任何工程或设计项目中,必须进行许多实施方案特定的决策来实现研发人员的特定目标,例如符合与系统有关的及与商业有关的约束,这些决策可能在实施方案之间有所不同。此外,应当理解,此研发努力可能复杂而且耗时,但是仍然将是受益于本发明的所属领域的技术人员的设计、制作及制造的例行任务。 当前实施例涉及抑制与电子装置的与语音有关的特征相关联的音频信号中的噪声。此与语音有关的特征可包含例如语音备忘录记录特征、视频记录特征、电话特征及/或语音命令特征,其中的每一者可涉及包含用户的语音的音频信号。然而,除了用户的语音之夕卜,音频信号还可包含在使用与语音有关的特征时存在的环境声音。由于这些环境声音可能会使用户的语音模糊不清,所以电子装置可以对音频信号应用噪声抑制以过滤掉环境声音,同时保留用户的语音。根据当前实施例的噪声抑制不是采用在制造装置时编程的通用噪声抑制参数,而是可以涉及可能是电子装置的用户特有的用户特定的噪声抑制参数。这些用户特定的噪声抑制参数可以通过语音训练、基于用户的语音简档及/或基于手动选择的用户设置来确定。当基于用户特定的参数而不是通用参数发生噪声抑制时,经过噪声抑制的信号的声音可能更令用户满意。这些用户特定的噪声抑制参数可以用于任何与语音有关的特征,并且可以配合自动增益控制(AGC)及/或均衡(EQ)调谐来使用。如上所述,可以使用语音训练序列来确定用户特定的噪声抑制参数。在此语音训练序列中,电子装置可以对与一个或一个以上干扰因素(例如,模拟环境声音,例如起皱的纸、白噪声、七嘴八舌的人等等)混合的用户的语音样本应用不同的噪声抑制参数。此后,用户可以指示哪些噪声抑制参数产生最优选的声音。基于用户的反馈,电子装置可以形成及存储用户特定的噪声抑制参数,用于稍后在使用电子装置的与语音有关的特征时使用。另外或替代地,可通过电子装置依据用户的语音的特性来自动确定用户特定的噪声抑制参数。不同用户的语音可具有各种不同特性,包含不同的平均频率、不同的频率可变性及/或不同的区分的声音。此外,可以知道某些噪声抑制参数对于某些语音特性更加有效地操作。因此,根据特定本发明的某些实施例的电子装置可基于此些用户语音特性来确定用户特定的噪声抑制参数。在一些实施例中,用户可通过例如选择高/中/低噪声抑制强度选择器或指示电子装置上的当前呼叫质量来手动设置噪声抑制参数。当已经确定了用户特定的参数时,电子装置可以抑制可能在使用与语音有关的特征时听到的各种类型的环境声音。在某些实施例中,电子装置可分析环境声音的特点,并且应用预期因此抑制当前环境声音的用户特定的噪声抑制参数。在另一实施例中,电子装置可以基于正在使用电子装置的当前场合来应用某些用户特定的噪声抑制参数。在某些实施例中,电子装置可以基于与用户相关联的用户语音简档来执行针对用户定制的噪声抑制。此后,电子装置可以更加有效地在正在使用与语音有关的特征时将环境声音与音频信号隔离,因为电子装置大体上可能预期音频信号的哪些组成部分对应于用户的语音。举例来说,电子装置可以放大音频信号的与用户语音简档相关联的组成部分,同时抑制音频信号的不与用户语音简档相关联的组成部分。还可以使用用户特定的噪声抑制参数来抑制音频信号中含有电子装置接收到的不是用户语音的语音的噪声。举例来说,当将电子装置用于电话或聊天特征时,电子装置可以对来自与用户对应的人的音频信号采用用户特定的噪声抑制参数。由于此音频信号先前可能已经被发送装置处理,所以此噪声抑制可以相对微弱。在某些实施例中,电子装置可以将用户特定的噪声抑制参数发射到发送装置,使得发送装置可以相应地修改其噪声抑制参数。同样,两个电子装置可以系统地起作用,以根据彼此的用户特定的噪声抑制参数来抑制传出的音频信号中的噪声。鉴于前述内容,下文提供对用于执行当前揭示的技术的合适电子装置的总体描 述。确切地说,图I是描绘适合与本技术一起使用的电子装置中可能存在的各种组件的框图。图2表示合适的电子装置的一个实例,如所说明,此电子装置可以是具有噪声抑制能力的手持电子装置。首先转向图1,用于执行当前揭示的技术的电子装置10可以尤其包含一个或一个以上处理器12、存储器14、非易失性存储装置16、显示器18、噪声抑制20、位置感测电路22、输入/输出(I/O)接口 24、网络接口 26、图像捕获电路28、加速计/磁力计30以及麦克风32。图I所示的各种功能块可以包含硬件元件(包含电路)、软件元件(包含存储在计算机可读媒体上的计算机代码)或硬件元件与软件元件两者的组合。应进一步注意,图I只是特定实施方案的一个实例,并且意在说明电子装置10中可以存在的类型的组件。举例来说,电子装置10可以表示图2中描绘的手持装置或类似装置的框图。此外或替代地,电子装置10可以表示具有某些特性的电子装置的系统。举例来说,第一电子装置可以包含至少一麦克风32,其可向第二电子装置提供音频,第二电子装置包含处理器12及其它数据处理电路。应注意,数据处理电路可以完全或部分地体现为软件、固件、硬件或其任何组合。此外,数据处理电路可以是单个内含式处理模块,或者可以完全或部分地并入到电子装置10内的任何其它元件内。数据处理电路还可以部分地体现在电子装置10内,并且部分地体现在有线或无线地连接到装置10的另一电子装置内。最后,数据处理电路可以完全实施在有线或无线地连接到装置10的另一装置内。作为一非限制性实例,数据处理电路可以体现在与装置10连接的头戴耳机内。在图I的电子装置10中,处理器12及/或其它数据处理电路可以可操作地与存储器14及非易失性存储器16耦合以执行用于实施当前揭示的技术的各种算法。由处理器12执行的此些程序或指令可以存储在任何合适的制造品中,所述制造品包含一个或一个以上至少共同存储指令或例程的有形的计算机可读媒体,例如存储器14及非易失性存储装置16。此外,在此计算机程序产品上编码的程序(例如,操作系统)还可以包含可以由处理器12执行以使得电子装置10能够提供各种功能性(包含本文中描述的功能性)的指令。显示器18可以是触摸屏显示器,其可以使得用户能够与电子装置10的用户接口交互。
可以通过例如处理器12等数据处理电路或者通过专用于对电子装置10处理的音频信号执行某种噪声抑制的电路执行。举例来说,可以通过基带集成电路(IC)(例如英飞凌公司制造的基带IC)基于外部提供的噪声抑制参数来执行噪声抑制20。此外或替代地,噪声抑制20可以在电话音频增强集成电路(IC)中执行,此电话音频增强IC经配置以基于外部提供的噪声抑 制参数来执行噪声抑制,例如听众公司(Audience)制造的电话音频增强1C。这些噪声抑制IC可以至少部分地基于某些噪声抑制参数来操作。改变此些噪声抑制参数可以改变噪声抑制20的输出。位置感测电路22可以表示用于确定电子装置10的相对或绝对位置的装置能力。举例来说,位置感测电路22可以表示全球定位系统(GPS)电路、用于基于紧接的无线网络(例如局域Wi-Fi网络)来估计位置的算法等等。I/O接口 24可以使电子装置10能够与各种其它电子装置介接,与网络接口 26—样。举例来说,网络接口 26可以包含用于个域网(PAN)(例如蓝牙网络)的接口、用于局域网(LAN)(例如802. Ilx Wi-Fi网络)的接口及/或用于广域网(WAN)(例如3G蜂窝式网络)的接口。通过网络接口 26,电子装置10可以与包含麦克风32的无线头戴耳机介接。图像捕获装置28可以实现图像及/或视频捕获,且加速计/磁力计30可以观测电子装置10的移动及/或相对定向。当配合电子装置10的与语音有关的特征(例如电话特征或语音识别特征)采用时,麦克风32可以获得用户的语音的音频信号。虽然除了用户的语音以外还可能在音频信号中获得环境声音,但是噪声抑制20可以处理音频信号以基于某些用户特定的噪声抑制参数来排除大部分环境声音。如下文更详细描述,所述用户特定的噪声抑制参数可以通过语音训练、基于用户的语音简档及/或基于手动选择的用户设置来确定。图2描绘表示电子装置10的一个实施例的手持装置34。举例来说,手持装置34可以表示便携式电话、媒体播放器、个人数据管理器、手持式游戏平台或此些装置的任何组合。举例来说,手持装置34可以是可从加利福尼亚州库珀蒂诺市的苹果公司购得的iPod 或iPhone 型号。手持装置34可以包含罩壳36,以保护内部组件免受物理损害,并且屏蔽内部组件免受电磁干扰。罩壳36可以围绕显示器18,显示器18可以显示指示符图标38。指示符图标38尤其可以指示蜂窝信号强度、蓝牙连接及/或电池寿命。I/O接口 24可以穿过罩壳36开口,并且举例来说可以包含来自苹果公司的用于连接到外部装置的专有I/O端口。如图2中指示,手持装置34的反面可以包含图像捕获电路28。用户输入结构40、42、44及46配合显示器18可以允许用户控制手持装置34。举例来说,输入结构40可以将手持装置34激活或去激活,输入结构42可以将用户接口 20导航到主屏幕、用户可配置的应用程序屏幕及/或激活手持装置34的语音识别特征,输入结构44可以提供音量控制,且输入结构46可以在振动模式与响铃模式之间来回切换。麦克风32可以获得用于各种与语音有关的特征的用户的语音,且扬声器48可以实现音频回放及/或某些电话能力。头戴受话器输入50可以提供与外部扬声器及/或头戴受话器的连接。如图2中说明,有线头戴耳机52可以经由头戴受话器输入50而连接到手持装置34。有线头戴耳机52可以包含两个扬声器48及一个麦克风32。麦克风32可以使得用户能够用与位于手持装置34上的麦克风32相同的方式对手持装置34中说话。在一些实施例中,靠近麦克风32的按钮可以致使麦克风32唤醒及/或可以致使手持装置34的与语音有关的特征激活。无线头戴耳机54可以经由网络接口 26的无线接口(例如,蓝牙接口)类似地连接到手持装置34。与有线头戴耳机52相同,无线头戴耳机54也可以包含扬声器48及麦克风32。此外,在一些实施例中,靠近麦克风32的按钮可以致使麦克风32唤醒及/或可以致使手持装置34的与语音有关的特征激活。此外或替代地,独立麦克风32(未图示)(其可能没有集成扬声器48)可以经由头戴受话器输入50或经由网络接口 26中的一者与手持装直34介接。用户可能会在具有各种环境声音的各种场合中使用电子装置10的与语音有关的特征(例如语音识别特征或电话特征)。图3说明许多此些场合56,其中电子装置10(描绘为手持装置34)可能会在执行与语音有关的特征时获得用户语音音频信号58及环境声音60。举例来说,电子装置10的与语音有关的特征可以例如包含语音识别特征、语音备忘录记录特征、视频记录特征及/或电话特征。与语音有关的特征可以实施在电子装置10上,在由处理器12或其它处理器实施的软件中,及/或可以实施在专用硬件中。
当用户说出语音音频信号58时,此信号可能会进入电子装置10的麦克风32。然而,在大约相同时间,环境声音60还可进入麦克风32。环境声音60可依据正在使用电子装置10的场合56来改变。可以使用与语音有关的特征的各种场合56可以包含在家62、在办公室64、在健身馆66、在繁忙的街道上68、在车上70、在体育赛事中72、在饭店74及在派对76上,等等。应当理解,在繁忙的街道68上发生的典型的环境声音60可能与在家里62或在车上70发生的典型环境声音60有很大区别。环境声音60的特点可能在场合56与场合56之间有所不同。如下文详细描述,电子装置10可以至少部分地基于用户特定的噪声抑制参数来执行噪声抑制20以过滤环境声音60。在一些实施例中,这些用户特定的噪声抑制参数可以经由语音训练来确定,在所述语音训练中,可以在包含用户语音样本及各种干扰因素(模拟环境声音)的音频信号上测试各种不同的噪声抑制参数。语音训练中采用的干扰因素可以经过选择以模拟在某些场合56中发现的环境声音60。此外,所述场合56中的每一者可以在某些位置及时间发生,具有电子装置10的变化的运动及环境光的量,且/或具有语音信号58及环境声音60的各种音量级别。因此,电子装置10可以使用用户特定的噪声抑制参数来过滤环境声音60,所述参数是针对某些场合56定制的,例如基于时间、位置、运动、环境光及/或音量级别等而确定。图4是用于在使用电子装置10的与语音有关的特征时在电子装置10上执行噪声抑制20的技术80的示意性框图。在图4的技术80中,与语音有关的特征涉及用户与另一个人之间的双向通信,并且可以在使用电子装置10的电话或聊天特征时发生。然而,应当理解,电子装置10也可以在未发生双向通信时对通过电子装置的麦克风32或网络接口 26接收的音频信号执行噪声抑制20。在噪声抑制技术80中,电子装置10的麦克风32可以获得用户语音信号58及背景中存在的环境声音60。在进入噪声抑制20之前,可以通过编解码器82对此第一音频信号进行编码。在噪声抑制20中,可以对第一音频信号应用发射噪声抑制(TX NS)84。可以通过某些噪声抑制参数(说明为发射噪声抑制(TX NS)参数86)来定义噪声抑制20的发生方式,举例来说,所述参数是由处理器12、存储器14或非易失性存储装置16提供的。如下文更详细论述,TX NS参数86可以是由处理器12确定的用户特定的噪声抑制参数,并且针对电子装置10的用户及/或场合56而定制。在标号84处执行了噪声抑制20之后,可以通过网络接口 26将所得信号传递到上行链路88。网络接口 26的下行链路90可以从另一装置(例如,另一电话)接收语音信号。可以在噪声抑制20中对此传入信号应用某些噪声接收器噪声抑制(RX NS)92。可以通过某些噪声抑制参数(说明为接收噪声抑制(RX NS)参数94)来定义此噪声抑制20的发生方式,举例来说,所述参数是由处理器12、存储器14或非易失性存储装置16提供的。由于在离开发送装置之前,传入音频信号先前可能已经经过处理来进行噪声抑制,所以可以将RX NS参数94选择成没有TX NS参数86强。可以通过编解码器82对所得的经过噪声抑制的信号进行解码,并且将其输出到电子装置10的接收器电路及/或扬声器48。TX NS参数86及/或RX NS参数94可能是电子装置10的用户特有的。也就是说,如图5的图100所示,可以从针对电子装置10的用户定制的用户特定的噪声抑制参数102中选出TX NS参数86及RX NS参数94。可以用各种方式来获得这些用户特定的噪声抑制参数102,例如通过语音训练104、基于用户语音简档106,及/或基于用户可选设置108, 如下文更详细描述。
语音训练104可以允许电子装置10通过测试与各种干扰因素或模拟背景噪声组合的各种噪声抑制参数来确定用户特定的噪声抑制参数102。下文参照图7到14更详细地论述用于执行此语音训练104的某些实施例。此外或替代地,电子装置10可以基于用户语音简档106来确定用户特定的噪声抑制参数102,所述用户语音简档106可以考虑用户的语音的特定特性,如下文参照图15到17更详细论述。此外或替代地,用户可以通过某些用户设置108来指示对用户特定的噪声抑制参数102的偏好,如下文参照图18及19更详细论述。举例来说,此些用户可选设置可以包含噪声抑制强度(例如,低/中/高)选择器及/或实时用户反馈选择器,以提供关于用户的实时语音质量的用户反馈。一般来说,电子装置10可以在电子装置的与语音有关的特征正在使用时采用用户特定的噪声抑制参数102 (例如,可以基于用户特定的噪声抑制参数102来选择TX NS参数86及RX NS参数94)。在某些实施例中,电子装置10可以基于对当前正在使用与语音有关的特征的用户的识别来在噪声抑制20期间应用某些用户特定的噪声抑制参数102。举例来说,此情形可以在其他家庭成员使用电子装置10时发生。家庭的每一成员可以代表有时候可以使用电子装置10的与语音有关的特征的用户。在此些多用户状况下,电子装置10可以查实是否存在与所述用户相关联的用户特定的噪声抑制参数102。举例来说,图6说明在已经识别了用户时用于应用某些用户特定的噪声抑制参数102的流程图110。流程图110可以在用户正在使用电子装置10的与语音有关的特征时开始(框112)。在实施与语音有关的特征时,电子装置10可以接收音频信号,此音频信号包含用户语音信号58及环境声音60。根据所述音频信号,电子装置10大体上可以确定用户的语音的某些特性且/或可以从用户语音信号58中识别出用户语音简档(框114)。如下文论述,用户语音简档可以表示识别与用户的语音相关联的某些特性的信息。如果在框114处检测到的语音简档不与同用户特定的噪声抑制参数102相关联的任何已知用户匹配(框116),则电子装置10可以应用某些默认噪声抑制参数来进行噪声抑制20(框118)。然而,如果在框114中检测到的语音简档不与电子装置10的已知用户匹配,且电子装置10当前存储与所述用户相关联的用户特定的噪声抑制参数102,则电子装置10可以替代地应用相关联的用户特定的噪声抑制参数102 (框120)。如上所述,可以基于语音训练序列104来确定用户特定的噪声抑制参数102。在电子装置10的一实施例(例如手持装置34)的激活阶段130期间,可以将对此语音训练序列104的起始作为选项向用户呈现,如图7所示。一般来说,此激活阶段130可以在手持装置34首次加入蜂窝式网络或者经由通信电缆134首次连接到计算机或其它电子装置132时发生。在此激活阶段130期间,手持装置34或计算机或其它装置132可以提供起始语音训练的提示136。在选择了所述提示之后,用户即刻可以起始语音训练104。此外或替代地,语音训练序列104可以在用户选择电子装置10的设置时开始,此设置致使电子装置10进入语音训练模式。如图8所示,手持装置34的主屏140可以包含用户可选按钮142,所述按钮在被选择时致使手持装置34显示设置屏幕144。当用户选择在设置屏幕144上标记为“电话”的用户可选按钮146时,手持装置34可以显示电话设置屏幕148。电话设置屏幕148尤其可以包含标记为“语音训练”的用户可选按钮150。当用 户选择语音训练按钮150时,语音训练104序列可以开始。图9的流程图160表不用于执行语音训练104的方法的一个实施例。流程图160可以在电子装置10提示用户在某些干扰因素(例如,模拟环境声音)在背景中播放时说话的时候开始(框162)。举例来说,可以要求用户在某些干扰因素(例如摇滚乐、七嘴八舌的人、起皱的纸等等)正在计算机或其它电子装置132上或在电子装置10的扬声器48上大声播放时说某个单词或短语。在此些干扰因素正在播放时,电子装置10可以读取用户的语音的样本(框164)。在一些实施例中,在播放各种干扰因素时框162及164可以重复来获得包含用户的语音及一个或一个以上干扰因素两者的若干测试音频信号。为了确定用户最偏好哪些噪声抑制参数,电子装置10可以在从用户请求反馈之前将噪声抑制20应用于测试音频信号时交替地应用某些测试噪声抑制参数。举例来说,电子装置10可以在经由扬声器48将音频输出给用户之前,向包含用户的语音样本及一个或一个以上干扰因素的测试音频信号应用第一组测试噪声抑制参数,此处标记为“A”(框166)。接下来,电子装置10可以在经由扬声器48将音频输出给用户之前,向用户的语音样本应用另一组测试噪声抑制参数,此处标记为“B”(框168)。用户接着可以决定用户偏好电子装置10输出的两个音频信号中的哪一者(例如,通过选择电子装置10的显示器18上的“A” 或“B”)(框 170)。电子装置10可以用各种测试噪声抑制参数及用各种干扰因素来重复框166到170的动作,每次都知道关于用户的噪声抑制偏好的更多情况,直到已经获得了合适的用户噪声抑制偏好数据组为止(决策框172)。因此,电子装置10可以测试实际上应用于含有用户的语音以及某些常见环境声音的音频信号的各种噪声抑制参数的合意性。在一些实施例中,通过框166到170的每次重复,电子装置10可以通过逐渐改变某些噪声抑制参数(例如,逐渐增加或减少噪声抑制强度)直到用户的噪声抑制偏好已经稳定下来为止来“调谐”测试噪声抑制参数。在其它实施例中,电子装置10可以在每次重复框166到170时测试不同类型的噪声抑制参数(例如,在一次重复时测试噪声抑制强度,在另一次重复时测试某些频率的噪声抑制,等等)。在任何情况下,框166到170可以一直重复到已经获得了所需数目的用户偏好为止(决策框172)。基于在框170处获得的所指示的用户偏好,电子装置10可以形成用户特定的噪声抑制参数102(框174)。举例来说,电子装置10可以在框166到170的重复已经稳定下来时,基于框170的用户反馈来到达优选的用户特定的噪声抑制参数组102。在另一实例中,如果框166到170的重复各自测试特定的噪声抑制参数组,则电子装置10可以基于所指示的对特定参数的偏好来形成复杂的用户特定的噪声抑制参数组。用户特定的噪声抑制参数102可以存储在电子装置10的存储器14或非易失性存储装置16中(框176),用于在同一用户稍后使用电子装置10的与语音有关的特征时进行噪声抑制。图10到13涉及电子装置10可以实施图9的流程图160的特定方式。确切地说,图10及11涉及图9的流程图160的框162及164,且图12及13A-B涉及框166到172。转向图10,双装置语音记录系统180包含计算机或其它电子装置132及手持装置34。在一些实施例中,手持装置34可以通过通信电缆134或经由无线通信(例如,802. Ilxffi-Fi WLAN或蓝牙PAN)加入计算机或其它电子装置132。在系统180的操作期间,计算机或其它电子装置132可以提示用户在背景中播放各种干扰因素182中的一者或一者以上时说一个单词或短语。举例来说,此些干扰因素182可以包含起皱的纸184、七嘴八舌的人186、白噪声188、摇滚乐190及/或马路噪声192的声音。举例来说,干扰因素182可以另外或替代地包含在各种场合56中通常遇到的其它噪声,例如上文参照图3论述的噪声。从计算机或其 它电子装置132大声播放的这些干扰因素182可以在用户提供用户语音样本194的同时被手持装置34的麦克风32拾取。以此方式,手持装置34可以获得包含干扰因素182及用户语音样本194两者的测试音频信号。在由图11的单装置语音记录系统200表示的另一实施例中,手持装置34可以同时既输出干扰因素182又记录用户语音样本194。如图11所示,手持装置34可以提示用户说一个单词或短语用于用户语音样本194。同时,手持装置34的扬声器48可以输出一个或一个以上干扰因素182。手持装置34的麦克风32接着可以在没有计算机或其它电子装置132的情况下记录测试音频信号,此信号包含当前播放的干扰因素182及用户语音样本194两者。对应于框166到170,图12说明用于基于应用于测试音频信号的噪声抑制参数的选择来确定用户的噪声抑制偏好的实施例。确切地说,此处表示为手持装置34的电子装置10可以向包含用户语音样本194及至少一个干扰因素182两者的测试音频信号应用第一组噪声抑制参数(“A”)。手持装置34可以输出所得的经过噪声抑制的音频信号(标号212)。手持装置34还可在输出所得的经过噪声抑制的音频信号之前向测试音频信号应用第二组噪声抑制参数(“B” )(标号214)。当用户已经听到将两组噪声抑制参数“A”及“B”应用于测试音频信号的结果时,手持装置34可以例如问用户“您偏好A还是B ”(编号216)。用户接着可以基于输出的经过噪声抑制的信号来指示噪声抑制偏好。举例来说,用户可以经由手持装置34上的屏幕218来选择第一经过噪声抑制的音频信号(“A”)或第二经过噪声抑制的音频信号(“B”)。在一些实施例中,用户可以例如通过大声说“A”或“B”来用其它方式指示偏好。电子装置10可以用各种方式确定对特定噪声抑制参数的用户偏好。图13的流程图220表示用于执行图9的流程图160的框166到172的方法的一个实施例。流程图220可以在电子装置10应用一组噪声抑制参数(出于示范性目的,标记为“A”及“B”)时开始。如果用户偏好噪声抑制参数“A” (决策框224),电子装置10接下来可以应用新的噪声抑制参数组,所述参数出于类似说明目的被标记为“C”及“D”(框226)。在某些实施例中,噪声抑制参数“C”及“D”可以是噪声抑制参数“A”的变化形式。如果用户偏好噪声抑制参数“C”(决策框228),则电子装置可以将噪声抑制参数设置成“A”与“C”的组合(框230)。如果用户偏好噪声抑制参数“D”(决策框228),则电子装置可以将用户特定的噪声抑制参数设置成噪声抑制参数“A”与“D”的组合(框232)。如果在框222之后,用户偏好噪声抑制参数“B”(决策框224),则电子装置10可以应用新的噪声抑制参数“C”及“D”(框234)。在某些实施例中,新的噪声抑制参数“C”及“D”可以是噪声抑制参数“B”的变化形式。如果用户偏好噪声抑制参数“C”(决策框236),则电子装置10可以将用户特定的噪声抑制参数设置成“B”与“C”的组合(框238)。否则,如果用户偏好噪声抑制参数“D”(决策框236),则电子装置10可以将用户特定的噪声抑制参数设置成“B”与“D”的组合(框240)。应当了解,仅将流程图220呈现为执行图9的流程图160的框166到172的一种方式。因此,应当理解,可以测试多得多的噪声抑制 参数,并且可以结合某些干扰因素来具体测试此些参数(例如,在某些实施例中,可以针对分别包含干扰因素182中的每一者的测试音频信号来重复流程图220)。可以用其它方式来执行语音训练序列104。举例来说,在图14的流程图250表示的一个实施例中,首先可以在未在背景中播放任何干扰因素182的情况下获得用户语音样本194(框252)。一般来说,可以在具有非常少的环境声音60的位置(例如,静噪房间)中获得此用户语音样本194,使得用户语音样本194具有相对高的信噪比(SNR)。此后,电子装置10可以将用户语音样本194与各种干扰因素182用电子方式混合(框254)。因此,电子装置10可以使用单个用户语音样本194产生具有各种干扰因素182的一个或一个以上测试音频信号。此后,电子装置10可以确定用户最偏好哪些噪声抑制参数来确定用户特定的噪声抑制参数102。以与图9的框166到170类似的方式,电子装置10可以交替地向在框254处获得的测试音频信号应用某些测试噪声抑制参数以计量用户偏好(框256-260)。电子装置10可以用各种测试噪声抑制参数及用各种干扰因素来重复框256到260的动作,每次都知道关于用户的噪声抑制偏好的更多情况,直到已经获得了合适的用户噪声抑制偏好数据组为止(决策框262)。因此,电子装置10可以测试应用于含有用户的语音以及某些常见环境声音的测试音频信号的各种噪声抑制参数的合意性。与图9的框174类似,电子装置10可以形成用户特定的噪声抑制参数102(框264)。用户特定的噪声抑制参数102可以存储在电子装置10的存储器14或非易失性存储装置16中(框266),以在同一用户稍后使用电子装置10的与语音有关的特征时进行噪声抑制。如上所述,本发明的某些实施例可以涉及在干扰因素182未在背景中大声播放的情况下获得用户语音样本194。在一些实施例中,电子装置10可在用户第一次在不打断用户的情况下在静噪设置中使用电子装置10的与语音有关的特征时获得此用户语音样本194。如图15的流程图270中所表示,在一些实施例中,在电子装置10首次检测到含有用户的语音的音频的足够高的信噪比(SNR)时,电子装置10可以获得此用户语音样本194。图15的流程图270可以在用户正在使用电子装置10的与语音有关的特征时开始(框272)。为了查实用户的身份,电子装置10可以基于麦克风32检测到的音频信号来检测用户的语音简档(框274)。如果在框274中检测到的语音简档表示电子装置的已知用户的语音的语音简档(决策框276),则电子装置10可以应用与所述用户相关联的用户特定的噪声抑制参数102 (框278)。如果用户的身份是未知的(决策框276),则电子装置10可以首先应用默认噪声抑制参数(框280)。电子装置10可以在使用与语音有关的特征时评估麦克风32接收到的音频信号的当前信噪比(SNR)(框282)。如果SNR足够高(例如,高于预设阈值),则电子装置10可以从麦克风32接收的音频中获得用户语音样本194 (框286)。如果SNR不够高(例如,低于阈值)(决策框284),则电子装置10可以继续应用默认噪声抑制参数(框280),继续至少周期性地重新评估SNR。以此方式获得的用户语音样本194可以稍后用于语音训练序列104中,如上文参照图14所论述。在其它实施例中,电子装置10可以采用此用户语音样本194来基于用户语音样本194本身来确定用户特定的噪声抑制参数102。具体来说,除了语音训练序列104之外,还可以基于与用户语音样本194相关联的某些特性来确定用户指定的噪声抑制参数102。举例来说,图16表示用于基于此些用户语 音特性来确定用户特定的噪声抑制参数102的流程图290。当电子装置10获得用户语音样本194时,可以开始流程图290(框292)。用户语音样本可以例如根据图15的流程图270来获得,或者可以在电子装置10提示用户说特定单词或短语时获得。电子装置接下来可以分析与用户语音样本相关联的某些特性(框294)。基于与用户语音样本194相关联的各种特性,电子装置10可以确定用户特定的噪声抑制参数102 (框296)。举例来说,如图17的语音特性图300所示,用户语音样本194可以包含各种语音样本特性302。此些特性302可以尤其包含用户语音样本194的平均频率304、用户语音样本194的频率的可变性306、与用户语音样本194相关联的常见话音声音308、用户语音样本194的频率范围310、用户语音样本的频率中的共振峰位置312,及/或用户语音样本194的动态范围314。这些特性可能会出现,是因为不同用户可能具有不同的话音模式。也就是说,用户的语音的高度或深度、用户说话时的口音及/或口齿不清等等可以被纳入考虑范围,只要它们改变了话音的可测量特点,例如特性302。如上所述,还可以通过直接选择用户设置108来确定用户特定的噪声抑制参数102。一个此实例在图18中作为用于手持装置32的用户设置屏幕序列320出现。当电子装置10显示一包含设置按钮142的主屏140时,可以开始屏幕序列320。选择设置按钮142可以致使手持装置34显示设置屏幕144。选择设置屏幕144上的标记为“电话”的用户可选按钮146,可以致使手持装置34显示电话设置屏幕148,其可以包含各种用户可选按钮,其中的一者可以是标记为“噪声抑制”的用户可选按钮322。当用户选择用户可选按钮322时,手持装置34可以显示噪声抑制选择屏幕324。通过噪声抑制选择屏幕324,用户可以选择噪声抑制强度。举例来说,用户可以经由选择轮盘326来选择噪声抑制是应当高、中还是低强度。选择较高的噪声抑制强度可能会产生抑制接收到的音频信号中的较多环境声音60但是可能也抑制较多用户58的语音的用户特定的噪声抑制参数102。选择较低的噪声抑制强度可能会产生准许接收到的音频信号中保留较多环境声音60但是也准许保留较多用户58的语音的用户特定的噪声抑制参数102。在其它实施例中,用户可以在使用电子装置10的与语音有关的特征时实时调整用户特定的噪声抑制参数102。举例来说,如图19的可以在手持装置34上显示的进行中的呼叫屏幕330中所见,用户可以提供语音电话呼叫质量反馈332的测量值。在某些实施例中,可以通过若干可选星级334来表示反馈以指示呼叫质量。如果用户选择的星级334的数目较高,则可以理解用户对当前用户特定的噪声抑制参数102感到满意,且因此电子装置10可能不改变噪声抑制参数。另一方面,如果所选星级334的数目较低,则电子装置10可以改变用户特定的噪声抑制参数102,直到星级334的数目增加,从而指示用户满意为止。此外或替代地,进行中的呼叫屏幕330可以包含实时用户可选噪声抑制强度设置,例如上文参照图18揭示的设置。在某些实施例中,可以与某些干扰因素182及/或某些场合60相关联地确定用户特定的噪声抑制参数102的子组。如图20的参数 图340说明,用户特定的噪声抑制参数102可以基于特定干扰因素182划分成子组。举例来说,用户特定的噪声抑制参数102可以包含干扰因素特定的参数344-352,所述参数可以表示经过选择以从还包含用户58的语音的音频信号中过滤与干扰因素182相关联的某些环境声音60的噪声抑制参数。应当理解,用户特定的噪声抑制参数102可以包含较多或较少的干扰因素特定的参数。举例来说,如果在语音训练104期间测试了不同的干扰因素182,则用户特定的噪声抑制参数102可以包含不同的干扰因素特定的参数。可以在确定用户特定的噪声抑制参数102时确定干扰因素特定的参数344-352。举例来说,在语音训练104期间,电子装置10可以使用包含各种干扰因素182的测试音频信号来测试多个噪声抑制参数。依据与每一干扰因素182的噪声抑制相关的用户偏好,电子装置可以确定干扰因素特定的参数344-352。举例来说,电子装置可以基于包含起皱的纸干扰因素184的测试音频信号来确定用于起皱的纸的参数344。如下文所述,在特定例子中,参数图340的干扰因素特定的参数可以稍后被重新调用,例如当在存在某些环境声音60及/或在某些场合56中使用电子装置10时。此外或替代地,可以相对于可以使用电子装置10的与语音有关的特征的某些场合56来定义用户特定的噪声抑制参数102的子组。举例来说,如图21所示的参数图360所表示,可以基于可最好地使用噪声抑制参数的场合56,将用户特定的噪声抑制参数102划分成子组。举例来说,用户特定的噪声抑制参数102可以包含场合特定的参数364-378,其表示经选择以过滤可能与特定场合56相关联的某些环境声音60的噪声抑制参数。应当理解,用户特定的噪声抑制参数102可以包含较多或较少的场合特定的参数。举例来说,如下文论述,电子装置10可能能够识别各种场合56,其中的每一者可以具有特定的预期的环境声音60。因此,用户特定的噪声抑制参数102可以包含不同的场合特定的参数以抑制可识别的场合56中的每一者中的噪声。与干扰因素特定的参数344-352 —样,可以在确定用户特定的噪声抑制参数102时确定场合特定的参数364-378。举一个实例,在语音训练104期间,电子装置10可以使用包含各种干扰因素182的测试音频信号来测试多个噪声抑制参数。依据与每一干扰因素182的噪声抑制相关的用户偏好,电子装置10可以确定场合特定的参数364-378。电子装置10可以基于场合特定的参数364到378中的每一者的场合56与一个或一个以上干扰因素182之间的关系来确定场合特定的参数364到378。具体来说,应当注意,电子装置10可以识别的场合56中的每一者可以与一个或一个以上特定的干扰因素182相关联。举例来说,在车上70的场合56可能主要与一个干扰因素182 (即,马路噪声192)相关联。因此,在车上的场合特定的参数376可以基于与包含马路噪声192的测试音频信号有关的用户偏好。类似地,体育赛事72的场合56可能与若干干扰因素182 (例如七嘴八舌的人186、白噪声188及摇滚乐190)相关联。因此,用于体育赛事的场合特定的参数368可以基于与包含七嘴八舌的人186、白噪声188及摇滚乐190的测试音频信号有关的用户偏好的组合。可以对此组合进行加权以更加偏重考虑预期与场合56的环境声音60更加密切地匹配的干扰因素182。如上所述,可以在有或没有语音训练104的情况下,基于用户语音样本194的特性来确定用户特定的噪声抑制参数102 (例如,如上文参照图16及17所述)。在此些状况下,电子装置10可以另外或替代地自动(例如,没有用户提示)确定干扰因素特定的参数344-352及/或场合特定的参数364-378。可以基于应用于用户语音样本194及某些干扰因素182时此些噪声抑制参数的预期性能来确定这些噪声抑制 参数344-352及/或363-378。当在使用电子装置10的与语音有关的特征时,电子装置10可以使用干扰因素特定的参数344-352及/或场合特定的参数364-378针对用户及环境声音60的特点两者来定制噪声抑制20。具体来说,图22说明用于基于环境声音60的评估的特点来选择及应用干扰因素特定的参数344-352的方法的实施例。图23说明用于基于识别出的使用电子装置10的场合56来选择及应用场合特定的参数364-378的方法的实施例。转向图22,用于选择及应用干扰因素特定的参数344-352的流程图380可以在使用电子装置10的与语音有关的特征时开始(框382)。接下来,电子装置10可以确定其麦克风32接收到的环境声音60的特点(框384)。在一些实施例中,电子装置10可以例如基于音量级别(例如,用户的语音58 —般可能大于环境声音60)及/或频率(例如,环境声音60可能会在与用户的语音58相关联的频率范围外部发生)来区分环境声音60与用户的语音58。环境声音60的特点可能类似于干扰因素182中的一者或一者以上。因此,在一些实施例中,电子装置10可以应用干扰因素特定的参数344-352中与环境声音60最密切地匹配的一个参数(框386)。举例来说,对于在饭店74的场合56,麦克风32检测到的环境声音60可能与七嘴八舌的人186最密切地匹配。电子装置10因此可以在检测到此些环境声音60时应用干扰因素特定的参数346。在其它实施例中,电子装置10可以应用干扰因素特定的参数344-352中与环境声音60最密切地匹配的几个参数。可以基于环境声音60与对应干扰因素182的相似度来对这几个干扰因素特定的参数344-352进行加权。举例来说,体育赛事72的场合56可能具有类似于几个干扰因素182 (例如七嘴八舌的人186、白噪声188及摇滚乐190)的环境声音60。当检测到此些环境声音60时,电子装置10可以与每一者与环境声音60的相似度成比例地应用几个相关联的干扰因素特定的参数346、348及/ 或 350。以类似的方式,电子装置10可以基于识别出的使用电子装置10的场合56来选择及应用场合特定的参数364-378。转向图23,用于进行此操作的流程图390可以在使用电子装置10的与语音有关的特征时开始(框392)。接下来,电子装置10可以确定正在使用电子装置10的当前场合56 (框394)。具体来说,电子装置10可以考虑各种装置场合因素(下文参照图24更详细论述)。基于经确定在使用电子装置10的场合56,电子装置10可以应用场合特定的参数364-378中的相关联的一者(框396)。
如图24的装置场合因数图400所示,电子装置10可以考虑各种装置场合因数402来识别正在使用电子装置10的当前场合56。可以单独或结合各种实施例考虑这些装置场合因数402,并且在一些情况下可以对装置场合因数402进行加权。也就是说,可以在确定场合56时给更加可能正确地预测当前场合56的装置场合因数402更大的加权,而可以给不太可能正确地预测当前场合56的装置场合因数402更小的加权。举例来说,装置场合因数402中的第一因数404可以是电子装置10的麦克风32检测到的环境声音60的特点。由于环境声音60的特点可能与场合56有关,所以电子装置10可以至少部分地基于此分析来确定场合56。装置场合因数402中的第二因数406可以是当前日期或一天中的时间。在一些实施例中,电子装置10可以将当前日期及/或时间与电子装置10的日历特征比较以确定场合。举例来说,如果日历特征指示用户预期在用餐,则第二特征406可以偏重于确定场合56是饭店74。在另一实例中,由于早晨或傍晚用户可能在赶路,所以在此些时间第二因数406可以偏重于确定场合56是车上70。 装置场合因数402中的第三因数408可以是电子装置10的当前位置,其可通过位置感测电路22来确定。使用第三因数408,电子装置10可以在确定场合56时,例如通过将当前位置与电子装置10的地图特征中的已知位置(例如,饭店74或办公室64)或电子装置10通常所在的位置(其可例如指示办公室64或家里62)比较来考虑其当前位置。装置场合因数402中的第四因数410可以是例如经由电子装置的图像捕获电路28在电子装置10周围检测到的环境光的量。举例来说,大量环境光可以与某些位于户外的场合56 (例如,繁忙的街道68)相关联。在此些状况下,因数410可以偏重于位于户外的场合56。相比之下,较低量的环境光可以与某些位于室内(例如,在家62)的场合56相关联,在此情况下,因数410可以偏重于此室内场合56。装置场合因数402中的第五因数412可以是电子装置10的检测到的运动。可以基于加速计及/或磁力计30及/或基于位置感测电路22确定的随时间的位置变化来检测此运动。运动可以用各种方式来暗示给定场合56。举例来说,当检测到电子装置10在非常快速地移动(例如,比每小时20英里快)时,因数412可以偏重于电子装置10处在车上70或类似形式的交通工具中。当电子装置10在随机移动时,因数412可以偏重于电子装置10的用户可能在四处移动的场合(例如,在健身馆66或派对76)。当电子装置10大部分时间固定的时候,因数412可以偏重于用户一段时间内坐在一个位置上的场合56 (例如,办公室64或饭店74)。装置场合因数402中的第六因数414可以是与另一装置(例如,蓝牙手持机)的连接。举例来说,与车载免提电话系统的蓝牙连接可以致使第六因数414偏重于确定场合56是在车上70。在一些实施例中,电子装置10可以基于与电子装置10的给定用户相关联的用户语音简档来确定用户特定的噪声抑制参数102。所得的用户特定的噪声抑制参数102可以致使噪声抑制20将看起来不与用户语音简档相关联且因此可以被理解为可能是噪声的环境声音60隔离。图25到29与此些技术有关。如图25所示,用于获得用户语音简档的流程图420可以在电子装置10获得语音样本时开始(框422)。此语音样本可以用上文所述的方式中的任一者来获得。电子装置10可以分析语音样本的某些特性,例如上文参照图论述的那些特性(框424)。可以将特定特性量化及存储为用户的语音简档(框426)。可以采用所确定的用户语音简档来针对用户的语音定制噪声抑制20,如下所述。此外,用户语音简档可以使得电子装置10能够识别何时特定用户在使用电子装置10的与语音有关的特征,例如上文参照图15所述。使用此语音简档,电子装置10可以用最适用于所述用户的语音的方式来执行噪声抑制20。在一个实施例中,如图26的流程图430所表示,电子装置10可以抑制音频信号的更可能对应于环境声音60而不是用户的语音58的频率,同时增强更可能对应于语音信号58的频率。流程图430可以在用户正在使用电子装置10的与语音有关的特征时开始(框432)。电子装置10可以将接收到的包含用户语音信号58及环境声音60两者的音频信号与同当前对电子装置10中说话的用户相关联的用户语音简档比较(框434)。为了针对用户的语音来定制噪声抑制20,电子装置可以用抑制音频信号的不与用户语音简档相关联的频率的方式且通过放大音频信号的与用户语音简档相关联的频率来执行噪声抑制20 (框 436)。
图27到29展示了进行此操作的一种方式,其表示将音频信号、用户语音简档及传出的经过噪声抑制的信号建模的曲线图。转向图27,曲线图440表示已经在使用与语音有关的特征时被接收到电子装置10的麦克风32中并且被变换到频率域中的音频信号。纵坐标442表示音频信号的频率的量值,且横坐标444表示音频信号的各种离散频率分量。应当理解,可以采用任何合适的变换(例如,快速傅立叶变换(FFT))将音频信号变换到频率域中。类似地,可以将音频信号划分成任何合适数目的离散频率分量(例如,40、128、256
坐^
寸/ ο相比之下,图28的曲线图450是将与用户语音简档的频率建模的曲线图。纵坐标452表示用户语音简档的频率的量值,且横坐标454表示用户语音简档的离散频率分量。将图27的音频信号曲线图440与图28的用户语音简档曲线图450比较,可以看出建模的音频信号包含通常不与用户语音简档相关联的频率范围。也就是说,建模的音频信号除了用户的语音之外可能还包含其它环境声音60。根据此比较,当电子装置10实施噪声抑制20时,其可以确定或选择用户特定的噪声抑制参数102,使得曲线图440的音频信号的对应于曲线图450的用户语音简档的频率的频率大体上被放大,而其它频率大体上被抑制。通过图29的曲线图460将此所得的经过噪声抑制的音频信号建模。曲线图460的纵坐标462表示经过噪声抑制的音频信号的频率的量值,且横坐标464表示经过噪声抑制的信号的离散频率分量。曲线图460的经过放大的部分466大体上对应于在用户语音简档中发现的频率。相比之下,曲线图460的经过抑制的部分468对应于经过噪声抑制的信号的不与曲线图450的用户简档相关联的频率。在一些实施例中,可以将较大量的噪声抑制应用于不与曲线图450的用户语音简档相关联的频率,而可以将较少量的噪声抑制应用于部分466,此部分可以被放大或者可以不被放大。上文的论述大体上集中于确定用于对传出的音频信号执行噪声抑制20的TX NS84的用户特定的噪声抑制参数102,如图4所示。然而,如上所述,用户特定的噪声抑制参数102也可以用于对来自另一装置的传入音频信号执行RX NS 92。由于此来自另一装置的传入音频信号将不包含用户自己的语音,所以在某些实施例中,可以基于除了几个干扰因素182之外还涉及几个测试语音的语音训练104来确定用户特定的噪声抑制参数102。
举例来说,如图30的流程图470呈现,电子装置10可以经由涉及预先记录的或模拟的语音及模拟干扰因素182的语音训练104来确定用户特定的噪声抑制参数102。语音训练104的此实施例可以涉及包含各种差值语音及干扰因素182的测试音频信号。流程图470可以在用户起始语音训练104时开始(框472)。电子装置10不是只基于用户自己的语音来执行语音训练104,而是可以对含有各种语音的各种测试音频信号应用各种噪声抑制参数,在某些实施例中所述语音中的一者可以是用户的语音(框474)。此后,电子装置10可以查实用户对于对各种测试音频信号测试的不同噪声抑制参数的偏好。应当理解,可以用与图9的框166-170类似的方式实施框474。
基于在框474处来自用户的反馈,电子装置10可以形成用户特定的噪声抑制参数102 (框476)。基于图30的流程图470形成的用户特定的参数102可能非常适合于应用于接收到的音频信号(例如,用于形成RX NS参数94,如图4所示)。确切地说,当电子装置10被“近端”用户用作电话与“远端”用户说话时,接收到的音频信号将包含不同的语音。因此,如图31的流程图480所示,依据从远端用户接收到的音频信号中的远端用户的语音的特点,可以将使用例如参照图30所述的技术的技术来确定的用户特定的噪声抑制参数102应用于所述音频信号。流程图480可以在电子装置10的与语音有关的特征(例如,电话或聊天特征)正在使用且在从另一电子装置10接收到包含远端用户的语音的音频信号时开始(框482)。随后,电子装置10可以确定音频信号中的远端用户的语音的特点(框484)。举例来说,进行此操作可能必须将接收到的音频信号中的远端用户的语音与在语音训练104(当如上文参照图30论述执行时)期间测试的某些其它语音比较。接下来,电子装置10可以应用对应于其它语音中最类似于最终用户的语音的一个语音的用户特定的噪声抑制参数102 (框486)。总地来说,当第一电子装置10在双向通信期间从第二电子装置10时接收到含有远端用户的语音的音频信号时,可能在第二电子装置10中已经处理了此音频信号以进行噪声抑制。根据某些实施例,第二电子装置10中的此噪声抑制可以针对第一电子装置10的近端用户而定制,如图32的流程图490所述。流程图490可以在第一电子装置10 (例如,图33的手持装置34A)正在或即将开始从第二电子装置10(例如,手持装置34B)接收远端用户的语音的音频信号时开始(框492)。第一电子装置10可以将先前由近端用户确定的用户特定的噪声抑制参数102发射到第二电子装置10 (框494)。此后,第二电子装置10可以对传出音频信号中的远端用户的语音的噪声抑制应用那些用户特定的噪声抑制参数102 (框496)。因此,包含从第二电子装置10发射到第一电子装置10的远端用户的语音的音频信号可以具有第一电子装置10的近端用户偏好的噪声抑制特性。可以使用两个电子装置10系统地采用图32的上述技术,所述电子装置说明为图33的系统500,包含具有类似的噪声抑制能力的手持装置34A及34B。当近端用户及远端用户分别通过网络(例如,使用电话或聊天特征)将手持装置34A及34B用于相互通信时,手持装置34A及34B可以交换与其相应用户相关联的用户特定的噪声抑制参数102(框504及506)。也就是说,手持装置34B可以接收与手持装置34A的近端用户相关联的用户特定的噪声抑制参数102。同样,手持装置34A可以接收与手持装置34B的远端用户相关联的用户特定的噪声抑制参数102。此后,手持装置34A可以基于远端用户的用户特定的噪声抑制参数102对近端用户的音频信号执行噪声抑制20。同样,手持装置34B可以基于近端用户的用户特定的噪声抑制参数102对远端用户的音频信号执行噪声抑制20。以此方式,手持装置34A及34B的相应用户可以听到来自另一方的噪声抑制与其相应偏好匹配的音频信
号。 已经举例展示了上述特定实施例,且应当理解,这些实施例可以得到各种修改及替代形式。应进一步理解,权利要求书并不意图限于所揭示的特定形式,而是涵盖所有属于本发明的精神及范围内的修改、等效物及替代形式。
权利要求
1.ー种方法,其包括 在使用电子装置的与语音有关的特征时在所述电子装置中接收包含用户语音的音频信号;以及 使用所述电子装置至少部分地基于用户特定的噪声抑制參数来抑制所述音频信号中的噪声同时实质上保留所述用户语音,其中所述用户特定的噪声抑制參数至少部分是基于用户噪声抑制偏好或用户语音简档或其组合。
2.根据权利要求I所述的方法,其中所述用户噪声抑制偏好至少部分是基于用户噪声抑制训练序列。
3.根据权利要求2所述的方法,其中所述用户噪声抑制训练序列包括在已经对测试音频信号测试了噪声抑制參数且将所述噪声抑制參数回放给所述用户之后在所述电子装置中接收用户对偏好的噪声參数的选择。
4.根据权利要求2所述的方法,其中所述用户噪声抑制训练序列包括测试应用于包含用户语音样本及至少ー个干扰因素的测试音频信号的噪声抑制參数。
5.根据权利要求I所述的方法,其中所述用户噪声抑制偏好至少部分是基于用户选择的噪声抑制设置。
6.根据权利要求5所述的方法,其中所述用户选择的噪声抑制设置包括噪声抑制強度设置。
7.根据权利要求5所述的方法,其中所述用户选择的噪声抑制设置可以在使用所述电子装置的所述与语音有关的特征时由用户实时选择。
8.根据权利要求I所述的方法,其中所述用户特定的噪声抑制參数至少部分地通过放大与所述用户语音简档相关联的频率来抑制所述音频信号中的噪声同时实质上保留所述用户语音。
9.根据权利要求I所述的方法,其中所述用户特定的噪声抑制參数至少部分地通过抑制不与所述用户语音简档相关联的频率来抑制所述音频信号中的噪声同时实质上保留所述用户语音。
10.一种制造品,其包括 ー个或ー个以上有形的机器可读的存储媒体,其上面编码有用于由处理器执行的指令,所述指令包括 用以确定包含用户语音样本及至少ー个干扰因素的测试音频信号的指令; 用以至少部分地基于第一噪声抑制參数对所述测试音频信号应用噪声抑制以获得第一经过噪声抑制的音频信号的指令; 用以致使所述第一经过噪声抑制的音频信号被输出到扬声器的指令; 用以至少部分地基于第二噪声抑制參数对所述测试音频信号应用噪声抑制以获得第ニ经过噪声抑制的音频信号的指令; 用以致使所述第二经过噪声抑制的音频信号被输出到所述扬声器的指令; 用于获得对所述第一经过噪声抑制的音频信号或所述第二经过噪声抑制的音频信号的用户偏好的指示的指令;以及 用以依据对所述第一经过噪声抑制的信号或所述第二经过噪声抑制的信号的所述用户偏好的所述指示至少部分地基于所述第一噪声抑制參数或所述第二噪声抑制參数来确定用户特定的噪声抑制參数的指令,其中所述用户特定的噪声抑制參数经配置以在使用所述电子装置的与语音有关的特征时抑制噪声。
11.根据权利要求10所述的制造品,其中所述用以确定所述测试音频信号的指令包括用以在所述干扰因素正在所述扬声器上大声播放时使用麦克风记录所述用户语音样本的指令。
12.根据权利要求10所述的制造品,其中所述用以确定所述测试音频信号的指令包括用以在所述干扰因素正在另ー装置上大声播放时使用麦克风记录所述用户语音样本的指令。
13.根据权利要求10所述的制造品,其中所述用以确定所述测试音频信号的指令包括用以使用麦克风记录所述用户语音样本且用电子方式将所述用户语音样本与所述干扰因素混合的指令。
14.根据权利要求10所述的制造品,其包括 用以至少部分地基于第三噪声抑制參数对所述测试音频信号应用噪声抑制以获得第三经过噪声抑制的音频信号的指令; 用以致使所述第三经过噪声抑制的音频信号被输出到所述扬声器的指令; 用以至少部分地基于第四噪声抑制參数对所述测试音频信号应用噪声抑制以获得第四经过噪声抑制的音频信号的指令; 用以致使所述第四经过噪声抑制的音频信号被输出到所述扬声器的指令; 用以获得对所述第三经过噪声抑制的音频信号或所述第四经过噪声抑制的音频信号的用户偏好的指示的指令;以及 用以依据对所述第三经过噪声抑制的音频信号或所述第四经过噪声抑制的音频信号的所述用户偏好的所述指示至少部分地基于所述第一噪声抑制參数、所述第二噪声抑制參数、所述第三噪声抑制參数或所述第四噪声抑制參数或其组合来确定所述用户特定的噪声抑制參数的指令。
15.根据权利要求14所述的制造品,其包括用以至少部分地基于对所述第一经过噪声抑制的音频信号或所述第二经过噪声抑制的音频信号的所述用户偏好来确定所述第三噪声抑制參数及所述第四噪声抑制參数的指令。
16.一种电子装置,其包括 麦克风,其经配置以获得包含用户语音及环境声音的音频信号; 噪声抑制电路,其经配置以至少部分地基于用户及场合特定的噪声抑制參数对所述音频信号应用噪声抑制,以抑制所述音频信号的所述环境声音; 存储器,其经配置以存储至少部分地基于对应用于用户语音样本及多个干扰因素的噪声抑制參数的测试而确定的多个噪声抑制參数;以及 数据处理电路,其经配置以通过确定所述电子装置的当前使用场合及选择所述多个噪声抑制參数中的至少ー者来将所述用户及场合特定的噪声抑制參数提供到所述噪声抑制电路,其中所述多个噪声抑制參数中的所述至少一者是至少部分地基于对应用于所述用户语音样本及所述多个干扰因素中的至少ー者的噪声抑制參数的测试而确定的,其中所述多个干扰因素中的所述至少一者与所述当前使用场合相关联。
17.根据权利要求16所述的电子装置,其中所述数据处理电路经配置以通过分析所述音频信号的所述环境声音来确定所述电子装置的所述当前使用场合且通过确定所述多个干扰因素中的哪ー些与所述环境声音类似来确定所述多个干扰因素中与所述当前使用场合相关联的所述至少一者。
18.根据权利要求16所述的电子装置,其中所述数据处理电路经配置以至少部分地基于以下内容来确定所述电子装置的所述当前使用场合来自所述电子装置的内部时钟的日期或时间或其组合、来自所述电子装置的位置感测电路的位置、来自所述电子装置的图像捕获电路的环境光的量、来自所述电子装置的运动感测电路的所述电子装置的运动、与另ー电子装置的连接或来自所述麦克风的所述环境声音的音量或其任何组合,且其中所述数据处理电路经配置以通过确定所述多个干扰因素中的哪ー些类似于所述确定的使用场合中的预期环境声音来确定所述多个干扰因素中与所述当前使用场合相关联的所述至少一者。
19.一种电子装置,其包括 麦克风,其经配置以获得包含用户语音及环境声音的音频信号; 噪声抑制电路,其经配置以至少部分地基于用户特定的噪声抑制參数对所述音频信号应用噪声抑制,以抑制所述音频信号的所述环境声音;以及 数据处理电路,其经配置以提供所述用户特定的噪声抑制參数,其中所述数据处理电路经配置以至少部分地基干与所述用户语音相关联的用户语音简档来确定所述用户特定的噪声抑制參数。
20.根据权利要求19所述的电子装置,其中所述数据处理电路经配置以至少部分地基于用户语音样本来确定所述用户语音简档,其中所述麦克风经配置以在所述电子装置的激活周期期间获得所述用户语音样本。
21.根据权利要求19所述的电子装置,其中所述数据处理电路经配置以至少部分地基于用户语音样本来确定所述用户语音简档,其中所述麦克风经配置以通过监视在使用所述电子装置的与语音有关的特征时获得的另一音频信号的信噪比且在所述另一音频信号的所述信噪比超过阈值时记录所述另一音频信号来获得所述用户语音样本。
22.根据权利要求19所述的电子装置,其中所述数据处理电路经配置以确定所述用户语音是否对应于已知用户,且在所述用户语音对应于所述已知用户时,重新调用与所述用户语音相关联的所述用户语音简档。
23.根据权利要求19所述的电子装置,其中所述数据处理电路经配置以确定所述用户语音是否对应于已知用户,且在所述用户语音不对应于所述已知用户时,通过获得用户语音样本及至少部分地基于所述用户语音样本来确定与所述用户语音相关联的所述用户语音简档而确定所述用户语音简档。
24.—种系统,其包括 第一电子装置,其经配置以从与所述第一电子装置相关联的麦克风获得第一用户语音信号,将所述第一用户语音信号提供到第二电子装置,且从所述第二电子装置接收第二用户噪声抑制參数,其中所述第一电子装置经配置以在将所述第一用户语音信号提供到所述第二电子装置之前至少部分地基于所述第二用户噪声抑制參数对所述第一用户语音信号应用噪声抑制。
25.根据权利要求24所述的系统,其中所述第一电子装置经配置以将第一用户噪声抑制參数提供到所述第二电子装置且从所述第二电子装置接收第二用户语音信号,其中在所述第一电子装置接收到所述第二用户语音信号之前,已经至少部分地基于所述第一用户噪 声抑制參数对所述第二用户语音信号应用噪声抑制。
全文摘要
本发明提供用于用户特定的噪声抑制的系统、方法及装置。举例来说,当在使用电子装置(10)的与语音有关的特征时,所述电子装置(10)可能会接收到包含用户语音的音频信号。因为此时例如环境声音(60)等噪声也可能会被所述电子装置(10)接收,所以电子装置(10)可以抑制所述音频信号中的此噪声。确切地说,所述电子装置(10)可以经由用户特定的噪声抑制参数抑制所述音频信号中的噪声同时实质上保留用户语音。这些用户特定的噪声抑制参数可以至少部分地基于用户噪声抑制偏好或用户语音简档或其组合。
文档编号G10L21/0208GK102859592SQ201180021126
公开日2013年1月2日 申请日期2011年5月18日 优先权日2010年6月4日
发明者阿拉姆·林达尔, 巴蒂斯特·皮埃尔·帕基耶 申请人:苹果公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1