预处理音频信号的方法和设备的制造方法

文档序号:9794123阅读:393来源:国知局
预处理音频信号的方法和设备的制造方法
【技术领域】
[0001] 本公开涉及处理音频信号,尤其涉及预处理音频信号的方法和设备。
【背景技术】
[0002] 虽然语音识别已经出现数十年,但是语音识别软件和硬件的质量直到最近才达到 足够高的水平以吸引大量消费者。近年来语音识别变得非常普及的一个领域是智能电话和 平板计算机产业。使用启用语音识别的装置,完全通过发音,消费者就可以执行诸如打电 话、写电子邮件、以及用GPS导航这样的任务。
[0003] 但是在这样的装置中语音识别远远未臻完美。在初次使用启用语音识别的装置 时,用户可能需要"训练"语音识别软件来识别他或她的发音。但是,即使经过训练,语音识 别功能也不能在所有声音环境下工作良好。例如,背景噪声的出现会降低语音识别的准确 性。
【附图说明】
[0004] 虽然后附权利要求书通过特性阐述了本技术的特征,但是根据结合附图的以下详 细描述可以更好地理解这些技术,在附图中:
[0005]图1示出用户向电子装置说话,在附图中将电子装置描述为移动装置。
[0006] 图2示出图1的电子装置的示例组件。
[0007] 图3示出可以实施各种实施例的体系结构。
[0008] 图4示出根据本发明实施例可以执行的步骤。
【具体实施方式】
[0009] 根据前述,现在将描述用于预处理音频信号的方法和设备。
[0010] 根据实施例,电子装置能够选择适合于装置操作所在环境的预处理技术。这样,装 置提高了语音识别准确度。在一个实施方式中,装置使用从音频信号本身获得的信息,以及 从一个或多个辅助装置获得的信息。
[0011] 装置能够在多种预处理技术(例如,单麦克风噪声抑制、双麦克风噪声抑制、自适 应噪声消除)中的任何一个中选择并将选择的技术应用于装置的音频输入信号。适当预处 理技术的选择可以取决于背景噪声的等级以及背景噪声的特性(例如,变化性、频谱形状等 等)。
[0012] 根据实施例,一个或多个辅助装置提供可以对其进行预处理过程选择的附加信 息。例如,全球定位信号(GPS)模块可以提供有关装置的位置、装置是否在运动及其速度的 信息。根据装置的位置和速度,可以获得有关背景噪声的等级以及背景噪声的特性的线索。 例如,装置可以放置在安静的家庭环境、繁忙的餐厅、城市街道、或者公路中。它可以静止, 或者以60mph的速度移动。基于装置的位置和速度,可以在类似条件下使用现有知识(例如, 存储的噪声等级和特性的查找表)来推测有关噪声等级和噪声特性的信息。然后可将这样 的信息用于为输入信号选择适当的预处理技术,从而增强语音识别性能。
[0013] 在实施例中,电子装置接收具有音频信息的音频信号,获得辅助信息(诸如位置、 速度、方向、光和温度),并基于音频信息和辅助信息,确定电子装置操作所在音频环境的类 型。装置基于确定的音频环境类型选择音频预处理过程,并根据选择的预处理过程预处理 音频信号。然后,装置可以对经过预处理的音频信号执行语音识别。
[0014] 用于预处理过程的可能实施方式包括直通式信号传输、单麦克风噪声抑制、双麦 克风噪声抑制、以及自适应噪声消除。
[0015] 在实施例中,确定音频环境的类型涉及确定装置是在车辆中、在家里、在餐厅中、 在办公室中、还是在街道上操作。
[0016] 如同这里使用的,装置的"音频环境"表示除了用户语音的声音之外,装置听得见 的声音的特性。背景噪声是音频环境的一部分。
[0017]如同这里使用的,"模块"是在硬件上执行的软件。模块可以在多个硬件元件上执 行,或可以在单个硬件元件上执行。此外,当附图中示出多个模块时,应当理解,实际上模块 可以都在相同的装置上并且在软件的相同整体单元中执行。
[0018] 当本公开提及模块和其他元件相互"提供"信息(数据)时,应当理解,可以有可以 执行这样的动作的多种可能方式,包括沿着传导路径(例如电线)传输的电信号以及对象间 方法调用。
[0019] 这里所述的一些实施例在常通音频(Α0Α)的背景下可用。当使用Α0Α时,装置102 (图1)能够在收到来自用户的触发命令时从休眠模式中苏醒。Α0Α对装置(尤其是移动装置) 提出了附加要求。因此,当装置102能够准确迅速识别用户的发音命令时,Α0Α最有效。
[0020] 参照图1,用户104提供发音输入(或者有声化的信息或语音)106,通过麦克风(或 者其他声音接收器)1〇8,发音输入106被启用语音的电子装置("装置")102接收。装置102 (在本示例中是移动装置)包括触摸屏显示器110,触摸屏显示器110能够显示视觉图像,以 及接收或感测通过用户手指或者其他触摸输入装置(诸如手写笔)提供的触摸式输入。虽然 有触摸屏显示器110,但是在图1所示实施例中,装置102还有充当装置的输入装置的多个分 立键或按钮112。但是,在其他实施例中,这样的键或按钮(或者任何特定数量的这样的键或 按钮)不需要出现,并且触摸屏显示器110可以充当主要或唯一的用户输入装置。
[0021] 虽然图1将装置102特别示出为包括触摸屏显示器110以及键或按钮112,但是这些 部件只是要作为装置102上组件/部件的示例,并且在其他实施例中,装置102不需要包括这 些部件中的一个或多个,和/或除了这些部件之外或者作为这些部件的替代,还可包括其他 部件。
[0022] 装置102是要作为各种装置的代表,例如包括蜂窝电话、个人数字助理(PDA)、智能 电话、或者其他手持或便携电子装置。在替代性实施例中,装置也可以是耳机(例如,蓝牙耳 机)、MP3播放器、电池供电的装置、手表装置(例如,腕表)或其他可佩戴装置、无线电设备、 导航装置、膝上型电脑或笔记本计算机、上网本、寻呼机、PMP(个人媒体播放器)、DVR(数字 视频记录仪)、游戏装置、相机、电子阅读器、电子书、平板装置、带视频功能屏幕的导航装 置、多媒体插接站、或其他装置。
[0023]本公开的实施例是为了可应用于多种电子装置中的任何一个,所述多种电子装置 能够或者被配置为接收指示或代表有声化信息的发音输入或其他声音输入。
[0024]图2示出根据本公开的实施例,图1的装置102的内部组件。如图2所示,内部组件 200包括一个或多个无线收发信机202、处理器204(例如,微处理器、微型计算机、专用集成 电路等等)、存储器部206、一个或多个输出装置208、以及一个或多个输入装置210。此外,内 部组件200可包括组件接口 212,以提供与辅助组件或附件(用于附加或增强功能)的直接连 接。此外,内部组件200可包括诸如电池的电源214,用于在使得移动装置成为可便携式时向 其他内部组件供电。此外,内部组件200附加性地包括一个或多个传感器228。通过一个或多 个内部通信链接232 (例如,内部总线),所有内部组件200都可以相互耦合,并相互通信。 [0025]此外,在图2的实施例中,无线收发信机202特别包括蜂窝收发信机203和Wi-Fi收 发信机205。更具体而言,蜂窝收发信机203被配置为进行蜂窝通信,诸如3G、4G、4G-LTE、面 对面小
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1