一种语音信号处理方法及装置的制造方法

文档序号:10492349
一种语音信号处理方法及装置的制造方法
【专利摘要】本发明实施例提供一种语音信号处理方法及装置,用于解决现有技术存在采集得到的语音信号噪声较大的问题,可以给用户带来更好的声音体验。语音信号处理方式方法包括:通过所述至少两个语音采集设备采集第一语音信号;确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语音信号的声源特征值;根据预设的第一对应关系确定所述至少两个语音采集设备采集到的第一语音信号的声源特征值对应的语音处理方式,所述预设的第一对应的关系包括所述至少两个语音采集设备所对应的声源特征值范围与语音处理方式之间的对应关系;根据所述确定的语音处理方式对所述至少两个语音采集设备采集的第一语音信号进行处理。
【专利说明】
-种语音信号处理方法及装置
技术领域
[0001] 本发明实施例设及信号处理技术领域,尤其设及一种语音信号处理方法及装置。
【背景技术】
[0002] 为了提高手机的语音应用的质量,许多手机厂商都通过增加麦克风数量来增加语 音应用的质量,现有的多麦克风终端主要包括两麦克风终端、=麦克风终端W及四麦克风 终端,而无论是两麦克风终端、=麦克风终端还是四麦克风终端,通常都是设置一个麦克风 作为主麦克风,其他麦克风作为辅麦克风。通过主麦克风主要采集人声信号,其他麦克风主 要采集噪音信号来进行语音处理的,达到降噪的效果。
[0003] 但是现有的两麦克风终端、=麦克风终端W及四麦克风终端,针对不同语音应用 (APP),采用终端预先设定好的麦克风作为主麦克风。比如针对微信语音时,采用设置在底 部的麦克风作为主麦克风,其他的麦克风作为辅麦克风。
[0004] 现在大多数用户不确定针对具体APP所设置的主麦克风,运样会导致用户可能会 将终端预先设定的辅麦克风作为主麦克风进行通信,但是该辅麦克风主要负责采集环境噪 声,从而会造成采集到的用户用于通信的语音信号噪声较大。

【发明内容】

[0005] 本发明实施例提供一种语音信号处理方法及装置,用于解决现有技术存在采集得 到的语音信号噪声较大的问题。
[0006] 本发明实施例提供了一种语音信号处理方法,所述方法应用包括至少两个语音采 集设备的终端,包括:
[0007] 通过所述至少两个语音采集设备采集第一语音信号;
[0008] 确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语音信号的 声源特征值;
[0009] 根据预设的第一对应关系确定所述至少两个语音采集设备采集到的第一语音信 号的声源特征值对应的语音处理方式,所述预设的第一对应的关系包括所述至少两个语音 采集设备所对应的声源特征值范围与语音处理方式之间的对应关系;
[0010] 根据所述确定的语音处理方式对所述至少两个语音采集设备采集的第一语音信 号进行处理。
[0011] 本发明实施例还提供了一种语音信号处理装置,包括:
[0012] 至少两个语音采集模块,分别用于采集第一语音信号,所述至少两个语音采集设 备模块在所述第一语音信号处理装置的位置不同;
[0013] 计算模块,用于确定所述至少两个语音采集模块中每个语音采集模块采集到的第 一语音信号的声源特征值;
[0014] 处理方式确定模块,用于根据预设的第一对应关系确定所述计算模块确定的所述 至少两个语音采集模块采集到的第一语音信号的声源特征值对应的语音处理方式,所述预 设的第一对应的关系包括所述至少两个语音采集模块所对应的声源特征值范围与语音处 理方式之间的对应关系;
[0015] 信号处理模块,用于根据所述确定模块确定的语音处理方式对所述至少两个语音 采集模块采集的第一语音信号进行处理。
[0016] 本发明实施例提供一种语音信号处理装置,包括存储器、处理器W及语音采集设 备,其中,处理器可W用于读取存储器中的程序,执行下列过程:通过所述至少两个语音采 集设备采集第一语音信号;确定所述至少两个语音采集设备中每个语音采集设备采集到的 第一语音信号的声源特征值;根据预设的第一对应关系确定所述至少两个语音采集设备采 集到的第一语音信号的声源特征值对应的语音处理方式,所述预设的第一对应的关系包括 所述至少两个语音采集设备所对应的声源特征值范围与语音处理方式之间的对应关系;根 据所述确定的语音处理方式对所述至少两个语音采集设备采集的第一语音信号进行处理。
[0017] 本发明实施例提供了语音信号处理方法及装置,通过确定的所述至少两个语音采 集设备中每个语音采集设备采集到的第一语音信号的声源特征值;然后所述至少两个语音 采集设备采集到的第一语音信号的声源特征值对应的语音处理方式,根据所述确定的语音 处理方式对所述至少两个语音采集设备采集的第一语音信号进行处理。由于预先设置好所 述至少两个语音采集模块所对应的声源特征值范围与语音处理方式之间的对应关系,通过 声源特征值来匹配最佳的语音处理方式,切换最佳的输入输出设备,达到了很好的降噪效 果,可W给用户带来更好的声音体验。减少了用户对终端的主麦克风所在位置的情况下所 带来的误操作。
【附图说明】
[0018] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发 明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可W根 据运些附图获得其他的附图。
[0019] 图1为本发明提供的一种语音信号处理方法流程图;
[0020] 图2为本发明提供的一种语音信号处理装置流程图。
【具体实施方式】
[0021] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例 中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是 本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员 在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0022] 由于装配两或者=或者四个麦克风的手机的降噪技术针对通话场景提出的或者 基于语音的各种应用提出的,例如各种手机上安装的APP,如微信、QQ里的语音聊天、对讲机 应用、语音录制应用、语音记事本等,不同的APP对应一种主麦克风,其他的麦克风用于降 噪。但是针对某一个应用使用确定的主麦风,如果用户不确定该应用的主麦克风的情况,运 样会导致用户可能会将终端预先设定的辅麦克风作为主麦克风进行通信,但是该辅麦克风 主要负责采集环境噪声,使得降噪的有效性降低了,因此提出了如下面所描述的技术方案, 但不仅限于下面所描述的各实施例。
[0023] 本发明实施例提供一种语音信号处理方法及装置,用于解决现有技术存在采集得 到的语音信号噪声较大的问题。其中,方法和装置是基于同一发明构思的,由于方法及装置 解决问题的原理相似,因此装置与方法的实施可W相互参见,重复之处不再寶述。
[0024] 本发明实施例提供了一种语音信号处理方法,所述方法应用包括至少两个语音采 集设备的终端,所述至少两个语音采集设备设置在所述终端的位置不同。语音采集设备可 W为麦克风,但本发明实施例中不限定麦克风的形式,例如耳麦。
[0025] 如图1所示,该方法包括:
[00%] SlOl,通过所述至少两个语音采集设备采集第一语音信号。
[0027] S102,确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语音信 号的声源特征值。
[0028] S103,根据预设的第一对应关系确定所述至少两个语音采集设备采集到的第一语 音信号的声源特征值对应的语音处理方式。
[0029] 所述预设的第一对应的关系包括所述至少两个语音采集设备所对应的声源特征 值范围与语音处理方式之间的对应关系。
[0030] S104,根据所述确定的语音处理方式对所述至少两个语音采集设备采集的第一语 音信号进行处理。
[0031] 可选地,在确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语 音信号的声源特征值时,可W周期性的确定所述至少两个语音采集设备中每个语音采集设 备采集到的第一语音信号的声源特征值。从而每周期根据预设的第一对应关系确定所述至 少两个语音采集设备采集到的第一语音信号的声源特征值对应的语音处理方式,从而避免 频繁的切换语音处理方式。
[0032] 可选地,根据预设的第一对应关系确定所述至少两个语音采集设备采集到的第一 语音信号的声源特征值对应的语音处理方式,可W但不仅限于通过如下方式实现:
[0033] 第一种实现方式
[0034] 选择所述至少两个语音采集设备中采集到的第一语音信号的声源特征值最大的 语音采集设备采集主声源的语音信号,其他的语音采集设备采集外部环境噪音。
[0035] W两个语音采集设备为例,两个语音采集设备的声源特征值分别通过MKFl、MKF2 表示,第一对应关系可W设置如表1所示。
[0036] 表1
[00971
[0038]在该技术方案中,至少两个语音采集设备可W是多个麦克风,用户在进行正常语 音通话时,使用位于终端下端的麦克风进行通话,则终端下端的麦克风主要获取的是人的 说话声音,而终端的其他位置上的麦克风主要获取的是外部环境的噪音,运样,从终端下端 的麦克风采集的声音中过滤掉终端的其他位置的麦克风采集的外部环境噪音,就可W获取 到清晰的人声,从而达到降噪的目的。
[0039] 第二种实现方式
[0040] 选择所述至少两个语音采集设备中采集到的第一语音信号的声源特征值最大的 两个语音采集设备采集主声源的语音信号,其他的语音采集设备采集外部环境噪音。
[0041] 第二种实现方式适用于包括=个或者=个W上的语音采集设备的终端。
[0042] 可选地,在根据所述确定的语音处理方式对所述至少两个语音采集设备采集的第 一语音信号进行处理时,可W通过如下方式实现:
[0043] 确定本次确定的语音处理方式与上一次确定的语音处理方式不同且采用上一次 确定的语音处理方式的时长达到预设时长阔值时,根据本次确定的语音处理方式对所述至 少两个语音采集设备采集的第一语音信号进行处理。
[0044] 比如用户使用微信过程中,一开始使用终端下端的麦克风作为主麦克风,用于获 取用户发出的声音,其他麦克风用于获取环境噪声,但是用户使用过程中更换了说话姿势, 对准终端上端的麦克风说话的时长达到预设时长阔值时,则可W更换将终端上端的麦克风 作为主麦克风,用于获取用户发出的声音,其他麦克风用于获取环境噪声。
[0045] 可选地,在确定本次确定的语音处理方式与上一次确定的语音处理方式不同且采 用上一次确定的语音处理方式的时长未达到预设时长阔值时,根据上一次确定的语音处理 方式对所述至少两个语音采集设备采集的第一语音信号进行处理。
[0046] 通过上述实现方式,可W避免频繁的切换语音处理方式。例如,用户在打电话过程 中,路过一个增杂的环境,但是在增杂环境中的时间较短,则可W不切换语音处理方式。
[0047] 可选的,在确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语 音信号的声源特征值之前,所述方法包括:
[0048] 确定用于指示自动选择语音处理方式的语音处理模式为开启状态。
[0049] 在确定用于指示自动选择语音处理方式的语音处理模式为关闭状态时,则不再确 定第一语音信号的声源特征值,不再通过本发明实施例提供的方式来确定语音处理方式, 则可W采用现有技术提供的方式,例如针对不同的应用采用对应的语音处理方式。
[0050] 可选地,本发明实施例还可W应用于语音输出设备。终端包括至少一个语音输出 设备。
[0051] 在至少一个语音输出设备输出第二语音信号时,通过所述至少两个语音采集设备 采集第=语音信号,所述第=语音信号至少包括所述第二语音信号;
[0052] 确定所述至少两个语音采集设备中每个语音采集设备采集到的第=语音信号的 声源特征值;
[0053] 根据预设的第二对应关系确定所述至少两个语音采集设备采集到的第=语音信 号的声源特征值对应的语音输出方式,所述预设的第二对应的关系包括所述至少两个语音 采集设备所对应的声源特征值范围与语音输出方式之间的对应关系;
[0054] 根据所述确定的语音输出方式控制所述至少一个语音输出设备输出所述第二语 音信号。
[0055] 在本发明实施例中,语音输出设备可W是卿趴。比如在卿趴播放音乐的过程中,所 述至少两个语音采集设备采集到的除所述音乐之外的其他声音较大时,则可W调高音量来 播放音乐。比如终端包括两个卿趴,终端预先存储有至少两个语音采集设备与所述两个卿 趴的距离,则在播放音乐时,所述至少两个语音采集设备采集到的除所述音乐之外的噪声 较大时,但是距离左声道的语音采集设备采集到的噪声较大时,则可W调高右声道的音量, 调低左声道的音量。
[0056] 通过本发明实施例提供的方式,通过语音采集设备采集到的语音信号的特征值匹 配最佳的语音处理方式,切换最佳的输入输出设备,,达到了很好的降噪效果,可W给用户 带来更好的声音体验。减少了用户对终端的主麦克风所在位置的情况下所带来的误操作。
[0057] 基于同一发明构思,本发明实施例中还提供了一种语音信号处理装置,由于装置 解决问题的原理与方法相似,因此装置的实施可W参见方法的实施,重复之处不再寶述。
[0058] 本发明实施例还提供了一种语音信号处理装置,所述语音信号处理装置应用于终 端。如图2所示,该装置包括:
[0059] 至少两个语音采集模块,本发明实施例W两个为例,分别为第一语音采集模块 201a和第二语音采集模块20化。第一语音采集模块201a和第二语音采集模块20化分别用于 采集第一语音信号。
[0060] 所述第一语音采集模块和第二语音采集模块在终端的位置不同。
[0061 ]计算模块202,用于确定第一语音采集模块201a和第二语音采集模块20化分别采 集到的第一语音信号的声源特征值。
[0062] 处理方式确定模块203,用于根据预设的第一对应关系确定所述计算模块202确定 的第一语音采集模块201a和第二语音采集模块201b分别采集到的第一语音信号的声源特 征值对应的语音处理方式,所述预设的第一对应的关系包括第一语音采集模块201a和第二 语音采集模块20化所对应的声源特征值范围与语音处理方式之间的对应关系。
[0063] 信号处理模块204,用于根据所述处理方式确定模块203确定的语音处理方式对第 一语音采集模块201a和第二语音采集模块20化采集的第一语音信号进行处理。
[0064] 可选的,所述处理方式确定模块203,具体用于:在第一语音采集模块201a和第二 语音采集模块201b中选择声源特征值最大的语音采集模块作为用于采集主声源语音信号 的主设备,其他语音采集模块作为用于采集环境噪声的辅设备。
[0065] 可选地,所述计算模块202,具体用于:
[0066] 周期性的确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语 音信号的声源特征值。
[0067] 可选地,所述信号处理模块204,具体用于:
[0068] 确定本次确定的语音处理方式与上一次确定的语音处理方式不同且采用上一次 确定的语音处理方式的时长达到预设时长阔值时,根据本次确定的语音处理方式对第一语 音采集模块201a和第二语音采集模块20化采集的第一语音信号进行处理。
[0069] 可选地,所述装置还包括:
[0070] 状态确定模块205,用于在所述计算模块202确定所述第一语音采集模块201a和第 二语音采集模块20化采集到的第一语音信号的声源特征值之前,确定用于指示自动选择语 音处理方式的语音处理模式为开启状态。
[0071] 所述装置还可W包括:
[0072] 至少一个语音输出模块206,用于输出第二语音信号;
[0073] 第一语音采集模块201a和第二语音采集模块20化,还用于在所述至少一个语音输 出模块输出第二语音信号时,采集第=语音信号,所述第=语音信号至少包括所述第二语 音信号;
[0074] 所述计算模块202,还用于确定所述第一语音采集模块201a和第二语音采集模块 20化采集到的第=语音信号的声源特征值;
[0075] 输出方式确定模块207,用于根据预设的第二对应关系确定所述第一语音采集模 块201a和第二语音采集模块201b采集到的第=语音信号的声源特征值对应的语音输出方 式,所述预设的第二对应的关系包括所述第一语音采集模块201a和第二语音采集模块20化 所对应的声源特征值范围与语音输出方式之间的对应关系;
[0076] 控制模块,用于根据所述确定的语音输出方式控制所述至少一个语音输出模块 206输出所述第二语音信号。
[0077] 为了描述的方便,W上各部分按照功能划分为各模块(或单元)分别描述。当然,在 实施本发明时可W把各模块(或单元)的功能在同一个或多个软件或硬件中实现。具体实施 时,上述设备识别装置可W设置于服务器中。
[0078] 本发明实施例中可W通过硬件处理器化ardware processor)来实现图2所示的除 语音采集模块W外的相关功能模块。具体的,一种语音信号处理装置,包括存储器、处理器 W及语音采集设备,其中,处理器可W用于读取存储器中的程序,执行下列过程:通过所述 至少两个语音采集设备采集第一语音信号;确定所述至少两个语音采集设备中每个语音采 集设备采集到的第一语音信号的声源特征值;根据预设的第一对应关系确定所述至少两个 语音采集设备采集到的第一语音信号的声源特征值对应的语音处理方式,所述预设的第一 对应的关系包括所述至少两个语音采集设备所对应的声源特征值范围与语音处理方式之 间的对应关系;根据所述确定的语音处理方式对所述至少两个语音采集设备采集的第一语 音信号进行处理。
[0079] W上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可 W是或者也可W不是物理上分开的,作为单元显示的部件可W是或者也可W不是物理单 元,即可W位于一个地方,或者也可W分布到多个网络单元上。可W根据实际的需要选择其 中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性 的劳动的情况下,即可W理解并实施。
[0080] 通过W上的实施方式的描述,本领域的技术人员可W清楚地了解到各实施方式可 借助软件加必需的通用硬件平台的方式来实现,当然也可W通过硬件。基于运样的理解,上 述技术方案本质上或者说对现有技术做出贡献的部分可WW软件产品的形式体现出来,该 计算机软件产品可W存储在计算机可读存储介质中,如R0M/RAM、磁碟、光盘等,包括若干指 令用W使得一台计算机设备(可W是个人计算机,服务器,或者网络设备等)执行各个实施 例或者实施例的某些部分所述的方法。
[0081] 最后应说明的是:W上实施例仅用W说明本发明的技术方案,而非对其限制;尽管 参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可 W对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换; 而运些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和 范围。
【主权项】
1. 一种语音信号处理方法,其特征在于,所述方法应用包括至少两个语音采集设备的 终端,所述至少两个语音采集设备设置在所述终端的位置不同,包括: 通过所述至少两个语音采集设备采集第一语音信号; 确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语音信号的声源 特征值; 根据预设的第一对应关系确定所述至少两个语音采集设备采集到的第一语音信号的 声源特征值对应的语音处理方式,所述预设的第一对应的关系包括所述至少两个语音采集 设备所对应的声源特征值范围与语音处理方式之间的对应关系; 根据所述确定的语音处理方式对所述至少两个语音采集设备采集的第一语音信号进 行处理。2. 根据权利要求1所述的方法,其特征在于,所述根据预设的第一对应关系确定所述至 少两个语音采集设备采集到的第一语音信号的声源特征值对应的语音处理方式,包括: 在所述至少两个语音采集设备中选择声源特征值最大的语音采集设备作为用于采集 主声源语音信号的主设备,其他语音采集设备作为用于采集环境噪声的辅设备。3. 根据权利要求1或2所述的方法,其特征在于,所述根据所述确定的语音处理方式对 所述至少两个语音采集设备采集的第一语音信号进行处理,包括: 确定本次确定的语音处理方式与上一次确定的语音处理方式不同且采用上一次确定 的语音处理方式的时长达到预设时长阈值时,根据本次确定的语音处理方式对所述至少两 个语音采集设备采集的第一语音信号进行处理。4. 根据权利要求1所述的方法,其特征在于,所述确定所述至少两个语音采集设备中每 个语音采集设备采集到的第一语音信号的声源特征值之前,包括: 确定用于指示自动选择语音处理方式的语音处理模式为开启状态。5. 根据权利要求1所述的方法,其特征在于,还包括: 在至少一个语音输出设备输出第二语音信号时,通过所述至少两个语音采集设备采集 第三语音信号,所述第三语音信号至少包括所述第二语音信号; 确定所述至少两个语音采集设备中每个语音采集设备采集到的第三语音信号的声源 特征值; 根据预设的第二对应关系确定所述至少两个语音采集设备采集到的第三语音信号的 声源特征值对应的语音输出方式,所述预设的第二对应的关系包括所述至少两个语音采集 设备所对应的声源特征值范围与语音输出方式之间的对应关系; 根据所述确定的语音输出方式控制所述至少一个语音输出设备输出所述第二语音信 号。6. -种语音信号处理装置,其特征在于,包括: 至少两个语音采集模块,分别用于采集第一语音信号,所述至少两个语音采集设备模 块在所述第一语音信号处理装置的位置不同; 计算模块,用于确定所述至少两个语音采集模块中每个语音采集模块采集到的第一语 音信号的声源特征值; 处理方式确定模块,用于根据预设的第一对应关系确定所述计算模块确定的所述至少 两个语音采集模块采集到的第一语音信号的声源特征值对应的语音处理方式,所述预设的 第一对应的关系包括所述至少两个语音采集模块所对应的声源特征值范围与语音处理方 式之间的对应关系; 信号处理模块,用于根据所述确定模块确定的语音处理方式对所述至少两个语音采集 模块采集的第一语音信号进行处理。7. 根据权利要求6所述的装置,其特征在于,所述处理方式确定模块,具体用于:在所述 至少两个语音采集模块中选择声源特征值最大的语音采集模块作为用于采集主声源语音 信号的主设备,其他语音采集模块作为用于采集环境噪声的辅设备。8. 根据权利要求6或7所述的装置,其特征在于,所述信号处理模块,具体用于: 确定本次确定的语音处理方式与上一次确定的语音处理方式不同且采用上一次确定 的语音处理方式的时长达到预设时长阈值时,根据本次确定的语音处理方式对所述至少两 个语音采集模块采集的第一语音信号进行处理。9. 根据权利要求6所述的装置,其特征在于,还包括: 状态确定模块,用于在所述计算模块确定所述至少两个语音采集模块中每个语音采集 设备采集到的第一语音信号的声源特征值之前,确定用于指示自动选择语音处理方式的语 音处理模式为开启状态。10. 根据权利要求6所述的装置,其特征在于,还包括: 至少一个语音输出模块,用于输出第二语音信号; 所述至少两个语音采集模块,还用于在所述至少一个语音输出模块输出第二语音信号 时,采集第三语音信号,所述第三语音信号至少包括所述第二语音信号; 所述计算模块,还用于确定所述至少两个语音采集模块中每个语音采集模块采集到的 第三语音信号的声源特征值; 输出方式确定模块,用于根据预设的第二对应关系确定所述至少两个语音采集模块采 集到的第三语音信号的声源特征值对应的语音输出方式,所述预设的第二对应的关系包括 所述至少两个语音采集模块所对应的声源特征值范围与语音输出方式之间的对应关系; 控制模块,用于根据所述确定的语音输出方式控制所述至少一个语音输出模块输出所 述第二语音信号。
【文档编号】G10L15/20GK105847497SQ201610184725
【公开日】2016年8月10日
【申请日】2016年3月28日
【发明人】赵宪浩, 刘子超
【申请人】乐视控股(北京)有限公司, 乐视致新电子科技(天津)有限公司
再多了解一些
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1