一种语音信号处理方法及装置的制造方法

文档序号：10492349阅读：313来源：国知局

一种语音信号处理方法及装置的制造方法
【专利摘要】本发明实施例提供一种语音信号处理方法及装置，用于解决现有技术存在采集得到的语音信号噪声较大的问题，可以给用户带来更好的声音体验。语音信号处理方式方法包括：通过所述至少两个语音采集设备采集第一语音信号；确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语音信号的声源特征值；根据预设的第一对应关系确定所述至少两个语音采集设备采集到的第一语音信号的声源特征值对应的语音处理方式，所述预设的第一对应的关系包括所述至少两个语音采集设备所对应的声源特征值范围与语音处理方式之间的对应关系；根据所述确定的语音处理方式对所述至少两个语音采集设备采集的第一语音信号进行处理。
【专利说明】
-种语音信号处理方法及装置
技术领域
[0001] 本发明实施例设及信号处理技术领域，尤其设及一种语音信号处理方法及装置。
【背景技术】
[0002] 为了提高手机的语音应用的质量，许多手机厂商都通过增加麦克风数量来增加语音应用的质量，现有的多麦克风终端主要包括两麦克风终端、=麦克风终端W及四麦克风终端，而无论是两麦克风终端、=麦克风终端还是四麦克风终端，通常都是设置一个麦克风作为主麦克风，其他麦克风作为辅麦克风。通过主麦克风主要采集人声信号，其他麦克风主要采集噪音信号来进行语音处理的，达到降噪的效果。
[0003] 但是现有的两麦克风终端、=麦克风终端W及四麦克风终端，针对不同语音应用 (APP)，采用终端预先设定好的麦克风作为主麦克风。比如针对微信语音时，采用设置在底部的麦克风作为主麦克风，其他的麦克风作为辅麦克风。
[0004] 现在大多数用户不确定针对具体APP所设置的主麦克风，运样会导致用户可能会将终端预先设定的辅麦克风作为主麦克风进行通信，但是该辅麦克风主要负责采集环境噪声，从而会造成采集到的用户用于通信的语音信号噪声较大。

【发明内容】

[0005] 本发明实施例提供一种语音信号处理方法及装置，用于解决现有技术存在采集得到的语音信号噪声较大的问题。
[0006] 本发明实施例提供了一种语音信号处理方法，所述方法应用包括至少两个语音采集设备的终端，包括：
[0007] 通过所述至少两个语音采集设备采集第一语音信号；
[0008] 确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语音信号的声源特征值；
[0009] 根据预设的第一对应关系确定所述至少两个语音采集设备采集到的第一语音信号的声源特征值对应的语音处理方式，所述预设的第一对应的关系包括所述至少两个语音采集设备所对应的声源特征值范围与语音处理方式之间的对应关系；
[0010] 根据所述确定的语音处理方式对所述至少两个语音采集设备采集的第一语音信号进行处理。
[0011] 本发明实施例还提供了一种语音信号处理装置，包括：
[0012] 至少两个语音采集模块，分别用于采集第一语音信号，所述至少两个语音采集设备模块在所述第一语音信号处理装置的位置不同；
[0013] 计算模块，用于确定所述至少两个语音采集模块中每个语音采集模块采集到的第一语音信号的声源特征值；
[0014] 处理方式确定模块，用于根据预设的第一对应关系确定所述计算模块确定的所述至少两个语音采集模块采集到的第一语音信号的声源特征值对应的语音处理方式，所述预设的第一对应的关系包括所述至少两个语音采集模块所对应的声源特征值范围与语音处理方式之间的对应关系；
[0015] 信号处理模块，用于根据所述确定模块确定的语音处理方式对所述至少两个语音采集模块采集的第一语音信号进行处理。
[0016] 本发明实施例提供一种语音信号处理装置，包括存储器、处理器W及语音采集设备，其中，处理器可W用于读取存储器中的程序，执行下列过程:通过所述至少两个语音采集设备采集第一语音信号;确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语音信号的声源特征值;根据预设的第一对应关系确定所述至少两个语音采集设备采集到的第一语音信号的声源特征值对应的语音处理方式，所述预设的第一对应的关系包括所述至少两个语音采集设备所对应的声源特征值范围与语音处理方式之间的对应关系;根据所述确定的语音处理方式对所述至少两个语音采集设备采集的第一语音信号进行处理。
[0017] 本发明实施例提供了语音信号处理方法及装置，通过确定的所述至少两个语音采集设备中每个语音采集设备采集到的第一语音信号的声源特征值;然后所述至少两个语音采集设备采集到的第一语音信号的声源特征值对应的语音处理方式，根据所述确定的语音处理方式对所述至少两个语音采集设备采集的第一语音信号进行处理。由于预先设置好所述至少两个语音采集模块所对应的声源特征值范围与语音处理方式之间的对应关系，通过声源特征值来匹配最佳的语音处理方式，切换最佳的输入输出设备，达到了很好的降噪效果，可W给用户带来更好的声音体验。减少了用户对终端的主麦克风所在位置的情况下所带来的误操作。
【附图说明】
[0018] 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可W根据运些附图获得其他的附图。
[0019] 图1为本发明提供的一种语音信号处理方法流程图；
[0020] 图2为本发明提供的一种语音信号处理装置流程图。
【具体实施方式】
[0021] 为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0022] 由于装配两或者=或者四个麦克风的手机的降噪技术针对通话场景提出的或者基于语音的各种应用提出的，例如各种手机上安装的APP，如微信、QQ里的语音聊天、对讲机应用、语音录制应用、语音记事本等，不同的APP对应一种主麦克风，其他的麦克风用于降噪。但是针对某一个应用使用确定的主麦风，如果用户不确定该应用的主麦克风的情况，运样会导致用户可能会将终端预先设定的辅麦克风作为主麦克风进行通信，但是该辅麦克风主要负责采集环境噪声，使得降噪的有效性降低了，因此提出了如下面所描述的技术方案，但不仅限于下面所描述的各实施例。
[0023] 本发明实施例提供一种语音信号处理方法及装置，用于解决现有技术存在采集得到的语音信号噪声较大的问题。其中，方法和装置是基于同一发明构思的，由于方法及装置解决问题的原理相似，因此装置与方法的实施可W相互参见，重复之处不再寶述。
[0024] 本发明实施例提供了一种语音信号处理方法，所述方法应用包括至少两个语音采集设备的终端，所述至少两个语音采集设备设置在所述终端的位置不同。语音采集设备可 W为麦克风，但本发明实施例中不限定麦克风的形式，例如耳麦。
[0025] 如图1所示，该方法包括：
[00%] SlOl，通过所述至少两个语音采集设备采集第一语音信号。
[0027] S102,确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语音信号的声源特征值。
[0028] S103,根据预设的第一对应关系确定所述至少两个语音采集设备采集到的第一语音信号的声源特征值对应的语音处理方式。
[0029] 所述预设的第一对应的关系包括所述至少两个语音采集设备所对应的声源特征值范围与语音处理方式之间的对应关系。
[0030] S104,根据所述确定的语音处理方式对所述至少两个语音采集设备采集的第一语音信号进行处理。
[0031] 可选地，在确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语音信号的声源特征值时，可W周期性的确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语音信号的声源特征值。从而每周期根据预设的第一对应关系确定所述至少两个语音采集设备采集到的第一语音信号的声源特征值对应的语音处理方式，从而避免频繁的切换语音处理方式。
[0032] 可选地，根据预设的第一对应关系确定所述至少两个语音采集设备采集到的第一语音信号的声源特征值对应的语音处理方式，可W但不仅限于通过如下方式实现：
[0033] 第一种实现方式
[0034] 选择所述至少两个语音采集设备中采集到的第一语音信号的声源特征值最大的语音采集设备采集主声源的语音信号，其他的语音采集设备采集外部环境噪音。
[0035] W两个语音采集设备为例，两个语音采集设备的声源特征值分别通过MKFl、MKF2 表示，第一对应关系可W设置如表1所示。
[0036] 表1
[00971
[0038]在该技术方案中，至少两个语音采集设备可W是多个麦克风，用户在进行正常语音通话时，使用位于终端下端的麦克风进行通话，则终端下端的麦克风主要获取的是人的说话声音，而终端的其他位置上的麦克风主要获取的是外部环境的噪音，运样，从终端下端的麦克风采集的声音中过滤掉终端的其他位置的麦克风采集的外部环境噪音，就可W获取到清晰的人声，从而达到降噪的目的。
[0039] 第二种实现方式
[0040] 选择所述至少两个语音采集设备中采集到的第一语音信号的声源特征值最大的两个语音采集设备采集主声源的语音信号，其他的语音采集设备采集外部环境噪音。
[0041] 第二种实现方式适用于包括=个或者=个W上的语音采集设备的终端。
[0042] 可选地，在根据所述确定的语音处理方式对所述至少两个语音采集设备采集的第一语音信号进行处理时，可W通过如下方式实现：
[0043] 确定本次确定的语音处理方式与上一次确定的语音处理方式不同且采用上一次确定的语音处理方式的时长达到预设时长阔值时，根据本次确定的语音处理方式对所述至少两个语音采集设备采集的第一语音信号进行处理。
[0044] 比如用户使用微信过程中，一开始使用终端下端的麦克风作为主麦克风，用于获取用户发出的声音，其他麦克风用于获取环境噪声，但是用户使用过程中更换了说话姿势，对准终端上端的麦克风说话的时长达到预设时长阔值时，则可W更换将终端上端的麦克风作为主麦克风，用于获取用户发出的声音，其他麦克风用于获取环境噪声。
[0045] 可选地，在确定本次确定的语音处理方式与上一次确定的语音处理方式不同且采用上一次确定的语音处理方式的时长未达到预设时长阔值时，根据上一次确定的语音处理方式对所述至少两个语音采集设备采集的第一语音信号进行处理。
[0046] 通过上述实现方式，可W避免频繁的切换语音处理方式。例如，用户在打电话过程中，路过一个增杂的环境，但是在增杂环境中的时间较短，则可W不切换语音处理方式。
[0047] 可选的，在确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语音信号的声源特征值之前，所述方法包括：
[0048] 确定用于指示自动选择语音处理方式的语音处理模式为开启状态。
[0049] 在确定用于指示自动选择语音处理方式的语音处理模式为关闭状态时，则不再确定第一语音信号的声源特征值，不再通过本发明实施例提供的方式来确定语音处理方式，则可W采用现有技术提供的方式，例如针对不同的应用采用对应的语音处理方式。
[0050] 可选地，本发明实施例还可W应用于语音输出设备。终端包括至少一个语音输出设备。
[0051] 在至少一个语音输出设备输出第二语音信号时，通过所述至少两个语音采集设备采集第=语音信号，所述第=语音信号至少包括所述第二语音信号；
[0052] 确定所述至少两个语音采集设备中每个语音采集设备采集到的第=语音信号的声源特征值；
[0053] 根据预设的第二对应关系确定所述至少两个语音采集设备采集到的第=语音信号的声源特征值对应的语音输出方式，所述预设的第二对应的关系包括所述至少两个语音采集设备所对应的声源特征值范围与语音输出方式之间的对应关系；
[0054] 根据所述确定的语音输出方式控制所述至少一个语音输出设备输出所述第二语音信号。
[0055] 在本发明实施例中，语音输出设备可W是卿趴。比如在卿趴播放音乐的过程中，所述至少两个语音采集设备采集到的除所述音乐之外的其他声音较大时，则可W调高音量来播放音乐。比如终端包括两个卿趴，终端预先存储有至少两个语音采集设备与所述两个卿趴的距离，则在播放音乐时，所述至少两个语音采集设备采集到的除所述音乐之外的噪声较大时，但是距离左声道的语音采集设备采集到的噪声较大时，则可W调高右声道的音量，调低左声道的音量。
[0056] 通过本发明实施例提供的方式，通过语音采集设备采集到的语音信号的特征值匹配最佳的语音处理方式，切换最佳的输入输出设备，，达到了很好的降噪效果，可W给用户带来更好的声音体验。减少了用户对终端的主麦克风所在位置的情况下所带来的误操作。
[0057] 基于同一发明构思，本发明实施例中还提供了一种语音信号处理装置，由于装置解决问题的原理与方法相似，因此装置的实施可W参见方法的实施，重复之处不再寶述。
[0058] 本发明实施例还提供了一种语音信号处理装置，所述语音信号处理装置应用于终端。如图2所示，该装置包括：
[0059] 至少两个语音采集模块，本发明实施例W两个为例，分别为第一语音采集模块 201a和第二语音采集模块20化。第一语音采集模块201a和第二语音采集模块20化分别用于采集第一语音信号。
[0060] 所述第一语音采集模块和第二语音采集模块在终端的位置不同。
[0061 ]计算模块202，用于确定第一语音采集模块201a和第二语音采集模块20化分别采集到的第一语音信号的声源特征值。
[0062] 处理方式确定模块203,用于根据预设的第一对应关系确定所述计算模块202确定的第一语音采集模块201a和第二语音采集模块201b分别采集到的第一语音信号的声源特征值对应的语音处理方式，所述预设的第一对应的关系包括第一语音采集模块201a和第二语音采集模块20化所对应的声源特征值范围与语音处理方式之间的对应关系。
[0063] 信号处理模块204,用于根据所述处理方式确定模块203确定的语音处理方式对第一语音采集模块201a和第二语音采集模块20化采集的第一语音信号进行处理。
[0064] 可选的，所述处理方式确定模块203,具体用于:在第一语音采集模块201a和第二语音采集模块201b中选择声源特征值最大的语音采集模块作为用于采集主声源语音信号的主设备，其他语音采集模块作为用于采集环境噪声的辅设备。
[0065] 可选地，所述计算模块202,具体用于：
[0066] 周期性的确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语音信号的声源特征值。
[0067] 可选地，所述信号处理模块204,具体用于：
[0068] 确定本次确定的语音处理方式与上一次确定的语音处理方式不同且采用上一次确定的语音处理方式的时长达到预设时长阔值时，根据本次确定的语音处理方式对第一语音采集模块201a和第二语音采集模块20化采集的第一语音信号进行处理。
[0069] 可选地，所述装置还包括：
[0070] 状态确定模块205,用于在所述计算模块202确定所述第一语音采集模块201a和第二语音采集模块20化采集到的第一语音信号的声源特征值之前，确定用于指示自动选择语音处理方式的语音处理模式为开启状态。
[0071] 所述装置还可W包括：
[0072] 至少一个语音输出模块206,用于输出第二语音信号；
[0073] 第一语音采集模块201a和第二语音采集模块20化，还用于在所述至少一个语音输出模块输出第二语音信号时，采集第=语音信号，所述第=语音信号至少包括所述第二语音信号；
[0074] 所述计算模块202,还用于确定所述第一语音采集模块201a和第二语音采集模块 20化采集到的第=语音信号的声源特征值；
[0075] 输出方式确定模块207,用于根据预设的第二对应关系确定所述第一语音采集模块201a和第二语音采集模块201b采集到的第=语音信号的声源特征值对应的语音输出方式，所述预设的第二对应的关系包括所述第一语音采集模块201a和第二语音采集模块20化所对应的声源特征值范围与语音输出方式之间的对应关系；
[0076] 控制模块，用于根据所述确定的语音输出方式控制所述至少一个语音输出模块 206输出所述第二语音信号。
[0077] 为了描述的方便，W上各部分按照功能划分为各模块(或单元)分别描述。当然，在实施本发明时可W把各模块(或单元)的功能在同一个或多个软件或硬件中实现。具体实施时，上述设备识别装置可W设置于服务器中。
[0078] 本发明实施例中可W通过硬件处理器化ardware processor)来实现图2所示的除语音采集模块W外的相关功能模块。具体的，一种语音信号处理装置，包括存储器、处理器 W及语音采集设备，其中，处理器可W用于读取存储器中的程序，执行下列过程:通过所述至少两个语音采集设备采集第一语音信号;确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语音信号的声源特征值;根据预设的第一对应关系确定所述至少两个语音采集设备采集到的第一语音信号的声源特征值对应的语音处理方式，所述预设的第一对应的关系包括所述至少两个语音采集设备所对应的声源特征值范围与语音处理方式之间的对应关系;根据所述确定的语音处理方式对所述至少两个语音采集设备采集的第一语音信号进行处理。
[0079] W上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可 W是或者也可W不是物理上分开的，作为单元显示的部件可W是或者也可W不是物理单元，即可W位于一个地方，或者也可W分布到多个网络单元上。可W根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可W理解并实施。
[0080] 通过W上的实施方式的描述，本领域的技术人员可W清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可W通过硬件。基于运样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可WW软件产品的形式体现出来，该计算机软件产品可W存储在计算机可读存储介质中，如R0M/RAM、磁碟、光盘等，包括若干指令用W使得一台计算机设备(可W是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0081] 最后应说明的是：W上实施例仅用W说明本发明的技术方案，而非对其限制;尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解:其依然可 W对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而运些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
【主权项】
1. 一种语音信号处理方法，其特征在于，所述方法应用包括至少两个语音采集设备的终端，所述至少两个语音采集设备设置在所述终端的位置不同，包括：通过所述至少两个语音采集设备采集第一语音信号；确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语音信号的声源特征值；根据预设的第一对应关系确定所述至少两个语音采集设备采集到的第一语音信号的声源特征值对应的语音处理方式，所述预设的第一对应的关系包括所述至少两个语音采集设备所对应的声源特征值范围与语音处理方式之间的对应关系；根据所述确定的语音处理方式对所述至少两个语音采集设备采集的第一语音信号进行处理。2. 根据权利要求1所述的方法，其特征在于，所述根据预设的第一对应关系确定所述至少两个语音采集设备采集到的第一语音信号的声源特征值对应的语音处理方式，包括：在所述至少两个语音采集设备中选择声源特征值最大的语音采集设备作为用于采集主声源语音信号的主设备，其他语音采集设备作为用于采集环境噪声的辅设备。3. 根据权利要求1或2所述的方法，其特征在于，所述根据所述确定的语音处理方式对所述至少两个语音采集设备采集的第一语音信号进行处理，包括：确定本次确定的语音处理方式与上一次确定的语音处理方式不同且采用上一次确定的语音处理方式的时长达到预设时长阈值时，根据本次确定的语音处理方式对所述至少两个语音采集设备采集的第一语音信号进行处理。4. 根据权利要求1所述的方法，其特征在于，所述确定所述至少两个语音采集设备中每个语音采集设备采集到的第一语音信号的声源特征值之前，包括：确定用于指示自动选择语音处理方式的语音处理模式为开启状态。5. 根据权利要求1所述的方法，其特征在于，还包括：在至少一个语音输出设备输出第二语音信号时，通过所述至少两个语音采集设备采集第三语音信号，所述第三语音信号至少包括所述第二语音信号；确定所述至少两个语音采集设备中每个语音采集设备采集到的第三语音信号的声源特征值；根据预设的第二对应关系确定所述至少两个语音采集设备采集到的第三语音信号的声源特征值对应的语音输出方式，所述预设的第二对应的关系包括所述至少两个语音采集设备所对应的声源特征值范围与语音输出方式之间的对应关系；根据所述确定的语音输出方式控制所述至少一个语音输出设备输出所述第二语音信号。6. -种语音信号处理装置，其特征在于，包括：至少两个语音采集模块，分别用于采集第一语音信号，所述至少两个语音采集设备模块在所述第一语音信号处理装置的位置不同；计算模块，用于确定所述至少两个语音采集模块中每个语音采集模块采集到的第一语音信号的声源特征值；处理方式确定模块，用于根据预设的第一对应关系确定所述计算模块确定的所述至少两个语音采集模块采集到的第一语音信号的声源特征值对应的语音处理方式，所述预设的第一对应的关系包括所述至少两个语音采集模块所对应的声源特征值范围与语音处理方式之间的对应关系；信号处理模块，用于根据所述确定模块确定的语音处理方式对所述至少两个语音采集模块采集的第一语音信号进行处理。7. 根据权利要求6所述的装置，其特征在于，所述处理方式确定模块，具体用于:在所述至少两个语音采集模块中选择声源特征值最大的语音采集模块作为用于采集主声源语音信号的主设备，其他语音采集模块作为用于采集环境噪声的辅设备。8. 根据权利要求6或7所述的装置，其特征在于，所述信号处理模块，具体用于：确定本次确定的语音处理方式与上一次确定的语音处理方式不同且采用上一次确定的语音处理方式的时长达到预设时长阈值时，根据本次确定的语音处理方式对所述至少两个语音采集模块采集的第一语音信号进行处理。9. 根据权利要求6所述的装置，其特征在于，还包括：状态确定模块，用于在所述计算模块确定所述至少两个语音采集模块中每个语音采集设备采集到的第一语音信号的声源特征值之前，确定用于指示自动选择语音处理方式的语音处理模式为开启状态。10. 根据权利要求6所述的装置，其特征在于，还包括：至少一个语音输出模块，用于输出第二语音信号；所述至少两个语音采集模块，还用于在所述至少一个语音输出模块输出第二语音信号时，采集第三语音信号，所述第三语音信号至少包括所述第二语音信号；所述计算模块，还用于确定所述至少两个语音采集模块中每个语音采集模块采集到的第三语音信号的声源特征值；输出方式确定模块，用于根据预设的第二对应关系确定所述至少两个语音采集模块采集到的第三语音信号的声源特征值对应的语音输出方式，所述预设的第二对应的关系包括所述至少两个语音采集模块所对应的声源特征值范围与语音输出方式之间的对应关系；控制模块，用于根据所述确定的语音输出方式控制所述至少一个语音输出模块输出所述第二语音信号。
【文档编号】G10L15/20GK105847497SQ201610184725
【公开日】2016年8月10日
【申请日】2016年3月28日
【发明人】赵宪浩, 刘子超
【申请人】乐视控股（北京）有限公司, 乐视致新电子科技（天津）有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵宪浩;刘子超;
技术所有人：乐视控股（北京）有限公司;乐视致新电子科技（天津）有限公司;
我是此专利的发明人

上一篇：一种可以检测空气中甲醛浓度的手机的制作方法
上一篇：一种用于智能手机的保护壳的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。