用于车辆的语音识别方法、装置、系统、设备以及车辆与流程

文档序号:18221442发布日期:2019-07-19 23:02阅读:270来源:国知局
用于车辆的语音识别方法、装置、系统、设备以及车辆与流程

本发明属于车辆技术领域,具体涉及一种用于车辆的语音识别方法、装置、系统、设备以及车辆。



背景技术:

随着车辆技术的发展,车辆已经成为人们生活中必不可少的一部分,车内场景也成为人们生活中的一个重要场所。随着人们对车辆的要求越来越高,人们不只是希望能够安全驾驶,在保证安全驾驶的前提下,人们同样希望拥有良好的驾驶体验。语音交互技术作为一种方便快捷的技术手段,能够很好地提高行车安全,在汽车上得到了广泛的应用。

用户可以通过语音与智能语音设备进行交互,控制智能语音设备执行相应的操作,但是在与智能语音设备进行交互时,车内可能同时有其他人在进行交谈,谈话的内容可能被录入,从而导致交互被干扰的尴尬场景。现有的语音交互方法大都关注单人在车内进行语音交互的场景,对于多人在车内交谈导致交互被干扰的场景则没有对应的解决方案。因此,如何提出一种准确识别交互人的语音并且消除其他用户的干扰语音的解决方案是本领域技术人员目前需要解决的问题。



技术实现要素:

为了解决现有技术中的上述问题,即为了解决现有技术无法在有其他用户语音干扰的情况下准确识别出交互人语音的问题,本发明提供了一种用于车辆的语音识别方法,所述车辆包括多个定向收音设备,所述语音识别方法包括:

检测所述车辆内唤醒智能语音设备用户的位置信息;

增大所述位置信息对应的定向收音设备的收音增益值并且减小其他定向收音设备的收音增益值;

通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别。

可选的,在所述用于车辆的语音识别方法中,“检测所述车辆内唤醒智能语音设备用户的位置信息”的步骤包括:

判断是否检测到预设的智能语音设备的唤醒语音信息,

若检测到所述唤醒语音信息,则启动所述车辆内预设的声源定位装置并且根据所述唤醒语音信息检测唤醒智能语音设备用户的位置信息。

可选的,在所述用于车辆的语音识别方法中,“通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息”的步骤包括:

判断是否检测到所述车辆内非唤醒智能语音设备用户输入的语音信息,

若检测到所述非唤醒智能语音设备用户输入的语音信息,则根据所述非唤醒智能语音设备用户输入的语音信息对每个所述定向收音设备采集到的语音信息进行音频干扰补偿,以便消除所述非唤醒智能语音设备用户输入的语音信息。

可选的,在所述用于车辆的语音识别方法中,“判断是否检测到所述车辆内非唤醒智能语音设备用户输入的语音信息”的步骤包括:

获取唤醒语音信息对应的第一声纹信息;

判断每个所述定向收音设备是否采集到与所述第一声纹信息不同的声纹信息,若采集到,则判定检测到非唤醒智能语音设备用户输入的语音信息。

可选的,在所述用于车辆的语音识别方法中,“根据所述非唤醒智能语音设备用户输入的语音信息对每个所述定向收音设备采集到的语音信息进行音频干扰补偿”的步骤包括:

根据所述非唤醒智能语音设备用户的声纹信息识别每个所述定向收音设备采集到的语音信息中与该用户的声纹信息对应的语音信息;

在每个所述定向收音设备采集到的语音信息上叠加与所述非唤醒智能语音设备用户输入的语音信息对应的反向声波。

可选的,在所述用于车辆的语音识别方法中,“通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别”的步骤包括:

根据预设的音频相位偏移对每个定向收音设备采集到的唤醒智能语音设备用户的语音信息对应的波形进行相位补偿;

将进行相位补偿后的语音信息进行叠加并且根据叠加结果进行语音识别;

其中,所述音频相位偏移是根据预设的用户位置与每个所述定向收音设备之间的距离预先获取的。

可选的,在所述用于车辆的语音识别方法中,“将进行相位补偿后的语音信息进行叠加”的步骤包括:

根据下式所示的方法将进行相位补偿后的语音信息进行叠加:

其中,其中,所述mi表示当所述位置信息对应的定向收音设备是第i个定向收音设备时的叠加结果,所述αi是所述第i个定向收音设备的收音增益值;

所述δpii是第i个用户位置与所述第i个定向收音设备之间的音频相位偏移,所述δpji是所述第i个定向收音设备与第j个用户位置之间的音频相位偏移,所述n是所述车辆内定向收音设备的总数,1≤i≤n,1≤j≤n,i≠j;

当检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息;当未检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息进行相位补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息进行相位补偿后的语音信息。

本发明的第二方面还提供了一种用于车辆的语音识别系统,所述车辆包括多个定向收音设备,所述语音识别系统包括:

位置检测模块,配置为检测所述车辆内唤醒智能语音设备用户的位置信息;

增益调整模块,配置为增大所述位置信息对应的定向收音设备的收音增益值并且减小其他定向收音设备的收音增益值;

语音识别模块,配置为通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别。

可选的,在所述用于车辆的语音识别系统中,所述位置检测模块进一步配置为执行如下操作:

判断是否检测到预设的智能语音设备的唤醒语音信息,

若检测到所述唤醒语音信息,则启动所述车辆内预设的声源定位装置并且根据所述唤醒语音信息检测唤醒智能语音设备用户的位置信息。

可选的,在所述用于车辆的语音识别系统中,所述增益调整模块还包括用户检测单元和干扰补偿单元,

所述用户检测单元配置为判断是否检测到所述车辆内非唤醒智能语音设备用户输入的语音信息,

所述干扰补偿单元配置为若检测到所述非唤醒智能语音设备用户输入的语音信息,则根据所述非唤醒智能语音设备用户输入的语音信息对每个所述定向收音设备采集到的语音信息进行音频干扰补偿,以便消除所述非唤醒智能语音设备用户输入的语音信息。

可选的,在所述用于车辆的语音识别系统中,所述用户检测单元进一步配置为执行如下操作:

获取唤醒语音信息对应的第一声纹信息;

判断每个所述定向收音设备是否采集到与所述第一声纹信息不同的声纹信息,若采集到,则判定检测到非唤醒智能语音设备用户输入的语音信息。

可选的,在所述用于车辆的语音识别系统中,所述干扰补偿单元进一步配置为执行如下操作:

根据所述非唤醒智能语音设备用户的声纹信息识别每个所述定向收音设备采集到的语音信息中与该用户的声纹信息对应的语音信息;

在每个所述定向收音设备采集到的语音信息上叠加与所述非唤醒智能语音设备用户输入的语音信息对应的反向声波。

可选的,在所述用于车辆的语音识别系统中,所述语音识别模块进一步配置为执行如下操作:

根据预设的音频相位偏移对每个定向收音设备采集到的唤醒智能语音设备用户的语音信息对应的波形进行相位补偿;

将进行相位补偿后的语音信息进行叠加并且根据叠加结果进行语音识别;

其中,所述音频相位偏移是根据预设的用户位置与每个所述定向收音设备之间的距离预先获取的。

可选的,在所述用于车辆的语音识别系统中,所述干扰补偿模块还配置为执行以下操作:

根据下式所示的方法将补偿后的语音信息进行叠加:

其中,所述mi表示当所述位置信息对应的定向收音设备是第i个定向收音设备时的叠加结果,所述αi是所述第i个定向收音设备的收音增益值;

所述δpii是第i个用户位置与所述第i个定向收音设备之间的音频相位偏移,所述δpji是所述第i个定向收音设备与第j个用户位置之间的音频相位偏移,所述n是所述车辆内定向收音设备的总数,1≤i≤n,1≤j≤n,i≠j;

当检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息;当未检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息进行相位补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息进行相位补偿后的语音信息。

本发明的第三方面还提供了一种智能语音设备,所述智能语音设备包括上述所述的用于车辆的语音识别系统。

本发明的第四方面还提供了一种车辆,所述车辆包括上述所述的智能语音设备。

本发明的第五方面还提供了一种存储装置,其中存储有多条程序,所述程序适于由处理器加载以执行上述所述的用于车辆的语音识别方法。

本发明的第六方面还提供了一种控制装置,包括处理器和存储设备;所述存储设备,适于存储多条程序;所述程序适于由所述处理器加载以执行上述所述的用于车辆的语音识别方法。

与最接近的现有技术相比,上述技术方案至少具有如下有益效果:

1、本发明提供的用于车辆的语音识别方法主要包括以下步骤:检测车辆内唤醒智能语音设备用户的位置信息;增大位置信息对应的定向收音设备的收音增益并且减小其他定向收音设备的收音增益值;根据调整收音增益值后的定向收音设备获取唤醒智能语音设备用户的输入语音信息并且根据所获取的语音信息进行语音识别。基于上述步骤,本发明提供的用于车辆的语音识别方法可以通过增大唤醒智能语音设备用户对应的定向收音设备的收音增益值来提高该定向收音设备采集唤醒智能语音设备用户输入语音的敏感度,并且减小其他定向收音设备的收音增益值,减小非唤醒智能语音设备用户的语音输入,降低非唤醒智能语音设备用户语音对唤醒智能语音设备用户语音的干扰,提高语音识别的效果。

2、本发明提供的用于车辆的语音识别方法还可以对每个定向收音设备采集到的非唤醒智能语音设备用户的语音信息进行音频干扰补偿和相位补偿,以便消除非唤醒智能语音设备用户输入的语音信息。基于上述步骤,本发明提供的用于车辆的语音识别方法可以综合每个定向收音设备采集到的唤醒智能语音设备用户的语音信息,并且消除非唤醒智能语音设备用户输入的语音信息,提高了在复杂环境下对唤醒智能语音设备用户的语音识别准确率。

方案1、一种用于车辆的语音识别方法,其特征在于,所述车辆包括多个定向收音设备,所述语音识别方法包括:

检测所述车辆内唤醒智能语音设备用户的位置信息;

增大所述位置信息对应的定向收音设备的收音增益值并且减小其他定向收音设备的收音增益值;

通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别。

方案2、根据方案1所述的用于车辆的语音识别方法,其特征在于,“检测所述车辆内唤醒智能语音设备用户的位置信息”的步骤包括:

判断是否检测到预设的智能语音设备的唤醒语音信息,

若检测到所述唤醒语音信息,则启动所述车辆内预设的声源定位装置并且根据所述唤醒语音信息检测唤醒智能语音设备用户的位置信息。

方案3、根据方案1所述的用于车辆的语音识别方法,其特征在于,“通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息”的步骤包括:

判断是否检测到所述车辆内非唤醒智能语音设备用户输入的语音信息,

若检测到所述非唤醒智能语音设备用户输入的语音信息,则根据所述非唤醒智能语音设备用户输入的语音信息对每个所述定向收音设备采集到的语音信息进行音频干扰补偿,以便消除所述非唤醒智能语音设备用户输入的语音信息。

方案4、根据方案3所述的用于车辆的语音识别方法,其特征在于,“判断是否检测到所述车辆内非唤醒智能语音设备用户输入的语音信息”的步骤包括:

获取唤醒语音信息对应的第一声纹信息;

判断每个所述定向收音设备是否采集到与所述第一声纹信息不同的声纹信息,若采集到,则判定检测到非唤醒智能语音设备用户输入的语音信息。

方案5、根据方案3所述的用于车辆的语音识别方法,其特征在于,“根据所述非唤醒智能语音设备用户输入的语音信息对每个所述定向收音设备采集到的语音信息进行音频干扰补偿”的步骤包括:

根据所述非唤醒智能语音设备用户的声纹信息识别每个所述定向收音设备采集到的语音信息中与该用户的声纹信息对应的语音信息;

在每个所述定向收音设备采集到的语音信息上叠加与所述非唤醒智能语音设备用户输入的语音信息对应的反向声波。

方案6、根据方案1所述的用于车辆的语音识别方法,其特征在于,“通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别”的步骤包括:

根据预设的音频相位偏移对每个定向收音设备采集到的唤醒智能语音设备用户的语音信息对应的波形进行相位补偿;

将进行相位补偿后的语音信息进行叠加并且根据叠加结果进行语音识别;

其中,所述音频相位偏移是根据预设的用户位置与每个所述定向收音设备之间的距离预先获取的。

方案7、根据方案6所述的用于车辆的语音识别方法,其特征在于,“将进行相位补偿后的语音信息进行叠加”的步骤包括:

根据下式所示的方法将进行相位补偿后的语音信息进行叠加:

其中,所述mi表示当所述位置信息对应的定向收音设备是第i个定向收音设备时的叠加结果,所述αi是所述第i个定向收音设备的收音增益值;

所述δpii是第i个用户位置与所述第i个定向收音设备之间的音频相位偏移,所述δpji是所述第i个定向收音设备与第j个用户位置之间的音频相位偏移,所述n是所述车辆内定向收音设备的总数,1≤i≤n,1≤j≤n,i≠j;

当检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息;当未检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息进行相位补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息进行相位补偿后的语音信息。

方案8、一种用于车辆的语音识别系统,其特征在于,所述车辆包括多个定向收音设备,所述语音识别系统包括:

位置检测模块,配置为检测所述车辆内唤醒智能语音设备用户的位置信息;

增益调整模块,配置为增大所述位置信息对应的定向收音设备的收音增益值并且减小其他定向收音设备的收音增益值;

语音识别模块,配置为通过调整所述收音增益值后的定向收音设备获取所述唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别。

方案9、根据方案8所述的用于车辆的语音识别系统,其特征在于,所述位置检测模块进一步配置为执行如下操作:

判断是否检测到预设的智能语音设备的唤醒语音信息,

若检测到所述唤醒语音信息,则启动所述车辆内预设的声源定位装置并且根据所述唤醒语音信息检测唤醒智能语音设备用户的位置信息。

方案10、根据方案8所述的用于车辆的语音识别系统,其特征在于,所述增益调整模块还包括用户检测单元和干扰补偿单元,

所述用户检测单元配置为判断是否检测到所述车辆内非唤醒智能语音设备用户输入的语音信息,

所述干扰补偿单元配置为若检测到所述非唤醒智能语音设备用户输入的语音信息,则根据所述非唤醒智能语音设备用户输入的语音信息对每个所述定向收音设备采集到的语音信息进行音频干扰补偿,以便消除所述非唤醒智能语音设备用户输入的语音信息。

方案11、根据方案10所述的用于车辆的语音识别系统,其特征在于,所述用户检测单元进一步配置为执行如下操作:

获取唤醒语音信息对应的第一声纹信息;

判断每个所述定向收音设备是否采集到与所述第一声纹信息不同的声纹信息,若采集到,则判定检测到非唤醒智能语音设备用户输入的语音信息。

方案12、根据方案10所述的用于车辆的语音识别系统,其特征在于,所述干扰补偿单元进一步配置为执行如下操作:

根据所述非唤醒智能语音设备用户的声纹信息识别每个所述定向收音设备采集到的语音信息中与该用户的声纹信息对应的语音信息;

在每个所述定向收音设备采集到的语音信息上叠加与所述非唤醒智能语音设备用户输入的语音信息对应的反向声波。

方案13、根据方案8所述的用于车辆的语音识别系统,其特征在于,所述语音识别模块进一步配置为执行如下操作:

根据预设的音频相位偏移对每个定向收音设备采集到的唤醒智能语音设备用户的语音信息对应的波形进行相位补偿;

将进行相位补偿后的语音信息进行叠加并且根据叠加结果进行语音识别;

其中,所述音频相位偏移是根据预设的用户位置与每个所述定向收音设备之间的距离预先获取的。

方案14、根据方案13所述的用于车辆的语音识别系统,其特征在于,所述语音识别模块还配置为执行如下操作:

根据下式所示的方法将进行相位补偿后的语音信息进行叠加:

其中,所述mi表示当所述位置信息对应的定向收音设备是第i个定向收音设备时的叠加结果,所述αi是所述第i个定向收音设备的收音增益值;

所述δpii是第i个用户位置与所述第i个定向收音设备之间的音频相位偏移,所述δpji是所述第i个定向收音设备与第j个用户位置之间的音频相位偏移,所述n是所述车辆内定向收音设备的总数,1≤i≤n,1≤j≤n,i≠j;

当检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息;当未检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息进行相位补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息进行相位补偿后的语音信息。

方案15、一种智能语音设备,其特征在于,所述智能语音设备包括方案8至14中任一项所述的用于车辆的语音识别系统。

方案16、一种车辆,其特征在于,所述车辆包括方案15所述的智能语音设备。

方案17、一种存储装置,其中存储有多条程序,其特征在于,所述程序适于由处理器加载以执行方案1至7中任一项所述的用于车辆的语音识别方法。

方案18、一种控制装置,包括处理器和存储设备;所述存储设备,适于存储多条程序;其特征在于,所述程序适于由所述处理器加载以执行方案1至7中任一项所述的用于车辆的语音识别方法。

附图说明

图1为本发明一种实施例的用于车辆的语音识别方法的主要步骤示意图;

图2为本发明一种实施例的将相位补偿后的语音信息进行叠加的示意框图;

图3为本发明一种实施例的用于车辆的语音识别系统的主要结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。

参阅附图1,图1示例性地示出了本实施例中用于车辆的语音识别方法的主要步骤。如图1所示,本实施例中用于车辆的语音识别方法包括下述步骤:

步骤s101:检测车辆内唤醒智能语音设备用户的位置信息。

在本实施例中,智能语音设备可以搭载能够实现特定功能的操控系统,在某些情况下,可能直接指代该操控系统的控制器。智能语音设备可以获取车辆内用户的语音信息,需要说明的是,本发明的保护范围不局限于这一具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员应该清楚的是,智能语音设备可以是车载娱乐显示系统,还可以是车载中控系统以及车载计算机系统等,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

在实际应用中,语音交互作为一种方便快捷的技术,可以很好地提高行车安全,用户可以直接通过语音控制车辆的某些功能。为了避免用户在行车过程中误触发语音交互,可以在智能语音设备中预设唤醒关键词,当智能语音设备接收到包含唤醒关键词的唤醒语音信息时才与用户进行语音交互。当智能语音设备被用户唤醒后,智能语音设备可以启动在车辆内预设的声源定位装置并且根据唤醒语音信息检测唤醒智能语音设备用户的位置信息,判断唤醒智能语音设备用户在车内的具体位置。其中,声源定位装置可以采用多种声源定位算法,声源定位算法可以包括但不限于基于时延估计的算法、基于高分辨率谱估计的算法以及基于稀疏表示的算法等等。

步骤s102:增大唤醒智能语音设备用户的位置信息对应的定向收音设备的收音增益值并且减小其他定向收音设备的收音增益值。

得到唤醒智能语音设备用户的位置信息后,为了能够更好地获取唤醒智能语音设备用户输入的语音信息,可以增大唤醒智能语音设备用户的位置信息对应的定向收音设备的收音增益值来提高该定向收音设备采集唤醒智能语音设备用户输入语音的敏感度。

其中,收音增益值能够体现定向收音设备的灵敏度,例如,提高收音增益值能够在用户输入的语音音量较低,或者录音距离较远时,也能够得到符合要求的语音信息。为了描述简洁,将“唤醒智能语音设备用户的位置信息对应的定向收音设备”简称为“目标定向收音设备”,将车辆内目标定向收音设备以外的定向收音设备简称为“非目标定向收音设备”。具体地,用户进行语音交互时往往是面向前方的,可以设定用户面向行车方向对应的定向收音设备为目标定向收音设备,定向收音设备是获取在一定空间范围内语音信息的声音获取设备,定向收音设备的位置可以取决于车辆中座椅的位置,定向收音设备的数量也可以根据实际需要进行调整,在本发明实施例中,定向收音设备可以为麦克风阵列。

在实际应用中,唤醒智能语音设备用户在进行语音交互时,除了目标定向收音设备会获取唤醒智能语音设备用户的语音信息外,非目标定向收音设备也会获取其语音信息,为了提高语音识别效果,可以减小非目标定向收音设备的收音增益值。

步骤s103:判断是否检测到车辆内非唤醒智能语音设备用户输入的语音信息,若检测到非唤醒智能语音设备用户输入的语音信息,则执行步骤s104;若没有到非唤醒智能语音设备用户输入的语音信息,则执行步骤s105。

在实际应用中,车辆内往往存在多个用户,唤醒智能语音设备用户在进行语音交互时,其他用户也可能同时在进行交谈,而定向收音设备也会采集非唤醒智能语音设备用户的语音信息,非唤醒智能语音设备用户的语音信息有可能会对唤醒智能语音设备用户的语音交互造成干扰。此外,如何区分具体是哪个用户输入的语音信息,对后续排除非唤醒智能语音设备用户的语音信息对唤醒智能语音设备用户的语音信息的干扰十分重要。

具体地,“判断是否检测到车辆内非唤醒智能语音设备用户输入的语音信息”的步骤可以包括:

获取唤醒语音信息对应的第一声纹信息;

判断每个定向收音设备是否采集到与第一声纹信息不同的声纹信息,若采集到,则判定检测到非唤醒智能语音设备用户输入的语音信息。

每个用户的语音信息均有对应的声纹信息,根据唤醒智能语音设备用户输入的唤醒语音信息可以获取其对应的声纹信息,通过判断每个定向收音设备是否采集到与第一声纹信息不同的声纹信息,可以判定车辆内是否存在非唤醒智能语音设备用户,若采集到,则说明存在非唤醒智能语音设备用户。

步骤s104:根据非唤醒智能语音设备用户输入的语音信息对每个定向收音设备采集到的语音信息进行音频干扰补偿。

每个定向收音设备均会采集到车辆内每个用户的语音信息,因此需要排除非唤醒智能语音设备用户的语音信息对唤醒智能语音设备用户的语音信息的干扰。例如,在实际应用中,唤醒智能语音设备用户与智能语音设备进行交互时,语音信息内容为“打开空调”,与此同时,非唤醒智能语音设备用户的语音信息内容为“播放音乐”,为了提高语音识别的准确率,可以对每个定向收音设备采集到的语音信息进行音频干扰补偿,其具体步骤可以包括:

根据非唤醒智能语音设备用户的声纹信息识别每个定向收音设备采集到的语音信息中与该用户的声纹信息对应的语音信息;

在每个定向收音设备采集到的语音信息上叠加与非唤醒智能语音设备用户输入的语音信息对应的反向声波。

具体地,以车内用户数量为4人、用户分别为a、b、c、d、唤醒智能语音设备用户为a、定向收音设备的数量为1个为例进行说明。定向收音设备能够采集到4位用户的语音信息,分别获取用户b、c、d的声纹信息,根据用户b、c、d的声纹信息,识别出定向收音设备采集到的语音信息中,具体哪条语音信息是用户b的,哪条语音信息是用户c的,以及哪条语音信息是用户d的,得到每个非唤醒智能语音设备用户对应的语音信息后,叠加与该语音信息对应的反向声波,消除非唤醒智能语音设备用户对应的语音信息。因此,当非唤醒智能语音设备用户的语音信息内容为“播放音乐”时,可以通过对定向收音设备采集到的语音信息进行音频干扰补偿,消除其对唤醒智能语音设备用户的语音信息的干扰。

步骤s105:通过调整收音增益值后的定向收音设备获取唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别。

具体地,“通过调整收音增益值后的定向收音设备获取唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别”的步骤可以包括:

根据预设的音频相位偏移对每个定向收音设备采集到的唤醒智能语音设备用户的语音信息对应的波形进行相位补偿;

将进行相位补偿后的语音信息进行叠加并且根据叠加结果进行语音识别;

其中,音频相位偏移是根据预设的用户位置与每个定向收音设备之间的距离预先获取的。

由于在车内不同位置说话,语音到达不同定向收音设备的时间不同,同一个用户的语音在不同定向收音设备上产生的语音波形不同,目标定向收音设备采集到的语音信息与非目标定向收音设备采集到的语音信息之间存在音频相位偏移。目标定向收音设备和非目标定向收音设备均能够获取唤醒智能语音设备用户的语音信息,为了充分利用每个定向收音设备获取的唤醒智能语音设备用户的语音信息,可以根据音频相位偏移对相应的定向收音设备采集到的唤醒智能语音设备用户的语音信息对应的波形进行相位补偿,从而消除信号延时。

将每个定向收音设备采集到语音信息对应的波形进行相位补偿后,将语音信息进行叠加并且根据叠加结果进行语音识别,可以提高语音识别的效果。具体地,可以根据如公式(1)所示的方法将补偿后的语音信息进行叠加:

其中,mi表示当位置信息对应的定向收音设备是第i个定向收音设备时的叠加结果,αi是第i个定向收音设备的收音增益值;

δpii是第i个用户位置与第i个定向收音设备之间的音频相位偏移,δpji是第i个定向收音设备与第j个用户位置之间的音频相位偏移,n是车辆内定向收音设备的总数,1≤i≤n,1≤j≤n,i≠j;

当检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息依次进行相位补偿和音频干扰补偿后的语音信息;当未检测到所述非唤醒智能语音设备用户输入的语音信息时,所述mi是对所述第i个定向收音设备采集到的语音信息进行相位补偿后的语音信息,所述mj是对第j个定向收音设备采集到的语音信息进行相位补偿后的语音信息。

具体地,以车内用户数量为4人、用户分别为a、b、c、d、定向收音设备的数量为4个以及唤醒智能语音设备用户为a为例进行说明。参阅附图2,图2示例性地示出了本实施例中将相位补偿后的语音信息进行叠加的示意框图。

每一个定向收音设备均可以获取车内用户的语音信息,以第一个定向收音设备为例,第一个定向收音设备可以获取到用户a、b、c、d的语音信息,则唤醒用户为a时,第一个定向收音设备语音信息叠加的结果如公式(2)所示:

m1=α1·((m1+δp11)+(m2+δp21)+(m3+δp31)+(m4+δp41))(2)

同理,第二个定向收音设备语音信息叠加的结果如公式(3)所示:

m2=α2·((m2+δp22)+(m1+δp12)+(m3+δp32)+(m4+δp42))(3)

第三个定向收音设备语音信息叠加的结果如公式(4)所示:

m3=α3·((m3+δp33)+(m1+δp13)+(m2+δp23)+(m4+δp43))(4)

第四个定向收音设备语音信息叠加的结果如公式(5)所示:

m4=α4·((m4+δp44)+(m1+δp14)+(m2+δp24)+(m3+δp34))(5)

上述实施例中虽然将各个步骤按照上述先后次序的方式进行了描述,但是本领域技术人员可以理解,为了实现本实施例的效果,不同的步骤之间不必按照这样的次序执行,其可以同时(并行)执行或以颠倒的次序执行,这些简单的变化都在本发明的保护范围之内。

基于上述方法实施例,本发明还提供了一种用于车辆的语音识别系统。下面结合附图,对该用于车辆的语音识别系统进行说明。

参阅附图3,图3示例性地给出了本实施例中用于车辆的语音识别系统的主要结构。如图3所示,本实施例的用于车辆的语音识别系统主要包括位置检测模块1、增益调整模块2以及语音识别模块3。

位置检测模块1,配置为检测车辆内唤醒智能语音设备用户的位置信息;

增益调整模块2,配置为增大位置信息对应的定向收音设备的收音增益值并且减小其他定向收音设备的收音增益值;

语音识别模块3,配置为通过调整收音增益值后的定向收音设备获取唤醒智能语音设备用户输入的语音信息并且根据所获取的语音信息进行语音识别。

在本发明实施例的一个优选实施方案中,位置检测模块1进一步配置为执行如下操作:

判断是否检测到预设的智能语音设备的唤醒语音信息,

若检测到唤醒语音信息,则启动车辆内预设的声源定位装置并且根据唤醒语音信息检测唤醒智能语音设备用户的位置信息。

在本发明实施例的一个优选实施方案中,增益调整模块2还包括用户检测单元和干扰补偿单元,

用户检测单元配置为判断是否检测到车辆内非唤醒智能语音设备用户输入的语音信息,

干扰补偿单元配置为若检测到非唤醒智能语音设备用户输入的语音信息,则根据非唤醒智能语音设备用户输入的语音信息对每个定向收音设备采集到的语音信息进行音频干扰补偿,以便消除非唤醒智能语音设备用户输入的语音信息。

在本发明实施例的一个优选实施方案中,用户检测单元进一步配置为执行如下操作:

获取唤醒语音信息对应的第一声纹信息;

判断每个定向收音设备是否采集到与第一声纹信息不同的声纹信息,若采集到,则判定检测到非唤醒智能语音设备用户输入的语音信息。

在本发明实施例的一个优选实施方案中,干扰补偿单元进一步配置为执行如下操作:

根据非唤醒智能语音设备用户的声纹信息识别每个定向收音设备采集到的语音信息中与该用户的声纹信息对应的语音信息;

在每个定向收音设备采集到的语音信息上叠加与非唤醒智能语音设备用户输入的语音信息对应的反向声波。

在本发明实施例的一个优选实施方案中,语音识别模块3进一步配置为执行如下操作:

根据预设的音频相位偏移对每个定向收音设备采集到的唤醒智能语音设备用户的语音信息对应的波形进行相位补偿;

将进行相位补偿后的语音信息进行叠加并且根据叠加结果进行语音识别;

其中,音频相位偏移是根据预设的用户位置与每个定向收音设备之间的距离预先获取的。

在本发明实施例的一个优选实施方案中,语音识别模块3还配置为执行如下操作:

根据公式(1)所示的方法将进行相位补偿后的语音信息进行叠加。

进一步地,基于上述系统实施例,本发明还提供了一种智能语音设备,该智能语音设备可以包括上述系统实施例所述的用于车辆的语音识别系统。

再进一步地,基于上述智能语音设备实施例,本发明还提供了一种车辆,该车辆可以包括上述智能语音设备实施例所述的智能语音设备。

再进一步地,基于上述方法实施例,本发明还提供了一种存储装置,其中存储有多条程序,该程序可以适于由处理器加载以执行上述方法实施例所述的用于车辆的语音识别方法。

再进一步地,基于上述方法实施例,本发明还提供了一种控制装置,其可以包括处理器、存储设备;存储设备可以适于存储多条程序,该程序可以适于由处理器加载以执行上述方法实施例所述的用于车辆的语音识别方法。

所属技术领域的技术人员可以清楚地了解到,为了描述的方便和简洁,本发明系统、智能语音设备、车辆以及装置实施例的具体工作过程以及相关说明,可以参考前述方法实施例中的对应过程,且与上述方法具有相同的有益效果,在此不再赘述。

本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1