车外语音控制方法、装置、存储介质及电子设备与流程

文档序号:42557250发布日期:2025-07-25 16:58阅读:48来源:国知局

本公开涉及人工智能,尤其涉及一种车外语音控制方法、装置、存储介质及电子设备。


背景技术:

1、车外语音控制指的是在车辆外部环境中,用户通过语音与车辆进行互动的技术,这种技术允许用户在车外就可以对车辆进行控制。随着车辆智能化程度的不断提升,车外语音控制的需求正在快速增长。

2、目前由于车外环境复杂,容易干扰语音信号的采集与识别,导致车外语音控制的准确率较低。


技术实现思路

1、本公开提供一种车外语音控制方法、装置、存储介质及电子设备,主要目的在于改善目前车外环境干扰语音信号的采集与识别,导致车外语音控制的准确率较低的技术问题。

2、根据本公开实施例的第一方面,提供了一种车外语音控制方法,包括:

3、获取车辆上的麦克风阵列针对车外不同区域采集到的音频信号;

4、对所述音频信号进行预处理;

5、根据预处理后的音频信号进行声源定位和声源分离,得到多通道音频信号;

6、基于所述多通道音频信号进行唤醒词识别,确定唤醒词所在的目标通道;

7、依据所述目标通道对应的音频信号执行相应的车辆语音控制命令。

8、可选的,对所述音频信号进行预处理,包括:

9、对所述音频信号进行回声消除和噪声抑制的预处理。

10、可选的,在对所述音频信号进行预处理之前,所述方法还包括:

11、利用车载扬声器播放的原始音频作为参考信号,建立所述车载扬声器发出信号与所述麦克风阵列接收信号之间的传递函数模型;

12、对所述音频信号进行预处理,包括:

13、利用所述传递函数模型,识别并消除所述音频信号中由所述车载扬声器发出的信号部分。

14、可选的,所述麦克风阵列包括针对车外不同区域分别设置的麦克风模组,所述麦克风模组具有至少两个麦克风;

15、所述根据预处理后的音频信号进行声源定位和声源分离,得到多通道音频信号,包括:

16、对至少一个麦克风模组经预处理后的音频信号进行声源定位,并依据声源定位结果去除不属于麦克风模组对应区域内的声源信号部分;

17、将至少一个麦克风模组去除所述声源信号部分后的音频信号进行声源分离,得到所述多通道音频信号。

18、可选的,所述对至少一个麦克风模组经预处理后的音频信号进行声源定位,并依据声源定位结果去除不属于麦克风模组对应区域内的声源信号部分,包括:

19、针对所述麦克风模组中的至少一个目标麦克风模组,使用除所述目标麦克风模组以外的其他麦克风模组的音频信号作为干扰信号,通过自适应干扰消除器在所述目标麦克风模组的目标音频信号中,去除不属于所述目标麦克风模组对应区域内的声源的干扰信号部分。。

20、可选的,所述将至少一个麦克风模组去除所述声源信号部分后的音频信号进行声源分离,得到所述多通道音频信号,包括:

21、使用盲源分离算法将至少一个麦克风模组去除所述声源信号部分后的音频信号,按照麦克风阵列中的麦克风数量进行声源分离得到所述多通道音频信号。

22、可选的,基于所述多通道音频信号进行唤醒词识别,确定唤醒词所在的目标通道,包括:

23、检测每个通道的音频信号中是否包含唤醒词;

24、将检测到包含所述唤醒词的音频信号所对应的通道确定为所述目标通道。

25、可选的,在依据所述目标通道对应的音频信号执行相应的车辆语音控制命令之前,所述方法还包括:

26、在所述车外不同区域中确定所述目标通道对应的音频信号所在的目标区域;

27、依据所述目标通道对应的音频信号执行相应的车辆语音控制命令,包括:

28、将所述目标区域作为语音交互区域,依据所述目标通道对应的音频信号执行所述语音交互区域相应的车辆语音控制命令。

29、根据本公开实施例的第二方面,提供一种车外语音控制装置,包括:获取模块、处理模块、定位模块、识别模块和控制模块;所述车外语音控制装置被配置为执行第一方面所述的方法。

30、根据本公开实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的车外语音控制方法。

31、根据本公开实施例的第四方面,提供一种电子设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面所述的车外语音控制方法。

32、根据本公开实施例的第五方面,本申请提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现第一方面所述的车外语音控制方法。。

33、借由上述技术方案,本公开提供的一种车外语音控制方法、装置、存储介质及电子设备。与目前相关技术相比,本公开首先获取车辆上的麦克风阵列针对车外不同区域采集到的音频信号;再对音频信号进行预处理;根据预处理后的音频信号进行声源定位和声源分离,得到多通道音频信号;然后基于多通道音频信号进行唤醒词识别,确定唤醒词所在的目标通道;依据目标通道对应的音频信号执行相应的车辆语音控制命令。通过应用本公开的技术方案,通过车辆周围不同区域的麦克风阵列采集音频信号,并经过预处理、声源定位与分离,得到多通道音频信号,进而实现精准的唤醒词识别和语音控制命令执行,不仅能够有效屏蔽户外复杂环境噪音,还能够准确识别目标发音人的指令,极大地提高了车外语音控制的准确率;同时支持多种音区划分模式以及不划分音区的运行方式,使得本公开实施例能够适应不同车型和使用场景的需求,具有很强的通用性和可扩展性。

34、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。



技术特征:

1.一种车外语音控制方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在对所述音频信号进行预处理之前,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述麦克风阵列包括针对车外不同区域分别设置的麦克风模组,所述麦克风模组具有至少两个麦克风;

4.根据权利要求3所述的方法,其特征在于,所述对至少一个麦克风模组经预处理后的音频信号进行声源定位,并依据声源定位结果去除不属于麦克风模组对应区域内的声源信号部分,包括:

5.根据权利要求3所述的方法,其特征在于,所述将至少一个麦克风模组去除所述声源信号部分后的音频信号进行声源分离,得到所述多通道音频信号,包括:

6.根据权利要求1所述的方法,其特征在于,基于所述多通道音频信号进行唤醒词识别,确定唤醒词所在的目标通道,包括:

7.根据权利要求1至6中任一项所述的方法,其特征在于,在依据所述目标通道对应的音频信号执行相应的车辆语音控制命令之前,所述方法还包括:

8.一种车外语音控制装置,其特征在于,包括:获取模块、处理模块、定位模块、识别模块和控制模块;所述车外语音控制装置被配置为执行权利要求1至7中任一项所述的方法。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法。

10.一种电子设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法。

11.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序在被处理器执行时实现权利要求1至7中任一项所述的方法。


技术总结
本公开提供了一种车外语音控制方法、装置、存储介质及电子设备,涉及人工智能技术领域,其中方法包括:首先获取车辆上的麦克风阵列针对车外不同区域采集到的音频信号;再对音频信号进行预处理;根据预处理后的音频信号进行声源定位和声源分离,得到多通道音频信号;然后基于多通道音频信号进行唤醒词识别,确定唤醒词所在的目标通道;依据目标通道对应的音频信号执行相应的车辆语音控制命令。本公开通过车辆周围不同区域的麦克风阵列采集音频信号,并经过预处理、声源定位与分离,得到多通道音频信号,进而实现精准的唤醒词识别和语音控制命令执行,能够有效屏蔽户外复杂环境噪音,极大地提高了车外语音控制的准确率。

技术研发人员:何琪琪,吴俊楠,范利春,于博仑,王露明,王鹏,李炯亮,高鹏
受保护的技术使用者:小米汽车科技有限公司
技术研发日:
技术公布日:2025/7/24
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!