一种车载多音区声源检测方法、装置及系统与流程

文档序号:21279378发布日期:2020-06-26 23:29阅读:134来源:国知局
一种车载多音区声源检测方法、装置及系统与流程

本发明属于语音识别技术领域,具体为涉及一种车载多音区声源检测方法、装置及系统。



背景技术:

随着科学技术的进步,人工智能的不断发展,不仅仅限于人与人之间的交互,随着语音交互技术越来越成熟,更多的是人和智能设备的交互,目前,该语音交互技术已经运用到更多的领域当中。例如:语音交互技术运用在汽车领域,在汽车领域运用语音交互技术具体为,将两个麦克风放在汽车的控制台,通过针对驾驶员的方向进行降噪处理,使得驾驶员的语音交互成功率提高。

虽然汽车中的其他位置的成员可使用两个麦克风进行交互,但是无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令。



技术实现要素:

有鉴于此,本发明的目的在于提供一种车载多音区声源检测方法、装置及系统,用于实现对车内不同位置的人进行区分,从而达到更好的交互体验的目的。技术方案如下:

本发明第一方面提供了一种车载多音区声源检测方法,应用于包括多个收音设备的车载系统,每一个所述收音设备在一个方向上形成一个波束,每一个所述波束对应一个音区,所述方法包括:

获取每个收音设备收录的音频信息,得到多路音频信息;

计算并比较多路所述音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息;

确定所述最大的唤醒分值对应的音频信息所处音区,基于所述音区确定声源位置。

优选的,所述计算并比较多路所述音频信息的唤醒分值,确定最大的唤醒分值对应的音频信息,包括:

计算多路所述音频信息的信噪比;

比较多路所述音频信息的信噪比,确定信噪比最高的音频信息的唤醒分值最大,获取所述最大唤醒分值对应的音频信息。

优选的,若所述车载系统的多个收音设备包括4个麦克风,所述4个麦克风集成为一个麦克风阵列,设置于汽车顶部,4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上分别形成一个波束,所述获取每个收音设备收录的音频信息,得到多路音频信息,包括:

获取4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上收录的音频信息,得到4路音频信息。

优选的,若所述车载系统的多个收音设备包括设置于汽车控制台上由第一麦克风和第二麦克风构成的麦克风阵列和设置于汽车后排b柱的第三麦克风和第四麦克风,所述第一麦克风在汽车驾驶员方向形成一个波束,所述第二麦克风在副驾驶方向形成一个波束,所述第三麦克风在后排左侧方向形成一个波束,所述第四麦克风在后排右侧方向形成一个波束,所述获取每个收音设备收录的音频信息,得到多路音频信息,包括:

分别获取所述第一麦克风在汽车驾驶员方向收录的音频信息,所述第二麦克风在副驾驶方向收录的音频信息,所述第三麦克风在后排左侧方向收录的音频信息,所述第四麦克风在后排右侧方向收录的音频信息,得到4路音频信息。

优选的,若所述车载系统的多个收音设备包括设置于汽车左侧a柱上的第一麦克风、设置于汽车右侧a柱上的第二麦克风、设置于汽车左侧b柱上的第三麦克风和设置于汽车右侧b柱上的第四麦克风,所述第一麦克风在汽车左侧a柱方向形成一个波束,所述第二麦克风在汽车右侧a柱方向形成一个波束,所述第三麦克风在汽车左侧b柱方向形成一个波束,所述第四麦克风在汽车右侧b柱方向形成一个波束,所述获取每个收音设备收录的音频信息,得到多路音频信息,包括:

分别获取所述第一麦克风在汽车左侧a柱方向收录的音频信息,所述第二麦克风在汽车右侧a柱方向收录的音频信息,所述第三麦克风在汽车左侧b柱方向收录的音频信息,所述第四麦克风在汽车右侧b柱方向收录的音频信息,得到4路音频信息。

本发明第二方面提供了一种车载多音区声源检测装置,应用于包括多个收音设备的车载系统,每一个所述收音设备在一个方向上形成一个波束,每一个所述波束对应一个音区,所述车载多音区声源检测装置包括:

获取模块,用于获取每个收音设备收录的音频信息,得到多路音频信息,并将所述多路音频信息输入至唤醒模块;

所述唤醒模块,用于计算并比较多路所述音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息;

确定模块,用于确定所述最大的唤醒分值对应的音频信息所处音区,基于所述音区确定声源位置。

优选的,所述唤醒模块,具体用于计算多路所述音频信息的信噪比,比较多路所述音频信息的信噪比,确定信噪比最高的音频信息的唤醒分值最大,获取所述最大唤醒分值对应的音频信息。

本发明第三方面提供了一种车载系统,所述系统包括第二方面提供的一种车载多音区声源检测装置的任意一项装置,以及多个收音设备;

每一个所述收音设备在一个方向上至少形成一个波束,每一个所述波束对应一个音区,每个所述收音设备,用于收录对应音区的音频信息,并将收录的音频信息发送至所述车载多音区声源检测装置;

所述车载多音区声源检测装置,用于获取每个收音设备收录的音频信息,得到多路音频信息,计算并比较多路所述音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定所述最大的唤醒分值对应的音频信息所处音区,基于所述音区确定声源位置。

优选的,所述多个收音设备包括4个麦克风,所述4个麦克风集成为一个麦克风阵列,设置于汽车顶部,4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上分别形成一个波束;

或者

多个收音设备包括设置于汽车控制台上由第一麦克风和第二麦克风构成的麦克风阵列和设置于汽车后排b柱的第三麦克风和第四麦克风,其中,所述第一麦克风在汽车驾驶员方向形成一个波束,所述第二麦克风在副驾驶方向形成一个波束,所述第三麦克风在后排左侧方向形成一个波束,所述第四麦克风在后排右侧方向形成一个波束。

优选的,所述多个收音设备包括设置于汽车左侧a柱上的第一麦克风、设置于汽车右侧a柱上的第二麦克风、设置于汽车左侧b柱上的第三麦克风和设置于汽车右侧b柱上的第四麦克风,其中,所述第一麦克风在汽车左侧a柱方向形成一个波束,所述第二麦克风在汽车右侧a柱方向形成一个波束,所述第三麦克风在汽车左侧b柱方向形成一个波束,所述第四麦克风在汽车右侧b柱方向形成一个波束。

与现有技术相比,本发明提供的上述技术方案具有如下优点:

获取每个收音设备收录的音频信息,得到多路音频信息,计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。实现了对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种车载多音区声源检测方法的流程图;

图2是本发明实施例提供的一种以4个麦克风集成为一个麦克风阵列,设置于汽车顶部,对图1进行举例说明的流程图;

图3是本发明实施例提供的一种汽车控制台上由第一麦克风和第二麦克风构成的麦克风阵列和设置于汽车后排b柱的第三麦克风和第四麦克风集成为一个麦克风阵列,对图1进行举例说明的流程图;

图4是本发明实施例提供的一种设置于汽车左侧a柱上的第一麦克风、设置于汽车右侧a柱上的第二麦克风、设置于汽车左侧b柱上的第三麦克风和设置于汽车右侧b柱上的第四麦克风,对图1进行举例说明的流程图;

图5是本发明实施例提供的一种车载多音区声源检测装置的结构示意图;

图6是本发明实施例提供的一种车载多音区声源检测系统的结构示意图。

具体实施方式

本发明提供了一种车载多音区声源检测方法、装置及系统,用于解决车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

由背景技术可知,在现有技术中,汽车中的其他位置的成员可使用两个麦克风进行交互,但是无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令。

因此,本发明提供一种车载多音区声源检测方法、装置及系统,用于实现对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。

如图1所示,示出了本发明实施例提供的一种车载多音区声源检测方法,该方法包括以下步骤:

s101:获取每个收音设备收录的音频信息,得到多路音频信息。

在具体实现s101的过程中,存在多个收音设备,每个收音设备在一个方向上形成一个波束,每一个波束对应一个音区,负责收录音区对应位置的音频信息。然后通过获取每个收音设备收录的音频信息,为计算并比较多路音频信息的唤醒分值提供基础。

s102:计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息。

在具体实现s102的过程中,在获得各路音频信息后,通过对音频信息进行计算,获得每一音频信息对应的唤醒分值,然后比较每一音频信息对应的唤醒分值的大小,确定声源位置。

具体的,通过计算多路音频信息的信噪比,比较多路音频信息的信噪比大小,确定信噪比最高的音频信息的唤醒分值最大,获取最大唤醒分值对应的音频信息。

其中,由于每一路音频信息的信噪比不同,所以每一音频信息的唤醒分值不同,信噪比越高唤醒分值就越大。信噪比最高,说明唤醒分值最大的音频信息所对应的收音设备距离车内发出音频的用户最近。

s103:确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。

在具体实现s103的过程中,通过比较多路音频信息的信噪高低,确定唤醒分值最大的一路音频信息,因为每一个收音设备在一个方向上形成一个波束,每一个波束对应一个音区,所以收录唤醒分值最大的一路音频信息的收音设备对应的音区,就为最大的唤醒分值对应的音频信息所处音区,最终根据该音区确定声源位置。

例如:存在甲、乙、丙和丁4路音频信息,其中甲音频信息的信噪比为20db,乙音频信息的信噪比为10db,丙音频信息的信噪比为20db,丁音频信息的信噪比为90db,其中丁音频信息的信噪比最高,因此确定唤醒分值最大的为丁音频信息,根据最大的唤醒分值对应的丁音频信息所处音区,最终根据该音区确定声源位置。

根据上述本发明实施例公开的车载多音区声源检测方法可知,获取每个收音设备收录的音频信息,得到多路音频信息,计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。实现了对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。

基于上述本发明实施例图1示出的方法,这里以4个收音设备为4个麦克风,以及4个麦克风集成为一个麦克风阵列,设置于汽车顶部进行举例说明,如图2所示。

s201:获取4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上收录的音频信息,得到4路音频信息。

在具体实现s201的过程中,若车载系统的多个收音设备包括4个麦克风,4个麦克风集成为一个麦克风阵列,设置于汽车顶部,4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上分别形成一个波束,则获取4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上收录的音频信息,得到4路音频信息。

需要说明的是,根据不同车型以及车位的不同麦克风阵列中的麦克风的个数不同,即麦克风的个数和车位相匹配。具体的,根据实际情况进行设定。

例如:轿车为5座时,麦克风阵列需要5个麦克风组成,对7座大型suv(sportutilityvehicle,运动型实用轿车)来说,则需要7个麦克风组成的麦克风阵列设置于汽车顶部。

s202:计算并比较4路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息。

在具体实现s202的过程中,可参见s102的实施例,这里不再进行赘述。

s203:确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。

根据上述本发明实施例公开的一种车载多音区声源检测方法可知,获取4个麦克风收录的音频信息,得到4路音频信息,计算并比较4路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。实现了对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。

可选的,基于上述本发明实施例图1示出的方法,这里以4个收音设备为4个麦克风,其中,汽车控制台上由第一麦克风和第二麦克风构成的麦克风阵列和设置于汽车后排b柱的第三麦克风和第四麦克风集成为一个麦克风阵列,进行举例说明,如图3所示。

s301:分别获取第一麦克风在汽车驾驶员方向收录的音频信息,第二麦克风在副驾驶方向收录的音频信息,第三麦克风在后排左侧方向收录的音频信息,第四麦克风在后排右侧方向收录的音频信息,得到4路音频信息。

在具体实现s301的过程中,若车载系统的多个收音设备包括设置于汽车控制台上由第一麦克风和第二麦克风构成的麦克风阵列和设置于汽车后排b柱的第三麦克风和第四麦克风,第一麦克风在汽车驾驶员方向形成一个波束,第二麦克风在副驾驶方向形成一个波束,第三麦克风在后排左侧方向形成一个波束,第四麦克风在后排右侧方向形成一个波束,则分别获取第一麦克风在汽车驾驶员方向收录的音频信息,第二麦克风在副驾驶方向收录的音频信息,第三麦克风在后排左侧方向收录的音频信息,第四麦克风在后排右侧方向收录的音频信息,得到4路音频信息。

需要说明的是,汽车b柱位于汽车前门和后门交接处(后门铰链铰接处),除了b柱,汽车还包括a柱和c柱。其中,a柱位于汽车前挡风玻璃和前门的交接处(前门铰链铰接处),c柱位于汽车后门和后挡风玻璃的交接处(后门和后备箱处)。汽车a柱、b柱和c柱分别位于汽车不同的位置,作用在于:在轿车车身构造中,abc柱的位置涉及到车辆的整体布置、安全及驾乘舒适性问题,它们不仅仅是撑起驾驶舱车顶的金属柱子,而且对驾驶舱内的成员有重要的保护作用,可以说是驾驶员的保护神。

在车辆发生翻滚或倾覆的时候,abc柱能够有效避免驾驶舱被挤压变形,所以,abc柱的强度对车内的生命来说有重要意义。

另一个方面,abc柱也是一些装置的“必经之路”比如部分电器线路、安全带(b柱)、照明音响装置,甚至安全气囊都可以安置在上面。

需要说明的是,根据不同车型除了大部分汽车包括abc柱,部分汽车还包括d柱。

当汽车内的用户不论从哪个位置发出音频,控制台安置的两个麦克风,以及汽车左右两边的b柱安置的麦克风,都能同时收录用户发出的音频信息。不同位置的麦克风对不同位置的人进行区分,从而达到更好的交互体验的目的。

s302:计算并比较4路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息。

s303:确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。

根据上述本发明实施例公开的一种车载多音区声源检测方法可知,获取4个麦克风收录的音频信息,得到4路音频信息,计算并比较4路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。实现了对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。

可选的,基于上述本发明实施例图1示出的方法,这里以4个收音设备为4个麦克风,其中,包括设置于汽车左侧a柱上的第一麦克风、设置于汽车右侧a柱上的第二麦克风、设置于汽车左侧b柱上的第三麦克风和设置于汽车右侧b柱上的第四麦克风,进行举例说明,如图4所示。

s401:分别获取第一麦克风在汽车左侧a柱方向收录的音频信息,第二麦克风在汽车右侧a柱方向收录的音频信息,第三麦克风在汽车左侧b柱方向收录的音频信息,第四麦克风在汽车右侧b柱方向收录的音频信息,得到4路音频信息。

在具体实现s401的过程中,若车载系统的多个收音设备包括设置于汽车左侧a柱上的第一麦克风、设置于汽车右侧a柱上的第二麦克风、设置于汽车左侧b柱上的第三麦克风和设置于汽车右侧b柱上的第四麦克风,第一麦克风在汽车左侧a柱方向形成一个波束,第二麦克风在汽车右侧a柱方向形成一个波束,第三麦克风在汽车左侧b柱方向形成一个波束,第四麦克风在汽车右侧b柱方向形成一个波束,则分别获取第一麦克风在汽车左侧a柱方向收录的音频信息,第二麦克风在汽车右侧a柱方向收录的音频信息,第三麦克风在汽车左侧b柱方向收录的音频信息,第四麦克风在汽车右侧b柱方向收录的音频信息,得到4路音频信息。

s402:计算并比较4路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息。

s403:确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。

根据上述本发明实施例公开的车载多音区声源检测方法可知,获取每个收音设备收录的音频信息,得到多路音频信息,计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。实现了对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。

基于上述本发明实施例图1公开的车载多音区声源检测方法,本发明实施例还对应公开一种车载多音区声源检测装置50,如图5所示,为本发明实施例公开的一种车载多音区声源检测装置50的结构示意图,包括:获取模块51、唤醒模块52和确定模块53。

获取模块51,用于获取每个收音设备收录的音频信息,得到多路音频信息,并将多路音频信息输入至唤醒模块。

唤醒模块52,用于计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息。

唤醒模块52具体用于计算多路音频信息的信噪比,比较多路音频信息的信噪比,确定信噪比最高的音频信息的唤醒分值最大,获取最大唤醒分值对应的音频信息。

确定模块53,用于确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。

根据上述本发明实施例公开的车载多音区声源检测装置可知,获取每个收音设备收录的音频信息,得到多路音频信息,计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。实现了对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。

基于上述本发明实施例图1公开的车载多音区声源检测方法,本发明实施例还对应公开一种车载多音区声源检测系统60,如图6所示,为本发明实施例提供的一种车载多音区声源检测系统60的结构示意图,包括:车载多音区声源检测装置50,以及多个收音设备61。需要说明的是,每一个收音设备61在一个方向上至少形成一个波束,每一个波束对应一个音区。

每个收音设备61,用于收录对应音区的音频信息,并将收录的音频信息发送至车载多音区声源检测装置50。

车载多音区声源检测装置50,用于获取每个收音设备61收录的音频信息,得到多路音频信息,计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。

可选的,多个收音设备61包括4个麦克风,4个麦克风集成为一个麦克风阵列,设置于汽车顶部,4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上分别形成一个波束。

可选的,多个收音设备61包括设置于汽车控制台上由第一麦克风和第二麦克风构成的麦克风阵列和设置于汽车后排b柱的第三麦克风和第四麦克风,其中,第一麦克风在汽车驾驶员方向形成一个波束,第二麦克风在副驾驶方向形成一个波束,第三麦克风在后排左侧方向形成一个波束,第四麦克风在后排右侧方向形成一个波束。

可选的,多个收音设备61包括设置于汽车左侧a柱上的第一麦克风、设置于汽车右侧a柱上的第二麦克风、设置于汽车左侧b柱上的第三麦克风和设置于汽车右侧b柱上的第四麦克风,其中,第一麦克风在汽车左侧a柱方向形成一个波束,第二麦克风在汽车右侧a柱方向形成一个波束,第三麦克风在汽车左侧b柱方向形成一个波束,第四麦克风在汽车右侧b柱方向形成一个波束。

根据上述本发明实施例公开的车载多音区声源检测系统可知,获取每个收音设备收录的音频信息,得到多路音频信息,计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。实现了对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1