一种用于汽车的语音控制装置、方法及汽车与流程

文档序号:12274049阅读:425来源:国知局
一种用于汽车的语音控制装置、方法及汽车与流程

本发明涉及汽车领域,具体涉及一种用于汽车的语音控制装置、方法及汽车。



背景技术:

随着社会的发展,汽车已经成为人们生活中的一种重要的代步工具。随着汽车工业的进一步发展,为了方便驾驶员对车载导航系统和车载娱乐系统等系统的操作,语音识别技术在越来越多的汽车中得到应用。

目前,在现有的汽车上,车载语音识别系统仅在驾驶员位置设置固定的模拟麦克风,音频信号采用模拟信号输出,且在布线方面,使用的是传统模拟音频信号线。在实现本发明的过程中,发明人发现现有技术至少存在如下问题:指向性模拟麦克风只能进行音频信号的放大采集,不能进行车载环境的降噪处理;而且音频模拟信号输出很容易被干扰,无法保证输出音频的信号质量;同时,因为音频模拟信号的传输采用的是传统的音频信号线,其布线方式非常复杂,而且增加了线束重量和成本。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种用于汽车的语音控制装置、方法及汽车。

依据本发明的一个方面,提供了一种用于汽车的语音控制装置,包括:采集降噪模块,用于采集车内的模拟音频信号,对模拟音频信号进行模数转换以及降噪处理得到数字音频信号,将数字音频信号发送给信号转换模块;信号转换模块,用于接收采集降噪模块发送的数字音频信号,将数字音频信号转换为汽车音频总线信号,并通过汽车音频总线接口将汽车音频总线信号发送给识别控制模块;识别控制模块,用于对信号转换模块发送的汽车音频总线信号进行识别,根据识别结果执行相应的控制操作。

可选的,采集降噪模块进一步包括:麦克风阵列子模块,用于采集车内的模拟音频信号;以及,降噪处理子模块,用于对麦克风阵列子模块采集到的模拟音频信号进行模数转换以及降噪处理得到数字音频信号,将数字音频信号发送给信号转换模块。

可选的,降噪处理子模块具体用于通过回声消除技术和波束成型技术进行降噪处理。

可选的,采集降噪模块的数量为多个,且多个采集降噪模块分别通过信号转换模块与识别控制模块相连。

可选的,识别控制模块具体用于根据识别结果执行下述至少一种类型的控制操作:音视频搜索操作、信息查询操作、车辆控制操作、以及语音通话操作。

依据本发明的另一方面,提供了一种汽车,包括上述的用于汽车的语音控制装置。

依据本发明的另一方面,提供了一种用于汽车的语音控制方法,包括:采集车内的模拟音频信号,对模拟音频信号进行模数转换以及降噪处理得到数字音频信号;将数字音频信号转换为汽车音频总线信号;对汽车音频总线信号进行识别,根据识别结果执行相应的控制操作。

可选的,车内的模拟音频信号通过麦克风阵列进行采集。

可选的,对模拟音频信号进行模数转换以及降噪处理得到数字音频信号的步骤包括通过回声消除技术和波束成型技术进行降噪处理。

可选的,控制操作具体包括下述至少一种类型的控制操作:音视频搜索操作、信息查询操作、车辆控制操作、以及语音通话操作。

本发明实施例提供的一种用于汽车的语音控制装置、方法及汽车中,采集车内的模拟音频信号,对模拟音频信号进行模数转换以及降噪处理得到数字音频信号;将数字音频信号转换为汽车音频总线信号;对汽车音频总线信号进行识别,根据识别结果执行相应的控制操作。由此可见,本发明实施例可以采集车内人员发出的语音指令,且将模拟音频信号转换成汽车音频总线信号后,通过汽车音频总线传输,能够极大的保证音频信号的高保真度和音频传输的实时性,降低车载布线复杂度,同时显著减轻传输电缆线束的重量,进而提高汽车燃油效率或电池寿命。

上述发明实施例仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本发明实施例提供的一种用于汽车的语音控制装置的结构图;

图2示出了本发明另一实施例提供的一种用于汽车的语音控制装置的结构图;

图3示出了本发明另一实施例提供的汽车的结构图;

图4示出了本发明另一实施例提供的汽车的结构图;

图5示出了本发明另一实施例提供的一种用于汽车的语音控制方法的流程图;

图6示出了本发明另一实施例提供的一种用于汽车的语音控制方法的流程图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例提供了一种用于汽车的语音控制装置、方法及汽车,至少能够解决现有技术中无法保证音频信号质量,车载布线复杂,线束重量大、成本高的技术问题。

图1示出了本发明一个实施例提供的用于汽车的语音控制装置的结构图,如图1所示,该装置包括:采集降噪模块11、信号转换模块12和识别控制模块13。

下面详细介绍图1所示的实施例中的各个部件的具体结构和工作原理:

采集降噪模块11,用于采集车内的模拟音频信号,对模拟音频信号进行模数转换以及降噪处理得到数字音频信号,将数字音频信号发送给信号转换模块12。具体实现时,音频信号的采集范围不限于驾驶员位置,还可以包括其他乘客所在位置,这样除驾驶员以外的其他乘客也能对该语音控制装置发出指令,进一步方便乘客操作。因为数字音频信号更容易通过软硬件对其进行降噪等处理,因此须对采集到的模拟音频信号进行模数转换。本领域技术人员可以灵活通过多种降噪技术进行降噪处理,例如,回声消除技术和/或波束成型技术等均可应用于本发明实施例中。

信号转换模块12,用于接收采集降噪模块11发送的数字音频信号,将数字音频信号转换为汽车音频总线信号,并通过汽车音频总线接口将汽车音频总线信号发送给识别控制模块13。

其中,汽车音频总线是美国的ADI公司针对车载应用推出的数字音频总线,英文名称为Automotive Audio Bus,缩写为A2B,只需要使用一束非屏蔽双绞线就可以双向传输32个通道的音频数据,还可以实现远程I2C控制和对多节点进行故障诊断,还具备对各个节点提供最大50mA左右的幻象供电的能力。A2B最大支持9个节点(1个主节点和8个从节点),采用菊花链形式连接,节点之间最大支持10米线缆,整条链路上支持最大40米距离的线缆,且第一个节点和第九个节点之间的音频数据传递延迟最大只有50μs的。基于A2B的特性,仅需要1束非屏蔽双绞线就可以将8个音频节点连接起来,在保证节点间音频数据传递实时性的前提下,极大降低了整车布线的复杂度和车身重量,也使得整车更容易通过EMC/EMI测试。同时,由于A2B还能实现远程I2C控制,因此在各个音频节点上,可以省去MCU以及CAN等控制接口。在使用幻象供电的情况下,部分节点也不需要使用电源芯片。从而为各个音频节点做了瘦身处理,降低了系统成本。

识别控制模块13,用于对信号转换模块12发送的汽车音频总线信号进行识别,根据识别结果执行相应的控制操作。其中,控制操作可以包括音视频搜索操作、信息查询操作、车辆控制操作、以及语音通话操作等操作。

由此可见,本发明实施例中的方式能够有效地采集车内任何位置的人员发出的语音指令,且降低车载布线复杂度,降低车载音频系统BOM成本,保证音频信号的高保真度和音频传输的实时性,同时显著减轻传输电缆线束的重量,进而提高汽车燃油效率或电池寿命。

图2示出了本发明另一个具体实施例提供的一种用于汽车的语音控制装置的结构图。如图2所示,该装置包括:采集降噪模块21,信号转换模块22和识别控制模块23。其中,采集降噪模块21进一步包括麦克风阵列子模块211和降噪处理子模块212。

下面详细介绍图2所示的实施例中的各个部件的具体结构和工作原理:

在本实施例中,采集降噪模块21用于采集车内的模拟音频信号,对模拟音频信号进行模数转换以及降噪处理得到数字音频信号,将数字音频信号发送给信号转换模块22。

其中,麦克风阵列子模块211是通过布置在车内不同位置的多个麦克风组成的麦克风阵列,全方位地实时采集车内的模拟音频信号。例如,可以在驾驶员位置和每个乘客位置分别设置对应的麦克风,以便于分别采集相应位置处的音频信号;也可以在车内前侧、后侧、左侧或右侧等不同方位分别设置多个麦克风,以便于全方位地采集车内所有的音频信号。因为麦克风阵列没有指向性,其采集音频信号的位置是一个区域,因此,通过合理布局麦克风,可以形成一个尽可能覆盖车内所有位置的音频信号接收区域,所以无论是驾驶员发出的语音指令还是其他乘客发出的语音指令均能被麦克风阵列子模块211有效采集并传送给降噪处理子模块212。

另外,触发上述的麦克风阵列子模块211开始采集音频信号的触发方式可以灵活通过多种形式实现:在第一种实现方式中,可以在汽车启动后直至熄火前的整个时间段内实时采集车内的音频信号,该方式尤其适用于麦克风阵列分别设置在车内前侧、后侧、左侧或右侧等不同方位处,以便于全方位地采集车内所有的音频信号的应用场景中。在第二种实现方式中,可以设置控制按钮,当保持控制按钮处于被按压状态时,开始采集车内的音频信号,松开控制按钮时,停止采集车内的音频信号,该方式尤其适用于麦克风阵列分别设置在驾驶员位置和各个乘客位置时,此时,可以为各个麦克风分别设置单独的控制按钮,以使相应位置处的乘客能够通过该控制按钮控制对应的麦克风,使得音频信号的采集更具有针对性。另外,在其他的实现方式中,还可以设置专用按钮,当按压该专用按钮后,在预设时间(如30s内)采集车内音频信号,当预设时间结束时,停止采集,下次采集时需再次按压该专用按钮。上述的控制按钮以及专用按钮可以灵活通过各种形式实现,例如,可以为按压式按钮和/或拨动式开关等。另外,上述的几种实现方式既可以单独使用,也可以结合使用,本发明对此不做限定。

降噪处理子模块212用于对麦克风阵列子模块211采集到的模拟音频信号转换成数字音频信号并进行降噪处理,最后将该数字音频信号发送给信号转换模块22。因为数字音频信号更容易通过软硬件对其进行降噪等处理,因此须对采集到的模拟音频信号进行模数转换。其中,降噪处理子模块212主要通过回声消除技术和波束成型技术进行降噪处理。回声消除技术是指采用回波抵消方法,也就是通过自适应方法估计回波信号的大小,然后在接收信号中减去此估计值以抵消回波的降噪技术。波束成型技术是通过多个音频接收器产生一个指向性的波束,将信号集中在需要采集的方向,从而减少采集其他方向噪音的降噪方式。在具体实施中,降噪方法不局限于上述两种方法。

可选的,采集降噪模块21的数量可以是多个,且多个采集降噪模块21分别通过信号转换模块22与识别控制模块23相连接。具体来说,这三者之间的连接关系可以有以下几种情况:在第一种情况中,信号转换模块22的数量也为多个,且信号转换模块22的数量等于采集降噪模块21的数量,此时,一个采集降噪模块21仅对应连接一个信号转换模块22,然后所有的信号转换模块22连接到同一个识别控制模块23上。在第二种情况中,信号转换模块22的数量也为多个,且信号转换模块22的数量小于采集降噪模块21的数量,此时,可以预先结合采集降噪模块21布置的位置等因素对所有的采集降噪模块21进行分组,同一组的采集降噪模块21连接到同一个信号转换模块22上,然后所有的信号转换模块22连接到同一个识别控制模块23上。在第三种情况中,信号转换模块22的数量仅为一个,此时,所有的采集降噪模块21都连接到同一个信号转换模块22上,然后该信号转换模块22与一个识别控制模块23相连接。本领域技术人员可以根据实际需要灵活选取上述几种方式中的任一方式。另外,本领域技术人员还可以对本发明实施例中的各个模块进行各种改进和变形,例如,也可以将信号转换模块22集成到采集降噪模块21中,该方式尤其适用于上述的第一种情况中,又如,还可以将信号转换模块22集成到识别控制模块23中,该方式尤其适用于上述的第三种情况中。

信号转换模块22主要用于接收采集降噪模块21发送的数字音频信号,并且将该数字音频信号转换成汽车音频总线信号,并通过汽车音频总线接口将汽车音频总线信号发送给识别控制模块23。其中,根据汽车音频总线的技术特点,汽车音频总线信号是通过非屏蔽双绞线传输的,且传输线路可以采用菊花链形式进行连接。

识别控制模块23主要用于识别信号转换模块22发送的汽车音频总线信号,并根据识别的结果执行相应的控制操作。其中,识别控制模块23是对采集并经过处理的音频信号予以具体应用的模块,在本实施例中具体来说,可以是智能车载娱乐系统,也可以是车载导航系统,其执行的具体操作可以是音视频搜索操作、信息查询操作、车辆控制操作以及语音通话操作等。

由此可见,本发明实施例中的方式采用麦克风阵列采集音频信号,能够有效地采集车内任何位置的人员发出的语音指令,通过汽车音频总线信号传输所采集到的音频信号,更好地保证了音频信号的高保真度和音频传输的实时性,并且,一组汽车音频总线能够同时挂载多路采集降噪模块21,显著降低了车载布线复杂度,降低了车载音频系统BOM成本,同时显著减轻传输电缆线束的重量,进而提高汽车燃油效率或电池寿命。

另外,本发明中的实现方式由于进行了语音降噪处理,因而尤其适用于车内嘈杂的环境中,并且,本发明实施例可以灵活应用于多种智能应用中,例如,车载导航系统、车载娱乐系统等。

图3示出了本发明另一实施例提供的汽车300的结构图。如图3所示,该汽车300包括上述图1所示的语音控制装置,具体包括:采集降噪模块11、信号转换模块12和识别控制模块13。

图4示出了本发明另一实施例提供的汽车400的结构图。如图4所述,该汽车400包括上述图2所示的语音控制装置,具体包括:采集降噪模块21、信号转换模块22和识别控制模块23,其中采集降噪模块21进一步包括麦克风阵列子模块211和降噪处理模块212。

图5示出了本发明另一实施例提供的一种用于汽车的语音控制方法的流程图。如图5所示,该方法包括以下步骤:

步骤S501:采集车内的模拟音频信号,对模拟音频信号进行模数转换以及降噪处理得到数字音频信号。

具体实现时,音频信号的采集范围不限于驾驶员位置,还可以包括其他乘客所在位置,这样除驾驶员以外的其他乘客也能发出语音控制指令,进一步方便乘客操作。因为数字音频信号更容易通过软硬件对其进行降噪等处理,因此须对采集到的模拟音频信号进行模数转换。其中,本领域技术人员可以灵活通过多种降噪技术进行降噪处理,例如,回声消除技术和/或波束成型技术等均可应用于本发明实施例中。

步骤S502:将数字音频信号转换为汽车音频总线信号。

其中,汽车音频总线是美国的ADI公司针对车载应用推出的数字音频总线,英文名称为Automotive Audio Bus,缩写为A2B,只需要使用一束非屏蔽双绞线就可以双向传输32个通道的音频数据,还可以实现远程I2C控制和对多节点进行故障诊断,还能对各个节点提供最大50mA左右的幻象供电的能力。A2B最大支持9个节点(1个主节点和8个从节点),采用菊花链形式连接,节点之间最大支持10米线缆,整条链路上支持最大40米距离的线缆,且第一个节点和第九个节点之间的音频数据传递延迟最大只有50μs的。基于A2B的特性,仅需要1束非屏蔽双绞线就可以将8个音频节点连接起来,在保证节点间音频数据传递实时性的前提下,极大降低了整车布线的复杂度和车身重量,也使得整车更容易通过EMC/EMI测试。同时,由于A2B还能实现远程I2C控制,因此在各个音频节点上,可以省去MCU以及CAN等控制接口。在使用幻象供电的情况下,部分节点也不需要使用电源芯片。从而为各个音频节点做了瘦身处理,降低了系统成本。

汽车音频总线通过专用的汽车音频总线信号进行音频信号传输。与模拟信号相比,汽车音频总线信号抗干扰能力强,具有高保真度和更好的实时性。

步骤S503:对汽车音频总线信号进行识别,根据识别结果执行相应的控制操作。其中,控制操作可以包括音视频搜索操作、信息查询操作、车辆控制操作、以及语音通话操作等操作。

由此可见,本发明实施例中的方式能够有效地采集车内任何位置的人员发出的语音指令,且降低车载布线复杂度,降低车载音频系统BOM成本,保证音频信号的高保真度和音频传输的实时性,同时显著减轻传输电缆线束的重量,进而提高汽车燃油效率或电池寿命。

图6示出了本发明另一实施例提供的一种用于汽车的语音控制方法的流程图。如图6所示,该方法包括以下步骤:

步骤S601:通过麦克风阵列采集车内的模拟音频信号。

其中,麦克风阵列是通过布置在车内不同位置的多个麦克风组成的,能够全方位地实时采集车内的模拟音频信号。例如,可以在驾驶员位置和每个乘客位置分别设置对应的麦克风,以便于分别采集相应位置处的音频信号;也可以在车内前侧、后侧、左侧或右侧等不同方位分别设置多个麦克风,以便于全方位地采集车内所有的音频信号。因为麦克风阵列没有指向性,其采集音频信号的位置是一个区域,因此,通过合理布局麦克风,可以形成一个尽可能覆盖车内所有位置的音频信号接收区域,所以无论是驾驶员发出的语音指令还是其他乘客发出的语音指令均能被麦克风阵列有效采集。

另外,触发上述的麦克风阵列开始采集音频信号的触发方式可以灵活通过多种形式实现:在第一种实现方式中,可以在汽车启动后直至熄火前的整个时间段内实时采集车内的音频信号,该方式尤其适用于麦克风阵列分别设置在车内前侧、后侧、左侧或右侧等不同方位处,以便于全方位地采集车内所有的音频信号的应用场景中。在第二种实现方式中,可以设置控制按钮,当保持控制按钮处于被按压状态时,开始采集车内的音频信号,松开控制按钮时,停止采集车内的音频信号,该方式尤其适用于麦克风阵列分别设置在驾驶员位置和各个乘客位置时,此时,可以为各个麦克风分别设置单独的控制按钮,以使相应位置处的乘客能够通过该控制按钮控制对应的麦克风,使得音频信号的采集更具有针对性。另外,在其他的实现方式中,还可以设置专用按钮,当按压该专用按钮后,在预设时间(如30s内)采集车内音频信号,当预设时间结束时,停止采集,下次采集时需再次按压该专用按钮。上述的控制按钮以及专用按钮可以灵活通过各种形式实现,例如,可以为按压式按钮和/或拨动式开关等。另外,上述的几种实现方式既可以单独使用,也可以结合使用,本发明对此不做限定。

步骤S602:对采集到的模拟音频信号进行模数转换并通过回声消除技术和波束成型技术进行降噪处理得到数字音频信号。

因为数字音频信号更容易通过软硬件对其进行降噪等处理,因此须对采集到的模拟音频信号进行模数转换。其中,回声消除技术是指采用回波抵消方法,也就是通过自适应方法估计回波信号的大小,然后在接收信号中减去此估计值以抵消回波的降噪技术。波束成型技术是通过多个音频接收器产生一个指向性的波束,将信号集中在需要采集的方向,从而减少采集其他方向噪音的降噪方式。在具体实施中,降噪方法不局限于上述两种方法。

步骤S603:将数字音频信号转换为汽车音频总线信号。

其中,根据汽车音频总线的技术特点,汽车音频总线信号是通过非屏蔽双绞线传输的,且传输线路可以采用菊花链形式进行连接。

步骤S604:对汽车音频总线信号进行识别,根据识别结果执行相应的音视频搜索、信息查询、车辆控制和语音通话等操作。

其中,对采集并经过处理的音频信号予以应用的系统,在本实施例中具体来说,可以是智能车载娱乐系统,也可以是车载导航系统。其中,与传统汽车的车载平台相比,智能车载娱乐系统是实现了网络化、智能化的多媒体终端,具备从互联网获得多媒体信息内容并通过车载大屏幕展现的功能,该系统可以实现网络搜索、音视频点播、信息查询和视频通话等各种互联网应用服务。

由此可见,本发明实施例中的方式采用麦克风阵列采集音频信号,能够有效地采集车内任何位置的人员发出的语音指令,通过汽车音频总线信号传输所采集到的音频信号,更好地保证了音频信号的高保真度和音频传输的实时性,并且,一组汽车音频总线能够同时挂载多路采集降噪设备,显著降低了车载布线复杂度,降低了车载音频系统BOM成本,同时显著减轻传输电缆线束的重量,进而提高汽车燃油效率或电池寿命。

另外,本发明中的实现方式由于进行了语音降噪处理,因而尤其适用于车内嘈杂的环境中,并且,本发明实施例可以灵活应用于多种智能应用中,例如,车载导航系统、车载娱乐系统等。

此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1