车载音响控制方法、装置、电子设备及存储介质与流程

文档序号：16521842发布日期：2019-01-05 10:01阅读：208来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本申请涉及汽车控制技术领域，特别涉及一种车载音响控制方法、装置、电子设备及计算机可读存储介质。

背景技术：

随着人们生活水平的不断提高，汽车越来越普及，驾乘场景也越来越多样。不同的驾乘场景下，用户对车载音响的播放内容和音量大小的要求有所不同。

例如，在车内进行商务洽谈时，一般不适合播放重金属摇滚音乐，也不适合大音量；在车内接听电话时，不适合大音量。

当前，车载音响的音量大小调节、播放内容切换都完全依赖于人工进行，较为繁琐。

申请内容

为了解决相关技术中车载音响的音量大小调节、播放内容切换完全依赖于人工进行的技术问题，本申请提供了一种车载音响控制方法、装置、电子设备及计算机可读存储介质。

一种车载音响控制方法，所述方法包括：

在车载音响执行音频播放时，采集车内声音获得声音信号；

根据所述车载音响播放的音频，消除所述声音信号中所述音频对应的部分，得到语音信号；

识别所述语音信号的语义内容，确定所述语义内容映射的语音场景；

根据所述语音场景调整所述车载音响的播放策略。

在一示例性实施例中，所述根据所述语音场景调整所述车载音响的播放策略之后，所述方法还包括：

检测所述车载音响的用户调控操作；

根据所述用户调控操作调整所述车载音响的播放策略。

在一示例性实施例中，所述根据所述语音场景调整所述车载音响的播放策略之后，所述方法还包括：

检测所述语音信号的停止时长；

所述停止时长达到指定时长时，控制还原所述车载音响的播放策略。

在一示例性实施例中，所述声音信号包括近场声音信号和远场声音信号，所述根据所述车载音响播放的音频，消除所述声音信号中所述音频对应的部分，得到语音信号，包括：

将所述近场声音信号和远场声音信号相减得到信号差；

放大所述信号差，得到所述语音信号。

在一示例性实施例中，所述识别所述语音信号的语义内容，确定所述语义内容映射的语音场景，包括：

对所述语音信号进行语音识别，得到语义内容；

根据预设的若干关键词，查找所述语义内容中所含关键词；

通过关键词向语音场景的映射，确定所述语义内容对应的语音场景。

在一示例性实施例中，所述识别所述语音信号的语义内容，确定所述语义内容映射的语音场景，包括：

将所述语音信号传输至语音识别后台，所述语音识别后台用于识别语音信号的语义内容，还用于根据语义内容确定语音场景；

接收所述语音识别后台确定的所述语音场景。

在一示例性实施例中，所述根据所述语音场景调整所述车载音响的播放策略包括：

调用所述语音场景所映射播放配置信息，调整所述车载音响的播放策略。

一种车载音响控制装置，所述装置包括：

声音采集模块，用于在车载音响执行音频播放时，采集车内声音获得声音信号；

语音提取模块，用于根据所述车载音响播放的音频，消除所述声音信号中所述音频对应的部分，得到语音信号；

语义识别模块，用于识别所述语音信号的语义内容，确定所述语义内容映射的语音场景；

调控模块，用于根据所述语音场景调整所述车载音响的播放策略。

在一示例性实施例中，所述装置还包括：

操作检测模块，用于检测所述车载音响的用户调控操作；

二次调控模块，用于根据所述用户调控操作调整所述车载音响的播放策略。

在一示例性实施例中，所述装置还包括：

计时模块，用于检测所述语音信号的停止时长；

还原模块，用于所述停止时长达到指定时长时，控制还原所述车载音响的播放策略。

在一示例性实施例中，所述语音提取模块包括：

差分单元，将所述近场声音信号和远场声音信号相减得到信号差；

放大单元，放大所述信号差，得到所述语音信号。

在一示例性实施例中，所述语义识别模块包括：

识别单元，对所述语音信号进行语音识别，得到语义内容；

查找单元，根据预设的若干关键词，查找所述语义内容中所含关键词；

映射单元，通过关键词向语音场景的映射，确定所述语义内容对应的语音场景。

在一示例性实施例中，所述语义识别模块包括：

发送单元，将所述语音信号传输至语音识别后台，所述语音识别后台用于识别语音信号的语义内容，还用于根据语义内容确定语音场景；

接收单元，接收所述语音识别后台确定的所述语音场景。

在一示例性实施例中，所述调控模块被配置为执行：

调用所述语音场景所映射播放配置信息，调整所述车载音响的播放策略。

一种电子设备，所述电子设备包括：

处理器；

存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被处理器执行时，实现如前所述的方法。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如前所述的方法。

本申请的实施例提供的技术方案可以包括以下有益效果：

在车载音响执行音频播放时，通过采集车内声音，从中提取语音信号，之后，根据语音信号的语义内容调用相应播放配置信息，调整车载音响的播放策略，实现了根据车内用户所说内容自动调整车载音响的播放策略，例如，调整播放内容、播放音量，解决了现有技术中车载音响的音量大小调节、播放内容切换完全依赖于人工进行的问题。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并于说明书一起用于解释本申请的原理。

图1是根据一示例性实施例示出的一种车载音响控制方法的流程图；

图2是根据图1对应实施例示出的一种车载音响控制方法的流程图；

图3是根据图1对应实施例示出的一种车载音响控制方法的流程图；

图4是根据图1对应实施例示出的步骤130的细节的流程图；

图5是根据图1对应实施例示出的步骤150的细节的流程图；

图6是根据图1对应实施例示出的步骤150的细节的流程图；

图7是根据一具体实施例示出的一种车载音响控制方法的流程图；

图8是根据一示例性实施例示出的一种语音提取算法原理示意图；

图9是根据一示例性实施例示出的一种车载音响控制装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所描述的、本申请的一些方面相一致的装置和方法的例子。

现如今，大部分汽车都装设了多媒体系统，配备了音响、显示屏，使用户在车内也能够听音乐、看视频。但是，在播放内容的切换上，目前还完全依赖于用户的手动操作，比如，通过触摸屏调节音量大小、切换播放内容。因此，以下提供一种车载音响控制方法，实现播放内容的智能化切换以及播放音量的智能化调节。

图1是根据一示例性实施例示出的一种车载音响控制方法的流程图。如图1所示，该方法包括以下步骤。

步骤110，在车载音响执行音频播放时，采集车内声音获得声音信号。

汽车的多媒体系统是基于包括处理器、存储器在内的硬件设备实现的，车载音响受控于处理器执行音频的播放，将音频转换为声波。

在车载音响执行音频播放时，用户可能在车内说话，为了获得用户所说内容，通过声音采集设备(例如麦克风)采集车内声音，将声波转换为电信号，得到声音信号。

步骤130，根据车载音响播放的音频，消除声音信号中音频对应的部分，得到语音信号。

车内声音包括车载音响产生的声音、用户说话产生的声音以及一些杂音(例如车外的雨声)。以上声音中，音量较大的一般为车载音响产生的声音和用户说话产生的声音。为识别用户所说的内容，通过消除声音信号中车载音响所播放音频对应的部分，得到语音信号。

在一示例性实施例中，通过装设于车内不同位置的声音采集设备(例如麦克风)进行声音信号采集。其中，距离说话用户较远的采集设备所采集到的说话声信号较弱，距离说话用户较近的设备所采集到的说话声信号较强，在车内不同位置采集到的音响信号强弱又极为接近。因此，通过将距离说话用户较远和较近的设备所采集声音信号之差放大，就能够得到语音信号。

步骤150，识别语音信号的语义内容，确定语义内容映射的语音场景。

在一示例性实施例中，得到语音信号后，通过前述处理器对语音信号进行识别，得到语义内容，以及，搜索语义内容中的关键词，根据关键词确定语音场景。

在另一示例性实施例中，得到语音信号后，通过无线网络将该语音信号传输到语音识别后台，该后台识别出语音信号的语义内容，搜索该语义内容中的关键词，根据关键词确定语音场景。

关键词及相应语音场景例如：

1、电话通话场景

从语义内容中搜索到例如“喂”和“您好”的关键词，可以确定车内用户正在打电话，语义内容映射的语音场景为电话通话场景。

2、商务洽谈场景

从语义内容中搜索到例如“价格”、“成本”、“货”的商务相关关键词，可以确定车内用户正在进行商务洽谈，语义内容映射的语音场景为商务洽谈场景。

3、出行游玩场景

从语义内容中搜索到例如旅游景点、行程安排的出行游玩相关内容，可以确定用户目前为出行游玩状态，语义内容映射的语音场景为出行游玩场景。

4、情侣交谈场景

从语义内容中搜索到情侣交谈相关关键词，可以确定车内用户正在进行情侣交谈，语义内容映射的语音场景为情侣交谈场景。

语音场景不限于以上场景，关键词也不限于以上关键词。

步骤170，根据语音场景调整车载音响的播放策略。

在一示例性实施例中，调用语音场景所映射播放配置信息，调整车载音响的播放策略。播放配置信息可以包括播放内容信息以及播放音量信息，相应的，调用播放配置信息可以使得车载音响播放音量增大/减小至上述播放音量信息指示的音量大小，还可以使得车载音响播放内容切换至上述播放内容信息指示的音频内容。

例如：

1、电话通话场景

根据例如“喂”和“您好”的关键词确定车内用户正在打电话后，自动将车载音响的播放策略调整为暂停状态。

2、商务洽谈场景

根据例如“价格”、“成本”、“货”的关键词确定车内用户正在进行商务洽谈还，自动将播放内容切换至轻音乐，可以是切换至轻音乐播放列表，也可以是切换至轻音乐单曲。

3、出行游玩场景

根据例如旅游景点、行程安排的出行游玩相关内容确定用户目前为出行游玩状态后，自动将播放音量降低，以便于用户交谈，以及，将播放内容切换为公路音乐。

4、情侣交谈场景

根据情侣交谈相关关键词确定车内用户正在进行情侣交谈后，自动将播放音量降低，以便于用户交谈，以及，将播放内容切换为情歌。

在一示例性实施例中，自动调整车载音响的播放策略之前，保存当前的播放内容和播放音量信息，使得之后能够根据所保存的信息还原至执行自动调整前的播放状态。

在步骤170之前，将语音场景与相应的播放配置信息关联存储于前述存储器(见对步骤110的说明)上。前述语音识别后台(见对步骤150的说明)根据关键词确定语音场景后，前述处理器(见对步骤110的说明)根据语音场景调用播放配置信息，调整车载音响的播放策略。

在一示例性实施例中，在步骤170之后，如图2所示，上述方法还包括以下步骤。

步骤210，检测车载音响的用户调控操作。

车载音响的用户调控操作是指触发前述处理器调整播放策略的用户操作，例如，通过前述多媒体系统为用户提供的hmi(humanmachineinterface，人机交互界面)触发前述处理器调整车载音响音量的触控操作。

步骤230，根据用户调控操作调整车载音响的播放策略。

在实际场景中，用户可能临时对播放内容、播放音量有其它需求，为此，在一示例性实施例中，在上述步骤230之后，保持用户所调整的播放内容、播放音量，直到语音场景发生变化。

在一示例性实施例中，在步骤170之后，如图3所示，上述方法还包括以下步骤。

步骤310，检测语音信号的停止时长。

如前所述的，之所以调整车载音响的播放策略，是因为检测到语音信号，自动调整播放内容、播放音量使得车载音响的播放策略适应于车内用户的说话内容，使播放内容、音量的切换及调节更为智能。

因此，在一示例性实施例中，在当前语音场景下，语音信号停止(即车内用户停止说话)时，开始计时，以确定语音信号停止了多长时间。

步骤330，停止时长达到指定时长时，控制还原车载音响的播放策略。

语音信号的停止时长达到指定时长，则说明用户在指定时长内都没有说话，此时，将车载音响的播放策略自动还原为检测到该语音信号前的状态。例如，自动将音量还原为降低前的大小，又例如，自动将播放内容还原为切换前的内容。

音量的降低是为了使用户能够从车载音响的声音中区分出人说话的声音，播放内容的切换则是为了使所播放音乐适应于车内用户的说话内容，在一示例性实施例中，进行还原时，只还原播放音量，不还原播放内容，直到语音场景发生变化。

图4是根据图1对应实施例示出的步骤130的细节的流程图。在一示例性实施例中，步骤110中所述声音信号包括近场声音信号和远场声音信号，相应的，如图4所示，步骤130具体包括：

步骤131，将近场声音信号和远场声音信号相减得到信号差。

近场声音信号是距离说话用户较近的设备采集到的，所含说话声信号较强，远场声音信号是距离说话用户较远的设备采集到的，所含说话声信号较弱。因近场声音信号和远场声音信号中所含音响信号的信号强弱极为接近，所以，将近场声音信号和远场声音信号相减所得信号差中几乎完全为说话声信号。

步骤133，放大信号差，得到语音信号。

因说话声信号的强度相比于音响信号较弱，所以，将所得信号差放大增强，得到语音信号。因所得信号差中几乎完全为说话声信号，所以语音信号中也基本为说话声信号，所含音响信号和杂音信号较少。

图5是根据图1对应实施例示出的步骤150的细节的流程图。如图5所示，在一示例性实施例中，步骤150包括：

步骤151，对语音信号进行语音识别，得到语义内容。

前述处理器调用存储于前述存储器中用于识别语音信号的计算机可读指令，执行对语音信号的识别，得到语义内容。

步骤153，根据预设的若干关键词，查找语义内容中所含关键词。

在一示例性实施例中，预先建立数据库，数据库中包含有不同场景中可能会出现的关键词，例如，在电话通话场景中大多会出现“喂”和“您好”。通过语音识别后台获得语义内容后，根据数据库中的关键词，在语义内容中进行关键词搜索。

步骤155，通过关键词向语音场景的映射，确定语义内容对应的语音场景。

除建立数据库外，还预先将数据库中的关键词与语音场景关联，例如，将“喂”和“您好”与电话通话场景关联，当从语义内容中查找到“喂”以及“您好”，确定语音场景为电话通话场景。又例如，将“价格”、“成本”、“货”与商务洽谈场景关联，当从语义内容中查找到“价格”、“成本”以及“货”，确定语音场景为商务洽谈场景。

部分场景可以根据单个关键词确定，例如求婚场景，可以根据关键词“嫁给我”确定。部分场景则需根据数个关键词确定，例如商务洽谈场景，只根据“成本”是无法确定车内用户是否在进行商务洽谈，还需辅以例如“价格”、“货”、“交期”的关键词。

在一示例性实施例中，步骤150包括：

步骤152，将语音信号传输至语音识别后台，语音识别后台用于识别语音信号的语义内容，还用于根据语义内容确定语音场景。

为保障语音识别速度，将语音信号通过例如3g、4g、5g的无线网络传输到语音识别后台，通过语音识别后台识别得到语音信号对应的语义内容。该语音识别后台可以是例如思必驰、科大讯飞的第三方平台。

语音识别后台识别出语义内容后，根据语义内容中的关键词确定该语义内容所对应语音场景，将该语音场景返回汽车。

步骤154，接收语音识别后台确定的语音场景。

以下根据一具体实施例对本申请进行说明。

图7是根据一具体实施例示出的一种车载音响控制方法的流程图。如图7所示，该方法的执行流程为：

s1：车内人员交谈和播放音乐同时进行的过程中，实时采集车内声音。

s2：通过语音提取算法滤除播放音乐声音，提取出人员交谈的音频流。

其中，语音提取算法的原理是：通过双麦克风采集环境声音，之后，通过声控引擎(例如思必驰、科大讯飞)进行差分计算滤除音乐声音，得到人员交谈的音频流。

图8是根据一示例性实施例示出的一种语音提取算法原理示意图。

s3：将音频流上传到语音识别后台进行语义解析，分析出音频流符合的语音场景(例如电话通话场景、商务洽谈场景、出行游玩场景)。

提取出人员交谈的音频流后，通过4g网络将音频流传送到语音识别后台，该后台由例如思必驰、科大讯飞的语音识别产品提供商搭建。

s4：自动调整至为该语音场景预置的音乐内容及音量。

s5：如果车上人员手动修改播放内容或音量，维持修改后的设置不变。

s6：如果车上人员没有修改播放内容或音量，则跳转到步骤s1。

s7：如果车上人员停止交谈，则恢复之前音量。

以下结合具体场景进行说明：

1、电话通话场景

通过例如“喂”、“您好”的关键词判别车内人员正在打电话，自动暂停音乐播放；提取到例如“再见”、“拜拜”的关键词，或持续一段时间没有检测到音频流，则恢复音乐播放。

2、商务洽谈场景

通过例如“价格”、“成本”、“货”、“交期”的商务相关关键词的组合，判别目前为商务洽谈状态，自动降低音量，将所播放音乐切换为轻音乐；持续一段时间没有检测到音频流，则恢复之前的音量。

3、出行游玩场景

通过提取谈话内容中的旅游景点、行程安排关键词，判别目前为出行游玩状态，自动降低音量，将所播放音乐切换为公路音乐；持续一段时间没有检测到音频流，则恢复之前音量。

下述为本申请装置实施例，可以用于执行本申请上述方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

图9是根据一示例性实施例示出的一种车载音响控制装置的框图。如图9所示，所述装置包括：

声音采集模块610，用于在车载音响执行音频播放时，采集车内声音获得声音信号。

语音提取模块630，用于根据所述车载音响播放的音频，消除所述声音信号中所述音频对应的部分，得到语音信号。

语义识别模块650，用于识别所述语音信号的语义内容，确定所述语义内容映射的语音场景。

调控模块670，用于根据所述语音场景调整所述车载音响的播放策略。

在一示例性实施例中，所述装置还包括：

操作检测模块，用于检测所述车载音响的用户调控操作。

二次调控模块，用于根据所述用户调控操作调整所述车载音响的播放策略。

在一示例性实施例中，所述装置还包括：

计时模块，用于检测所述语音信号的停止时长。

还原模块，用于所述停止时长达到指定时长时，控制还原所述车载音响的播放策略。

在一示例性实施例中，所述声音信号包括近场声音信号和远场声音信号，所述语音提取模块630包括：

差分单元，将所述近场声音信号和远场声音信号相减得到信号差。

放大单元，放大所述信号差，得到所述语音信号。

在一示例性实施例中，所述语义识别模块650包括：

识别单元，对所述语音信号进行语音识别，得到语义内容。

查找单元，根据预设的若干关键词，查找所述语义内容中所含关键词。

映射单元，通过关键词向语音场景的映射，确定所述语义内容对应的语音场景。

在一示例性实施例中，所述语义识别模块650包括：

发送单元，将所述语音信号传输至语音识别后台，所述语音识别后台用于识别语音信号的语义内容，还用于根据语义内容确定语音场景；

接收单元，接收所述语音识别后台确定的所述语音场景。

在一示例性实施例中，所述调控模块670被配置为执行：

调用所述语音场景所映射播放配置信息，调整所述车载音响的播放策略。

本申请还提供一种电子设备，其特征在于，所述电子设备包括：

处理器；

存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被处理器执行时，实现如前所述的方法。

本申请还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如前所述的方法。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围执行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘新;倪巍
技术所有人：深圳市元征科技股份有限公司
我是此专利的发明人

上一篇：碳酸盐岩储层缝洞充填物识别方法及系统与流程
上一篇：一种釉下彩骨质瓷及其制备方法与流程