车载声音反应系统及方法与流程

文档序号：15690871发布日期：2018-10-16 22:06阅读：357来源：国知局

本发明涉及一车载语音认知系统，特别是在汽车中对声音进行采集、处理和反馈的语音系统和方法。

背景技术：

智能自动驾驶已经成为汽车行业和控制行业的研发前沿。为了能稳定地进行汽车智能控制，众多厂商和机构针对驾驶中存在的问题进行改进。因为对于汽车驾驶来说，安全性是最重要的。智能自动驾驶的目标就是可以突破人类本身的缺陷，能认知到人类到认知不到的信息。例如，驾驶员视线的限制、反应能力的延迟、紧急情况的动作僵硬，甚至是交通系统的实时更新。在利用汽车本身的快速执行能力后，通过汽车的认识计算控制相应的随动系统，很大的改善了人为驾驶的限制。但是，单纯的通过汽车本身的控制，对于控制算法的严格程度有很大的要求。特别是，全自动化的汽车的驾驶控制。在社会公共交通设施还没有普遍的智能化的情况下，智能汽车的推行也受到限制。而且，声音作为人为控制，一般都会优先做出声音要求的动作。那么，这种高优先级的控制信号一旦有错误或者和汽车的控制有冲突，对于整个汽车控制来说会有不利的影响。

目前，在安全性得不到百分百的保证的情况下，车载语音系统并不涉及行驶安全方面的应用，或者并不是行驶指令的核心。但是不可否认地，语音作为解放身体的沟通方式，有效地利用声音可以更好的完成人车交流。尤其是，随着车载处理器的发展，有更多的资源可以服务于声音的识别、处理和反馈，使得声音信号的处理变得可行。

因为汽车驾驶环境的复杂性，声音控制在行驶中的应用还是受到了限制。但是如果一个语音系统并能在车内环境有很好的表现，直接将其连接于行驶控制方面只能增加不安。另外，传统的声音控制没有定制功能，通常是在厂家初始化设定的。但是，根据驾驶习惯、说话口音、车内环境的不同，对于声音的处理是需要做出改变的。对于每次声音控制的执行结果，目前也只是记录在日志中。但是若是发生事故的话，一切都是晚了一步。与其他语音系统不同的是，车载语音更多是指令式的话语，那么单调的识别方式并不能满足车内识别的需要。而且在其他环境下的语音库也很难完美地融入行车环境中。也就是说，人们还不能很好的掌握在行车环境中汽车对声音的反应。只有了解汽车对语音的反应情况，下面一步才可以有依据地进行控制方向的研发。

以上都是目前车载语音不受欢迎，得不到有效地开展应用的缘由。因此，一方面要通过应用来完善车载声音识别的可靠性，另一面也要针对车内环境来开发声音处理系统。

技术实现要素：

本发明的一个目的在于提供一种车载声音反应系统及方法，通过对一车辆中对一声音信息进行接收和处理，根据一语音数据库进行匹配分析，反馈出所述声音信息的意义。

本发明的另一个目的在于提供一种车载声音反应系统及方法，对该声音信息进行分析，根据决策方式给出相对应的评价，使得用户得到所述车辆对所述声音信息的反应。

本发明的另一个目的在于提供一种车载声音反应系统及方法，根据所述声音信息的意义和对应的评价，得到相应的处理结果。

本发明的另一个目的在于提供一种车载声音反应系统及方法，决策评价的方式被预先地设定，使得所述声音信息可以被转换为一定意义的信息，进而完成评分、翻译、回答等等系列的反应。

本发明的另一个目的在于提供一种车载声音反应系统及方法，对该声音信息做过滤、特征提取、放大处理，排除在行驶中的各种噪声影响，对该声音信息的音调和意义。

本发明的另一个目的在于提供一种车载声音反应系统及方法，对该声音信息做记录，在后续分析和反馈使用，使该系统具有高自适应性。

本发明的另一个目的在于提供一种车载声音反应系统及方法，累积所述声音信息和对应的意义，相互组成成对的映射关系，进而形成一用户库，保存个性化声音数据库。

本发明的另一个目的在于提供一种车载声音反应系统及方法，对于所述声音信息的决策评价可以通过使用一地理信息而调用部分的所述语音数据库，使得需要处理的数据量被缩小，降低处理难度和节省处理时间。

本发明的另一个目的在于提供一种车载声音反应系统及方法，所述声音信息的决策评价作为所述车辆对所述声音信息的反应，除了匹配出文字意义，进而通过所述车辆的反应而认识所述车辆。

本发明的另一个目的在于提供一种车载声音反应系统及方法，对于所述声音信息的决策评价可以作为语言学习和应用的基础，使得用户可以在车内进行一定的学习或者娱乐活动。

本发明的另一个目的在于提供一种车载声音反应系统及方法，对于所述声音信息基本会给出一个结果或者评价，使得所述车辆对于所述声音信息的反应被输出。

依本发明的一个方面，提供一车载声音反应系统，包括：

一收音构件；

一处理器；以及

一语音数据库，其中所述收音构件进一步包括一采集模块和一存储模块，其中所述采集模块从车辆中接收一声音信息，其中所述声音信息被储存于所述存储模块，其中所述处理器可通信地连接于所述存储模块，进而寻找与所述声音信息相匹配的所述语音数据库中的相对应的意义，并根据决策方式而反应出所述声音信息。

依本发明的一个实施例，所述语音数据库包括一基准库和一用户库，其中所述基准库被预先地存储一定的标准语言数据，其中所述用户库被写入所述声音信息和对应的决策结果。

依本发明的一个实施例，所述处理器提取所述声音信息选自音色、声调、内容的组合的至少一种信息类型。

依本发明的一个实施例，所述声音信息被提取出的信息被所述处理器在所述语音数据库中进行匹配，其中匹配结果为对应于所述声音信息的一匹配值。

依本发明的一个实施例，所述匹配值被根据所对应的决策进行评价或者输出。

依本发明的一个实施例，所述收音构件进一步包括一预识别模块，其中所述预识别模块对所述声音信息进行来源判断。

依本发明的一个实施例，若所述预识别模块判断所述声音信息为来自人声，则需要对所述声音信息进行进一步地匹配。

依本发明的一个实施例，所述处理器包括一识别模块、一匹配模块以及一决策模块，其中所述识别模块将所述采集模块所采集的所述声音信息进行音和意的识别，其中所述匹配模块通过调用所述语音数据库为所述声音信息生成所述匹配值，其中所述决策模块根据所述匹配模块的匹配值而得到决策结果。

依本发明的一个实施例，所述处理器进一步地包括一定位模块，其中所述定位模块为所述匹配模块提供一地理信息，其中根据所述地理信息，对所使用的所述语音数据库中缩小匹配范围。

依本发明的一个实施例，所述处理器进一步地包括一设置接口，其中从所述设置接口向所述识别模块、所述匹配模块以及所述决策模块载入具体的执行参数。

依本发明的一个实施例，所述识别模块、所述匹配模块以及所述决策模块的处理参数被预先地设定默认值，其中通过所述设置接口对所述匹配模块和所述决策模块进行参数的修改

依本发明的一个实施例，通过所述设置接口对所述匹配模块和所述决策模块的处理的精度和速度进行修改。

依本发明的一个实施例，决策结果的展示方式为通过图像而显示。

依本发明的一个实施例，决策通过选自中控台显示器、座椅显示器或者移动终端的组合中的一种或者几种而显示。

依本发明的一个实施例，所述识别模块包括一音识别单元和一意识别单元，其中所述音识别单元对所述声音信息进行声调的特征提取，其中所述意识别单元对所述声音信息进行语义的特征提取。

依本发明的一个实施例，所述声音信息的声调在关联所述用户库的情况下，通过对所述声音信息的识别而指定所述用户库。

依本发明的一个实施例，所述决策模块包括一评价单元和一输出单元，其中所述评价单元根据所述基准库进而对所述声音信息进行匹配值的评价而得到数值化的结果，其中所述输出单元对所述声音信息进行意义上的分析而得到语言化的结果。

依本发明的另一个方面，本发明提供一车载声音反应方法，包括步骤：

a.得到一种决策方式；

b.收录一声音信息；

c.根据决策方式，对所述声音信息进行处理；以及

d.输出处理结果。

依本发明的一个实施例，步骤c中进一步地包括：

c1.根据决策方式，调用一语音数据库；

c2.根据决策方式，匹配所述声音信息与所述语音数据库；以及

c3.将匹配结果对应至决策方式的输出类型。

依本发明的一个实施例，步骤b中进一步地包括：

b1.对所述声音信息进行预识别处理。

附图说明

图1是根据本发明的一个优选实施例的所述车载声音反应系统及方法的场景示意图。

图2是根据本发明的上述优选实施例的所述车载声音反应系统及方法的评价示意图。

图3根据本发明的上述优选实施例的所述车载声音反应方法的流程图。

图4是根据本发明的上述优选实施例的所述车载声音反应系统的架构示意图。

图5是根据本发明的上述优选实施例的所述车载声音反应系统及方法的一种应用示意图。

图6是根据本发明的上述优选实施例的所述车载声音反应系统及方法的信息流动示意图。

具体实施方式

以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例，本领域技术人员可以想到其他显而易见的变型。在以下描述中界定的本发明的基本原理可以应用于其他实施方案、变形方案、改进方案、等同方案以及没有背离本发明的精神和范围的其他技术方案。

本领域技术人员应理解的是，在本发明的揭露中，术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系是基于附图所示的方位或位置关系，其仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此上述术语不能理解为对本发明的限制。

可以理解的是，术语“一”应理解为“至少一”或“一个或多个”，即在一个实施例中，一个元件的数量可以为一个，而在另外的实施例中，该元件的数量可以为多个，术语“一”不能理解为对数量的限制。

本发明提供一车载声音反应系统包括一收音构件10和一语音数据库30，其中所述语音数据库30包括一基准库31和一用户库32，其中所述基准库被预先地存储一定的标准语言数据，其中所述用户库被写入所述声音信息和对应的决策结果。所述收音构件10进一步包括一采集模块11和一存储模块13，其中所述采集模块11从车辆中接收一声音信息，并存储于所述存储模块13中。所述处理器可通信地连接于所述存储模块。在对所述声音信息进行处理和分析后，所述车载声音反应系统将寻找与所述声音信息相匹配的所述语音数据库30中的相对应的语言意义，进而针对语言意义进行反应。这样，通过所述声音信息来利用车载资源得到所述车辆对所述声音信息的反应。需要说明是，这里的反应为根据一定的决策评价而得到的匹配结果。

如图1所示的所述车载声音反应系统在通过所述收音构件10和所述语音数据库30中进行匹配的应用原理示意图。所述车载声音反应系统接收的所述声音信息包括音色、声调、内容的特征要素。根据所述声音信息的特征要素，对应不同意义。

所述车载声音反应系统中的处理器20，对于接收的所述声音信息经过处理和分析，提取所述声音信息的声调和意义。将所述语音数据库30中的信息与所述声音信息进行比对，所述处理器确认相匹配的对应意义。根据不同的决策评价要求，所述声音信息的意义所对应的所述车辆反应是不同的。所述声音信息对应的声调和意义分别地被储存，通过储存并对应于用户可形成个性化的数据库。

优选地，在接收所述声音信息之后，所述车载声音反应系统将对所述声音信息进行处理。所述声音信息被接收后，先进行过滤处理，将环境因素的声音过滤掉。本优选实施例中，所述声音信息可以被通过硬件过滤或者软件过滤的方法来过滤。硬件过滤优选的方法推荐为在声音采集装备中加装减震装置或者降噪装置。软件过滤的优选方法推荐为在声波信号中过滤出特定人声发声的频率范围。过滤后，对所述声音信息做特征提取，将所述声音信息中的关键要素提取出来并放大，供之后准确地对比匹配参考使用。

在初步处理之后，所述声音信息的关键要素，即所述声音信息的音色、声调、内容，被提取出来进而被所述系统在所述语音数据库30中进行搜寻匹配。所述处理器20提取所述声音信息选自音色、声调、内容的组合的至少一种信息类型。当根据所述声音信息的内容匹配并得到一匹配值时，根据所述匹配值所对应的决策进行评价或者输出。优选地，所述声音信息的音色被所述系统在所述语音数据库30中进行搜寻匹配，来辨别所述声音信息的来源。这样，就有效地防止其他声音来源，例如歌曲、广播等等带来的误解。当然，可以根据在所述语音数据库30中的储存的声音音色来判断。通过车辆给出的评价或者输出，后续进一步地改善对所述声音信息的识别效率，使得所述车载声音反应系统具有很强的自适应学习能力。经过反复的反馈后，所述语音数据库30具有更强的适应性和个性化设置，使得所述车载声音反应系统具有很强的学习能力。

在更多的可行的应用中，所述声音信息进一步被赋予为驾驶相关的操作，例如控制车辆行驶、或者更新相关路径的导航信息等等，也可以为与驾驶无关的对车辆硬件的操作，例如，播放音乐、打开车窗、开锁车门等等。当然，也可以为多个操作。优选地，所述车载声音反应系统利用声音采集装置进行所述声音信息的采集，例如麦克风等。

更多地，优选地，所述车载声音反应方法还进一步包括对所述声音信息的分类和分析。所述收音构件10进一步包括一预识别模块12，其中所述预识别模块12对所述声音信息进行来源判断，也就是说辨认所述声音信息发出的来源。值得一提的是，所述预识别模块12从所述存储模块13中获取所述声音信息。特别地，若是判断为来自人声，特别是根据与所述声音信息的内容分辨出与决策和评价相关的，则需要对所述声音信息进行进一步地匹配，也就是交至所述匹配模块22。若是判断为来自人声，根据与所述声音信息的内容分辨出为与行驶不相关的，则所述声音信息被记录与所述语音数据库30。若是判断为来自车声，特别是根据与所述声音信息的内容分辨出为车辆状态相关的，则需要对所述声音信息进行相应的车辆状态分析的，则另外进行储存。这样，可以及时的记录车辆状态，有利于故障分析和诊断。因此，所述系统不仅可以保证行驶操作的安全可靠，还可以用来分析了解车辆的行驶情况和车辆状态。

所述处理器20包括一识别模块21、一匹配模块22以及一决策模块23，其中所述识别模块21将所述采集模块11所采集的所述声音信息进行音和意两个方面的识别，其中所述匹配模块22通过调用所述语音数据库30进而为所述声音信息生成所述匹配值，其中所述决策模块23根据所述匹配模块22的匹配值而得到评价或者数据。

所述处理器20进一步地包括一定位模块25，其中所述定位模块25为所述匹配模块22提供一地理信息。根据所述地理信息，在所述语音数据库30中缩小匹配范围。

所述处理器20进一步地包括一设置接口24，其中从所述设置接口24向所述识别模块21、所述匹配模块22以及所述决策模块23载入具体的执行参数。所述识别模块21、所述匹配模块22以及所述决策模块23的处理参数被预先地设定默认值。通过所述设置接口24可以对所述匹配模块22以及所述决策模块23进行参数的修改，使得处理的精度和速度满足用户的需要。

需要说明的是，对于决策结果和评价的展示方式优选为通过图像而显示。如图2中所示，通过中控台显示器、座椅显示器或者移动终端，使得所述处理器20的处理结果得到输出。所述决策模块23将结果传递至显示设备，而且根据不同设备的显示要求，相应的将结果进行数据形式的调整。

所述车载声音反应方法如图3所示，其包括步骤：

a.得到一种决策方式；

b.收录所述声音信息；

c.根据决策方式，对所述声音信息进行处理；以及

d.输出处理结果。

更多地，步骤c中进一步地包括：

c1.根据决策方式，调用所述语音数据库30；

c2.根据决策方式，匹配所述声音信息与所述语音数据30；以及

c3.将匹配结果对应至决策方式的输出类型。

更多地，步骤b中进一步地包括：

b1.对所述声音信息进行预识别处理。

在步骤b1中进一步地通过先进行过滤处理，将环境因素的声音过滤掉。所述声音信息可以被通过硬件过滤或者软件过滤的方法来过滤。硬件过滤优选的方法推荐为在声音采集装备中加装减震装置或者降噪装置。软件过滤的优选方法推荐为在声波信号中过滤出特定人声发声的频率范围。

为了方便对所述车辆的决策和评价过程进行说明，本优选实施例中利用三种决策方式进行流程性的说明。所述车载声音反应系统及其方法可以在练习英文、学习方言、以及答题游戏等等应用中运作，进而提供所述车辆对所述声音信息的反应。需要注意的是，对所述声音信息的反应可以为对所述声音信息的评价，优选地化为数值的形式反馈给用户。

一种英文练习或者语音游戏的应用中，首先确定本次方法中对于所述声音信息的决策方式。例如，本次确定为对英文发音给出熟练度评分。那么，对于收录的所述声音信息，先通过预识别处理，过滤噪声。然后，因为是英文发音评分，相应地调用所述语音数据库30中英文发音数据库。所述声音信息的声调和语义被分别的提取，并与所述语音数据30的所述基准库31进行匹配。一种匹配方式中，根据所述声音信息的语义，找到标准的发声方式，然后对所述声音信息进行匹配。对于匹配结果的匹配结果，也就是匹配值，根据决策方式输出。例如，匹配后的结果具有89％的匹配值，那么所述决策模块23给出89分的评价。如图1中将结果输出至中控显示器中。

更多地，所述识别模块21包括一音识别单元211和一意识别单元212，其中所述音识别单元211对所述声音信息进行声调的特征提取，其中所述意识别单元212对所述声音信息进行语义的特征提取。而所述声音信息的声调在关联所述用户库32的情况下，通过对所述声音信息的识别而指定所述用户库32。所述意识别单元212将结果交至所述匹配模块22，使得进一步地会被分析和处理。也就是说，不是将所述声音信息完全地通过所述识别模块21解读，而是通过部分的特征解决对所述声音信息的意义的理解。这样，对于所述车辆在识别和处理中的过程可以分别的得到认识。

所述决策模块23包括一评价单元231和一输出单元232，其中所述评价单元231根据所述基准库31进而对所述声音信息进行匹配值的评价，而得到数值化的结果，其中所述输出单元232对所述声音信息进行意义上的分析，根据匹配值而得到语言化的结果。也就是说，所述评价单元231根据一定的标准而判断，而所述输出单元232是根据匹配度得到语言上的解释。优选地，所述输出单元232将结果进行图像或者语音删的展示和输出。

所述输出单元232进一步地包括一显示输出单元2321和一声音输出单元2322，其中所述显示输出单元2321将匹配结果转化为文字化可视信息，其中所述声音输出单元2322将匹配结果转化为声音化可听信息。

一种可行的应用场景如图5和图6所示，对于所述收音构件10的所述存储模块13收录的所述声音信息，所述处理器20根据所述语音数据库30进行匹配并得到意义解释，进而将所述声音信息翻译为另外的语言或者方言。若所述预识别模块12进行了处理，则根据处理后的所述声音信息进行后续的操作。所述车辆通过所述车载声音反应系统及其方法对所述声音信息而反应的数据流程如图6所示。

如图5，所述声音信息被接收后，通过预识别后，所述识别模块21提取所述声音信息的声调和意义。优选地，所述声音信息的声调辅助所述匹配模块22在所述语音数据库30中找到对应的数据部分。也就是说，可以通过对声调的识别，定位所述语音数据库30中所述基准库31的部分内容，而不是全部的数据库都需要进行匹配。或者，根据所述声音信息的音色对应所述用户库32。也就是说，所述用户库32并不需要特别的指定，而是说所述用户库32被所述声音信息的音色而被选择。另外，所述定位模块25提供所述地理信息，使得所述匹配模块22进一步地锁定所述语音数据库30的部分。

所述匹配模块22对所述声音信息在所述语音数据库30中进行比对，以寻找相应的意义，从而得到匹配值。本优选实施例中，所述匹配模块22通过对所述声音信息的意义，而得到所述声音信息具体的语言翻译。所述决策模块23将所述匹配模块22得到的结果进行输出。优选地，所述输出单元232的所述显示输出接口2321将语言文字进行输出，进而得到图5中通过所述车辆对所述声音信息的反应而翻译的效果。

图6中为所述声音信息在所述收音机构10、所述处理器20以及所述语音数据库30中处理的整体流程图。首先获取所述语音数据库30，通过所述语音数据库30的所述基准库31和所述用户库32而对所述声音信息进行适应性匹配。然后接收所述声音信息，特别地，接收所述声音信息为实时进行的，所述方法优选为周期运转的。对所述声音信息做预识别的处理，本优选实施例采用硬件和软件过滤结合的方法，优选将所述声音信息的内容、音色和声调提取出来以供之后的分析和判断。接着，所述声音信息根据决策和评价的方式，得到对应的输出结果。所述输出单元232提供画面或者声音的输出。例如，所述声音信息被给予分数的评价，或者给予对应的文字显示，或者给予对应的翻译文字。

值得一提的是，所述声音信息被记录于所述车载声音反应方法的所述语音数据库30的情况还有很多。特别是，所述声音信息没有被匹配到相应的意义，所述声音信息被优选根据匹配值而给予相近的反应。当所述声音信息没有匹配到相应意义时，所述声音信息被认为不是意义对应的，进而被记录在所述语音数据库30中，但是会通过所述决策模块23给出一个结果。在辨别所述声音信息来源时没有匹配到相应的所述语音数据库30，所述声音信息和分析结果被记录在所述语音数据库30中。当所述声音信息所对应的意义被再确认时没有被确认，所述声音信息被记录在所述车载声音反应方法的所述语音数据库30中。在保证所述声音信息可靠地触发所述动作30的同时，将没有触发所述声音信息的分析过程和结果都通过反馈对所述方法进行反馈和更新。在提高所述车载声音反应方法的稳定性的同时，使所述方法具有备份更新、自适应学习能力，使得在使用过程中，所述方法的智能化和执行能力得到优化。

本领域的技术人员应理解，上述描述及附图中所示的本发明的实施例只作为举例而并不限制本发明。本发明的目的已经完整并有效地实现。本发明的功能及结构原理已在实施例中展示和说明，在没有背离所述原理下，本发明的实施方式可以有任何变形或修改。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邹盛享;李云飞
技术所有人：斑马网络技术有限公司
我是此专利的发明人

上一篇：一种高性能鞋底鞋垫的3D打印工艺的制作方法
上一篇：利用激光能再循环的增材制造的制作方法