语音交互的自适应优化方法及装置与流程

文档序号：35873067发布日期：2023-10-28 09:06阅读：39来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本发明涉及智能座舱，提供了一种语音交互的自适应优化方法及装置。

背景技术：

1、目前，车载语音技术的应用越来越普遍，车载语音技术可以支持用户通过语音在车舱内与车辆进行交互，控制车辆零部件或与车载系统用户界面中的组件进行交互，用户在驾驶场景下使用语音进行设备控制相较于手动操作无需转移视线，能够提升驾驶的安全性。

2、当用户发出的语音命令因为语调、省略、分句、方言等因素，影响语音交互的流畅性和准确性，导致用户体验不佳。一般情况下，需要车载系统后台升级或等系统更新才能批量解决部分语音交互不流畅和不准确的问题。

3、由于车载系统后台升级或等系统更新主要是面相所有的用户群体，解决或改善用户全体中的主要问题，由于个体用户间的语言差异较大，对单个个体用户而言，车载系统后台升级或等系统更新可能无法解决或改善个体用户的语音交互不流畅和不准确的问题。

技术实现思路

1、鉴于此，本申请提供一种语音交互的自适应优化方法，旨在改善上述问题。

2、具体而言，包括以下的技术方案：

3、一方面，本申请实施例提供了一种语音交互的自适应优化方法，所述方法包括如下步骤：

4、(1)激活语音控制功能，接收驾驶员录入的语音数据；

5、(2)将语音数据转换成文本数据，提取文本数据中动词及名词，将动词及名字组成控制指令；

6、(3)检测当前形成的控制指令是否有效，若检测结果为是，则将有效控制指令发送至对应的控制器，以控制对应对象执行指令对应的动作。

7、在一些实施例中，该方法还包括：

8、更新驾驶员的语音库，每个驾驶员对应一个语音库，语音库中存储有语音-文本偏差转换前后的文本数据；

9、基于该语音-文本偏差转换前后的文本数据对文本数据进行修正。

10、在一些实施例中，语音库的形成方法具体如下：

11、接收录入的语音数据，将录入的语音数据转换成文本数据，输出文本数据；

12、接收修正后的文本数据，将修正后的文本数据与修正前的文本数据进行比对，获取文本数据中偏差位置；

13、将修正前后偏差位置处的文本数据组成数据对存储至语音库中。

14、在一些实施例中，在步骤(1)之前还包括：

15、驾驶员在启动车辆前，进行驾驶员的身份识别，进而匹配出驾驶员对应的语音库。

16、在一些实施例中，在文本数据存在多个动词时，对文本数据进行拆分，拆分方法具体如下：

17、检测两个动词之间的最长停顿时长，在最长停顿时长位置处进行分割，将一条文本数据/段分成两条文本段，提取每条文本段中动词及名词，动词与各名词的组成形成多条控制指令。

18、在一些实施例中，基于语音库的文本数据转换方法具体如下：

19、在将语音数据转换成文本数据后，检测相应语音库中数据对中修正前文本是否存在于当前文本数据中，若存在，则用语音库中数据对中修正后文本替代，形成新的文本数据；

20、对文本数据按优先级进行排序，修正后的文本数据优先级高于未修正的文本数据，先对优先级高的文本数据进行控制指令的提取。

21、一方面，本申请实施例提供了一种语音交互的自适应优化装置，所述装置包括：

22、依次连接的语音录入模块、文本转换模块、控制指令形成模块及有效性检测模块，

23、激活语音控制功能后，语音录入模块用于接收驾驶员录入的语音数据；

24、文本转换模块，用于将语音数据转换成文本数据；

25、控制指令形成模块，用于提取文本数据中动词及名词，将动词及名词组成控制指令；

26、有效性检测模块，用于检测当前形成的控制指令是否有效，若检测结果为是，则将有效控制指令发送至对应的控制器，以控制对应对象执行指令对应的动作。

27、在一些实施例中，所述装置还包括：存储单元及文本形成模块，文本形成模块分别与文本转换模块、存储单元连接，

28、存储单元内存储所有驾驶员的语音库，语音库中存储有中对应驾驶员的语音-文本偏差转换前后的文本数据；

29、文本转换模块将文本数据输入文本形成模块，文本形成模块检测相应语音库中数据对中修正前文本是否存在于当前文本数据中，若存在，则用语音库中数据对中修正后文本替代，形成新的文本数据。

30、在一些实施例中，所述装置还包括：

31、文本排序模块，对对文本数据按优先级进行排序，修正后的文本数据优先级高于修正前的文本数据，将优先级高为文本数据优先输入至文本拆分模块或者是指令形成模块。

32、在一些实施例中，该装置还包括：本拆分模块，与文本转换模块、文本形成模块连接，用于多动词的文本数据进行拆分，拆分成多条文本段。

33、本发明通过针对每个驾驶员构建用于口音纠正的语音库，基于该语音库来辅助文本数据的转换，以降低口音导致的控制指令识别偏差，可以极大地提高控制指令识别的精准度。

技术特征：

1.一种语音交互的自适应优化方法，其特征在于，所述方法包括如下步骤：

2.如权利要求1所述语音交互的自适应优化方法，其特征在于，该方法还包括：

3.如权利要求2所述所述语音交互的自适应优化方法，其特征在于，语音库的形成方法具体如下：

4.如权利要求2所述语音交互的自适应优化方法，其特征在于，在步骤(1)之前还包括：

5.如权利要求1所述语音交互的自适应优化方法，其特征在于，在文本数据存在多个动词时，对文本数据进行拆分，拆分方法具体如下：

6.如权利要求1所述语音交互的自适应优化方法，其特征在于，基于语音库的文本数据转换方法具体如下：

7.一种语音交互的自适应优化装置，其特征在于，所述装置包括：

8.如权利要求7所述语音交互的自适应优化装置，其特征在于，所述装置还包括：存储单元及文本形成模块，文本形成模块分别与文本转换模块、存储单元连接，

9.如权利要求7所述述语音交互的自适应优化装置，其特征在于，所述装置还包括：

10.如权利要求8所述述语音交互的自适应优化装置，其特征在于，该装置还包括：本拆分模块，与文本转换模块、文本形成模块连接，用于多动词的文本数据进行拆分，拆分成多条文本段。

技术总结
本发明涉及智能座舱技术领域，提供了一种语音交互的自适应优化方法，包括如下步骤：(1)激活语音控制功能，接收驾驶员录入的语音数据；(2)将语音数据转换成文本数据，提取文本数据中动词及名词，将动词及名字组成控制指令；(3)检测当前形成的控制指令是否有效，若检测结果为是，则将有效控制指令发送至对应的控制器，以控制对应对象执行指令对应的动作。通过针对每个驾驶员构建用于口音纠正的语音库，基于该语音库来辅助文本数据的转换，以降低口音导致的控制指令识别偏差，可以极大地提高控制指令识别的精准度。

技术研发人员：吴正飞,叶德英,阴山慧,孙亚红,吴倩倩
受保护的技术使用者：奇瑞汽车股份有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴正飞叶德英阴山慧孙亚红吴倩倩
技术所有人：奇瑞汽车股份有限公司
我是此专利的发明人

上一篇：一种可避免交叉污染的冷冻肉解冻装置
上一篇：一种基于SSA-ELM-PSO的大断面隧道围岩参数反演模型的制作方法