一种语音识别方法、车载设备、以及车载系统与流程

文档序号：40417499发布日期：2024-12-24 14:50阅读：177来源：国知局

技术简介：
本发明针对车载语音识别中因网络波动导致的识别中断问题，提出通过预测网络质量选择在线或离线识别方案。方法包括记录车辆坐标与网络数据，结合用户语音习惯和车辆状态预测语音结束位置，查询网络质量库评分，根据预测分数动态切换识别模式，避免因网络不稳定导致的数据丢失或延迟。
关键词：网络质量预测,语音识别优化

本发明属于语音识别，尤其涉及一种语音识别方法、车载设备、以及车载系统。

背景技术：

0、技术背景

1、车载语音识别是一种智能驾驶中非常常见的技术，其主要是用于对用户的语音识别，从而检测用户意图，并控制对应的模块进行相应，实现智能驾驶。

2、在现有的技术中，识别往往采用两种手段，一种为线上识别也即云端网络识别，另一种则是车载内部离线识别模块识别，在一些网络状态好时，优选精度更高，更智能的现象识别，二网络状态不好时，才选择用离线识别，因此很多车机都配备了网络状态识别的功能，但是车辆在行驶过程是一个动态过程，用户在说话过程中，可能存在网络质量不好，导致音频传输数据丢失、识别结果不正确或者无数据返回的问题，该问题特别会出现在如高速进入隧道时，若用户在这之间说话，则会使得线上的语音判断中断，进而导致整个语音判断失灵或者存在高延迟的状况。

技术实现思路

1、基于上述问题，本发明提出一种语音识别方法、车载设备、以及车载系统，在检测到用户说话时，即刻开启网络判断，以预测语音开始至语音结束后的网络状态，并提前判断采用离线，或者在线的语音判断，防止中途出现中断，或者来不及进行离线、或者在线状态切换的问题。

2、本发明的目的通过以下技术方案实现：

3、第一方面，本发明提出一种车辆语音识别方法，包括：

4、周期采集第一坐标、以及第一网络数据设为第一数据，通过网络数据评分算法根据第一数据计算第一数据评分并保存至网络质量库；

5、获取初始语音数据，根据用户语音习惯、以及当前车辆状态预测语音完成时车辆第二坐标；

6、根据第二坐标、初始语音数据发出时刻车辆的第三坐标、以及第二坐标和第三坐标之间的第一坐标，查询网络质量库，并预测网络质量分数；

7、若网络质量分数低于预设分数阈值，则采用离线语音分析方法对用户语音数据分析；若网络质量分数高于预设分数阈值，则采用在线语音分析方法对用户语音数据分析。

8、通过将第一坐标数据以及对应的第一网络数据进行记录至网络质量库，以实现二次行驶时对网络数据的预测参考；并在获取到初始语音数据是，根据用户习惯、以及车辆状态对用户说完语音的车辆所在坐标进行预测；并根据预测的最终第三坐标和起始第二坐标、以及两个坐标之间保存在网络质量库中的第一坐标进行查询，并得到预测路段的网络质量分数，根据该分数决定在线分析或者是离线分析。该方法通过提前预测的手段选择在线语音分析方式或者离线语音分析方式，避免了因为网络质量不好，导致音频传输数据丢失、识别结果不正确或者无数据返回的问题。

9、在一些实施方式中，若第三坐标在网络质量库中尚未保存，则采集当前第二网络数据、以及第三坐标设为第二数据，通过网络数据评分算法根据第二数据计算第二数据评分并保存至网络质量库；

10、若预测车辆第二坐标也尚未保存在网络质量库中，则将第二网络数据、以及第三坐标为第三数据，通过网络数据评分算法计算第三数据评分并保存至网络质量库；并在车辆行驶至第三坐标时，重新采集第三网络数据并将第三网络数据、第二坐标设为第四数据，将第四数据，通过网络数据评分算法计算第四数据的第四数据评分，将第四数据评分替换第三数据评分。

11、若分析的路段尚未在网络质量库中出现，则根据实时的坐标和网络质量数据进行评分存储，若预测的坐标也未记录在网络质量库中，则先有当前网络数据与预测坐标进行网络质量评分，在行驶至预测坐标后，再重新进行网络数据评分，并替换原有的预测数据。

12、在一些实施方式中，周期采集第一坐标、以及第一网络数据设为第一数据，通过网络数据评分算法根据第一数据计算第一数据评分并保存至网络质量库；包括：

13、获取信号强度、上传速率、下载速率、以及网络延迟速率数据为第一网络数据；

14、将第一坐标、以及第一网络数据输入网络数据评分算法；

15、网络数据评分算法根据预设数据分数对照表，查询信号强度、上传速率、下载速率、网络延迟速率的各项评分，并根据评分权重，计算得到第一数据评分。

16、通过信号强度、上传速率、下载速率、以及网络延迟速率数据进行主要参数判断，并预设有数据分数对照表，根据数据分数对照表查询当前数据的分数，且每个数据设置有对应权重，通过权重、以及查询的各项分数，得到网络数据评分。

17、在一些实施方式中，获取初始语音数据，根据用户语音习惯、以及当前车辆状态预测语音完成时车辆第二坐标；包括：

18、通过语音活动检测，获取初始语音数据；

19、根据初始语音数据、用户语音习惯，推算出完整语音数据；并根据完整语音数据推算语音时长；

20、根据当前车辆车速、车辆加速状态、以及车辆行驶方向推算出当前车辆行车状态；

21、根据预测语音时长、以及当前行车状态，推算出第二坐标。

22、通过在语音活动检测方法，获取到初始语音数据后，根据用户语音习惯预测完成语音数据及完整时长，并根据车辆当前状态得到行驶速度，通过行驶速度和时间、以及当下坐标位置，预算出第二坐标。

23、在一些实施方式中，通过语音活动检测，获取初始语音数据；包括

24、语音活动检测通过能量阈值的方法，检测到语音数据达到能量阈值时，开始收集第一初始语音数据；

25、根据第一初始语音数据，在排除预设语音频段并进行语音处理后，获得第二初始语音数据，并设置第二初始语音数据为初始语音数据。

26、语音活动检测主要通过对能量阈值的进行判断，在检测到达阈值时，开始收集语音数据，并在排除一些预设语音频段，也即无用语音频段后，获取第二初始语音数据，也即初始语音数据。

27、在一些实施方式中，用户语音习惯包括：

28、用户预设语音后，并由在线语音分析方法、和/或离线语音分析方法分析出用户语音的第一语音习惯；

29、根据采集的语音数据，并通过在线语音分析方法、和/或离线语音分析方法分析出语音的中的第二语音习惯；并根据第二语音习惯对第一语音习惯进行调整；

30、第一语音习惯、以及第二语音习惯均包括语音的语速、语调、平均时长、以及间隔。

31、用户的语音习惯可以是，用户在行车前录制预设语音通过在线或者离线语音分析的方法得出的第一语音习惯，进一步可在行车过程中根据实时采集的第二语音习惯对第一语音习惯进行调整。

32、在一些实施方式中，根据第二坐标、初始语音数据发出时刻车辆的第三坐标、以及第二坐标和第三坐标之间的第一坐标，查询网络质量库，并预测网络质量分数；包括：

33、根据第二坐标查询网络质量库，得到第二数据评分；根据第三坐标查询网络质量库，得到第三数据评分；根据第二坐标和第三坐标之间的第一坐标，查询第四数据评分；

34、计算第四数据评分、第二数据评分、第三数据评分平均值，得出预测网络质量分数。

35、根据说话时的第二坐标至预测出说话结束后，第三坐标形成的路段，进行质量分数查询，通过取平均值的方式，得出路段的预测网络质量分数。

36、在一些实施方式中，得出预测网络质量分数；还包括：

37、将第一质量分数、第二质量分数、以及第三质量分数两两相减，并与相减后的结果与预设波动阈值对比；

38、若相减后的结果大于预设波动阈值，则将波动较大的两个质量分数与其他的质量分数相减，若仍然大于预设波动阈值，则删除该质量分数；

39、若删除的网络质量分数中，包含有第二网路质量分数，则重新获取第二坐标；

40、若删除的网络质量分数中，包含有第三网络质量分数，则重新获取第三坐标。

41、根据坐标查询的数据评分之间的差值，可设定波动阈值，从而筛选一些可能存在网络波动的位置，以减少判断的误差。

42、第二方面，本发明提出一种车载设备，包括：处理器、存储器、通信接口和通信总线，处理器、存储器和通信接口通过通信总线完成相互间的通信；

43、存储器用于存放至少一可执行指令，可执行指令使处理器执行如第一方面任意一项的车辆语音识别方法的操作。

44、第三方面，本发明提出一种车载系统，包括：

45、数据采集评分模块，用于周期采集第一坐标、以及第一网络数据设为第一数据，通过网络数据评分算法根据第一数据计算第一数据评分并保存至网络质量库；

46、数据分析模块，用于获取初始语音数据，根据用户语音习惯、以及当前车辆状态预测语音完成时车辆第二坐标；

47、网络质量评分模块，用于根据第二坐标、初始语音数据发出时刻车辆的第三坐标、以及第二坐标和第三坐标之间的第一坐标，查询网络质量库，并预测网络质量分数；

48、语音判断决策模块，用于判断若网络质量分数低于预设分数阈值，则采用离线语音分析方法对用户语音数据分析；若网络质量分数高于预设分数阈值，则采用在线语音分析方法对用户语音数据分析。

49、通过数据采集评分模块、数据分析模块，、网络质量评分模块、以及语音判断决策模块以执行第一方面任一项的方法。

50、本发明的一种语音识别方法、车载设备、以及车载系统的有益效果是：

51、通过将第一坐标数据以及对应的第一网络数据进行记录至网络质量库，以实现二次行驶时对网络数据的预测参考；并在获取到初始语音数据是，根据用户习惯、以及车辆状态对用户说完语音的车辆所在坐标进行预测；并根据预测的最终第三坐标和起始第二坐标、以及两个坐标之间保存在网络质量库中的第一坐标进行查询，并得到预测路段的网络质量分数，根据该分数决定在线分析或者是离线分析。该方法通过提前预测的手段选择在线语音分析方式或者离线语音分析方式，避免了因为网络质量不好，导致音频传输数据丢失、识别结果不正确或者无数据返回的问题。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邱均,谢志华,李向阳,王斌
技术所有人：成都市卡蛙科技有限公司
我是此专利的发明人

上一篇：一种YB55包装机端部烙铁组件的制作方法
下一篇：一种用于花菇种植的温湿度调节装置的制作方法

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！