语音识别交互的实现方法及装置与流程

文档序号：32307983发布日期：2022-11-23 10:37阅读：来源：国知局

技术特征：
1.一种语音识别交互的实现方法，其特征在于，包括：获取待识别语音并发送至语音唤醒引擎中进行分析处理，输出唤醒结果，确定唤醒结果后输出唤醒延时信息；将所述唤醒延时信息发送至语音识别引擎，输出识别结果。2.根据权利要求1所述的方法，其特征在于，所述语音唤醒引擎包括：数据处理单元和边界处理单元；所述输出唤醒结果和唤醒延时信息，包括：所述数据处理单元对所述待识别语音进行分析，判断所述待识别语音中是否满足唤醒条件，根据判断结果输出唤醒结果；所述边界处理单元对所述待识别语音进行处理，得到唤醒延时信息。3.根据权利要求2所述的方法，其特征在于，判断所述待识别语音中是否满足唤醒条件，包括：判断所述待识别语音中是否存在唤醒词，如果存在，则所述待识别语音满足唤醒条件，否则所述待识别语音不满足唤醒条件。4.根据权利要求2所述的方法，其特征在于，所述对所述待识别语音进行处理，得到唤醒延时信息，包括：对所述待识别语音进行分析，根据预设时间段的区间采样点的值计算平均值，将所述平均值确定为语音能量值；根据语音能量值判断是否保留所述区间的语音数据作为唤醒延时信息；其中，所述唤醒延时信息中存在唤醒词最后一个字的尾音。5.根据权利要求4所述的方法，其特征在于，所述根据语音能量值判断是否保留所述区间的语音数据作为唤醒延时信息，包括：如果唤醒延时信息的语音能量值小于所述唤醒延时信息中第一帧的能量值，则丢弃所述唤醒延时信息；如果唤醒延时信息的语音能量值大于所述唤醒延时信息中第一帧的能量值，则保留所述换线延时信息。6.根据权利要求4所述的方法，其特征在于，所述预设时间段为10s。7.一种语音识别交互的实现装置，其特征在于，包括：唤醒模块，用于获取待识别语音并发送至语音唤醒引擎中进行分析处理，输出唤醒结果，确定唤醒结果后输出唤醒延时信息；识别模块，用于将所述唤醒延时信息发送至语音识别引擎，输出识别结果。8.根据权利要求7所述的装置，其特征在于，所述唤醒模块，包括：数据处理单元和边界处理单元；所述数据处理单元用于对所述待识别语音进行分析，判断所述待识别语音中是否满足唤醒条件，根据判断结果输出唤醒结果；所述边界处理单元用于对所述待识别语音进行处理，得到唤醒延时信息。9.一种计算机设备，其特征在于，包括：存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1至6中任一项所述的语音识别交互的实现方法。
10.一种计算机存储介质，其特征在于，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1至6中任一项所述的语音识别交互的实现方法。

技术总结
本发明涉及一种语音识别交互的实现方法及装置，所述方法包括获取待识别语音并发送至语音唤醒引擎中进行分析处理，输出唤醒结果和唤醒延时信息；将所述唤醒延时信息发送至语音识别引擎，输出识别结果。本发明通过语音唤醒引擎中设置的边界处理以及唤醒时延，能够识别多字或少字的问题，使得语音识别准确率更高，提高了智能语音助手的反应速度和准确度，使得智能语音变的更加智能。智能语音变的更加智能。智能语音变的更加智能。

技术研发人员：赵茂祥刘威李全忠何国涛蒲瑶
受保护的技术使用者：普强时代（珠海横琴）信息技术有限公司
技术研发日：2022.07.06
技术公布日：2022/11/22

完整全部详细技术资料下载

当前第2页1 2