一种智能语音交互方法、系统、设备及介质与流程

文档序号：34925497发布日期：2023-07-28 04:38阅读：54来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本发明涉及语音交互，特别指一种智能语音交互方法、系统、设备及介质。

背景技术：

1、随着智能家居的发展和普及，家里出现了越来越多的智能设备，而各智能设备一般都有配套相应的遥控器，由于这个遥控器操作繁琐、不直观，难以满足人们的操作习惯和需求，因此产生了通过语音操控这些智能设备的需求。

2、针对智能设备的语音操控，传统上主要通过智能音箱来实现，但需要额外购买智能音箱，成本较高，且由于语音识别技术的局限性，当前的智能音箱还存在一些缺陷，如存在识别率低、响应速度慢等问题，无法完全满足人们的需求。

3、因此，如何提供一种智能语音交互方法、系统、设备及介质，实现提升语音识别的准确率以及响应速度，降低语音交互成本，成为一个亟待解决的技术问题。

技术实现思路

1、本发明要解决的技术问题，在于提供一种智能语音交互方法、系统、设备及介质，实现提升语音识别的准确率以及响应速度，降低语音交互成本。

2、第一方面，本发明提供了一种智能语音交互方法，包括如下步骤：

3、步骤s10、机顶盒创建并训练一语音识别模型；

4、步骤s20、机顶盒实时采集语音数据，对所述语音数据进行预处理后，将所述语音数据由模拟信号转换为数字信号并输入语音识别模型；

5、步骤s30、语音识别模型将输入的所述语音数据转换为文本数据，基于所述文本数据提取操作指令；

6、步骤s40、机顶盒基于所述操作指令操控智能设备，接收设备设备发送的操控反馈。

7、进一步地，所述步骤s10具体包括：

8、步骤s11、机顶盒基于神经网络创建一用于将语音数据转换为文本数据的语音识别模型，获取历史语音数据；

9、步骤s12、将所述历史语音数据按预设比例划分为训练集和验证集，设定一准确率阈值；

10、步骤s13、利用所述训练集对语音识别模型进行训练直至满足预设的收敛条件，利用所述验证集对训练后的所述语音识别模型进行验证，判断识别准确率是否大于所述准确率阈值，若是，则进入步骤s20；若否，则扩充所述训练集继续训练。

11、进一步地，所述步骤s20具体为：

12、机顶盒通过麦克风实时采集语音数据，对所述语音数据进行降噪的预处理后，通过模数转换芯片将所述语音数据由模拟信号转换为数字信号并实时输入语音识别模型。

13、进一步地，所述步骤s30具体为：

14、语音识别模型将输入的所述语音数据实时转换为文本数据，利用自然语言处理技术从所述文本数据提取操作指令。

15、第二方面，本发明提供了一种智能语音交互系统，包括如下模块：

16、语音识别模型创建模块，用于机顶盒创建并训练一语音识别模型；

17、语音数据采集模块，用于机顶盒实时采集语音数据，对所述语音数据进行预处理后，将所述语音数据由模拟信号转换为数字信号并输入语音识别模型；

18、语音数据转换模块，用于语音识别模型将输入的所述语音数据转换为文本数据，基于所述文本数据提取操作指令；

19、智能设备操控模块，用于机顶盒基于所述操作指令操控智能设备，接收设备设备发送的操控反馈。

20、进一步地，所述语音识别模型创建模块具体包括：

21、模型创建单元，用于机顶盒基于神经网络创建一用于将语音数据转换为文本数据的语音识别模型，获取历史语音数据；

22、历史语音数据划分单元，用于将所述历史语音数据按预设比例划分为训练集和验证集，设定一准确率阈值；

23、模型训练单元，用于利用所述训练集对语音识别模型进行训练直至满足预设的收敛条件，利用所述验证集对训练后的所述语音识别模型进行验证，判断识别准确率是否大于所述准确率阈值，若是，则进入语音数据采集模块；若否，则扩充所述训练集继续训练。

24、进一步地，所述语音数据采集模块具体用于：

25、机顶盒通过麦克风实时采集语音数据，对所述语音数据进行降噪的预处理后，通过模数转换芯片将所述语音数据由模拟信号转换为数字信号并实时输入语音识别模型。

26、进一步地，所述语音数据转换模块具体用于：

27、语音识别模型将输入的所述语音数据实时转换为文本数据，利用自然语言处理技术从所述文本数据提取操作指令。

28、第三方面，本发明提供了一种智能语音交互设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现第一方面所述的方法。

29、第四方面，本发明提供了一种智能语音交互介质，其上存储有计算机程序，该程序被处理器执行时实现第一方面所述的方法。

30、本发明实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

31、通过在机顶盒上创建并训练语音识别模型，机顶盒对采集的语音数据进行降噪的预处理后，将语音数据由模拟信号转换为数字信号并输入训练后的语音识别模型中，语音识别模型自动将输入的语音数据转换为文本数据，利用自然语言处理技术从文本数据提取操作指令以操控智能设备，由于语音识别模型基于神经网络进行创建，且训练后需保证识别准确率是否大于设定的准确率阈值，且输入语音识别模型的语音数据进行降噪的预处理，结合自然语言处理技术，以保障语音识别的准确率；通过预先创建和训练语音识别模型，后续采集的语音数据可直接输入语音识别模型进行识别以保障响应速度；通过机顶盒进行语音识别，无需额外购买智能音箱，最终极大的提升了语音识别的准确率以及响应速度，极大的降低了语音交互成本。

32、上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

技术特征：

1.一种智能语音交互方法，其特征在于：包括如下步骤：

2.如权利要求1所述的一种智能语音交互方法，其特征在于：所述步骤s10具体包括：

3.如权利要求1所述的一种智能语音交互方法，其特征在于：所述步骤s20具体为：

4.如权利要求1所述的一种智能语音交互方法，其特征在于：所述步骤s30具体为：

5.一种智能语音交互系统，其特征在于：包括如下模块：

6.如权利要求5所述的一种智能语音交互系统，其特征在于：所述语音识别模型创建模块具体包括：

7.如权利要求5所述的一种智能语音交互系统，其特征在于：所述语音数据采集模块具体用于：

8.如权利要求5所述的一种智能语音交互系统，其特征在于：所述语音数据转换模块具体用于：

9.一种智能语音交互设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至4任一项所述的方法。

10.一种智能语音交互介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至4任一项所述的方法。

技术总结
本发明提供了语音交互技术领域的一种智能语音交互方法、系统、设备及介质，方法包括如下步骤：步骤S10、机顶盒创建并训练一语音识别模型；步骤S20、机顶盒实时采集语音数据，对所述语音数据进行预处理后，将所述语音数据由模拟信号转换为数字信号并输入语音识别模型；步骤S30、语音识别模型将输入的所述语音数据转换为文本数据，基于所述文本数据提取操作指令；步骤S40、机顶盒基于所述操作指令操控智能设备，接收设备设备发送的操控反馈。本发明的优点在于：极大的提升了语音识别的准确率以及响应速度，降低语音交互成本。

技术研发人员：张维泉,袁苇,张宏辉
受保护的技术使用者：福建新大陆通信科技股份有限公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张维泉袁苇张宏辉
技术所有人：福建新大陆通信科技股份有限公司
我是此专利的发明人