一种智慧语音互动系统的制作方法

文档序号：33554477发布日期：2023-03-22 11:12阅读：51来源：国知局

1.本发明涉及语音互动系统领域，尤其涉及一种智慧语音互动系统。

背景技术：

2.随着网络时代的来临，语音互动成为一种常见的交流手段，用于远程的公司会议、学术交流、网络授课等场景中。有效解决了距离问题，提高了各行各业的工作、学习效率。现有的语音互动系统将多个语音终端网络连接，实时传递语音信息。但在实际互动过程中常常出现互动设备失效，语言沟通不畅的情况发生，导致语音互动的效果不理想。此外，多人互动时，互动环境的秩序也不能保证。

技术实现要素：

3.针对背景技术中存在的问题，提出一种智慧语音互动系统。本发明通过对键盘、麦克风、摄像头以及互动环境进行检测，设置触发关键词集合，提前查找互动中可能出现的问题，便于提前解决问题。通过收集、对比、检测各用户的语音，得到语音特征。系统结合语音特征对各用户的语音内容进行翻译、校正、识别。用户在听语音互动过程中，通过窗口展示的文字进行辅助理解，特别是对一些口音较重的或外国语音的语音，使得互动更加顺畅、准确。出现触发关键词行为时，系统及时处理，有效维持互动秩序，保证互动环境安全。
4.本发明提出一种智慧语音互动系统，包括语音互动终端、云端服务器和语音互动平台；语音互动终端、云端服务器和语音互动平台通过网络连接。语音互动终端至少包括两组，每组语音互动终端上设置有语音互动窗口以及与语音互动窗口配合使用的互动设备；语音互动窗口上设置有互动请求模块、互动展示模块、身份验证模块、互动监督模块和报警模块。语音互动平台包括数据库、语音识别模块、互动连接模块和条件检测模块。
5.优选的，语音互动终端互动过程中，语音互动窗口对语音内容进行文字展示，同时校正语义模糊的语音信息，帮助其他用户了解语音内容。
6.优选的，系统还通过语音互动终端对语音互动过程进行监督，存储互动过程中的文字、图像和声音信息，必要时发出警报，封锁互动环境。
7.优选的，用户根据身份验证模块进行身份识别，识别方式为人脸或指纹；高级权限的用户具有发出互动请求、同意互动请求、结束互动请求以及查看历史互动信息的权利；低级权限的用户具有邀请其他用户互动的权利。
8.优选的，有高级权限的用户通过报警模块设置触发关键词集合，某一用户触发关键词出现至一定频率后，该用户被禁止使用互动功能。
9.优选的，互动设备包括键盘、麦克风和摄像头。
10.优选的，数据库用于存储用户的测试语音以及现有的不同国家、名族、地区的语言新型特征数据。
11.优选的，语音识别模块设置有语音识别模型，通过对收集的用户测试语音信息导入模型，与数据库中的现有数据进行对比、分析，得到用户的语音特征，根据特征对互动过
程中的用户语音进行翻译、识别、校正。
12.优选的，条件检测模块包括键盘检测单元、麦克风检测单元、摄像头检测单元和互动环境安全性检测单元。
13.优选的，上述的一种智慧语音互动系统，工作方法如下：
14.s1、高权限用户发起互动；
15.s2、身份验证后，语音互动平台接收互动请求，并建立互动环境；
16.s3、低权限用户发送互动请求，经过高权限用户同意后验证身份，连接进入互动环境；
17.s4、系统对所有接入互动环境的语音互动终端进行设备检测，将可使用的键盘检、麦克风、摄像头标识在语音互动窗口上，同时检测互动环境安全系数，将互动环境安全情况反馈至高权限用户；
18.s5、高权限用户设置触发关键词；
19.s6、互动环境封闭，开始语音互动，互动过程中系统收集各用户的检测语音，并对收集的用户测试语音信息导入模型，与数据库中的现有数据进行对比、分析，得到用户的语音特征；
20.s7、结合用户语音特征，系统对各用户的语音内容进行翻译、校正、识别，并将处理结果以文字形式展示在语音互动窗口上；
21.s8、各用户结合语音互动窗口文字和语音，了解互动内容；
22.s9、某一用户触发关键词出现至一定频率后，该用户被禁止使用互动功能。
23.与现有技术相比，本发明具有如下有益的技术效果：
24.本发明在进行语音互动前，首先建立高级用户等级白名单和语音识别模型。接着对键盘、麦克风、摄像头以及互动环境进行检测，设置触发关键词集合，提前查找互动中可能出现的问题，便于提前解决问题。然后在语音互动初期，收集各用户的检测语音，并对收集的用户测试语音信息导入模型，与数据库中的现有数据进行对比、分析。结合用户语音特征，系统对各用户的语音内容进行翻译、校正、识别，并将处理结果以文字形式展示在语音互动窗口上。用户在听语音互动过程中，可以通过窗口展示的文字进行辅助理解，特别是对一些口音较重的或外国语音的语音，使得互动更加顺畅、准确。出现触发关键词行为时(例如不文明用语)，系统及时处理，有效维持互动秩序，保证互动环境安全。
附图说明
25.图1为本发明一种实施例的系统结构示意图；
26.图2为本发明一种实施例的系统工作方法图。
具体实施方式
27.实施例一
28.如图1所示，本发明提出的一种智慧语音互动系统，包括语音互动终端、云端服务器和语音互动平台；语音互动终端、云端服务器和语音互动平台通过网络连接。语音互动终端至少包括两组，每组语音互动终端上设置有语音互动窗口以及与语音互动窗口配合使用的互动设备；语音互动窗口上设置有互动请求模块、互动展示模块、身份验证模块、互动监
督模块和报警模块。语音互动平台包括数据库、语音识别模块、互动连接模块和条件检测模块。
29.实施例二
30.如图1所示，本发明提出的一种智慧语音互动系统，包括语音互动终端、云端服务器和语音互动平台；语音互动终端、云端服务器和语音互动平台通过网络连接。语音互动终端至少包括两组，每组语音互动终端上设置有语音互动窗口以及与语音互动窗口配合使用的互动设备；语音互动窗口上设置有互动请求模块、互动展示模块、身份验证模块、互动监督模块和报警模块。语音互动平台包括数据库、语音识别模块、互动连接模块和条件检测模块。
31.进一步的，语音互动终端互动过程中，语音互动窗口对语音内容进行文字展示，同时校正语义模糊的语音信息，帮助其他用户了解语音内容。
32.进一步的，系统还通过语音互动终端对语音互动过程进行监督，存储互动过程中的文字、图像和声音信息，必要时发出警报，封锁互动环境。
33.进一步的，用户根据身份验证模块进行身份识别，识别方式为人脸或指纹；高级权限的用户具有发出互动请求、同意互动请求、结束互动请求以及查看历史互动信息的权利；低级权限的用户具有邀请其他用户互动的权利。
34.进一步的，有高级权限的用户通过报警模块设置触发关键词集合，某一用户触发关键词出现至一定频率后，该用户被禁止使用互动功能。
35.进一步的，互动设备包括键盘、麦克风和摄像头。
36.实施例三
37.如图1所示，本发明提出的一种智慧语音互动系统，包括语音互动终端、云端服务器和语音互动平台；语音互动终端、云端服务器和语音互动平台通过网络连接。语音互动终端至少包括两组，每组语音互动终端上设置有语音互动窗口以及与语音互动窗口配合使用的互动设备；语音互动窗口上设置有互动请求模块、互动展示模块、身份验证模块、互动监督模块和报警模块。语音互动平台包括数据库、语音识别模块、互动连接模块和条件检测模块。
38.进一步的，语音互动终端互动过程中，语音互动窗口对语音内容进行文字展示，同时校正语义模糊的语音信息，帮助其他用户了解语音内容。
39.进一步的，系统还通过语音互动终端对语音互动过程进行监督，存储互动过程中的文字、图像和声音信息，必要时发出警报，封锁互动环境。
40.进一步的，用户根据身份验证模块进行身份识别，识别方式为人脸或指纹；高级权限的用户具有发出互动请求、同意互动请求、结束互动请求以及查看历史互动信息的权利；低级权限的用户具有邀请其他用户互动的权利。
41.进一步的，有高级权限的用户通过报警模块设置触发关键词集合，某一用户触发关键词出现至一定频率后，该用户被禁止使用互动功能。
42.进一步的，互动设备包括键盘、麦克风和摄像头。
43.进一步的，数据库用于存储用户的测试语音以及现有的不同国家、名族、地区的语言新型特征数据。
44.进一步的，语音识别模块设置有语音识别模型，通过对收集的用户测试语音信息
导入模型，与数据库中的现有数据进行对比、分析，得到用户的语音特征，根据特征对互动过程中的用户语音进行翻译、识别、校正。
45.进一步的，条件检测模块包括键盘检测单元、麦克风检测单元、摄像头检测单元和互动环境安全性检测单元。
46.实施例四
47.如图2所示，上述的一种智慧语音互动系统，工作方法如下：
48.s1、建立高级用户等级白名单和语音识别模型；
49.s2、高权限用户发起互动；身份验证后，语音互动平台接收互动请求，并建立互动环境；
50.s3、低权限用户发送互动请求，经过高权限用户同意后验证身份，连接进入互动环境；
51.s4、系统对所有接入互动环境的语音互动终端进行设备检测，将可使用的键盘检、麦克风、摄像头标识在语音互动窗口上，同时检测互动环境安全系数，将互动环境安全情况反馈至高权限用户；
52.s5、高权限用户设置触发关键词；
53.s6、互动环境封闭，开始语音互动，互动过程中系统收集各用户的检测语音，并对收集的用户测试语音信息导入模型，与数据库中的现有数据进行对比、分析，得到用户的语音特征；
54.s7、结合用户语音特征，系统对各用户的语音内容进行翻译、校正、识别，并将处理结果以文字形式展示在语音互动窗口上；
55.s8、各用户结合语音互动窗口文字和语音，了解互动内容；
56.s9、某一用户触发关键词出现至一定频率后，该用户被禁止使用互动功能。
57.本发明在进行语音互动前，首先建立高级用户等级白名单和语音识别模型。接着对键盘、麦克风、摄像头以及互动环境进行检测，设置触发关键词集合，提前查找互动中可能出现的问题，便于提前解决问题。然后在语音互动初期，收集各用户的检测语音，并对收集的用户测试语音信息导入模型，与数据库中的现有数据进行对比、分析。结合用户语音特征，系统对各用户的语音内容进行翻译、校正、识别，并将处理结果以文字形式展示在语音互动窗口上。用户在听语音互动过程中，可以通过窗口展示的文字进行辅助理解，特别是对一些口音较重的或外国语音的语音，使得互动更加顺畅、准确。出现触发关键词行为时(例如不文明用语)，系统及时处理，有效维持互动秩序，保证互动环境安全。
58.上面结合附图对本发明的实施方式作了详细说明，但是本发明并不限于此，在所属技术领域的技术人员所具备的知识范围内，在不脱离本发明宗旨的前提下还可以作出各种变化。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：唐凤晨詹宇航
技术所有人：上海蓁康电子有限公司
我是此专利的发明人

上一篇：一种方便安装的漏电开关支撑件的制作方法
上一篇：一种用于易碎密封件检测的防划伤上料机构及上料方法与流程