一种语音交互系统及语音交互方法与流程

文档序号：15674534发布日期：2018-10-16 19:54阅读：334来源：国知局

本发明涉及语音交互技术领域，特别涉及一种语音交互系统及语音交互方法。

背景技术：

音箱是整个音响系统的终端，其作用是把音频电能转换成相应的声能，并把它辐射到空间去。它是音响系统极其重要的组成部分，因为它担负着把电信号转变成声信号供人的耳朵直接聆听这么一个关键任务，可以认为，音箱的性能高低对一个音响系统的放音质量是起着关键作用。一般的音箱接上电源，接上外部设备，如手机、电脑、mp3等，向其输送音频数据时，音箱能够根据数据进行播放。但是现有技术中的音箱无法做到语音交互功能。

针对这一问题，部分商家推出一款新的智能音箱，该音箱包括拾音模块、语音识别模块、语义分析模块和wifi模块，通过拾音模块、语音识别模块、语义分析模块和wifi模块能实现语音交互功能，但如此会导致音箱的制作成本高昂，这意味着消费者需承担高昂的价格才能享受到音箱语音交互功能带来的便捷。

技术实现要素：

本发明要解决的技术问题是，针对上述现有技术中的不足，提供一种语音交互系统及语音交互方法，其能做到低成本实现音箱的语音交互功能，使消费者能以更低的价格来享受音箱语音交互功能带来的便捷，满足消费者的需求。

为解决上述技术问题，本发明的技术方案是：

一种语音交互系统，包括音箱、智能终端和云端服务器，所述音箱包括usb接头、拾音模块、第一主控模块和喇叭模块，所述usb接头、拾音模块和喇叭模块均与第一主控模块电连接，所述智能终端设有与usb接头匹配的接口，所述智能终端上安装有降噪处理模块、第二主控模块和usb接入判断模块，所述云端服务器包括cpu控制处理模块、语音识别模块、语义分析模块和索引擎模块，所述语音识别模块、语义分析模块和索引擎模块均与cpu控制处理模块电连接，所述音箱通过usb接头接入接口与智能终端通信连接，所述智能终端通过自带的wifi模块接入wifi无线通信网与云端服务器通信连接。

作为一种优选方案，所述拾音模块包括多个以阵列方式排布的麦克风。

作为一种优选方案，所述音箱还包括蓝牙模块，所述蓝牙模块与第一主控模块电连接。

作为一种优选方案，所述音箱还设有音频接口，所述音频接口与第一主控模块电连接。

作为一种优选方案，所述云端服务器还包括语音合成模块和语音字库模块，所述语音合成模块和语音字库模块均与cpu控制处理模块电连接。

一种语音交互方法，基于如上所述的语音交互系统，所述方法包括以下步骤：

1）音箱通过usb接头接入接口与智能终端通信连接，智能终端通过自身带有的wifi模块接入wifi无线通信网络与云端服务器通信连接；

2）音箱的拾音模块实时采集用户语音，得到第一语音文件，音箱通过usb接头与接口配合将第一语音文件发送至智能终端上；

3）智能终端的降噪处理模块对第一语音文件进行降噪处理，得到第二语音文件；

4）智能终端通过自身带有的wifi模块将第二语音文件发送至云端服务器上；

5）云端服务器的语音识别模块将第二语音文件转化成文字文件，然后cpu控制处理模块对文字文件进行智能分析，并且cpu控制处理模块根据智能分析的结果将文字文件转化为控制指令或控制索引擎模块进行检索；

6）云端服务器经wifi无线通信网络将步骤5）中获得的控制指令或检索结果发送至智能终端，然后智能终端通过usb接头与接口配合将接收到的控制指令或检索结果发送至音箱，音箱的第一主控模块对控制指令进行解析，并进行相应的控制操作或音箱的第一主控模块将收到的检索结果转发送至喇叭模块播放出来。

作为一种优选方案，步骤1）中在usb接头接入智能终端的接口之后，智能终端的usb接入判断模块判断接入的usb设备是否为音箱，若是，则智能终端与音箱通信连接，并开启第二主控模块和降噪处理模块，同时音箱的第一主控模块开启拾音模块以及关闭蓝牙模块和音频接口；若否，则智能终端不与音箱通信连接，且音箱的拾音模块处于关闭状态、蓝牙模块和音频接口处于开启状态。

作为一种优选方案，步骤5）中智能分析方法包括以下步骤：

1）云端服务器的语义分析模块对文字文件进行语义分析，获取动作指令；

2）云端服务器的cpu控制处理模块判断动作指令中是否为检索指令，若是，则云端服务器的cpu控制处理模块获取检索关键词，索引擎模块根据检索关键词检索出相关内容，若否，则云端服务器的cpu控制处理模块将文字文件转换成控制指令。

作为一种优选方案，步骤3）中在智能终端的降噪处理模块对第一语音文件进行降噪处理之前，智能终端的第二主控模块判断第一语音文件中是否含有唤醒词，若是，则将第一语音发送至降噪处理模块进行降噪处理，若否，则自动忽略该第一语音文件。

作为一种优选方案，步骤5）中在索引擎模块检索得到检索结果后，cpu控制处理模块判断检索结果是否为文字文件，若是，则语音合成模块根据该文字文件和语音字库模块合成语音文件，然后将该语音文件作为检索结果通过智能终端发送至音箱的喇叭模块播放出来，若否，则直接将该检索结果通过智能终端发送至音箱的喇叭模块播放出来。

本发明的有益效果是：所述语音交互系统包括音箱、智能终端和云端服务器，音箱收集语音数据，然后通过usb接头将语音数据发送至智能终端，而智能终端对语音数据进行降噪处理，然后通过自身的wifi模块发送至云端服务器上做语音识别、语义分析和检索结果，再将检索结果或控制指令通过智能终端反馈至音箱，如此实现语音交互功能，由于音箱内无需设置语音识别模块、语义分析模块和wifi模块，使音箱的制作成本能大幅度降低，从而使该音箱能做到低成本实现语音交互功能，使消费者能以更低的价格来享受音箱语音交互功能带来的便捷，满足消费者的需求。

附图说明

图1为本发明之实施例的结构示意图；

图2为本发明之语音交互方法的框架图；

图3为本发明之智能分析方法的框架图。

图中：1-音箱，11-usb接头，12-拾音模块，13-第一主控模块，14-喇叭模块，2-智能终端，21-接口，22-降噪处理模块，23-第二主控模块，24-usb接入判断模块，3-云端服务器，31-cpu控制处理模块，32-语音识别模块，33-语义分析模块，34-索引擎模块，35-语音合成模块，36-语音字库模块。

具体实施方式

下面结合附图对本发明的结构原理和工作原理作进一步详细说明。

如图1所示，一种语音交互系统，包括音箱1、智能终端2和云端服务器3，所述音箱1包括usb接头11、拾音模块12、第一主控模块13和喇叭模块14，所述usb接头11、拾音模块12和喇叭模块14均与第一主控模块13电连接，所述智能终端2设有与usb接头11匹配的接口21，所述智能终端2上安装有降噪处理模块22、第二主控模块23和usb接入判断模块24，所述智能终端2为智能手机或平板电脑，所述降噪处理模块22、第二主控模块23和usb接入判断模块24集合以app的方式安装于智能终端2上。所述云端服务器3包括cpu控制处理模块31、语音识别模块32、语义分析模块33和索引擎模块34，所述语音识别模块32、语义分析模块33和索引擎模块34均与cpu控制处理模块31电连接，所述音箱1通过usb接头11接入接口21与智能终端2通信连接，所述智能终端2通过自带的wifi模块接入wifi无线通信网与云端服务器3通信连接。

作为一种优选方案，所述云端服务器3还包括语音合成模块35和语音字库模块36，所述语音合成模块35和语音字库模块36均与cpu控制处理模块31电连接。

作为一种优选方案，所述拾音模块12包括多个以阵列方式排布的麦克风，所述拾音模块12通常安装于音箱1的顶部。

作为一种优选方案，所述音箱1还包括蓝牙模块，所述蓝牙模块与第一主控模块13电连接。所述蓝牙模块优选为ble蓝牙模块。

作为一种优选方案，所述音箱1还设有音频接口21，所述音频接口21与第一主控模块13电连接。

蓝牙模块和音频接口21的设置，使音箱1能与其他设备进行音频数据交互，从而使音箱1能作为普通便携式音箱1使用，增加音箱1的实用性。

作为一种优选方案，所述音箱1上还设有开关按键、暂停播放按键、音量加减按键和麦克风禁用按键，所述开关按键、暂停播放按键、音量加减按键和麦克风禁用按键均与第一主控模块13电连接。

作为一种优选方案，所述音箱1既可以通过适配器供电，又可以通过内置电池的方式来供电。

如图2所示，一种语音交互方法，基于如上所述的语音交互系统，所述方法包括以下步骤：

1）音箱1通过usb接头11接入接口21与智能终端2通信连接，智能终端2通过自身带有的wifi模块接入wifi无线通信网络与云端服务器3通信连接；

2）音箱1的拾音模块12实时采集用户语音，得到第一语音文件，音箱1通过usb接头11与接口21配合将第一语音文件发送至智能终端2上；

3）智能终端2的降噪处理模块22对第一语音文件进行降噪处理，得到第二语音文件；

4）智能终端2通过自身带有的wifi模块将第二语音文件发送至云端服务器3上；

5）云端服务器3的语音识别模块32将第二语音文件转化成文字文件，然后cpu控制处理模块31对文字文件进行智能分析，并且cpu控制处理模块31根据智能分析的结果将文字文件转化为控制指令或控制索引擎模块34进行检索；

6）云端服务器3经wifi无线通信网络将步骤5）中获得的控制指令或检索结果发送至智能终端2，然后智能终端2通过usb接头11与接口21配合将接收到的控制指令或检索结果发送至音箱1，音箱1的第一主控模块13对控制指令进行解析，并进行相应的控制操作或音箱1的第一主控模块13将收到的检索结果转发送至喇叭模块14播放出来。

其中，所述控制指令可以为音量加减、暂停播放、继续播放、循环播放等，所述检索结果不限于歌曲检索，也可以为新闻、天气预报等其他信息。

作为一种优选方案，步骤1）中在usb接头11接入智能终端2的接口21之后，智能终端2的usb接入判断模块24判断接入的usb设备是否为音箱1，若是，则智能终端2与音箱1通信连接，并开启第二主控模块23和降噪处理模块22，同时音箱1的第一主控模块13开启拾音模块12以及关闭蓝牙模块和音频接口21；若否，则智能终端2不与音箱1通信连接，且音箱1的拾音模块12处于关闭状态、蓝牙模块和音频接口21处于开启状态。

作为一种优选方案，步骤3）中在智能终端2的降噪处理模块22对第一语音文件进行降噪处理之前，智能终端2的第二主控模块23判断第一语音文件中是否含有唤醒词，若是，则将第一语音发送至降噪处理模块22进行降噪处理，若否，则自动忽略该第一语音文件。

第一语音文件通过降噪处理之后，便能获得清晰的第二语音文件，如此云端服务器3的语音识别模块32进行语音识别的时候，便不容易出错，能形成准确的文字文件，这样能提高语音识别的准确率，从而使提高语音交互质量，使用户具有良好的体验感。

由于检索结果不一定为语音文件，因此在步骤5）中在索引擎模块34检索得到检索结果后，cpu控制处理模块31判断检索结果是否为文字文件，若是，则语音合成模块35根据该文字文件和语音字库模块36合成语音文件，然后将该语音文件作为检索结果通过智能终端2发送至音箱1的喇叭模块14播放出来，若否，则直接将该检索结果通过智能终端2发送至音箱1的喇叭模块14播放出来。

如图3所示，步骤5）中智能分析方法包括以下步骤：

1）云端服务器3的语义分析模块33对文字文件进行语义分析，获取动作指令；

2）云端服务器3的cpu控制处理模块31判断动作指令中是否为检索指令，若是，则云端服务器3的cpu控制处理模块31获取检索关键词，索引擎模块34根据检索关键词检索出相关内容，若否，则云端服务器3的cpu控制处理模块31将文字文件转换成控制指令。

以上所述，仅是本发明较佳实施方式，凡是依据本发明的技术方案对以上的实施方式所作的任何细微修改、等同变化与修饰，均属于本发明技术方案的范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张鑫
技术所有人：广东思派康电子科技有限公司
我是此专利的发明人

上一篇：一种可叠层式减震垫的制作方法
上一篇：一种具有多层疏松一体烟草段的低温卷烟及其制备方法与流程