基于USB端口的多MIC语音助理模块的制作方法

文档序号：18325500发布日期：2019-08-03 10:58阅读：569来源：国知局

本发明涉及智能语音应用领域，属于语音识别、通信类技术领域。具体涉及对现有电脑主机系统或者类似于电脑的主机系统增加智能语音助理功能，使得这些设备可以接入云端语音服务平台。

背景技术：

与本技术相关的现有技术主要为智能语音处理技术，其代表产品为智能音箱等，如阿里的天猫精灵。其中包含智能语音终端的mic数据处理技术，语音识别技术，网络连接技术等。随着人工智能技术的发展，如何让终端产品接入语音平台对于人工智能智能的普及变得很重要。目前这类技术应用还是集中在各种新型的智能音箱产品。现有的电脑系统，或者类似于电脑的主机系统目前还不能扩展至智能语音平台。

技术实现要素：

本发明实施例的目的在于提供一种智能语音助理模块，实现一款硬件产品。通过它将现有的电脑系统，或者类似于电脑的主机系统扩展至智能语音平台。通过云端语音智能服务平台实现智能家居控制、信息播报、音频音乐播放等功能，带来人机交互新体验。

方案的详细描述：

(1)设计一款特定的usb语音模块，具有标准usb接口，兼容可插入电脑主机的usb端口，并且由电脑主机系统给该模块提供供电。

(2)usb语音模块设计有多路mic，用于采集外部语音。多路mic的设计可以保证mic阵列算法，支持远场语音拾取，实现一定的语音降噪处理和保证语音采集的质量。

(3)usb语音模块上采用一个或者多个mcu或者dsp处理单元，一方面收集多mic数据，另外做初步的语音预处理。

(4)usb语音模块上的mcu或者dsp处理单元，将负责本地端的关键词唤醒处理，从而支持语音自动唤醒功能。

(5)usb语音模块上的mcu或者dsp处理单元具有usb端口，支持usb数据通信，负责将语音数据以特定的格式传送到主机系统。

(6)主机系统将提供此特定usb语音模块的驱动程序，并建立特定的通信协议。此协议主要包含mic语音原始数据从usb语音模块上传至主机，以及相关数据控制命令的交互。

(7)主机系统将分析mic录音的原始数据，并进行相关降噪处理，以及多mic语音算法处理，转化为单mic信号。

(8)主机系统内的语音客户端软件将建立与语音云端服务器的连接，并将以上mic数据上传至云端。

(9)云端服务器将处理上传的语音数据，进行语音识别，语义理解，以及获得答复，并下传。

(10)主机系统获取云端答复信息，通过主机扬声器播放出来。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示意性示出了根据本发明的一些实施例的流程示意框图；

图2示意性示出了根据本发明的一些实施例的usb语音模块架构示意图；

具体实施方式

现在将参考附图更全面地描述示例实施例。然而，示例实施例能够以多种形式实施，且不应被理解为限于在此阐述的实施例；相反，提供这些实施例使得本发明将全面和完整，并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本发明的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本发明的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

在本示例实施例中，图1示意性示出了根据本发明的一些实施例的语音助理实现流程的示意框图。参考图1所示，该实现包括如下步骤：

步骤s110，usb语音模块插入主机的usb接口后，主机自动识别usb模块并激活模块；

步骤s120，mic-1......mic-n终端处于接收语音状态；

步骤s130，接收到语音后mic处理单元进行降噪、识别、转义处理；

步骤s140，语音数据通过usb口传输给主机；

步骤s150，主机接收到语音数据后通过内部软件接口将数据送入语音客户端软件；

步骤s160，语音客户端软件通过无线网络连接语音服务云端平台。

下面，将对本示例实施例的实现进行进一步的说明。

参考图1所示，在步骤s110中，主机端的usb驱动会自动识别usb语音模块，并直接加载、激活usb语音模块里面的程序。

在步骤s120中，mic终端可以将语音的模拟信号转换为数字信号。

在步骤s130中，mic处理单元将语音数字信号进一步处理，滤除噪音干扰、提取出关键字、转义成智能语音数据。

在步骤s140中，将所述数据按照usb数据格式进行打包，将打包后的所述数据通过usb端口发送给主机。

在步骤s150中，主机侧的语音处理单元通知主机内的语音客户端软件“语音数据已经到来”，然后通过软件内部的接口将所述语音数据送入到语音客户端软件中。

在步骤s160中，语音客户端软件负责建立本地与云端语音服务器的连接，数据的传送和接收，并驱动主机的扬声器播放声音信息。语音客户端软件和语音服务云端平台的通信与交互这样的功能实现，可以通过第三方软件平台实现，如阿里云，亚马逊云等。

在本示例实施例中，图2示意性示出了根据本发明的一些实施例的usb语音模块架构，和其在整个语音交互服务中的角色。参照图2所示，该架构包括：

usb语音模组。它属于主机usb端口的一个外设，向主机输入语音数据；

主机系统。可以是windows/ios/android等操作系统，可用于支持各种语音客户端软件、网络通信和接口驱动软件的运行。

语音云端服务平台。这里是数据处理中心，服务中心，大数据中心。用于响应来自客户端的服务请求。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张云骥
技术所有人：张云骥
我是此专利的发明人