语音控制交互系统的制作方法

文档序号：12724098阅读：338来源：国知局

本发明涉及人机交互、语音识别技术领域，更具体地涉及一种语音控制交互系统。

背景技术：

随着语音识别技术的飞速发展，人机语音交互的应用场景越来越普遍，人机语音交互系统可以为人们提供有效的人机交互功能，通过语音与机器进行交流，让机器明白人说的是什么，并给出相应的回答。例如，通过人机语音交互系统获取某个地方的天气状况，也可以通过人机语音交互系统为人们指引路径，告诉人们想要去的地方的路线等。

语音交互系统在智能家居中是非常重要的人机交互方式。通过固定安装在房间内的语音交互设备，既可以采集该房间内人的语音控制命令又可以通过声音回放功能给人反馈信息。但现有的语音交互设备只能在该房间内使用，如果人走到另一个房间则无法实现语音交互功能；或者在多个房间内安装该语音交互设备，但是目前这些设备之间无法通信，不能协同工作。例如，当人在一个房间A通过语音下达指令后走到另外一个房间B，此时任何语音反馈结果还是房间A内的设备回放，而此时已经在房间B内的人并不能听到反馈结果，这将降低用户的人机交互使用的便利性，降低用户的使用体验。

鉴于此，有必要提供一种无论人在哪个房间都可以利用在居所内的语音交互设备进行数据交互，便于增加人机交互的空间范围和使用便利性的语音控制交互系统。

技术实现要素：

本发明所要解决的技术问题是提供一种无论人在哪个房间都可以利用在居所内的语音交互设备进行数据交互，便于增加人机交互的空间范围和使用便利性的语音控制交互系统。

为解决上述技术问题，本发明提供一种语音控制交互系统，该系统包括：多个分布在不同房间的语音交互设备以及一第一服务器，多个所述语音交互设备互相通信。其中，所述语音交互设备用于检测和感应人体活动信息并记录，采集语音信息，对所采集的语音信息进行预处理，并将预处理后的语音信息及人体活动信息发送给所述第一服务器，且播放所述第一服务器发送的信息；所述第一服务器用于对所接收的语音信息进行分析处理，匹配相应的信息，并根据所接收的人体活动信息将所述相应的信息发送至相应的语音交互设备。

其进一步技术方案为：多个所述语音交互设备包括一主设备及多个从设备，所述从设备与所述主设备进行数据交互，所述主设备与所述第一服务器进行数据交互。

其进一步技术方案为：所述语音交互设备包括一人体感应模块、一语音采集模块、一中央处理模块、一第一网络连接模块以及一语音解码与播放模块；所述中央处理模块与所述人体感应模块、语音采集模块、第一网络连接模块以及语音解码与播放模块相连。其中，所述人体感应模块，用于检测和感应人体活动信息；所述语音采集模块，用于采集人体发出的语音信息；所述中央处理模块，用于记录人体活动信息以及对所采集的语音信息进行预处理；所述第一网络连接模块，用于与其他语音交互设备进行通信以将所述人体活动信息发送至其他语音交互设备，且与所述第一服务器进行通信以将预处理后的语音信息及人体活动信息发送至第一服务器并接收该第一服务器发送的信息；所述语音解码与播放模块，用于对所述第一服务器发送的信息进行解压缩并播放。

其进一步技术方案为：所述人体感应模块包括红外探测器和/或人体热感传感器和/或视频摄像头。

其进一步技术方案为：所述语音采集模块包括由一个或者多个麦克风构成的麦克风矩阵。

其进一步技术方案为：所述中央处理模块包括中央处理器/微处理器、非易失性存储器及随机存储器。

其进一步技术方案为：所述第一服务器包括一第二网络连接模块、一数据存储模块以及一数据处理模块。其中，所述第二网络连接模块，用于与所述语音交互设备进行通信以接收所述语音交互设备发送的语音信息及人体活动信息，并根据所接收的人体活动信息将匹配的信息发送给相应的语音交互设备；所述数据存储模块，用于存储信息并实时更新所述信息；所述数据处理模块，用于对所接收的语音信息进行分析处理，且与所述数据存储模块进行通信以获取与所述分析处理后的语音信息匹配的信息。

其进一步技术方案为：所述第一服务器还包括一第一数据生成模块以及一第一数据记录模块。其中，所述第一数据生成模块，用于根据所接收的人体活动信息生成相应的时间戳，且根据所接收的预处理后的语音信息生成一语音分析标志位；所述第一数据记录模块，用于记录根据人体活动信息生成的时间戳以及根据所接收的预处理后的语音信息生成的语音分析标志位，且根据所述语音分析标志位从所述数据处理模块中获取与所接收的语音信息匹配的信息并记录。

其进一步技术方案为：所述语音控制交互系统还包括一第二服务器，所述第二服务器与所述语音交互设备及所述第一服务器进行通信，所述第二服务器用于生成并记录人体活动信息的时间戳、接收语音交互设备预处理后的语音信息并生成一语音分析标志位，记录该语音分析标志位，且根据该标志位从所述第一服务器中获取与来自所述语音交互设备的语音信息匹配的信息并记录。

其进一步技术方案为：所述第二服务器包括一第三网络连接模块、一第二数据生成模块以及一第二数据记录模块。其中，所述第三网络连接模块，用于与所述语音交互设备及所述第一服务器进行通信以接收所述语音交互设备发送的人体活动信息、预处理后的语音信息以及所述第一服务器发送的与所述预处理后的语音信息匹配的信息；所述第二数据生成模块，用于根据人体活动信息生成相应的时间戳，且根据所接收的预处理后的语音信息生成一语音分析标志位；所述第二数据记录模块，用于记录根据人体活动信息生成的时间戳、根据所接收的预处理后的语音信息生成的语音分析标志位以及从所述第一服务器中获取的与所接收的语音信息匹配的信息。

与现有技术相比，本发明的语音控制交互系统中的语音交互设备可以检测和感应人体活动信息，且设备之间可以互相通信，使得多个语音交互设备可以协同工作。即通过语音交互设备中的人体感应模块可检测和感应人体活动信息，当使用者位于房间时，该房间内的语音交互设备可对人发出的指令进行采集，而当使用者离开该房间去往另一房间时，另一房间的语音交互设备可继续采集人发出的命令，并接收之前房间的设备采集的语音信息，且进行信息拼接及预处理，第一服务器可接收预处理后的语音信息，且将所接收的语音信息进行分析处理，匹配相应的信息，并根据人体活动信息将所述相应的信息发送至感应到使用者存在的房间内的语音交互设备进行播放。该系统极大地提高了通过语音交互的人机交互方式的便利性和用户使用的顺畅感。

附图说明

图1展示了本发明语音控制交互系统第一实施例的结构框图。

图2展示了本发明语音控制交互系统第一实施例的一具体应用场景。

图3展示了本发明语音控制交互系统第二实施例的结构框图。

图4展示了本发明语音控制交互系统第三实施例的结构框图。

具体实施方式

为使本领域的普通技术人员更加清楚地理解本发明的目的、技术方案和优点，以下结合附图和实施例对本发明做进一步的阐述。

参照图1，图1展示了本发明的语音控制交互系统10第一实施例的结构框图。在附图所示的实施例中，该系统10包括：多个分布在不同房间的语音交互设备11以及一第一服务器12，所述语音交互设备11与所述第一服务器12进行通信，且多个所述语音交互设备11可互相通信。其中，所述语音交互设备11用于检测和感应人体活动信息并记录，该语音交互设备11可将所述人体活动信息发送至其他语音交互设备11，所述人体活动信息包括人进入房间、发出指令、离开房间等信息，采集语音信息，对所采集的语音信息进行预处理，即对所采集的语音信息进行去噪处理，并将预处理后的语音信息及人体活动信息发送给所述第一服务器12，且播放所述第一服务器12发送的信息；所述第一服务器12用于对所接收的语音信息进行分析处理，匹配相应的信息，并根据所接收的人体活动信息将所述相应的信息发送至相应的语音交互设备11，即将所述相应的信息发送至检测和感应到人存在的房间内的语音交互设备11。

在某些实施例，例如本实施例中，所述语音交互设备11包括一人体感应模块111、一语音采集模块112、一中央处理模块113、一第一网络连接模块114以及一语音解码与播放模块115；所述中央处理模块113与所述人体感应模块111、语音采集模块112、第一网络连接模块114以及语音解码与播放模块115相连。

其中，所述人体感应模块111，用于检测和感应人体活动信息；其包括红外探测器和/或人体热感传感器和/或视频摄像头。所述语音采集模块112，用于采集人体发出的语音信息；所述语音信息包括天气查询、路况查询、音乐、新闻查询、控制家具电器开关、询问家具电器状态等信息，该语音采集模块112包括由一个或者多个麦克风构成的麦克风矩阵，若所述麦克风是模拟麦克风则还需要搭配模拟到数字转换装置即ADC。所述中央处理模块113，用于记录人体活动信息以及对所采集的语音信息进行预处理；其包括中央处理器/微处理器、非易失性存储器及易失性的随机存储器，其中，所述中央处理器或微处理器采用高性能低功耗的ARM架构处理器，其具备丰富的接口，可与外部模块连接及通信；非易失性存储器用于存储整个系统运行的嵌入式操作系统和相关的应用程序或算法，还用于存储系统的配置信息和一些临时的用户数据；易失性的随机存储器因为其访问速度迅速，所以用于存放在系统运行过程中缓存的数据或中间结果。所述第一网络连接模块114，用于与其他语音交互设备11进行通信以将所述人体活动信息发送至其他语音交互设备11，且与所述第一服务器12进行通信以将预处理后的语音信息及人体活动信息发送至第一服务器12并接收该第一服务器12发送的信息。所述语音解码与播放模块115，用于对所述第一服务器12发送的信息进行解压缩并播放；若中央处理模块113具备音频解码与播放能力，则可直接外接喇叭即可完成相应功能，若中央处理模块113不具备音频解码与播放能力，则需要外接具有音频解码与播放的芯片，再通过数模转换器及放大电路与喇叭连接。

在某些实施例，例如本实施例中，语音交互设备11在房间内安装完毕后，可通过无线路由器接入网络，即设备上电后，将无线路由器的名称和密码通过系统自带的人机交互界面直接写入语音交互设备11，设备11接收到无线路由器的接入信息后，进行加密且自动存储在非易失性存储器中，然后用接入信息尝试接入无线路由器，如果成功接入则提示成功并开始工作，如果没有接入则给出异常信息，且从第二台设备11开始，都通过WIFI-Mesh协议自动接入无线路由器，同时每添加一台设备11都会先尝试发现是否已经有设备11被配置好，如果有则自动加入已经配置好的设备网络。

在附图所示的实施例中，所述第一服务器12包括一第二网络连接模块121、一数据存储模块122以及一数据处理模块123。其中，所述第二网络连接模块121，用于与所述语音交互设备11进行通信以接收所述语音交互设备11发送的语音信息及人体活动信息，并根据所接收的人体活动信息将匹配的信息发送给相应的语音交互设备11。所述数据存储模块122，用于存储信息并实时更新所述信息；所述信息包括天气情况、路况、音乐、新闻、家具电器状态等信息，这些信息可连网实时更新。所述数据处理模块123，用于对所接收的语音信息进行分析处理，且与所述数据存储模块122进行通信以获取与所述分析处理后的语音信息匹配的信息。

在某些实施例，例如本实施例中，多个所述语音交互设备11包括一主设备及多个从设备，其中，多个所述语音交互设备11中性能最优或最早加入网络的设备11设为主设备，其他设备11均为从设备，所述从设备与所述主设备进行数据交互，所述主设备与所述第一服务器12进行数据交互。本实施例中，所述从设备将人体活动信息及所采集的语音信息发送给所述主设备，所述主设备对所接收的来自从设备的语音信息进行拼接及预处理，且将预处理后的语音信息发送给所述第一服务器12，并接收第一服务器12发送的匹配的信息，再根据所接收的人体活动信息将所述匹配的信息发送至感应到人存在的房间的从设备，所述从设备播放所述匹配的信息。其中，所有设备11均采用符合IEEE1588的精确时钟同步协议，该协议利用硬件晶振提供的频率可以达到亚微秒级同步精度，所述主设备的时钟提供时钟源，组内所有从设备都与该时钟源保持同步。

参照图2，图2展示了本发明语音控制交互系统10第一实施例的一具体应用场景。在附图所示的实施例中，该应用场景中语音交互设备N1为主设备，语音交互设备N2至语音交互设备Nn均为从设备，多个从设备均与所述主设备进行数据交互，所述主设备与所述第一服务器12进行数据交互，且多个所述语音交互设备11分别分布在不同房间。可理解地，本实施例中的语音控制交互系统10中的语音交互设备11之间可以互相通信，多个语音交互设备11可以协同工作。例如，如果用户在设置有语音交互设备N2的房间说出部分语音命令，而后又进入设置有语音交互设备Nn的另一房间，在另一房间对语音交互设备Nn说完剩下的语音命令，则该语音交互设备N2及语音交互设备Nn均会将各自接收到的部分语音命令发送给主设备即语音交互设备N1，设备N1将两部分语音命令拼接并预处理后再发送到第一服务器12进行处理。同理，如果用户在设置有语音交互设备N2的房间说完语音命令后，在没有离开该房间时收听到反馈的语音信息中的部分消息，然后进入另一房间，此时语音交互设备N1会控制该房间内的设备11进行无缝的切换并播放剩余没有播放完的反馈语音信息。

参照图3，图3展示了本发明的语音控制交互系统10第二实施例的结构框图。本实施例与第一实施例的不同之处在于所述第一服务器12还包括有一第一数据生成模块124以及一第一数据记录模块125。其中，所述第一数据生成模块124，用于根据所接收的人体活动信息生成相应的时间戳，即生成人进入房间、发出指令及离开房间时的时间戳，且根据所接收的预处理后的语音信息生成一语音分析标志位；该语音分析标志位用于提醒所述第一数据记录模块125从所述数据处理模块123中提取与所接收的预处理后的语音信息匹配的信息。所述第一数据记录模块125，用于记录根据人体活动信息生成的时间戳以及根据所接收的预处理后的语音信息生成的语音分析标志位，且根据所述语音分析标志位从所述数据处理模块123中获取与所接收的语音信息匹配的信息并记录。基于本实施例增加的第一数据生成模块124以及第一数据记录模块125可收集用户在具体房间内的具体时间通过语音交互触发的行为信息，可准确地记录使用者的空间和时间行为信息，促使该系统10从空间和时间角度为智能家居、智能娱乐及智能安防等系统提供准确的决策数据，在提升用户体验的同时，节约了资源，提高了各个智能系统的经济性。

参照图4，图4展示了本发明的语音控制交互系统10第三实施例的结构框图。本实施例与第一实施例的不同之处在于所述语音控制交互系统10还包括一第二服务器13，所述第二服务器13与所述语音交互设备11及所述第一服务器12进行通信，所述第二服务器13用于接收所述人体活动信息并生成、记录与该人体活动信息相对应的时间戳、接收语音交互设备11预处理后的语音信息并生成一语音分析标志位，记录该语音分析标志位，且根据该标志位从所述第一服务器12中获取与来自所述语音交互设备11的语音信息匹配的信息并记录。

在某些实施例，例如本实施例中，所述第二服务器13包括一第三网络连接模块131、一第二数据生成模块132以及一第二数据记录模块133。其中，所述第三网络连接模块131，用于与所述语音交互设备11及所述第一服务器12进行通信以接收所述语音交互设备11发送的人体活动信息、预处理后的语音信息以及所述第一服务器12发送的与所述预处理后的语音信息匹配的信息；所述第二数据生成模块132，用于根据人体活动信息生成相应的时间戳，即生成人进入房间、发出指令及离开房间时的时间戳，且根据所接收的预处理后的语音信息生成一语音分析标志位；该语音分析标志位用于提醒所述第二服务器13从所述第一服务器12中提取与所接收的预处理后的语音信息匹配的信息。所述第二数据记录模块133，用于记录根据人体活动信息生成的时间戳、根据所接收的预处理后的语音信息生成的语音分析标志位以及从所述第一服务器12中获取的与所接收的语音信息匹配的信息。本实施例和上述第二实施例均可准确地记录使用者的空间和时间行为信息，促使该系统10从空间和时间角度为其他一些系统提供准确的决策数据，在提升用户体验的同时，可节约资源，提高各个智能系统的经济性。但具体实施方式不同，区别在于：本实施例增加了一个服务器，使得所述语音交互及行为采集分析行为运行在不同的服务器上，而上述第二实施例中的语音交互及行为采集分析行为运行在同一个服务器的不同服务上。

综上所述，本发明的语音控制交互系统中的语音交互设备可以检测和感应人体活动信息，且设备之间可以互相通信，使得多个语音交互设备可以协同工作。即通过语音交互设备中的人体感应模块可检测和感应人体活动信息，当使用者位于房间时，该房间内的语音交互设备可对人发出的指令进行采集，而当使用者离开该房间去往另一房间时，另一房间的语音交互设备可继续采集人发出的命令，并接收之前房间的设备采集的语音信息，且进行信息拼接及预处理，第一服务器可接收预处理后的语音信息，且将所接收的语音信息进行分析处理，匹配相应的信息，并根据人体活动信息将所述相应的信息发送至感应到使用者存在的房间内的语音交互设备进行播放。该系统极大地提高了通过语音交互的人机交互方式的便利性和用户使用的顺畅感。

以上所述仅为本发明的优选实施例，而非对本发明做任何形式上的限制。本领域的技术人员可在上述实施例的基础上施以各种等同的更改和改进，凡在权利要求范围内所做的等同变化或修饰，均应落入本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孟强祥;宋昱
技术所有人：巨数创新（深圳）科技有限公司
我是此专利的发明人

上一篇：用于智能机器人的语音输出方法和装置与流程
上一篇：一种智能穿戴设备的制作方法与工艺