一种语音设备控制方法、装置和终端与流程

文档序号：17846622发布日期：2019-06-11 21:48阅读：119来源：国知局

本发明涉及智能家电技术领域，特别涉及一种语音设备控制方法、装置和终端。

背景技术：

目前，市场上带唤醒词的智能音箱都是开机后一直处于联网状态，随时可以语音唤醒的状态。然而，智能音箱开机后一直处于联网状态会带来很高的功耗，普通锂电池无法满足。所以，一般设计为需要插上电源之后，智能音箱才能工作，限制了智能音箱的移动特性。现有的智能音箱通常是直流输入，没有充电带电池的功能。如果用户需要在卧室听歌，或者在厨房听歌，或者在浴室听歌，而智能音箱放置于客厅，就必须拔掉智能音箱的电源，然后放到新的位置。新的位置还必须有电源插头，重新插上电源，并且重新开机联网后才能正常使用，这样的体验相当繁琐。

技术实现要素：

本发明实施例提供一种语音设备控制方法、装置和终端，以至少解决现有技术中的以上技术问题。

第一方面，本发明实施例提供了一种语音设备控制方法，包括：

在语音设备处于唤醒状态下，与服务器建立网络连接；

接收需求语音；

将所述需求语音发送至所述服务器；

根据所述服务器返回的信息播放与所述需求语音对应的回复语音；

若在预设时间段内没有检测到语音，则断开与所述服务器的网络连接。

在一种实施例中，在语音设备处于唤醒状态之前，还包括：

接收唤醒语音；

根据所述唤醒语音控制所述语音设备处于唤醒状态。

在一种实施例中，接收唤醒语音之后，还包括：

根据所述唤醒语音生成开启提示播放指令；

根据所述开启提示播放指令播放开启提示音。

在一种实施例中，与服务器建立网络连接，包括：

根据所述唤醒语音生成联网请求信息；

将所述联网请求信息发送至网关设备，所述联网请求信息用于指示所述网关设备根据所述联网请求信息与所述服务器建立无线网络连接；

接收所述服务器经过所述网关设备返回的联网成功信息。

在一种实施例中，根据所述服务器返回的信息播放与所述需求语音对应的回复语音之后，还包括：

将所述回复语音的结束时间点设置为所述预设时间段的起点，根据预设条件设置所述预设时间段的长度，所述预设条件包括所述语音设备使用频率。

在一种实施例中，还包括：

根据所述服务器返回的信息播放与所述需求语音对应的图像或视频。

第二方面，本发明实施例提供了一种语音设备控制装置，包括：

网络连接模块，用于在语音设备处于唤醒状态下，与服务器建立网络连接；

需求语音接收模块，用于接收需求语音；

需求语音发送模块，用于将所述需求语音发送至所述服务器；

回复语音播放模块，用于根据所述服务器返回的信息播放与所述需求语音对应的回复语音；

网络断开模块，用于若在预设时间段内没有检测到语音，则断开与所述服务器的网络连接。

在一种实施方式中，还包括：

唤醒语音接收模块，用于接收唤醒语音；

唤醒状态控制模块，用于根据所述唤醒语音控制所述语音设备处于唤醒状态。

在一种实施方式中，还包括：

开启提示播放指令生成模块，用于根据所述唤醒语音生成开启提示播放指令；

开启提示播放模块，用于根据所述开启提示播放指令播放开启提示音。

在一种实施方式中，所述网络连接模块包括：

联网请求信息生成单元，用于根据所述唤醒语音生成联网请求信息；

联网请求信息发送单元，用于将所述联网请求信息发送至网关设备，所述联网请求信息用于指示所述网关设备根据所述联网请求信息与所述服务器建立无线网络连接；

联网成功信息接收单元，用于接收所述服务器经过所述网关设备返回的联网成功信息。

在一种实施方式中，还包括：

预设时间段设置模块，用于将所述回复语音的结束时间点设置为所述预设时间段的起点，根据预设条件设置所述预设时间段的长度，所述预设条件包括所述语音设备使用频率。

在一种实施方式中，还包括：

图像视频播放模块，用于根据所述服务器返回的信息播放与所述需求语音对应的图像或视频。

第三方面，本发明实施例提供了一种语音设备控制终端，所述功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中，语音设备控制终端的结构中包括处理器和存储器，所述存储器用于存储支持语音设备控制终端执行上述第一方面中语音设备控制方法的程序，所述处理器被配置为用于执行所述存储器中存储的程序。所述语音设备控制终端还可以包括通信接口，用于语音设备控制终端与其他设备或通信网络通信。

第四方面，本发明实施例提供了一种计算机可读存储介质，用于存储语音设备控制装置所用的计算机软件指令，其包括用于执行上述第一方面中语音设备控制方法为语音设备控制装置所涉及的程序。

上述技术方案中的一个技术方案具有如下优点或有益效果：在预设时间段内不使用语音设备的情况下，语音设备断开根据断开与服务器的无线连接，使其处于低功耗模式下。在低功耗模式下，大大延长了利用电池供电的语音设备的待机功耗，从而让语音设备能够长时间待机，设备可以不用长时间插电源，也可以不用更换位置之后，还要重新插电，满足用户随意挪动使用语音设备的需求，在保证唤醒功能体验不降低的情况下，极大提升语音设备使用的便利性和自由度。

上述概述仅仅是为了说明书的目的，并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外，通过参考附图和以下的详细描述，本发明进一步的方面、实施方式和特征将会是容易明白的。

附图说明

在附图中，除非另外规定，否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解，这些附图仅描绘了根据本发明公开的一些实施方式，而不应将其视为是对本发明范围的限制。

图1为本发明实施例提供的一种语音设备控制方法流程图；

图2为本发明实施例提供的另一种语音设备控制方法示意图；

图3为本发明实施例提供的另一种语音设备控制方法流程图；

图4为本发明实施例提供的一种语音设备控制装置框图；

图5为本发明实施例提供的另一种语音设备控制装置框图；

图6为本发明实施例提供的另一种语音设备控制装置框图；

图7为本发明实施例提供的一种语音设备控制终端示意图。

具体实施方式

在下文中，仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样，在不脱离本发明的精神或范围的情况下，可通过各种不同方式修改所描述的实施例。因此，附图和描述被认为本质上是示例性的而非限制性的。

实施例一

在一种具体的实施方式中，如图1所示，提供了一种语音设备控制方法，包括：

步骤s10：在语音设备处于唤醒状态下，与服务器建立网络连接；

步骤s20：接收需求语音；

步骤s30：将需求语音发送至服务器；

步骤s40：根据服务器返回的信息播放与需求语音对应的回复语音；

步骤s50：若在预设时间段内没有检测到语音，则断开与服务器的网络连接。

需要指出的是，步骤s20和步骤s10可以同时进行，步骤s20也可能滞后于步骤s10，以同时进行为佳。本实施例提供的方法可适用于各种音控的智能家电，例如智能音箱、智能空调等。

在一种示例中，以智能音箱为例进行说明。智能音箱被用户唤醒后，立即与服务器建立网络连接，同时，智能音箱被唤醒后立即接收用户发出的需求语音。例如，需求语音可以是“我想知道杭州未来七天的天气预报”、“请讲出李白的诗词”、“请求茄子焖饭的菜谱”等。由于智能音箱与服务器建立网络连接需要一段时间，所以，在这段时间内，智能音箱可以将接收的需求语音压缩存储。当然，智能音箱与服务器建立连接之后，用户可能还在继续发出需求语音，此时，智能音箱将后续实时接收到的需求语音和之间压缩存储的需求语音打包发送至服务器。例如，在智能音箱与服务器连接完成之前，智能音箱所需要缓存并压缩的是0-3秒的需求语音。由于提前缓存了部分需求语音，所以并不会造成接收需求语音延时，与不会造成需求语音延时发送至服务器，不会受到智能音箱和服务器之间建立连接所花费时间(例如，大约0-3秒)的影响，不影响用户体验。

服务器接收到需求语音之后，对需求语音进行语音识别，得到需求信息。服务器根据需求信息检索出对应的回复信息，将回复信息返回至音箱中。音箱中的语音播报模块可以将回复信息转换为回复语音，进行播报。例如，对应于前述的需求语音，回复语音可以是“杭州天气下周一阴转多云……”、“将进酒，君不见，黄河之水天上来……”、“茄子、酱油、葱花…….”。

音箱播报了回复语音之后，音箱中的计时器可以立即开始计时。在计时之前，用户可以根据需求设置时间长度，完成预设时间段的设置。计时器实时记录预设时间段的长度。若在预设时间段之内，音箱并未检测到任何语音，例如，并未检测到音箱继续播报的回复语音，并未检测到用户发出的需求语音，并未检测到用户发出用于唤醒音箱的唤醒语音等，则断开音箱与服务器的网络连接，使得音箱处于低功耗模式下。在低功耗模式下，大大延长了利用电池供电的音箱的待机功耗，从而让智能音箱能够长时间待机，音箱可以不用长时间插电源，也可以不用更换位置之后，还要重新插电，满足用户随意挪动使用音箱的需求，在保证唤醒功能体验不降低的情况下，极大提升音箱使用的便利性和自由度。

在一种实施方式中，如图2所示，步骤s10之前，还包括：

步骤s01：接收唤醒语音；

步骤s02：根据唤醒语音控制语音设备处于唤醒状态。

在一种示例中，智能音箱中可以设置有(dsp数字信号处理器，digitalsignalprocessing)、主控芯片和语音播放装置。dsp不仅接收用户发出的唤醒语音，还能够检测唤醒语音中的唤醒词，例如，唤醒语音可以是“小度、小度”等，唤醒词为“小度”。dsp还可以根据唤醒词生成第一控制信号，例如高电平，并将高电平发送至音箱中的主控芯片，第一控制信号用于唤醒主控芯片进入正常工作模式，进而使得主控芯片处于唤醒状态。

此外，主控芯片进入正常工作模式后，在主控芯片与服务器建立连接的时间段内，dsp还可以接收用户在发出唤醒语音之后随即发出的需求语音，并将这段时间内接受的需求语音压缩存储。当然，主控芯片与服务器建立连接之后，用户可能还在继续发出需求语音，此时，主控芯片将后续实时接收到的需求语音和之间压缩存储的需求语音打包发送至服务器。语音播放装置根据服务器返回的信息播放与需求语音对应的回复语音。若在预设时间段内，dsp没有检测到语音，dsp可生成第二控制信号，例如低电平，并将低电平发送至主控芯片，第二控制信号用于控制主控芯片进入休眠模式，断开根据断开与服务器的网络连接，使得音箱进入低功耗模式。经过测试发现，在低功耗模式下，主控芯片的电流可以从100-200ma降低到2ma，智能音箱的整体待机电流从140-240ma降低到42ma，按照2000毫安时电池计算，根据本实施例提供的方法使得智能音箱，可以待机运行2-3天时间。

在一种实施方式中，如图2所示，步骤s01之后，还包括：

步骤s11：根据唤醒语音生成开启提示播放指令；

步骤s12：根据开启提示播放指令播放开启提示音。

需要指出的是，步骤s11和步骤s12可以在步骤s02之前发生，或者，步骤s11和步骤s12可能与步骤s02同时发生。

在一种示例中，主控芯片被唤醒后，生成开启提示播放指令，并将开启提示播放指令发送至音箱中的语音播放装置。语音播放装置可以选择对应的声音播放开启提示音，开启提示音是指音箱从休眠模式或者关闭模式进入正常工作模式的提示音，例如，唤醒语音是“小度、小度”，开启提示音可以是“小度很高兴为您服务”等。音箱处于低功耗状态情况下，用户唤醒音箱后，音箱立刻播放开启提示音，从用户角度看，开启提示音并没有发生延时。

在一种实施方式中，如图2所示，步骤s10，包括：

步骤s101：根据唤醒语音生成联网请求信息；

步骤s102：将联网请求信息发送至网关设备，联网请求信息用于指示网关设备根据联网请求信息与服务器建立无线网络连接；

步骤s103：接收服务器经过网关设备返回的联网成功信息。

在一种示例中，主控芯片被唤醒后，使得主控芯片在正常工作模式情况下，通过无线连接信号建立主控芯片和服务器之间的联系。具体的，可以在音箱播放开启提示音时，主控芯片生成联网请求信息。之后将联网请求信息发送至网关设备，例如路由器，路由器发送联网请求信息至服务器，请求联网，服务器将联网成功的信息返回至路由器，路由器再将联网成功的信息返回至主控芯片，表明主控芯片与服务器连接成功，可以传输数据。例如，在语音设备处于唤醒状态下，大约0-3秒内，语音设备与服务器建立网络连接。

在一种实施方式中，如图3所示，步骤s50之前，还包括：

步骤s60：将回复语音的结束时间点设置为预设时间段的起点，根据预设条件设置预设时间段的长度，预设条件包括语音设备使用频率。

在一种示例中，预设时间段的长度根据用户需求进行动态调整。可以有两种情况。第一种情况是高峰期，例如大多数用户会在早上和晚上的特定时间段，使用音箱的频率较高，可以将预设时间段设置较长时间。例如，音箱在发出回复语音开始，20分钟后，若用户并未使用音箱，则进入休眠模式。第二种情况是低峰期，例如大多数用户会在晚上睡觉之后和白天上班期间，使用音箱的频率较低，可以将预设时间段设置较短时间。例如，音箱在发出回复语音开始，5分钟后，若用户并未使用音箱，则进入休眠模式。若音箱被用户唤醒，或者音箱播放声音资源如音乐天气等，继续使用音箱的情况下，结束计时。

在一种实施方式中，还包括：

步骤s41：根据服务器返回的信息播放与需求语音对应的图像或视频。

在一种示例中，服务器接收到需求语音之后，对需求语音进行语音识别，得到需求信息。服务器根据需求信息检索出对应的回复信息，将回复信息返回至音箱中。音箱可以设置有显示器，用于显示与回复信息对应的图像或视频。例如，显示的图像可以是杭州天气下周的天气预报动图，李白吟诗的动画，或者一档美食节目，主持人和嘉宾在做茄子焖饭的视频。

实施例二

在另一种具体的实施方式中，如图4所示，提供了一种语音设备控制装置，包括：

网络连接模块10，用于在语音设备处于唤醒状态下，与服务器建立网络连接；

需求语音接收模块20，用于接收需求语音；

需求语音发送模块30，用于将需求语音发送至服务器；

回复语音播放模块40，用于根据服务器返回的信息播放与需求语音对应的回复语音；

网络断开模块50，用于若在预设时间段内没有检测到语音，则断开与服务器的网络连接。

在一种实施方式中，如图5所示，所述装置还包括：

唤醒语音接收模块11，用于接收唤醒语音；

唤醒状态控制模块12，用于根据唤醒语音控制语音设备处于唤醒状态。

在一种实施方式中，如图6所示，所述装置还包括：

开启提示播放指令生成模块13，用于根据唤醒语音生成开启提示播放指令；

开启提示播放模块14，用于根据开启提示播放指令播放开启提示音。

在一种实施方式中，如图5所示，网络连接模块10包括：

联网请求信息生成单元101，用于根据唤醒语音生成联网请求信息；

联网请求信息发送单元102，用于将联网请求信息发送至网关设备，联网请求信息用于指示网关设备根据联网请求信息与服务器建立无线网络连接；

联网成功信息接收单元103，用于接收服务器经过网关设备返回的联网成功信息。

在一种实施方式中，如图6所示，所述装置还包括：

预设时间段设置模块60，用于将回复语音的结束时间点设置为预设时间段的起点，根据预设条件设置预设时间段的长度，预设条件包括设备使用频率。

在一种实施方式中，所述装置还包括：

图像视频播放模块，用于根据所述服务器返回的信息播放与所述需求语音对应的图像或视频。

实施例三

本发明实施例提供了一种语音设备控制终端，如图7所示，包括：

存储器400和处理器500，存储器400内存储有可在处理器500上运行的计算机程序。处理器500执行所述计算机程序时实现上述实施例中的语音设备控制方法。存储器400和处理器500的数量可以为一个或多个。

通信接口600，用于存储器400和处理器500与外部进行通信。

存储器400可能包含高速ram存储器，也可能还包括非易失性存储器(non-volatilememory)，例如至少一个磁盘存储器。

如果存储器400、处理器500以及通信接口600独立实现，则存储器400、处理器500以及通信接口600可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(isa，industrystandardarchitecture)总线、外部设备互连(pci，peripheralcomponent)总线或扩展工业标准体系结构(eisa，extendedindustrystandardcomponent)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图7中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果存储器400、处理器500以及通信接口600集成在一块芯片上，则存储器400、处理器500及通信接口600可以通过内部接口完成相互间的通信。

实施例四

一种计算机可读存储介质，其存储有计算机程序，所述程序被处理器执行时实现如实施例一包括的任一所述的语音设备控制方法。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(ram)，只读存储器(rom)，可擦除可编辑只读存储器(eprom或闪速存储器)，光纤装置，以及便携式只读存储器(cdrom)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据语音实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器，磁盘或光盘等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到其各种变化或替换，这些都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘智宇
技术所有人：百度在线网络技术（北京）有限公司
我是此专利的发明人

上一篇：一种模特模型手臂及模特模型的制作方法
上一篇：机箱支架及电器设备的制作方法