语音唤醒方法、装置、设备及存储介质与流程

文档序号：20834842发布日期：2020-05-22 16:44阅读：241来源：国知局

本发明实施例涉及信息处理技术，尤其涉及一种语音唤醒方法、装置、设备及存储介质。

背景技术：

随着智能电子设备的普及，很多电子设备都具有语音唤醒功能。

目前，语音唤醒方法主要是简单地采用基于深度神经网络的唤醒模型，来检测语音中是否含有唤醒词，若检测到唤醒词，则设备被唤醒，否则设备保持静默。该技术方案在安静的场景下表现优异，拥有较低的误唤醒率和较高的唤醒率，但在一些噪声场景下则表现不那么突出，容易出现误唤醒率高或唤醒率低的情况。这些噪声场景主要包括强噪声的卖场、有人说话的办公室、正在播放电视或音乐的房间等，而这些场景在生活中很常见，也给语音唤醒技术提出了挑战。

另外，现有技术中为了追求较低的误唤醒率和较高的唤醒率，必须提高神经网络模型在不同场景下的适应能力，通常是通过改变模型结构和增加模型大小的方法实现，以提高模型对不同场景的适应能力，但由于芯片空间有限，因此，无法实现在不同场景下同时兼顾较高的唤醒率及较低的误唤醒率。

技术实现要素：

本发明实施例提供一种语音唤醒方法、装置、设备及存储介质，以实现在不同场景下同时兼顾较高的唤醒率及较低的误唤醒率。

第一方面，本发明实施例提供了一种语音唤醒方法，包括：

实时获取语音信息，识别所述语音信息对应的环境类型；

根据所述语音信息对应的环境类型从预设的唤醒模型组中，确定目标唤醒模型，所述唤醒模型组中包括至少两个唤醒模型，不同的唤醒模型对应于不同的环境类型；

将所述语音信息输入至所述目标唤醒模型进行唤醒词的检测，并在确定检测到所述唤醒词时执行设备唤醒操作。

第二方面，本发明实施例还提供了一种语音唤醒装置，该装置包括：

环境识别模块，用于实时获取语音信息，识别所述语音信息对应的环境类型；

模型确定模块，用于根据所述语音信息对应的环境类型从预设的唤醒模型组中，确定目标唤醒模型，所述唤醒模型组中包括至少两个唤醒模型，不同的唤醒模型对应于不同的环境类型；

语音检测模块，用于将所述语音信息输入至所述目标唤醒模型进行唤醒词的检测，并在确定检测到所述唤醒词时执行设备唤醒操作。

第三方面，本发明实施例还提供了一种电子设备，该设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本发明实施例中任一所述的语音唤醒方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例中任一所述的语音唤醒方法。

本发明实施例通过实时获取语音信息，识别语音信息对应的环境类型，并根据语音信息对应的环境类型从预设的唤醒模型组中确定目标唤醒模型，进而将该语音信息输入至目标唤醒模型进行唤醒词的检测，并在确定检测到唤醒词时执行设备唤醒操作，利用了根据不同环境选择不同唤醒模型来检测语音信息中的唤醒词的优点，解决了现有技术中由于使用一种模型去适应多种场景，而导致的无法在不同场景下同时兼顾较高的唤醒率及较低的误唤醒率的问题，实现了在不同场景下同时兼顾较高的唤醒率及较低的误唤醒率的效果。

附图说明

图1是本发明实施例一提供的一种语音唤醒方法的流程示意图；

图2a是本发明实施例二提供的一种语音唤醒方法的流程示意图；

图2b是本发明实施例二适用的一种设备唤醒方式的流程示意图；

图3a是本发明实施例三提供的一种语音唤醒方法的流程示意图；

图3b是本发明实施例三适用的一种设备唤醒方式的流程示意图；

图4是本发明实施例三提供的一种语音唤醒装置的结构示意图；

图5是本发明实施例四提供的一种电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的一种语音唤醒方法的流程示意图。该方法可适用于对电子设备进行语音唤醒的情况，该方法可以由语音唤醒装置来执行，该装置可由硬件和/或软件组成，并一般可集成在手机、平板以及所有包含语音唤醒功能的电子设备中。具体包括如下：

s110、实时获取语音信息，识别语音信息对应的环境类型。

本实施例中，语音信息可以是通过设备上自带的或外接的声音采集器(例如麦克风)，采集用户说话的声音而得到的信息。由于用户可能处于不同的场景之中，因此在实时获取的语音信息中会携带有环境声音，可通过该语音信息来识别对应的环境类型。其中，环境类型包括但不限于街道、办公室、房间内、市场等，在此不作限定。具体的，可根据实际需要预先设置几个典型的环境类型，进而根据各环境类型的特征来识别实时获取的语音信息所对应的环境类型。

可选的，实时获取语音信息，包括：对外界环境声音进行语音端点检测；如果确定从外界环境声音中检测到语音信号，则实时获取与语音信号对应的语音信息。

示例性的，可通过vad(voiceactivitydetection，语音端点检测)模块对外界环境声音进行语音端点检测，其目的是为了从声音信号流里识别和消除长时间的静音期，以确定外界环境声音中是否检测到语音信号，在未检测到语音信号时则不进行后续的识别过程，在确定检测到语音信号时，实时获取与语音信号对应的语音信息。具体的，获取语音信息的过程可以是将外界环境声音中的语音信号转换成电子设备能够识别的电压信息或者电流信息的过程。

可选的，实时获取与语音信号对应的语音信息，包括：从检测到语音信号出现前预设时刻开始，实时获取语音信息，直至检测到语音信号消失时或设备已被唤醒时结束。

为了保证获取到所有的语音信息，可在检测到语音信号时向前追溯一段时间，也即检测到语音信号出现前预设时刻开始，实时获取语音信息，并在检测到语音信号消失后结束，或者语音信号消失前设备已被唤醒时结束。

例如，在检测到语音信号的时间点前1s开始，实时获取语音信息，直至语音信号消失，或者设备已被唤醒时结束。

s120、根据语音信息对应的环境类型从预设的唤醒模型组中，确定目标唤醒模型，唤醒模型组中包括至少两个唤醒模型，不同的唤醒模型对应于不同的环境类型。

本实施例中，可针对预设的每一种环境类型分别设置一个对应的唤醒模型。一旦语音信息对应的环境类型确定，则可从包含多个唤醒模型的唤醒模型组中，选择与该环境类型对应的唤醒模型，以基于该环境类型的实际场景下所获取的语音信息进行唤醒词的检测。具体的，唤醒模型组包含的唤醒模型可以是，使用不同场景下获取的包含唤醒词的语音样本，分别对预设的神经网络进行训练得到，其中，该预设的神经网络例如可以是fsmn(feed-forwardsequentialmemorynetwork，前馈型序列记忆网络)。

由于每一种唤醒模型都根据特定场景专门定制的，因此可保证在该特定场景下同时拥有较高的唤醒率和较低的误唤醒率，极大地提高了用户体验。另外，对于每个唤醒模型来说，由于一个模型只需应对一种应用场景，所以其模型大小比多场景混合的唤醒模型更小，节约了芯片的运行空间。

举一个实际例子，若语音信息对应的环境类型为办公室，也即用户发出语音指令时极大可能是处在办公室内，因此，可从预设的唤醒模型组中选择办公室类型对应的唤醒模型，作为目标唤醒模型，以在后续步骤中利用该目标唤醒模型进行唤醒词的检测。

s130、将语音信息输入至目标唤醒模型进行唤醒词的检测，并在确定检测到唤醒词时执行设备唤醒操作。

本实施例中，唤醒词可以是预设的用于唤醒设备的关键词，例如设备名称和/或其与特定词的组合等，在此不作限定。示例性的，各唤醒模型可存储在高功耗芯片上，以提高运行效率。具体的，高功耗芯片上存储了多个对应于不同场景的唤醒模型，根据识别出的环境类型，将调用相对应的目标唤醒模型，而其他唤醒模型保持静默，不占用运行空间。通过目标唤醒模型对传入的语音信息进行唤醒词检测，如果检测到唤醒词，则设备被唤醒，否则设备不会被唤醒。其中，执行设备唤醒操作包括但不限于点亮显示屏，启动解锁识别模块等，在此不作限定。

本实施例的技术方案，通过实时获取语音信息，识别语音信息对应的环境类型，并根据语音信息对应的环境类型从预设的唤醒模型组中确定目标唤醒模型，进而将该语音信息输入至目标唤醒模型进行唤醒词的检测，并在确定检测到唤醒词时执行设备唤醒操作，利用了根据不同环境选择不同唤醒模型来检测语音信息中的唤醒词的优点，解决了现有技术中由于使用一种模型去适应多种场景，而导致的无法在不同场景下同时兼顾较高的唤醒率及较低的误唤醒率的问题，实现了在不同场景下同时兼顾较高的唤醒率及较低的误唤醒率的效果。

实施例二

图2a为本发明实施例二提供的一种语音唤醒方法的流程示意图。本实施例以上述实施例为基础进行优化，提供了优选的语音唤醒方法，具体是，将识别语音信息对应的环境类型进一步优化为，包括：将语音信息实时输入至初步检测模型进行唤醒词的初步检测，同时将语音信息实时输入至环境识别模型中，输出得到语音信息对应的环境类型；相应的，将语音信息输入至目标唤醒模型进行唤醒词的检测，并在确定检测到唤醒词时执行设备唤醒操作进一步优化为，包括：如果初步确定检测到唤醒词，则获取语音信息对应的唤醒词片段；将语音信息对应的唤醒词片段输入至目标唤醒模型进行唤醒词的检测，并在确定检测到唤醒词时执行设备唤醒操作。具体包括如下：

s210、实时获取语音信息，将语音信息实时输入至初步检测模型进行唤醒词的初步检测，同时将语音信息实时输入至环境识别模型中，输出得到语音信息对应的环境类型。

本实施例中，在上述实施例的基础上，增加了一个初步检测唤醒词的过程，也即，在获取到语音信息时，首先将语音信息输入至初步检测模型进行唤醒词的初步检测，其中，由于初步检测是对语音信息进行粗粒度检测，例如将所有疑似唤醒词均判定为唤醒词，以提高设备的唤醒率。在将语音信息输入至初步检测模型的同时，还将语音信息实时输入至环境识别模型中，二者同时进行，可以减少唤醒延迟，保障了唤醒词检测的实时性。其中，环境识别模型可以是在低功耗芯片上增加的一个经训练的小型神经网络模型，用于确定本电子设备所处的使用场景。

示例性的，初步检测模型相较于唤醒模型而言，由于初步检测模型对计算的要求不高，因此，可将初步检测模型设置在低功耗芯片上，作为一级模型，而将唤醒模型组中包括的各个唤醒模型设置在高功耗芯片上，作为二级模型。具体的，初步检测模型可以是使用包含唤醒词的语音样本对预设的神经网络进行训练得到，其中，该预设的神经网络例如可以是dnn(deepneuralnetwork，深度神经网络)、rnn(recurrentneuralnetwork，循环神经网络)等，在此不作限定。

在一个实际例子中，vad模块用于不断对外界环境声音进行检测，如果检测到语音，则从检测语音时间点前固定长度开始实时向一级模型传输采集的音频信息用于唤醒词的初步检测，同时向环境识别模型也实时送入该音频信息用于判断设备当前所处的环境类型。一级模型和环境识别模型采用并联的方式，几乎同时运行，时间效率很高。

s220、根据语音信息对应的环境类型从预设的唤醒模型组中，确定目标唤醒模型，唤醒模型组中包括至少两个唤醒模型，不同的唤醒模型对应于不同的环境类型。

s230、如果初步确定检测到唤醒词，则获取语音信息对应的唤醒词片段。

示例性的，如果经初步检测模型检测到语音信息中包含有唤醒词，则可首先获取语音信息对应的唤醒词片段，其中，唤醒词片段可以是语音信息中包含有唤醒词的语音片段。

可选的，获取语音信息对应的唤醒词片段，包括：确定初步检测到唤醒词的时间点；获取语音信息中时间点前第一预设时间长度至时间点后第二预设时间长度之间的信息片段，作为语音信息对应的唤醒词片段。

其中，第一预设时间长度与第二预设时间长度可以相同，也可以不同，在此不作限定。举一个实际例子，在源源不断的语音信息检测过程中，如果一级模型检测到唤醒词，则截取检测到唤醒词时间点附近(如前后各1.5秒，共3秒)的语音片段，作为该段语音信息的唤醒词片段。需要指出的是，一段语音信息中可包含一个唤醒词片段，也可能包含多个唤醒词片段，在此不作限定。

s240、将语音信息对应的唤醒词片段输入至目标唤醒模型进行唤醒词的检测，并在确定检测到唤醒词时执行设备唤醒操作。

示例性的，针对初步检测时获取的唤醒词片段，可有针对性地对语音信息对应的唤醒词片段进行二次唤醒词识别，其中，由于再次检测是对语音信息中的唤醒词片段进行细粒度检测，例如排除掉所有不是唤醒词的疑似唤醒词，从而可以降低设备的误唤醒率。

在一个实际例子中，将实时获取的音频流传入一级模型进行唤醒词的初步检测，同时将该音频流传入环境类型检测模型进行环境类型的识别，并将检测出的结果用于选取合适的二级模型。如果一级模型检测到唤醒词，则将该段音频流中的唤醒词片段以及环境类型检测结果送入二级模型以选择合适的二级模型对唤醒词片段进行唤醒词的再识别；如果一级模型没有检测到唤醒词，则不会向高功耗芯片传输任何信息，高功耗芯片仍处于静默状态，以节约芯片的运行资源。

在本实施例的基础上，具体可参见图2b中所示的设备唤醒流程示意图，其中，将语音信息实时输入至一级模型进行唤醒词的初步检测过程，与将语音信息实时输入至环境识别模型进行环境类型的识别过程，是同时进行的，也即一级模型与环境识别模型是并联的。

本实施例的技术方案，通过实时获取语音信息，将语音信息实时输入至初步检测模型进行唤醒词的初步检测，同时将语音信息实时输入至环境识别模型中，输出得到语音信息对应的环境类型，根据语音信息对应的环境类型从预设的唤醒模型组中，确定目标唤醒模型，如果初步确定检测到唤醒词，则获取语音信息对应的唤醒词片段，将语音信息对应的唤醒词片段输入至目标唤醒模型进行唤醒词的检测，并在确定检测到唤醒词时执行设备唤醒操作。利用了根据不同环境选择不同唤醒模型来检测语音信息中的唤醒词，并在初步检测的同时进行环境类型的识别的优点，实现了在不同场景下同时兼顾较高的唤醒率及较低的误唤醒率，减少了设备唤醒延迟，保障了设备唤醒的实时性。

实施例三

图3a为本发明实施例三提供的一种语音唤醒方法的流程示意图。本实施例以上述实施例为基础进行优化，提供了优选的语音唤醒方法，具体是，将识别语音信息对应的环境类型进一步优化为，包括：将语音信息实时输入至初步检测模型进行唤醒词的初步检测；如果初步确定检测到唤醒词，则获取语音信息对应的唤醒词片段；将语音信息对应的唤醒词片段输入至环境识别模型中，输出得到语音信息对应的环境类型；相应的，将语音信息输入至目标唤醒模型进行唤醒词的检测，并在确定检测到唤醒词时执行设备唤醒操作进一步优化为，包括：将语音信息对应的唤醒词片段输入至目标唤醒模型进行唤醒词的检测，并在确定检测到唤醒词时执行设备唤醒操作。具体包括如下：

s310、实时获取语音信息，将语音信息实时输入至初步检测模型进行唤醒词的初步检测。

本实施例中，在实施例一的基础上，增加了一个初步检测唤醒词的过程，也即，在获取到语音信息时，首先将语音信息输入至初步检测模型进行唤醒词的初步检测，其中，由于初步检测是对语音信息进行粗粒度检测，例如将所有疑似唤醒词均判定为唤醒词，以提高设备的唤醒率。

示例性的，初步检测模型的相关描述可参考上述实施例二，在此不再赘述。

在一个实际例子中，vad模块用于不断对外界环境声音进行检测，如果检测到语音，则从检测语音时间点前固定长度开始向一级模型传输音频用于唤醒词检测，同时储存一段特定长度的音频用于后续判断设备当前所处场景的环境类型。

s320、如果初步确定检测到唤醒词，则获取语音信息对应的唤醒词片段。

本实施例中，唤醒词片段的获取方式与上述实施例二中相同，在此不再赘述。

s330、将语音信息对应的唤醒词片段输入至环境识别模型中，输出得到语音信息对应的环境类型。

示例性的，环境识别模型的相关描述与上述实施例二中相同，在此不再赘述。其中，由于识别环境类型的过程是在进行唤醒词的初步检测过程之后才进行的，另外，由于低功耗芯片需一直保持运行，因此，本实施例只在该低功耗芯片上运行一个初步检测模型，可以减小芯片的功耗，节约芯片的运行空间。

在一个实际例子中，如果一级模型检测到唤醒词，则将语音信息中的唤醒词片段送入高功耗芯片进行进一步处理，具体的，首先由环境类型检测模型对唤醒词片段进行环境类型识别，判断后续该使用哪一种二级模型，然后，根据检测结果选取合适的二级模型对唤醒词片段进行唤醒词检测，如果检测到唤醒词，则设备被唤醒，否则设备不会被唤醒。

在本实施例的基础上，具体可参见图3b中所示的设备唤醒流程示意图，其中，先将语音信息输入至一级模型进行唤醒词的初步检测，在确定检测到唤醒词时，再将语音信息的唤醒词片段输入至环境识别模型进行环境类型的识别，这两个过程是依次进行的，也即一级模型与环境识别模型是串联的。

s340、根据语音信息对应的环境类型从预设的唤醒模型组中，确定目标唤醒模型，唤醒模型组中包括至少两个唤醒模型，不同的唤醒模型对应于不同的环境类型。

s350、将语音信息对应的唤醒词片段输入至目标唤醒模型进行唤醒词的检测，并在确定检测到唤醒词时执行设备唤醒操作。

本实施例的技术方案，通过实时获取语音信息，将语音信息实时输入至初步检测模型进行唤醒词的初步检测，如果初步确定检测到唤醒词，则获取语音信息对应的唤醒词片段，将语音信息对应的唤醒词片段输入至环境识别模型中，输出得到语音信息对应的环境类型，根据语音信息对应的环境类型从预设的唤醒模型组中，确定目标唤醒模型，将语音信息对应的唤醒词片段输入至目标唤醒模型进行唤醒词的检测，并在确定检测到唤醒词时执行设备唤醒操作。利用了根据不同环境选择不同唤醒模型来检测语音信息中的唤醒词，并在初步确定检测到唤醒词后再进行环境类型的识别的优点，实现了在不同场景下同时兼顾较高的唤醒率及较低的误唤醒率，减少了芯片的功耗，节约了芯片的运行空间。

在上述各实施例的基础上，可选的，还包括：获取具有环境类型标签的环境声音样本；根据环境声音样本以及对应的环境类型标签，对设定神经网络模型进行训练，得到环境识别模型。

示例性的，可针对不同的使用场景设置不同的环境类型，针对不同的环境类型分别采集多个环境声音样本，并附上对应的环境类型标签，在对特定环境类型下的环境识别模型进行训练时，可使用该环境类型标签下的多个环境声音样本，对设定神经网络模型进行训练，当模型参数达到最优时，可将其作为环境识别模型。其中，设定神经网络模型例如可以是rnn模型、dnn模型等，在此不作限定。

实施例四

图4为本发明实施例四提供的一种语音唤醒装置的结构示意图。参考图4，语音唤醒装置包括：环境识别模块410、模型确定模块420以及语音检测模块430，下面对各模块进行具体说明。

环境识别模块410，用于实时获取语音信息，识别所述语音信息对应的环境类型；

模型确定模块420，用于根据所述语音信息对应的环境类型从预设的唤醒模型组中，确定目标唤醒模型，所述唤醒模型组中包括至少两个唤醒模型，不同的唤醒模型对应于不同的环境类型；

语音检测模块430，用于将所述语音信息输入至所述目标唤醒模型进行唤醒词的检测，并在确定检测到所述唤醒词时执行设备唤醒操作。

本实施例提供的语音唤醒装置，通过实时获取语音信息，识别语音信息对应的环境类型，并根据语音信息对应的环境类型从预设的唤醒模型组中确定目标唤醒模型，进而将该语音信息输入至目标唤醒模型进行唤醒词的检测，并在确定检测到唤醒词时执行设备唤醒操作，利用了根据不同环境选择不同唤醒模型来检测语音信息中的唤醒词的优点，解决了现有技术中由于使用一种模型去适应多种场景，而导致的无法在不同场景下同时兼顾较高的唤醒率及较低的误唤醒率的问题，实现了在不同场景下同时兼顾较高的唤醒率及较低的误唤醒率的效果。

可选的，环境识别模块410具体可以包括：

端点检测子模块，用于对外界环境声音进行语音端点检测；

信息获取子模块，用于如果确定从所述外界环境声音中检测到语音信号，则实时获取与所述语音信号对应的语音信息。

可选的，信息获取子模块具体可以用于：

从检测到所述语音信号出现前预设时刻开始，实时获取语音信息，直至检测到所述语音信号消失时或设备已被唤醒时结束。

可选的，环境识别模块410具体还可以用于：

将所述语音信息实时输入至初步检测模型进行唤醒词的初步检测，同时将所述语音信息实时输入至环境识别模型中，输出得到所述语音信息对应的环境类型；

相应的，语音检测模块430具体可以用于：

如果初步确定检测到所述唤醒词，则获取所述语音信息对应的唤醒词片段；

将所述语音信息对应的唤醒词片段输入至所述目标唤醒模型进行唤醒词的检测，并在确定检测到所述唤醒词时执行设备唤醒操作。

可选的，环境识别模块410具体还可以用于：

将所述语音信息实时输入至初步检测模型进行唤醒词的初步检测；

如果初步确定检测到所述唤醒词，则获取所述语音信息对应的唤醒词片段；

将所述语音信息对应的唤醒词片段输入至环境识别模型中，输出得到所述语音信息对应的环境类型；

相应的，将所述语音信息输入至所述目标唤醒模型进行唤醒词的检测，并在确定检测到所述唤醒词时执行设备唤醒操作，包括：

将所述语音信息对应的唤醒词片段输入至所述目标唤醒模型进行唤醒词的检测，并在确定检测到所述唤醒词时执行设备唤醒操作。

可选的，获取所述语音信息对应的唤醒词片段，具体还可以包括：

确定初步检测到所述唤醒词的时间点；

获取所述语音信息中所述时间点前第一预设时间长度至所述时间点后第二预设时间长度之间的信息片段，作为所述语音信息对应的唤醒词片段。

可选的，该装置还可以包括：

样本获取模块，用于获取具有环境类型标签的环境声音样本；

模型训练模块，用于根据所述环境声音样本以及对应的环境类型标签，对设定神经网络模型进行训练，得到所述环境识别模型。

上述产品可执行本发明任意实施例所提供的方法，具备执行方法相应的功能模块和有益效果。

实施例五

图5为本发明实施例五提供的一种电子设备的结构示意图，如图5所示，本实施例提供的一种电子设备，包括：处理器51和存储器52。该电子设备中的处理器可以是一个或多个，图5中以一个处理器51为例，所述电子设备中的处理器51和存储器52可以通过总线或其他方式连接，图5中以通过总线连接为例。

本实施例中电子设备的处理器51中集成了上述实施例提供的语音唤醒装置。此外，该电子设备中的存储器52作为一种计算机可读存储介质，可用于存储一个或多个程序，所述程序可以是软件程序、计算机可执行程序以及模块，如本发明实施例中语音唤醒方法对应的程序指令/模块(例如，附图4所示的语音唤醒装置中的模块，包括：环境识别模块410、模型确定模块420以及语音检测模块430)。处理器51通过运行存储在存储器52中的软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述方法实施例中语音唤醒方法。

存储器52可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据设备的使用所创建的数据等。此外，存储器52可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器52可进一步包括相对于处理器51远程设置的存储器，这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

并且，当上述电子设备所包括一个或者多个程序被所述一个或者多个处理器51执行时，程序进行如下操作：

实时获取语音信息，识别所述语音信息对应的环境类型；根据所述语音信息对应的环境类型从预设的唤醒模型组中，确定目标唤醒模型，所述唤醒模型组中包括至少两个唤醒模型，不同的唤醒模型对应于不同的环境类型；将所述语音信息输入至所述目标唤醒模型进行唤醒词的检测，并在确定检测到所述唤醒词时执行设备唤醒操作。

实施例六

本发明实施例六还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被语音唤醒装置执行时实现如本发明实施例一提供的语音唤醒方法，该方法包括：实时获取语音信息，识别所述语音信息对应的环境类型；根据所述语音信息对应的环境类型从预设的唤醒模型组中，确定目标唤醒模型，所述唤醒模型组中包括至少两个唤醒模型，不同的唤醒模型对应于不同的环境类型；将所述语音信息输入至所述目标唤醒模型进行唤醒词的检测，并在确定检测到所述唤醒词时执行设备唤醒操作。

当然,本发明实施例所提供的一种计算机可读存储介质,其上存储的计算机程序被执行时不限于实现如上所述的方法操作,还可以实现本发明任意实施例所提供的语音唤醒方法中的相关操作。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、闪存(flash)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

值得注意的是，上述语音唤醒装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨程
技术所有人：苏州思必驰信息科技有限公司
我是此专利的发明人