语音唤醒方法、装置及电子设备与流程

文档序号:17152544发布日期:2019-03-19 23:34阅读:328来源:国知局
语音唤醒方法、装置及电子设备与流程

本申请主要涉及通信技术领域,更具体地说是涉及一种语音唤醒方法、装置及电子设备。



背景技术:

如今,为了提高用户使用手机、笔记本以及掌上电脑等电子设备的便利性,很多电子设备上具有语音识别能力,用户可以输出唤醒词来唤醒电子设备及其包含的应用,如a音箱,用户可以说“你好a”,启动a音箱,并唤醒a音箱的语音识别引擎(如语音助手),此时,用户说“播放xx的歌曲”,语音助手能够自动识别该语音信号包含的语音控制指令,并通过执行语音控制指令,自动控制a音箱播放xx的歌曲,无需用户手动操作,非常方便。

申请人注意到,在实际应用中,通常都需要用户先输入主唤醒词,唤醒电子设备的语音助手,才能继续输入包含语音控制指令的语音信号,非常麻烦,语音唤醒灵活性差。

申请内容

有鉴于此,本申请提供了一种语音唤醒方法、装置及电子设备,解决了现有技术无论什么情况下,都必须输入主唤醒词,才能够唤醒语音识别引擎,导致语音唤醒灵活性差,过程复杂的技术问题。

为了实现上述申请目的,本申请提供了以下技术方案:

本申请提供了一种语音唤醒方法,所述方法包括:

获得第一唤醒词;

如果电子设备的应用场景满足预定条件,响应所述第一唤醒词,唤醒语音识别引擎,所述语音识别引擎至少用于识别语音;

其中,所述语音识别引擎能够基于主唤醒词唤醒,所述主唤醒词与所述第一唤醒词不同。

可选的,所述电子设备的应用场景不满足预定条件,不响应所述第一唤醒词。

可选的,针对所述电子设备的不同应用场景,配置有对应的不同的唤醒词;

如果获得所述主唤醒词,则直接响应所述主唤醒词,唤醒所述语音识别引擎。

可选的,所述第一唤醒词既是唤醒词又是控制指令;或/和,

所述第一唤醒词为多个,多个第一唤醒词为第一应用的操作指令,所述第一应用是具有与所述多个第一唤醒词对应的应用场景的任一应用。

可选的,所述预定条件包括如下至少一种:

电子设备中的一应用处于预定应用场景下运行;

预定器件处于工作状态,所述预定器件用于识别预定应用场景。

可选的,所述获得第一唤醒词,包括:

接收声音采集器采集到的语音信号;

根据所述语音信号的声学特征,计算所述语音信号与预存的词序列的相似度,每一组词序列对应一个唤醒词,且所述词序列基于对应唤醒词的音素生成;

基于得到的相似度,得到所述语音信号包含的第一唤醒词。

可选的,所述方法还包括:

获取第一应用场景下输入的控制信息,并基于深度学习算法,从所述控制信息中提取满足指定条件的词,并将提取出的词确定为所述第一应用场景对应的唤醒词;和/或,

接收针对电子设备的第一应用场景输入的控制指令,并将所述控制指令确定为所述第一应用场景对应的唤醒词;和/或,

获取电子设备的第一应用场景下的默认控制指令,并将所述默认控制指令确定为所述第一应用场景对应的唤醒词。

可选的,所述基于深度学习算法,从所述控制信息中提取满足指定条件的词,包括:

统计所述控制信息包含的多个词分别对应的词频;

利用深度学习算法,对所述多个词分别对应的词频进行调整;

基于所述多个词分别对应的调整后的词频大小,选择第一数量个词频较大的词。

本申请还提供了一种语音唤醒装置,所述装置包括:

唤醒词获得模块,用于获得第一唤醒词;

第一唤醒模块,用于在电子设备的应用场景满足预定条件的情况下,响应所述第一唤醒词,唤醒语音识别引擎,所述语音识别引擎至少用于识别语音;

其中,所述语音识别引擎能够基于主唤醒词唤醒,所述主唤醒词与所述第一唤醒词不同。

本申请还提供了一种电子设备,包括:

声音采集器;

存储器,用于存储实现如上所述的语音唤醒方法的程序;

控制器,用于加载并执行所述存储器存储的程序,所述程序用于:

获得第一唤醒词;

如果电子设备的应用场景满足预定条件,响应所述第一唤醒词,唤醒语音识别引擎,所述语音识别引擎至少用于识别语音;

其中,所述语音识别引擎能够基于主唤醒词唤醒,所述主唤醒词与所述第一唤醒词不同。

由此可见,与现有技术相比,本申请提供了一种语音唤醒方法、装置及电子设备,在电子设备处于某应用场景下工作的情况下,除了能够利用主唤醒词,唤醒语音识别引擎外,本实施例还能够在电子设备的应用场景满足预定条件,通过响应获得的第一唤醒词,唤醒语音识别引擎,实现对电子设备的语音控制,提高了电子设备语音唤醒功能的灵活性和多样性,且相对于传统方案先输入主唤醒词,再输入第一唤醒词包含的控制指令,才能够控制电子设备执行该控制指令的操作过程,本实施例只需要输入第一唤醒词,简化了语音控制步骤。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1a为现有的一种语音唤醒方法的场景示意图;

图1b为本申请实施例提供的一种语音唤醒方法的场景示意图;

图2为本申请实施例提供的一种语音唤醒方法的流程示意图;

图3为本申请实施例提供的一种语音唤醒方法中,获得第一唤醒词的方法流程示意图;

图4为本申请实施例提供的一种语音唤醒方法的场景流程示意图;

图5为本申请实施例提供的另一种语音唤醒方法的流程示意图;

图6为本申请实施例提供的另一种语音唤醒方法的流程示意图;

图7为本申请实施例提供的一种语音唤醒方法中,配置不同应用场景对应的唤醒词的过程示意图;

图8为本申请实施例提供的另一种语音唤醒方法中,配置不同应用场景对应的唤醒词的过程示意图;

图9为本申请实施例提供的一种语音唤醒方法中,唤醒语音识别引擎并切换应用场景的示意图;

图10为本申请实施例提供的一种语音唤醒装置的结构示意图;

图11为本申请实施例提供的另一种语音唤醒装置的结构示意图;

图12为本申请实施例提供的一种电子设备的硬件结构示意图。

具体实施方式

本申请的申请人发现:目前市场上的如智能家居设备、智能手机、ipad、笔记本电脑等电子设备中,通常会设置语音助手,并配置有对应的唤醒词(本申请可以将其记为主唤醒词),来唤醒电子设备的语音助手。用户要使用电子设备的语音控制功能,必须先说该主唤醒词,来唤醒电子设备的语音助手,在电子设备的某些应用场景下使用比较麻烦。

举例说明,参照图1a所示的场景示意图,在电子设备处于音乐应用场景下熄屏后,电子设备仍然在播放音乐,此时若用户希望改变播放内容,就必须先说主唤醒词(如你好,a),来重新触发电子设备进入工作状态,唤醒电子设备的语音助手,之后,用户说“播放下一首”,电子设备才能够识别并执行,切换到下一首歌曲播放,过程比较麻烦。

为了改善上述问题,申请人提出,在电子设备处于应用场景下工作,如图1b所示的音乐场景下的语音唤醒方法的流程示意图,希望不用先说主唤醒词,如“你好,a”,用户直接说如“播放下一首”这一语音信号,就能够直接唤醒电子设备的语音助手,同时,还能够执行该语音内容中包含的语音控制指令,如切换到下一首歌曲播放,从而达到提高电子设备的语音唤醒功能的灵活性和多样性的目的,提高用户使用电子设备语音助手功能的感受。

基于上述构思,申请人提出了一种语音唤醒方法,可以预先针对电子设备的不同应用场景,如音乐场景、视频场景、天气场景等,配置一组次唤醒词(其可以包括一个或多个次唤醒词),这样在实际应用中,若电子设备处于该应用场景下工作,即属于该应用场景的一应用处于运行状态,用户除了能够使用电子设备的主唤醒词,如上述“你好,a”,来唤醒电子设备的语音助手;还能够直接使用预先配置的,与该应用场景关联的次唤醒词,来唤醒电子设备的语音助手,同时还能够执行该次唤醒词包含的控制指令,提高了电子设备的语音唤醒功能的灵活性和多样性。

基于上文申请人提出的技术方案构思,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

参照图2,为本申请实施例提供的一种语音唤醒方法的流程示意图,该方法可以应用于电子设备,该电子设备能够安装语音识别引擎,即语音助手,以使得用户能够对该电子设备进行语音控制,本申请对该电子设备的具体产品类型不作限定,如图2所示,该方法可以包括但并不局限于以下步骤:

步骤s11,获得第一唤醒词;

本实施例实际应用中,用户需要对电子设备进行语音控制,以使得电子设备实现某一功能应用。通常需要向电子设备输入相应内容的语音信号。若此时电子设备的语音识别引擎(即语音助手)未处于工作状态,可能无法识别该语音信号,因此,在进行语音识别之前,通常需要先唤醒电子设备语音识别引擎。

所以,用户输入的语音信号可以包含预先配置的唤醒词,用来唤醒电子设备的语音识别引擎,以使其能够进行语音识别。

需要说明,对于电子设备的语音识别引擎的唤醒,可以响应主唤醒词实现,也就是说,在电子设备处于各种模式下,用户输入主唤醒词,能够直接唤醒电子设备的语音识别引擎,所以说,该语音识别引擎能够基于主唤醒词唤醒。

本实施例所提出的语音唤醒方法,主要描述的并不是利用主唤醒词来唤醒语音识别引擎,而是希望使用预先配置的次唤醒词,来唤醒该语音识别引擎。因此,本实施例的第一唤醒词与主唤醒词不同,且该第一唤醒词可以是针对电子设备的不同应用场景配置的次唤醒词,本申请对该第一唤醒词的获取方式及其内容不做限定。

步骤s12,如果电子设备的应用场景满足预定条件,响应该第一唤醒词,唤醒语音识别引擎。

继上文描述,本实施例获得的第一唤醒词可以是次唤醒词,而次唤醒词通常是要求电子设备工作在其对应的应用场景下,才能够会被响应,实现对电子设备的语音识别引擎的唤醒。

因此,本实施例获得第一唤醒词后,可以确定该第一唤醒词对应的应用场景,再验证电子设备工作所处的应用场景是否为第一唤醒词对应的应用场景,或者说,验证电子设备是否在第一唤醒词对应的应用场景下工作,或者说,验证是否存在一应用处于第一唤醒词对应的应用场景下运行等等,本申请对如何验证电子设备的应用场景是否满足预定条件的实现方法不作限定。

在本实施实际应用中,步骤s12中电子设备的应用场景可以是第一唤醒词对应的应用场景,此时,在执行步骤s12之前,可以先确定第一唤醒词关联的应用场景;或者该电子设备的应用场景也可以是电子设备当前工作所在的应用场景,步骤s12中的应用场景表示内容不同,预定条件的内容可以相应调整,但验证目的相同,即验证电子设备是否处于第一唤醒词对应的应用场景下工作。

可选的,结合上述分析,由于在实际应用中,随着通信技术的发展,应用(即应用程序app)具有的功能越来越多,用户通过一个应用可以听音乐、看笑话、看小说、听段子、看新闻等,而这些功能操作过程中,所使用的操作指令往往并不一致,因此,并不能直接将这些功能执行场景归为一种应用场景,也就是说,一个应用可能会具有多种应用场景,而如上述分析,本实施例则是针对不同的应用场景,配置对应的唤醒词。基于该应用场景与应用之间的关系,本实施例预先配置的预定条件可以包括以下至少一种,但并不局限于下文列举的内容:

电子设备中的一应用处于预定应用场景下运行,也就是说,该应用处于运行状态,且该应用当前处于该预定应用场景在运行。其中,该预定应用场景具体可以是第一唤醒词对应的应用场景,该第一唤醒词内容不同,该预定应用场景可以相同调整。

电子设备中的预定器件处于工作状态,该预定器件可以用来识别预定应用场景,因此,本实施例可以通过这种方式,验证电子设备是否处于预定应用场景下工作,本申请对不同应用场景下的预定器件类型不做限定。

综上,若电子设备处于某应用场景下工作,除了能够利用主唤醒词,唤醒语音识别引擎外,本实施例能够在获得第一唤醒词后,通过验证电子设备的应用场景满足预定条件,如电子设备处于第一唤醒词对应的应用场景下工作,也能够通过响应该第一唤醒词,唤醒语音识别引擎,实现对电子设备的语音控制,提高了电子设备语音唤醒功能的灵活性和多样性,且相对于传统方案先输入主唤醒词,再输入第一唤醒词包含的控制指令,才能够控制电子设备执行该控制指令的操作过程,本实施例只需要输入第一唤醒词,简化了语音控制步骤。

结合上述实施例描述的语音唤醒方法,本申请的唤醒词实际上可以是语音信号,在上述实施例中获得第一唤醒词过程中,可以利用语音识别技术,来识别输入的语音信号,获得第一唤醒词,本申请对该语音识别过程的具体实现方法不做限定。

其中,将语音信号转换成计算机可读的输入的过程,可以利用语音信号的声学特征实现,如语音信号(即用户的声音信号波)进行识别,得到其包含的音素,相对于是文字拼音的各个字母,如“下一首”这个声音信号,识别得到的音素可以包括x、i、a、y、i、sh、ou,组合得到拼音为xia、yi、shou,再由此生成相应的字/词,下、吓、瞎、夏…;移、已、一、亦…;首、手、收、瘦…;之后,可以组合而成的词序列:下一首、夏已收、下移受…,之后,再将得到的各词序列与预存唤醒词的词序列进行匹配,选择匹配概率最大的因素序列构造的指令句子,为采集到的语音信号包含的第一唤醒词。

可见,在本申请实际应用中,采集到语音信号后,可以对该语音信号进行声学特征提取,得到该语音信号包含的多个音素,之后,基于音素字典,由得到的多个音素组合成至少一个词序列,计算每一个词序列与预存唤醒词的词序列之间的相似度,选择相似度大于阈值的词序列,将选择出的词序列对应的内容确定为第一唤醒词。

基于此,参照图3所示的语音唤醒方法中,唤醒词识别过程可以包括但并不局限于以下步骤:

步骤s21,接收声音采集器采集到的语音信号;

步骤s22,根据所该语音信号的声学特征,计算该语音信号与预存的词序列的相似度;

其中,每一组词序列对应一个唤醒词,且该词序列可以基于对应唤醒词的音素生成,具体实现方法可以参照上文实施例相应部分的描述。

步骤s23,基于得到的相似度,得到语音信号包含的第一唤醒词。

本实施例中,得到的相似度大小,可以由计算得到的分数的数值表示,通常情况下,词序列对应的分数越大,其与预存唤醒词的词序列相似度越高,该词序列对应的内容为唤醒词的概率越大。

作为本申请另一可选实施例,本申请还可以利用语音识别技术,预先训练得到唤醒词识别模型,具体训练方法不做限定,这样,在得到语音信号后,可以直接将其输入唤醒词识别模型,输出结果可以为该语音信号与预存唤醒词的匹配概率,以便由此得知该语音信号是否包含唤醒词,还可以进一步得知该语音信号包含的第一唤醒词的内容,具体实现过程本申请不做详述。

可选的,若本申请为预存的各应用场景对应的唤醒词设置了权重,那么,在计算得到当前采集到的语音信号包含的词序列,与预存唤醒词的词序列之间的相似度(即初始匹配概率)后,还可以计算该相似度与该预存唤醒词的权重的乘积,将得到的数值作为该语音信号与预存唤醒词的匹配概率,之后,再判断该匹配概率是否大于阈值,如果大于,确定用户输入的语音信号包含唤醒词,并识别出了该唤醒词包含的内容。

基于上述分析,在实际应用中,电子设备的声音采集器采集到语音信号后,可以按照上述语音识别方式,从该语音信号中提取第一唤醒词,该过程可以由电子设备的控制系统中专用的控制单元mcu实现,且在如上述第一唤醒词获得过程中,在确定语音信号包含第一唤醒词的同时,还可以得到对应的控制指令,即在将语音信号转换成文字后,可以利用该文字内容,生成电子设备能够识别的控制指令,如二进制编码或字符序列等,将该控制指令发送至电子设备的处理器(如cpu),由该处理器响应控制指令,控制电子设备实现预设操作,如切换到下一首歌曲,查询明天天气并输出等等。

可见,这种语音识别和处理方式,不需要电子设备的处理器对同一语音信号再次进行语音识别,减小了电子设备的计算量,降低了计算压力和功耗。提高了工作效率。

当然,本申请上述控制单元mcu,也可以仅按照上述方式,从采集到的语音信号中,识别出其包含了第一唤醒词,通知电子设备的处理器利用语音识别技术,识别语音信号包含的控制指令,即确定第一唤醒词包含的控制指令,以响应该控制指令,实现预设操作等。本申请对如何获取第一唤醒词,及其包含的控制指令的具体实现方法不做限定。

此外,在实际应用中,电子设备采集到的语音信号除了唤醒词外,还可能包含其他控制指令,为了实现对该语音信号的可靠响应,本申请可以对语音信号进行语义分析,以得到该语音信号包含的所有控制指令,并执行该控制指令,实现预设操作。需要说明,该语义分析过程可以由上述控制单元mcu实现,如在识别唤醒词过程中,得到该语音信号包含的各控制指令,也可以由电子设备的处理器cpu分析得到,本申请对此不做限定。

可选的,结合上文分析,参照图4所示的语音唤醒方法的场景流程示意图,在上述电子设备的应用场景验证过程中,若电子设备的应用场景不满足预定条件,也就是说,电子设备不是在第一唤醒词对应的应用场景下工作,如第一唤醒词与音乐场景对应,而电子设备当前工作在天气场景下,电子设备并不会响应第一唤醒词,也就不能利用该第一唤醒词来唤醒电子设备的语音识别引擎。

可见,本申请提出的语音唤醒方法,解决了设置同一级别的多个唤醒词,与主唤醒词雷系,作为唤醒语音识别引擎的唤醒词使用,容易发生误唤醒的问题,如用户正在听新闻,用户不小心说了“下一首”这个唤醒词,电子设备的语音识别引擎将被唤醒,并中断当前新闻的播放,切换到音乐场景,大大降低了用户使用体验,而本申请提出的语音唤醒方法,即便用户不小心说了“下一首”,因电子设备当前工作的应用场景并不是音乐场景,电子设备不会响应该“下一首”唤醒词,也就不能唤醒语音识别引擎,根本不能通过执行该唤醒词的控制指令,中断新闻播放。

可选的,在本实施例提出的上述情况下,还可以输出相应的提示信息,如唤醒词不匹配等,以使得用户能够依据该提示信息,重新输入新的第一唤醒词,并按照上述方式重新验证;当然,用户也可以直接输入主唤醒词,来唤醒语音识别引擎,本实施例对输出该提示信息后,采用哪种唤醒方式,来唤醒电子设备的语音识别引擎不做限定。

基于上文对本申请提出的语音唤醒方法的技术构思,本申请可以针对电子设备的不同应用场景,配置对应的不同的唤醒词,本实施例将该唤醒词记为次唤醒词,区别于上述主唤醒词,在实际应用中,可以利用主唤醒词,来唤醒语音识别引擎,也可以利用次唤醒词,来唤醒该语音识别引擎,区别在于这两种唤醒词的响应条件不同。

具体的,参照图5所示的语音唤醒方法的流程示意图,如果获得主唤醒词,将直接响应该主唤醒词,唤醒电子设备的语音识别引擎;如果获得次唤醒词,可以按照上文实施例描述的验证方式,验证电子设备是否处于该次唤醒词对应的应用场景下工作,如果是,才会响应该次唤醒词,唤醒电子设备的语音识别引擎。

其中,在确定当前获得的次唤醒词对应的目标应用场景后,直接验证电子设备中当前处于运行状态的应用是否处于该目标应用场景下,即当前是否存在处于目标应用场景下运行的应用,具体的,本申请可以先确定电子设备中当前处于运行状态的目标应用,再验证该目标应用是否处于目标应用场景下运行,具体可以通过检测该目标应用的输出信息,来确定该目标应用是否处于目标应用场景,但并不局限于此。

且对于具有一种应用场景的应用,可以直接验证与当前获得的次唤醒词对应的应用是否处于运行状态,来确定电子设备的应用场景能够是否满足条件等。本申请对如何实现对电子设备的应用场景是否满足预定条件的验证方法不做限定。

应该理解,在上述验证过程中,若电子设备中当前不存在处于运行状态的应用,或者处于运行状态的应用未处于目标应用场景,本实施例均可以认为电子设备的应用场景不满足预定条件,不响应获得的次唤醒词。

由此可见,如图5所示,在电子设备处于某一应用场景下工作,能够使用主唤醒词,或与该应用场景对应的次唤醒词,来唤醒电子设备的语音识别引擎,实现对电子设备语音控制,相对于现有技术只能使用主唤醒词唤醒语音识别引擎的方案,提高了语音唤醒的灵活性和多样性,简化了电子设备处于某一应用场景下工作的语音唤醒的步骤,且通过应用场景是否满足预定条件的验证步骤,保证了语音唤醒功能的可靠性。

需要说明的是,本申请对不同应用场景配置不同的唤醒词的实现方法不作限定,下面将列举出几种实现方式,但并不局限于本文列举的实现方式。

可选的,对于只在一种应用场景下运行的应用,本实施例可以按照这些应用的类型进行划分,将属于同一类型的应用对应于一种应用场景,且该应用场景的内容可以基于应用的该类型确定,如简单版的音乐应用、天气预报应用等,可以确定音乐场景与该音乐应用对应,天气场景与该天气预报应用对应。这种情况下,获得音乐/天气场景对应的唤醒词后,可以直接对该音乐/天气预报应用进行验证,来决定是否响应该唤醒词。

当然,结合上述实施例相应部分的描述,目前市面上的很多应用能够处于不同的应用场景下运行,对于这类应用,并不能简单通过应用类型,来实现应用场景的划分。如某拉雅、某蜓等应用,可以用来播放音乐、播放文学作品、播放段子、播放新闻等,很明显,播放的这几类应用内容,往往不会划分为一个应用场景,所以,本实施例并不能根据应用的应用类型,直接确定该应用所处的应用场景,具体在验证应用场景是否满足预定条件时,往往不能直接验证具有该应用场景的应用是否处于运行状态,因具有唤醒词对应的应用场景的应用当前可能处于运行状态,但其并不是处于该唤醒词对应的应用场景下运行,可见,这种直接验证具有应用场景的应用是否处于运行状态的验证方式并不准确。

由此可见,电子设备中的一应用可能会对应一个或多个应用场景,对于处于不同应用场景的应用,用户输入的操作指令往往不同,如对于音乐场景,输入的操作指令可以是下一首、上一首、暂停、播放等,而对于听书场景中,输入的操作指令往往不会有下一首、上一首,输入的通常是下一篇、上一篇等等,因此,为了保证语音唤醒的可靠性,本申请是针对应用能够运行的每一个应用场景,预先配置生成对应的一个或多个唤醒词,而不是针对每一个应用,配置生成对应的一个或多个唤醒词。基于上述分析,参照图6,为本申请实施例提出的另一种语音唤醒方法的流程示意图,该方法可以应用于电子设备,其可以是上述图1对应的实施例的一种具体实现方法,但并不局限于本实施例描述的这种实现方法,如图6所示,该方法可以包括但并不局限于以下步骤:

步骤s31,获得第一唤醒词;

步骤s32,获取电子设备当前运行的第一应用;

步骤s33,验证该第一应用所处的应用场景是否为与第一唤醒词对应的应用场景,如果否,进入步骤s34;如果是,执行步骤s35;

可选的,结合上文分析,在实际应用中,在执行步骤s31后,也可以获取具有与该第一唤醒词对应的应用场景的至少一个应用,验证该至少一个应用中是否存在处于该应用场景下运行的应用,如果是,执行步骤s35;如果否,进入步骤s34。

其中,与第一唤醒词对应的至少一个应用,都可以处于与第一唤醒词对应的应用场景下运行,因此,该至少一个应用可以共享该第一唤醒词,在该至少一个应用中任一应用处于该应用场景下运行,电子设备都可以响应第一唤醒词,唤醒电子设备的语音识别引擎。

可选的,本实施例可以根据应用的输出信息,来确定该应用所处的应用场景,即通过检测应用当前输出信息的类型,如音乐、天气预报、笑话、文学作品、影视剧等,来确定该应用当前运行在什么应用场景下,但并不局限于这种实现方式。

步骤s34,不响应该第一唤醒词;

这种情况下,电子设备可能不会产生任何反应,或者可能输出唤醒词错误的提示信息,提醒用户重新输入唤醒词等,本申请不作限定。

步骤s35,响应第一唤醒词,唤醒语音识别引擎;

步骤s36,执行该第一唤醒词包含的语音控制指令,控制第一应用执行预设操作。

结合上述分析,第一唤醒词既可以是唤醒词,又可以是控制指令,也就是说,本实施例的第一唤醒词具有多种功能,在满足一定条件的情况下,既可以用来唤醒电子设备的语音识别引擎,又因其是针对应用场景下的应用配置生成的,可以用来对该应用进行语音控制。

如电子设备处于音乐场景下,获得的第一唤醒词是适用于该音乐场景的唤醒词,如“下一首”,按照上文描述的方式进行验证后,电子设备能够响应该“下一首”唤醒词,此时,不仅能够直接唤醒电子设备的语音识别引擎,还能够执行播放“下一首”这一语音控制指令,控制电子设备的音乐播放器切换到下一首音乐播放,简化了唤醒语音识别引擎,切换到下一首歌曲播放的操作步骤,提高了用户体感。

可选的,对于本申请的第一唤醒词,其数量可以是多个,也就是说,适用于同一应用场景下的唤醒词可以有多个,这多个第一唤醒词可以是属于该应用场景下的任一应用的操作指令,即本申请可以利用一应用场景下的各应用的操作指令,来生成适用于该应用场景的第一唤醒词,该第一唤醒词的具体生成过程不做限定。

作为本申请另一可选实施例,结合上述实施例相应部分的描述,在获得第一唤醒词后,关于验证电子设备的应用场景是否满足预定条件的实现方法,并不局限于验证电子设备中是否存在一应用处于第一唤醒词对应应用场景下运行的方式,还可以验证电子设备的预定器件是否处于工作状态,该预定器件可以用于识别预定应用场景,即电子设备处于获得的第一唤醒词对应的应用场景下工作,独有的标志性的器件,通过该预定器件可以区别电子设备当前工作所处的应用场景,本申请对该预定器件的具体类型不做限定。

可见,在电子设备的某预定器件处于工作状态下,电子设备的语音识别引擎退出工作状态,用户可以输入与该预定器件对应的第一唤醒词,重新唤醒该语音识别引擎,使其进入工作状态,且该预定器件或其对应的应用,还能够执行该第一唤醒词包含的语音控制指令,实现相应的功能,不需要必须输入主唤醒词,来唤醒语音识别引擎,再输入第一唤醒词包含的语音控制指令,简化了操作步骤,提高了语音唤醒的灵活性。

可选的,对于上述各实施例中,针对不同应用场景对应的不同唤醒词,可以采用以下几种方式来配置生成,但并不局限于本文列举的几种实现方式,需要说明,以下几种方式配置生成的唤醒词可以是区别于主唤醒词的次唤醒词,下文不再强度说明。

方式一:按照系统默认规则,划分应用场景,并获取每一应用场景下的常见指令,为适用于该应用场景的唤醒词。

也就是说,本实施例可以根据电子设备能够实现的应用场景,将电子设备中的各应用划分给对应的应用场景,即确定电子设备包含的各应用所属的应用场景,之后,通过统计每一应用场景下的各应用常用的控制指令,确定为该应用场景对应的唤醒词,但并不局限于这种实现方式。

可见,本实施例提供的这种实现方式一,对于同一类型的电子设备,所配置的适用于不同应用场景的唤醒词的数量及内容基本相同,具有一定通用性,但可能无法满足用户的个性化需求。

方式二:区别方式一的通用唤醒词,本实施例可以由用户自定义各应用场景对应的唤醒词。如在电子设备的唤醒词配置界面,可以输出电子设备具有的各应用场景,用户选择某一应用场景,进入唤醒词编辑状态后,可以从备选的多个唤醒词中,直接选择适用于该应用场景的唤醒词,还可以自己编辑唤醒词,满足了用户的个性化需求。

基于此,本实施例可以接收针对电子设备的任一应用场景输入的至少一个唤醒词,并建立该至少一个唤醒词与该应用场景之间的对应关系。

结合上文对第一唤醒词的描述,应该理解,本实施例输入的至少一个唤醒词可以是用户在该应用场景下常用的控制指令。可见,用户可以根据自己习惯或喜好,设定电子设备的各应用场景下,语音识别引擎的次唤醒词,不仅满足了用户个性化需求,且用户对这种方式生成的次唤醒词记忆更加牢固,使用更加方便,提高了语音唤醒效率。

方式三:本实施例可以利用人工智能技术,来配置生成电子设备的不同应用场景对应的唤醒词,具体的,参照图6所示的次唤醒词配置方法,在获得不同场景下,用户输入的控制信息后,可以利用深度学习算法,从每一应用场景对应的控制信息中,提取满足指定条件的词,确定为该应用场景对应的唤醒词,即得到不同应用场景各自对应的次唤醒词。

其中,对于方式三提出的唤醒词配置方法,可以采用如图8所示的流程示意图中的处理步骤,但并不局限于此,如图8所示,本实施例提供的另一种语音唤醒方法中,配置唤醒词的过程可以包:

步骤s41,获取第一应用场景下输入的控制信息;

其中,第一应用场景可以是电子设备能够工作的任一应用场景,通常可以基于该电子设备中的应用当前输出信息的内容确定,本申请对第一应用场景的类型不作限定。

在本实施例实际应用中,该控制信息可以包括:在第一应用场景下,用户针对处于该第一应用场景运行的任一应用输入的控制指令,如音乐场景下,用户针对任一音频应用播放音乐过程中输入的控制指令,如“上一首”、“下一首”、“播放”、“暂停”、“增大/减小音量”等等,输入的控制指令通常包括该应用具有的各操作指令,本申请对该控制信息的内容及其获取方式不做限定。

需要说明,本实施例获取的控制信息,可以是对用户输入的语音信号进行语义分析后,得到的控制指令的集合,而不是用户直接输入的语音信号的集合。

步骤s42,统计该控制信息包含的多个词分别对应的词频;

可选的,在实际应用中,可以通过设置词粒度最小值和最大值,采用分粒度方式统计词频。具体的,在由该最小值和最大值词粒度构成的区间内,确定进行词频统计的词粒度的长度后,可以按照该词粒度的长度对获取的控制信息的文本内容进行分词,再统计分词得到的每个词的词频。本本实施例对该词粒度的长度的具体数值不做限定。

当然,本申请也可以利用已有的字典,对控制信息包含的文本进行分词,以实现词频统计,本申请对如何实现对控制信息包含的每个词的词频的统计方法不做限定。

步骤s43,利用深度学习算法,对这多个词分别对应的词频进行调整;

步骤s44,基于多个词分别对应的调整后的词频大小,选择第一数量个词频较大的词确定为第一应用场景对应的次唤醒词;

可选的,在实际应用中,得到控制信息包含的每个词及其词频后,可以采用一种或多种深度学习算法,对每个词的词频进行调整,如结合该词在文本中的位置信息,对句首词、句中词、句尾词分布设置相应的权重,之后,由该权重与对应词的词频的乘积结果,作为该词的新的词频,之后,对所有词粒度得到的词频进行排序,选择词频最大的n个(即第一数量)词作为当前应用场景对应的次唤醒词。

可见,本实施例得到的每一应用场景对应的次唤醒词的数量可以是n,该n可以是大于0的整数,即适用于一应用场景的次唤醒词的数量可以是一个或多个。如上述分析,若属于该应用场景的应用数量为多个,那么,这多个应用可以共享得到的n个次唤醒词。

举例说明:对于天气场景,按照上述方式,确定的次唤醒词可以包括“明天呢”、“后天呢”,且该天气场景可以对应电子设备中的天气预报软件;音乐场景对应的次唤醒词可以包括“上一首”、“下一首”、“暂停”、“增大/减小音量”等,电子设备中可以设置有如某q音乐软件、某度音乐软件、酷x音乐软件等一个或多个音频软件,结合上文语音唤醒方法的描述,若输入音乐场景对应的任一个次唤醒词,无论电子设备中的哪个音频软件正在播放音乐或处于音乐操作界面运行,都可以响应该次唤醒词,实现对该音乐软件的语音控制。

需要说明,本申请对实现词频调整的深度学习算法的类型及其工作原理不做限定。

步骤s45,创建选择出的次唤醒词第一应用场景的对应关系,并对该对应关系进行存储。

本实施例按照上文描述的方式,确定电子设备具有的每一种应用场景下的次唤醒词后,可以对该次唤醒词进行存储,同时还可以存储确定的次唤醒词与该应用场景之间的对应关系,以便后续再实际语音唤醒应用中,能够将获得的第一唤醒词与存储的次唤醒词进行比对,确定该第一唤醒词对应的应用场景,进而验证电子设备当前工作所处的应用场景是否为第一唤醒词对应的应用场景,也就是验证当前是否满足响应第一唤醒词的条件,具体验证过程可以参照上述实施例相应部分的描述。

由此可见,本实施例针对应用场景生成的次唤醒词既可以是唤醒词也可以是控制指令,因此,可以利用用户输入的历史控制信息,分析得到适用于该应用场景的次唤醒词。且结合上述举例的次唤醒词的内容得知,本实施例确定的次唤醒词可以是属于对应应用场景的应用的操作指令,也就是说,本实施例可以从电子设备中各应用具有的操作指令中,确定该应用所属应用场景的次唤醒词。

其中,应用具有的操作指令可以体现在,该应用的相应场景下的操作界面具有的操作按钮,或电子设备针对应用的机械操作按钮,所以,本实施可以获取各应用具有的操作按钮对应的操作指令,通过对获取的多个操作指令进行统计,可以选择操作频率较大的操作指令作为次唤醒词,即选择词频较大的操作指令(其可以作为一个词)确定为次唤醒词。

进一步地,对于按照上文一种或多种方式,得到的适用于某一应用场景的次唤醒词的数量为多个的情况下,本申请还可以为得到的这多个次唤醒词进行分级设置,即生成对应同一应用场景的多个次唤醒词的优先级,以便按照该优先级实现唤醒词识别。

可选的,对于任一应用场景对应的多个次唤醒词,本实施例可以按照次唤醒词与该应用场景的相关度大小,来设置各次唤醒词权重,相关度越大,所设置的权重越大。当然,本申请也可以自定义调整各次唤醒词的权重,如将用户自定义的次唤醒词的权重设置为最大,则这类次唤醒词的优先级最高等等,本申请对如何设置同一应用场景对应的多个次唤醒词的权重方法不作限定。

其中,关于次唤醒词与应用场景的相关度的计算方法,可以采用相似度算法实现,如余弦相似度算法等等,本申请对此不做限定。在实际应用中,按照上述方式三确定次唤醒词过程中,从控制信息中提取出的每一个词,通常会有相应的分数,因此,对于这类次唤醒词,本实施例可以由该分数大小,来表示相应次唤醒词与应用场景之间的相关度,通常分数越大,可以表示该次唤醒词与应用场景的相关度越大,所设置的权重往往也越大,但并不局限于这种相关度和权重的获取方法,且本申请对每一应用场景对应的多个次唤醒词各自的权重数值也不做限定。

应该理解,在实际应用中,次唤醒词的优先级越高,该次唤醒词被识别的效率越高,所以,本申请通常会使用优先级较高的次唤醒词,实现对语音识别引擎的唤醒。

且,通常情况下,为了唤醒语音识别引擎,实现对电子设备的语音控制,用户输入的唤醒词通常为一个,如一个主唤醒词或次唤醒词,通常不会在一个语音信号中包含多个次唤醒词。但是,一个语音信号中可以同时包括一个主唤醒词和一个次唤醒词,这种情况下,次唤醒词相当于语音控制指令,电子设备可以先响应主唤醒词,唤醒语音识别引擎,再响应该次唤醒词,控制电子设备执行相应操作,如实现电子设备的应用场景的切换等。

在本申请又一可选实施例中,本申请可以对应用场景对应的次唤醒词设置有效时长,一旦电子设备处于该应用场景下连续工作的时间超过该有效时长,那么,即便用户输入该应用场景下的次唤醒词,电子设备也不再响应该次唤醒词。可见,在这种情况下,不能再使用该次唤醒词来唤醒语音识别引擎,需要用户输入主唤醒词,唤醒电子设备的语音识别引擎。

基于此,在上述各实施例的基础上,本申请还可以对电子设备切换到任一应用场景工作进行计时,得到电子设备在该应用场景下连续工作的工作时长,并验证该工作时长是否超过预设时长(即上述有效时长),如果超过,电子设备再获得次唤醒词,不需要再进行应用场景是否满足预定条件的验证,将直接不响应该次唤醒词,降低了电子设备的计算压力。

可选的,若对于同一应用场景的次唤醒词数量为多个,且预先设置了这多个次唤醒词的优先级,并用各次唤醒词的分数大小来表示优先级高低,具体实现如上述实施例相应部分的描述,在工作时长超过预设时长的情况下,本实施例还可以调整该应用场景对应的这多个次唤醒词的分数,如调整这多个次唤醒词的权重系数等等,来调整这多个次唤醒词的优先级,该调整过程可以是在电子设备的后台实现,具体实现过程不做限定。

进一步地,本申请还可以为各应用场景对应的次唤醒词,设置启用概率,且该启动概率可以动态调整,如电子设备当前工作所在的应用场景对应的次唤醒词的启用概率最大,这样,在获得第一唤醒词后,可以直接验证该第一唤醒词对应的应用场景是否为电子设备当前工作所处的应用场景,避免在给该验证结果为否的情况下,误响应该第一唤醒词。

基于此,在上述确定工作时长超过预设时长的情况下,本实施例还可以降低电子设备当前工作所处的应用场景对应的次唤醒词的启动概率,甚至将该启动概率调整为0,即设置对这些次唤醒词的使用权限,限制电子设备响应获得的这些次唤醒词,使得电子设备需要响应主唤醒词,来实现语音识别引擎的唤醒功能,减少了响应次唤醒词的控制程序始终处于工作状态,对资源的占用,降低了功耗。

另外,在电子设备进行应用场景切换的情况下,如在处于a应用场景下的运行的a应用的操作界面,用户可以输入具有b应用场景的b应用的启动指令(此时也可以输入a应用切换到b应用场景下运行的切换指令),这样,电子设备响应该启动指令,可以从a应用切换到b应用运行,且b应用会进入b应用场景下运行,在完成电子设备的应用场景的切换后,本实施例可以对这两个应用场景分别对应的次唤醒词的启用概率进行动态调整,即降低a应用场景对应的次唤醒词的启用概率,增大b应用场景对应的次唤醒词的启用概率,以使后续再获得第一唤醒词后,能够快速识别出该第一唤醒词是哪个应用场景下的次唤醒词,提高工作效率。

基于上述各实施例对语音唤醒方法的描述,为了更加清楚说明该方法的技术方案,下面将以具体使用场景为例进行说明,但并不局限于本文举例的使用场景。

参照图1b所示的音乐场景下的语音唤醒方法的流程示意图,用户向电子设备输入主唤醒词,“你好,a”,唤醒电子设备的语音识别引擎后,输入“播放音乐”这一语音信号,将启动电子设备的音乐软件运行,并由该音乐软件自动播放音乐,使得电子设备的音乐软件处于音乐场景下工作。在音乐播放过程中,电子设备处于静置状态一段时间,往往会锁屏,如图1b中间示意图,电子设备的屏幕关闭,这可以不影响电子设备的音乐播放,但其语音识别引擎可能已退出工作状态,若用户希望对音乐软件进行语音控制,需要重新唤醒电子设备的语音识别引擎。

此时,若用户希望播放下一首歌曲,由于“下一首”已经预先设置成为电子设备音乐场景下的次唤醒词,所以,用户可以直接说“播放下一首”,电子设备确定从中识别到“下一首”这个次唤醒词,且电子设备当前仍处于音乐模式下工作,可以直接响应“下一首”,唤醒电子设备的语音识别引擎,并由该语音识别引擎或处理器(cpu)执行下一首控制指令,控制音乐软件播放下一首歌曲。

其中,若用户输入“换下一首,播放周xx的xxx歌”,由于此时电子设备仍处于音乐场景下,除了会按照上述方式唤醒电子设备的语音识别引擎外,还能够得到其他控制指令,并执行,如查找周xx的xxx歌,并在切换到下一首时播放查找到的歌曲。

同理,若用户希望对音乐软件进行其他操作,且该操作的指令已经预先设置为该音乐场景下的次唤醒词,就可以按照上述切换到下一首歌曲的操作方法进行处理,本申请不再一一详述。

另外,在电子设备处于音乐场景下工作,若用户输入的语音信号未包含唤醒词,或者是包含的唤醒词不是音乐场景对应的唤醒词,电子设备不会响应从语音信号中识别出的唤醒词,从而避免了处于同一级别的不同应用场景对应的唤醒词之间的误响应,提高了电子设备的语音唤醒可靠性。

还有,若用户需要电子设备切换到其他应用场景工作,通常也需要先唤醒电子设备的语音识别引擎,再响应切换应用场景的控制指令,该过程对语音识别引擎的唤醒,可以利用主唤醒词实现,也可以利用当前工作所处的应用场景对应的次唤醒词实现,本申请对此不做限定。

参照图9,如在电子设备播放音乐过程中,用户输入“你好a,给我讲个笑话”,利用“你好a”这个主唤醒词,可以唤醒电子设备的语音识别引擎,从“给我讲个笑话”这个语音信号中,可以得到应用场景切换指令,如得到控制音频应用(可以是上述音乐软件,也可以是其他音频软件)并进入笑话操作界面,播放笑话的控制指令,响应该控制指令,可以控制电子设备从音乐场景切换到笑话场景,这种情况下,用户再输入音乐场景对应的次唤醒词,无法再唤醒语音识别引擎,需要输入笑话场景对应的次唤醒词,才能够唤醒语音识别引擎,保证了语音唤醒功能的可靠性,避免了语音控制的误操作带来的不便。

基于上段描述的语音唤醒过程,同一应用可能会存在多种应用场景,不同应用场景对应的唤醒词通常不同,所以说,同一应用可能会对应多组唤醒词,每一组唤醒词对应一种应用场景。如上述分析,本实施例可以通过检测当前运行的应用的输出信息,来确定当前运行的应用所处的应用场景,即确定电子设备当前工作所处的应用场景。基于此,在上述举例中,获得“下一首”这个次唤醒词后,可以检测电子设备当前运行的音乐软件的输出信息是否为音乐信息,如果是,响应该次唤醒词,唤醒语音识别引擎,并播放下一首歌曲。

参照图10,为本申请实施例提供的一种语音唤醒装置的结构示意图,该装置可以应用于电子设备,该装置可以包括但并不局限于以下组成结构:

唤醒词获得模块11,用于获得第一唤醒词;

可选的,如图11所示,该唤醒词获得模块11可以包括:

语音信号接收单元111,用于接收声音采集器采集到的语音信号;

相似度计算单元112,用于根据所述语音信号的声学特征,计算所述语音信号与预存的词序列的相似度,每一组词序列对应一个唤醒词,且所述词序列基于对应唤醒词的音素生成;

唤醒词获得单元113,用于基于得到的相似度,得到所述语音信号包含的第一唤醒词。

第一唤醒模块12,用于在电子设备的应用场景满足预定条件的情况下,响应所述第一唤醒词,唤醒语音识别引擎,所述语音识别引擎至少用于识别语音;

其中,所述语音识别引擎能够基于主唤醒词唤醒,所述主唤醒词与所述第一唤醒词不同,该第一唤醒词可以是针对应用场景配置的次唤醒词,也就是说,针对电子设备的不同应用场景,可以配置对应的不同唤醒词,关于主唤醒词和次唤醒词的描述可以参照上文方法实施例相应部分的记载。

本申请中,上述第一唤醒词既是唤醒词又是控制指令;或/和,第一唤醒词为多个,多个第一唤醒词可以是第一应用的操作指令,该第一应用是具有与所述多个第一唤醒词对应的应用场景的任一应用,该操作指令可以是第一应用处于该应用场景下具有的操作指令,本申请对第一唤醒词包含的内容不做限定。

在实际应用中,上述第一唤醒模块12还可以用于在电子设备的应用场景不满足预定条件的情况下,不响应第一唤醒词。

其中,该预定条件可以包括如下至少一种:

电子设备中的一应用处于预定应用场景下运行;

预定器件处于工作状态,所述预定器件用于识别预定应用场景。

关于电子设备的应用场景是否满足预定条件的验证过程,可以参照上述方法实施例相应部分的描述。

可选的,如图11所示,该装置还可以包括:

第二唤醒模块13,用于在获得主唤醒词的情况下,直接响应所述主唤醒词,唤醒所述语音识别引擎。在上述各实施例的基础上,为了获得各应用场景分别对应的唤醒词,该装置还可以包括:

第一配置模块,用于获取第一应用场景下输入的控制信息,并基于深度学习算法,从所述控制信息中提取满足指定条件的词,并将提取出的词确定为所述第一应用场景对应的唤醒词;和/或,

第二配置模块,用于接收针对电子设备的第一应用场景输入的控制指令,并将所述控制指令确定为所述第一应用场景对应的唤醒词;和/或,

第三配置模块,用于获取电子设备的第一应用场景下的默认控制指令,并将所述默认控制指令确定为所述第一应用场景对应的唤醒词。

可选的,上述第一配置模块可以包括:

词频统计单元,用于统计所述控制信息包含的多个词分别对应的词频;

调整单元,用于利用深度学习算法,对所述多个词分别对应的词频进行调整;

选择单元,用于基于所述多个词分别对应的调整后的词频大小,选择第一数量个词频较大的词;

确定单元,用于将选择出的词确定为第一应用场景对应的唤醒词。

关于上述几种配置不同应用场景对应的不同唤醒词的过程,可以参照上述实施例相应部分的描述。本申请实施例还提供了一种存储介质,其上存储有程序,该程序被处理器或控制器执行,实现上述语音唤醒方法的各个步骤。

本申请实施例还提供了一种控制器,用于加载并执行存储器中的程序,实现上述语音唤醒方法的各个步骤。

可选的,该控制器可以电子设备中实现语音唤醒的专用设备,如微控制单元(microcontrollerunit,mcu),即由该微控制单元mcu对采集到的语音信号进行分析,如结合声学模型进行分析,识别该语音信号是否包含唤醒词,还可以进一步生成相应的控制指令,发送至电子设备中的处理器cpu执行控制指令,实现预设操作。

或者,微控制单元mcu仅用来识别语音信号是否包含唤醒词,关于从语音信号中识别并生成控制指令的过程,可以由电子设备中的处理器cpu实现,本申请对此不做限定。参照图12,为本申请实施例提供的一种电子设备的硬件结构示意图,该电子设备可以包括声音采集器21、存储器22和控制器23,其中:

声音采集器21可以用来进行声音采集,得到语音信号,并将该语音信号发送至控制器23进行语音识别处理。本申请对该声音采集器21的数量及类型不做限定。

可选的,为了提高声音采集的可靠性,减小语音识别工作量,本申请可以采用多个声音采集器21实现,如多个麦克风构成的麦克风阵列进行声音采集等等,具体实现过程本实施例不做详述。

存储器21可以用来存储实现上述的语音唤醒方法的程序;

在本实施例实际应用中,该存储器21还可以用来存储预先配置的唤醒词,即该唤醒词与各应用场景的对应关系,语音识别引擎对应的应用程序,根据需要还可以用来存储语音唤醒过程中产生的中间数据等等。

可选的,该存储器可以是计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram),存储器包括至少一个存储芯片。

控制器22可以用于加载并执行所述存储器存储的程序,该程序主要用于:

获得第一唤醒词;

如果电子设备的应用场景满足预定条件,响应所述第一唤醒词,唤醒语音识别引擎,所述语音识别引擎至少用于识别语音;

其中,所述语音识别引擎能够基于主唤醒词唤醒,所述主唤醒词与所述第一唤醒词不同。

关于控制器22执行程序实现语音唤醒的各个步骤,可以参照上述方法实施例相应部分的描述。

可选的,本实施例的控制器22可以是微控制器mcu,这种情况下,该电子设备还可以包括处理器,如cpu等,用来实现对电子设备的语音控制。

另外,关于电子设备的硬件组成,并不局限于上文实施例列举的几部分,还可以包括如显示器、播放器等输出设备,可以根据电子设备的产品类型确定,本申请不再一一详述。

综上,本实施例提供的电子设备,可以利用主唤醒词,随时唤醒语音识别引擎,执行后续采集到的语音控制指令;且,在电子设备处于某应用场景下工作,还可以利用该应用场景对应的次唤醒词,唤醒语音识别引擎,并不局限于主唤醒词,提高了语音唤醒的灵活性和多样性。

且由于次唤醒词只会当电子设备处于对应的应用场景下工作时才会响应,即次唤醒词比主唤醒词的级别低,从而避免了设置与主唤醒词同一级别的多个唤醒词,很容易造成误唤醒的情况发生,提高了语音唤醒的可靠性。

本申请所公开的实施例不同的应用场景具有不同的第一唤醒词(即,次唤醒词)。所述第一唤醒词既是唤醒词也是控制指令,即,每个应用场景下的第一唤醒词就是该应用场景下应用程序的操作控件所指示的意思,例如,音乐场景,音乐场景所对应的至少一个音乐应用程序(网易音乐),该音乐应用程序具有多个操控控件(例如,三角形的图标标识所指示的是播放,两个竖杠的图标标识所指示的是暂停)。每个是每个应用场景下的第一唤醒词就是该应用场景下应用的操作控件所对应的控制指令。例如,音乐场景,音乐场景所对应的至少一个音乐应用程序(网易音乐),三角形的图标标识如果被用户触发则产生播放指令以控制其中的一个歌曲进行输出播放)。所以该音乐场景的第一唤醒词就是“播放”、“暂停”等等。

最后,需要说明的是,关于上述各实施例中,诸如第一、第二等之类的关系术语仅仅用来将一个操作、单元或模块与另一个操作、单元或模块区分开来,而不一定要求或者暗示这些单元、操作或模块之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法或者系统中还存在另外的相同要素。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、电子设备而言,由于其与实施例公开的方法对应,所以描述的比较简单,相关之处参见方法部分说明即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1