一种开启终端语音识别功能的方法、装置、耳机及终端与流程

文档序号:13007530阅读:208来源:国知局
一种开启终端语音识别功能的方法、装置、耳机及终端与流程

本发明涉及语音识别技术领域,特别涉及一种开启终端语音识别功能的方法、装置、耳机及终端。



背景技术:

随着电子技术和语音识别技术的发展,已经有越来越多的终端具有语音识别功能,例如手机。

虽然上述终端具有了语音识别功能,能够在一定程度上提高终端的使用便捷性,但是,由于终端的语音识别功能一经开启,无论用户是否正在使用该功能,终端均会持续通过麦克风实时地主动获取周围环境中的声音,并当获取到的声音的强度大于阈值时,对获取到的语音进行识别,所以,如果保持终端的语音识别功能处于常开状态,则会造成大量的能量损耗。再加上终端自身的能量限制,所以,现有的具有语音识别功能的终端多是将该功能保持在常关状态,只有在用户通过物理按键或虚拟按键手动开启该功能后,用户才可以正常使用该功能。

而物理按键不仅会占用终端的空间,增加终端体积,从而导致终端不便携带,还会由于多次的物理按压很容易失灵,影响用户的使用,进而降低用户的体验感。而且,当用户双手被占用时,则无法通过物理按键或虚拟按键手动开启终端的语音识别功能,进一步地影响了用户的使用。当然,用户为了防止双手被占用时无法开启终端的语音识别功能以进行语音识别,还可以选择保持终端的语音识别功能常开,可是,正如上文所述,由于终端的能量有限,在该功能大量损耗终端自身能量的情况下,很容易导致终端电量不足而影响终端的使用,进一步影响该功能的使用。

因此,如何在节省终端自身功耗的情况下,提高语音识别功能的使用便捷性,进一步提升用户的体验感是本领域技术人员目前需要解决的技术问题。



技术实现要素:

本发明的目的是提供一种开启终端语音识别功能的方法、装置、耳机及终端,能够在节省终端自身功耗的情况下,提高语音识别功能的使用便捷性,进一步提升用户的体验感。

为了解决上述技术问题,本发明提供了一种通过耳机开启终端语音识别功能的方法,所述通过耳机开启终端语音识别功能的方法包括:

采集语音;

当确定所述语音中包含预设关键词时,向终端发送开启语音识别功能的开启指令以使所述终端进行语音识别。

优选地,在所述向所述终端发送开启语音识别功能的开启指令之后,所述通过耳机开启终端语音识别功能的方法还包括:

响应所述终端发起的建立语音传输链路的请求;

当检测到所述语音传输链路接通时,可通过所述语音传输链路传输语音至所述终端。

优选地,所述通过耳机开启终端语音识别功能的方法还包括:

当检测到所述终端关闭所述语音传输链路时,停止将语音通过所述语音传输链路传输至所述终端。

优选地,所述向所述终端发送开启语音识别功能的开启指令具体为:

通过基于ble协议的指令通道向所述终端发送所述开启指令。

为了解决上述技术问题,本发明还提供了一种通过耳机开启终端语音识别功能的装置,所述通过耳机开启终端语音识别功能的装置包括:

采集模块,用于采集语音;

开启模块,用于当确定所述语音中包含预设关键词时,向终端发送开启语音识别功能的开启指令以使所述终端进行语音识别。

为了解决上述技术问题,本发明还提供了一种耳机,所述耳机包括存储器和处理器,所述处理器通过调用存储于所述存储器中的指令以执行上述任一种通过耳机开启终端语音识别功能的方法。

为了解决上述技术问题,本发明还提供了一种开启终端语音识别功能的方法,所述开启终端语音识别功能的方法包括:

接收耳机发送的开启语音识别功能的开启指令;

开启所述语音识别功能以进行语音识别。

优选地,在所述开启所述语音识别功能后,所述开启终端语音识别功能的方法还包括:

向所述耳机发起建立语音传输链路的请求以建立所述语音传输链路;

通过所述语音传输链路接收所述耳机发送的语音,并进行语音识别。

优选地,在通过所述语音传输链路接收所述耳机发送的语音后,所述开启终端语音识别功能的方法还包括:

当达到预设关闭条件时,断开所述语音传输链路,并关闭所述语音识别功能;

所述预设关闭条件具体包括:

语音的信号强度低于第一预设值且持续时长达到第二预设值;

或语音的信号强度高于第三预设值,且持续时长达到第四预设值;

或得到语音识别结果;

其中,所述第一预设值小于所述第三预设值。

为了解决上述技术问题,本发明还提供了一种开启终端语音识别功能的装置,所述开启终端语音识别功能的装置包括:

接收模块,用于接收耳机发送的开启语音识别功能的开启指令;

开启模块,用于开启所述语音识别功能以进行语音识别。

为了解决上述技术问题,本发明还提供了一种终端,所述终端包括存储器和处理器,所述处理器通过调用存储于所述存储器中的指令以执行上述任一种开启终端语音识别功能的方法。

相对于上述现有技术而言,本发明提供的通过耳机开启终端语音识别功能的方法,包括采集语音,并当确定语音中包含预设关键词时,向终端发送开启语音识别功能的开启指令以使终端进行语音识别。由此可见,该方法可以在终端的语音识别功能处于关闭的状态下,无需手动操作,仅通过包含有预设关键词的语音便可以向终端发送开启语音识别功能的开启指令以开启终端的语音识别功能进行语音识别,因此,本发明提供的方法能够通过耳机进行语音识别,并自动开启终端的语音识别功能,使得终端无需长时间开启语音识别功能,不仅能够降低终端的功耗,而且能够提高用户使用语音识别功能的便捷性,进一步提升用户的体验感。此外,本发明还提供了一种通过耳机开启终端语音识别功能的装置和一种耳机,效果如上。

另外,本发明还提供了一种开启终端语音识别功能的方法,包括接收耳机发送的开启语音识别功能的开启指令;开启语音识别功能以进行语音识别。由此可见,本发明提供的方法可以在终端的语音识别功能处于关闭的状态下,无需手动操作,终端仅通过接收耳机发送的开启指令,便可以开启自身的语音识别功能以进行语音识别。相对于现有技术而言,本方法不仅能够降低终端的功耗,而且能够提高用户使用语音识别功能的便捷性,进一步提升用户的体验感。此外,本发明还提供了一种开启终端语音识别功能的装置和一种终端,效果如上。

附图说明

为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。

图1为本发明实施例提供的一种通过耳机开启终端语音识别功能的方法的流程图;

图2为本发明实施例提供的另一种通过耳机开启终端语音识别功能的方法的流程图;

图3为本发明实施例提供的另一种通过耳机开启终端语音识别功能的方法的流程图;

图4本发明实施例提供的一种通过耳机开启终端语音识别功能的装置的结构图;

图5为本发明实施例提供的一种开启终端语音识别功能的方法的流程图;

图6为本发明实施例提供的另一种开启终端语音识别功能的方法的流程图;

图7为本发明实施例提供的另一种开启终端语音识别功能的方法的流程图;

图8为本发明实施例提供的一种开启终端语音识别功能的装置的结构图;

图9为本发明实施例提供的耳机和终端的应用场景示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动的前提下,所获得的所有其他实施例,都属于本发明保护范围。

本发明的目的是提供一种语音识别的方法,能够提高用户使用语音识别功能的便捷性,从而提升用户的体验感。

为了使本领域的技术人员更好的理解本发明技术方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。

需要说明的是,本发明中提到的耳机需要与终端建立通信连接,而建立通信连接所需的通信模块可以为蓝牙模块,或者其它类型的通信模块,只要耳机和终端的通信模块匹配即可。另外,终端可以为手机等其他类型的电子产品。

图1为本发明实施例提供的一种通过耳机开启终端语音识别功能的方法的流程图。如图1所示,该方法包括:

s10:采集语音。

s11:当确定语音中包含预设关键词时,向终端发送开启语音识别功能的开启指令以使终端进行语音识别。

在具体实施中,耳机的语音采集模块实时采集用户输入的语音,再通过本地语音识别模块识别采集到的语音是否包含有预设关键词,如果有,则向终端发送开启指令。

需要说明的是,耳机识别预设关键词的具体过程是:将采集到的语音转化为文本,再将该文本与数据库中的预设关键词的文本作比对,如果该文本中包含有与预设关键词的文本相同的文本,则确定耳机采集到的语音中包含预设关键词,如果该文本中没有与预设关键词相同的文本,则确定耳机采集到的语音中没有预设关键词。

在步骤s11中提到的预设关键词是指开启终端的语音识别功能的关键词。而且,可以理解的是,预设关键词所包含的内容没有限制,可以为字母,数字,汉语等,预设关键词中包含的内容越多,则识别过程会较慢,但是能够有效防止误操作,因此,可以根据可以实际情况选择,本发明不作限定。

例如,预设关键词为“开启语音识别功能”,那么当用户向耳机说出“我要开启语音识别功能”的语音(该语音中包含了预设关键词“开启语音识别功能”)时,耳机的第一语音采集模块就会采集到用户向耳机说出的语音,并且由耳机的本地语音识别模块对该语音进行识别,最终确定出该语音中包含预设关键词(预设关键词为“开启语音识别功能”),向终端发送开启语音识别功能的开启指令,那么终端在接收到开启指令后便会开启语音识别功能进行语音识别。

当然,在具体实施中,开启语音识别功能的预设关键词可以为一个,也可以为多个,且如果预设关键词为多个,则数据库中就包括了多个预设关键词的文本,那么用户输入包含任意一个预设关键词的语音都可以实现开启终端语音识别功能的目的。另外,在一个具体实施中,可以设置两个预设关键词,分别表征开启终端的本地语音识别功能的关键词和开启终端的网络语音识别功能的关键词。则对应的,开启指令中携带有对应的信息,例如将开启指令对应的数据的头部设置为1,表示采用终端本地语音识别功能;将开启指令对应的数据的头部设置为0,采用网络语音识别功能。具体地,当耳机接收到包含有开启终端的本地语音识别功能的关键词时,向终端发送开启终端的本地语音识别功能的开启指令;当耳机接收到包含有开启终端的网络语音识别功能的关键词时,向终端发送开启终端的网络语音识别功能的开启指令。

由此可见,本发明实施例提供的通过耳机开启终端语音识别功能的方法可以在终端的语音识别功能处于关闭的状态下,无需手动操作,仅通过包含有预设关键词的语音便可以向终端发送开启语音识别功能的开启指令以开启终端的语音识别功能进行语音识别,因此,本方法不仅能够降低终端的功耗,而且能够提高用户使用语音识别功能的便捷性,进一步提升用户的体验感。

在具体实施中,当用户在距离终端较远的地方说出待识别语音时,通过终端自身的麦克风获取到的待识别语音的质量是差的,从而会导致语音识别的成功率降低,影响用户体验。当然,用户可以将终端移动至与自身的距离较小的地方以便终端可以获取到质量较好的待识别语音,但是由于终端的便携性较差,当用户的双手被占用时,用户则很难保证自身与终端的距离。有鉴于此,本发明考虑到耳机的便携性较好,只要用户戴着耳机,即便用户在距离终端较远的地方说出待识别语音,终端也可以通过耳机采集到质量较高的待识别语音,所以,在耳机向终端发送了开启指令之后,终端还可以建立与耳机之间的语音传输链路,以便终端能够通过语音传输链路获取由便携性较好的耳机采集到的高质量待识别语音。

图2为本发明实施例提供的另一种通过耳机开启终端语音识别功能的方法的流程图。本实施例中,耳机语音传输链路向终端传输自身采集到的高质量待识别语音,如图2所示,作为优选地实施方式,在图1的基础上,执行完步骤s11后,还包括:

s20:响应终端发起的建立语音传输链路的请求。

s21:当检测到语音传输链路接通时,可通过语音传输链路传输语音至终端。

需要说明的是,上述语音传输链路是指终端与耳机之间传输待识别语音的传输链路,步骤s21中提到的语音是由耳机在发送完开启指令之后,当检测到语音传输链路接通时采集到的语音,与步骤s10中的提到的语音为不同时刻的语音,具体地,步骤s10中提到的语音为在语音传输链路接通之前用户说出的语音;步骤s21中提到的语音为语音传输链路接通后用户说出的语音。例如,在当前时刻,耳机没有检测到语音传输链路已接通,则耳机实时采集的语音为步骤s10中的语音。而如果在下一时刻,耳机的检测到语音传输链路已经接通,则耳机实时采集到的语音为步骤s21中的语音。

在具体实施中,当耳机接收到终端向自身发起建立语音传输链路的请求时,耳机则立即响应终端发起的建立语音传输链路的请求以便终端尽快建立两者之间的语音传输链路。并且当耳机检测到自身与终端之间的语音传输链路接通时,耳机则开始将自身实时采集到语音通过语音传输链路实时传输至终端。

但是,值得注意的是,对于步骤s21来说,当用户输入待识别语音的时机不对时,很可能会导致语音识别失败,例如,在用户输入包含有预设关键词的语音后,立即输出待识别语音时,很可能会由于终端还没有完全开启语音识别功能或还没有建立好语音传输链路,而导致终端无法获取到用户在终端开启语音识别功能的时候和在终端建立语音传输链路的时候说出的待识别语音,致使语音识别失败。因此,为了使用户能够准确把输入待识别语音的时机,从而提高语音识别的成功率,进而提升用户的体验感,在其他实施例中还可以采用如下方式。

作为优选地实施方式,当耳机检测到语音传输链路接通,并接收到终端发送的提示指令时,耳机向用户播放开始输入待识别语音的提示信号以帮助用户准确把握输入待识别语音的时机,且耳机可通过语音传输链路传输自身采集到的语音至终端,使得终端能够获得全部的待识别语音以提高语音识别的成功率,进而提升用户的体验感。

由此可见,本实施例提供的方法可以通过便携性较好的耳机响应终端发起的建立语音传输链路的请求,并且当检测到语音传输链路接通时,耳机可通过语音传输链路实时传输自身采集到的语音至终端,使得终端可以通过便携性较好耳机获取到高质量待识别语音,避免了由于终端无法通过自身的麦克风获取高质量待识别语音而导致的终端无法成功识别出用户想要识别的语音为影响用户体验。因此,本方法能够提高语音识别的成功率,进而提升用户的体验感。

在具体实施中,当终端成功获取到待识别语音或成功获得识别结果后,终端会关闭语音传输链路,此时,耳机则可以停止向终端传输采集到的语音以降低耳机自身的功耗。因此,本发明实施例提供了另一种通过耳机开启终端语音识别功能的方法,在图2的基础上作进一步改进,下面结合附图进行详细说明。

图3为本发明实施例提供的另一种通过耳机开启终端语音识别功能的方法的流程图。如图3所示,为了降低耳机自身的功耗,作为优选地实施方式,在图2的基础上,执行完步骤s21后,还包括:

s30:当检测到终端关闭语音传输链路时,停止将语音通过语音传输链路传输至终端。

值得注意的是,虽然在步骤s30中停止了将语音通过语音传输链路传输至终端,但耳机仍然在实时采集语音,此时对于耳机来说,采集得到的语音是用于判断是否包含有预设关键词,以便用户再次通过语音识别功能开启终端的语音识别功能。另外,需要说明的是,耳机在工作过程中,虽然在实时采集语音,但是采集到的语音的用途是不同的,即在在一个完整周期内,未向终端发送开启指令之前,采集到的语音是用来判断是否包含预设关键词,而向终端发送完开启指令之后,采集到的语音是用来传输至终端以进行语音识别。因此,在具体实施中,耳机是包括有两个采集模块,分别为第一采集模块和第二采集模块,两个采集模块是不同时工作的。

而且,为了更进一步完善本实施例提供的通过耳机开启终端的语音识别功能的方法,提升用户的体验感,在执行完步骤s30后,耳机还可以接收终端发送的识别结果中的音频,并播放该音频。

当然,可以理解的是,还可以在图1的基础上对本发明实施例提供的通过耳机开启终端语音识别功能的方法作进一步的改进,即在执行完步骤s11后,继续执行步骤s30,本文不再详细赘述。

为了降低耳机自身的功耗,作为优选地实施方式,向终端发送开启语音识别功能的开启指令具体为:通过基于ble协议的指令通道向终端发送开启指令。除了基于ble协议这一种方式,还可以采用其它通信协议,本实施例不再赘述。

上文对于本发明提供的一种通过耳机开启终端语音识别功能的方法的实施例进行了详细的描述,本发明还提供了一种与该方法对应的通过耳机开启终端语音识别功能的装置,由于装置部分的实施例与方法部分的实施例相互照应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。

图4为本发明实施例提供的一种通过耳机开启终端语音识别功能的装置的结构图。如图4所示,该装置包括:

采集模块40,用于采集语音。

开启模块41,用于当确定语音中包含预设关键词时,向终端发送开启语音识别功能的开启指令以使终端进行语音识别。

其中,采集模块40包括第一语音采集模块和第二语音采集模块,且第一语音采集模块和第二语音采集模块均用于实时采集语音,但是第一语音采集模块采集到的语音作为被耳机的本地语音识别模块识别的语音;而第二语音采集模块采集到的语音则作为被耳机传输至终端的语音以便终端对该语音进行语音识别。一般地,为了降低耳机自身的功耗,在耳机没有向终端传输语音的时候,只保持第一语音采集模块处于开启状态实时采集语音以便耳机的本地语音识别模块实时识别第一语音采集模块采集到的语音中是否包含预设的关键词,而将第二语音采集模块保持在关闭状态。需要说明的是,在一般情况下,第二语音采集模块只有在耳机自身的本地语音识别模块识别出第一语音采集模块采集到的语音中包含有预设关键词后,当检测到语音传输链路接通时才会开启,并且在第二语音采集模块开启时,第一语音采集模块会同时关闭。当然,如果耳机中还存储有包含有其它指令的关键词,也可以在第二语音采集模块开启时依旧保持第一语音采集模块处于开启状态。

而且,可以理解的是,在当检测到语音传输链路已经关闭时,耳机将关闭第二语音采集模块以节省自身的功耗,并同时开启自身的第一语音采集模块,以便用户在下一次需要使用终端的语音识别功能的时候,依旧能够通过语音更加便捷地开启终端的语音识别功能,以提升用户的体验感。但是,值得注意的是,如果耳机中还存储有包含有其它指令的关键词,在第二语音采集模块开启时并未关闭第一语音采集模块,而是将第一语音采集模块依旧保持在开启状态的话,那么在耳机关闭第二语音采集模块时,则无需再次开启第一语音采集模块。

本实施例提供的通过耳机开启终端语音识别功能的装置可以在终端的语音识别功能处于关闭的状态下,无需手动操作,仅通过采集模块采集到的包含有预设关键词的语音便可以由开启模块向终端发送开启语音识别功能的开启指令以开启终端的语音识别功能进行语音识别,因此,本装置能够通过耳机进行语音识别,并自动开启终端的语音识别功能,使得终端无需长时间开启语音识别功能,不仅能够降低终端的功耗,而且能够提高用户使用语音识别功能的便捷性,进一步提升用户的体验感。

此外,本发明实施例还提供了一种耳机,该耳机包括存储器和处理器,处理器通过调用存储于存储器中的指令以实现上述任一实施例提供的方法。需要说明的是,耳机除了上述器件外,还包括耳机本体,例如通信模块、电池、扬声器、听筒等。

由此可见,本实施例提供的耳机可以在终端的语音识别功能处于关闭的状态下,无需手动操作,仅通过包含有预设关键词的语音便可以向终端发送开启语音识别功能的开启指令以开启终端的语音识别功能进行语音识别,因此,本耳机能够通过包含有预设关键词的语音自动向终端发送开启语音识别功能的指令以使终端自动开启自身的语音识别功能,使得终端无需长时间开启语音识别功能,不仅能够降低终端的功耗,而且能够提高用户使用语音识别功能的便捷性,进一步提升用户的体验感。

图5为本发明实施例提供的一种开启终端语音识别功能的方法的流程图。如图5所示,该方法包括:

s50:接收耳机发送的开启语音识别功能的开启指令。

s51:开启语音识别功能以进行语音识别。

需要说明的是,当终端接收到耳机发送的开启语音识别功能的开启指令时,则立即开启自身的语音识别功能以进行语音识别。

而且,可以理解的是,如果终端接收到的是耳机发送的开启本地语音识别功能的开启指令,则终端开启自身的本地语音识别功能,如果终端接收到的是耳机发送的开启网络语音识别功能的开启指令,则终端开启自身的网络语音识别功能。优选地,当终端接收到的是耳机发送的开启语音识别功能的开启指令时,则终端默认开启本地语音识别功能识别用户输入的语音,并且当本地语音识别功能无法成功识别用户输入的语音时,终端则关闭本地语音识别功能并同时开启网络语音识别功能以识别用户输入的语音。

由此可见,本实施例提供的开启终端语音识别功能的方法可以在终端的语音识别功能处于关闭的状态下,无需手动操作,终端仅通过接收耳机发送的开启指令,便可以开启自身的语音识别功能以进行语音识别。相对于现有技术而言,本方法不仅能够降低终端的功耗,而且能够提高用户使用语音识别功能的便捷性,进一步提升用户的体验感。

在具体实施中,当用户在距离终端较远的地方说出待识别语音时,通过终端自身的麦克风获取到的待识别语音的质量是差的,从而会导致语音识别的成功率降低,影响用户体验。当然,用户可以将终端移动至与自身的距离较小的地方以便终端可以获取到质量较好的待识别语音,但是由于终端的便携性较差,当用户的双手被占用时,用户则很难保证自身与终端的距离。有鉴于此,本发明考虑到耳机的便携性较好,只要用户戴着耳机,即便用户在距离终端较远的地方说出待识别语音,终端也可以通过耳机采集到质量较高的待识别语音,所以,在耳机向终端发送了开启指令之后,终端还可以建立与耳机之间的语音传输链路,以通过该语音传输链路获取由便携性较好的耳机采集到的高质量待识别语音。

图6为本发明实施例提供的另一种开启终端语音识别功能的方法的流程图。本实施例中,终端通过语音传输链路获取耳机采集到的高质量待识别语音,如图6所示,作为优选地实施方式,在图5的基础上,在执行完步骤s51后,还包括:

s60:向耳机发起建立语音传输链路的请求以建立语音传输链路。

s61:通过语音传输链路接收耳机发送的语音,并进行语音识别。

需要说明的是,上述语音传输链路是指终端与耳机之前的传输待识别语音的传输链路,步骤s61中提到的语音是在终端开启语音识别功能之后,在语音传输链路建立成功后,由耳机采集到的语音。

其中,对于步骤s60来说,当终端开启语音识别功能后,如果检测到有耳机与自身连接,则向与自身连接的耳机发起建立两者之间的语音传输链路的请求,一旦接收到耳机响应终端发起的建立两者之间语音传输链路的请求的响应消息后便立即建立两者之间的语音传输链路,在建立好两者之间的语音传输链路后,则通过该语音传输链路接收耳机发送的语音并进行语音识别。当然,可以理解的是,当通过耳机开启终端的语音识别功能后,终端也可以不向耳机发送建立与耳机之间的语音传输链路的请求,而是通过自身的麦克风或者与自身连接的其它可以获取语音的设备获取用户输入的待识别语音,详细过程本发明不再赘述。

而且,值得注意的是,对于步骤s61来说,当用户输入待识别语音的时机不对时,很可能会导致语音识别失败,例如,在耳机发送完开启指令之后,耳机和终端之间的语音传输链路还未建立好,但是用于已经开始待识别的语音,则导致终端无法获取到的用户在终端开启语音识别功能的时候和在终端建立语音传输链路这一段时间内输出的待识别语音,致使语音识别失败或不完整。因此,为了使用户能够准确把输入待识别语音的时机,从而提高语音识别的成功率,进而提升用户的体验感,作为优选地实施方式,当终端建立好语音传输链路后,还向耳机发送提示指令以便于耳机在接收到终端发送的提示指令后,向用户播放开始输入待识别语音的提示信号,帮助用户准确把握输入待识别语音的时机,且终端可通过语音传输链路获取耳机采集到的语音。使得终端能够获得全部的待识别语音以提高语音识别的成功率,进而提升用户的体验感。

由此可见,本发明充分考虑到终端的语音识别成功率与终端和用户之间的距离有很大关系,且终端的便携性与耳机的便携性又相差甚远,终端通过上述语音传输链路接收耳机采集到的用户输入的待识别语音,避免了由于用户与终端之间的距离较远导致的语音识别失败,影响用户体验。因此,本方法能够提高终端的语音识别的成功率,进而提升用户的体验感。

在具体实施中,当终端成功获取到待识别语音或成功获得识别结果后,终端便不再需要通过语音传输链路获取待识语音,此时,终端便可以断开语音传输链路以降低终端自身的功耗。并且,如果终端已经获得识别结果,还可以同时关闭语音识别功能。因此,本发明实施例提供了另一种开启终端语音识别功能的方法,在图6的基础上作进一步改进,下面结合附图进行详细说明。

图7为本发明实施例提供的另一种开启终端语音识别功能的方法的流程图。如图7所示,为了降低终端自身的功耗,作为优选地实施方式,在图6的基础上,在执行完步骤s61后,还包括:

s70:当达到预设关闭条件时,断开语音传输链路,并关闭语音识别功能。

其中,上述预设关闭条件具体包括:

语音的信号强度低于第一预设值且持续时长达到第二预设值;或语音的信号强度高于第三预设值,且持续时长达到第四预设值;或得到语音识别结果。

需要说明的是,第一预设值小于第三预设值。当终端获取到的语音的信号强度低于第一预设值,且该信号强度持续低于第一预设值的时间长达第二预设值时,终端则会断开上述语音传输链路,关闭自身的语音识别功能。例如,当第一预设值为终端识别语音的最低信号强度,第二预设值为2秒时,如果终端2秒内获取到的语音的信号强度均小于最低信号强度的语音,终端则认为待识别语音已经输入完毕,会断开上述语音传输链路,关闭自身的语音识别功能。

当终端获取到的语音的信号强度高于第三预设值,且该信号强度高于第三预设值的时间长达第四预设值时,终端则会断开上述语音传输链路,关闭自身的语音识别功能。例如,当第三预设值为终端识别语音的最高信号强度,第四预设值为10秒时,如果终端获取到的语音的信号强度在10秒内均大于最高信号强度,终端则认为待识别语音输入有误,会断开上述语音传输链路,关闭自身的语音识别功能。

当终端得到识别结果后,终端则认为完成语音识别,会断开上述语音传输链路,关闭自身的语音识别功能。当然,可以理解的是,为了进一步完善本实施例提供的开启终端语音识别功能的方法,在终端获得识别结果后,终端可以将识别结果的音频发送至耳机,以通过耳机播放音频。当然,也可以通过其他播音设备播放识别结果中的音频,如终端自身的扬声器和与终端连接的音响等。

同样的,为了进一步完善本实施例提供的开启终端语音识别功能的方法,在终端获得识别结果后,当识别结果中包含字符、图片或视频信息时,终端还可以通过显示屏显示识别结果,其中,显示屏可以是终端自身的显示屏,还可以是与终端连接的显示设备,如还可以通过与终端连接的投影仪显示识别结果。

因此,本实施例提供的开启终端语音识别功能的方法可以通过及时关闭终端的语音识别功能降低终端自身的功耗以延长终端的待机时长,从而进一步地提升用户的体验感。当然,还可以通过耳机播放识别结果中的音频和显示屏显示识别结果中的字符、图片或视频信息等内容,以更进一步地提升用户的体验感。

当然,可以理解的是,还可以在图5的基础上对本发明实施例提供的开启终端语音识别功能的方法作进一步改进,即在执行完步骤s51后,继续执行步骤s70,本文不再详细赘述。

上文对于本发明提供的一种开启终端语音识别功能的方法的实施例进行了详细的描述,本发明还提供了一种与该方法对应的开启终端语音识别功能的装置,由于装置部分的实施例与方法部分的实施例相互照应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。

图8为本发明实施例提供的一种开启终端语音识别功能的装置的结构图。如图8所示,该装置包括:

接收模块80,用于接收耳机发送的开启语音识别功能的开启指令。

开启模块81,用于开启语音识别功能以进行语音识别。

由此可见,本实施例提供的开启终端语音识别功能的装置可以在终端的语音识别功能处于关闭的状态下,无需手动操作,终端仅通过接收模块接收耳机发送的开启指令,便可以由开启模块开启自身的语音识别功能以进行语音识别,相对于现有技术而言,本装置不仅能够降低终端的功耗,而且能够提高用户使用语音识别功能的便捷性,进一步提升用户的体验感。

此外,本发明实施例还提供了一种终端,该终端包括存储器和处理器,处理器通过调用存储于存储器中的指令以实现上述任一实施例所提供的开启终端语音识别功能的方法。由此可见,本实施例提供的终端可以在终端的语音识别功能处于关闭的状态下,无需手动操作,终端仅通过接收耳机发送的开启指令,便可以开启自身的语音识别功能以进行语音识别,相对于现有技术而言,本终端不仅能够降低功耗,而且能够提高用户使用语音识别功能的便捷性,进一步提升用户的体验感。

为了使本领域的技术人员更好的理解本发明的技术方案,下面结合附图、本发明实施例提供的通过耳机开启终端语音识别功能的方法及装置、本发明实施例提供的开启终端语音识别功能的方法及装置、本发明实施例提供的耳机和终端,对上述本发明作进一步的详细说明。

图9为本发明实施例提供的耳机和终端的应用场景示意图。如图9所示,该应用过程包括:

s90:当用户需要使用终端的语音识别功能的时候,用户向耳机说出含有预设关键词的语音,例如,“开启网络语音识别功能”。

s91:当耳机捕捉到预设关键词时,耳机通过指令通道向终端发送开启指令。

s92:终端在接收到开启指令后,开启网络语音识别功能,并建立与耳机的语音传输链路。

s93:用户向耳机说出待识别语音。

s94:耳机采集待识别语音,并通过语音传输链路向终端发送待识别语音。

s95:终端通过语音传输链路接收待识别语音,并通过网络语音识别模块将待识别语音发送至网络语音识别服务器。

s96:网络语音识别服务器接收待识别语音进行识别,得到识别结果,并将识别结果发送至终端。

s97:终端接收识别结果,并将识别结果的音频发送至耳机。

s98:耳机接收识别结果的音频,并向用户播放该音频。

上文通过对本发明实施例提供的方法及装置、耳机和终端的应用过程的具体描述,可以看出本发明实施例提供的方法及装置、耳机和终端,能够在终端的语音识别功能处于关闭的状态下,无需手动操作,耳机仅通过包含有预设关键词的语音便可以开启终端的语音识别功能,并可以正常使用终端的语音识别功能,因此,本发明实施例提供的方法及装置、耳机和终端能够在节约终端自身功耗的情况下,通过语音开启并使用终端的语音识别功能,从而提高用户使用语音识别功能的便捷性,进一步提升用户的体验感。

以上对本发明所提供的本发明实施例提供的通过耳机开启终端语音识别功能的方法及装置、本发明实施例提供的开启终端语音识别功能的方法及装置、本发明实施例提供的耳机和终端进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明都是与其它实施例的不同之处,各个实施例之间相同相似部分互相参见即可。

应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

还需要说明的是,在本说明书中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或者操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何变体意在涵盖非排他性的包含,从而使得包括一系列的要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1