一种语音唤醒方法、装置及系统与流程

文档序号:16989454发布日期:2019-03-02 00:51阅读:159来源:国知局
一种语音唤醒方法、装置及系统与流程

本发明实施例涉及人工智能领域,特别涉及一种语音唤醒方法、装置及系统。



背景技术:

随着人工智能技术的不断发展,用户在日常生活中越来越多的通过语音交互方式从终端、各种app应用程序获得各种服务。

目前人们进行语音交互时通常为用户说出固定的唤醒关键字,终端采集该关键字后唤醒相应的服务,如语音助手等,启动语音交互过程,随后采集用户的语音进行人机交互。或者是固定的唤醒关键字和用户命令同时被采集,终端判断采集到唤醒关键字后,根据其后的用户命令与智能终端进行人机交互过程。

上述语音交互过程中,用户需要使用固定的唤醒关键字,交互过程繁琐不简洁,交互成本高,尤其当用户在紧急情况忘记唤醒关键字或者用户时间紧张,需要尽快启动语音交互过程的时候,上述语音交互方式太过死板,用户获取所需语音交互结果等待的时间太长,降低了用户体验。



技术实现要素:

针对现有技术中存在的上述问题,本发明提出一种语音唤醒方法、装置及系统。

本发明实施例提供了一种语音唤醒方法,包括:

一种语音唤醒的方法,该语音唤醒方法包括以下步骤:

步骤101,判断是否满足预设条件,若是,则执行步骤103,否则执行步骤105;

步骤103,激活免唤醒词唤醒语音控制逻辑的操作;

步骤105,不激活免唤醒词唤醒语音控制逻辑的操作。

所述判断是否满足预设条件包括:

判断语音控制逻辑预设范围内是否只有一个人,当仅有一个人时,满足预设条件;

和/或,

判断用户是否发出紧急求助,若是,则满足预设条件;

和/或,

检测车内驾驶员说话的音量,根据其说话的音量确定是否满足预设条件;

和/或,

判断语音控制逻辑是否位于特定区域,若是,则满足预设条件。

当语音控制逻辑在室内时,所述预设范围为房间内;

当语音控制逻辑在户外时,所述预设范围为以语音控制逻辑所处位置为圆心,r为半径的圆内,r为大于0的数;

当语音控制逻辑在车辆内或者安装于车辆中,所述预设范围为车辆内。

优选地,所述判断语音控制逻辑预设范围内是否只有一个人,当仅有一个人时,满足预设条件包括:

判断语音控制逻辑预设范围内是否只有一个人,若是,则确定该人为语音控制逻辑的用户,语音控制逻辑若获取了用户发出的语音,则满足预设条件;

或者,

获取用户发出的语音后判断语音控制逻辑预设范围内是否只有一个人,若是则满足预设条件。

所述判断用户是否发出紧急求助,若是,则满足预设条件包括:

获取用户发出的语音,

判断所述语音中是否包括紧急求助,若是,则满足预设条件。

优选地,所述判断语音控制逻辑预设范围内是否只有一个人,当仅有一个人时,进一步地,

获取声音信息,判断所获取的声音信息是否为预设范围内人员所发出的语音,若是,则满足预设条件。

优选地,检测车内驾驶员说话的音量,根据其说话的音量确定是否满足预设条件包括

获取驾驶员发出的语音,判断车内是否只有一个人,若是,当其语音音量大于等于第一预设值时,则满足预设条件;若车内多于一个人,当其语音音量大于等于第二预设值时,则满足预设条件;或者驾驶员的语音音量大于等于第三预设值时,满足预设条件;

所述第一预设值低于第二预设值。

优选地,当所述预设范围为车辆内时,

进一步判断所述仅有的一个人是否为驾驶员,若是驾驶员,则满足预设条件。

优选地,判断语音控制逻辑是否位于特定区域,若是,则满足预设条件包括:

获取用户的语音,判断用户的语音是否与该特定区域存在关联性,若是,则满足预设条件。

优选地,预先建立用户语音与特定区域的关联性关系,判断用户的语音是否与该特定区域存在关联性包括

获取用户的语音与语音控制逻辑所处位置区域,判断获取的语音与位置区域是否与预先建立的关联性关系匹配,若是,则满足预设条件。

优选地,判断用户是否在进行语音相关的业务,若是,则不激活免唤醒词唤醒语音控制逻辑的操作。

优选地,确定用户是否开启免唤醒词唤醒语音控制逻辑的功能,若是,则用户开启该功能,执行步骤101。

优选地,判断获取的用户发出的语音是否包含固定的唤醒关键字,若不包含固定的唤醒关键字,则执行步骤101。

若获取的用户发出的语音包含固定的唤醒关键字,则基于固定的唤醒关键字唤醒语音控制逻辑。

所述激活免唤醒词唤醒语音控制逻辑的操作包括:

语音控制逻辑根据获取的语音执行对应的动作。

所述不激活免唤醒词唤醒语音控制逻辑的操作包括:

语音控制逻辑根据其他唤醒方式唤醒语音控制逻辑。

本发明实施例还提供一种语音唤醒装置,该装置包括:

判断模块,用于判断是否满足预设条件;若满足预设条件,触发激活模块激活免唤醒词唤醒操作;否则,触发激活模块不执行免唤醒词唤醒操作;

激活模块,用于根据判断模块的触发信号,激活免唤醒词唤醒语音控制逻辑或者不激活免唤醒词唤醒语音控制逻辑。

判断是否满足预设条件包括:

判断语音控制逻辑预设范围内是否只有一个人,当仅有一个人时,满足预设条件;

和/或,

判断用户是否发出紧急求助,若是,则满足预设条件;

和/或,

检测车内驾驶员说话的音量,根据其说话的音量确定是否满足预设条件;

和/或,

判断语音控制逻辑是否位于特定区域,若是,则满足预设条件;

优选地,当语音控制逻辑在室内时,所述预设范围为房间内;

当语音控制逻辑在户外时,所述预设范围为以语音控制逻辑所处位置为圆心,r为半径的圆内,r为大于0的数;

当语音控制逻辑在车辆内或者安装于车辆中,所述预设范围为车辆内。

优选地,所述判断语音控制逻辑预设范围内是否只有一个人,当仅有一个人时,满足预设条件包括:

判断语音控制逻辑预设范围内是否只有一个人,若是,则确定该人为语音控制逻辑的用户,语音控制逻辑若获取了用户发出的语音,则满足预设条件;

或者,

获取用户发出的语音后判断语音控制逻辑预设范围内是否只有一个人,若是则满足预设条件。

优选地,所述判断用户是否发出紧急求助,若是,则满足预设条件包括:

判断获取的用户发出的语音中是否包括紧急求助,若是,则满足预设条件。

优选地,所述判断语音控制逻辑预设范围内是否只有一个人,当仅有一个人时,满足预设条件包括

判断获取的声音信息是否为预设范围内人员所发出的语音,若是,则满足预设条件。

优选地,检测车内驾驶员说话的音量,根据其说话的音量确定是否满足预设条件包括

获取驾驶员发出的语音,判断车内是否只有一个人,若是,当其语音音量大于等于第一预设值时,则满足预设条件;若车内多于一个人,当其语音音量大于等于第二预设值时,则满足预设条件;或者驾驶员的语音音量大于等于第三预设值时,满足预设条件;

所述第一预设值低于第二预设值。

优选地,当所述预设范围为车辆内时,进一步判断所述仅有的一个人是否为驾驶员,若是驾驶员,则满足预设条件。

优选地,判断终端是否位于特定区域,若是,则满足预设条件包括:

判断用户的语音是否与该特定区域存在关联性,若是,则满足预设条件。

优选地,预先建立用户语音与特定区域的关联性关系,判断用户的语音是否与该特定区域存在关联性包括

根据获取的用户的语音与语音控制逻辑所处位置区域,判断获取的语音与位置区域是否与预先建立的关联性关系匹配,若是,则满足预设条件。

优选地,所述判断模块还用于,判断用户是否在进行语音相关的业务,若是,判断不满足预设条件。

优选地,装置还包括开关模块,用于用户选择开启或者关闭免唤醒词唤醒功能;当用户选择开启时,则开启免唤醒词唤醒语音控制逻辑的功能。

优选地,该装置还包括语音检测模块,用于判断获取的用户发出的语音是否包含固定的唤醒关键字,若不包含固定的唤醒关键字,则触发判断模块执行其功能;若包含,则触发激活模块不激活免唤醒词唤醒语音控制逻辑的操作。

触发激活模块不激活免唤醒词唤醒语音控制逻辑的操作包括基于固定唤醒关键字唤醒语音控制逻辑。

该装置还包括

获取模块,用于获取用户发出的语音。

本发明实施例还提供一种语音控制逻辑,包括如上所述的装置。

本发明实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器存储可被处理器执行的计算机指令,当处理器执行上述计算机指令时,实现如上所述的方法。

本发明实施例提供了一种计算机可读存储介质,其特征在于,存储计算机指令,所述计算机指令用于实现如上所述的方法。

通过本发明的语音唤醒方法、装置,用户在与语音控制逻辑进行语音交互时,无需每次都说出唤醒词,根据预设的条件语音控制逻辑判断其唤醒方式,提高了唤醒语音控制逻辑效率,使用户与语音控制逻辑的语音交互更自然,更加人性化和智能化。特别的,本发明提出的语音唤醒方法根据环境的不同执行不同的判断过程,能够更加准确高效的唤醒语音控制逻辑。此外,本发明通过判断是否进行语音业务以确定是否执行免唤醒语音控制逻辑的操作,使得对语音控制逻辑的误唤醒率降低。

附图说明

图1是本发明一种实施例中的语音唤醒的方法。

图2是本发明一种实施例中的语音唤醒的装置。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

图1是本发明一实施例提出的免唤醒词唤醒的方法。

该方法可以应用于语音控制逻辑,该语音控制逻辑包括单向或双向能够实现语音交互功能的软件、硬件、固件等,语音控制逻辑可以由一个或多个设备执行。

参见图1,该语音唤醒方法包括以下步骤:

步骤101,判断是否满足预设条件,若是,则执行步骤103,否则执行步骤105;

步骤103,激活免唤醒词唤醒操作;

步骤105,不激活免唤醒词唤醒操作。

具体的,在步骤101中,判断是否满足预设条件包括:

判断语音控制逻辑预设范围内是否只有一个人,当仅有一个人时,满足预设条件,则激活免唤醒词唤醒操作。当判断预设范围内只有一个人时,语音控制逻辑获取用户发出的语音,则唤醒语音控制逻辑,根据语音执行相应的动作。如果判断语音控制逻辑的预设范围内只有一个人,并获取到用户的语音“上海下雨了吗”,则唤醒语音控制逻辑,识别用户的语音,调用其他服务或程序,在本地查询或者通过云端服务器查询上海天气,并向用户反馈查询结果,若获取到用户的语音为“我想和你聊天”,则唤醒语音控制逻辑,与用户进行聊天。

或者,

当语音控制逻辑获取到用户发出的语音,则判断语音控制逻辑预设范围内是否只有一个人,若只有一个人,则启动免唤醒词唤醒操作,唤醒语音控制逻辑,根据用户语音执行相应的操作。如果获取到用户发出“上海下雨了吗”的语音,对预设范围内环境中人员数量进行检测,判断为只有一个人时,则启动免唤醒词唤醒操作,识别用户发出的语音,调用其他服务或程序,执行查询天气的操作,若用户语音为聊天等无需调用其他程序或服务的语音时,则只唤醒语音控制逻辑,根据用户语音与其进行交流。

在本发明中,先判断在语音控制逻辑预设范围内是否只有一个人,再获取用户发出的语音还是先获取用户发出的语音,再判断预设范围内是否只有一个人这两种方式可以相互替换,并非限定为只采用其中的某一种方式。

和/或,

获取用户的语音,判断用户是否发出紧急求助,若是,则满足预设条件。如用户说“拨打120”,语音控制逻辑获取到用户说的语音后,判断该语音为紧急求助,则无需使用固定的唤醒关键字,直接唤醒语音控制逻辑,执行语音中的命令,调用通话功能,拨打120电话。对于判断语音是否属于紧急求助时,对获取的语音通过例如语义分析进行识别,若属于紧急求助情形,如紧急呼叫、紧急救援等情况时,确定用户发出紧急求助。

和/或,

判断语音控制逻辑是否位于特定区域,若是,则满足预设条件。当语音控制逻辑位于特定区域时,获取用户的语音,直接唤醒语音控制逻辑,根据语音执行相应操作,或者当获取到用户的语音后,判断语音控制逻辑是否位于特定区域,若是,则直接唤醒语音控制逻辑,无需使用固定的唤醒关键字。例如特定区域为商场、超市、加油站、家等具有特定功能的区域,当语音控制逻辑处于该区域时,通常会执行特定的操作,在该区域时,通过免唤醒词语音直接唤醒语音控制逻辑,可简化用户操作,更加便利。在本发明中上述检测语音控制逻辑的位置与获取语音的执行顺序不做限定,可以先执行上述任何一个步骤。

进一步的,对不同的特定区域,判断语音的命令与该区域是否关联,若是,满足预设条件,执行免唤醒词唤醒方式,如,当用户位于医院,当获取到用户的语音后,识别用户语音是否与就医相关,如挂号,支付,查询化验单等,若是,则执行免唤醒关键字唤醒语音控制逻辑的方式,通过语音控制逻辑调用其他程序或服务,如医院的app,执行语音所指示的命令。当用户位于商场或超市,获取用户进行价格查询或者支付或者查询饭店等的语音时,判断用户的语音是否与所处区域相关,若是,则根据语音唤醒语音控制逻辑,执行对应操作。通过上述限定,可以在一定程度上避免误唤醒语音控制逻辑。

优选地,获取用户的语音,并且获取语音控制逻辑的位置区域,对语音进行识别,判断用户语音与语音控制逻辑所在位置区域的关联性,若相关,则满足预设条件,否则,不满足预设条件。

对于用户语音与位置区域的关联性判断,可以由语音控制逻辑执行,或者通过网络将语音与位置区域发送服务器,由服务器执行,也可以首先由语音控制逻辑执行,当其不能判断出二者之间的关联性时,则通过网络发送服务器,由服务器执行判断,并将判断结果反馈给语音控制逻辑。

优选的,可以预先建立用户语音与特定区域的关联性关系,该关联性关系可以通过大数据进行模型训练,当判断识别的语音与位置区域存在关联性时,满足预设条件;或者对用户在该区域与语音控制逻辑交互的语音、和/或用户在该区域执行的操作进行训练,通过对用户历史数据的深度学习,建立用户在特定区域执行的操作、和/或用户语音与位置区域的关联性关系模型,该模型根据用户在特定区域执行的操作、发出的语音不断更新,并且根据误唤醒的语音命令更新模型,当误唤醒的语音命令满足一定条件时,则根据该语音命令更新模型,剔除该语音命令与位置区域的关联性,当判断用户的语音与所处位置区域存在关联性时,根据该语音直接唤醒语音控制逻辑,执行与识别的语音相对应的操作。

进一步的,该关联性关系也可以由用户自定义,或者用户自行对模型中的关联性关系进行修改,例如,用户可以在语音控制逻辑或者服务器设置语音与位置区域的关联性关系表,列表中包括位置区域、免唤醒词唤醒指令,其中位置区域与该指令存在对应关系,获取到用户语音后,根据识别的语音判断用户语音以及所处位置区域是否属于列表中存在对应关系的条目,若是,满足预设条件,否则,不满足。或者用户希望删除或增加模型中免唤醒语音指令,可以直接删除语音指令或增加相应免唤醒语音指令。

优选的,获取用户语音和语音控制逻辑所处位置区域后,首先判断其是否匹配用户自定义的关联性关系或者根据用户历史数据训练的模型,若是,满足预设条件,否则,进一步根据大数据训练的模型进行判断,若是,满足预设条件。通过上述方式,一方面使得判断结果更符合用户使用习惯,加快判断速度,另一方面可以根据大数据模型提高用户体验。

和/或,

获取用户发出的语音,识别该语音,判断该语音与前台app和/或后台app的功能是否相关联,若是,则满足预设条件。如前台app或后台app为音乐播放器,获取用户语音为“下一首”,判断该语音与上述app相关联,则满足预设条件。

优选的,在执行判断操作时,首先判断语音与前台app是否相关联,若是,则满足预设条件,若否,进一步判断是否与后台app相关联,若是满足预设条件,否则,不满足预设条件。通过上述依次判断的方式,可以满足在同一语音同时与多个app相关联时,用户期望对前台app进行控制,而不对后台app控制的情形。

和/或,

对用户与语音控制逻辑交互的语音进行学习,统计使用率较高的命令,将上述高频率命令作为免唤醒词唤醒命令。例如获取用户的语音,对语音进行识别,判断该识别的语音是否属于高频率命令,若是,满足预设条件,否则不满足。通过不断学习用户语音,分析统计高频率命令的方式,可以使得语音控制逻辑更灵活的与用户交流。同样的,对于误唤醒的命令,及时更新剔除。

和/或,

当语音控制逻辑在车辆内,或者语音控制逻辑设置于车辆上,检测驾驶员说话音量,根据其说话音量确定是否满足预设条件。如获取驾驶员发出的语音后,判断车内是否只有驾驶员一个人,若是,当其语音音量大于等于第一预设值时,则满足预设条件;若车内多于一个人,当其语音音量大于等于第二预设值时,则满足预设条件;所述第一预设值低于第二预设值。当车辆内只有一个人时,环境相对安静,驾驶员用较低的音量即可满足预设条件,当车内多于一人时,为了防止其他人说话的声音造成干扰,当驾驶员音量高于第二预设值时,满足预设条件。

对于车内环境,也可以不判断车内人员数量,当驾驶员的语音音量大于等于第三预设值时,确定为满足预设条件;

其中该第一预设值、第二预设值、第三预设值可以是用户预先设定的,或者语音控制逻辑根据音量唤醒时根据历史数据,如正确唤醒时音量和误唤醒时音量自适应调整的,也可以是出厂时厂家设置的。

在判断语音的音量时,可以先对语音信号进行去噪处理,然后再进行比较,如比较语音的分贝与预设分贝值。

上述判断是否满足预设条件的各具体实施方式可以任意组合,包括上述一个或多个具体条件。

通过上述方法,可以简化唤醒语音控制逻辑的操作,不需要用户频繁的对语音控制逻辑重复说出唤醒关键字,用户和语音控制逻辑之间的语音交互过程更简洁,更人性化,智能化,提高了人机语音交互的效率。

对于上述实施方式,该预设范围可以是室内,户外,或者是车辆内。

1)当语音控制逻辑位于室内时

预设范围为语音控制逻辑所在房间。

判断语音控制逻辑所在房间是否只有一个人,若是,则当获取到说话的声音时,激活免唤醒词唤醒操作,唤醒语音控制逻辑。优选地,为了防止外界声音造成干扰,对获取的声音进一步判断,判断该声音是否为该房间内人员说话产生的声音,若是则满足预设条件;否则不满足该预设条件。如采用声源定位技术,确定声音来源与房间内人员位置是否相同,若相同,则判断获取的声音为房间内人员发出的,则唤醒语音控制逻辑,识别用户的语音,根据识别的语音执行相应的操作。

2)当语音控制逻辑在户外时,

预设范围为户外环境。

可以设定语音控制逻辑检测的范围,如以语音控制逻辑所处位置为圆心,r为半径的圆内为检测范围,r为大于零的数,r的值可以是用户预先设置的。若在检测范围内只有一个人,则满足预设条件,若检测范围内多于一个人时,则不满足预设条件。同样的,可以对获取的声音进一步执行如上述终端在房间内时的判断操作。

3)当预设范围为车辆内

当车辆内人员数量为一个人时,满足上述预设条件。也可以对车内环境的免唤醒词唤醒条件进一步限定,当该人员为驾驶员时,满足预设条件,否则,当该人员不是驾驶员时,不满足预设条件。或者判断该人员是否为授权用户,若是,满足预设条件,否则,不满足预设条件。对于判断人员是否为驾驶员,可以通过检测用户是否坐在驾驶位进行判断,此外,对于判断人员是否为驾驶员或者授权用户,也可以提前录入驾驶员或者授权用户的信息,如指纹信息,头像信息,语音信息或者其他生物特征有关的信息,或者其他可以确定人员身份的相关信息,对车内人员检测,判断获取的人员信息与预先录入的信息是否匹配,若匹配,则判断该人员为驾驶员或授权用户。如提前录入了驾驶员或授权用户的语音信息,当车内人员说话时,获取语音信息,和提前录入的语音信息比较,判断是否属于录入语音的人员,若是,则判定为驾驶员或授权用户,满足上述预设条件,可启动免唤醒词唤醒语音控制逻辑的操作,语音控制逻辑按照所述获取的语音执行相应的动作。

进一步的,对不同的人员设置不同的免唤醒词唤醒条件,对于驾驶员,所有语音均可以实现免唤醒词唤醒语音控制逻辑的功能,对于其他人员,则对于涉及行车安全的语音命令,免唤醒词唤醒语音控制逻辑失效。因此,获取用户的语音后,判断该用户是否为驾驶员,若是则执行免唤醒词唤醒功能,否则进一步判断用户语音是否与行车安全相关,若是,则无法实现免唤醒词唤醒功能,否则直接唤醒语音控制逻辑。

在步骤103中,当按照上述任一方式确定出满足预设条件,则可以直接唤醒语音控制逻辑,根据已获取的用户的语音执行相应的动作。

如上所述,在满足了预设条件后,唤醒语音控制逻辑,识别用户语音,当需要调用其他程序或功能执行用户语音命令时,则调用其他程序或功能,并向用户反馈执行结果,当无需调用其他程序或功能时,则根据识别的语音与用户进行语音交流。

在步骤105中,当确定出不满足预设条件时,不激活免唤醒词唤醒语音控制逻辑的操作。

在根据上述判断步骤判断不满足预设条件时,则不激活免唤醒词唤醒语音控制逻辑的操作,需要采用固定唤醒关键字唤醒语音控制逻辑,或者其他常用的唤醒语音控制逻辑的方式进行唤醒。

本实施方式提供的语音唤醒语音控制逻辑的方法,通过判断语音控制逻辑是否满足预设条件,在满足预设条件时,激活免唤醒词唤醒语音控制逻辑的方式,简化了人机语音交互的流程,提高了用户的体验,使语音控制逻辑更便捷的为用户服务。

在另一实施方式中,为了防止上述免唤醒词唤醒语音控制逻辑的方法误唤醒语音控制逻辑,当语音控制逻辑获取到用户发出的语音时,进一步检测该用户是否在进行语音通信业务,若用户在进行语音通信业务,则用户开口说话时不激活免唤醒词唤醒操作,否则再按本发明的方法做进一步判断。比如该用户有呼叫接入或者呼出呼叫,或者正在打电话,或者与其他人正在进行视频通信业务或语音通信业务,则不激活免唤醒词唤醒操作。在这种情况下,如果用户需要唤醒语音控制逻辑,可以采用现有技术中已有的唤醒方式唤醒语音控制逻辑,如利用固定的唤醒词唤醒语音控制逻辑。比如,用户正在和朋友打电话,询问朋友“上海下雨没”,在这种情况下,语音控制逻辑获取并识别用户的语音,若采用免唤醒词唤醒方式,语音控制逻辑会被误唤醒查询天气情况,影响用户打电话,通过本发明的实施方式,语音控制逻辑检测到用户正在打电话,则只有当用户利用现有的唤醒方式,如说出包括固定唤醒关键字的语音时,如“小蓦,上海下雨了吗”或者“上海下雨了吗,小蓦”,语音控制逻辑识别出固定唤醒关键字“小蓦”,则采用固定唤醒关键字唤醒语音控制逻辑的方式对语音控制逻辑唤醒,识别出与“小蓦”相关联的语音,根据语音执行相应的动作,如采集用户说出“小蓦”时前后一定时间范围内的语音,对该语音进行分析,判断哪些内容是与语音控制逻辑语音交互相关的内容,哪些内容是用户与对方打电话的内容,识别出与语音控制逻辑语音交互的相关内容后,根据该相关内容执行相应的动作,如查询上海的天气。若判断用户没有进行语音通信业务,则执行步骤101,进一步判断是否满足预设条件,按照本发明的方法执行。

通过上述方式,有效避免了当语音控制逻辑启用免唤醒词唤醒操作时,因用户正在进行的语音相关的业务而错误唤醒语音控制逻辑,达到降低误唤醒的概率的效果。

在另一实施方式中,可以在语音控制逻辑中设置是否启用免唤醒词唤醒功能的选项,若用户开启该功能,则执行上述方法,若用户关闭该功能,则使用现有技术中常用的唤醒方式,如固定的唤醒关键字唤醒语音控制逻辑。通过该设置,用户可以更加灵活的根据其需要选择其语音唤醒方式。

在另一实施方式中,当语音控制逻辑获取用户发出的语音时,先对该语音进行识别,判断是否包含固定的唤醒关键字,若是,则按现有技术中采用固定唤醒词唤醒语音控制逻辑的方式与语音控制逻辑进行语音交互,交互方式可以如前文所述的方式进行。若不包含固定的唤醒关键字,则执行步骤101,按照本发明的语音唤醒方法执行。

比如用户说“小蓦,上海下雨了吗”,语音控制逻辑采集到用户的语音,识别出包括固定唤醒关键字“小蓦”,则按现有技术的方法唤醒语音控制逻辑,执行语音指示的动作。或者,用户说“上海下雨了吗,小蓦”,虽然唤醒关键字位于用户语音指示的动作后面,但是语音控制逻辑将该句话作为一个整体,识别出其中包括的固定唤醒关键字“小蓦”,则采用固定唤醒关键字唤醒语音控制逻辑的方式唤醒语音控制逻辑,执行该语音中指示的动作,查询上海的天气,确定是否下雨,并向用户反馈结果。

当用户说“上海下雨了吗”,由于该语音中不包括固定的唤醒关键字,则按照本发明的唤醒语音控制逻辑的方式进行语音控制逻辑唤醒,即执行上述步骤101。

优选的,在本发明的语音唤醒方法中,上述防止误唤醒语音控制逻辑的方法步骤和该判断获取的语音中是否包含固定的唤醒关键字的步骤可以都执行,或者执行二者之一。其中都执行时,上述步骤不分先后。

以上对本发明语音唤醒语音控制逻辑的方法进行了详细描述。

图2为本发明提供的语音唤醒装置的结构示意图,用于执行上述方法,如图2所示,本实施例提供的语音唤醒装置包括:

判断模块,用于判断是否满足预设条件;若满足预设条件,触发激活模块激活免唤醒词唤醒操作;否则,触发激活模块不执行免唤醒词唤醒操作;

激活模块,用于根据判断模块的触发信号,激活免唤醒词唤醒语音控制逻辑或者不激活免唤醒词唤醒语音控制逻辑;

优选的,判断是否满足预设条件包括:

判断语音控制逻辑预设范围内是否只有一个人,当仅有一个人时,满足预设条件;

和/或,

判断用户是否发出紧急求助,若是,则满足预设条件;

和/或,

检测车内驾驶员说话的音量,根据其说话的音量确定是否满足预设条件;

和/或,

判断语音控制逻辑是否位于特定区域,若是,则满足预设条件;

和/或,

判断获取的用户的语音是否与前台app和/或后台app的功能相关联,若是,则满足预设条件;

和/或,

判断获取的用户的语音是否属于高频率命令,若是,则满足预设条件。

进一步的,

当语音控制逻辑在室内时,所述预设范围为房间内;

当语音控制逻辑在户外时,所述预设范围为以语音控制逻辑所处位置为圆心,r为半径的圆内,r为大于0的数;

当语音控制逻辑在车辆内或者安装于车辆中,所述预设范围为车辆内。

进一步的,所述判断语音控制逻辑预设范围内是否只有一个人,当仅有一个人时,满足预设条件包括:

判断语音控制逻辑预设范围内是否只有一个人,若是,则确定该人为语音控制逻辑的用户,若获取了用户发出的语音,则满足预设条件;

或者,

获取用户发出的语音后判断语音控制逻辑预设范围内是否只有一个人,若是则满足预设条件。

所述判断用户是否发出紧急求助,若是,则满足预设条件包括:

判断获取的用户发出的语音中是否包括紧急求助,若是,则满足预设条件。

优选地,所述判断语音控制逻辑预设范围内是否只有一个人,当仅有一个人时,满足预设条件包括

判断获取的声音信息是否为预设范围内人员所发出的语音,若是,则满足预设条件。

优选的,检测车内驾驶员说话的音量,根据其说话的音量确定是否满足预设条件包括

获取驾驶员发出的语音后,判断车内是否只有一个人,若是,当其语音音量大于等于第一预设值时,则满足预设条件;若车内多于一个人,当其语音音量大于等于第二预设值时,则满足预设条件;或者驾驶员的语音音量大于等于第三预设值时,满足预设条件;

所述第一预设值低于第二预设值。

当所述预设范围为车辆内时,进一步判断所述仅有的一个人是否为驾驶员,若是驾驶员,则满足预设条件。

优选的,所述判断模块还用于,判断用户是否在进行语音相关的业务,若是,判断不满足预设条件。

优选的,该装置还包括开关模块,用于用户选择开启或者关闭免唤醒词唤醒功能;当用户选择开启时,则开启免唤醒词唤醒语音控制逻辑的功能,执行本发明的方法,否则,关闭该功能,使用现有技术中常用的唤醒方式,如固定的唤醒关键字唤醒语音控制逻辑。

优选的,该装置还包括语音检测模块,用于判断获取的用户发出的语音是否包含固定的唤醒关键字,若不包含固定的唤醒关键字,则触发判断模块执行其功能;若包含,则触发激活模块不激活免唤醒词唤醒语音控制逻辑的操作,采用现有技术中常用的唤醒方式,如固定的唤醒关键字唤醒语音控制逻辑。

可选的,该装置还包括:

获取模块,用于获取用户发出的语音;

该获取模块可以是麦克风,或麦克风阵列。

激活免唤醒词唤醒语音控制逻辑包括语音控制逻辑根据获取的语音执行对应的动作,若需要调用其他程序或服务,则调用其他程序或服务,并向用户反馈执行结果,若无需调用其他程序或服务的语音时,则只唤醒语音控制逻辑,根据用户语音与其进行交流。

不激活免唤醒词唤醒语音控制逻辑包括根据其他唤醒方式唤醒语音控制逻辑。

上述各个模块具体执行上述各个步骤的方式与上述方法相同。

本发明还提供一种语音控制逻辑,该语音控制逻辑包括上述语音唤醒装置。

本发明还提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器存储可被处理器执行的计算机指令,当处理器执行上述计算机指令时,实现如上所述的方法。

本发明还提供一种计算机可读存储介质,存储计算机指令,所述计算机指令用于实现如上所述的方法。

可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质可以包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、闪存、可擦式可编程只读存储器(eprom)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码。

以上说明只是为了方便理解本发明而举出的例子,不用于限定本发明的范围。在具体实现时,本领域技术人员可以根据实际情况对装置的部件进行变更、增加、减少,在不影响方法所实现的功能的基础上可以根据实际情况对方法的步骤进行变更、增加、减少或改变顺序。

尽管已经示出和描述了本发明的实施例,本领域技术人员应当理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同替换所限定,在未经创造性劳动所作的改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1