一种语音交互的智能语音设备防误唤醒方法、系统及设备与流程

文档序号:33476807发布日期:2023-03-15 10:36阅读:149来源:国知局
技术简介:
本专利针对多设备视频语音交互中智能语音设备无法识别指令来源导致误操作的问题,提出通过为每台设备设置唯一识别特征(如白噪声音频),在接收到唤醒指令时提取特征并与设备预设特征匹配,仅当匹配成功时才执行操作,从而实现精准唤醒与防误操作。该方案通过特征唯一性和匹配机制,解决了现有技术中指令识别不准确导致的安全隐患。
关键词:智能语音设备防误唤醒,识别特征匹配
一种语音交互的智能语音设备防误唤醒方法、系统及设备
1.本技术要求于2022年08月22日提交中国专利局、申请号为202211006289.9、发明名称为“一种语音交互的智能语音设备防误唤醒方法、系统及设备”的中国专利申请的优先权。
技术领域
2.本技术涉及数据传输技术领域,尤其涉及一种语音交互的智能语音设备防误唤醒方法、系统及设备。


背景技术:

3.随着人工智能的发展,各类智能设备正在成为人们日常生活的必备品之一。尤其近几年由于语音识别的技术逐渐完善,使人机交互也成为了可能,智能音箱产业也正在成几何倍增长,智能音箱通过语音控制可以做到很多事情,尤其智能音箱与智能家居互通后,通过智能音箱可以控制接入的其它设备,如:灯、空调、电视等等。
4.但是智能音箱在使用者身份的判断上,却无法进行有效的管控,经常会出现的一种情况是:在当用户a、用户b双方通过智能音箱进行视频通话时,自己一方的智能音箱特别容易被对方用户语音误操作造成双方的极大困扰。例如:在用户a与用户b正视频通话的情况下,当用户a发出对自己的音箱进行唤醒的指令时,用户b的音箱也会接收到用户a唤醒音箱的指令被唤醒,此时无论用户a通过语音下发什么指令,很容易使用户b的音箱也进行相同操作。此唤醒音箱的控制指令容易造成智能设备误操作,导致安全事故的发生,假如对智能插座这类的智能设备误操作(通电、断电)、燃气控制等等。


技术实现要素:

5.本技术实施例提供了一种语音交互的智能语音设备防误唤醒方法、系统及设备,用于解决现有智能语音设备难识别是否是自身用户下发的操作指令,存在误操作的技术问题。
6.为了实现上述目的,本技术实施例提供如下技术方案:
7.一种语音交互的智能语音设备防误唤醒方法,应用于至少两台智能语音设备对应用户的视频语音交互上,每台所述智能语音设备上设置有用于识别的识别特征,该智能语音设备防误唤醒方法包括以下步骤:
8.获取第一智能语音设备的第一识别特征和与所述第一识别特征对应的第一用户,以及获取第二智能语音设备的第二识别特征和与所述第二识别特征对应的第二用户;
9.所述第一用户与所述第二用户通过各自的智能语音设备进行语音交互时,所述第一用户或所述第二用户下发控制对应智能语音设备操作的唤醒指令,所述第一智能语音设备和所述第二智能语音设备接收所述唤醒指令并对接收所述唤醒指令进行特征提取,得到与所述唤醒指令对应的唤醒识别特征;
10.根据所述唤醒识别特征确定是否与所述第一识别特征或所述第二识别特征一致,
只有与所述唤醒识别特征一致的所述第一识别特征或所述第二识别特征对应智能语音设备被唤醒,该智能语音设备才能根据所述唤醒指令执行操作。
11.优选地,所述第一用户与所述第二用户通过各自的智能语音设备进行语音交互之后,该语音交互的智能语音设备防误唤醒方法包括:将所述第一识别特征随着视频通话传送至所述第二智能语音设备和将所述第二识别特征随着视频通话传送至所述第一智能语音设备。
12.优选地,该语音交互的智能语音设备防误唤醒方法包括:若与所述唤醒识别特征不一致的所述第一识别特征或所述第二识别特征对应智能语音设备不会被唤醒,该智能语音设备保持沉默。
13.优选地,所述第一识别特征、所述第二识别特征和所述唤醒识别特征均为白噪声音频,所述白噪声音频包含具有识别其音频的特征值。
14.优选地,所述智能语音设备上设置有特征生成模块、特征激活模块、特征播放模块、视频语音通话模块、语音识别模块和特征匹配模块;
15.所述特征生成模块,用于生成与该智能语音设备使用用户对应具有识别特征的识别音频;
16.所述特征激活模块,用于在用户对该智能语音设备讲话时,激活所述特征播放模块;
17.所述特征播放模块,用于播放所述识别音频;
18.所述视频语音通话模块,用于远程视频通话交互;
19.所述语音识别模块,用于对该智能语音设备接收唤醒指令的视频语音进行识别提取视频语音中的唤醒识别特征;
20.所述特征匹配模块,用于将唤醒识别特征与该智能语音设备的识别特征进行匹配,判断是否根据该智能语音设备接收唤醒指令进行唤醒或静默。
21.本技术还提供一种语音交互的智能语音设备防误唤醒系统,应用于至少两台智能语音设备对应用户的视频语音交互上,每台所述智能语音设备上设置有用于识别的识别特征,该智能语音设备防误唤醒系统包括:数据获取单元、交互提取单元和识别唤醒单元;
22.所述数据获取单元,用于获取第一智能语音设备的第一识别特征和与所述第一识别特征对应的第一用户,以及获取第二智能语音设备的第二识别特征和与所述第二识别特征对应的第二用户;
23.所述交互提取单元,用于通过所述第一用户与所述第二用户的语音交互,所述第一用户或所述第二用户下发控制对应智能语音设备操作的唤醒指令,所述第一智能语音设备和所述第二智能语音设备接收所述唤醒指令并对接收所述唤醒指令进行特征提取,得到与所述唤醒指令对应的唤醒识别特征;
24.所述识别唤醒单元,用于根据所述唤醒识别特征确定是否与所述第一识别特征或所述第二识别特征一致,只有与所述唤醒识别特征一致的所述第一识别特征或所述第二识别特征对应智能语音设备被唤醒,该智能语音设备才能根据所述唤醒指令执行操作。
25.优选地,所述识别唤醒单元还用于若与所述唤醒识别特征不一致的所述第一识别特征或所述第二识别特征对应智能语音设备不会被唤醒,该智能语音设备保持沉默。
26.优选地,该语音交互的智能语音设备防误唤醒系统包括特征传送单元,所述特征
传送单元用于通过所述第一用户与所述第二用户的语音交互之后,将所述第一识别特征随着视频通话传送至所述第二智能语音设备和将所述第二识别特征随着视频通话传送至所述第一智能语音设备。
27.优选地,所述第一识别特征、所述第二识别特征和所述唤醒识别特征均为白噪声音频,所述白噪声音频包含具有识别其音频的特征值。
28.本技术还提供一种终端设备,包括处理器和存储器;
29.所述存储器,用于存储程序代码,并将所述程序代码传输给所述处理器;
30.所述处理器,用于根据所述程序代码中的指令执行上述所述的语音交互的智能语音设备防误唤醒方法。
31.从以上技术方案可以看出,本技术实施例具有以下优点:该语音交互的智能语音设备防误唤醒方法、系统及设备,该方法包括获取第一智能语音设备的第一识别特征和与第一识别特征对应的第一用户,以及获取第二智能语音设备的第二识别特征和与第二识别特征对应的第二用户;第一用户与第二用户通过各自的智能语音设备进行语音交互时,第一用户或第二用户下发控制对应智能语音设备操作的唤醒指令,第一智能语音设备和第二智能语音设备接收唤醒指令并对接收唤醒指令进行特征提取,得到与唤醒指令对应的唤醒识别特征;根据唤醒识别特征确定是否与第一识别特征或第二识别特征一致,只有与唤醒识别特征一致的第一识别特征或第二识别特征对应智能语音设备被唤醒,该智能语音设备才能根据唤醒指令执行操作。该语音交互的智能语音设备防误唤醒方法通过智能语音设备自身的识别特征与接收到唤醒指令中提取的唤醒识别特征进行对比,只有唤醒识别特征与智能语音设备的识别特征一致时,该智能语音设备才能根据唤醒指令执行相应的操作,实现智能语音设备在语音交互过程中避免因不是唤醒智能语音设备的唤醒指令而执行操作,造成安全事故的发生,解决了现有智能语音设备难识别是否是自身用户下发的操作指令,存在误操作的技术问题。
附图说明
32.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
33.图1为本技术实施例所述的语音交互的智能语音设备防误唤醒方法的步骤流程图;
34.图2为本技术实施例所述的语音交互的智能语音设备防误唤醒方法的框架图;
35.图3为本技术另一实施例所述的语音交互的智能语音设备防误唤醒方法的框架图;
36.图4为本技术实施例所述的语音交互的智能语音设备防误唤醒系统的框架图。
具体实施方式
37.为使得本技术的发明目的、特征、优点能够更加的明显和易懂,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述
的实施例仅仅是本技术一部分实施例,而非全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
38.本技术提出一种语音交互的智能语音设备防误唤醒方法、系统及设备,能够在两两智能语音设备双方进行视频通话时,第一智能语音设备自动播放具有第一识别特征的音频并同时远程发送该音频给第二智能语音设备,同时第二智能语音设备也会执行相同操作并把自身的第二识别特征传送至第一智能语音设备。或第一智能语音设备的第一用户通过语音唤醒自己第一智能语音设备时,因为第一智能语音设备与第二智能语音设备处于正常视频通话状态中,所以第二智能语音设备也会收到第一用户的声音。第一智能语音设备和第二智能语音设备的语音识别模块各自获取现有的声音唤醒指令并进行特征提取,再进一步的识别出指令,当识别出“唤醒”指令时,再判断此“唤醒”帧包含的音频中唤醒识别特征是属于第一智能语音设备还是第二智能语音设备,只有唤醒识别特征属于自身智能语音设备时,才会进行唤醒该智能语音设备,进行语音控制操作。避免了智能语音设备在通话过程中被对方误操作的问题。用于解决了现有智能语音设备难识别是否是自身用户下发的操作指令,存在误操作的技术问题。
39.实施例一:
40.图1为本技术实施例所述的语音交互的智能语音设备防误唤醒方法的步骤流程图。
41.如图1所示,本技术提供一种语音交互的智能语音设备防误唤醒方法,应用于至少两台智能语音设备对应用户的视频语音交互上,每台智能语音设备上设置有用于识别的识别特征,该智能语音设备防误唤醒方法包括以下步骤:
42.s10.获取第一智能语音设备的第一识别特征和与第一识别特征对应的第一用户,以及获取第二智能语音设备的第二识别特征和与第二识别特征对应的第二用户。
43.需要说明的是,在步骤s10中,每台智能语音设备上均有唤醒自身的识别特征。在本实施例中,获取两两智能语音设备各自的识别特征和使用设备的用户,为后续唤醒提供基础数据。其中,智能语音设备可以为智能音箱、电视、语音速记本、会议速记机、智能机顶盒等智能办公产品;也可以是智能语音阅读台灯、智能语音学习机、智能语音翻译笔等智慧教育产品。
44.s20.第一用户与第二用户通过各自的智能语音设备进行语音交互时,第一用户或第二用户下发控制对应智能语音设备操作的唤醒指令,第一智能语音设备和第二智能语音设备接收唤醒指令并对接收唤醒指令进行特征提取,得到与唤醒指令对应的唤醒识别特征。
45.需要说明的是,在步骤s20中,在第一用户与第二用户通过各自智能语音设备进行视频通话后,在第一用户或第二用户给自身的智能语音设备下发语音控制其操作。在本实施例中,在每台智能语音设备接收唤醒指令的语音后,均对该唤醒指令的语音进行特征提取,得到与该唤醒指令的语音对应的唤醒识别特征,为后续智能语音设备识别唤醒指令是否是对自身下发的提供识别依据,避免该智能语音设备根据唤醒指令直接执行造成无操作。其中,第一识别特征、第二识别特征和唤醒识别特征均可以为白噪声音频,白噪声音频包含具有识别其音频的特征值。唤醒指令包括智能语音设备名称的唤醒指令和该智能语音
设备执行操作的控制指令。
46.s30.根据唤醒识别特征确定是否与第一识别特征或第二识别特征一致,只有与唤醒识别特征一致的第一识别特征或第二识别特征对应智能语音设备被唤醒,该智能语音设备才能根据唤醒指令执行操作。
47.需要说明的是,在步骤s30中,每台智能语音设备根据提取的唤醒识别特征与自身的识别特征进行对比,判断唤醒识别特征与智能语音设备的识别特征是否一致,只有唤醒识别特征与智能语音设备的识别特征一致时,该智能语音设备才能根据唤醒指令执行相应的操作,实现用户通过智能语音设备在语音交互过程中避免因不是唤醒智能语音设备的唤醒指令而执行操作,造成安全事故的发生。
48.本技术提供的语音交互的智能语音设备防误唤醒方法,包括获取第一智能语音设备的第一识别特征和与第一识别特征对应的第一用户,以及获取第二智能语音设备的第二识别特征和与第二识别特征对应的第二用户;第一用户与第二用户通过各自的智能语音设备进行语音交互时,第一用户或第二用户下发控制对应智能语音设备操作的唤醒指令,第一智能语音设备和第二智能语音设备接收唤醒指令并对接收唤醒指令进行特征提取,得到与唤醒指令对应的唤醒识别特征;根据唤醒识别特征确定是否与第一识别特征或第二识别特征一致,只有与唤醒识别特征一致的第一识别特征或第二识别特征对应智能语音设备被唤醒,该智能语音设备才能根据唤醒指令执行操作。该语音交互的智能语音设备防误唤醒方法通过智能语音设备自身的识别特征与接收到唤醒指令中提取的唤醒识别特征进行对比,只有唤醒识别特征与智能语音设备的识别特征一致时,该智能语音设备才能根据唤醒指令执行相应的操作,实现智能语音设备在语音交互过程中避免因不是唤醒智能语音设备的唤醒指令而执行操作,造成安全事故的发生,解决了现有智能语音设备难识别是否是自身用户下发的操作指令,存在误操作的技术问题。
49.图2为本技术实施例所述的语音交互的智能语音设备防误唤醒方法的框架图。
50.在本技术的一个实施例中,该语音交互的智能语音设备防误唤醒方法包括:若与唤醒识别特征不一致的第一识别特征或第二识别特征对应智能语音设备不会被唤醒,该智能语音设备保持。
51.需要说明的是,若判断唤醒识别特征与智能语音设备的识别特征不一致时,该智能语音设备处于静默状态,不会根据唤醒指令执行相应的操作,避免了因不是唤醒智能语音设备的唤醒指令而执行操作,造成安全事故的发生。在本实施例中,该语音交互的智能语音设备防误唤醒方法可以应用在两台智能语音设备的单人对单人,也可以应用在一台智能语音设备同时有多人在使用,因使用的是同一台智能语音设备,即白噪声属于同一台智能语音设备。
52.在本技术的一个实施例中,第一用户与第二用户通过各自的智能语音设备进行语音交互之后,该语音交互的智能语音设备防误唤醒方法包括:将第一识别特征随着视频通话传送至第二智能语音设备和将第二识别特征随着视频通话传送至第一智能语音设备。
53.需要说明的是,该语音交互的智能语音设备防误唤醒方法在第一用户与第二用户通过各自的智能语音设备进行语音交互后,第一用户和第二用户各自的智能语音设备会播放具有识别特征的音频随着第一用户和第二用户传送至对方的智能语音设备中,确保第一用户与第二用户通过各自的智能语音设备进行视频通话交互正常。如:第一智能语音设备
中具有识别特征的音频随着第一用户的通话传送至第二智能语音设备并被其接收;第二智能语音设备中具有识别特征的音频随着第二用户的通话传送至第一智能语音设备并被其接收。
54.在本技术实施例中,以第一智能语音设备a与第二智能语音设备b之间进行视频通话交互为案例说明该语音交互的智能语音设备防误唤醒方法,如图2所示,第一智能语音设备a自身具有第一识别特征(如白噪声1特征)的音频(如白噪声1),第二智能语音设备b自身具有第二识别特征(如白噪声2特征)的音频(如白噪声2),第一智能语音设备a与第二智能语音设备b在视频通话交互后相互向对方传送各自的识别特征。第一用户(即是用户甲)向第一智能语音设备a下发具有白噪声1语音的唤醒指令,该唤醒指令也会随着第一用户与第二用户之间的通话传送至第二智能语音设备b中,第一智能语音设备a和第二智能语音设备b均对接收的具有白噪声1语音的唤醒指令进行特征提取,得到唤醒识别特征;在第一智能语音设备a和第二智能语音设备b上将唤醒识别特征均与对应自身的识别特征进行对比是否一致,唤醒识别特征与第一智能语音设备a的白噪声1特征一致,第一智能语音设备a被唤醒执行与唤醒指令对应的操作,唤醒识别特征与第二智能语音设备b的白噪声2特征不一致,第二智能语音设备b保持静默,不按唤醒指令执行操作。
55.在本技术的一个实施例中,智能语音设备上设置有特征生成模块、特征激活模块、特征播放模块、视频语音通话模块、语音识别模块和特征匹配模块。
56.在本技术实施例中,特征生成模块可以用于生成与该智能语音设备使用用户对应具有识别特征的识别音频。
57.需要说明的是,识别音频可以为白噪声。智能语音设备上的特征生成模块生成的具有识别特征的识别音频可以通过智能语音设备本地生成或下载具有一定可辨度对应用户的具有识别特征值的白噪声音频,白噪声音频是可以根据自身需要调整白噪声达到人耳无法听到的频率,避免影响通话语音质量;同时保证进行通讯设备的白噪声都具有不同的特征值。
58.在本技术实施例中,特征激活模块用于在用户对该智能语音设备讲话时,激活特征播放模块。
59.需要说明的是,在用户通过智能语音设备进行视频语音通话的过程中,当用户对自身智能语音设备说话时,激活特征播放模块。若用户的智能语音设备处于安静或静默状态则关闭特征播放模块。
60.在本技术实施例中,特征播放模块用于播放识别音频。
61.需要说明的是,特征播放模块是控制智能语音设备播放特征生成模块生成的识别音频,使识别音频与用户声音一起被智能语音设备存储。
62.在本技术实施例中,视频语音通话模块用于远程视频通话交互。
63.需要说明的是,智能语音设备通过视频语音通话模块具有远程视频通话功能,实现远程交换具有识别特征的识别音频并存储。
64.在本技术实施例中,语音识别模块于对该智能语音设备接收唤醒指令的视频语音进行识别提取视频语音中的唤醒识别特征。
65.需要说明的是,智能语音设备通过语音识别模块识别该智能语音设备接收具有识别特征音频的唤醒令进行设备唤醒等操作;提取该音频所有包含的特征(包括白噪声特
征)。
66.在本技术实施例中,特征匹配模块用于将唤醒识别特征与该智能语音设备的识别特征进行匹配,判断是否根据该智能语音设备接收唤醒指令进行唤醒或静默。
67.需要说明的是,智能语音设备通过特征匹配模块根据唤醒识别特征查询匹配此唤醒指令归属于哪个设备,判断自身设备是进行“唤醒”还是“静默”。
68.在本技术实施例中,智能语音设备通过特征生成模块、特征激活模块、特征播放模块、视频语音通话模块、语音识别模块和特征匹配模块实现防误唤醒功能,成本更低,无需额外硬件或设备的增加;使得智能语音设备应用场景更丰富,满足各种通话模式,如单对单,多对多的通话模式,也满足单设备多人使用的复杂场景。该智能语音设备实用性更强,无论是否因网络波动或其它不可控因素造成如声音断断续续、声音的延迟、只有声音没有画面、画面与声音不同步等问题,都不会影响效果,因白噪声已与人声混到一起才被传送。智能语音设备使用更为便捷,不用单独为每个智能语音设备的设置不同的唤醒词。
69.图3为本技术另一实施例所述的语音交互的智能语音设备防误唤醒方法的框架图。
70.在本技术实施例中,具有防误唤醒的智能语音设备通过该语音交互的智能语音设备防误唤醒方法防误唤醒,可以通过以下案例说明,如图3所示,用户小王通过智能音箱设备a与小李家智能音箱设备b进行视频通话,且两台智能音箱都有其它智能插座、智能灯等设备绑定,通过各自的智能音箱进行操控。再视频通话的过程中,小王通过语音“小翼小翼”唤醒智能音箱设备a,然后对其语音控制“断开插座电源”控制智能插座关闭电源,同时小李家智能音箱设备b也接收到了“小翼小翼”唤醒语音指令,经过判断智能音箱设备b保持“静默”状态,忽略此条唤醒指令,从而避免自己家智能插座被误操作“断电”。其过程是:智能音箱设备的语音识别模块持续识别智能音箱设备接收声音等待设备唤醒;智能音箱设备通过特征生成模块获取唤醒指令中的白噪声音频;小王通过智能音箱设备a发起与小李的视频通话请求,小李接通后,视频语音通话模块远程交换了两台智能音箱设备代表自身具有识别特征的白噪声音频;智能音箱设备通过视频语音通话模块支持智能音箱设备a和智能音箱设备b开始视频通话;小王与小李在通话的过程中,当用户对自身智能音箱设备说话时,其特征激活模块来激活特征播放模块,如果用户安静状态则关闭特征播放模块;当小王对自己的智能音箱设备a喊道“小翼小翼”时特征播放模块被激活,控制智能音箱设备播放白噪声1音频,使白噪声与小王的声音一起被智能音箱设备a接收存储,此时小李的智能音箱设备b也会播放智能音箱设备a传输过来的“小翼小翼”的音频声音;智能音箱设备a、智能音箱设备b自身的语音识别模块通过智能音箱设备接收的音频声音提取音频特征(包括白噪声特征),两台智能音箱设备都识别“小翼小翼”唤醒语音指令;小王的智能音箱设备a识别到“小翼小翼”唤醒指令后,进一步提取此音频声音段覆盖白噪声特征,通过智能音箱设备a的特征匹配模块根据此特征值查询匹配符合白噪声1,白噪声1属于自身智能音箱设备a,于是智能音箱设备a进行“唤醒”,并等待语音指令的下发。小王听到智能音箱设备a已被唤醒,继续通过语音对设备下发指令“断开插座电源”,智能音箱设备a的语音识别模块识别到该指令,并执行“智能插座断电操作”;同时,小李的智能音箱设备b也识别到“小翼小翼”唤醒语音指令后,进一步提取此音频声音片段覆盖白噪声特征,智能音箱设备b的特征匹配模块根据此特征值查询匹配符合白噪声1,白噪声1属于自身智能音箱设备a而不是自身智能音
箱设备b,判断该条指令不是针对智能音箱设备b自身下发的。于是智能音箱设备b保持“静默”,当用户小王通过语音“断开插座电源”喊话时,虽然智能音箱设备b同样收到此声音,但因设备未被唤醒,所以不会执行任何操作;如果小李对智能音箱设备b进行唤醒,智能音箱设备b是识别到“唤醒”语音命令后,提取包含此“唤醒”命令的帧所包含的白噪声特征,并通过其自身的特征匹配模块匹配到白噪声属于智能音箱设备b,智能音箱设备b被“唤醒”等待语音指令。而虽然小王的智能音箱设备a也同样识别到“唤醒”指令,但是在进一步判断白噪声归属时,发现该白噪声不属于自身,则保持“静默”状态。如果此时因小王、小李同时在说话,造成白噪声特征包含了2组,则智能音箱a、b都保持或恢复“静默”状态。
71.在本技术的一个实施例中,该语音交互的智能语音设备防误唤醒方法包括:若第一用户和第二用户一通下发控制对应智能语音设备操作的唤醒指令,则第一智能语音设备和第二智能语音设备均不会被唤醒。
72.实施例二:
73.图4为本技术实施例所述的语音交互的智能语音设备防误唤醒系统的框架图。
74.如图4所示,本技术还提供一种语音交互的智能语音设备防误唤醒系统,应用于至少两台智能语音设备对应用户的视频语音交互上,每台智能语音设备上设置有用于识别的识别特征,该智能语音设备防误唤醒系统包括:数据获取单元10、交互提取单元20和识别唤醒单元30;
75.数据获取单元10,用于获取第一智能语音设备的第一识别特征和与第一识别特征对应的第一用户,以及获取第二智能语音设备的第二识别特征和与第二识别特征对应的第二用户;
76.交互提取单元20,用于通过第一用户与第二用户的语音交互,第一用户或第二用户下发控制对应智能语音设备操作的唤醒指令,第一智能语音设备和第二智能语音设备接收唤醒指令并对接收唤醒指令进行特征提取,得到与唤醒指令对应的唤醒识别特征;
77.识别唤醒单元30,用于根据唤醒识别特征确定是否与第一识别特征或第二识别特征一致,只有与唤醒识别特征一致的第一识别特征或第二识别特征对应智能语音设备被唤醒,该智能语音设备才能根据唤醒指令执行操作;
78.其中,第一识别特征、第二识别特征和唤醒识别特征均为白噪声音频,白噪声音频包含具有识别其音频的特征值。
79.在本技术实施例中,识别唤醒单元30还用于若与唤醒识别特征不一致的第一识别特征或第二识别特征对应智能语音设备不会被唤醒,该智能语音设备保持沉默。
80.在本技术实施例中,该语音交互的智能语音设备防误唤醒系统包括特征传送单元,特征传送单元用于通过第一用户与第二用户的语音交互之后,将第一识别特征随着视频通话传送至第二智能语音设备和将第二识别特征随着视频通话传送至第一智能语音设备。
81.需要说明的是,实施例二中模块的内容对应于实施例一方法中的步骤,实施例一方法步骤的内容已经在实施例一中详细阐述了,在实施例二不再对系统中模块的内容重复阐述。
82.实施例三:
83.本技术还提供一种一种终端设备,包括处理器和存储器;
84.存储器,用于存储程序代码,并将程序代码传输给处理器;
85.处理器,用于根据程序代码中的指令执行上述的语音交互的智能语音设备防误唤醒方法。
86.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
87.在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
88.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
89.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
90.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
91.以上所述,以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!