【】本技术涉及电子,尤其涉及一种语音交互方法、装置和第一电子设备。
背景技术
0、
背景技术:
1、语音是日常生活中携带信息的常用方式,随着语音技术的发展,也出现了越来越多的语音识别算法来进行语音识别,根据语音来源距离的不同分为远场语音和近场语音,在进行语音识别时,可以针对不同的语音来源距离采用不同的语音交互方法来进行语音交互,以便获取到的清晰的、可识别的语音信息。
2、在近场语音交互场景中,用户一般通过手动点击电子设备的唤醒按键或者说出特定唤醒词来触发电子设备的语音交互功能开启,一般的免唤醒功能采用语音的定向拾取,只能对电子设备的某个角度范围的声音进行响应,不能实现近场语音交互场景中对电子设备的轻声免唤醒功能。
技术实现思路
0、
技术实现要素:
1、有鉴于此,本技术实施例提供了一种语音交互方法、装置和第一电子设备,用以实现近场语音交互场景中对电子设备的轻声免唤醒功能。
2、本技术实施例采用下述技术方案:
3、第一方面,本技术实施例提供了一种语音交互方法,该方法应用于第一电子设备,该方法包括:
4、获取环境音信号;
5、当判断出环境音信号包括用户在设定距离范围内输入的声音信号时,对声音信号进行语音识别,生成语音指令;
6、响应于语音指令触发语音交互;或者,向第二电子设备发送语音指令,语音指令用于触发所述第二电子设备进行语音交互。
7、根据本技术提供的语音交互方法,通过判断环境音信号是否包括用户在设定距离范围内输入的声音信号,对用户在设定距离范围内输入的声音信号进行语音识别来触发语音交互,能够实现近场语音交互场景中对电子设备的轻声免唤醒功能。
8、在第一方面的一种实现方式中,判断出环境音信号包括用户在设定距离范围内输入的声音信号,具体包括:
9、识别出环境音信号对应的一个或多个说话人;
10、根据获取的拾音模型,生成每个说话人对应的拾音距离;
11、当一个或多个说话人对应的拾音距离小于设定距离阈值时,则判断出环境音信号包括用户在设定距离范围内输入的声音信号。
12、在第一方面的一种实现方式中,判断出环境音信号包括用户在设定距离范围内输入的声音信号,具体包括:
13、根据环境音信号生成一个或多个说话人对应的拾音距离;
14、当一个或多个说话人对应的拾音距离小于设定距离阈值时,则判断出环境音信号包括用户在设定距离范围内输入的声音信号。
15、进一步地,当一个或多个说话人对应的拾音距离小于设定距离阈值时,则判断出环境音信号满足近场谱分析的条件,能够根据说话人的发声体与第一电子设备的距离判断出当前的环境音信号中包括用户在设定距离范围内输入的声音信号,能够从多个说话人中判断出处于近场语音交互条件的说话人,能够提高后续语音识别的准确性。
16、在第一方面的一种实现方式中,根据环境音信号生成一个或多个说话人对应的拾音距离,具体包括:
17、根据环境音信号生成环境音信号的声压信息和/或声速信息;
18、根据声速信息,生成一个或多个说话人对应的拾音距离;或者,
19、根据声压信息和声速信息,生成一个或多个说话人对应的拾音距离。
20、进一步地,根据声压信息和/或声速信息能够准确得到说话人的拾音距离。
21、在第一方面的一种实现方式中,对声音信号进行语音识别,生成语音指令,具体包括:
22、对一个或多个说话人对应的拾音距离中最小的拾音距离对应的声音信号进行语音识别,生成语音指令。
23、进一步地,通过对一个或多个说话人对应的拾音距离中最小的拾音距离对应的声音信号进行语音识别,能够准确得到距离第一电子设备最近的用户的声音信号,提高了拾音的准确性。
24、在第一方面的一种实现方式中,语音指令包括应用操作指令或录音指令。
25、在第一方面的一种实现方式中,对声音信号进行语音识别之前,还包括:
26、对环境音信号进行声音增强处理,生成声音信号。
27、进一步地,对环境音信号进行声音增强处理,能够去除环境噪声,提高声音信号的质量。
28、在第一方面的一种实现方式中,声音增强处理包括噪声抑制处理和/或混响抑制处理。
29、在第一方面的一种实现方式中,获取环境音信号,具体包括:
30、接收第二电子设备发送的环境音信号。
31、第二方面,本技术实施例提供了一种语音交互装置,该装置应用于第一电子设备,该装置包括:
32、麦克风模块,用于获取环境音信号;
33、判断模块,用于判断环境音信号是否包括用户在设定距离范围内输入的声音信号;
34、语音识别模块,用于当判断模块判断出环境音信号包括用户在设定距离范围内输入的声音信号时,对声音信号进行语音识别,生成语音指令;
35、语音交互模块,用于响应于语音指令触发语音交互;或者,无线通信模块,用于向第二电子设备发送语音指令,语音指令用于触发第二电子设备进行语音交互。
36、在第二方面的一种实现方式中,判断模块具体用于:
37、识别出环境音信号对应的一个或多个说话人;
38、根据获取的拾音模型,生成每个说话人对应的拾音距离;
39、当一个或多个说话人对应的拾音距离小于设定距离阈值时,则判断出环境音信号包括用户在设定距离范围内输入的声音信号。
40、在第二方面的一种实现方式中,判断模块具体用于:
41、根据环境音信号生成一个或多个说话人对应的拾音距离;
42、当一个或多个说话人对应的拾音距离小于设定距离阈值时,则判断出环境音信号包括用户在设定距离范围内输入的声音信号。
43、在第二方面的一种实现方式中,判断模块具体用于:
44、根据环境音信号生成环境音信号的声压信息和/或声速信息;
45、根据声速信息,生成一个或多个说话人对应的拾音距离;或者,
46、根据声压信息和声速信息,生成一个或多个说话人对应的拾音距离。
47、在第二方面的一种实现方式中,还包括:
48、当麦克风模块中麦克风的数量为一颗时,麦克风为声速麦克风;
49、判断模块具体用于根据环境音信号生成环境音信号的声速信息;根据声速信息生成一个或多个说话人对应的拾音距离。
50、在第二方面的一种实现方式中,还包括:
51、当麦克风模块中麦克风的数量为多颗时,麦克风包括一颗声速麦克风和一颗声压麦克风;
52、判断模块具体用于根据环境音信号生成环境音信号的声压信息和声速信息;根据声压信息和声速信息,生成一个或多个说话人对应的拾音距离。
53、在第二方面的一种实现方式中,麦克风处于始终开启状态,以实时获取环境音信号。
54、在第二方面的一种实现方式中,语音识别模块具体用于:
55、对一个或多个说话人对应的拾音距离中最小的拾音距离对应的声音信号进行语音识别,生成语音指令。
56、第三方面,本技术实施例提供了一种计算机可读存储介质,其中,计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行如第一方面所述的方法。
57、第四方面,本技术实施例提供了一种第一电子设备,其中,第一电子设备包括用于存储计算机程序指令的存储器和用于执行计算机程序指令的处理器,其中,当计算机程序指令被该处理器执行时,触发第一电子设备执行如第一方面所述的方法步骤。