本发明涉及智能家居,特别涉及一种基于智能家居场景的声纹识别方法及相关设备。
背景技术:
1、智能家居场景是指通过互联网、物联网、人工智能等技术将家庭中的各种设备和系统连接起来,从而实现自动化控制和远程管理的环境;这些设备能够通过语音指令、移动设备、传感器等进行交互,从而提升家庭生活的便捷性与舒适性,当然对于家居设备的控制设置有权限,需要对语音进行声纹识别,以完成用户权限的判断。
2、智能家居场景是一个较为复杂的场景,往往存在一个较大的空间范围,且在这个空间范围内容存在多人对话、背景声音或电器噪音等影响因素,且拾音设备的类型众多,对语音的拾取情况也存在差异,现有的声纹识别方法无法适应性地满足多样化拾音设备的使用需要,导致声纹识别准确性的下降。
技术实现思路
1、为解决以上技术问题,本申请提出了一种基于智能家居场景的声纹识别方法及相关设备。
2、本申请的第一方面提供一种基于智能家居场景的声纹识别方法,包括:
3、获取待识别的语音段;
4、确定采集所述待识别的语音段的拾音设备;
5、确定所述拾音设备的位置移动频率,并依据所述位置移动频率识别所述拾音设备的设备类别;
6、采用与所述拾音设备的设备类别对应的声纹识别策略对所述待识别的语音段进行声纹识别。
7、在一个可选的实施例中,当所述拾音设备为第一类别拾音设备时,所述采用与所述拾音设备的设备类别对应的声纹识别策略对所述待识别的语音段进行声纹识别包括:
8、获取所述第一类别拾音设备的移动噪声模式,依据所述移动噪声模式实时调整预设的第一噪声处理算法的参数;
9、调用参数调整后的第一噪声处理算法对所述待识别语音段进行噪声处理,获得第一语音段;
10、获取所述第一类别拾音设备的运动状态信息,基于所述运动状态信息调整第二噪声处理算法的参数;
11、调用参数调整后的第二噪声处理算法对所述第一语音段进行噪声处理,得到第二语音段;
12、调用训练完成的声纹特征提取模型提取所述第二语音段的声纹特征;
13、将提取的声纹特征与预设的声纹数据库中的声纹特征进行比对得到声纹识别结果。
14、在一个可选的实施例中,当所述拾音设备为第二类别拾音设备时,所述采用与所述拾音设备的设备类别对应的声纹识别策略对所述待识别的语音段进行声纹识别包括:
15、调用基于长期噪声数据库进行训练得到的噪音分离模型,对所述待识别的语音段进行噪声分离;
16、对经过噪声分离的语音段进行加密处理,获得第三语音段;
17、将所述第三语音段传送至云端,并接收所述云端发送的基于所述第三语音段提取的声纹特征;
18、获取预设的声纹数据库中与提取的声纹特征的相似度大于预设相似度阈值的目标声纹特征;
19、若所述目标声纹特征的数量大于预设的数量阈值时,则将所述第三语音段传送至边缘端,以使得所述边缘端基于所述第三语音段进行声纹识别。
20、在一个可选的实施例中,所述获取待识别的语音段包括:
21、获取第一类别拾音设备发送的待识别的语音段,其中,所述第一类别拾音设备通过分散式麦克风阵列实时采集语音信号,并结合波束成形技术追踪用户移动轨迹,动态调整声源指向并采集所述待识别的语音段;或
22、获取第二类别拾音设备发送的待识别的语音段,其中,所述第二类别拾音设备通过环形式麦克风阵列建立声场映射,结合长期噪声高斯混合模型抑制背景噪音并采集所述待识别的语音段。
23、在一个可选的实施例中,所述采用与所述拾音设备的设备类别对应的声纹识别策略对所述待识别的语音段进行声纹识别包括:
24、提取所述待识别的语音段的情绪相关信息;
25、将所述情绪相关信息输入到训练完成的情绪识别模型,得到情绪标签;
26、获取预设的第一声纹数据库中与所述情绪标签对应的目标情绪相关信息;
27、采用与所述拾音设备的设备类别对应的声纹识别策略及所述目标情绪相关信息对所述待识别的语音段进行声纹识别。
28、在一个可选的实施例中,所述方法还包括:
29、获取预设的声纹数据库中与所述待识别的语音段对应的第一声纹特征;
30、计算所述待识别的语音段的第二声纹特征与所述第一声纹特征之间的相似度评分;
31、当所述相似度评分高于预设的第一相似度阈值且低于预设的第二相似度阈值时,将所述第一声纹特征与所述第二声纹特征进行关联;
32、后续在多次声纹识别中,待识别的语音段与所述第二声纹特征的相似度评分高于所述预设的第二相似度阈值,且高于的次数超过预设的次数阈值时,则将所述第一声纹特征替换为所述第二声纹特征。
33、在一个可选的实施例中,所述方法还包括:
34、对所述待识别的语音段进行预处理。
35、本申请的第二方面提供一种基于智能家居场景的声纹识别系统,所述系统包括:
36、语音采集模块,用于获取待识别的语音段;
37、设备确定模块,用于确定采集所述待识别的语音段的拾音设备;
38、类别识别模块,用于确定所述拾音设备的位置移动频率,并依据所述位置移动频率识别所述拾音设备的设备类别;
39、声纹识别模块,用于采用与所述拾音设备的设备类别对应的声纹识别策略对所述待识别的语音段进行声纹识别。
40、本申请的第三方面提供一种电子设备,所述电子设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述的基于智能家居场景的声纹识别方法的步骤。
41、本申请的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于智能家居场景的声纹识别方法的步骤。
42、有益效果:
43、本发明提供了一种基于智能家居场景的声纹识别方法及相关设备,基于拾音设备的移动特性,具有针对性地进行语音的声纹识别,能够有效提高智能家居场景的声纹识别准确性;具体地,通过拾音设备的位置移动频率,对拾音设备进行有效分类;建立语音段与其来源的拾音设备,同时基于语音段来源的拾音设备的差异,对语音段选取不同的声纹识别策略,实现了差异化处理,从而提高了智能家居场景声纹识别的准确性。
1.一种基于智能家居场景的声纹识别方法,其特征在于,包括:
2.根据权利要求1所述的一种基于智能家居场景的声纹识别方法,其特征在于,当所述拾音设备为第一类别拾音设备时,所述采用与所述拾音设备的设备类别对应的声纹识别策略对所述待识别的语音段进行声纹识别包括:
3.根据权利要求1所述的一种基于智能家居场景的声纹识别方法,其特征在于,当所述拾音设备为第二类别拾音设备时,所述采用与所述拾音设备的设备类别对应的声纹识别策略对所述待识别的语音段进行声纹识别包括:
4.根据权利要求1所述的一种基于智能家居场景的声纹识别方法,其特征在于,所述获取待识别的语音段包括:
5.根据权利要求1所述的一种基于智能家居场景的声纹识别方法,其特征在于,所述采用与所述拾音设备的设备类别对应的声纹识别策略对所述待识别的语音段进行声纹识别包括:
6.根据权利要求5所述的一种基于智能家居场景的声纹识别方法,其特征在于,所述方法还包括:
7.根据权利要求5所述的基于智能家居场景的声纹识别方法,其特征在于,所述方法还包括:
8.一种基于智能家居场景的声纹识别系统,其特征在于,所述系统包括:
9.一种电子设备,其特征在于,所述电子设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现根据权利要求1至7中任意一项所述的基于智能家居场景的声纹识别方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现根据权利要求1至7中任意一项所述的基于智能家居场景的声纹识别方法的步骤。