一种声纹注册方法、装置及设备与流程

文档序号:35697395发布日期:2023-10-11 20:40阅读:340来源:国知局
一种声纹注册方法、装置及设备与流程

本发明涉及声纹注册,具体为一种声纹注册方法、装置及设备。


背景技术:

1、声纹,是用电声学仪器显示的携带言语信息的声波频谱。现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点,因此能够用于身份识别或者验证随着计算机技术的不断发展,语音对话系统得到了广泛地应用,目前,需要使用预先注册的诸如声纹嵌入码等特征来实现语音。

2、现有声纹信息采集,主要是通过麦克风进行一段语音录制保存为语音文件由于不同的麦克风、环境噪音等因素的差异,造成注册的声纹质量参差不齐,导致语言采集的数据不够精准,同时声纹注册过程不但繁琐,并且当用户声音发生变化时,会造成声纹识别失败,需要反复的重新注册,为此我们提出了一种声纹注册方法、装置及设备。


技术实现思路

1、本发明的目的在于提供一种声纹注册方法、装置及设备,以解决上述背景技术中提出了现有声纹信息采集,主要是通过麦克风进行一段语音录制保存为语音文件由于不同的麦克风、环境噪音等因素的差异,造成注册的声纹质量参差不齐,导致语言采集的数据不够精准,同时声纹注册过程不但繁琐,并且当用户声音发生变化时,会造成声纹识别失败,需要反复的重新注册的问题。

2、为实现上述目的,本发明提供如下技术方案:一种声纹注册方法、装置及设备,包括:

3、通过录音设备记录说话人的语音数据,采集的语音数据进行语音识别,获得语音识别结果,对语音数据存储;

4、对获取的语音样本切分为长度相同的语音帧;

5、将语音识别得到的语音识别结果与随机内容进行比对,保存比对结果一致的语音数据作为原始文件;

6、获取每条语音段中每个语音帧的声纹识别特征,并于声纹注册的录音文件进行声纹注册。

7、优选的,所述的采集的语音数据进行语音识别,根据性别分类器和语音确定用户的性别,同时重复采集的语音数据三次以上。

8、优选的,所述的对获取的语音样本切分为长度相同的语音帧,根据语音样本对应的所有有效的声纹嵌入码获得说话人的注册声纹嵌入码,将每条语音段切分为长度相同且彼此重叠的多个语音帧。

9、优选的,确定目标的语音特征对应非注册用户,且新的语音特征与目标语音特征向量簇的向量距离大于或者等于设定阈值时,将目标新的语音特征加入至目标语音特征向量簇中,得到新的目标语音特征向量簇。

10、优选的,根据每条语音段的声纹嵌入码的所有相似度和预设的相似度阈值确定有效的声纹嵌入码,根据语音样本对应的所有有效的声纹嵌入码获得说话人的注册声纹嵌入码。

11、优选的,根据多个语音段的所有相似度和预设的相似度阈值,确定第一语音段的声音嵌入码的置信度,在第一语音段的声音嵌入码的置信度大于或等于预设置信度阈值时,确定第一语音段的声音嵌入码有效,在第一语音段的声音嵌入码的置信度小于预设置信度阈值时,确定第一语音段的声音嵌入码无效。

12、语言识别模块,用于记录说话人的语音数据,采集的语音数据进行语音识别;

13、数据处理模块,用于处理获取的语音样本切分为长度相同的语音帧;

14、识别模块,用于语音识别得到的语音识别结果与随机内容进行比对;

15、注册模块,用于声纹注册的录音文件进行声纹注册。

16、一个或多个存储器,存储器存储执行指令;

17、存储装置,存储装置执行存储器存储的执行指令,使得处理器执行如权利要求1至7中任一项所述的方法。

18、与现有技术相比,本发明的有益效果是:

19、该声纹注册方法、装置及设备,通过性别分类器和语音确定用户的性别,同时重复采集的语音数据三次以上,对获取的语音样本切分为长度相同的语音帧,根据语音样本对应的所有有效的声纹嵌入码获得说话人的注册声纹嵌入码,将每条语音段切分为长度相同且彼此重叠的多个语音帧,根据语音样本对应的所有有效的声纹嵌入码获得说话人的注册声纹嵌入码,从而能够使注册的声纹质量提高,语言采集的数据更的精准。

20、该声纹注册方法、装置及设备,通过对多个语音段的所有相似度和预设的相似度阈值,确定第一语音段的声音嵌入码的置信度,在第一语音段的声音嵌入码的置信度大于或等于预设置信度阈值时,确定第一语音段的声音嵌入码有效,在第一语音段的声音嵌入码的置信度小于预设置信度阈值时,确定第一语音段的声音嵌入码无效,从而能够在用户声音出现变化的情况下,能够精准识别,避免因声音的变化导致声纹的录制失败,能够一次性完成声纹的录制,无需反复注册。



技术特征:

1.一种声纹注册方法,其特征在于:包括:

2.根据权利要求1所述的一种声纹注册方法,其特征在于:所述的采集的语音数据进行语音识别,根据性别分类器和语音确定用户的性别,同时重复采集的语音数据三次以上。

3.根据权利要求1所述的一种声纹注册方法,其特征在于:所述的对获取的语音样本切分为长度相同的语音帧,根据语音样本对应的所有有效的声纹嵌入码获得说话人的注册声纹嵌入码,将每条语音段切分为长度相同且彼此重叠的多个语音帧。

4.根据权利要求3所述的一种声纹注册方法,其特征在于:确定目标的语音特征对应非注册用户,且新的语音特征与目标语音特征向量簇的向量距离大于或者等于设定阈值时,将目标新的语音特征加入至目标语音特征向量簇中,得到新的目标语音特征向量簇。

5.根据权利要求1所述的一种声纹注册方法,其特征在于:根据每条语音段的声纹嵌入码的所有相似度和预设的相似度阈值确定有效的声纹嵌入码,根据语音样本对应的所有有效的声纹嵌入码获得说话人的注册声纹嵌入码。

6.根据权利要求1所述的一种声纹注册方法,其特征在于:根据多个语音段的所有相似度和预设的相似度阈值,确定第一语音段的声音嵌入码的置信度,在第一语音段的声音嵌入码的置信度大于或等于预设置信度阈值时,确定第一语音段的声音嵌入码有效,在第一语音段的声音嵌入码的置信度小于预设置信度阈值时,确定第一语音段的声音嵌入码无效。

7.一种声纹注册装置,其特征在于:

8.一种声纹注册设备,其特征在于:


技术总结
本发明公开了声纹注册技术领域的一种声纹注册方法、装置及设备,包括:通过录音设备记录说话人的语音数据,采集的语音数据进行语音识别,获得语音识别结果,对语音数据存储;对获取的语音样本切分为长度相同的语音帧;将语音识别得到的语音识别结果与随机内容进行比对,保存比对结果一致的语音数据作为原始文件;获取每条语音段中每个语音帧的声纹识别特征,并于声纹注册的录音文件进行声纹注册,该声纹注册方法、装置及设备,结构设计合理,能够使注册的声纹质量提高,语言采集的数据更的精准,能够在用户声音出现变化的情况下,能够精准识别,避免因声音的变化导致声纹的录制失败,能够一次性完成声纹的录制,无需反复注册。

技术研发人员:班荣军
受保护的技术使用者:安徽声云智能科技有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1