声纹认证方法、装置、介质及电子设备与流程

文档序号：20268266发布日期：2020-04-03 18:40阅读：来源：国知局

技术特征：

1.一种声纹认证方法，其特征在于，包括：

获取目标用户在预设时间段前的声纹信息、年龄、性别和所处环境；

将所述目标用户在预设时间段前的声纹信息、年龄、性别和所处环境输入第一预测模型得到预测声纹信息；

采集当前用户的待认证声纹信息；

将所述预测声纹信息与所述待认证声纹信息进行匹配，以获得第一匹配度；

若所述第一匹配度超过第一预设阈值，则将所述当前用户确定为所述目标用户。

2.根据权利要求1所述的声纹认证方法，其特征在于，在所述获取目标用户预设时间段前的声纹信息之后，所述方法包括：

对所述声纹信息进行降噪处理得到纯语音数据；

对所述纯语音数据进行分帧，基于人耳耳蜗听觉模型提取每帧语音数据中的听觉倒谱系数特征；

所述将所述目标用户在预设时间段前的声纹信息、年龄、性别和所处环境输入第一预测模型得到预测声纹信息包括：将年龄、性别、所处环境及每帧的听觉倒谱系数特征输入第一预测模型，以获得每帧的预测声纹信息；

根据所述每帧的预测声纹信息得到所述预测声纹信息。

3.根据权利要求1所述的声纹认证方法，其特征在于，所述方法还包括：

获取所述目标用户在预设时间段前的人脸图像信息；

将所述目标用户预设时间段前的人脸图像、年龄、性别输入第二预测模型获得预测人脸图像信息；

采集所述当前用户的待认证人脸图像信息；

将所述预测人脸图像信息与所述待认证人脸图像信息进行匹配，以获得第二匹配度；

在所述获得第一匹配度之后，所述方法还包括：

将所述第一匹配度和所述第二匹配度进行加权和计算以获得总匹配度；若所述总匹配度大于第二预设阈值，则确定所述当前用户为所述目标用户。

4.根据权利要求1所述的声纹认证方法，其特征在于，所述将所述预测声纹信息与所述待认证声纹信息进行匹配，以获得第一匹配度，包括：

基于人耳耳蜗听觉模型提取所述目标用户在预设时间段前的声纹信息的听觉倒谱系数特征，将所述听觉倒谱系数特征输入第一深度神经网络模型得到深度瓶颈特征；

将所述听觉倒谱系数特征和所述深度瓶颈特征按照公式y＝ag+bb计算，得到所述目标用户在预设时间段前的声纹信息的融合特征y，其中，g为所述听觉倒谱系数特征，b为所述深度瓶颈特征，系数a和b预先通过以下过程获得：获取所述目标用户在预设时间段前的声纹信息样本集合，求使语音区分度r取最小值时a与b的值，0≤a≤1，0≤b≤1，a+b＝1，其中，n为所述目标用户在所述预设时间段前的声纹信息样本集合中的声纹数，yi与yj分别为基于在声纹信息样本集合中所述目标用户的第i条语音和第j条语音的听觉倒谱系数特征g和深度瓶颈特征b按照y＝ag+bb得到的所述融合特征；

将所述待认证声纹信息的融合特征与所述预测声纹信息的融合特征进行比较，以获得第一匹配度。

5.根据权利要求4所述的声纹认证方法，其特征在于，所述基于人耳耳蜗听觉模型提取所述预设时间段前的声纹信息的听觉倒谱系数特征之后，所述方法还包括：

将所述目标用户在预设时间段前的声纹信息的听觉倒谱系数特征输入堆叠降噪自编码网络模型得到所述目标用户在预设时间段前的声纹信息的迁移特征；

将所述迁移特征输入第二深度神经网络模型得到迁移深度瓶颈特征；

将所述听觉倒谱系数特征和所述迁移深度瓶颈特征按照公式y1＝ag+bb1计算，得到所述目标用户在预设时间段前的声纹信息的迁移融合特征y1，其中，g为所述听觉倒谱系数特征，b1为所述迁移深度瓶颈特征；

将所述待认证声纹信息的迁移融合特征与所述预测声纹信息的迁移融合特征进行比较，以获得第三匹配度；

基于所述第一匹配度和所述第三匹配度，判断所述当前用户是否为所述目标用户。

6.一种声纹认证装置，其特征在于，包括：

获取模块，用于获取目标用户在预设时间段前的声纹信息、年龄、性别和所处环境；

第一预测模块，用于将所述目标用户在预设时间段前的声纹信息、年龄、性别和所处环境输入第一预测模型得到预测声纹信息；

采集模块，用于采集当前用户的待认证声纹信息；

匹配模块，用于将所述预测声纹信息与所述待认证声纹信息进行匹配，以获得第一匹配度；

确定模块，若所述第一匹配度超过第一预设阈值，则将所述当前用户确定为所述目标用户。

7.一种电子设备，其特征在于，包括:

一个或多个处理器；

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1至5中任一项所述的声纹认证方法。

8.一种计算机程序介质，其上存储有计算机可读指令，当所述计算机可读指令被计算机的处理器执行时，使计算机执行权利要求1-5中的任一项所述的声纹认证方法。

完整全部详细技术资料下载

当前第2页1 2 3