声纹认证处理方法及装置的制造方法_3

文档序号：9752207阅读：来源：国知局

型比较语音的第二特征向量和声纹注册模型的相似度，根据所述相似度和预设的阈值向所述用户返回声纹识别结果。由此，实现了区分性别的声纹认证过程，提高了声纹认证的效率和准确性。
[0086]为了实现上述实施例，本申请还提出一种声纹认证处理装置。
[0087]图7是本申请一个实施例的声纹认证处理装置的结构示意图。
[0088]如图7所示，该声纹认证处理装置包括:
[0089]提取模块11，用于应用混合性别的深度神经网络DNN声纹基线系统，提取训练集中每条语音的第一特征向量；
[0090]生成模块12，用于根据所述每条语音的第一特征向量以及预先标注的性别标签训练性别分类器；
[0091]第一训练模块13，用于根据所述训练集中不同性别的语音数据，分别训练不同性别的DNN模型；
[0092]第二训练模块14，用于根据不同性别的DNN模型以及所述训练集中不同性别的语音数据，分别训练不同性别的统一背景模型、特征向量提取模型、以及概率线性判别分析模型。
[0093]需要说明的是，前述对声纹认证处理方法实施例的解释说明也适用于该实施例的声纹认证处理装置，此处不再赘述。
[0094]本申请实施例的声纹认证处理装置，应用混合性别的深度神经网络DNN声纹基线系统，提取训练集中每条语音的第一特征向量，根据所述每条语音的第一特征向量以及预先标注的性别标签训练性别分类器，根据所述训练集中不同性别的语音数据，分别训练不同性别的DNN模型，根据不同性别的DNN模型以及所述训练集中不同性别的语音数据，分别训练不同性别的统一背景模型、特征向量提取模型、以及概率线性判别分析模型。由此，建立了区分性别的声纹认证处理模型，以提高声纹认证的效率和准确性。
[0095]图8是本申请另一个实施例的声纹认证处理装置的结构示意图，如图8所示，基于图7所示实施例，还包括:
[0096]第一接收模块15，用于接收用户发送的携带用户标识的声纹注册请求；
[0097]性别标注模块16，用于获取用户发送的用于声纹注册的多条语音，提取第一条语音的第一特征信息，应用所述性别分类器获取所述第一特征信息的性别标签；
[0098]第一处理模块17，用于根据与所述性别标签对应的DNN模型获取每条语音的后验概率;根据与所述性别标签对应的统一背景模型和特征向量提取模型，分别提取每条语音的第二特征向量；
[0099]获取模块18，用于根据与所述多条语音对应的多个第二特征向量获取所述用户的声纹注册模型；
[0100]注册模块19，用于将所述用户标识、所述性别标签、所述声纹注册模型的对应关系存储到声纹注册数据库。
[0101]在一个实施例中，所述获取模块18用于:
[0102]获取所述多个第二特征向量的平均特征向量作为所述用户的声纹注册模型。
[0103]需要说明的是，前述对声纹认证处理方法实施例的解释说明也适用于该实施例的声纹认证处理装置，此处不再赘述。
[0104]本申请实施例的声纹认证处理装置，首先应用性别分类器获取用户输入的第一条语音的性别标签，根据与性别标签对应的DNN模型获取每条语音的后验概率，根据与所述性别标签对应的统一背景模型和特征向量提取模型，分别提取每条语音的第二特征向量，根据多个第二特征向量获取所述用户的声纹注册模型，将所述用户标识、所述性别标签、所述声纹注册模型的对应关系存储到声纹注册数据库。由此，实现了区分性别的声纹注册过程，以便应用区分性别的声纹认证处理模型提高了声纹认证的效率和准确性。
[0105]图9是本申请另一个实施例的声纹认证处理装置的结构示意图，如图9所示，基于图8所示实施例，还包括:
[0106]第二接收模块20，用于接收用户发送的携带用户标识的声纹识别请求；
[0107]查询模块21，用于查询所述声纹注册数据库获取与所述用户标识对应的性别标签和声纹注册模型；
[0108]第二处理模块22，用于获取用户发送的用于声纹识别的语音，根据与所述性别标签对应的DNN模型获取所述语音的后验概率，应用与所述性别标签对应的统一背景模型和特征向量提取模型，提取所述语音的第二特征向量；
[0109]比较模块23，用于应用与所述性别标签对应的概率线性判别分析模型，比较所述语音的第二特征向量和所述声纹注册模型的相似度；
[0110]识别模块24，用于根据所述相似度和预设的阈值向所述用户返回声纹识别结果。
[0111]其中，所述识别模块24用于:
[0112]比较所述相似度和预设的阈值的大小；
[0113]若获知所述相似度大于等于预设的阈值，则返回声纹识别成功；
[0114]若获知所述相似度小于预设的阈值，则返回声纹识别失败。
[0115]需要说明的是，前述对声纹认证处理方法实施例的解释说明也适用于该实施例的声纹认证处理装置，此处不再赘述。
[0116]本申请实施例的声纹认证处理装置，首先查询声纹注册数据库获取与用户标识对应的性别标签和声纹注册模型；应用与性别标签对应的统一背景模型和特征向量提取模型，提取语音的第二特征向量，应用概率线性判别分析模型比较语音的第二特征向量和声纹注册模型的相似度，根据所述相似度和预设的阈值向所述用户返回声纹识别结果。由此，实现了区分性别的声纹认证过程，提高了声纹认证的效率和准确性。
[0117]在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0118]此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。
[0119]流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。
[0120]在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，〃计算机可读介质〃可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取

完整全部详细技术资料下载

当前第3页1 2 3 4