语音多级身份验证方法

文档序号：9397893阅读：351来源：国知局

语音多级身份验证方法
【技术领域】
[0001] 本发明涉及一种身份验证方法，特别是一种语音多级身份验证方法。
【背景技术】
[0002] 随着通讯技术和计算机网络的飞速发展，顾客可以用电话或网络接受金融、购物、查询等日常服务。银行等机构在提供服务前需鉴定顾客的身份，以便防止假冒者入侵。用户名和密码等身份验证信息容易泄漏，造成安全隐患。基于人的生理和行为特征的生物身份鉴别认证技术，是近年来发展起来的一门高新技术，它是利用与生倶来的生理和行为特征来鉴别每个人的真实身份，可杜绝信息泄漏，大大降低假冒或者恶意攻击的侵入危险。与传统的以"物"（密码、钥匙、磁卡等）进行身识别技术相比，这种技术具有更好的安全性和准确性，能克服传统方法中的丢失、盗用、复制等缺点，随着计算机技术和信息化社会的发展，说话人识别技术凭借其简单、方便、经济及可扩展性等良好的优势，将会有更加广阔的市场应用前景。
[0003] 具体来说，说话人辨识就是判定待测说话人的语音属于多个参考说话人之中的某一个，每一次辨识需要将待测语音去匹配所有说话人的参考模型，找出最相近模型所对应的说话人作为辨识结果，这样必然导致注册人数越多，花费时间越长，当注册人数达到一定数量后，系统很难做到实时响应。对此一些学者提出了自己的解决方案，例如利用模型距离定义类模型，识别时先进行类模型识别，然后在对应的类模型中寻找目标说话人。例如用 GMM模型的KL距离，把相似的说话人聚在一起等等方法。这些方法共同特点是利用GMM 模型定义距离，其缺点是首先要训练每个说话人的GMM模型，且GMM模型是一种概率统计模型，随着注册说话人的增多，提取的语音特征矢量之间重叠较为严重，用GMM模型进行识别时，识别率下降很快。而PCA分类器不需要训练，直接可由语音特征矢量求得，实现比较快速、简单。且SVM是一种基于结构风险最小化原则的模式分类方法，在处理样本中非线性、高维数问题时有很大的优势，应用在基于语音特征样本的说话人识别上有良好的效果，不会随着注册说话人的增多而识别率下降。

【发明内容】

[0004] 为了克服现有技术的不足，本发明提供一种语音多级身份验证方法。
[0005] 本发明解决其技术问题所采用的技术方案是：
[0006] -种语音多级身份验证方法，其特征在于：包括，
[0007] 步骤一，首先建立[nX (n_l)]/2个一对一的一级注册说话人模型，
[0008] 步骤二，用PCA分类方式对待测语音进行粗分类，取采用PCA分类方式粗判决得出的M个说话人作为进一步的目标说话人，
[0009] 步骤三，然后从建立好的一级说话人模型中的数据库中提取此M个说话人再次构建[MX (M_l)]/2个二级注册说话人模型，在这些模型中做出最终的判决。
[0010] 所述步骤二中采用PCA分类方式对待测语音进行粗分类的所用公式在于： CN 105118510 A 说明书 2/3 页
[0012] 上述公式中，WsR表模型空间，s = 1，2,…，η，η为注册的说话人人数，λ为原向量向其投影后保留的方差总和，通过上述计算，并提取特征矢量X，计算在子空间的投影方差：
[0013] λ3= Il (Ws)T(X_ms) ||2,取方差最大的前M个说话人作为预选的目标说话人。
[0014] 本发明的有益效果是：传统的识别方法是将待测语音输入到建立的模型中，需要判决[nX(n-l)]/2个建立的模型，而本申请提出的辨识方法，根据预判决只需判决 [MX (M-l)]/2个二级注册说话人模型，大大减少了预判决的二级注册说话人模型个数，从而大大提高了辨识速度。
【附图说明】
[0015] 下面结合附图和实施例对本发明进一步说明。
[0016] 图1是PCA分类方式的流程示意框图。
【具体实施方式】
[0017] 本文提出的多级说话人辨识方法有效地解决了辨识速度低的问题，按如下步骤：
[0018] 步骤一，首先建立[nX (n_l)]/2个一对一的一级注册说话人模型，
[0019] 步骤二，用PCA分类方式对待测语音进行粗分类，取采用PCA分类方式粗判决得出的M个说话人作为进一步的目标说话人，
[0020] 步骤三，然后从建立好的一级说话人模型中的数据库中提取此M个说话人再次构建[MX (M_l)]/2个二级注册说话人模型，在这些模型中做出最终的判决。
[0021] 结合附图1的说明，PCA分类方式具体为：对每一个注册的说话人，在上述的PCA 降维中，得到了？〇4的1；3(8 = 1，2,…，n，n为注册的说话人人数），在此组成分子空间，使得原向量向其投影后保留的方差总和最大，保留的方差总和为

[0023] 对于一段待判决的语音信号，用PCA作为粗分类，首先对其预处理，并提取特征矢量X，计算在子空间的投影方差：λ3= Il (Ws)T(X-ms) ||2,根据PCA的分类依据，X在正确子空间的投影应该比在别的子空间上的投影方差大，为了减少识别误差，取方差最大的前M个说话人作为预选的目标说话人。
[0024] 根据预判决的结果，从训练好的二级注册说话人库中，提取此M个说话人之间的二级注册说话人模型，再用待测语音的特征参数作为二级注册说话人的输入，用投票法做出最终的判决。
[0025] 以上对本发明实施例所提供的一种语音多级身份验证方法，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在【具体实施方式】及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。
【主权项】
1. 一种语音多级身份验证方法，其特征在于：包括，步骤一，首先建立[nX(n-l)]/2个一对一的一级注册说话人模型，步骤二，用PCA分类方式对待测语音进行粗分类，取采用PCA分类方式粗判决得出的M个说话人作为进一步的目标说话人，步骤三，然后从建立好的一级说话人模型中的数据库中提取此M个说话人再次构建[MX(M-l)]/2个二级注册说话人模型，在这些模型中做出最终的判决。2. 根据权利要求1所述的语音多级身份验证方法，其特征在于：所述步骤二中采用PCA 分类方式对待测语音进行粗分类的所用公式在于：A. = 入即：上述公式中，Ws代表模型空间，s= 1，2,…，n，n为注册的说话人人数，A为原向量向其投影后保留的方差总和，通过上述计算，并提取特征矢量X，计算在子空间的投影方差：入s= !! (ws)T(x_ms) ||2，取方差最大的前m个说话人作为预选的目标说话人。
【专利摘要】本发明公开了一种语音多级身份验证方法，传统的识别方法是将待测语音输入到建立的模型中,需要判决[n×(n-1)]/2个建立的模型,而本申请提出的辨识方法,根据预判决只需判决[M×(M？-1)]/2个二级注册说话人模型,大大减少了预判决的二级注册说话人模型个数,从而大大提高了辨识速度。
【IPC分类】H04L29/06, G10L17/02
【公开号】CN105118510
【申请号】CN201510439438
【发明人】刘雪燕, 袁宝玲
【申请人】中山火炬职业技术学院
【公开日】2015年12月2日
【申请日】2015年7月23日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘雪燕;袁宝玲;
技术所有人：中山火炬职业技术学院;
我是此专利的发明人