用数据复用法确定声纹认证阈值的声纹认证系统及方法

文档序号:7759684阅读:148来源:国知局
专利名称:用数据复用法确定声纹认证阈值的声纹认证系统及方法
技术领域
本发明涉及一种声纹认证系统,尤其涉及一种用数据复用法确定声纹认证阈值的声纹认证系统;此外,本发明还涉及该声纹认证系统的实现方法。
背景技术
声纹识别(Voic^print recognition), 又称为说话人识别 (SpeakerRecognition),是一项根据语音波形中反映说话人生理、心理和行为特征的语音参数,自动识别说话人身份的技术。由于先天声道结构的差异以及后天养成的发音习惯的不同,导致每个人的声音都具有独特性,根据这一独特性,可以准确的对人的身份加以区分。声纹认证系统(或声纹识别)中,阈值是一个非常关键的参数,由于每个人发音器官生理特征和发音习惯的不同,每个人的阈值并不一样。为了为每个用户确定阈值,通常需要另外收集用户的语音数据,这增加了用户的使用复杂度。因此,需要研发一种声纹认证系统,用来更方便快捷地为每个用户确定声纹认证阈值,以降低系统的使用复杂度。

发明内容
本发明要解决的技术问题是提供一种用数据复用法确定声纹认证阈值的声纹认证系统,其不需要用户提供额外的数据即可为其确定声纹认证的阈值,减少了用户的操作, 使声纹认证系统使用起来更加方便,更易为用户接受。为此,本发明还提供了该声纹认证系统的实现方法。为解决上述技术问题,本发明提供一种用数据复用法确定声纹认证阈值的声纹认证系统,包括密码建立模块、语音识别模块和声纹识别模块;该密码建立模块与服务器相连,服务器产生随机密码并提供给用户或用户设定固定密码,用户提供语音数据,并提交到服务器;该语音识别模块用于对用户提供的语音进行内容分析,对提供的语音内容与密码内容进行模式匹配,若两者不符合,说明用户提供的密码不合要求,若两者相符,则进入声纹识别模块;该声纹识别模块分为注册单元和测试单元,该注册单元包括建立模型模块和确定阈值模块,在注册单元建立说话人模型,同时复用用户的注册数据,为每个用户确定其声纹认证的阈值;在测试单元调用说话人模型,分析测试时提供的语音特征,与用户的声纹确认阈值进行比较,判断接受或拒绝。所述声纹识别模块中在注册单元建立说话人模型,具体为说话人提供若干段固定密码及随机数字串的语音数据,在由大量说话人的大量语音训练出的通用背景模型的基础上,通过最大后验概率自适应算法对该说话人的模型参数进行估计,建立该说话人模型。所述声纹识别模块中在注册单元复用用户的注册数据,为每一个用户确定其声纹认证的阈值,具体为用一部分说话人的语音数据来训练说话人模型,其余的语音数据对所训练的说话人模型进行测试(将其余的语音数据与说话人模型进行匹配,得到多个测试语音的评分),用所测试的结果(即多个测试语音的评分)来估计阈值,这个过程可根据情况进行多次,以得到阈值的最佳估计。所述声纹识别模块中在测试单元调用说话人模型,分析测试时提供的语音特征, 获得测试语音与该说话人模型匹配的一个匹配评分,并将该评分与声纹认证的阈值进行匹配,进行一个确认判决,若评分大于阈值,则接受,反之,若评分低于阈值,则拒绝。此外,本发明还提供一种用数据复用法确定声纹认证阈值的声纹认证系统的实现方法,包括如下步骤(1)服务器产生随机密码并提供给用户或用户设定固定密码;(2)用户提供语音;(3)语音识别模块对用户提供的语音进行内容分析,对提供的语音内容与密码内容进行模式匹配,判断两者是否相符,若不符合,说明用户提供的密码不合要求,应予以拒绝,回到步骤⑵;若相符,则进入步骤⑷;(4)在注册阶段,声纹识别模块建立说话人模型,同时复用用户的注册数据,为每个用户确定其声纹认证的阈值;在测试阶段,声纹识别模块调用说话人模型,分析测试时提供的语音特征,与用户的声纹确认阈值进行比较,判断接受或拒绝。步骤(4)中,所述在注册阶段声纹识别模块建立说话人模型,具体为说话人提供若干段固定密码及随机数字串的语音数据,在由大量说话人的大量语音训练出的通用背景模型的基础上,通过最大后验概率自适应算法对该说话人的模型参数进行估计,建立该说话人模型。步骤中,所述在注册阶段声纹识别模块复用用户的注册数据,为每一个用户确定其声纹认证的阈值,具体为用一部分说话人的语音数据来训练说话人模型,其余的语音数据对所训练的说话人模型进行测试(将其余的语音数据与说话人模型进行匹配,得到多个测试语音的评分),用所测试的结果(即多个测试语音的评分)来估计阈值,这个过程可根据情况进行多次,以得到阈值的最佳估计。步骤中,所述在测试阶段声纹识别模块调用说话人模型,分析测试时提供的语音特征,获得测试语音与该说话人模型匹配的一个匹配评分,并将该评分与声纹认证的阈值进行匹配,进行一个确认判决,若评分大于阈值,则接受,结束流程;反之,若评分低于阈值,则拒绝,回到步骤⑵。本发明的有益效果在于本发明通过复用用户的注册数据,不需要用户提供额外的数据即可为其确定声纹认证的阈值,减少了用户的操作,使声纹认证系统使用起来更加方便,更易为用户接受。


图1是本发明系统的模块结构示意图;图2是本发明方法中注册阶段的流程示意图;图3是本发明方法中测试阶段的流程示意图;图4是本发明方法中阈值确定的流程示意图。
具体实施例方式
5
如图1所示,本发明的声纹认证系统需要用户提供符合要求的语音,本发明以随机密码为例,主要分三部分第一密码建立模块,由服务器产生随机密码并提供给用户,用户提供一定数量的符合要求的语音数据,并提交到服务器。第二 语音识别模块,该模块对用户提供的语音进行内容分析,对提供的语音与密码内容进行模式匹配,判断两者是否相符,若不符合,说明用户提供的密码不合要求,应与拒绝。若相符,则进入下面的声纹识别模块。第三声纹识别模块,该模块由两部分组成注册单元和测试单元;注册单元包括建立模型模块和确定阈值模块;建立模型模块用于建立说话人模型,具体为说话人提供若干段语音数据,在由大量说话人的大量语音训练出的通用背景模型(例如高斯混合模型)的基础上,通过最大后验概率自适应算法(本领域公知的经典算法)对该说话人的模型参数进行估计,建立该说话人模型;同时,启动确定阈值模块,具体为复用用户的注册数据,为每一个用户确定其声纹认证的阈值,即用一部分说话人的语音数据来训练说话人模型,其余的语音数据对所训练的说话人模型进行测试(即将其余的语音数据与说话人模型进行匹配,得到多个测试语音的评分),用所测试的结果(即多个测试语音的评分)来估计阈值。用户阈值的估计过程可采用如下方法由用户数据复用方法得到的评分来估计出一个用户对自己模型的匹配得分,并根据该得分对用户的阈值(初始为普通用户阈值,即公共阈值)进行调整优化,若该得分较普通用户高,则可在普通用户阈值(公共阈值)的基础上调高该用户的阈值,反之,调低该用户的阈值,调整的幅度与该评分相关。这个过程可根据情况进行多次,以得到阈值的最佳估计。测试单元系统调用声明的说话人模型,分析测试时提供的语音特征,获得测试语音与该声明的说话人模型匹配的一个匹配评分,并将该评分与用户的声纹确认阈值进行比较,进行一个确认判决,判断接受或拒绝,若评分大于阈值,则接受,反之,若评分低于阈值,则拒绝。如图2和图3所示,本发明声纹认证系统的实现方法,以随机密码为例,包括如下步骤(1)服务器产生随机密码并提供给用户;(2)用户提供语音数据,并提交到服务器;(3)语音识别模块对用户提供的语音进行内容分析,对提供的语音内容与密码内容进行模式匹配,判断两者是否相符,若不符合,说明用户提供的密码不合要求,应予以拒绝,回到步骤⑵;若相符,则进入步骤⑷;(4)在注册阶段,声纹识别模块建立说话人模型(即注册模型),同时复用用户的注册数据,为每个用户确定其声纹认证的阈值,见图2 ;在测试阶段,声纹识别模块调用说话人模型(即注册模型),分析测试时提供的语音特征,获得测试语音与该声明的说话人模型匹配的一个匹配评分,并将该评分与用户的声纹确认阈值进行比较,进行一个确认判决, 若评分大于阈值,则接受,结束流程;反之,若评分低于阈值,则拒绝,回到步骤O),见图3。如图4所示,在用户注册过程时,需要用户提供N条训练数据(即图4中的用户注册语音1、2……N),如N = 5,取其中的M条用于训练模型(如M = N-1),其余N-M条 (即M+1……N条)用于测试(即调用声纹模型(说话人模型)进行模型匹配),可以得到 Cf* (N-M)个测试语音的评分用于确定阈值。如当N = 5,M = 4时,C^ *(N-M)=5,即相当于有5条测试语音的评分,而不需要用户专门提供5条语音用于确定阈值。这样,当用户注册完成时,即为其确定了阈值,其声纹模型(即说话人模型、注册模型)即已建立完整,后面即可进行正常登录使用了。 本发明采用复用数据的方法确定声纹认证的阈值,通过复用用户的注册数据,不需要额外的数据即可确认用户的声纹认证阈值,简化了用户操作,确认阈值方式更加方便快捷。
权利要求
1.一种用数据复用法确定声纹认证阈值的声纹认证系统,其特征在于,包括密码建立模块、语音识别模块和声纹识别模块;该密码建立模块与服务器相连,服务器产生随机密码并提供给用户或用户设定固定密码,用户提供语音数据,并提交到服务器;该语音识别模块用于对用户提供的语音进行内容分析,对提供的语音内容与密码内容进行模式匹配,若两者不符合,说明用户提供的密码不合要求,若两者相符,则进入声纹识别模块;该声纹识别模块分为注册单元和测试单元;该注册单元包括建立模型模块和确定阈值模块,在注册单元建立说话人模型,同时复用用户的注册数据,为每个用户确定其声纹认证的阈值;在测试单元调用说话人模型,分析测试时提供的语音特征,与用户的声纹确认阈值进行比较,判断接受或拒绝。
2.如权利要求1所述的用数据复用法确定声纹认证阈值的声纹认证系统,其特征在于,所述声纹识别模块中在注册单元建立说话人模型,具体为说话人提供若干段固定密码及随机数字串的语音数据,在由大量说话人的大量语音训练出的通用背景模型的基础上, 通过最大后验概率自适应算法对该说话人的模型参数进行估计,建立该说话人模型。
3.如权利要求1或2所述的用数据复用法确定声纹认证阈值的声纹认证系统,其特征在于,所述声纹识别模块中在注册单元复用用户的注册数据,为每一个用户确定其声纹认证的阈值,具体为用一部分说话人的语音数据来训练说话人模型,其余的语音数据对所训练的说话人模型进行测试,用所测试的结果来估计阈值,这个过程可根据情况进行多次,以得到阈值的最佳估计。
4.如权利要求3所述的用数据复用法确定声纹认证阈值的声纹认证系统,其特征在于,所述其余的语音数据对所训练的说话人模型进行测试,用所测试的结果来估计阈值,具体为将其余的语音数据与说话人模型进行匹配,得到多个测试语音的评分,用该多个测试语音的评分来估计阈值。
5.如权利要求1所述的用数据复用法确定声纹认证阈值的声纹认证系统,其特征在于,所述声纹识别模块中在测试单元调用说话人模型,分析测试时提供的语音特征,获得测试语音与该说话人模型匹配的一个匹配评分,并将该评分与声纹认证的阈值进行匹配,进行一个确认判决,若评分大于阈值,则接受,反之,若评分低于阈值,则拒绝。
6.一种用数据复用法确定声纹认证阈值的声纹认证系统的实现方法,其特征在于,包括如下步骤(1)服务器产生随机密码并提供给用户或用户设定固定密码;(2)用户提供语音;(3)语音识别模块对用户提供的语音进行内容分析,对提供的语音内容与密码内容进行模式匹配,判断两者是否相符,若不符合,说明用户提供的密码不合要求,应予以拒绝,回到步骤O);若相符,则进入步骤;(4)在注册阶段,声纹识别模块建立说话人模型,同时复用用户的注册数据,为每个用户确定其声纹认证的阈值;在测试阶段,声纹识别模块调用说话人模型,分析测试时提供的语音特征,与用户的声纹确认阈值进行比较,判断接受或拒绝。
7.如权利要求6所述的用数据复用法确定声纹认证阈值的声纹认证系统的实现方法,其特征在于,步骤中,所述在注册阶段声纹识别模块建立说话人模型,具体为说话人提供若干段固定密码及随机数字串的语音数据,在由大量说话人的大量语音训练出的通用背景模型的基础上,通过最大后验概率自适应算法对该说话人的模型参数进行估计,建立该说话人模型。
8.如权利要求6所述的用数据复用法确定声纹认证阈值的声纹认证系统的实现方法, 其特征在于,步骤中,所述在注册阶段声纹识别模块复用用户的注册数据,为每一个用户确定其声纹认证的阈值,具体为用一部分说话人的语音数据来训练说话人模型,其余的语音数据对所训练的说话人模型进行测试,用所测试的结果来估计阈值,这个过程可根据情况进行多次,以得到阈值的最佳估计。
9.如权利要求8所述的用数据复用法确定声纹认证阈值的声纹认证系统的实现方法, 其特征在于,所述其余的语音数据对所训练的说话人模型进行测试,用所测试的结果来估计阈值,具体为将其余的语音数据与说话人模型进行匹配,得到多个测试语音的评分,用该多个测试语音的评分来估计阈值。
10.如权利要求6所述的用数据复用法确定声纹认证阈值的声纹认证系统的实现方法,其特征在于,步骤(4)中,所述在测试阶段声纹识别模块调用说话人模型,分析测试时提供的语音特征,获得测试语音与该说话人模型匹配的一个匹配评分,并将该评分与声纹认证的阈值进行匹配,进行一个确认判决,若评分大于阈值,则接受,结束流程;反之,若评分低于阈值,则拒绝,回到步骤O)。
全文摘要
本发明公开了一种用数据复用法确定声纹认证阈值的声纹认证系统,包括密码建立模块、语音识别模块和声纹识别模块;密码建立模块与服务器相连,服务器产生随机密码给用户或用户设定固定密码;语音识别模块用于对用户提供的语音内容与密码内容进行模式匹配,若相符,则进入声纹识别模块;声纹识别模块分为注册单元和测试单元,注册单元包括建立模型模块和确定阈值模块,在注册单元建立说话人模型,同时复用用户的注册数据,确定其声纹认证阈值;在测试单元调用说话人模型,分析测试时提供的语音特征,与用户的声纹确认阈值做比较,判断接受或拒绝。此外,本发明还公开了该系统的实现方法。本发明操作简单,使用起来更加方便,更易为用户接受。
文档编号H04L29/06GK102404287SQ20101028073
公开日2012年4月4日 申请日期2010年9月14日 优先权日2010年9月14日
发明者李霄寒, 许东星, 黄伟 申请人:盛乐信息技术(上海)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1