伪随机声纹密码文本生成方法及系统的制作方法

文档序号：10626596阅读：219来源：国知局

伪随机声纹密码文本生成方法及系统的制作方法
【专利摘要】本发明公开了一种伪随机声纹密码文本生成方法及系统，该方法包括：在用户注册阶段生成一个或多个注册声纹密码文本；将所述多个注册声纹密码文本进行拆分，并将拆分后得到的所有声纹密码子文本作为注册声纹密码子文本集合；从所述注册声纹密码子文本集合中选择声纹密码子文本；将选择的声纹密码子文本组合后作为所述用户认证时的声纹密码文本。利用本发明，可以提升声纹认证的准确度。
【专利说明】
伪随机声纹密码文本生成方法及系统
技术领域
[0001] 本发明涉及声纹认证技术领域，具体涉及一种伪随机声纹密码文本生成方法及系统。
【背景技术】
[0002] 随着信息技术的迅猛发展，通信以及网络的全球覆盖使得信息公开化成为历史必然，伴随着信息透明化，个人隐私的安全性也受到了极大的威胁，如何正确地进行个人身份的识别进而保护私人数据是现代社会需要重点关注的方向之一。声纹作为个人身份相关性很高的生物特征已被应用到身份认证领域中，并且声纹密码认证可以利用密码文本和声纹特征两种加密手段进行加密，具有较强的安全保障，得到了社会广泛的关注和应用。
[0003] 现有的声纹密码生成方法一般分为以下两种：
[0004] 1)固定密码文本，即在用户的注册阶段和认证阶段使用相同的密码文本，如"芝麻开门"，在注册阶段让用户朗读多遍"芝麻开门"完成声纹模型训练数据录制，在认证阶段直接让用户朗读注册时密码文本，进行声纹密码认证。
[0005] 2)随机密码文本，即在用户注册阶段和认证阶段的密码文本都是系统随机产生的。
[0006] 上述第1)种固定密码文本，由于密码文本的公开化，容易被冒认者利用目标说话人录音进行冒认。
[0007] 上述第2)种随机密码文本的随机性，经常会出现一些区分性较差的字符作为密码文本，如'555'，进行声纹认证时，由于'5'的发音过于低沉，相对于其它字符文本，较难将冒认说话人和目标说话人区分开，从而降低认证效果。另外，现有方法在声纹认证时，由于经常会存在一些字符组合的发音很难完全切分开的现象，如零声母的字符组合'25'，在声纹模型建模时，容易混入难切分字符的语音，导致模型训练不准确，认证准确度下降，如对字符'2'进行声纹模型训练时，训练数据中含有字符'5'的语音。

【发明内容】

[0008] 本发明实施例提供一种伪随机声纹密码文本生成方法及系统，以提升声纹认证的准确度。
[0009] 为此，本发明实施例提供如下技术方案：
[0010] -种伪随机声纹密码文本生成方法，包括：
[0011] 在用户注册阶段生成一个或多个注册声纹密码文本；
[0012] 将所述注册声纹密码文本进行拆分，并将拆分后得到的所有声纹密码子文本作为注册声纹密码子文本集合；
[0013] 从所述注册声纹密码子文本集合中选择声纹密码子文本；
[0014] 将选择的声纹密码子文本组合后作为所述用户认证时的声纹密码文本。
[0015] 优选地，所述在用户注册阶段生成一个或多个注册声纹密码文本包括：
[0016] 在用户注册阶段随机生成一个或多个注册声纹密码文本。
[0017] 优选地，所述方法还包括：
[0018] 确定各声纹密码文本字符的说话人区分性能；
[0019] 选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集；
[0020] 所述在用户注册阶段生成一个或多个注册声纹密码文本包括：
[0021] 在用户注册阶段从所述声纹密码文本候选字符集中挑选字符生成一个或多个注册声纹密码文本。
[0022] 优选地，所述确定各字符的说话人区分性能包括：
[0023] 收集各声纹密码文本字符的语音数据；
[0024] 利用所述语音数据训练所述字符的声纹模型；
[0025] 将所述字符作为声纹密码文本进行目标说话人和冒认说话人声纹认证，并根据认证结果确定所述字符的说话人区分性能。
[0026] 优选地，所述说话人区分性能指标包括以下任意一种或多种组合：等错误率、识别正确率、检测代价。
[0027] 优选地，所述将所述注册声纹密码文本进行拆分包括：
[0028] 对每个注册声纹密码文本，依次以其各字符为拆分的起始单位，按照设定的子文本的字符数进行拆分。
[0029] 优选地，对选择的声纹密码子文本进行依序组合或任意组合。
[0030] 优选地，所述方法还包括：在从所述注册声纹密码子文本集合中选择声纹密码子文本之前，删除所述注册声纹密码子文本集合中的重复声纹密码子文本。
[0031] -种伪随机声纹密码文本生成系统，包括：
[0032] 注册声纹密码文本生成模块，用于在用户注册阶段生成一个或多个注册声纹密码文本；
[0033] 拆分模块，用于将所述多个注册声纹密码文本进行拆分，并将拆分后得到的所有声纹密码子文本作为注册声纹密码子文本集合；
[0034] 选择模块，用于从所述注册声纹密码子文本集合中选择声纹密码子文本；
[0035] 认证声纹密码文本生成模块，用于将选择的声纹密码子文本组合后作为所述用户认证时的声纹密码文本。
[0036] 优选地，所述注册声纹密码文本生成模块，具体用于在用户注册阶段随机生成一个或多个注册声纹密码文本。
[0037] 优选地，所述系统还包括：
[0038] 区分性能确定模块，用于确定各声纹密码文本字符的说话人区分性能；
[0039] 候选字符集生成模块，用于选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集；
[0040] 所述注册声纹密码文本生成模块，具体用于在用户注册阶段从所述声纹密码文本候选字符集中挑选字符生成一个或多个注册声纹密码文本。
[0041] 优选地，所述区分性能确定模块包括：
[0042] 语音数据获取单元，用于收集各声纹密码文本字符的语音数据；
[0043] 训练单元，用于利用所述语音数据训练所述字符的声纹模型；
[0044] 认证确定单元，用于将所述字符作为声纹密码文本进行目标说话人和冒认说话人声纹认证，并根据认证结果确定所述字符的说话人区分性能。
[0045] 优选地，所述拆分模块，具体用于对每个注册声纹密码文本，依次以其各字符为拆分的起始单位，按照设定的子文本的字符数进行拆分。
[0046] 优选地，所述认证声纹密码文本生成模块对所述选择模块选择的声纹密码子文本进行依序组合或任意组合。
[0047] 优选地，所述系统还包括：整理模块，用于在所述选择模块从所述注册声纹密码子文本集合中选择声纹密码子文本之前，删除所述注册声纹密码子文本集合中的重复声纹密码子文本。
[0048] 本发明实施例提供的伪随机声纹密码文本生成方法及系统，在用户注册阶段生成一个或多个声纹密码文本，对注册阶段的声纹密码文本进行拆分；在用户认证阶段，利用拆分后的子文本组合生成认证阶段的声纹密码文本，在保证认证阶段的声纹密码文本具有随机性的同时，使其相邻字符大部分来自注册阶段的声纹密码文本，从而可以有效利用用户的协同发音特性（即用户在读一些连续文本时，在发音上表现出的不同特性）进行声纹认证，提升声纹密码认证的准确度。
【附图说明】
[0049] 为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。
[0050] 图1是本发明实施例伪随机声纹密码文本生成方法的流程图；
[0051] 图2是本发明实施例中生成注册声纹密码文本的一种流程图；
[0052] 图3是本发明实施例伪随机声纹密码文本生成系统的一种结构示意图；
[0053] 图4是本发明实施例伪随机声纹密码文本生成系统的另一种结构示意图。
【具体实施方式】
[0054] 为了使本技术领域的人员更好地理解本发明实施例的方案，下面结合附图和实施方式对本发明实施例作进一步的详细说明。
[0055] 如图1所示，是本发明实施例伪随机声纹密码文本生成方法的流程图，包括以下步骤：
[0056] 步骤101，在用户注册阶段生成一个或多个注册声纹密码文本。
[0057] 具体地，可以随机生成一个或多个（比如3个、5个等）注册声纹密码文本，这些注册声纹密码文本的长度可以相同，也可以不同。让用户朗读这些声纹密码文本，录制用户朗读这些声纹密码文本的语音数据，利用这些语音数据完成声纹模型训练，以便在认证阶段利用该声纹模型对用户进行声纹认证。
[0058] 当然，还可以有其它方式生成注册声纹密码文本，具体将在后面详细描述。
[0059] 步骤102,将所述注册声纹密码文本进行拆分，并将拆分后得到的所有声纹密码子文本作为注册声纹密码子文本集合。
[0060] 具体地，对每个注册声纹密码文本，依次以其各字符为拆分的起始单位，按照设定的子文本的字符数进行拆分。
[0061] 比如，确定子文本的字符数（即生成认证阶段声纹密码文本时，使用注册阶段声纹密码文本中相邻的字符数）为s ;选中一个注册声纹密码文本，长度为1，作为当前待拆分声纹密码文本，拆分过程如下：
[0062] 从待拆分声纹密码文本的第i (i = 1)个字符开始依次连续组合s个字符，得到一个声纹密码子文本；然后判断当前待拆分声纹密码文本拆分是否结束（即i是否为当前待拆分声纹密码文本第1-s+l个字符），如果是则表明当前待拆分声纹密码文本拆分结束，否则，i = i+ι，即选择下一个字符开始继续执行切分操作。
[0063] 在所有注册声纹密码文本拆分完成后，即可得到注册声纹密码子文本集合，该集合包含所有注册声纹密码子文本。
[0064] 步骤103,从所述注册声纹密码子文本集合中选择声纹密码子文本。
[0065] 步骤104,将选择的声纹密码子文本组合后作为所述用户认证时的声纹密码文本。
[0066] 认证声纹密码文本的长度可以预先设定，可以随机从注册声纹密码子文本集合中挑选声纹密码子文本进行组合得到认证阶段的声纹密码文本，具体组合方式可以是依序组合，也可以不分先后顺序任意组合。如果组合后的文本的长度大于预设长度，可以将多余的字符删除。
[0067] 在对用户进行认证时，将上述声纹密码文本呈现给用户，用户朗读该文本，利用用户朗读的语音及声纹模型对该用户进行声纹密码认证。
[0068] 进一步地，由于注册声纹密码子文本集合中可能会有重复的声纹密码子文本，因此，在本发明方法另一实施例中，还可以在从所述注册声纹密码子文本集合中选择声纹密码子文本之前，先对该注册声纹密码子文本集合进行整理，即删除其中重复的声纹密码子文本，然后再从中选择用于生成认证阶段的声纹密码子文本，这样可以使生成的用户认证时的声纹密码文本的覆盖性更好，进一步提高声纹认证效果。
[0069] 下面举例进一步说明利用本发明伪随机声纹密码文本生成方法生成认证阶段声纹密码文本的过程。
[0070] 以数字字符为例，假设注册阶段生成5个声纹密码文本让用户录音进行声纹模型的训练，所述声纹密码文本分别为'28045769'、'29687304'、'39406578'、'54237860'、 '69784532'。
[0071] 设定生成认证声纹密码文本时使用注册声纹密码文本中相邻字符数为2个，拆分注册声纹密码文本，得到拆分后的声纹密码子文本集如下：'28'、'80'、'04'、'45'、'57'、 '76'、'69'、'29'、，6'、'68'、'87'、'73'、'30'、'04'、'39'、，4'、'40'、'06'、'65'、'57'、 '78'、'54'、'42'、'23'、'37'、'78'、'86'、'60'、'69'、'97'、'78'、'84'、'45'、'53'、'32' 共35个。
[0072] 删除注册声纹密码子文本集合中的重复子文本后将该集合作为认证声纹密码子文本侯选集，具体如下：'04'、'06'、'23'、'28'、'29'、'30'、'32'、'37'、'39'、'40'、'42'、 '45，、'53，、'54，、'57，、％0，、'65，、'68，、'69，、'73，、'76，、'78，、'80，、'84，、'86，、'87，、 '94'、 '96'、 '97'。
[0073] 假设认证阶段声纹密码文本长度为8,则随机从认证声纹密码子文本侯选集合中挑选4个子文本进行组合，直到组合文本长度为8时，得到认证阶段声纹密码文本；如 "04235796"，如果组合文本长度为9,则随机从认证声纹密码子文本侯选集合中挑选5个子文本进行组合，将组合后多余的1个字符删除即可。
[0074] 本发明实施例提供的伪随机声纹密码文本生成方法，在用户注册阶段，生成一个或多个声纹密码文本，对注册阶段的声纹密码文本进行拆分，在用户注册阶段，利用拆分后的子文本组合生成认证阶段的声纹密码文本，在保证认证阶段的声纹密码文本具有随机性的同时，使其相邻字符大部分来自注册阶段的声纹密码文本，从而可以有效利用用户的协同发音特性（即用户在读一些连续文本时，在发音上表现出的不同特性）进行声纹认证，提升声纹密码认证的准确度。
[0075] 前面提到，在注册阶段，可以采用随机方式生成注册声纹密码文本，也可以采用其它方式，下面举例说明。
[0076] 如图2所示，是本发明实施例中生成注册声纹密码文本的一种流程图，包括以下步骤：
[0077] 步骤201，确定各声纹密码文本字符的说话人区分性能。
[0078] 所述声纹密码文本字符可以是汉字、字母、数字或特殊符号中的一种或多种组合。
[0079] 在本发明实施例中，可以采用数据驱动的方法计算每个声纹密码文本字符针对不同说话人的区分性能，具体过程如下：
[0080] 1)收集各声纹密码文本字符的语音数据。
[0081] 也就是说，所述语音数据包含相应的字符，而且，对应一个字符有多个不同说话人的语音数据。
[0082] 2)利用所述语音数据训练所述字符的声纹模型。
[0083] 对于每个字符，利用收集到的包含该字符的大量说话人的语音数据提取声学特征，利用模型训练准则进行声纹模型训练，所述训练准则如最大似然准则，所述模型例如 HMM(Hidden Markov Model，隐马尔可夫模型）、GMM(Gaussian Mixture Model，高斯混合模型），从而得到对应该字符的声纹模型。
[0084] 3)将所述字符作为声纹密码文本进行目标说话人和冒认说话人声纹认证，并根据认证结果确定所述字符的说话人区分性能。
[0085] 具体地，对于每个字符，将其作为声纹密码文本，利用对应该字符的声纹模型和该字符对应的目标说话人语音，首先进行自适应训练得到该目标说话人对应的声纹模型，所述自适应算法例如最大后验概率；然后利用所述声纹模型对目标说话人和冒认说话人进行声纹认证，根据认证结果计算该字符的说话人区分性能。
[0086] 所述说话人区分性能可以采用不同的指标来表示，比如：等错误率、识别正确率、检测代价等，当然还可以采用这些指标的任意组合来计算所述字符的说话人区分性能。
[0087] 所述等错误率是与当前字符的虚警率EfJP漏警率相关的区分性能衡量指标，所述等错误率指标表明所有的错误（错误接受、错误拒绝）代价都是相同的，如式（1) 所示。所述虚警率表示错误接受冒认说话人语音的比例，所述漏警率表示错误拒绝目标说话人语音的比例，所述虚警率E fJP漏警率Ε"_的计算方式如式（2)和式（3)所示，由式（2) 和式（3)易知当所述虚警率EfJi低时，所述漏警率Ε"_就越高，反之亦然；特殊地，当虚警率E fJP漏警率Ε 相等时，即为等错误率，当前字符语音段等错误率越小时，当前字符的区分性越好。
[0088] Perr=Efa=Eniss (1)
[0089]
[0090]
[0091] 其中，nfa指使用冒认说话人语音认证时被当成目标说话人语音被接受的次数； ninpcistCT指使用冒认说话人语音认证次数。η指目标说话人语音认证时被当成冒认说话人语音被拒绝的次数，n ta_t指使用目标说话人语音认证次数。
[0092] 所述识别正确率PralT是与当前字符等错误率P _相关的区分性能衡量指标，当前字符的识别正确率越大时，区分性能越好，具体计算方法如式（4)所示：
[0093] Pcorr= 1-Perr (4)
[0094] 所述检测代价C^t是与虚警率E ￡3和漏警率E 以及应用场景有关的一个区分性能评价指标，用于描述认证错误后造成损失的大小，一般检测代价越小，造成的损失越小，区分性越好，具体计算方式如式（5)所示：
[0095] Cdet= Cfa*Efa*Ptar+Cniss*E niss*(l-Ptar) (5)
[0096] 其中，CfdP 分别是虚警代价和漏警代价，具体取值根据实际应用场景设定，例如，特定目标说话人的侦听工作场景中，会把设置很大，防止出现太多漏警情况。P 指实际认证时，当前用户为目标说话人的概率，具体取值根据经验或实验结果设定。l_PtaJ^ 实际认证时，当前用户为冒认说话人的概率。
[0097] 步骤202,选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集。
[0098] 根据发音规则及语言学相关理论，有些文本字符对不同说话人的区分性较好，而有些文本字符对不同说话人的区分性较差。为此，在本发明实施例中，挑选出区分性较好的字符作为声纹密码文本的候选字符，构建声纹密码文本候选字符集。
[0099] 对于不同的指标，所述的要求也是不同的。以等错误率匕"为例，如果步骤101计算得到的当前字符语音段的等错误率1\"小于设定的阈值，则确定该字符满足要求，否则不满足要求。
[0100] 步骤203,在用户注册阶段从所述声纹密码文本候选字符集中挑选字符生成多个注册声纹密码文本。
[0101] 需要说明的是，在从所述声纹密码文本候选字符集挑选字符时，可以有多种方式，比如：
[0102]方式一
[0103] 随机从所述声纹密码文本候选字符集挑选设定个数的字符生成声纹密码文本。
[0104] 方式二
[0105] 1)计算所述声纹密码文本候选字符集中每个字符被选中为声纹密码文本的概率。
[0106] 具体地，可以根据各字符的说话人区分性能指标，计算声纹密码文本候选字符集中每个字符被挑选为声纹密码文本的概率，以前面提到的等错误率区分性能指标为例，计算公式如下：
[0107]
[0108] 其中，Pi表示声纹密码文本侯选字符集中第i个字符被选中的概率，N表示声纹密码文本侯选字符集中所有字符数。
[0109] 由式（6)可以看出当前字符被选中的概率与当前字符的等错误率成反比，即等错误率越大，说明当前字符的区分性越差，被选中的概率也就越低。
[0110] 2)划分概率区间。
[0111] 具体划分时，可以将声纹密码文本侯选字符集中所有字符根据其被选中的概率依次进行区间划分，以百分比为单位，具体划分范围为[1，100]。如侯选字符集中有3个字符'A'、'B'、'C'，被选中的概率分别为0. 2、0. 3、0. 5。可以划分3个概率区间，分别为：[1， 20]、[21，50]及[51，100]，其中，概率区间[1，20]对应字符'A'，概率区间[21，50]对应字符'B'，概率区间[51，100]对应字符'C'。当然，每个概率区间也可以对应多个字符。
[0112] 3)根据划分的概率区间从所述声纹密码文本候选字符集中挑选字符。
[0113] 在实际应用中，可以有多种挑选方式。
[0114] 比如，随机生成范围在[1，100]的随机数，根据所述随机数所属的概率区间，选择相应概率区间对应的字符或字符组合作为当前声纹密码文本字符。如生成的随机数为25，则选择概率区间[21，50]对应的字符'B'作为当前声纹密码文本字符。
[0115] 再比如，依照概率区间由高到低的顺序，依次随机在相应区间中挑选字符或字符组合。
[0116] 另外，在将挑选的字符组合成注册声纹密码文本时，还可以预先设定一些排列规贝ij，按照该排列规则组合相应的字符。比如，可以根据语言学发音原理确定如下一些声纹密码文本字符排列规则：
[0117] 1)相同字符不能相邻；
[0118] 2)零声母字符不能相邻。
[0119] 这样可以避免因为快速连读而出现字符不能完全切分的情况，同时也避免了没有声母的字符连读时不易切分开的情况，进一步提高声纹认证的准确度。
[0120] 相应地，本发明实施例还提供一种伪随机声纹密码文本生成系统，如图3所示，是该系统的一种结构示意图。
[0121] 在该实施例中，所述系统包括：
[0122] 注册声纹密码文本生成模块301，用于在用户注册阶段生成一个或多个注册声纹密码文本31 ;
[0123] 拆分模块302,用于将所述注册声纹密码文本进行拆分，并将拆分后得到的所有声纹密码子文本作为注册声纹密码子文本集合；
[0124] 选择模块303,用于从所述注册声纹密码子文本集合中选择声纹密码子文本；
[0125] 认证声纹密码文本生成模块304,用于将选择的声纹密码子文本组合后作为所述用户认证时的声纹密码文本32。
[0126] 进一步地，由于注册声纹密码子文本集合中可能会有重复的声纹密码子文本，因此，在本发明系统另一实施例中，还可包括：整理模块（未图示），用于在所述选择模块303 从所述注册声纹密码子文本集合中选择声纹密码子文本之前，删除所述注册声纹密码子文本集合中的重复声纹密码子文本，这样可以使选择模块303从所述注册声纹密码子文本集合中选择的声纹密码子文本没有重复，使生成的用户认证时的声纹密码文本的覆盖性更好，进一步提高声纹认证效果。
[0127] 在实际应用中，上述注册声纹密码文本生成模块301可以采用多种方式生成注册声纹密码文本，比如随机生成多个注册声纹密码文本。再比如，在图4所示的本发明系统另一实施例中，注册声纹密码文本生成模块301'从说话人区分性能较好的字符集中选择字符生成多个注册声纹密码文本。
[0128] 如图4所示，该实施例与图3所示实施例不同的是，在该实施例中所述系统还包括：
[0129] 区分性能确定模块401，用于确定各声纹密码文本字符的说话人区分性能；
[0130] 候选字符集生成模块402,用于选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集。
[0131] 相应地，注册声纹密码文本生成模块301'在用户注册阶段从所述声纹密码文本候选字符集中挑选字符生成多个注册声纹密码文本。
[0132] 所述声纹密码文本字符可以是汉字、字母、数字或特殊符号中的一种或多种组合。上述区分性能确定模块401具体可以采用数据驱动的方法计算每个声纹密码文本字符针对不同说话人的区分性能，该模块的一种具体结构包括以下各单元：
[0133] 语音数据获取单元，用于收集各声纹密码文本字符的语音数据；
[0134] 训练单元，用于利用所述语音数据训练所述字符的声纹模型；
[0135] 认证确定单元，用于将所述字符作为声纹密码文本进行目标说话人和冒认说话人声纹认证，并根据认证结果确定所述字符的说话人区分性能。
[0136] 在实际应用中，所述说话人区分性能可以采用不同的指标来表示，比如：等错误率、识别正确率、检测代价等，当然还可以采用这些指标的任意组合来计算所述字符的说话人区分性能。
[0137] 相应地，上述认证确定单元在根据认证结果确定所述字符的说话人区分性能时可以基于上述不同指标来确定，具体可参照前面本发明方法实施例中的描述，在此不再赘述。
[0138] 上述候选字符集生成模块402需要挑选出区分性较好的字符作为声纹密码文本的候选字符，构建声纹密码文本候选字符集。同样，对于不同的指标，所述的要求也是不同的，需要根据具体的指标做适应性调整。
[0139] 在实际应用中，注册声纹密码文本生成模块301'可以采用多种方式从所述声纹密码文本候选字符集挑选字符。
[0140] 比如，注册声纹密码文本生成模块301'可以随机从所述声纹密码文本候选字符集挑选设定个数的字符，或者计算所述声纹密码文本候选字符集中每个字符被选中为声纹密码文本的概率，并划分概率区间，根据划分的概率区间从所述声纹密码文本候选字符集中挑选字符。当然，还可以有其它选择方式，对此本发明实施例不做限定。
[0141] 另外，还可以预先设定一些排列规则，注册声纹密码文本生成模块301'按照该排列规则组合挑选的字符。
[0142] 本发明实施例提供的伪随机声纹密码文本生成系统，在用户注册阶段，生成一个或多个声纹密码文本，对注册阶段的声纹密码文本进行拆分，在用户认证阶段，利用拆分后的子文本组合生成认证阶段的声纹密码文本，在保证认证阶段的声纹密码文本具有随机性的同时，使其相邻字符大部分来自注册阶段的声纹密码文本，从而可以有效利用用户的协同发音特性（即用户在读一些连续文本时，在发音上表现出的不同特性）进行声纹认证，提升声纹密码认证的准确度。
[0143] 本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。
[0144] 以上对本发明实施例进行了详细介绍，本文中应用了【具体实施方式】对本发明进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及系统；同时，对于本领域的一般技术人员，依据本发明的思想，在【具体实施方式】及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。
【主权项】
1. 一种伪随机声纹密码文本生成方法，其特征在于，包括：在用户注册阶段生成一个或多个注册声纹密码文本；将所述注册声纹密码文本进行拆分，并将拆分后得到的所有声纹密码子文本作为注册声纹密码子文本集合；从所述注册声纹密码子文本集合中选择声纹密码子文本；将选择的声纹密码子文本组合后作为所述用户认证时的声纹密码文本。2. 根据权利要求1所述的方法，其特征在于，所述在用户注册阶段生成一个或多个注册声纹密码文本包括：在用户注册阶段随机生成一个或多个注册声纹密码文本。3. 根据权利要求1所述的方法，其特征在于，所述方法还包括：确定各声纹密码文本字符的说话人区分性能；选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集；所述在用户注册阶段生成一个或多个注册声纹密码文本包括：在用户注册阶段从所述声纹密码文本候选字符集中挑选字符生成一个或多个注册声纹密码文本。4. 根据权利要求3所述的方法，其特征在于，所述确定各字符的说话人区分性能包括：收集各声纹密码文本字符的语音数据；利用所述语音数据训练所述字符的声纹模型；将所述字符作为声纹密码文本进行目标说话人和冒认说话人声纹认证，并根据认证结果确定所述字符的说话人区分性能。5. 根据权利要求3所述的方法，其特征在于，所述说话人区分性能指标包括以下任意一种或多种组合：等错误率、识别正确率、检测代价。6. 根据权利要求1所述的方法，其特征在于，所述将所述注册声纹密码文本进行拆分包括：对每个注册声纹密码文本，依次以其各字符为拆分的起始单位，按照设定的子文本的字符数进行拆分。7. 根据权利要求1所述的方法，其特征在于，对选择的声纹密码子文本进行依序组合或任意组合。8. 根据权利要求1至7任一项所述的方法，其特征在于，所述方法还包括：在从所述注册声纹密码子文本集合中选择声纹密码子文本之前，删除所述注册声纹密码子文本集合中的重复声纹密码子文本。9. 一种伪随机声纹密码文本生成系统，其特征在于，包括：注册声纹密码文本生成模块，用于在用户注册阶段生成一个或多个注册声纹密码文本；拆分模块，用于将所述多个注册声纹密码文本进行拆分，并将拆分后得到的所有声纹密码子文本作为注册声纹密码子文本集合；选择模块，用于从所述注册声纹密码子文本集合中选择声纹密码子文本；认证声纹密码文本生成模块，用于将选择的声纹密码子文本组合后作为所述用户认证时的声纹密码文本。10. 根据权利要求9所述的系统，其特征在于，所述注册声纹密码文本生成模块，具体用于在用户注册阶段随机生成一个或多个注册声纹密码文本。11. 根据权利要求9所述的系统，其特征在于，所述系统还包括：区分性能确定模块，用于确定各声纹密码文本字符的说话人区分性能；候选字符集生成模块，用于选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集；所述注册声纹密码文本生成模块，具体用于在用户注册阶段从所述声纹密码文本候选字符集中挑选字符生成一个或多个注册声纹密码文本。12. 根据权利要求11所述的系统，其特征在于，所述区分性能确定模块包括：语音数据获取单元，用于收集各声纹密码文本字符的语音数据；训练单元，用于利用所述语音数据训练所述字符的声纹模型；认证确定单元，用于将所述字符作为声纹密码文本进行目标说话人和冒认说话人声纹认证，并根据认证结果确定所述字符的说话人区分性能。13. 根据权利要求9所述的系统，其特征在于，所述拆分模块，具体用于对每个注册声纹密码文本，依次以其各字符为拆分的起始单位，按照设定的子文本的字符数进行拆分。14. 根据权利要求9所述的系统，其特征在于，所述认证声纹密码文本生成模块对所述选择模块选择的声纹密码子文本进行依序组合或任意组合。15. 根据权利要求9至14任一项所述的系统，其特征在于，所述系统还包括：整理模块，用于在所述选择模块从所述注册声纹密码子文本集合中选择声纹密码子文本之前，删除所述注册声纹密码子文本集合中的重复声纹密码子文本。
【文档编号】H04L9/32GK105991290SQ201510100856
【公开日】2016年10月5日
【申请日】2015年3月6日
【发明人】方昕, 刘俊华, 魏思, 胡国平, 王影, 胡郁, 刘庆峰
【申请人】科大讯飞股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：方昕;刘俊华;魏思;胡国平;王影;胡郁;刘庆峰;
技术所有人：科大讯飞股份有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。