能够防止录音攻击的声纹认证方法、服务器、终端及系统的制作方法

文档序号:10572628阅读:461来源:国知局
能够防止录音攻击的声纹认证方法、服务器、终端及系统的制作方法
【专利摘要】本发明提供了一种能够防止录音攻击的声纹认证方法、服务器、终端及系统,声纹认证方法包括:根据一用户的声纹认证请求生成字符组合及字符的发音规则;将所述字符组合及字符的发音规则发送给请求终端;接收所述请求终端根据所述字符组合及字符的发音规则输入的用户语音;根据所述用户语音、所述字符组合及字符的发音规则进行声纹认证;将所述声纹认证结果发送至所述请求终端。本发明能够有效的防止录音攻击。
【专利说明】
能够防止录音攻击的声纹认证方法、服务器、终端及系统
技术领域
[0001] 本发明属于声纹识别领域,特别涉及一种能够防止录音攻击的声纹认证方法、月艮 务器、终端及系统。
【背景技术】
[0002] 声纹同指纹一样,是一种非常重要的能表征人身份的生物特征。相比传统的密码 认证等手段,声纹高安全性和便捷性等特点。声纹认证中最常用的攻击手段主要有录音回 放攻击、说话人仿冒攻击及伪造认证语音攻击。
[0003] 其中录音回放攻击是指攻击者通过高保真的录音设备通过各种手段获取用户的 语音样本,使用用户的原始录音或者通过裁剪、拼接等手段处理后合成"说话人真音",然后 在认证系统采集用户语音时,通过高保真的功放进行回放,从而进行攻击。说话人仿冒攻击 是指一些善于默认他人语音的攻击者通过模仿说话人的说话方式以及发音特点来进行攻 击。伪造认证语音攻击是指通过合成、转换、拼接等技术手段伪造被攻击者的语音来进行攻 击。
[0004] 说话人仿冒攻击需要攻击者具有很好的模仿能力,伪造认证语音攻击也往往需要 较高的专业技能,这两种攻击本身攻击难道就高,另外无论是模仿音还是伪造音,终究不是 真实音,现有的声纹识别技术基本能够应对这两类攻击。
[0005] 录音回放攻击是声纹识别中面临的非常重要的问题,攻击者获取声音后通过软件 合成来进行攻击。录音攻击有两种情况,一种是用户在其他情况下说话声音被窃取来进行 攻击;另一种是用户在进行声纹识别时,通过恶意软件录取用户的声音进行攻击。
[0006] 针对录音攻击,现有技术中,主要有如下两种解决方法:
[0007] 第一种方案是通过分析录音和原始语音之间在信道特征模式上差异来分辨出是 否是录音内容;第二种方案是在验证说话人的声纹的同时,也验证说话人的说话内容,因为 录音攻击者并不知道本次的说话内容。
[0008] 但是,方案一对声音信号质量、信噪比、通道质量等要求很高,在实际应用中取得 的效果并不是很好。
[0009] 方案二中如果每次随机的让用户读写大段文字,用户体验较差,如果减少用户的 语音输入,比如专利(申请号:201310123555. 0 ;发明名称:基于动态密码语音的身份确认 系统及方法),从26个英文字母以及10个数字中挑选组合,每次随机组合生产动态密码后, 让用户通过语音进行输入,由于事先并不知道每次生产的动态密码,所以可以抵抗简单的 录音攻击,是一种较好的解决办法。但是由于该专利只在26个英文字母和10个数字中共 36个字符随机组合,如果攻击者通过录音分隔的方式,分隔出这36个字符,那么无论得到 何种随机字符串,攻击者只需要简单的通过36个字符中进行拼接进行攻击。

【发明内容】

[0010] 本发明提供一种具有防止录音攻击功能的声纹认证方法、服务器及终端,用于解 决现有技术中防止录音攻击方法存在漏洞,不能有效的防止录音攻击的缺陷。
[0011] 为了解决上述技术问题,本发明提供一种能够防止录音攻击的声纹认证方法,
[0012] 根据一用户的声纹认证请求生成字符组合及字符的发音规则;
[0013] 将所述字符组合及字符的发音规则发送给请求终端;
[0014] 接收所述请求终端根据所述字符组合及字符的发音规则输入的用户语音;
[0015] 根据所述用户语音、所述字符组合及字符的发音规则进行声纹认证;;
[0016] 将所述声纹认证结果发送至所述请求终端。
[0017] 本发明另提供一种能够防止录音攻击的声纹认证方法,
[0018] 发送一用户的声纹认证请求至服务器;
[0019] 接收并显示所述服务器发送的字符组合及字符的发音规则;
[0020] 接收用户根据所述字符组合及字符的发音规则输入的用户语音;
[0021] 将所述用户语音发送至所述服务器;
[0022] 接收所述服务器发送的声纹认证结果。
[0023] 本发明另提供一种能够防止录音的声纹认证服务器,
[0024] 生成单元,用于根据一用户的请求生成字符组合及字符的发音规则;
[0025] 发送单元,用于将所述字符组合及字符的发音规则发送给请求终端,将声纹认证 结果发送至所述请求终端;
[0026] 接收单元,用于接收所述请求终端根据所述字符组合及字符的发音规则输入的用 户语音;
[0027] 声音检测单元,用于根据所述用户语音、所述字符组合及字符的发音规则进行声 纹认证;
[0028] 本发明又提供一种能够防止录音攻击的声纹认证终端,
[0029] 请求单元,用于发送一用户的声纹认证请求至服务器;
[0030] 接收单元,用于接收并显示所述服务器发送的字符组合及字符的发音规则,接收 所述服务器发送的声纹认证结果;
[0031] 录入单元,用于接收用户根据所述字符组合及字符的发音规则输入的用户语音;
[0032] 发送单元,用于将所述用户语音发送至所述服务器。
[0033] 本发明再提供一种能够防止录音攻击的声纹认证系统,该系统包括服务器及请求 终端,其中,所述服务器用于根据一用户的声纹认证请求生成字符组合及字符的发音规则; 将所述字符组合及字符的发音规则发送给请求终端;接收所述请求终端根据所述字符组合 及字符的发音规则输入的用户语音;根据所述用户语音、所述字符组合及字符的发音规则 进行声纹认证;将所述声纹认证结果发送至所述请求终端;
[0034] 所述请求终端用于发送一用户的声纹认证请求至服务器;接收并显示所述服务器 发送的字符组合及字符的发音规则;接收用户根据所述字符组合及字符的发音规则输入的 用户语音;将所述用户语音发送至所述服务器;接收所述服务器发送的声纹认证结果。
[0035] 本发明提出的能够防止录音攻击的声纹认证方法、服务器、终端及系统,通过验证 用户语音中的字符和发音方式与服务器生成的字符组合及字符的发音规则是否一致,能够 有效的防止录音攻击,攻击者即使能通过其他渠道获取到的用户语音满足语音内容,也无 法满足发音方式的要求。进一步的,为了防止用户重复输入的用户语音受到录音攻击,判断 出用户语音中的字符和发音方式与服务器生成的字符组合及字符的发音规则一致后,还判 断当前待验证的语音与历史语音库中该用户的语音是否一致,如果一致则说明存在录音攻 击。本发明可以有效的防止声纹认证中的录音攻击。
【附图说明】
[0036] 为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用 的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本 领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的 附图。
[0037] 图1为本发明一实施例的能够防止录音攻击的声纹认证方法流程图;
[0038] 图2为本发明一实施例的能够防止录音攻击的声纹认证过程流程图;
[0039] 图3为本发明一实施例的能够防止录音攻击的声纹认证过程流程图;
[0040] 图4为本发明一实施例的数字"0"的发音对应的波形图;
[0041] 图5为本发明一实施例的能够防止录音攻击的声纹认证方法流程图;
[0042] 图6为本发明一实施例的能够防止录音攻击的声纹认证服务器;
[0043] 图7为本发明一实施例的能够防止录音攻击的声纹认证终端;
[0044] 图8为本发明一实施例的能够防止录音攻击的声纹认证系统;
[0045] 图9为本发明一实施例的具有防止录音攻击功能的声纹认证方法流程图。
【具体实施方式】
[0046] 为了使本发明的技术特点及效果更加明显,下面结合附图对本发明的技术方案做 进一步说明,本发明也可有其他不同的具体实例来加以说明或实施,任何本领域技术人员 在权利要求范围内做的等同变换均属于本发明的保护范畴。
[0047] 如图1所示,图1为本发明一实施例的能够防止录音攻击的声纹认证方法流程图。
[0048] 本实施例是从服务器侧描述的声纹认证方法,根据终端反馈的用户语音、服务器 生成的字符组合及字符的发音规则进行声纹认证,本实施例能够一定程度上防止录音攻 击。
[0049] 具体的,能够防止录音攻击的声纹认证方法包括如下步骤:
[0050] 步骤101 :根据一用户的声纹认证请求生成字符组合及字符的发音规则;
[0051] 字符组合包括但不限于字母、数字、汉字等,字符的发音规则包括但不限于发音的 音调、发音的长度等,一实施例中,字符组合中的每个字符对应一个发音规则,另一实施例 中,字符组合中的两个字符对应一个发音规则,本发明对字符组合及字符组合中的字符的 发音规则的具体形式不做限制。
[0052] 本申请一实施例中,所述字符组合及字符的发音规则是随机生成的。
[0053] 步骤102 :将字符组合及字符的发音规则发送给请求终端;
[0054] 本发明所述的终端包括但不限于手机、PAD、电脑及笔记本。
[0055] 步骤103 :接收所述请求终端根据所述字符组合及字符的发音规则输入的用户语 音;
[0056] 步骤104 :根据所述用户语音、所述字符组合及字符的发音规则进行声纹认证;
[0057] 步骤105 :将所述声纹认证结果发送至所述请求终端。
[0058] 本实施例中,即使攻击者能够获取语音字符信息,也无法获取字符的发音规则,通 过加入发音规则的认证,能够有效的防止录音攻击。
[0059] 详细的说,步骤104进一步包括:
[0060] 判断所述用户语音与所述用户历史输入的语音是否为同一人的声音;
[0061] 判断所述用户语音中的字符与所述字符组合中的字符是否相同;
[0062] 判断所述用户语音中的字符的发音方式与所述字符的发音规则是否匹配;
[0063] 只有所述用户语音与所述用户历史输入的语音为同一人、所述用户语音中的字符 与所述字符组合中的字符相同且所述用户语音中的字符的发音方式与所述字符的发音规 则匹配同时满足时,声纹认证才通过,其他情况声纹认证不通过,即若所述用户语音与所述 用户历史输入的语音不为同一人,和/或所述用户语音中的字符与所述字符组合中的字符 不同,和/或所述用户语音中的字符的发音方式与所述字符的发音规则不匹配,则声纹认 证不通过。
[0064] 本发明并不限制上述判断过程的顺序,任何顺序的组合均能实现声纹认证的判 断。
[0065] 优选的,如图2所示,步骤104进一步包括:
[0066] 步骤201 :先判断所述用户语音与所述用户历史输入的语音是否为同一人的声 音;如果不为同一人的声音,则声纹认证不通过,如果为同一人的声音,继续步骤202 ;
[0067] 具体实施时,在进行步骤202之前,需先按照字符分隔客户端上送的用户语音,然 后提取用户语音中的字符。
[0068] 步骤202 :判断所述用户语音中的字符与所述字符组合中的字符是否相同;
[0069] 如果所述用户语音中的字符与所述字符组合中的字符不同,则声纹认证不通过即 声纹认证失败;
[0070] 如果所述用户语音中的字符与所述字符组合中的字符相同,则继续步骤203 ;
[0071] 步骤203 :判断所述用户语音中的字符的发音方式与所述字符的发音规则是否匹 配;
[0072] 如果所述用户语音中的字符的发音方式与所述字符的发音规则不匹配,则声纹认 证不通过;
[0073] 如果所述用户语音中的字符的发音方式与所述字符的发音规则匹配,则声纹认证 通过。
[0074] 按照本实施例所述的顺序进行声纹认证能够加快认证的速度,预防录音攻击的同 时提高用户的体验效果。如下实施例中,如不做特殊说明,均按照本实施例所述的顺序进行 声纹认证。
[0075] 复请参阅图2,判断出所述用户语音与所述用户历史输入的语音为同一人、所述用 户语音中的字符与所述字符组合中的字符相同且所述用户语音中的字符的发音方式与所 述字符的发音规则匹配后还包括将用户语音存储至历史语音库中,便于后续调取用户输入 的语音信息。
[0076] 如图3所示,本申请一实施例中,判断出所述用户语音与所述用户历史输入的语 音为同一人、所述用户语音中的字符与所述字符组合中的字符相同且所述用户语音中的字 符的发音方式与所述字符的发音规则匹配后还包括:
[0077] 步骤204 :判断所述用户语音与所述用户在历史语音库中的语音是否一致;
[0078] 如果所述用户语音与所述用户在历史语音库中的语音一致,则声纹认证不通过;
[0079] 如果所述用户语音与所述用户在历史语音库中的语音不一致,则声纹认证通过, 将所述用户语音存储至历史语音库中。
[0080] 通过验证用户语音与历史语音库中的该用户的语音是否一致,能够防止同一用户 的不同次语音认证中输入的相同用户语音出现录音攻击。
[0081] 本发明一实施例中,上一实施例的步骤204进一步包括:
[0082] 提取所述用户语音的特征参数;
[0083] 计算所述用户语音的特征参数与所述用户在历史数据库中的语音的特征参数的 欧几里德距离,所述欧几里德距离小于预定阈值时,所述用户语音与所述用户在历史语音 库中的语音一致,所述欧几里德距离大于预定阈值时,所述用户语音与所述用户在历史语 音库中的语音不一致。
[0084] 本实施例所述的预定阈值可根据人发出同样声音的差异性确定。
[0085] 具体实施时,判断用户语音与所述用户在历史语音库中的语音是否一致的详细过 程为:
[0086] 1)按字符将用户语音分为多段语音,对每段语音进行预处理,包括分帧、预加重、 加窗等处理,得到可以进一步计算的一段声音。
[0087] 2)找到每段语音中的有效语音部分的起点和终点。
[0088] 如图4所示,图4为数字"0"的发音对应的波形图,由图4可以看出在声音的前后 都有很多的无音段或者细微的噪声段。如果不去掉这些无效的声音信号,攻击者可以在录 音的无效的声音端进行处理而影响录音检测的效果。
[0089] 具体实施时,可通过短时能量和短时过零率判断语音有效部分的起点和终点。
[0090] 其中短时能量是指一帧语音信号的强度之和,第η帧语音信号的短时能量En :
[0091]
[0092] 其中,m为第n帧第m个采样点,N为该帧的大小,x n(m)为第η帧第m个采样点归 一化后的频率。
[0093] 短时过零率是指在一帧语音信号波形穿过横轴的次数,记为Zn,
[0094]
[0095] 其中,m为第n帧第m个采样点,N为该帧的大小,x n(m)为第η帧第m个采样点归 一化后的频率。
[0096] 当短时能量En超过阀值E或者短时过零率Zn超过阀值Z时,该语音为有效语音 的开始,当短时能量En低于阀值E或者短时过零率Zn低于阀值Z时,该语音为有效语音的 结束。
[0097] 3)采用Mel尺度倒谱系数(MFCC)对有效语音提取特征参数。该方法是目前声音 处理中比较通用的特征参数提取办法,本发明此处不再赘述。
[0098] 记录用户本次经过前三步预处理、分割掉语音无效部分和提取特征参数后,用户 的某个字符的语音表示为T :
[0099] Τ有Ν帧矢量{Τ(1),Τ(2),…以!!),…,仪吣},!^!!)是第η帧的语音特征矢量。
[0100] 对于历史库中该用户的字符发音进行同样预处理、分割掉语音无效部分和提取特 征参数后记为R :
[0101] R有Μ帧矢量R= {R(1),R(2),…以!!!),…,R(M)},R(m)为第m帧的语音特征矢 量。
[0102] 4)计算用户声音与历史语音库中存储的声音的相似性,即为计算T与R的相似性, 该相似性判断可通过计算T和R的欧几里得距离。
[0103] d(T(in),R(〇)表示T中第1帧特征与R中i "帧特征之间的欧几里德距离,如果 两个波形在某个帧完全重合,则距离d为0。为了比较它们之间的相似度,可以计算它们之 间的距离D[T,R],距离越小则相似度越高。
[0104] 若N = M,即两段语音长度相同,直接简单计算用户语音与历史语音库中存储的 语音的欧几里得距离D[T,R] = d(l,l)+d(2, 2)+…+d(N,N),如果两端语音完全一样,则 D[T,R] =0,通过这种方式只可以判断T和R是否完全相同,但是录音攻击者在实际攻击中 往往会采取对原始录音在部分位置进行拉伸、缩短或者删除等操作,所以如果简单计算两 者距离并不能很好的防御此类攻击。
[0105] 对于N和Μ不相同时,要考虑将T(n)和R(m)对齐。对齐可以采用线性扩张的方 法,如果N〈M可以将T线性映射为一个Μ帧的序列,再计算它与{R(l),R(2),……,R(M)} 之间的距离。但是攻击者不会对整段声音进行处理,而往往只对声音的部分位置进行处理, 如果采取此方法会识别出二者声音相似度很低。
[0106] 因此比较语音T和R的相似度需要将时间规则和距离测量结合起来,通过寻找 函数in= Φ (i n),将T的时间轴η非线性地映射到R的时间轴m上,并使该T与R的距离 D[T,R]满足:
[0107]
[0108]
[0109]
[0110]
[0111]
[0112] 可以看出很明显满足动态规划的条件,可以使用动态规划算法进行求解,其中动 态规划多项式为:
[0113] D (in, im) = d (T (in), R (im)) +min {D (in-1, im), D (in-1, im-1), D (in-1, im-2)}
[0114] 这样从(1,1)点出发(令D(l,1) = 0)搜索,反复递推,直到(N,M)就可以得到最 优路径,而且D (N,M)就是最佳匹配路径所对应的匹配距离。
[0115] 由于每个人的发言由多种因素影响,任何人重复发相同字符的声音在声波上不可 能完全相似,肯定存在差异性,定义这个差异性为判断的预定阀值。如果D(N,M) =0,则说 明两端语音T和R完全一致,可以证明为语音T和R为一个声音,可能存在录音攻击;如果 D (N,M)〈阀值,则说明两端语音T和R相似程度很高,同样可能存在录音攻击;如果D (N,M) > =阀值,则说明T和R不是同一语音,不存在录音攻击。
[0116] 本发明提出的能够防止录音攻击的声纹认证方法,通过验证用户语音中的字符和 发音方式与服务器生成的字符组合及字符的发音规则是否一致,能够有效的防止录音攻 击,攻击者即使能通过其他渠道获取到的用户语音满足语音内容,也无法满足发音方式的 要求。进一步的,为了防止用户重复输入的用户语音受到录音攻击,判断出用户语音中的字 符和发音方式与服务器生成的字符组合及字符的发音规则一致后,还判断当前待验证的语 音与历史语音库中该用户的语音是否一致,如果一致则说明存在录音攻击。本发明可以有 效的防止声纹认证中的录音攻击。
[0117] 如图5所示,图5为本发明一实施例的能够防止录音攻击的声纹认证方法流程图。 该方法是从请求终端侧进行的描述,具体的,声纹认证方法包括:
[0118] 步骤501 :发送一用户的声纹认证请求至服务器;
[0119] 步骤502 :接收并显示所述服务器发送的字符组合及字符的发音规则;
[0120] 步骤503 :接收用户根据所述字符组合及字符的发音规则输入的用户语音;
[0121] 步骤504 :将所述用户语音发送至所述服务器;
[0122] 步骤505 :接收所述服务器发送的声纹认证结果。
[0123] 如图6所示,图6为本发明一实施例的一种能够防止录音攻击的声纹认证服务器, 该服务器600包括,生成单元601,用于根据一用户的请求生成字符组合及字符的发音规 则;
[0124] 发送单元602,用于将所述字符组合及字符的发音规则发送给请求终端,将声纹认 证结果发送至所述请求终端;
[0125] 接收单元603,用于接收所述请求终端根据所述字符组合及字符的发音规则输入 的用户语音;
[0126] 声音检测单元604,用于根据所述用户语音、所述字符组合及字符的发音规则进行 声纹认证。
[0127] 如图7所示,图7为本发明一实施例的能够防止录音攻击的声纹认证终端。具体 的,该认证终端700包括:请求单元701,用于发送一用户的声纹认证请求至服务器;
[0128] 接收单元702,用于接收并显示所述服务器发送的字符组合及字符的发音规则,接 收所述服务器发送的声纹认证结果;
[0129] 录入单元703,用于接收用户根据所述字符组合及字符的发音规则输入的用户语 音;
[0130] 发送单元704,用于将所述用户语音发送至所述服务器。
[0131] 如图8所示,图8为本发明一实施例的能够防止录音攻击的声纹认证系统。
[0132] 该声纹认证系统包括服务器600及请求终端700,其中,所述服务器600用于根据 一用户的声纹认证请求生成字符组合及字符的发音规则;将所述字符组合及字符的发音规 则发送给请求终端;接收所述请求终端根据所述字符组合及字符的发音规则输入的用户语 音;根据所述用户语音、所述字符组合及字符的发音规则进行声纹认证;将所述声纹认证 结果发送至所述请求终端;
[0133] 所述请求终端700用于发送一用户的声纹认证请求至服务器;接收并显示所述服 务器发送的字符组合及字符的发音规则;接收用户根据所述字符组合及字符的发音规则 输入的用户语音;将所述用户语音发送至所述服务器;接收所述服务器发送的声纹认证结 果。
[0134] 本发明提出的能够防止录音攻击的声纹认证方法、服务器、终端及系统,通过验证 用户语音中的字符和发音方式与服务器生成的字符组合及字符的发音规则是否一致,能够 有效的防止录音攻击,攻击者即使能通过其他渠道获取到的用户语音满足语音内容,也无 法满足发音方式的要求。进一步的,为了防止用户重复输入的用户语音受到录音攻击,判断 出用户语音中的字符和发音方式与服务器生成的字符组合及字符的发音规则一致后,还判 断当前待验证的语音与历史语音库中该用户的语音是否一致,如果一致则说明存在录音攻 击。本发明可以有效的防止声纹认证中的录音攻击。
[0135] 为了更清楚的说明本申请的技术方案,下面以一具体实施例进行说明,结合图9 所示,防止录音攻击的系统工作流程为:
[0136] 步骤901 :客户端发送身份认证请求至服务器;
[0137] 步骤902 :服务器接收身份认证请求;
[0138] 步骤903:服务器根据身份认证请求随机生成验证字符组合以及字符的发音方 式,并将其发送给客户端;
[0139] 步骤904:客户端接收到服务器下发的待验证字符组合及字符的发音规则后,提 示用户按要求读入字符;
[0140] 步骤905:客户端接收用户读入的用户语音,并将用户读入的用户语音发送至服 务器;
[0141] 步骤906:服务器进行声纹验证,判断接收的用户语音与预先存储的该用户的语 音是否为同一人,具体实施时可采用目前常规的声纹验证算法;
[0142] 如果声纹验证不是同一个人,则直接返回用户认证失败给客户端;
[0143] 如果声纹验证为同一人,则继续录音检测;
[0144] 步骤907 :验证用户声音中的字符与服务器生成的字符组合中的字符是否相同; 如果用户声音中的字符与服务器生成的字符组合中的字符不相同,则用户声音中的字符验 证不通过,返回用户认证失败给客户端;如果用户声音中的字符与服务器生成的字符组合 中的字符相同,则用户声音中的字符验证通过,继续步骤908 ;
[0145] 步骤908 :验证用户声音中的字符的发音方式与服务器生成的字符发音方式是否 相同,如果用户声音中的字符的发音方式与服务器生成的字符发音方式不相同,则用户声 音中的字符发音方式验证不通过,返回用户认证失败给客户端;如果用户声音中的字符的 发音方式与服务器生成的字符发音方式相同,则用户声音中的字符发音方式验证通过,继 续步骤909 ;
[0146] 步骤909 :验证用户声音是否存在于历史语音库中,如果存在,则证明存在录音攻 击,认证失败,将认证失败结果发送给客户端;如果不存在,则声纹认证通过,将用户声音存 储于历史语音库中,将声纹认证通过结果发送给客户端。
[0147] 验证用户声音是否存在于历史语音库中的过程已在上述实施例中进行了详细的 说明,此处不再赘述。声纹认证通过后,客户端继续相应的操作,本发明对此不做限制。
[0148] 本发明提出的能够防止录音攻击的声纹认证方法、服务器、终端及系统,通过验证 用户语音中的字符和发音方式与服务器生成的字符组合及字符的发音规则是否一致,能够 有效的防止录音攻击,攻击者即使能通过其他渠道获取到的用户语音满足语音内容,也无 法满足发音方式的要求。进一步的,为了防止用户重复输入的用户语音受到录音攻击,判断 出用户语音中的字符和发音方式与服务器生成的字符组合及字符的发音规则一致后,还判 断当前待验证的语音与历史语音库中该用户的语音是否一致,如果一致则说明存在录音攻 击。本发明可以有效的防止声纹认证中的录音攻击。
[0149] 以上所述仅用于说明本申请技术方案,任何本领域普通技术人员均可在不违背本 发明的精神及范畴下,对上述实施例进行修饰与改变。因此,本发明的权利保护范围应视权 利要求范围为准。
【主权项】
1. 一种能够防止录音攻击的声纹认证方法,其特征在于,包括, 根据一用户的声纹认证请求生成字符组合及字符的发音规则; 将所述字符组合及字符的发音规则发送给请求终端; 接收所述请求终端根据所述字符组合及字符的发音规则输入的用户语音; 根据所述用户语音、所述字符组合及字符的发音规则进行声纹认证;将所述声纹认证 结果发送至所述请求终端。2. 如权利要求1所述的能够防止录音攻击的声纹认证方法,其特征在于,根据所述用 户语音、所述字符组合及字符的发音规则进行声纹认证进一步包括, 判断所述用户语音与所述用户历史输入的语音是否为同一人的声音; 判断所述用户语音中的字符与所述字符组合中的字符是否相同; 判断所述用户语音中的字符的发音方式与所述字符的发音规则是否匹配; 只有所述用户语音与所述用户历史输入的语音为同一人、所述用户语音中的字符与所 述字符组合中的字符相同且所述用户语音中的字符的发音方式与所述字符的发音规则匹 配时,声纹认证才通过,其他情况声纹认证不通过。3. 如权利要求2所述的能够防止录音攻击的声纹认证方法,其特征在于,判断出所述 用户语音与所述用户历史输入的语音为同一人、所述用户语音中的字符与所述字符组合中 的字符相同且所述用户语音中的字符的发音方式与所述字符的发音规则匹配后还包括, 将所述用户语音存储至历史语音库中。4. 如权利要求2所述的能够防止录音攻击的声纹认证方法,其特征在于,判断出所述 用户语音与所述用户历史输入的语音为同一人、所述用户语音中的字符与所述字符组合中 的字符相同且所述用户语音中的字符的发音方式与所述字符的发音规则匹配后还包括, 判断所述用户语音与所述用户在历史语音库中的语音是否一致; 如果所述用户语音与所述用户在历史语音库中的语音一致,则声纹认证不通过; 如果所述用户语音与所述用户在历史语音库中的语音不一致,则声纹认证通过,将所 述用户语音存储至历史语音库中。5. 如权利要求4所述的能够防止录音攻击的声纹认证方法,其特征在于,判断所述用 户语音与所述用户在历史语音库中的语音是否一致进一步包括, 提取所述用户语音的特征参数; 计算所述用户语音的特征参数与所述用户在历史数据库中的语音的特征参数的欧几 里德距离,所述欧几里德距离小于预定阈值时,所述用户语音与所述用户在历史语音库中 的语音一致,所述欧几里德距离大于预定阈值时,所述用户语音与所述用户在历史语音库 中的语音不一致。6. 如权利要求5所述的能够防止录音攻击的声纹认证方法,其特征在于,提取所述用 户语音的特征参数进一步包括, 对所述用户语音进行预处理,将所述用户语音按字符划分为多段语音; 找到每段语音中的有效语音部分的起点和终点; 提取有效语音部分的特征参数。7. 如权利要求1所述的能够防止录音攻击的声纹认证方法,其特征在于,所述字符组 合及字符的发音规则是随机生成的。8. -种能够防止录音攻击的声纹认证方法,其特征在于,包括, 发送一用户的声纹认证请求至服务器; 接收并显示所述服务器发送的字符组合及字符的发音规则; 接收用户根据所述字符组合及字符的发音规则输入的用户语音; 将所述用户语音发送至所述服务器; 接收所述服务器发送的声纹认证结果。9. 一种能够防止录音攻击的声纹认证服务器,其特征在于,包括, 生成单元,用于根据一用户的请求生成字符组合及字符的发音规则; 发送单元,用于将所述字符组合及字符的发音规则发送给请求终端,将声纹认证结果 发送至所述请求终端; 接收单元,用于接收所述请求终端根据所述字符组合及字符的发音规则输入的用户语 音; 声音检测单元,用于根据所述用户语音、所述字符组合及字符的发音规则进行声纹认 证。10. -种能够防止录音攻击的声纹认证终端,其特征在于,包括, 请求单元,用于发送一用户的声纹认证请求至服务器; 接收单元,用于接收并显示所述服务器发送的字符组合及字符的发音规则,接收所述 服务器发送的声纹认证结果; 录入单元,用于接收用户根据所述字符组合及字符的发音规则输入的用户语音; 发送单元,用于将所述用户语音发送至所述服务器。11. 一种能够防止录音攻击的声纹认证系统,其特征在于,包括服务器及请求终端,其 中,所述服务器用于根据一用户的声纹认证请求生成字符组合及字符的发音规则;将所述 字符组合及字符的发音规则发送给请求终端;接收所述请求终端根据所述字符组合及字符 的发音规则输入的用户语音;根据所述用户语音、所述字符组合及字符的发音规则进行声 纹认证;将所述声纹认证结果发送至所述请求终端; 所述请求终端用于发送一用户的声纹认证请求至服务器;接收并显示所述服务器发送 的字符组合及字符的发音规则;接收用户根据所述字符组合及字符的发音规则输入的用户 语音;将所述用户语音发送至所述服务器;接收所述服务器发送的声纹认证结果。
【文档编号】G10L15/26GK105933272SQ201511020257
【公开日】2016年9月7日
【申请日】2015年12月30日
【发明人】徐燕军, 何朔, 尹亚伟, 万四爽
【申请人】中国银联股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1