语音重放检测方法和装置的制造方法

文档序号：9922701阅读：404来源：国知局

语音重放检测方法和装置的制造方法
【技术领域】
[0001] 本申请设及计算机信息服务技术领域，特别是设及一种语音重放检测方法和装置。
【背景技术】
[0002] 说话人识别技术，又称为声纹识别技术，主要是基于语音中说话人包含的个性特征的信息，利用计算机W及各种信息识别技术，自动地实现说话人身份的确认。
[0003] 近几年来，随着互联网的飞速发展，语音作为一种非接触性信息载体，人们可W依靠各种移动终端设备，例如:手机、麦克风和IP电话等，随时随地的完成语音采集，并通过网络传输和后台服务器来实现人机交互和说话人身份识别。
[0004] 随着移动互联网时代的到来，在给予人类方便快捷的同时，也带来了许多安全隐患。如图1所示，若说话人A的语音被企图闯入者预先窃取并录制，继而将录制的语音重新播放至说话人识别系统，说话人识别系统通常将难W区分，从而导致企图闯入者成功地W说话人A的录音闯入说话人A的账号，对说话人A的账号带来极大的安全隐患。

【发明内容】

[0005] 本申请提供一种录音重放检测方法和装置，W解决说话人识别技术中语音重放的问题。
[0006] 为了解决上述问题，本申请公开了一种语音重放检测方法，包括：
[0007] 依据目标用户的预留训练语音建立用户信道模型；
[000引计算待识别语音在所述用户信道模型上的信任度打分，获得待识别语音的信任度打分；
[0009] 若所述信任度打分小于设定阔值，则认定待识别语音存在重放，返回认证失败;反之，通过重放检测。
[0010] 优选地，依据目标用户的预留训练语音建立用户信道模型的步骤包括：
[0011] 提取目标用户的预留训练语音的低能量语音段；
[0012] 若低能量语音段的时间长度小于设定阔值，则依据信道通用背景模型自适应获取用户信道模型;反之，则采用最大期望算法直接获取用户信道模型。
[0013] 优选地，所述提取目标用户的预留训练语音的低能量语音段的步骤之前还包括：
[0014] 计算当前预留训练语音段的采样值的平方和得到当前预留训练语音段的能量，若所述能量低于设定阔值，则认定为低能量语音段。
[0015] 优选地，依据信道通用背景模型自适应获取用户信道模型的步骤包括：
[0016] 提取目标用户的预留训练语音的低能量段的多复合声学特征；
[0017] 依据最大后验概率估计算法，利用所述低能量训练语音数据的多复合特征对所述信道通用背景模型进行模型自适应更新，得到用户信道模型。
[0018] 优选地，所述提取所述低能量语音段的多复合声学特征的步骤包括：
[0019] 提取低能量语音段的多类语音声学特征，并拼接成高维度声学特征；
[0020] 使用主成分分析PCA对高维度声学特征进行处理，获得正交化的声学特征；
[0021] 使用线性判别分析LDA对正交化后的声学特征进行处理，获得低维度声学特征，将所述低维度声学特征作为多复合声学特征。
[0022] 优选地，训练所述信道通用背景模型的步骤包括：
[0023] 获取系统开发集语音数据的多复合声学特征；
[0024] 计算多复合声学特征中每一帖声学特征在信道通用背景模型上的后验概率；
[0025] 通过最大期望算法计算模型参数的极值，使其在多复合声学特征上的总体概率最大；
[0026] 通过最大期望算法反复迭代使模型参数不断更新，直到得到收敛的模型参数值，将所述收敛的模型参数值对应的模型作为信道通用背景模型。
[0027] 优选地，计算待识别语音在目标用户信道模型上的信任度打分的步骤包括：
[0028] 提取待识别语音的低能量段的多复合声学特征；
[0029] 计算每一帖多复合声学特征在目标用户信道模型上的概率似然分；
[0030] 计算全部概率似然分的平均值作为待识别语音的信任度打分。
[0031] 为了解决上述问题，本申请还公开了一种语音重放检测装置，包括：
[0032] 用户信道模块，用于依据目标用户的预留训练语音建立用户信道模型；
[0033] 计算模块，用于计算待识别语音在目标用户信道模型上的信任度打分，获得待识别语音的信任度打分；
[0034] 第一判断模块，用于若所述信任度打分小于设定阔值，则认定待识别语音存在重放，返回认证失败;反之，通过重放检测。
[0035] 优选地，用户信道模块包括：
[0036] 第一提取模块，用于提取目标用户的预留训练语音的低能量语音段；
[0037] 多复合声学特征模块，用于提取所述低能量语音段的多复合声学特征；
[0038] 第二判断模块，用于若低能量语音段的时间长度小于设定阔值，则依据信道通用背景模型自适应获取用户信道模型;反之，则采用最大期望算法直接获取用户信道模型。
[0039] 优选地，第一提取模块之前还包括:第=判断模块，用于计算当前预留训练语音段的采样值的平方和得到当前预留训练语音段的能量，若所述能量低于设定阔值，则认定为低能量语音段。
[0040] 与现有技术相比，本申请包括W下优点：
[0041] 本申请通过目标用户的预留训练语音建立用户信道模型，依据用户信道模型计算待识别语音的信任度打分，将信任度打分与设定的阔值比较，若信任度打分小于设定阔值，则认定待识别语音存在重放，返回待识别语音认证失败，反之，则通过重放检测，即待识别语音认证成功，通过计算待识别语音在所述用户信道模型上的信任度打分，，从而避免了闯入者重放攻击的问题。
【附图说明】
[0042] 图1是本申请录音重放应用场景的示意图；
[0043] 图2是本申请实施例一所述一种语音重放检测方法的流程图；
[0044] 图3是本申请语音数据在录音前后的时域图；
[0045] 图4是本申请语音数据在录音前后的频域图；
[0046] 图5是本申请实施例二所述一种语音重放检测方法的流程图；
[0047] 图6是本申请一种语音重放检测方法应用的实例；
[0048] 图7是本申请实施例=所述一种语音重放检测装置的结构框图。
【具体实施方式】
[0049] 为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本申请作进一步详细的说明。
[0050] 实施例一
[0051] 参照图2,示出了本申请实施例一所述一种语音重放检测方法的流程图，具体包括：
[0052] 步骤201:依据目标用户的预留训练语音建立用户信道模型。
[0053] 预先获取目标用户的预留训练语音，根据获取的目标用户的预留训练语音建立用户信道模型。
[0054] 可W通过从后台服务器或者目标用户的客户端获取预留训练语音，也可W采用其他方式获取预留训练语音，对此本申请不做具体限制。
[0055] 步骤202:计算待识别语音在所述用户信道模型上的信任度打分。
[0056] 本申请使用用户信道模型对用户端输入的待识别语音进行信任度打分，获取待识别语音的信任度打分，根据信任度打分判断输入的待识别语音是否存在重放。
[0057

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郑方;李蓝天;邬晓钧;王小钢;刘乐;
技术所有人：清华大学;北京得意音通技术有限责任公司;
我是此专利的发明人

上一篇：音频处理装置和方法
上一篇：带相位自校正功能的声聚焦麦克风阵列长距离拾音装置的制造方法