一种基于超声波的语音重放攻击的活体检测方法与流程

文档序号：22433488发布日期：2020-10-02 10:20阅读：757来源：国知局

本发明属于语音安全领域，涉及语音信息处理、语音安全分析、重放攻击检测和活体检测。本发明可应用于语音安全领域中的活体检测领域。

背景技术：

语音认证系统作为一种快捷方便的认证方式，已经应用于多种重要领域，因此语音安全成为了一个非常重要的课题，对语音认证系统的欺骗攻击检测也十分关键。在多种攻击中，重放攻击是最为常见的一种攻击，因此对重放攻击的检测有很大的现实意义。在多种检测攻击的方法中，活体检测因其检测方法直接，信息来源多样而被很多学者研究，也有不少已经投入市场。而现有的重放攻击检测方法中大多都对用户提出了较高的要求，导致用户在进行语音认证时需要保持违背正常的手机使用习惯的动作，对位置和距离都提出了较为苛刻的要求，比如必须垂直于地面，手机必须保持静止等；或者有些方法对认证环境提出了极为苛刻的环境，二者在现实生活中的使用场景下都是很难实现的，降低了用户的体验。

技术实现要素：

为解决语音认证系统的重放攻击检测的安全性问题，本发明提出了一种新的检测重放攻击的活体检测方法，以解决上述问题，达到检测重放攻击的目的，达到保证安全性的同时也能保证用户的使用体验的目的，做到用户友好，算法简单，并应用于实际语音信号处理系统中。

本发明的目的是通过以下技术方案实现的：

一种基于超声波的语音重放攻击的活体检测方法，包括以下步骤：

步骤1：发送连续超声波，保证较高频率和一定幅值；

步骤2：由于用户发声，在嘴部气流波动的影响下高频回波在低频语音对应时段出现了明显的毛刺；

步骤3：通过滤波和重采样，得到完整高频回波信号；

步骤4：提取超声回波信号的包络检波，获得与低频有效语音段时域对应的包络段，并分析其毛刺信息。

上述技术方案中，进一步地，所述的步骤1具体为：

步骤1.1：用户开始认证时会打开手机的扬声器，该扬声器能发送具有一特定频率(20khz以上)和特定幅值(0db)的超声波，此频率和幅值保证其正常使用。

进一步地，步骤2包括以下子步骤：

步骤2.1：用户认证时会打开手机的麦克风，同时用户会说出指定认证内容，用户的语音信号被手机麦克风收集；

步骤2.2：超声波到达人脸后，经过漫反射会有部分返回，再经过空气传播过程中的衰减后到达手机麦克风，超声回波被成功采集。

进一步地，所述的步骤3包括以下子步骤：

步骤3.1：对采集到的语音信号做重采样，采用高频频谱补零扩展的方法，将采样率从原来的低采样率(44.1hz)扩展到200khz以上；

步骤3.2：重采样后得到的信号同时包含低频语音信号和超声回波信号，需要经过滤波将二者分开。

进一步地，所述的步骤4包括以下子步骤：

步骤4.1：滤波后得到低频语音信号，对其进行有效语音片段的识别和截取；

步骤4.2：由于滤波后高低频时域相对应，根据识别出的低频有效语音片段，对高频的超声回波信号相应地进行截取，得到待分析的超声回波信号；

步骤4.3：对待分析的超声回波信号提取包络检波，超声回波信号的包络检波中具有明显毛刺，对包络检波做快速傅里叶变换，获得其频率信息。对包络检波的的频率进行分析后，判断待分析的超声回波信号是否有明显毛刺。毛刺信息的特征主要表现为，在用户直接认证的语音的高频信号中，与低频有效语音信号时域相对应的包络段中有明显的毛刺，而攻击者的重放攻击不具有此特征，或者说此特征表现很弱。明显毛刺具有频率较高的特点，其数量特征主要表现为毛刺部分频率为5khz～10khz。

步骤4.4：得到高频超声回波信号的毛刺信息后，以此为依据来判定此语音信号来自真实用户还是来自重放攻击：若具有明显毛刺信息则此语音信号来自真实用户，若没有明显毛刺则此语音信号来自重放攻击。

本发明的有益效果是：

1、利用超声回波作为特征信息载体，并巧妙利用超声波和语音信号可以用一个手机麦克风手机的特点，仅利用一个麦克风即可同时收集到低频语音信息和超声回波，简化设备，有效地降低了成本同时提升了用户体验；

2、利用用户认证时低频语音信号对超声波回波的影响来表征用户特性，在时域分析，提取包络线即可获得明显特征，处理简单而有效，简化算法；

3、采用此方法扩大了超声波的应用领域，简化了活体检测的方法，用更简单的方法做到了重放攻击的检测，有效地提高了语音认证系统的安全性。

附图说明

图1是本发明实施例的真实用户认证场景模型示意图；

图2是本发明实施例的攻击者重放攻击场景模型示意图；

图3是本发明实施例的真实用户认证场景中的原始语音信号；

图4是本发明实施例的真实用户认证场景中的原始语音信号；

图5是本发明实施例的重采样前后对比图；

图6是本发明实施例的滤波前后信号示意图；

图7是本发明实施例的真实用户认证场景中的包络检波特征提取前后的高频超声回波信号；

图8是本发明实施例的攻击者重放攻击场景中的包络检波特征提取前后的高频超声回波信号；

图9是本发明实施例的流程框图。

具体实施方式

为了便于本领域普通技术人员理解和实施此发明，下面结合附图及实施例对本发明作进一步的详细阐述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。

本发明提供了一种利用超声波回波作为用户特征载体的活体检测方法，利用用户语音认证时对着手机麦克风说话造成局部气流的剧烈波动，从而对手机接收到的超声波回波产生明显影响，以此作为判定用户与攻击者的活体检测方法。

本发明巧妙利用超声波和语音信号可以用一个手机麦克风手机的特点，减轻了语音认证检测的设备需求，降低了对用户认证时的要求，在降低成本的同时提升了用户体验。

本实施例以“一次用户语音认证过程或攻击者重放攻击过程与语音信号处理”对本发明进行详细分析和仔细说明。

如图9所示，本发明提供一种基于麦克风非线性特性的超声波动态处理方法，包括以下步骤：

步骤1：用户开始认证，手机扬声器发送连续超声波。考虑到实际手机的硬件条件，并且为保证后续的处理效果，发送20khz的超声波，并选择合适的幅值以保证有足够的能量。超声波经过人脸漫反射后部分到达手机的麦克风并被收集，同时被收集的还有用户认证时的语音信息，在此案例中用户所说内容为“你好”。

对应此步骤有两种不同的场景进行对比，分别是真实用户认证和攻击者重放攻击。真实用户认证场景模型示意图请见图1，攻击者重放攻击场景模型示意图请见图2。

步骤2：低频语音信号与超声回波信号同时被手机麦克风收集，得到的信号是低频语音信号和高频超声回波信号混杂在一起的信号。真实用户认证场景和攻击者重放攻击场景收集到的信号详见图3和图4。直接观察两种场景收集到的语音信号略有不同，可以得出的结论是语音信号的能量相比于超声波来说更强，而攻击者重放攻击场景中的超声波回波能量明显更强。

下面对信号做进一步的处理，进入软件处理部分。首先由于手机的采样率对于超声波信号来说远远不够，会造成信息的严重丢失，故需要对原信号做重采样，采用的方法是对频谱的高频部分补零扩展。为了保证信号可以尽可能地还原，使重采样后的频率达到400khz。重采样后得到的波形更好地还原了高频的超声波信号的信息。重采样前后的示意图详见图5，其中上图为重采样前的波形，下图为重采样后的波形。

随后对重采样过的信号进行滤波处理，以分离低频的语音信号与高频的超声回波信号。考虑到实际中正常说话的人声的频率范围是500hz到2khz，所发送的超声波的频率为20khz，设置理想的高通滤波器和低通滤波器，分别获得0～10khz的低频部分和10khz以上的高频部分。滤波前后的示意图详见图6，图中自上而下分别为滤波前信号、滤波后0～10khz的低频语音信号和滤波后10khz以上的高频超声回波信号。

在此步骤中，两个场景中的语音经过了相同的处理，都得到了低频的语音信号和高频的超声回波信号。

步骤3：对滤波后的高频超声回波信号做包络检波，提取超声回波的特征信息。高频超声回波信号的包络检波前后波形的示意图，以及两图的对比，详见图7或图8，其中自上而下，第二幅图为包络检波前的高频超声回波信号，第三幅图为包络检波，第四幅图为二者的合成对比。

在此步骤中，对高频的超声回波信号做包络检波时，用到了希尔伯特变换，下面给出包络检波的数学原理。

希尔伯特变换能在振幅保持不变的情况下将输入信号的相角偏移90度，简单地说就是能够将正弦波形转换为余弦波形。相角偏移90度相当于复数平面上的点与虚数单位1j相乘，因此希尔伯特变换的频率响应可以用如下公式表示：

h(ω)＝-jsgn(ω)

利用希尔伯特变换做包络检波的原理公式如下：

根据上述包络检波的原理获得滤波后的高频超声回波信号的包络信息。

步骤4：对低频的语音信号进行端点检测，获得有效语音片段的时域信息并截取。由于步骤2中滤波后得到的高频和低频信号时域相对应，故可以根据低频信号中有效语音片段的时域信息在高频信息中进行截取，得到待分析的高频超声回波信号。

在此步骤中，两种不同场景下得到的特征提取前后的波形，详见图7和图8。在图7和图8中，分别包括四张图，自上而下分别是滤波后的低频语音信号、滤波后的高频超声回波信号、高频超声回波信号的包络检波和包络检波前后波形的对比图。两种场景下的语音信号所获得的待分析的高频超声回波信号不同，在真实用户认证的场景中，所得到的截取后的超声回波信号带有明显的毛刺，具有较高的频率；而在攻击者重放攻击的场景中，所得到的截取后的超声回波信号没有明显的毛刺，近乎平滑。根据这个明显的特征可以很有效地将真实用户与攻击者的重放攻击区分开，以达到检测重放攻击的目的。

应当理解的是，本说明书未详细阐述的部分均属于现有技术。

应当理解的是，上述针对实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以作出替换或变形，均落入本发明的保护范围之内，本发明的请求保护范围应该以所附权利要求为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：冀晓宇;张欣怡;陈铁炜;渠倩楠
技术所有人：浙江大学
我是此专利的发明人

上一篇：一种半导体超纯水处理系统及工艺的制作方法
上一篇：一种污水净化装置及其使用方法与流程