用户验证方法和装置的制作方法

文档序号：6402409阅读：407来源：国知局

专利名称：用户验证方法和装置的制作方法
技术领域：
本发明涉及云计算领域，并且特别地，涉及一种用户验证方法和系统。
背景技术：
随着云计算的蓬勃发展，给各行各业带来了便利，但是很多行业部门出于对云计算的环境安全的考虑而较少地使用云计算，尤其是一些对信息安全要求极高的金融机构。然而在登录环节对用户的身份进行验证可以很好地确保云计算环境的安全，因此，如何在登录环节对云计算的环境进行安全控制已经成为关注的重点。在登录环节常用的身份识别方法有密码、指纹识别等，然而，利用人的语音进行身份识别以其特有的优点越来越受到人们的重视。例如，语音信号不会丢失或遗忘；语音信号是非接触、自然的方式，从而更容易被接受和使用；语音信号采集方便，所用到的设备(麦克风、电话等)成本相对比较低。用户识别技术发展到今天虽然已经有几十年的历史，也取得了许多优秀的成果，但是仍然存在着大量难点，直到现在为止还未达到令人满意的程度，尽管有些识别器已经投放市场，并用于商业、军事、工业控制等领域，但基本上还停留在实验阶段。语音处理领域包括语音识别和用户识别，在这两者之中，用户识别更加困难。如今越来越多的场合都需要对人们的身份进行准确的识别，但是利用传统的方式进行身份认证的技术逐渐显现出许多不足。针对相关技术中身份认证的方式存在安全隐患的问题，目前尚未提出有效的解决方案。

发明内容
针对相关技术中身份验证的方式存在安全隐患的问题，本发明提出一种用户验证方法和装置，能够对人的身份进行快速、可靠的验证，从而在登录环节提高系统的安全性。本发明的技术方案是这样实现的:根据本发明的一个方面，提供了一种用户验证方法。该用户验证方法包括:根据从用户的语音信号中提取的语音特征参数获取特征矢量，其中，语音特征参数包括线性预测倒谱系数、基音周期、差分线性预测倒谱系数和/或差分基音周期；使用预先存储的与用户对应的码本量化特征矢量，得到平均量化误差；根据得到的平均量化误差与预先存储的与用户对应的平均量化误差的差值，确定用户是否通过语音验证。其中，差分线性预测倒谱系数由线性预测倒谱系数计算得到，差分基音周期由基音周期计算得到。而且，在从用户的语音信号中提取语音特征参数之前，根据用户输入的个人信息确定用户的身份。进一步地，在使用预先存储的与用户对应的码本量化特征矢量时，根据确定的用户的身份调用码本。并且，在使用预先存储的与用户对应的码本量化特征矢量时，使用码本对特征矢
量进行矢量量化。此外，该用户验证方法进一步包括:采集用户的虹膜信息，将采集的虹膜信息与预先存储的与用户对应的虹膜信息比较；根据虹膜信息的比较结果确定用户是否通过虹膜验证。根据本发明的一个方面，提供了一种用户验证装置。该用户验证装置包括:获取模块，用于根据从用户的语音信号中提取的语音特征参数获取特征矢量，其中，语音特征参数包括线性预测倒谱系数、基音周期、差分线性预测倒谱系数和/或差分基音周期；量化模块，用于使用预先存储的与用户对应的码本量化特征矢量，得到平均量化
误差;确定模块，用于根据得到的平均量化误差与预先存储的与用户对应的平均量化误差的差值，确定用户是否通过语音验证。此外，该用户验证装置还包括:身份确定模块，用于在从用户的语音信号中提取语音特征参数之前，根据用户输入的个人信息确定用户的身份。并且，在使用预先存储的与用户对应的码本量化特征矢量时，上述量化模块还用于根据确定的用户的身份调用码本。进一步地，在使用预先存储的与用户对应的码本量化特征矢量时，上述量化模块用于使用码本对特征矢量进行矢量量化。本发明通过对从用户的语音信号中提取的语音特征参数进行处理，再根据处理后的信息与预存的信息进行比较，来判断用户是否通过语音验证，能够对人的身份进行快速、可靠的验证，从而在登录环节提高系统的安全性。

图1是根据本发明实施例的用户验证方法的流程图；图2是在实际应用中使用本发明的用户验证方法的云安全登录系统的流程图；图3是根据本发明实施例的语音识别方法的流程图；图4是在实施根据本发明实施例之前对采集的用户语音信号进行预处理的流程图；图5是根据本发明实施例的语音识别方法提取语音特征参数的流程图；图6是根据本发明实施例的语音识别方法处理图5提取的语音特征参数的流程图；图7是根据本发明实施例的虹膜识别方法的流程图；图8是根据本发明实施例的虹膜识别方法提取的眼部灰度直方图的示意图；图9是对图8所示的眼部灰度直方图进行平滑处理后的示意图10是根据本发明实施例的用户验证装置的框图。
具体实施例方式下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员所获取的所有其他实施例，都属于本发明保护的范围。根据本发明的实施例，提供了一种用户验证方法。如图1所示，根据本发明实施例的用户验证方法包括:步骤S101，根据从用户的语音信号中提取的语音特征参数获取特征矢量，其中，语音特征参数包括线性预测倒谱系数、基音周期、差分线性预测倒谱系数和/或差分基音周期；步骤S103，使用预先存储的与用户对应的码本量化特征矢量，得到平均量化误差;步骤S105，根据得到的平均量化误差与预先存储的与用户对应的平均量化误差的差值，确定用户是否通过语音验证。其中，差分线性预测倒谱系数由线性预测倒谱系数计算得到，差分基音周期由基音周期计算得到。而且，在从用户的语音信号中提取语音特征参数之前，根据用户输入的个人信息确定用户的身份。进一步地，在使用预先存储的与用户对应的码本量化特征矢量时，根据确定的用户的身份调用码本。并且，在使用预先存储的与用户对应的码本量化特征矢量时，使用码本对特征矢
量进行矢量量化。在实际应用中，可以将根据本发明实施例的用户验证方法用于云安全登录系统。如图2所示，使用本发明的用户验证方法的云安全登录系统的使用步骤如下所示:步骤S201,登录人访问请求；步骤S203，非生物识别方法验证，例如,密码输入等；步骤S205，判断是否验证成功，如果成功则进入步骤S207，如果失败则拒绝登录；步骤S207，包括语音识别和虹膜识别，首先，对系统内部的相关人员进行生物识别信息(语音信息和虹膜信息)的采集，以便训练形成生物信息库，再将处理后的登录人的信息与生物信息库存中预先采集的与登录人对应的信息进行对比；步骤S209，判断两个特征(即，上述的语音信息和虹膜信息)是否同时相符，如果同时相符，则成功登录，否则拒绝登录。用户识别方法分为两个部分:训练方法和识别方法。在训练方法阶段，对输入语音进行特征提取，然后训练成用户模型库。识别阶段对输入的语音进行匹配计算然后再判决，从而得出结果。在使用了根据本发明的实施例的用户验证方法的云安全登录系统中包括两个一级模块，为语音识别方法和虹膜识别方法，以下对两个一级模块进行详细描述。一级模块--语音识别方法包括四个二级模块，分别为:语音识别、用户语音信号预处理、语音特征参数提取以及用户确认系统的矢量量化和分类决策。一级模块--虹膜识别包括:虹膜内缘识别和虹膜外缘识别。如图3所示，根据本发明实施例的语音识别方法的步骤具体如下所示:步骤S301，用户通过系统与外界的接口输入语音；步骤S303，系统对用户进行语音采集；步骤S305，系统对采集的语音进行端点检测、加窗等预处理；步骤S307，系统对经过预处理的语音信号进行处理，即提取四个特征系数，分别为:线性预测倒谱系数(Liner Prediction Cepstral Coding, LPCC)、差分线性预测倒谱系数、基音周期以及差分基音周期；步骤S309,系统对处理后的语音信号进行矢量量化(Vector Quantization, VQ)；

当处于训练阶段时，执行步骤S311，存储相应码本码字和平均量化误差0，为每个用户建立语音模板，然后执行步骤S313，当处于识别阶段时，直接执行步骤S313 ；步骤S313，提取所要确认身份的用户的模板(即预先存储的用户的码本)量化所输入的语音；步骤S315，得到平均量化误差O '与阈值进行比较判决。在实现上述的一级模块一语音识别之前，无论是训练阶段或是识别阶段，都要对输入的语音进行预处理。如图4所示，语音识别的二级模块对用户语音信号进行预处理，具体步骤如下:步骤S401，读取原始语音；步骤S403，对读取的语音进行分帧、加窗和端点检测等操作；步骤S405,调用IittleEnergy (),得到语音信息的每巾贞的短时能量；步骤S407,调用IittleZeroO ,得到每巾贞的短时过零率；步骤S409,计算每巾贞能频值；步骤S411，队列中下一帧是否存在，如果存在，则返回步骤S409，如果不存在，则继续步骤S413 ;步骤S413,调用findBeginingO ,计算有效巾贞的起始索引；步骤S415,调用findEndO ,计算有效巾贞的截止索引；步骤S417，得到有效帧数据；步骤S419,调用trameToDataO ,由有效巾贞数据还原语音数据。通过对采集的语音信号进行预处理，能得到较高的语音信噪比，且语音信号被分成了一帧一帧的语音信号，利于进行下述特征提取等操作，并且，图3所示仅为一种示例性的处理方法，还可采用本领域公知的其它技术来对语音信号进行预处理。语音信号处理完毕之后就要进行特征提取。语音信号特征参数提取是根据本发明实施例的语音识别方法的关键环节。语音信号的特征参数可以用来表征语音信号序列。在用户识别中，要提取出可以表征用户声音特点的参数，而丢弃表征语义内容的参数。特征提取就是从用户的语音信号中提取出表示用户个性的基本特征。一般都包含在两个方面，即生成语音的发音器官的差异(先天的)和发音器官发音时动作的差异(后天的)，前者主要表现在语音的频率结构上，主要包含了反映声道共振与反共振特性的频谱包络特征信息和反映声带振动等音源特性的频谱细节构造特征信息。代表性的特征参数有倒谱和基因参数(静态特征)。后者的发音习惯差异主要表现在语音的频率结构的时间变化上，主要包含了特征参数的动态特性，代表性的特征参数是倒谱和基音的线性回归系数(动态特征)，即差值倒谱和差值基音参数。在用户识别中，频谱包络特征特别是倒谱特征用的比较多，因为使用倒谱特征可以得到比较好的识别性能，而且稳定的倒谱系数比较容易提取。和倒谱相比，基音特征只存在于浊音部分，而且准确稳定的基音特征较难提取。一般来说，人能从声音的音色、频高、能量的大小等信息中知觉用户的个人特性。所以可以想象，如果利用特征的有效组合，可以得到比较稳定的识别性能。例如，利用倒谱特征和可靠性能高的区间的基音特征的有效组合进行识别实验，首先对于浊音部、清音部、无音部分分别进行编码，在浊音部用倒谱，差值倒谱，基音，差值基音，在其他区间用倒谱和差值倒谱作为识别特征，然后利用两部分的概率加权值和闭值进行比较，可以得到较好的识别效果。根据上述分析，可知选取的特征应当满足下面的特征:(I)能够有效地区分不同的用户，但又能在同一用户的语音发生变化时相对保持稳定;(2)易于从语音信号中提取；(3)不易被模仿；(4)尽量不随时间和空间变化。综合考虑以上各种因素，根据本发明实施例的用户验证方法选用线性预测倒谱系数(Liner Prediction Cepstral Coding, LPCC)、差分线性预测倒谱系数、基音周期和/或差分基音周期四种特征参数的组合来表征用户的语音特征。在实现上述的一级模块(语音识别时)，无论是训练阶段或是识别阶段，都需要提取用户输入的语音信号的语音特征参数。如图5所示，对图4中得到的有效语音数据进行语音特征参数的提取，具体步骤如下:步骤S501，对有效语音数据调用getFramelLPCO，得到每帧的线性预测参数；步骤S503,对步骤S501得到的每巾贞的线性预测参数调用getFramelLPCC (),得到每帧的线性预测倒谱系数；步骤S505,对步骤S503得到的每巾贞的线性预测倒谱系数调用getMarginData (),得到每帧的差分线性预测倒谱系数；步骤S507，对有效语音数据调用getFramelLPCO，得到每帧的基音频率；步骤S509，对步骤S507得到的每帧的基音频率调用getMarginData ()，得到每帧的差分基音频率；步骤S511，对由步骤S503、步骤S505、步骤S507、步骤S509得到的每帧的线性预
测倒谱系数、差分线性预测倒谱系数、基音频率、差分基音频率调用getFramelFeatureO，得到组合特征。然后，使用用户确认系统的矢量量化和分类决策对图5所得的组合特征(即从训练语音提取的特征矢量)进行处理，具体步骤如下:步骤S601,调用getFirstCodeWordO ,得到训练语音的初始码本；步骤S603，采用LBG算法得到训练语音的最优码字，计算平均量化误差o ;
步骤S605，将以上二者(即最优码字和平均量化误差O )联合作为用户模型存入数据库；步骤S607，抽取用户的模型(即训练样本)量化待检测人的语音，得到平均量化误差O ,;步骤S609，计算待检测语音的E(即| o-o ! /o)与阈值进行比较判决待测语音是否为待识别语音，如果E小于阈值，则语音验证成功，若E大于阈值，则语音验证失败。此外，根据本发明实施例的用户验证方法进一步包括:采集用户的虹膜信息，将采集的虹膜信息与预先存储的与用户对应的虹膜信息比较；根据虹膜信息的比较结果确定用户是否通过虹膜验证。在实际应用中，根据本发明实施例的虹膜识别包括虹膜内缘识别和虹膜外缘识别。其中，如图7所示，虹膜内缘识别的具体流程如下所示:步骤S701，根据输入眼部图像，得到眼部灰度直方图，其中，灰度直方图有效地反映了图像中某灰度出现的次数或是频率；步骤S703，获得分割阈值，选取阈值的核心指标就是眼睛图像的灰度直方图，选取合适的阈值可以较准确的分割出瞳孔的区域；步骤S705，基于阈值，利用形态学滤波进行瞳孔内边缘的定位；步骤S707，像素统计，得出瞳孔中心坐标和半径。在实际情况中，如图8所示，为获取的眼部灰度直方图，然后利用高斯整型滤波器对眼部灰度直方图进行平滑处理。如图9所示，为平滑后的眼部灰度直方图。如图9中平滑以后的灰度直方图所示，由于瞳孔区域的灰度最小，所以没有特别明显的波峰，主要都是集中在第一个不太明显的波峰位置上pl，而睫毛眼睑的区域部分主要集中在第二个较明显的波峰P2上，因此可以将pl和p2之间的波谷p3位置作为瞳孔分割的阈值。P3位于pl和p2之间，存储了分布不多的边缘灰度值。步骤S705包括对瞳孔区域的定位。自动阈值分割完图像以后，得到的二值图像除了清晰可见的瞳孔区域以外还会混有其他的噪声区域，比如眼睑睫毛或是由于光照而产生的暗区域。采用形态学滤波的方法可以剔除图像中的噪声和以及一些干扰信息，并且可以对边界点进行填充和修复，对“空洞”进行填补。本发明的虹膜内缘识别的技术方案所采用的形态学滤波方法的公式为:f/ = erodeN2^N1 {dilateN2 (erodeN1 ( f))}其中，f'代表瞳孔区域，f表示眼部二值图，erode ()表示腐蚀函数，dilate ()表示膨胀函数。通过对眼部二值图取反，然后进行NI次腐蚀，N2次膨胀，再进行N2-N1次腐蚀可得出瞳孔区域。再根据像素统计，得出瞳孔中心坐标和半径，从而得出虹膜的内边缘信息。此外，根据本发明的虹膜识别方法的外边缘可利用现有技术实现，因此，不在文中具体描述。根据虹膜内外边缘所得出的虹膜信息，与预存储的信息进行比较，如果虹膜信息符合，则验证成功。并且，在虹膜验证与语音验证同时通过验证的情况下，可成功登录系统。根据本发明的实施例，提供了一种用户验证装置。本发明的实施例的用户验证装置包括:获取模块101，用于根据从用户的语音信号中提取的语音特征参数获取特征矢量，其中，语音特征参数包括线性预测倒谱系数、基音周期、差分线性预测倒谱系数和/或差分基音周期；量化模块102，用于使用预先存储的与用户对应的码本量化特征矢量，得到平均量化误差；确定模块103，用于根据得到的平均量化误差与预先存储的与用户对应的平均量化误差的差值，确定用户是否通过语音验证。此外，该用户验证装置还包括:身份确定模块(未示出)，用于在从用户的语音信号中提取语音特征参数之前，根据用户输入的个人信息确定用户的身份。并且，在使用预先存储的与用户对应的码本量化特征矢量时，上述量化模块102还用于根据确定的用户的身份调用码本。进一步地，在使用预先存储的与用户对应的码本量化特征矢量时，上述量化模块102用于使用码本对特征矢量进行矢量量化。综上所述，借助于本发明的上述技术方案，本发明通过对从用户的语音信号中提取的语音特征参数进行处理，再根据处理后的信息与预存的信息进行比较，来判断用户是否通过语音验证，并且对用户附加虹膜验证，能够对人的身份进行快速、可靠的验证，从而在登录环节提高系统的安全性。以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
权利要求
1.一种用户验证方法，其特征在于，包括: 根据从用户的语音信号中提取的语音特征参数获取特征矢量，其中，所述语音特征参数包括线性预测倒谱系数、基音周期、差分线性预测倒谱系数和/或差分基音周期；使用预先存储的与所述用户对应的码本量化所述特征矢量，得到平均量化误差；根据得到的所述平均量化误差与预先存储的与所述用户对应的平均量化误差的差值，确定所述用户是否通过语音验证。
2.根据权利要求1所述的用户验证方法，其特征在于，所述差分线性预测倒谱系数由所述线性预测倒谱系数计算得到，所述差分基音周期由所述基音周期计算得到。
3.根据权利要求1所述的用户验证方法，其特征在于，在从所述用户的语音信号中提取所述语音特征参数之前，根据所述用户输入的个人信息确定所述用户的身份。
4.根据权利要求3所述的用户验证方法，其特征在于，在使用预先存储的与所述用户对应的码本量化所述特征矢量时，根据确定的所述用户的身份调用所述码本。
5.根据权利要求1所述的用户验证方法，其特征在于，使用预先存储的与所述用户对应的码本量化所述特征矢量包括: 使用所述码本对所述特征矢量进行矢量量化。
6.根据权利要求1所述的用户验证方法，进一步包括: 采集所述用户的虹膜信息，将采集的所述虹膜信息与预先存储的与所述用户对应的虹膜信息比较；根据虹膜信息的比较结果确定所述用户是否通过虹膜验证。
7.一种用户验证装置，其特征在于，包括: 获取模块，用于根据从用户的语音信号中提取的语音特征参数获取特征矢量，其中，所述语音特征参数包括线性预测倒谱系数、基音周期、差分线性预测倒谱系数和/或差分基音周期；量化模块，用于使用预先存储的与所述用户对应的码本量化所述特征矢量，得到平均量化误差；确定模块，用于根据得到的所述平均量化误差与预先存储的与所述用户对应的平均量化误差的差值，确定所述用户是否通过语音验证。
8.根据权利要求7所述的验证装置，包括: 身份确定模块，用于在从所述用户的语音信号中提取所述语音特征参数之前，根据所述用户输入的个人信息确定所述用户的身份。
9.根据权利要求8所述的验证装置，其特征在于，在使用预先存储的与所述用户对应的码本量化所述特征矢量时，所述量化模块还用于根据确定的所述用户的身份调用所述码本。
10.根据权利要求7所述的用户验证装置，其特征在于，在使用预先存储的与所述用户对应的码本量化所述特征矢量时，所述量化模块用于使用所述码本对所述特征矢量进行矢量量化。
全文摘要
本发明公开了一种用户验证方法和装置，其中，该方法包括根据从用户的语音信号中提取的语音特征参数获取特征矢量，其中，语音特征参数包括线性预测倒谱系数、基音周期、差分线性预测倒谱系数和/或差分基音周期；使用预先存储的与用户对应的码本量化特征矢量，得到平均量化误差；根据得到的平均量化误差与预先存储的与用户对应的平均量化误差的差值，确定用户是否通过语音验证。本发明通过对从用户的语音信号中提取的语音特征参数进行处理，再根据处理后的信息与预存的信息进行比较，来判断用户是否通过语音验证，能够对人的身份进行快速、可靠的验证，从而在登录环节提高系统的安全性。
文档编号G06F21/32GK103207961SQ20131014425
公开日2013年7月17日申请日期2013年4月23日优先权日2013年4月23日
发明者杨莉, 曹振南, 范玉峰, 张海忠, 高崎, 姜海旺, 高增, 许辉, 马庆怀申请人:曙光信息产业(北京)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨莉;曹振南;范玉峰;张海忠;高崎;姜海旺;高增;许辉;马庆怀
技术所有人：曙光信息产业（北京）有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。