一种声纹验证方法和装置与流程

文档序号：15020407发布日期：2018-07-25 00:34阅读：327来源：国知局

本发明涉及身份验证技术领域，特别是涉及一种声纹验证方法和装置。

背景技术：

随着语音技术的逐渐成熟，语音识别、TTS(Text To Speech，从文本到语言)合成、语种识别、声纹识别等多项技术被应用。其中，由于声纹具有唯一性，在建立声纹模型后，将用户输入的声纹与该声纹模型进行匹配，可以通过这种方式验证用户身份。

声纹虽然具有唯一性，但无法避免恶意模拟，比如：通过录音等手段模拟用户的声纹，可以成功通过身份验证，造成安全隐患。

技术实现要素：

本发明提供一种声纹验证方法和装置，用以解决恶意模拟用户的声纹，可以通过身份验证的问题。

为了解决上述技术问题，本发明是通过以下技术方案来解决的：

本发明提供了一种声纹验证方法，包括：采集待验证的语音信息；在所述语音信息对应的声音波形中，提取声纹特征；将所述声音波形和预存的标准声音波形进行波形匹配，将所述声纹特征和预存的标准声纹特征进行特征匹配；如果所述波形匹配和所述特征匹配都匹配成功，则声纹验证通过。

其中，在所述采集待验证的语音信息之前，还包括：截取用户输入的语音片段；将所述语音片段的声音波形作为标准声纹波形进行存储。

其中，在所述采集待验证的语音信息之前，还包括：根据截取的所述语音片段生成随机密码并存储所述随机密码。

其中，所述采集待验证的语音信息，包括：获取预先存储的随机密码；提示用户通过语音方式输入获取的所述随机密码；采集所述用户通过语音方式输入的所述随机密码，作为待验证的语音信息。

其中，将所述声音波形和预存的标准声音波形进行波形匹配，将所述声纹特征和预存的标准声纹特征进行特征匹配，包括：将所述声音波形和预存的标准声音波形进行波形匹配；如果所述波形匹配成功，则将所述声纹特征和预存的标准声纹特征进行特征匹配，反之，则声纹验证不通过；如果所述特征匹配成功，则声纹验证通过，反之，则声纹验证不通过；或者，将所述声纹特征和预存的标准声纹特征进行特征匹配；如果所述特征匹配成功，则将所述声音波形和预存的标准声音波形进行波形匹配，反之，则声纹验证不通过；如果所述波形匹配成功，则声纹验证通过，反之，则声纹验证不通过。

本发明还提供了一种声纹验证装置，包括：采集模块，用于采集待验证的语音信息；提取模块，用于在所述语音信息对应的声音波形中，提取声纹特征；验证模块，用于将所述声音波形和预存的标准声音波形进行波形匹配，将所述声纹特征和预存的标准声纹特征进行特征匹配；如果所述波形匹配和所述特征匹配都匹配成功，则声纹验证通过。

其中，所述采集模块，还用于：在采集待验证的语音信息之前，截取用户输入的语音片段；将所述语音片段的声音波形作为标准声音波形进行存储。

其中，所述采集模块，还用于：在所述采集待验证的语音信息之前，根据截取的所述语音片段生成随机密码并存储所述随机密码。

其中，所述采集模块进一步用于：获取预先存储的随机密码；提示用户通过语音方式输入获取的所述随机密码；采集所述用户通过语音方式输入的所述随机密码，作为待验证的语音信息。

其中，所述验证模块进一步用于：将所述声音波形和预存的标准声音波形进行波形匹配；如果所述波形匹配成功，则将所述声纹特征和预存的标准声纹特征进行特征匹配，反之，则声纹验证不通过；如果所述特征匹配成功，则声纹验证通过，反之，则声纹验证不通过；或者，将所述声纹特征和预存的标准声纹特征进行特征匹配；如果所述特征匹配成功，则将所述声音波形和预存的标准声音波形进行波形匹配，反之，则声纹验证不通过；如果所述波形匹配成功，则声纹验证通过，反之，则声纹验证不通过。

本发明有益效果如下：

本发明不但对声纹特征进行匹配验证，还要对声音波形进行匹配验证，两个匹配验证都通过，才认定声纹验证通过。这样即便用户的声纹特征被恶意模拟，也不会发生声纹特征和声音波形同时被模拟的情况，进而通过本发明避免了用户的声纹特征被恶意模拟，可以通过身份验证的问题。

附图说明

图1是根据本发明第一实施例的声纹验证方法的流程图；

图2是根据本发明第二实施例的声纹验证方法的流程图；

图3是根据本发明第三实施例的声纹验证装置的结构图。

具体实施方式

以下结合附图以及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不限定本发明。

实施例一

本实施例提供一种声纹验证方法。图1是根据本发明第一实施例的声纹验证方法的流程图。本实施例的执行主体为终端设备。

步骤S110，采集待验证的语音信息。

在启动声纹验证功能后，采集用户输入的语音信息，该语音信息为待验证的语音信息。在本实施例中，该语音信息可以是用户输入的语音密码。

采集语音信息可以包括以下几个步骤：

步骤1，启动声纹验证功能，提示用户语音输入语音密码。语音密码可以是一段文字或数字，用户通过麦克风读出该段文字或数字即可。

步骤2，采集用户通过麦克风输入的语音密码。语音信号为语音信息的载体，语音信号为具有波形的声音，用户读出的语音密码承载在声音波形中。

步骤S120，在该语音信息对应的声音波形中，提取声纹特征。

声音波形为承载用户输入的语音信息的波形。在输入同一语音信息时，由于不同用户的音色不同，说话方式不同，导致不同用户的声音波形不同。

将声音波形转换为声波频谱，在声波频谱中提取声纹特征。声纹特征包括但不限于：声音的波长、频率、强度、节奏。每个用户的声纹特征具有唯一性。

步骤S130，将该声音波形和预存的标准声音波形进行波形匹配，将该声纹特征和预存的标准声纹特征进行特征匹配。

标准声音波形为合法用户预先输入语音信息时的声音波形。

可以截取用户输入的语音片段；将截取的语音片段的声音波形作为标准声纹波形进行存储；根据截取的语音片段生成随机密码并存储所述随机密码(语音密码)。语音片段是指：在用户输入的语音信息中截取的部分语音信息。例如：用户输入语音信息“今天天气不错”，在该语音信息中截取部分语音信息“天气不错”，该“天气不错”即是语音片段。进一步地，随机密码可以是对语音片段进行语音识别而形成的文本信息。

在采集待验证的语音信息时，可以获取预先存储的随机密码；提示用户通过语音方式输入获取的所述随机密码；采集所述用户通过语音方式输入的所述随机密码，以便作为待验证的语音信息。

标准声纹波形为合法用户的声纹特征。可以预先采集合法用户输入的语音信息，根据该语音信息提取出合法用户的声纹特征并存储。

波形匹配和特征匹配可以同时进行，或者按顺进行。按顺进行，可以先进行波形匹配，再进行特征匹配；也可以先进行特征匹配，再进行波形匹配。

波形匹配是计算用户输入的语音信号的声音波形和标准声音波形的相似度，如果波形的相似度大于预设的波形相似度阈值，则认定波形匹配，反之，则认定波形不匹配。波形相似度阈值为经验值或实验获得的值，例如为98％。

特征匹配是计算用户输入的语音信号的声纹特征和标准声纹特征的相似度，如果特征的相似度大于预设的特征相似度阈值，则认定特征匹配，反之，则认定特征不匹配。特征相似度阈值为经验值或实验获得的值，例如为98％。

步骤S140，如果波形匹配和特征匹配都匹配成功，则声纹验证通过。

声纹验证通过，说明待验证的语音信息合法，输入该待验证的语音信息的用户为合法用户。

如果波形匹配和特征匹配中的一个或两个匹配失败，则声纹验证不通过。声纹验证不通过，说明输入待验证的语音信息的用户为非法用户。

本实施例不但对声纹特征进行匹配验证，还要对声音波形进行匹配验证，两个匹配验证都通过，才认定声纹验证通过。这种情况下，即便用户的声纹特征被恶意模拟，也不会发生声纹特征和声音波形同时被模拟的情况，进而通过本发明避免了用户的声纹特征被恶意模拟，可以通过身份验证的问题，提升身份验证的准确度。

实施例二

下面给出一个较为具体的实施例来说明本发明的声纹验证方法。

在本实施例中，先将声音波形和预存的标准声音波形进行波形匹配；如果波形匹配成功，则再将声纹特征和预存的标准声纹特征进行特征匹配，反之，则声纹验证不通过；如果特征匹配成功，则声纹验证通过，反之，则声纹验证不通过。当然，也可以先将声纹特征和预存的标准声纹特征进行特征匹配；如果特征匹配成功，则将声音波形和预存的标准声音波形进行波形匹配，反之，则声纹验证不通过；如果波形匹配成功，则声纹验证通过，反之，则声纹验证不通过。

图2是根据本发明第二实施例的声纹验证方法的流程图。

步骤S210，提取用户的标准声纹特征。

提示用户输入语音信息，录制用户输入的语音信息，在该语音信息中，提取用户的声纹特征，将用户的声纹特征存储到声纹模型库中。

该步骤S210可以在终端设备初始化时进行。

步骤S220，截取用户输入的语音片段。

为了提升声纹验证的安全性，可以在每次声纹验证通过之后，截取用户输入的语音片段，将该语音片段对应的标准声音波形以及根据语音片段生成的随机密码用在下一次声纹验证中，这样每次进行声纹验证，用户都会输入新生成的随机密码，使用新存储的标准声音波形。当然，在首次进行声纹验证时，可以在提取标准声纹特征时所使用的语音信息中，截取语音片段，根据该语音片段生成随机密码，并将该语音片段的声音波形作为标准声音波形。

步骤S230，根据该语音片段生成随机密码并存储，以及将该语音片段的声音波形作为标准声音波形进行存储。

具体的，在用户使用语音功能的过程中，录制用户输入的语音信息；在录制的所述语音信息中，截取多个语音片段；将多个所述语音片段的声音波形都作为标准声音波形进行存储。根据每个所述语音片段生成一个随机密码；存储多个所述语音片段分别对应的随机密码。

例如：在用户通话过程中，录制通话内容，截取用户的语音片段，根据该语音片段生成随机密码，并将该语音片段的声音波形作为标准声音波形。

步骤S240，在进行声纹验证时，提示用户语音输入与语音片段对应的随机密码。

启动声纹验证功能进行本次声纹验证。在存储的多个随机密码中，获取其中一个随机密码，在屏幕中显示该随机密码，并提示用户通过语音方式输入该随机密码。例如：语音片段为“天气不错”，那么就提示用户输入“天气不错”。

步骤S250，采集该用户根据所述提示语音输入的随机密码，形成待验证的语音信息。

步骤S260，将该语音信息的声音波形和标准声音波形进行波形匹配。如果波形匹配成功，则执行步骤S270；如果波形匹配失败，则执行步骤S290。

步骤S270，将该语音信息的声纹特征和标准声纹特征进行特征匹配。如果特征匹配成功，则执行步骤S280；如果特征匹配失败，则执行步骤S290。

步骤S280，声纹验证通过。

步骤S290，声纹验证不通过。

本实施例的每次需要用户输入的语音片段不同，使用的标准声音波形不同，在进行特征匹配之前，先确定用户的声音波形是否和存储的语音片段的声音波形是否匹配，在波形匹配成功的前提下，进行特征匹配，提高了用户身份验证的准确度。

实施例三

本实施例提供一种声纹验证装置。图3是根据本发明第三实施例的声纹验证装置的结构图。本实施例的所述装置可以设置在终端设备中。

该装置包括：

采集模块310，用于采集待验证的语音信息。

提取模块320，用于在所述语音信息对应的声音波形中，提取声纹特征。

验证模块330，用于将所述声音波形和预存的标准声音波形进行波形匹配，将所述声纹特征和预存的标准声纹特征进行特征匹配；如果所述波形匹配和所述特征匹配都匹配成功，则声纹验证通过。

在一个实施例中，采集模块310，还用于在采集待验证的语音信息之前，截取用户输入的语音片段；将所述语音片段的声音波形作为标准声纹波形进行存储。

在另一实施例中，采集模块310，还用于在所述采集待验证的语音信息之前，根据截取的所述语音片段生成随机密码并存储所述随机密码。

在又一实施例中，获取预先存储的随机密码；提示用户通过语音方式输入获取的所述随机密码；采集所述用户通过语音方式输入的所述随机密码作为待验证的语音信息。

在再一实施例中，验证模块330进一步用于：将所述声音波形和预存的标准声音波形进行波形匹配；如果所述波形匹配成功，则将所述声纹特征和预存的标准声纹特征进行特征匹配，反之，则声纹验证不通过；如果所述特征匹配成功，则声纹验证通过，反之，则声纹验证不通过；或者，验证模块330进一步用于：将所述声纹特征和预存的标准声纹特征进行特征匹配；如果所述特征匹配成功，则将所述声音波形和预存的标准声音波形进行波形匹配，反之，则声纹验证不通过；如果所述波形匹配成功，则声纹验证通过，反之，则声纹验证不通过。

本实施例所述的装置的功能已经在图1～2所示的方法实施例中进行了描述，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此不做赘述。

尽管为示例目的，已经公开了本发明的优选实施例，本领域的技术人员将意识到各种改进、增加和取代也是可能的，因此，本发明的范围应当不限于上述实施例。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：柳岸
技术所有人：中兴通讯股份有限公司
我是此专利的发明人

上一篇：一种可自动分级储存的经济信息管理系统的制作方法
上一篇：一种Modbus-CAN协议转换装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。