一种基于声纹的身份识别方法和设备与流程

文档序号：11202365阅读：571来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本发明涉及身份识别领域，特别涉及一种基于声纹的身份识别方法和设备。

背景技术：

人类与机器之间的信息传递，目前仍然以键盘输入的文字为主，但是这种方式需要额外的设备，识别不够方便，且容易被盗。

技术实现要素：

针对现有技术中的缺陷，本发明提出了一种基于声纹的身份识别方法和设备。

具体的，本发明提出了以下具体的实施例：

本发明实施例提出了一种基于声纹的身份识别方法，包括：

当业务应用请求需要用户确认身份信息时，提示所述用户输入语音密码；

接收所述用户的语音数据，并将所述语音数据转换为文字信息；

将所述文字信息与用户列表中各用户事先设置的预设语音密码中文字信息进行匹配；

若所述语音密码匹配成功，获取所述用户的声纹特征；

将所述声纹特征与所述用户列表中各用户事先设置的预设声纹特征进行匹配，获取匹配度；

若所述匹配度大于预设识别阈值，则确认所述用户的身份识别成功。

在一个具体的实施例中，该方法还包括：

基于所述业务应用请求确定所包括的用户；

基于所确定的用户生成用户列表。

在一个具体的实施例中，该方法还包括：

若所述语音密码匹配不成功，则提示所述用户再次输入语音密码。

在一个具体的实施例中，所述将所述声纹特征与所述用户列表中各用户事先设置的预设声纹特征进行匹配，获取匹配度，包括：

将所述声纹特征分别与所述用户列表中各用户事先设置的预设声纹特征进行匹配，获取到多个预设声纹特征匹配值；

选取最大预设声纹特征匹配值作为匹配度。

在一个具体的实施例中，该方法还包括：

若所述匹配度不大于预设识别阈值，则提示所述用户再次输入语音密码。

在一个具体的实施例中，该方法还包括：

获取用户输入的识别信息；

当所述识别信息验证通过后，获取所述用户输入的语音密码以及声纹特征；

在所述语音密码得到所述用户的确认之后，将所述语音密码以及声纹特征与所述用户进行关联并进行存储。

在一个具体的实施例中，所述识别信息包括身份证信息，和/或银行卡信息，和/或人脸识别数据。

在一个具体的实施例中，该方法还包括：

当基于预设的密码策略以及声纹特征的完整性确定需要额外的语音密码时，获取所述用户输入的其他语音密码；其中，所述其他语音密码不同于已存储的语音密码；

在所述其他语音密码得到所述用户的确认之后，将所述其他语言密码与所述用户进行关联并进行存储。

在一个具体的实施例中，所述语音密码具体为用户输入的语音；

所述在所述语音密码得到所述用户的确认之后，将所述语音密码以及声纹特征与所述用户进行关联并进行存储，包括：

将所述语音密码转换为文字信息；

播放或展示所述文字信息；

在得到所述用户的确认之后，将所述语音密码以及声纹特征与所述用户进行关联并进行存储。

本发明实施例还提出了一种基于声纹的身份识别设备，包括：

提示模块，用于当业务应用请求需要用户确认身份信息时，提示所述用户输入语音密码；

转换模块，用于接收所述用户的语音数据，并将所述语音数据转换为文字信息；

语音匹配模块，用于将所述文字信息与用户列表中各用户事先设置的预设语音密码中文字信息进行匹配；

获取模块，用于若所述语音密码匹配成功，获取所述用户的声纹特征；

声纹匹配模块，用于将所述声纹特征与所述用户列表中各用户事先设置的预设声纹特征进行匹配，获取匹配度；

识别模块，用于当所述匹配度大于预设识别阈值，确认所述用户的身份识别成功。

以此，本发明实施例提出了一种基于声纹的身份识别方法和设备，其中该方法包括：当业务应用请求需要用户确认身份信息时，提示所述用户输入语音密码；接收所述用户的语音数据，并将所述语音数据转换为文字信息；将所述文字信息与用户列表中各用户事先设置的预设语音密码中文字信息进行匹配；若所述语音密码匹配成功，获取所述用户的声纹特征；将所述声纹特征与所述用户列表中各用户事先设置的预设声纹特征进行匹配，获取匹配度；若所述匹配度大于预设识别阈值，则确认所述用户的身份识别成功。以此通过语音和声纹实现了对用户身份的识别，实现方便，识别准确，安全性高。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明实施例提出的一种基于声纹的身份识别方法的流程示意图；

图2为本发明实施例提出的一种基于声纹的身份识别方法中进行身份识别的流程示意图；

图3为本发明实施例提出的一种基于声纹的身份识别方法中录入声纹特征以及语音密码的流程示意图；

图4为本发明实施例提出的一种基于声纹的身份识别设备的结构示意图；

图5为本发明实施例提出的一种基于声纹的身份识别设备的结构示意图。

具体实施方式

在下文中，将更全面地描述本公开的各种实施例。本公开可具有各种实施例，并且可在其中做出调整和改变。然而，应理解：不存在将本公开的各种实施例限于在此公开的特定实施例的意图，而是应将本公开理解为涵盖落入本公开的各种实施例的精神和范围内的所有调整、等同物和/或可选方案。

在下文中，可在本公开的各种实施例中使用的术语“包括”或“可包括”指示所公开的功能、操作或元件的存在，并且不限制一个或更多个功能、操作或元件的增加。此外，如在本公开的各种实施例中所使用，术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合，并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。

在本公开的各种实施例中，表述“或”或“a或/和b中的至少一个”包括同时列出的文字的任何组合或所有组合。例如，表述“a或b”或“a或/和b中的至少一个”可包括a、可包括b或可包括a和b二者。

在本公开的各种实施例中使用的表述(诸如“第一”、“第二”等)可修饰在各种实施例中的各种组成元件，不过可不限制相应组成元件。例如，以上表述并不限制所述元件的顺序和/或重要性。以上表述仅用于将一个元件与其它元件区别开的目的。例如，第一用户装置和第二用户装置指示不同用户装置，尽管二者都是用户装置。例如，在不脱离本公开的各种实施例的范围的情况下，第一元件可被称为第二元件，同样地，第二元件也可被称为第一元件。

应注意到：如果描述将一个组成元件“连接”到另一组成元件，则可将第一组成元件直接连接到第二组成元件，并且可在第一组成元件和第二组成元件之间“连接”第三组成元件。相反地，当将一个组成元件“直接连接”到另一组成元件时，可理解为在第一组成元件和第二组成元件之间不存在第三组成元件。

在本公开的各种实施例中使用的术语“用户”可指示使用电子装置的人或使用电子装置的装置(例如，人工智能电子装置)。

在本公开的各种实施例中使用的术语仅用于描述特定实施例的目的并且并非意在限制本公开的各种实施例。如在此所使用，单数形式意在也包括复数形式，除非上下文清楚地另有指示。除非另有限定，否则在这里使用的所有术语(包括技术术语和科学术语)具有与本公开的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义，除非在本公开的各种实施例中被清楚地限定。

实施例1

本发明实施例1公开了一种基于声纹的身份识别方法，如图1所示，包括：

步骤101、当业务应用请求需要用户确认身份信息时，提示所述用户输入语音密码；

步骤102、接收所述用户的语音数据，并将所述语音数据转换为文字信息；

步骤103、将所述文字信息与用户列表中各用户事先设置的预设语音密码中文字信息进行匹配；

步骤104、若所述语音密码匹配成功，获取所述用户的声纹特征；

步骤105、将所述声纹特征与所述用户列表中各用户事先设置的预设声纹特征进行匹配，获取匹配度；

步骤106、若所述匹配度大于预设识别阈值，则确认所述用户的身份识别成功。

具体的，在一个实施例中，还包括：

基于所述业务应用请求确定所包括的用户；

基于所确定的用户生成用户列表。

具体的，以一个具体的例子来进行说明，例如业务应用请求为转账，基于该业务，可以查询到所可能对应的用户(例如预先只有这些用户绑定了该业务，或者进行了该业务的设置)，并将查询到的用户形成用户列表

在一个具体的实施例中，该方法还包括：

若所述语音密码匹配不成功，则提示所述用户再次输入语音密码。

在一个具体的实施例中，步骤105中的所述将所述声纹特征与所述用户列表中各用户事先设置的预设声纹特征进行匹配，获取匹配度，包括：

将所述声纹特征分别与所述用户列表中各用户事先设置的预设声纹特征进行匹配，获取到多个预设声纹特征匹配值；

选取最大预设声纹特征匹配值作为匹配度。

在一个具体的实施例中，该方法还包括：

若所述匹配度不大于预设识别阈值，则提示所述用户再次输入语音密码。

具体的，在一个实施例中，使用声纹识别验证用户身份流程如图2所示，包括如下流程：

1、业务应用请求本发明所述系统确认用户身份；

2、系统根据请求，判断可能出现的用户范围(可能是一个或多个)；

3、系统与用户建立会话，提示用户输入语音密码；

4、系统调用语音识别模块，将用户语音转换为文字，并与用户列表中各用户事先设置的语音密码进行比较；

5、如果语音密码匹配失败，则提示用户重新输入，转回步骤3；

6、如果语音密码匹配成功，则调用声纹识别模块，提取用户声纹特征，并与用户列表中事先保存的声纹特征进行比较；取出与声纹特征匹配最佳的用户，取出匹配度比值；

7、系统判断匹配度的值；

8、如果匹配度大于或等于事先设定的识别通过值，则认为身份识别成功；

9、如果匹配度小于事先设定的识别最小值，则认为身份识别失败，结束流程；

10、如果匹配度小于事先设定的识别通过值，但大于或等于事先设定的识别最小值，系统认为需要进一步识别用户身份，转到步骤3，提示用户再次输入下一组语音密码。

至于采集声纹特征以及语音密码，具体的流程如下：

在一个具体的实施例中，该方法还包括：

获取用户输入的识别信息；

当所述识别信息验证通过后，获取所述用户输入的语音密码以及声纹特征；

在所述语音密码得到所述用户的确认之后，将所述语音密码以及声纹特征与所述用户进行关联并进行存储。

在一个具体的实施例中，所述识别信息包括身份证信息，和/或银行卡信息，和/或人脸识别数据。

在一个具体的实施例中，该方法还包括：

在所述其他语音密码得到所述用户的确认之后，将所述其他语言密码与所述用户进行关联并进行存储。

在一个具体的实施例中，所述语音密码具体为用户输入的语音；

所述在所述语音密码得到所述用户的确认之后，将所述语音密码以及声纹特征与所述用户进行关联并进行存储，包括：

将所述语音密码转换为文字信息；

播放或展示所述文字信息；

在得到所述用户的确认之后，将所述语音密码以及声纹特征与所述用户进行关联并进行存储。

具体的，以一个具体的实施例来进行说明，具体如图3所示：

1、系统与用户建立会话；

2、系统要求用户输入信息，并借助外部系统(如公安身份证信息、银行卡绑定、人脸识别等)对用户身份进行核实；

3、系统进一步收集用户信息，通过一定保密措施之后妥善保存在用户信息数据库中；

4、系统提示用户设置语音密码；

5、用户使用语音输入，设置语音密码；系统调用声纹识别模块提取用户语音的声纹特征；

6、系统保存用户的声纹特征；

7、系统调用语音识别模块，将用户输入语音转换为文字，并向用户播放或展示，提示用户确认；

8、用户确认密码正确后，系统保存语音密码；

实施例2

本发明实施例2还公开了一种基于声纹的身份识别设备，如图4所示，包括：

提示模块201，用于当业务应用请求需要用户确认身份信息时，提示所述用户输入语音密码；

转换模块202，用于接收所述用户的语音数据，并将所述语音数据转换为文字信息；

语音匹配模块203，用于将所述文字信息与用户列表中各用户事先设置的预设语音密码中文字信息进行匹配；

获取模块204，用于若所述语音密码匹配成功，获取所述用户的声纹特征；

声纹匹配模块205，用于将所述声纹特征与所述用户列表中各用户事先设置的预设声纹特征进行匹配，获取匹配度；

识别模块206，用于当所述匹配度大于预设识别阈值，确认所述用户的身份识别成功。

在一个具体的实施例中，该设备还包括：

生成模块，用于基于所述业务应用请求确定所包括的用户；

基于所确定的用户生成用户列表。

在一个具体的实施例中，该设备还包括：

第一提示模块，用于当所述语音密码匹配不成功时，提示所述用户再次输入语音密码。

在一个具体的实施例中，所述将所述声纹特征与所述用户列表中各用户事先设置的预设声纹特征进行匹配，获取匹配度，包括：

将所述声纹特征分别与所述用户列表中各用户事先设置的预设声纹特征进行匹配，获取到多个预设声纹特征匹配值；

选取最大预设声纹特征匹配值作为匹配度。

在一个具体的实施例中，该设备还包括：

第二提示模块，用于当所述匹配度不大于预设识别阈值，则提示所述用户再次输入语音密码。

在一个具体的实施例中，该设备还包括：

录入模块，用于获取用户输入的识别信息；

当所述识别信息验证通过后，获取所述用户输入的语音密码以及声纹特征；

在所述语音密码得到所述用户的确认之后，将所述语音密码以及声纹特征与所述用户进行关联并进行存储。

在一个具体的实施例中，所述识别信息包括身份证信息，和/或银行卡信息，和/或人脸识别数据。

在一个具体的实施例中，该设备还包括：

增强模块，用于当基于预设的密码策略以及声纹特征的完整性确定需要额外的语音密码时，获取所述用户输入的其他语音密码；其中，所述其他语音密码不同于已存储的语音密码；

在所述其他语音密码得到所述用户的确认之后，将所述其他语言密码与所述用户进行关联并进行存储。

在一个具体的实施例中，所述语音密码具体为用户输入的语音；

所述录入模块在所述语音密码得到所述用户的确认之后，将所述语音密码以及声纹特征与所述用户进行关联并进行存储，包括：

将所述语音密码转换为文字信息；

播放或展示所述文字信息；

在得到所述用户的确认之后，将所述语音密码以及声纹特征与所述用户进行关联并进行存储。

具体的，在一个具体的实施例中，该设备如图5所示，包括以下模块：

声纹特征数据库：用于保存用户声纹特征信息。

用户信息数据库：用于保存用户个人信息。

语音通信模块：用于实现系统和用户之间的语音通信，包括放音单元、录音单元和传输系统，例如，传统电话网络是一种语音通信模块。

语音转换模块：用于将用户的语音转化为文字。根据用户发音的特点，可提供支持用户方言或不够标准的普通话。

声纹识别模块：用于识别用户音色、节奏、语气、语调等发音特征，并通过一定算法提取为数字信息。

智能处理模块：使用声音、图像和文字等方式与用户交互，组织和处理业务流程。包括调用语音通信模块采集用户语音，调用语音识别和声纹识别模块进行识别，访问声纹特征数据库和个人信息数据库，并提供与外部系统的接口，实现用户身份识别功能。

本发明所述利用声纹识别认定用户身份的方法，包括两个部分：一部分是保存用户信息，另一部分是验证用户身份。其中，保存用户身份信息流程如下：

1、系统与用户建立通信会话，在确认用户身份之后，收集用户声纹特征，并保存在声纹特征数据库中；

2、系统请求用户设置一组语音密码，每级密码分别设置对应的提示语，并保存在用户个人信息数据库中；

其中，语音通信模块301包括录音单元、放音单元和传输系统。录音单元负责对用户发出的语音进行采样，放音单元负责向用户播放提示语音，传输系统负责将语音信息传输到其它模块。

声纹识别模块302负责解析和处理用户声音采样，并通过一定的算法，抽取出用户声纹特征。当采样样本数较多时，可以获得更准确的特征数据。此模块也负责比对两个声纹特征，比较结果可以通过比值进行量化。

语音转换模块303负责实现语音和文本之间的转换，即tts技术。

声纹特征数据库304专门负责存储用户声纹特征。一个用户的声纹特征由语气、语调、语速、音色、音调、频率范围等内容组成。此模块可从多个维度保存用户声纹特征，并与用户建立关联关系。

用户信息数据库305负责保存用户身份信息，包括用户的姓名、证件类型和证件号、性别、生日、联系方式等，

智能处理模块306负责执行逻辑，灵活调用各个模块的能力，完成交互过程。它同时处理与外部系统的通信。

本发明通过声纹识别的，具备以下有益效果：

一、绝大多数用户终端设备都具备发音和声音采样功能，因此声纹识别对用户终端的要求低，不需要额外增加成本；

二、相比其它身份识别手段，语音输出是人类最为快捷、自然、简单的传递信息方式，几乎没有学习成本；

三、同时识别用户声纹特征和语音内容，可以有效识别他人仿冒；

四、精确计算匹配度并据此使用多次校验的密码策略，能有效提高识别率，解决单次识别无法确认身份的问题。

本领域技术人员可以理解附图只是一个优选实施场景的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中，也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块，也可以进一步拆分成多个子模块。

上述本发明序号仅仅为了描述，不代表实施场景的优劣。

以上公开的仅为本发明的几个具体实施场景，但是，本发明并非局限于此，任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：叶建生;胡志尧;姜小华
技术所有人：深圳市讯联智付网络有限公司
我是此专利的发明人

上一篇：一种快速组合轻质异形陈列架的制造方法与工艺
上一篇：一种智能化展示货架的制造方法与工艺