声纹验证方法、服务器、客户端及系统的制作方法

文档序号：2827700阅读：320来源：国知局

声纹验证方法、服务器、客户端及系统的制作方法
【专利摘要】本发明公开了一种声纹验证方法、服务器、客户端及系统，属于计算机【技术领域】。该方法包括：接收客户端发送的携带业务类型的业务操作请求；向客户端发送携带验证语料的验证指令；接收客户端获取到的当前用户根据验证语料输入的验证声音数据，并生成验证声纹；确定验证声纹与合法用户的参考声纹之间的相似度分值是否达到业务类型对应的预设相似度分值；其中，不同业务类型对应不同预设相似度分值；如果是，则确定当前用户通过声纹验证。本发明通过为不同业务类型设置不同预设相似度分值，并在进行声纹验证时，通过确定验证声纹与参考声纹之间的相似度的分值是否达到业务类型对应的预设相似度分值来进行声纹验证，声纹验证方法更具灵活性。
【专利说明】声纹验证方法、服务器、客户端及系统

【技术领域】
[0001] 本发明涉及计算机【技术领域】，特别涉及一种声纹验证方法、服务器、客户端及系统。

【背景技术】
[0002] 为了保障用户信息或用户财产的安全，很多应用场景均需要对用户进行身份验证。例如，各种社交应用软件的客户端、银行应用软件的客户端在操作时均需要对操作客户端的用户进行身份验证，等等。由于不同用户的声音往往具有不同的特征，因此，在进行身份验证时，可以根据不同用户的声音数据生成声纹，从而通过声纹实现对用户进行身份验证。
[0003] 通常，针对于支持声纹验证的所有业务类型，在进行声纹验证时，均分为声纹注册和声纹验证两个过程。其中，在声纹注册时，客户端录制合法用户的一段声音数据，将该声音数据上传至服务器，服务器将该声音数据生成注册声纹。在声纹验证时，客户端录制当前用户的一段声音数据，将该声音数据上传至服务器后，服务器将该声音数据生成验证声纹，并将该验证声纹与注册声纹进行匹配来确定当前用户是否为合法用户。如果验证声纹与注册声纹匹配，则声纹验证通过；否则，声纹验证未通过。
[0004] 在实现本发明的过程中，发明人发现相关技术至少存在以下问题：
[0005] 由于相关技术在进行声纹验证时，基本的验证过程为将验证声纹与注册声纹进行匹配来实现，当验证声纹与注册声纹匹配时，则声纹验证通过。然而，针对于不同的业务类型，其涉及的用户信息或用户财产的安全系数并不相同，如果采用上述相关技术的方法进行声纹验证，则对不同业务类型进行声纹验证的方式相同，导致声纹验证的灵活性不高。

【发明内容】

[0006] 为了解决相关技术的问题，本发明实施例提供了一种声纹验证方法、服务器、客户端及系统。所述技术方案如下：
[0007] 第一方面，提供了一种声纹验证方法，所述方法包括：
[0008] 接收客户端发送的携带业务类型的业务操作请求；
[0009] 根据所述业务操作请求向所述客户端发送携带验证语料的验证指令；
[0010] 接收所述客户端获取到的操作所述客户端的当前用户根据所述验证语料输入的验证声音数据，并根据所述验证声音数据生成验证声纹；
[0011] 确定所述验证声纹与预先存储的参考声纹之间的相似度分值是否达到所述业务类型对应的预设相似度分值，所述参考声纹为操作所述客户端的合法用户的声纹；其中，不同业务类型对应不同预设相似度分值；
[0012] 如果所述验证声纹与所述参考声纹之间的相似度分值达到所述业务类型对应的预设相似度分值，则确定所述当前用户通过声纹验证。
[0013] 第二方面，提供了一种声纹验证方法，所述方法包括：
[0014] 向服务器发送携带业务类型的业务操作请求；
[0015] 接收所述服务器根据所述业务操作请求发送的携带验证语料的验证指令；
[0016] 获取操作客户端的当前用户根据所述验证语料输入的验证声音数据，并将所述验证声音数据提交至所述服务器，使所述服务器根据所述验证声音数据生成验证声纹，并根据所述验证声纹与预先存储的操作所述客户端的合法用户的参考声纹对所述当前用户进行声纹验证。
[0017] 第三方面，提供了一种声纹验证服务器，所述服务器包括：
[0018] 第一接收模块，用于接收客户端发送的携带业务类型的业务操作请求；
[0019] 第一发送模块，用于根据所述业务操作请求向所述客户端发送携带验证语料的验证指令；
[0020] 第二接收模块，用于接收所述客户端获取到的操作所述客户端的当前用户根据所述验证语料输入的验证声音数据；
[0021] 第一生成模块，用于根据所述验证声音数据生成验证声纹；
[0022] 第一确定模块，用于确定所述验证声纹与预先存储的参考声纹之间的相似度分值是否达到所述业务类型对应的预设相似度分值，所述参考声纹为操作所述客户端的合法用户的声纹；其中，不同业务类型对应不同预设相似度分值；
[0023] 第二确定模块，用于当所述验证声纹与所述参考声纹之间的相似度分值达到所述业务类型对应的预设相似度分值时，确定所述当前用户通过声纹验证。
[0024] 第四方面，提供了一种声纹验证客户端，所述客户端包括：
[0025] 发送模块，用于向服务器发送携带业务类型的业务操作请求；
[0026] 第一接收模块，用于接收所述服务器根据所述业务操作请求发送的携带验证语料的验证指令；
[0027] 第一获取模块，用于获取操作客户端的当前用户根据所述验证语料输入的验证声音数据；
[0028] 第一提交模块，用于将所述验证声音数据提交至所述服务器，使所述服务器根据所述验证声音数据生成验证声纹，并根据所述验证声纹与预先存储的操作所述客户端的合法用户的参考声纹对所述当前用户进行声纹验证。
[0029] 第五方面，提供了一种声纹验证系统，所述系统包括服务器和客户端；
[0030] 其中，所述服务器如上述第三方面所述的服务器；
[0031] 所述客户端如上述第四方面所述的客户端。
[0032] 本发明实施例提供的技术方案带来的有益效果是：
[0033] 通过为不同业务类型设置不同预设相似度分值，并在进行声纹验证时，通过确定验证声纹与参考声纹之间的相似度的分值是否达到业务类型对应的预设相似度分值来进行声纹验证，从而可以针对不同的业务类型确定是否声纹验证成功，声纹验证方法更具灵活性。

【专利附图】

【附图说明】
[0034] 为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0035] 图1是本发明一实施例提供的一种声纹验证方法所涉及的实施环境示意图；
[0036] 图2是本发明另一实施例提供的一种声纹验证方法的流程图；
[0037] 图3是本发明另一实施例提供的一种声纹验证方法的流程图；
[0038] 图4是本发明另一实施例提供的一种声纹验证方法的流程图；
[0039] 图5是本发明另一实施例提供的一种存储的注册声音数据及验证声音数据及每个验证声音数据对应的属性信息的示意图；
[0040] 图6是本发明另一实施例提供的一种筛选进化声音数据的示意图；
[0041] 图7本发明另一实施例提供的一种根据拼接的注册声音数据和进化声音数据生成进化声纹的过程示意图；
[0042] 图8本发明另一实施例提供的一种服务器的结构示意图；
[0043] 图9本发明另一实施例提供的一种服务器的结构示意图；
[0044] 图10本发明另一实施例提供的一种客户端的结构示意图；
[0045] 图11本发明另一实施例提供的一种客户端的结构示意图；
[0046] 图12本发明另一实施例提供的一种声纹验证系统的结构示意图。

【具体实施方式】
[0047] 为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。
[0048] 如图1所示，其示出了本发明实施例提供的声纹验证方法所涉及的实施环境示意图。如图1所示，该实施环境包括服务器101和客户端102。其中，服务器101和客户端102 通过无线网络或有线网络连接。
[0049] 其中，客户端102能够支持各种不同业务类型，且可以为不同业务类型划分不同等级的声纹验证。当需要对操作客户端102的当前用户进行声纹验证时，本发明实施例提供的方法支持根据操作客户端102的当前用户的验证声纹与操作该客户端102的合法用户的参考声纹来对当前用户进行声纹验证。
[0050] 其中，客户端102可以是任何需要对操作该客户端102的当前用户进行身份验证的客户端，包括但不限于社交应用客户端，财产账户客户端，等等。服务器101为与客户端 102对应的，且能够为客户端102提供对应服务的服务器。具体的声纹验证方法详见下述各个实施例：
[0051] 图2是根据一示例性实施例提供的一种声纹验证方法的流程图。以服务器执行本发明实施例提供的方法的角度为例，参见图2,本发明实施例提供的方法流程包括：
[0052] 201 :接收客户端发送的携带业务类型的业务操作请求。
[0053] 202 :根据业务操作请求向客户端发送携带验证语料的验证指令。
[0054] 203:接收客户端获取到的操作客户端的当前用户根据验证语料输入的验证声音数据，并根据验证声音数据生成验证声纹。
[0055] 204:确定验证声纹与预先存储的参考声纹之间的相似度分值是否达到业务类型对应的预设相似度分值，其中，参考声纹为操作客户端的合法用户的声纹；其中，不同业务类型对应不同预设相似度分值。
[0056] 可选地，确定验证声纹与预先存储的参考声纹之间的相似度分值是否达到业务类型对应的预设相似度分值之前，还包括：
[0057] 获取客户端支持的每个业务类型及预设相似度分值之间的映射关系；
[0058] 根据映射关系确定业务操作请求中携带的业务类型对应的预设相似度分值。
[0059] 可选地，确定验证声纹与预先存储的参考声纹之间的相似度分值是否达到业务类型对应的预设相似度分值之前，还包括：
[0060] 获取参考声纹；
[0061] 计算验证声纹与参考声纹之间的相似度分值。
[0062] 可选地，获取参考声纹之前，还包括：
[0063] 获取合法用户的第一用户信息；
[0064] 获取与第一用户信息相关的注册语料；
[0065] 向客户端发送注册语料；
[0066] 分预设次数获取合法用户根据注册语料输入的注册声音数据，得到预设次数个注册声音数据；
[0067] 确定预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分值；
[0068] 如果预设次数个注册声音数据之间的相似度分值达到声纹注册相似度分值，则根据预设次数个注册声音数据生成注册声纹，将注册声纹作为参考声纹。
[0069] 205 :如果验证声纹与参考声纹之间的相似度分值达到业务类型对应的预设相似度分值，则确定当前用户通过声纹验证。
[0070] 可选地，确定当前用户通过声纹验证之后，还包括：
[0071] 存储验证声音数据以及验证声音数据的属性信息，以将验证声音数据以及验证声音数据的属性信息作为后续进化参考声纹时筛选进化声音数据的参考。
[0072] 可选地，存储验证声音数据以及验证声音数据的属性信息之后，还包括：
[0073] 确定是否需要进化参考声纹；
[0074] 如果确定需要进化参考声纹，则根据多次声纹验证通过后存储的验证声音数据的属性信息筛选预设数值个进化声音数据；
[0075] 根据注册声音数据和进化声音数据生成进化声纹，将进化声纹作为后续声纹验证的参考声纹。
[0076] 可选地,根据业务操作请求向客户端发送携带验证语料的验证指令之前，还包括：
[0077] 根据业务操作请求获取当前用户的第二用户信息，并根据第二用户信息生成电子票据；
[0078] 根据业务操作请求向客户端发送携带验证语料的验证指令，包括：
[0079] 根据业务操作请求向客户端发送携带验证语料及生成的电子票据的验证指令；
[0080] 接收客户端获取到的操作客户端的当前用户根据验证语料输入的验证声音数据，包括：
[0081] 接收客户端提交的电子票据及客户端获取到的操作客户端的当前用户根据验证语料输入的验证声音数据；
[0082] 根据验证声音数据生成验证声纹之前，还包括：
[0083] 判断客户端提交的电子票据与生成的电子票据是否一致；
[0084] 如果客户端提交的电子票据与生成的电子票据一致，则执行根据验证声音数据生成验证声纹的步骤。
[0085] 可选地，接收客户端提交的电子票据及验证声音数据之后，还包括：
[0086] 确定客户端提交的电子票据是否在生成的电子票据的预设有效时间内；
[0087] 如果确定客户端提交的电子票据在生成的电子票据的预设有效时间内，则执行判断客户端提交的电子票据与生成的电子票据是否一致的步骤。
[0088] 可选地，确定客户端提交的电子票据是否在生成的电子票据的预设有效时间内之后，还包括：
[0089] 如果确定客户端提交的电子票据不在生成的电子票据的预设有效时间内，则确定当前用户为非法用户，并终止声纹验证。
[0090] 可选地，判断客户端提交的电子票据与生成的电子票据是否一致之后，还包括：
[0091] 如果客户端提交的电子票据与生成的电子票据不一致，则确定当前用户为非法用户，并终止声纹验证。
[0092] 可选地，确定当前用户通过声纹验证之后，还包括：
[0093] 记录第二用户信息，并获取已经存储的上次声纹验证通过后记录的第三用户信息；
[0094] 确定第二用户信息是否与第三用户信息一致；
[0095] 如果确定第二用户信息与第三用户信息一致，则将当前用户标记为可信用户。
[0096] 可选地，确定当前用户通过声纹验证之后，还包括：
[0097] 确定当前用户在客户端操作业务类型对应的业务的时间是否达到预设时间；
[0098] 如果当前用户在客户端操作业务类型对应的业务的时间达到预设时间，则终止当前用户在客户端操作业务类型对应的业务。
[0099] 可选地，确定验证声纹与预先存储的注册声纹之间的相似度分值是否达到业务类型对应的预设相似度分值之后，还包括：
[0100] 如果验证声纹与参考声纹未达到业务类型对应的预设相似度分值，则确定当前用户非法，并终止声纹验证。
[0101] 本发明实施例提供的方法，通过为不同业务类型设置不同预设相似度分值，并在进行声纹验证时，通过确定验证声纹与参考声纹之间的相似度的分值是否达到业务类型对应的预设相似度分值来进行声纹验证，从而可以针对不同的业务类型确定是否声纹验证成功，声纹验证方法更具灵活性。
[0102] 图3是根据一示例性实施例提供的一种声纹验证方法的流程图。以客户端执行本发明实施例提供的方法的角度为例，参见图3,本发明实施例提供的方法流程包括：
[0103] 301 :向服务器发送携带业务类型的业务操作请求。
[0104] 302 :接收服务器根据业务操作请求发送的携带验证语料的验证指令。
[0105] 303 :获取操作客户端的当前用户根据验证语料输入的验证声音数据，并将验证声音数据提交至服务器，使服务器根据验证声音数据生成验证声纹，并根据验证声纹与预先存储的操作客户端的合法用户的参考声纹对当前用户进行声纹验证。
[0106] 可选地，方法还包括：
[0107] 接收服务器获取到合法用户的第一用户信息后发送的与第一用户信息相关的注册语料；
[0108] 分预设次数获取合法用户根据注册语料输入的注册声音数据，得到预设次数个注册声音数据；
[0109] 将预设次数个注册声音数据提交至服务器，使服务器在确定预设次数个注册声音数据之间的相似度分值达到声纹注册相似度分值后，根据预设次数个注册声音数据生成注册声纹，并将注册声纹作为参考声纹。
[0110] 可选地，接收服务器根据业务操作请求发送的携带验证语料的验证指令之前，还包括：
[0111] 向服务器提交第二用户信息，使服务器根据第二用户信息生成电子票据；
[0112] 接收服务器根据业务操作请求发送的携带验证语料的验证指令，包括：
[0113] 接收服务器发送的携带验证语料及服务器生成的电子票据的验证指令；
[0114] 将验证声音数据提交至服务器，包括：
[0115] 将验证声音数据及服务器生成的电子票据提交至服务器，使服务器判断提交的电子票据与服务器生成的电子票据一致后，根据验证声音数据生成验证声纹。
[0116] 本发明实施例提供的方法，通过服务器为不同业务类型设置不同预设相似度分值，并在进行声纹验证时，在向服务器提交当前用户的验证声音数据后，服务器生成验证声纹，并通过确定验证声纹与参考声纹之间的相似度的分值是否达到业务类型对应的预设相似度分值来进行声纹验证，从而可以针对不同的业务类型确定是否声纹验证成功，声纹验证方法更具灵活性。
[0117] 图4是根据一示例性实施例提供的一种声纹验证方法的流程图。以客户端和服务器进行交互来实现本发明实施例提供的方法为例，参见图4,本发明实施例提供的方法流程包括：
[0118] 401 :客户端向服务器发送携带业务类型的业务操作请求。
[0119] 如果当前用户需要在客户端操作某一业务类型的业务，则需要通过客户端向服务器发送携带业务类型的业务操作请求。关于客户端向服务器发送携带业务类型的业务操作请求的方式，本发明实施例不作具体限定。具体实施时，客户端可以在获取到当前用户的操作指令后，触发向服务器发送携带业务类型的业务操作请求。关于客户端获取到当前用户的操作指令的方式，具体实施时，包括但不限于通过检测操作选项或操作按钮是否被选中来实现。其中，检测操作选项或操作按钮是否被选中的方式可以有很多种，例如，可以通过检测操作选项或操作按钮是否被点击、是否被双击、操作选项或操作按钮的触摸操作是否达到预设时间，等等。
[0120] 关于业务操作类型，本发明实施例不作具体限定。具体实施时，可以结合客户端支持的业务类型而定。例如，业务类型可以为登录业务、支付业务、小区门禁业务，等等。
[0121] 例如，如果业务类型为登录业务，为了触发登录操作，当前用户需要通过对应的客户端向服务器发送携带登录业务的登录操作请求。其中，客户端向服务器发送携带登录业务的登录操作请求可以是在检测到客户端对应的登录选项被选中后触发的。在检测登录选项是否被选中时，包括但不限于通过检测登录选项是否被点击、是否被双击、登录选项上的触摸操作是否达到预设时间，等等。
[0122] 例如，如果业务类型为小区门禁业务，则当前用户在进入小区之前进行身份验证时，可以通过声纹验证实现。为了触发声纹验证过程，当前用户可以通过客户端进入门禁验证页面，从而触发向服务器发送携带小区门禁业务的业务操作请求。关于当前用户进入门禁验证页面的方式，包括但不限于通过客户端与门禁管理系统建立连接来实现。其中，当前用户通过客户端与门禁管理系统建立连接的方式，包括但不限于通过关注门禁管理系统的公众号实现。
[0123] 402 :服务器接收客户端发送的携带业务类型的业务操作请求，并根据业务操作请求向客户端发送携带验证语料的验证指令。
[0124] 关于服务器接收客户端发送的携带业务类型的业务操作请求的方式，本发明实施例不作具体限定。另外，为了触发通过声纹验证对当前用户的身份进行验证，服务器根据业务操作请求向客户端发送携带验证语料的验证指令，使当前用户可以根据验证语料输入声音数据。关于根据业务操作请求向客户端发送携带验证语料的验证指令的方式，本发明实施例不作具体限定。
[0125] 需要说明的是，服务器根据业务操作请求向客户端发送携带验证语料的验证指令之前，需要获取验证语料。关于获取到的验证语料的具体内容，本发明实施例不作具体限定。具体实施时，该验证语料的具体内容与形成参考声纹时使用的语料有关。后续在介绍参考声纹时，再对验证语料进行具体说明，此处先暂不对验证语料的内容进行说明。
[0126] 可选地，由于通常的声纹验证过程是由服务器发起的，然而，也可能存在人为伪造发起声纹验证的情况。为了保证声纹验证过程由服务器发起，避免人为伪造发起声纹验证过程，服务器在发起声纹验证过程时，可以生成一个电子票据，从而在与客户端每次进行交互的过程中，均携带该电子票据，以标识该次声纹验证过程的基本信息，保证声纹验证过程的安全性。为了生成电子票据，服务器在根据业务操作请求向客户端发送携带验证语料的验证指令之前，还需要根据业务操作请求获取当前用户的第二用户信息，并根据第二用户信息生成电子票据。
[0127] 关于第二用户信息的具体内容，具体实施时，为了标识声纹验证过程的基本信息，该第二用户信息至少包括但不限于业务类型、验证时刻、当前用户账号信息及当前用户的终端信息。根据第二用户信息生成电子票据的方式，具体实施时，可以包括但不限于通过建立电子票据标识与第二用户信息的映射关系实现。
[0128] 关于获取第二用户信息的方式，包括但不限于通过接收客户端提交的第二用户信息实现。
[0129] 综上，如果服务器在声纹验证过程中生成了电子票据，则服务器在根据业务操作请求向客户端发送携带验证语料的验证指令时，可以根据业务操作请求向客户端发送携带验证语料及生成的电子票据的验证指令。关于根据业务操作请求向客户端发送携带验证语料及生成的电子票据的验证指令的方式，本发明实施例不作具体限定。
[0130] 403 :客户端接收服务器根据业务操作请求发送的携带验证语料的验证指令，并获取操作客户端的当前用户根据验证语料输入的验证声音数据，将验证声音数据提交至服务器。
[0131] 关于客户端接收服务器根据业务操作请求发送的携带验证语料的验证指令的方式，本发明实施例不作具体限定。通常，服务器在生成用户的声纹时，需要根据用户的声音数据生成，因此，客户端获取操作客户端的当前用户根据验证语料输入的验证声音数据，并将验证声音数据提交至服务器。
[0132] 其中，本发明实施例不对客户端获取操作客户端的当前用户根据验证语料输入的验证声音数据的方式进行限定。具体实施时，在当前用户根据验证语料输入验证声音数据时，客户端通过录制当前用户输入的声音数据来实现。具体地，在录制验证声音数据时，可以先获取麦克风或话筒的启动指令，并根据麦克风或话筒的启动指令录制当前用户根据验证语料输入的声音数据。其中，获取麦克风或话筒的启动指令的方式可以有很多种，具体实施时，包括但不限于通过检测麦克风或话筒被长按来实现。
[0133] 可选地，客户端通过接收服务器根据业务操作请求发送的携带验证语料的验证指令后，可以显示验证指令中携带的验证语料，使得当前用户在输入验证声音数据时，可以根据显示的验证语料朗读验证语料，保证用户不会因忘记验证语料的内容而使得输入的验证声音数据不满足验证声音数据的条件，从而给用户带来良好操作体验的同时，能够提高获取当前用户的验证声音数据的效率，从而可以提高声纹验证的效率。
[0134] 关于将验证声音数据提交至服务器的方式，可以有很多种。例如，客户端在录制当前用户的验证声音数据时，可以在录制验证声音数据的页面提供提交选项，并通过检测该提交选项是否被选中来确定是否将验证声音数据提交至服务器。当客户端检测到提交选项被选中后，触发将验证声音数据提交至服务器。
[0135] 另外，客户端在向服务器提交验证声音数据时，由于声音数据通常比较大，因此，客户端可以将验证声音数据切分为若干份，并分别提交切分后的声音数据，直至将验证声音数据提交完毕。其中，在切分验证声音数据时，可以将验证声音数据切分为相等大小的声音数据，也可以切分为不等大小的声音数据。本发明实施例不对切分后的声音数据的具体大小进行限定。
[0136] 例如，可以将验证声音数据切分为相等大小的三等份，得到验证声音数据1、验证声音数据2和验证声音数据3,因此，客户端在向服务器提交验证声音数据时，将分别提交验证声音数据1、验证声音数据2和验证声音数据3。
[0137] 可选地，如果服务器向客户端发送携带验证语料的验证指令时，还发送了电子票据，则为了使服务器能够获得第二用户信息，客户端可以向服务器提交第二用户信息。关于客户端向服务器提交第二用户信息的方式，本发明实施例不作具体限定。另外，当生成电子票据后，服务器与客户端在每次进行交互时，均需要携带该电子票据。因此，客户端在接收服务器发送的携带验证语料的验证指令时，还接收了验证指令中携带的服务器生成的电子票据。此时，客户端在将验证声音数据提交至服务器时同时还将服务器生成的电子票据提交至服务器。
[0138] 404:服务器接收客户端获取到的操作客户端的当前用户根据验证语料输入的验证声音数据，并根据验证声音数据生成验证声纹。
[0139] 为了获得当前用户的声纹，服务器接收客户端获取到的操作客户端的当前用户根据验证语料输入的验证声音数据,并根据验证声音数据生成验证声纹。其中,本发明实施例不对服务器接收客户端获取到的操作客户端的当前用户根据验证语料输入的验证声音数据的方式进行限定。另外，关于服务器根据验证声音数据生成验证声纹的方式，可以采用声纹生成算法实现。关于服务器根据声纹生成算法将验证声音数据生成验证声纹的方式，本发明实施例不作具体限定。具体实施时，可以通过提取验证声音数据中的典型特征来实现。具体地，由于声音的波长、频率、强度、节奏等特征能体现用户声音的特点，因此，在根据验证声音数据生成验证声纹时，可以提取验证声音数据中波长、频率、强度、节奏等特征，并确定验证声音数据中波长、频率、强度、节奏等特征的特征值，将验证声音数据中波长、频率、强度、节奏等特征的特征值等作为验证声纹。
[0140] 另外，如果客户端在提交验证声音数据时，将验证声音数据切分为若干个声音数据，则服务器在生成验证声纹时，需要先拼接组成验证声音数据的每个声音数据，并将拼接后的组成验证声音数据的每个声音数据生成验证声纹。
[0141] 可选地，如果客户端提交验证声音数据时，还提交了服务器生成的电子票据，则为了保证声纹验证过程的安全性，服务器根据验证声音数据生成验证声纹之前，还需要判断客户端提交的电子票据与服务器生成的电子票据是否一致；如果客户端提交的电子票据与服务器生成的电子票据一致，则执行根据验证声音数据生成验证声纹的步骤。如果服务器确定客户端提交的电子票据与服务器生成的电子票据不一致，则确定当前用户为非法用户，并终止声纹验证，从而禁止当前用户在该客户端操作业务操作请求中携带的业务类型对应的业务。
[0142] 关于服务器判断客户端提交的电子票据与服务器生成的电子票据是否一致的方式，包括但不限于判断客户端提交的电子票据相对于服务器生成的电子票据是否有改变；如果服务器判断客户端提交的电子票据相对于服务器生成的电子票据未发生改变，则确定客户端提交的电子票据与服务器生成的电子票据一致。
[0143] 关于终止声纹验证的方法，可以有很多种。具体实施时，包括但不限于通过强制跳出客户端所在的业务类型对应的页面或者发送提示消息以提示当前用户操作失败，等等。例如，如果该次声纹验证用于对当前用户的登录业务进行验证，则可以禁止当前用户登录该客户端。
[0144] 然而，为了进一步确定当前用户是否为合法用户，还可以继续对当前用户的身份进行验证。因此，服务器也可以采用其它方式对当前用户进行身份验证。其中，服务器在采用其它方式对当前用户进行身份验证时，可以通过弹出其它方式的验证界面，并获取当前用户在该验证界面输入的信息来对当前用户进行身份验证。关于根据操作当前用户在该验证界面输入的信息来对当前用户进行身份验证的具体实现过程，本发明实施例不作具体限定。
[0145] 可选地，为了保证声纹验证过程在一定的时间范围内有效，服务器还可以设置生成的电子票据的有效时间，从而将在生成的电子票据的有效时间内的完成的声纹验证确定为合法，而如果声纹验证过程超过生成的电子票据的有效时间，则将该声纹验证过程确定为非法。因此，服务器在接收客户端提交的电子票据及验证声音数据之后，还需要确定客户端提交的电子票据是否在生成的电子票据的预设有效时间内；如果确定客户端提交的电子票据在生成的电子票据的预设有效时间内，则执行判断客户端提交的电子票据与生成的电子票据是否一致的步骤。如果确定客户端提交的电子票据不在生成的电子票据的预设有效时间内，则确定当前用户为非法用户，并终止声纹验证。
[0146] 关于确定预设有效时间的方式，本发明实施例不作具体限定。具体实施时，可以根据经验统计完成声纹验证的基本时间，并将该基本时间作为预设有效时间。当然，还可以采用其它方式确定预设有效时间。其中，本发明实施例不对预设有效时间的具体大小进行限定。
[0147] 关于终止声纹验证的方式，可以有很多种，具体实施时，与上述如果服务器确定客户端提交的电子票据与服务器生成的电子票据不一致时终止声纹验证的原理一致，具体可参见上述内容，在此不再赘述。
[0148] 405:服务器确定验证声纹与预先存储的参考声纹之间的相似度分值是否达到业务类型对应的预设相似度分值，其中，参考声纹为操作客户端的合法用户的声纹，且不同业务类型对应不同预设相似度分值。
[0149] 为了确定当前用户能否在客户端操作业务类型对应的业务，服务器需要确定验证声纹与预先存储的操作客户端的合法用户的参考声纹之间的相似度分值是否达到业务类型对应的预设相似度分值。
[0150] 其中，在确定验证声纹与预先存储的参考声纹之间的相似度分值是否达到业务类型对应的预设相似度分值之前，需要先确定业务操作请求中携带的业务类型对应的预设相似度分值。关于确定业务操作请求中携带的业务类型对应的预设相似度分值的方式，包括但不限于：获取客户端支持的每个业务类型及预设相似度分值之间的映射关系，并根据该映射关系确定业务操作请求中携带的业务类型对应的预设相似度分值。
[0151] 关于获取客户端支持的每个业务类型及预设相似度分值之间的映射关系的方式，本发明实施例不作具体限定。具体实施时，可以从本地获取，也可以从其它节点获取。关于根据映射关系确定业务操作请求中携带的业务类型对应的预设相似度分值的方式，包括但不限于将业务操作请求中携带的业务类型与映射关系中的每个业务类型一一比对，并将映射关系中与业务操作请求中携带的业务类型一致的业务类型对应的预设相似度分值作为业务操作请求中携带的业务类型对应的预设相似度分值。
[0152] 如表一所示，其示出了一种获取客户端支持的所有业务类型及预先设定的每个业务类型对应的预设相似度分值的映射关系的表格示意图。
[0153] 表一
[0154]

【权利要求】
1. 一种声纹验证方法，其特征在于，所述方法包括：接收客户端发送的携带业务类型的业务操作请求；根据所述业务操作请求向所述客户端发送携带验证语料的验证指令；接收所述客户端获取到的操作所述客户端的当前用户根据所述验证语料输入的验证声音数据，并根据所述验证声音数据生成验证声纹；确定所述验证声纹与预先存储的参考声纹之间的相似度分值是否达到所述业务类型对应的预设相似度分值，所述参考声纹为操作所述客户端的合法用户的声纹；其中，不同业务类型对应不同预设相似度分值；如果所述验证声纹与所述参考声纹之间的相似度分值达到所述业务类型对应的预设相似度分值，则确定所述当前用户通过声纹验证。
2. 根据权利要求1所述的方法，其特征在于，所述确定所述验证声纹与预先存储的参考声纹之间的相似度分值是否达到所述业务类型对应的预设相似度分值之前，还包括：获取所述客户端支持的每个业务类型及预设相似度分值之间的映射关系；根据所述映射关系确定所述业务操作请求中携带的业务类型对应的预设相似度分值。
3. 根据权利要求1所述的方法，其特征在于，所述确定所述验证声纹与预先存储的参考声纹之间的相似度分值是否达到所述业务类型对应的预设相似度分值之前，还包括：获取所述参考声纹；计算所述验证声纹与所述参考声纹之间的相似度分值。
4. 根据权利要求3所述的方法，其特征在于，所述获取所述参考声纹之前，还包括：获取所述合法用户的第一用户信息；获取与所述第一用户信息相关的注册语料；向所述客户端发送所述注册语料；分预设次数获取所述合法用户根据所述注册语料输入的注册声音数据，得到预设次数个注册声音数据；确定所述预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分值；如果所述预设次数个注册声音数据之间的相似度分值达到所述声纹注册相似度分值，则根据所述预设次数个注册声音数据生成注册声纹，将所述注册声纹作为所述参考声纹。
5. 根据权利要求1所述的方法，其特征在于，所述确定所述当前用户通过声纹验证之后，还包括：存储所述验证声音数据以及所述验证声音数据的属性信息，以将所述验证声音数据以及所述验证声音数据的属性信息作为后续进化所述参考声纹时筛选进化声音数据的参考。
6. 根据权利要求5所述的方法，其特征在于，所述存储所述验证声音数据以及所述验证声音数据的属性信息之后，还包括：确定是否需要进化所述参考声纹；如果确定需要进化所述参考声纹，则根据多次声纹验证通过后存储的验证声音数据的属性信息筛选预设数值个进化声音数据；根据注册声音数据和所述进化声音数据生成进化声纹，将所述进化声纹作为后续声纹验证的参考声纹。
7. 根据权利要求1所述的方法，其特征在于，所述根据所述业务操作请求向所述客户端发送携带验证语料的验证指令之前，还包括：根据所述业务操作请求获取所述当前用户的第二用户信息，并根据所述第二用户信息生成电子票据；所述根据所述业务操作请求向所述客户端发送携带验证语料的验证指令，包括：根据所述业务操作请求向所述客户端发送携带验证语料及生成的电子票据的验证指令；所述接收所述客户端获取到的操作所述客户端的当前用户根据所述验证语料输入的验证声音数据，包括：接收所述客户端提交的电子票据及所述客户端获取到的操作所述客户端的当前用户根据所述验证语料输入的验证声音数据；所述根据所述验证声音数据生成验证声纹之前，还包括：判断所述客户端提交的电子票据与所述生成的电子票据是否一致；如果所述客户端提交的电子票据与所述生成的电子票据一致，则执行根据所述验证声音数据生成验证声纹的步骤。
8. 根据权利要求7所述的方法，其特征在于，所述接收所述客户端提交的电子票据及验证声音数据之后，还包括：确定所述客户端提交的电子票据是否在所述生成的电子票据的预设有效时间内；如果确定所述客户端提交的电子票据在所述生成的电子票据的预设有效时间内，则执行判断所述客户端提交的电子票据与生成的电子票据是否一致的步骤。
9. 根据权利要求8所述的方法，其特征在于，所述确定所述客户端提交的电子票据是否在所述生成的电子票据的预设有效时间内之后，还包括：如果确定所述客户端提交的电子票据不在所述生成的电子票据的预设有效时间内，则确定所述当前用户为非法用户，并终止声纹验证。
10. 根据权利要求7所述的方法，其特征在于，所述判断所述客户端提交的电子票据与所述生成的电子票据是否一致之后，还包括：如果所述客户端提交的电子票据与所述生成的电子票据不一致，则确定所述当前用户为非法用户，并终止声纹验证。
11. 根据权利要求7所述的方法，其特征在于，所述确定所述当前用户通过声纹验证之后，还包括：记录所述第二用户信息，并获取已经存储的上次声纹验证通过后记录的第三用户信息；确定所述第二用户信息是否与所述第三用户信息一致；如果确定所述第二用户信息与所述第三用户信息一致，则将所述当前用户标记为可信用户。
12. 根据权利要求7所述的方法，其特征在于，所述确定所述当前用户通过声纹验证之后，还包括：确定所述当前用户在所述客户端操作所述业务类型对应的业务的时间是否达到预设时间；如果所述当前用户在所述客户端操作所述业务类型对应的业务的时间达到预设时间，则终止所述当前用户在所述客户端操作所述业务类型对应的业务。
13. 根据权利要求1所述的方法，其特征在于，所述确定所述验证声纹与预先存储的注册声纹之间的相似度分值是否达到所述业务类型对应的预设相似度分值之后，还包括：如果所述验证声纹与所述参考声纹未达到所述业务类型对应的预设相似度分值，则确定所述当前用户非法，并终止声纹验证。
14. 一种声纹验证方法，其特征在于，所述方法包括：向服务器发送携带业务类型的业务操作请求；接收所述服务器根据所述业务操作请求发送的携带验证语料的验证指令；获取操作客户端的当前用户根据所述验证语料输入的验证声音数据；将所述验证声音数据提交至所述服务器，使所述服务器根据所述验证声音数据生成验证声纹，并根据所述验证声纹与预先存储的操作所述客户端的合法用户的参考声纹对所述当前用户进行声纹验证。
15. 根据权利要求14所述的方法，其特征在于，所述方法还包括：接收所述服务器获取到所述合法用户的第一用户信息后发送的与所述第一用户信息相关的注册语料；分预设次数获取所述合法用户根据所述注册语料输入的注册声音数据，得到预设次数个注册声音数据；将所述预设次数个注册声音数据提交至所述服务器，使所述服务器在确定所述预设次数个注册声音数据之间的相似度分值达到声纹注册相似度分值后，根据所述预设次数个注册声音数据生成注册声纹，并将所述注册声纹作为所述参考声纹。
16. 根据权利要求14所述的方法，其特征在于，所述接收所述服务器根据所述业务操作请求发送的携带验证语料的验证指令之前，还包括：向所述服务器提交第二用户信息，使所述服务器根据所述第二用户信息生成电子票据；所述接收所述服务器根据所述业务操作请求发送的携带验证语料的验证指令，包括：接收所述服务器发送的携带验证语料及所述服务器生成的电子票据的验证指令；所述将所述验证声音数据提交至所述服务器，包括：将所述验证声音数据及所述服务器生成的电子票据提交至所述服务器，使所述服务器判断提交的电子票据与所述服务器生成的电子票据一致后，根据所述验证声音数据生成验证声纹。
17. -种声纹验证服务器，其特征在于，所述服务器包括：第一接收模块，用于接收客户端发送的携带业务类型的业务操作请求；第一发送模块，用于根据所述业务操作请求向所述客户端发送携带验证语料的验证指令；第二接收模块，用于接收所述客户端获取到的操作所述客户端的当前用户根据所述验证语料输入的验证声音数据；第一生成模块，用于根据所述验证声音数据生成验证声纹；第一确定模块，用于确定所述验证声纹与预先存储的参考声纹之间的相似度分值是否达到所述业务类型对应的预设相似度分值，所述参考声纹为操作所述客户端的合法用户的声纹；其中，不同业务类型对应不同预设相似度分值；第二确定模块，用于当所述验证声纹与所述参考声纹之间的相似度分值达到所述业务类型对应的预设相似度分值时，确定所述当前用户通过声纹验证。
18. 根据权利要求17所述的服务器，其特征在于，所述服务器，还包括：第一获取模块，用于获取所述客户端支持的每个业务类型及预设相似度分值之间的映身寸关系；第三确定模块，用于根据所述映射关系确定所述业务操作请求中携带的业务类型对应的预设相似度分值。
19. 根据权利要求17所述的服务器，其特征在于，所述服务器，还包括：第二获取模块，用于获取所述参考声纹；计算模块，用于计算所述验证声纹与所述参考声纹之间的相似度分值。
20. 根据权利要求19所述的服务器，其特征在于，所述服务器，还包括：第三获取模块，用于获取所述合法用户的第一用户信息；第四获取模块，用于获取与所述第一用户信息相关的注册语料；第二发送模块，用于向所述客户端发送所述注册语料；第五获取模块，用于分预设次数获取所述合法用户根据所述注册语料输入的注册声音数据，得到预设次数个注册声音数据；第四确定模块，用于确定所述预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分值；第二生成模块，用于当所述预设次数个注册声音数据之间的相似度分值达到所述声纹注册相似度分值时，根据所述预设次数个注册声音数据生成注册声纹，将所述注册声纹作为所述参考声纹。
21. 根据权利要求17所述的服务器，其特征在于，所述服务器，还包括：存储模块，用于存储所述验证声音数据以及所述验证声音数据的属性信息，以将所述验证声音数据以及所述验证声音数据的属性信息作为后续进化所述参考声纹时筛选进化声音数据的参考。
22. 根据权利要求21所述的服务器，其特征在于，所述服务器，还包括：第五确定模块，用于确定是否需要进化所述参考声纹；筛选模块，用于当确定需要进化所述参考声纹时，根据多次声纹验证通过后存储的验证声音数据的属性信息筛选预设数值个进化声音数据；第三生成模块，用于根据注册声音数据和所述进化声音数据生成进化注册声纹，将所述进化注册声纹作为后续声纹验证的参考声纹。
23. 根据权利要求17所述的服务器，其特征在于，所述服务器，还包括：第六获取模块，用于根据所述业务操作请求获取所述当前用户的第二用户信息；第四生成模块，用于根据所述第二用户信息生成电子票据；所述第一发送模块，用于根据所述业务操作请求向所述客户端发送携带验证语料及生成的电子票据的验证指令；所述第二接收模块，用于接收所述客户端提交的电子票据及所述客户端获取到的操作所述客户端的当前用户根据所述验证语料输入的验证声音数据；所述服务器，还包括：判断模块，用于判断所述客户端提交的电子票据与所述生成的电子票据是否一致；所述第一生成模块，用于当所述客户端提交的电子票据与所述生成的电子票据一致时，根据所述验证声音数据生成验证声纹。
24. 根据权利要求23所述的服务器，其特征在于，所述服务器，还包括：第六确定模块，用于确定所述客户端提交的电子票据是否在所述生成的电子票据的预设有效时间内；所述判断模块，用于当确定所述客户端提交的电子票据在所述生成的电子票据的预设有效时间内时，断所述客户端提交的电子票据与生成的电子票据是否一致。
25. 根据权利要求24所述的服务器，其特征在于，所述服务器，还包括：第七确定模块，用于当确定所述客户端提交的电子票据不在所述生成的电子票据的预设有效时间内时，确定所述当前用户为非法用户；第一终止模块，用于终止声纹验证。
26. 根据权利要求23所述的服务器，其特征在于，所述服务器，还包括：第八确定模块，用于当所述客户端提交的电子票据与所述生成的电子票据不一致时，确定所述当前用户为非法用户；第二终止模块，用于终止声纹验证。
27. 根据权利要求23所述的服务器，其特征在于，所述服务器，还包括：记录模块，用于记录所述第二用户信息；第七获取模块，用于获取已经存储的上次声纹验证通过后记录的第三用户信息；第九确定模块，用于确定所述第二用户信息是否与所述第三用户信息一致；标记模块，用于当确定所述第二用户信息与所述第三用户信息一致时，将所述当前用户标记为可信用户。
28. 根据权利要求23所述的服务器，其特征在于，所述服务器，还包括：第十确定模块，用于确定所述当前用户在所述客户端操作所述业务类型对应的业务的时间是否达到预设时间；第三终止模块，用于当所述当前用户在所述客户端操作所述业务类型对应的业务的时间达到预设时间时，终止所述当前用户在所述客户端操作所述业务类型对应的业务。
29. 根据权利要求17所述的服务器，其特征在于，所述服务器，还包括：第十一确定模块，用于当所述验证声纹与所述参考声纹未达到所述业务类型对应的预设相似度分值时，确定所述当前用户非法；第四终止模块，用于终止声纹验证。
30. -种声纹验证客户端，其特征在于，所述客户端包括：发送模块，用于向服务器发送携带业务类型的业务操作请求；第一接收模块，用于接收所述服务器根据所述业务操作请求发送的携带验证语料的验证指令；第一获取模块，用于获取操作客户端的当前用户根据所述验证语料输入的验证声音数据；第一提交模块，用于将所述验证声音数据提交至所述服务器，使所述服务器根据所述验证声音数据生成验证声纹，并根据所述验证声纹与预先存储的操作所述客户端的合法用户的参考声纹对所述当前用户进行声纹验证。
31. 根据权利要求30所述的客户端，其特征在于，所述客户端还包括：第二接收模块，用于接收所述服务器获取到所述合法用户的第一用户信息后发送的与所述第一用户信息相关的注册语料；第二获取模块，用于分预设次数获取所述合法用户根据所述注册语料输入的注册声音数据，得到预设次数个注册声音数据；第二提交模块，用于将所述预设次数个注册声音数据提交至所述服务器，使所述服务器在确定所述预设次数个注册声音数据之间的相似度分值达到声纹注册相似度分值后，根据所述预设次数个注册声音数据生成注册声纹，并将所述注册声纹作为所述参考声纹。
32. 根据权利要求30所述的客户端，其特征在于，所述客户端，还包括：第三提交模块，用于向所述服务器提交第二用户信息，使所述服务器根据所述第二用户信息生成电子票据；所述第一接收模块，用于接收所述服务器发送的携带验证语料及所述服务器生成的电子票据的验证指令；所述第一提交模块，用于将所述验证声音数据及所述服务器生成的电子票据提交至所述服务器，使所述服务器判断提交的电子票据与所述服务器生成的电子票据一致后，根据所述验证声音数据生成验证声纹。
33. -种声纹验证系统，其特征在于，所述系统包括服务器和客户端；其中，所述服务器如上述权利要求17至29中任一权利要求所述的服务器；所述客户端如上述权利要求30至32中任一权利要求所述的客户端。
【文档编号】G10L17/00GK104219050SQ201410388869
【公开日】2014年12月17日申请日期:2014年8月8日优先权日:2014年8月8日
【发明者】龙强, 张翔申请人:腾讯科技（深圳）有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：龙强;张翔;
技术所有人：腾讯科技（深圳）有限公司;
我是此专利的发明人

上一篇：一种说话人识别方法和装置制造方法
上一篇：一种五指组合控制的新型电子乐器的制造方法