声纹验证方法、服务器、客户端及系统的制作方法

文档序号:2827700阅读:320来源:国知局
声纹验证方法、服务器、客户端及系统的制作方法
【专利摘要】本发明公开了一种声纹验证方法、服务器、客户端及系统,属于计算机【技术领域】。该方法包括:接收客户端发送的携带业务类型的业务操作请求;向客户端发送携带验证语料的验证指令;接收客户端获取到的当前用户根据验证语料输入的验证声音数据,并生成验证声纹;确定验证声纹与合法用户的参考声纹之间的相似度分值是否达到业务类型对应的预设相似度分值;其中,不同业务类型对应不同预设相似度分值;如果是,则确定当前用户通过声纹验证。本发明通过为不同业务类型设置不同预设相似度分值,并在进行声纹验证时,通过确定验证声纹与参考声纹之间的相似度的分值是否达到业务类型对应的预设相似度分值来进行声纹验证,声纹验证方法更具灵活性。
【专利说明】声纹验证方法、服务器、客户端及系统

【技术领域】
[0001] 本发明涉及计算机【技术领域】,特别涉及一种声纹验证方法、服务器、客户端及系 统。

【背景技术】
[0002] 为了保障用户信息或用户财产的安全,很多应用场景均需要对用户进行身份验 证。例如,各种社交应用软件的客户端、银行应用软件的客户端在操作时均需要对操作客户 端的用户进行身份验证,等等。由于不同用户的声音往往具有不同的特征,因此,在进行身 份验证时,可以根据不同用户的声音数据生成声纹,从而通过声纹实现对用户进行身份验 证。
[0003] 通常,针对于支持声纹验证的所有业务类型,在进行声纹验证时,均分为声纹注册 和声纹验证两个过程。其中,在声纹注册时,客户端录制合法用户的一段声音数据,将该声 音数据上传至服务器,服务器将该声音数据生成注册声纹。在声纹验证时,客户端录制当前 用户的一段声音数据,将该声音数据上传至服务器后,服务器将该声音数据生成验证声纹, 并将该验证声纹与注册声纹进行匹配来确定当前用户是否为合法用户。如果验证声纹与注 册声纹匹配,则声纹验证通过;否则,声纹验证未通过。
[0004] 在实现本发明的过程中,发明人发现相关技术至少存在以下问题:
[0005] 由于相关技术在进行声纹验证时,基本的验证过程为将验证声纹与注册声纹进行 匹配来实现,当验证声纹与注册声纹匹配时,则声纹验证通过。然而,针对于不同的业务类 型,其涉及的用户信息或用户财产的安全系数并不相同,如果采用上述相关技术的方法进 行声纹验证,则对不同业务类型进行声纹验证的方式相同,导致声纹验证的灵活性不高。


【发明内容】

[0006] 为了解决相关技术的问题,本发明实施例提供了一种声纹验证方法、服务器、客户 端及系统。所述技术方案如下:
[0007] 第一方面,提供了一种声纹验证方法,所述方法包括:
[0008] 接收客户端发送的携带业务类型的业务操作请求;
[0009] 根据所述业务操作请求向所述客户端发送携带验证语料的验证指令;
[0010] 接收所述客户端获取到的操作所述客户端的当前用户根据所述验证语料输入的 验证声音数据,并根据所述验证声音数据生成验证声纹;
[0011] 确定所述验证声纹与预先存储的参考声纹之间的相似度分值是否达到所述业务 类型对应的预设相似度分值,所述参考声纹为操作所述客户端的合法用户的声纹;其中,不 同业务类型对应不同预设相似度分值;
[0012] 如果所述验证声纹与所述参考声纹之间的相似度分值达到所述业务类型对应的 预设相似度分值,则确定所述当前用户通过声纹验证。
[0013] 第二方面,提供了一种声纹验证方法,所述方法包括:
[0014] 向服务器发送携带业务类型的业务操作请求;
[0015] 接收所述服务器根据所述业务操作请求发送的携带验证语料的验证指令;
[0016] 获取操作客户端的当前用户根据所述验证语料输入的验证声音数据,并将所述验 证声音数据提交至所述服务器,使所述服务器根据所述验证声音数据生成验证声纹,并根 据所述验证声纹与预先存储的操作所述客户端的合法用户的参考声纹对所述当前用户进 行声纹验证。
[0017] 第三方面,提供了一种声纹验证服务器,所述服务器包括:
[0018] 第一接收模块,用于接收客户端发送的携带业务类型的业务操作请求;
[0019] 第一发送模块,用于根据所述业务操作请求向所述客户端发送携带验证语料的验 证指令;
[0020] 第二接收模块,用于接收所述客户端获取到的操作所述客户端的当前用户根据所 述验证语料输入的验证声音数据;
[0021] 第一生成模块,用于根据所述验证声音数据生成验证声纹;
[0022] 第一确定模块,用于确定所述验证声纹与预先存储的参考声纹之间的相似度分值 是否达到所述业务类型对应的预设相似度分值,所述参考声纹为操作所述客户端的合法用 户的声纹;其中,不同业务类型对应不同预设相似度分值;
[0023] 第二确定模块,用于当所述验证声纹与所述参考声纹之间的相似度分值达到所述 业务类型对应的预设相似度分值时,确定所述当前用户通过声纹验证。
[0024] 第四方面,提供了一种声纹验证客户端,所述客户端包括:
[0025] 发送模块,用于向服务器发送携带业务类型的业务操作请求;
[0026] 第一接收模块,用于接收所述服务器根据所述业务操作请求发送的携带验证语料 的验证指令;
[0027] 第一获取模块,用于获取操作客户端的当前用户根据所述验证语料输入的验证声 音数据;
[0028] 第一提交模块,用于将所述验证声音数据提交至所述服务器,使所述服务器根据 所述验证声音数据生成验证声纹,并根据所述验证声纹与预先存储的操作所述客户端的合 法用户的参考声纹对所述当前用户进行声纹验证。
[0029] 第五方面,提供了一种声纹验证系统,所述系统包括服务器和客户端;
[0030] 其中,所述服务器如上述第三方面所述的服务器;
[0031] 所述客户端如上述第四方面所述的客户端。
[0032] 本发明实施例提供的技术方案带来的有益效果是:
[0033] 通过为不同业务类型设置不同预设相似度分值,并在进行声纹验证时,通过确定 验证声纹与参考声纹之间的相似度的分值是否达到业务类型对应的预设相似度分值来进 行声纹验证,从而可以针对不同的业务类型确定是否声纹验证成功,声纹验证方法更具灵 活性。

【专利附图】

【附图说明】
[0034] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 的附图。
[0035] 图1是本发明一实施例提供的一种声纹验证方法所涉及的实施环境示意图;
[0036] 图2是本发明另一实施例提供的一种声纹验证方法的流程图;
[0037] 图3是本发明另一实施例提供的一种声纹验证方法的流程图;
[0038] 图4是本发明另一实施例提供的一种声纹验证方法的流程图;
[0039] 图5是本发明另一实施例提供的一种存储的注册声音数据及验证声音数据及每 个验证声音数据对应的属性信息的示意图;
[0040] 图6是本发明另一实施例提供的一种筛选进化声音数据的示意图;
[0041] 图7本发明另一实施例提供的一种根据拼接的注册声音数据和进化声音数据生 成进化声纹的过程示意图;
[0042] 图8本发明另一实施例提供的一种服务器的结构示意图;
[0043] 图9本发明另一实施例提供的一种服务器的结构示意图;
[0044] 图10本发明另一实施例提供的一种客户端的结构示意图;
[0045] 图11本发明另一实施例提供的一种客户端的结构示意图;
[0046] 图12本发明另一实施例提供的一种声纹验证系统的结构示意图。

【具体实施方式】
[0047] 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方 式作进一步地详细描述。
[0048] 如图1所示,其示出了本发明实施例提供的声纹验证方法所涉及的实施环境示意 图。如图1所示,该实施环境包括服务器101和客户端102。其中,服务器101和客户端102 通过无线网络或有线网络连接。
[0049] 其中,客户端102能够支持各种不同业务类型,且可以为不同业务类型划分不同 等级的声纹验证。当需要对操作客户端102的当前用户进行声纹验证时,本发明实施例提 供的方法支持根据操作客户端102的当前用户的验证声纹与操作该客户端102的合法用户 的参考声纹来对当前用户进行声纹验证。
[0050] 其中,客户端102可以是任何需要对操作该客户端102的当前用户进行身份验证 的客户端,包括但不限于社交应用客户端,财产账户客户端,等等。服务器101为与客户端 102对应的,且能够为客户端102提供对应服务的服务器。具体的声纹验证方法详见下述各 个实施例:
[0051] 图2是根据一示例性实施例提供的一种声纹验证方法的流程图。以服务器执行本 发明实施例提供的方法的角度为例,参见图2,本发明实施例提供的方法流程包括:
[0052] 201 :接收客户端发送的携带业务类型的业务操作请求。
[0053] 202 :根据业务操作请求向客户端发送携带验证语料的验证指令。
[0054] 203:接收客户端获取到的操作客户端的当前用户根据验证语料输入的验证声音 数据,并根据验证声音数据生成验证声纹。
[0055] 204:确定验证声纹与预先存储的参考声纹之间的相似度分值是否达到业务类型 对应的预设相似度分值,其中,参考声纹为操作客户端的合法用户的声纹;其中,不同业务 类型对应不同预设相似度分值。
[0056] 可选地,确定验证声纹与预先存储的参考声纹之间的相似度分值是否达到业务类 型对应的预设相似度分值之前,还包括:
[0057] 获取客户端支持的每个业务类型及预设相似度分值之间的映射关系;
[0058] 根据映射关系确定业务操作请求中携带的业务类型对应的预设相似度分值。
[0059] 可选地,确定验证声纹与预先存储的参考声纹之间的相似度分值是否达到业务类 型对应的预设相似度分值之前,还包括:
[0060] 获取参考声纹;
[0061] 计算验证声纹与参考声纹之间的相似度分值。
[0062] 可选地,获取参考声纹之前,还包括:
[0063] 获取合法用户的第一用户信息;
[0064] 获取与第一用户信息相关的注册语料;
[0065] 向客户端发送注册语料;
[0066] 分预设次数获取合法用户根据注册语料输入的注册声音数据,得到预设次数个注 册声音数据;
[0067] 确定预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分 值;
[0068] 如果预设次数个注册声音数据之间的相似度分值达到声纹注册相似度分值,则根 据预设次数个注册声音数据生成注册声纹,将注册声纹作为参考声纹。
[0069] 205 :如果验证声纹与参考声纹之间的相似度分值达到业务类型对应的预设相似 度分值,则确定当前用户通过声纹验证。
[0070] 可选地,确定当前用户通过声纹验证之后,还包括:
[0071] 存储验证声音数据以及验证声音数据的属性信息,以将验证声音数据以及验证声 音数据的属性信息作为后续进化参考声纹时筛选进化声音数据的参考。
[0072] 可选地,存储验证声音数据以及验证声音数据的属性信息之后,还包括:
[0073] 确定是否需要进化参考声纹;
[0074] 如果确定需要进化参考声纹,则根据多次声纹验证通过后存储的验证声音数据的 属性信息筛选预设数值个进化声音数据;
[0075] 根据注册声音数据和进化声音数据生成进化声纹,将进化声纹作为后续声纹验证 的参考声纹。
[0076] 可选地,根据业务操作请求向客户端发送携带验证语料的验证指令之前,还包 括:
[0077] 根据业务操作请求获取当前用户的第二用户信息,并根据第二用户信息生成电子 票据;
[0078] 根据业务操作请求向客户端发送携带验证语料的验证指令,包括:
[0079] 根据业务操作请求向客户端发送携带验证语料及生成的电子票据的验证指令;
[0080] 接收客户端获取到的操作客户端的当前用户根据验证语料输入的验证声音数据, 包括:
[0081] 接收客户端提交的电子票据及客户端获取到的操作客户端的当前用户根据验证 语料输入的验证声音数据;
[0082] 根据验证声音数据生成验证声纹之前,还包括:
[0083] 判断客户端提交的电子票据与生成的电子票据是否一致;
[0084] 如果客户端提交的电子票据与生成的电子票据一致,则执行根据验证声音数据生 成验证声纹的步骤。
[0085] 可选地,接收客户端提交的电子票据及验证声音数据之后,还包括:
[0086] 确定客户端提交的电子票据是否在生成的电子票据的预设有效时间内;
[0087] 如果确定客户端提交的电子票据在生成的电子票据的预设有效时间内,则执行判 断客户端提交的电子票据与生成的电子票据是否一致的步骤。
[0088] 可选地,确定客户端提交的电子票据是否在生成的电子票据的预设有效时间内之 后,还包括:
[0089] 如果确定客户端提交的电子票据不在生成的电子票据的预设有效时间内,则确定 当前用户为非法用户,并终止声纹验证。
[0090] 可选地,判断客户端提交的电子票据与生成的电子票据是否一致之后,还包括:
[0091] 如果客户端提交的电子票据与生成的电子票据不一致,则确定当前用户为非法用 户,并终止声纹验证。
[0092] 可选地,确定当前用户通过声纹验证之后,还包括:
[0093] 记录第二用户信息,并获取已经存储的上次声纹验证通过后记录的第三用户信 息;
[0094] 确定第二用户信息是否与第三用户信息一致;
[0095] 如果确定第二用户信息与第三用户信息一致,则将当前用户标记为可信用户。
[0096] 可选地,确定当前用户通过声纹验证之后,还包括:
[0097] 确定当前用户在客户端操作业务类型对应的业务的时间是否达到预设时间;
[0098] 如果当前用户在客户端操作业务类型对应的业务的时间达到预设时间,则终止当 前用户在客户端操作业务类型对应的业务。
[0099] 可选地,确定验证声纹与预先存储的注册声纹之间的相似度分值是否达到业务类 型对应的预设相似度分值之后,还包括:
[0100] 如果验证声纹与参考声纹未达到业务类型对应的预设相似度分值,则确定当前用 户非法,并终止声纹验证。
[0101] 本发明实施例提供的方法,通过为不同业务类型设置不同预设相似度分值,并在 进行声纹验证时,通过确定验证声纹与参考声纹之间的相似度的分值是否达到业务类型对 应的预设相似度分值来进行声纹验证,从而可以针对不同的业务类型确定是否声纹验证成 功,声纹验证方法更具灵活性。
[0102] 图3是根据一示例性实施例提供的一种声纹验证方法的流程图。以客户端执行本 发明实施例提供的方法的角度为例,参见图3,本发明实施例提供的方法流程包括:
[0103] 301 :向服务器发送携带业务类型的业务操作请求。
[0104] 302 :接收服务器根据业务操作请求发送的携带验证语料的验证指令。
[0105] 303 :获取操作客户端的当前用户根据验证语料输入的验证声音数据,并将验证声 音数据提交至服务器,使服务器根据验证声音数据生成验证声纹,并根据验证声纹与预先 存储的操作客户端的合法用户的参考声纹对当前用户进行声纹验证。
[0106] 可选地,方法还包括:
[0107] 接收服务器获取到合法用户的第一用户信息后发送的与第一用户信息相关的注 册语料;
[0108] 分预设次数获取合法用户根据注册语料输入的注册声音数据,得到预设次数个注 册声音数据;
[0109] 将预设次数个注册声音数据提交至服务器,使服务器在确定预设次数个注册声音 数据之间的相似度分值达到声纹注册相似度分值后,根据预设次数个注册声音数据生成注 册声纹,并将注册声纹作为参考声纹。
[0110] 可选地,接收服务器根据业务操作请求发送的携带验证语料的验证指令之前,还 包括:
[0111] 向服务器提交第二用户信息,使服务器根据第二用户信息生成电子票据;
[0112] 接收服务器根据业务操作请求发送的携带验证语料的验证指令,包括:
[0113] 接收服务器发送的携带验证语料及服务器生成的电子票据的验证指令;
[0114] 将验证声音数据提交至服务器,包括:
[0115] 将验证声音数据及服务器生成的电子票据提交至服务器,使服务器判断提交的电 子票据与服务器生成的电子票据一致后,根据验证声音数据生成验证声纹。
[0116] 本发明实施例提供的方法,通过服务器为不同业务类型设置不同预设相似度分 值,并在进行声纹验证时,在向服务器提交当前用户的验证声音数据后,服务器生成验证声 纹,并通过确定验证声纹与参考声纹之间的相似度的分值是否达到业务类型对应的预设相 似度分值来进行声纹验证,从而可以针对不同的业务类型确定是否声纹验证成功,声纹验 证方法更具灵活性。
[0117] 图4是根据一示例性实施例提供的一种声纹验证方法的流程图。以客户端和服务 器进行交互来实现本发明实施例提供的方法为例,参见图4,本发明实施例提供的方法流程 包括:
[0118] 401 :客户端向服务器发送携带业务类型的业务操作请求。
[0119] 如果当前用户需要在客户端操作某一业务类型的业务,则需要通过客户端向服务 器发送携带业务类型的业务操作请求。关于客户端向服务器发送携带业务类型的业务操作 请求的方式,本发明实施例不作具体限定。具体实施时,客户端可以在获取到当前用户的操 作指令后,触发向服务器发送携带业务类型的业务操作请求。关于客户端获取到当前用户 的操作指令的方式,具体实施时,包括但不限于通过检测操作选项或操作按钮是否被选中 来实现。其中,检测操作选项或操作按钮是否被选中的方式可以有很多种,例如,可以通过 检测操作选项或操作按钮是否被点击、是否被双击、操作选项或操作按钮的触摸操作是否 达到预设时间,等等。
[0120] 关于业务操作类型,本发明实施例不作具体限定。具体实施时,可以结合客户端支 持的业务类型而定。例如,业务类型可以为登录业务、支付业务、小区门禁业务,等等。
[0121] 例如,如果业务类型为登录业务,为了触发登录操作,当前用户需要通过对应的客 户端向服务器发送携带登录业务的登录操作请求。其中,客户端向服务器发送携带登录业 务的登录操作请求可以是在检测到客户端对应的登录选项被选中后触发的。在检测登录选 项是否被选中时,包括但不限于通过检测登录选项是否被点击、是否被双击、登录选项上的 触摸操作是否达到预设时间,等等。
[0122] 例如,如果业务类型为小区门禁业务,则当前用户在进入小区之前进行身份验证 时,可以通过声纹验证实现。为了触发声纹验证过程,当前用户可以通过客户端进入门禁验 证页面,从而触发向服务器发送携带小区门禁业务的业务操作请求。关于当前用户进入门 禁验证页面的方式,包括但不限于通过客户端与门禁管理系统建立连接来实现。其中,当前 用户通过客户端与门禁管理系统建立连接的方式,包括但不限于通过关注门禁管理系统的 公众号实现。
[0123] 402 :服务器接收客户端发送的携带业务类型的业务操作请求,并根据业务操作请 求向客户端发送携带验证语料的验证指令。
[0124] 关于服务器接收客户端发送的携带业务类型的业务操作请求的方式,本发明实施 例不作具体限定。另外,为了触发通过声纹验证对当前用户的身份进行验证,服务器根据业 务操作请求向客户端发送携带验证语料的验证指令,使当前用户可以根据验证语料输入声 音数据。关于根据业务操作请求向客户端发送携带验证语料的验证指令的方式,本发明实 施例不作具体限定。
[0125] 需要说明的是,服务器根据业务操作请求向客户端发送携带验证语料的验证指令 之前,需要获取验证语料。关于获取到的验证语料的具体内容,本发明实施例不作具体限 定。具体实施时,该验证语料的具体内容与形成参考声纹时使用的语料有关。后续在介绍 参考声纹时,再对验证语料进行具体说明,此处先暂不对验证语料的内容进行说明。
[0126] 可选地,由于通常的声纹验证过程是由服务器发起的,然而,也可能存在人为伪造 发起声纹验证的情况。为了保证声纹验证过程由服务器发起,避免人为伪造发起声纹验证 过程,服务器在发起声纹验证过程时,可以生成一个电子票据,从而在与客户端每次进行交 互的过程中,均携带该电子票据,以标识该次声纹验证过程的基本信息,保证声纹验证过程 的安全性。为了生成电子票据,服务器在根据业务操作请求向客户端发送携带验证语料的 验证指令之前,还需要根据业务操作请求获取当前用户的第二用户信息,并根据第二用户 信息生成电子票据。
[0127] 关于第二用户信息的具体内容,具体实施时,为了标识声纹验证过程的基本信息, 该第二用户信息至少包括但不限于业务类型、验证时刻、当前用户账号信息及当前用户的 终端信息。根据第二用户信息生成电子票据的方式,具体实施时,可以包括但不限于通过建 立电子票据标识与第二用户信息的映射关系实现。
[0128] 关于获取第二用户信息的方式,包括但不限于通过接收客户端提交的第二用户信 息实现。
[0129] 综上,如果服务器在声纹验证过程中生成了电子票据,则服务器在根据业务操作 请求向客户端发送携带验证语料的验证指令时,可以根据业务操作请求向客户端发送携带 验证语料及生成的电子票据的验证指令。关于根据业务操作请求向客户端发送携带验证语 料及生成的电子票据的验证指令的方式,本发明实施例不作具体限定。
[0130] 403 :客户端接收服务器根据业务操作请求发送的携带验证语料的验证指令,并获 取操作客户端的当前用户根据验证语料输入的验证声音数据,将验证声音数据提交至服务 器。
[0131] 关于客户端接收服务器根据业务操作请求发送的携带验证语料的验证指令的方 式,本发明实施例不作具体限定。通常,服务器在生成用户的声纹时,需要根据用户的声音 数据生成,因此,客户端获取操作客户端的当前用户根据验证语料输入的验证声音数据,并 将验证声音数据提交至服务器。
[0132] 其中,本发明实施例不对客户端获取操作客户端的当前用户根据验证语料输入的 验证声音数据的方式进行限定。具体实施时,在当前用户根据验证语料输入验证声音数据 时,客户端通过录制当前用户输入的声音数据来实现。具体地,在录制验证声音数据时,可 以先获取麦克风或话筒的启动指令,并根据麦克风或话筒的启动指令录制当前用户根据验 证语料输入的声音数据。其中,获取麦克风或话筒的启动指令的方式可以有很多种,具体实 施时,包括但不限于通过检测麦克风或话筒被长按来实现。
[0133] 可选地,客户端通过接收服务器根据业务操作请求发送的携带验证语料的验证指 令后,可以显示验证指令中携带的验证语料,使得当前用户在输入验证声音数据时,可以根 据显示的验证语料朗读验证语料,保证用户不会因忘记验证语料的内容而使得输入的验证 声音数据不满足验证声音数据的条件,从而给用户带来良好操作体验的同时,能够提高获 取当前用户的验证声音数据的效率,从而可以提高声纹验证的效率。
[0134] 关于将验证声音数据提交至服务器的方式,可以有很多种。例如,客户端在录制当 前用户的验证声音数据时,可以在录制验证声音数据的页面提供提交选项,并通过检测该 提交选项是否被选中来确定是否将验证声音数据提交至服务器。当客户端检测到提交选项 被选中后,触发将验证声音数据提交至服务器。
[0135] 另外,客户端在向服务器提交验证声音数据时,由于声音数据通常比较大,因此, 客户端可以将验证声音数据切分为若干份,并分别提交切分后的声音数据,直至将验证声 音数据提交完毕。其中,在切分验证声音数据时,可以将验证声音数据切分为相等大小的声 音数据,也可以切分为不等大小的声音数据。本发明实施例不对切分后的声音数据的具体 大小进行限定。
[0136] 例如,可以将验证声音数据切分为相等大小的三等份,得到验证声音数据1、验证 声音数据2和验证声音数据3,因此,客户端在向服务器提交验证声音数据时,将分别提交 验证声音数据1、验证声音数据2和验证声音数据3。
[0137] 可选地,如果服务器向客户端发送携带验证语料的验证指令时,还发送了电子票 据,则为了使服务器能够获得第二用户信息,客户端可以向服务器提交第二用户信息。关于 客户端向服务器提交第二用户信息的方式,本发明实施例不作具体限定。另外,当生成电子 票据后,服务器与客户端在每次进行交互时,均需要携带该电子票据。因此,客户端在接收 服务器发送的携带验证语料的验证指令时,还接收了验证指令中携带的服务器生成的电子 票据。此时,客户端在将验证声音数据提交至服务器时同时还将服务器生成的电子票据提 交至服务器。
[0138] 404:服务器接收客户端获取到的操作客户端的当前用户根据验证语料输入的验 证声音数据,并根据验证声音数据生成验证声纹。
[0139] 为了获得当前用户的声纹,服务器接收客户端获取到的操作客户端的当前用户根 据验证语料输入的验证声音数据,并根据验证声音数据生成验证声纹。其中,本发明实施例 不对服务器接收客户端获取到的操作客户端的当前用户根据验证语料输入的验证声音数 据的方式进行限定。另外,关于服务器根据验证声音数据生成验证声纹的方式,可以采用声 纹生成算法实现。关于服务器根据声纹生成算法将验证声音数据生成验证声纹的方式,本 发明实施例不作具体限定。具体实施时,可以通过提取验证声音数据中的典型特征来实现。 具体地,由于声音的波长、频率、强度、节奏等特征能体现用户声音的特点,因此,在根据验 证声音数据生成验证声纹时,可以提取验证声音数据中波长、频率、强度、节奏等特征,并确 定验证声音数据中波长、频率、强度、节奏等特征的特征值,将验证声音数据中波长、频率、 强度、节奏等特征的特征值等作为验证声纹。
[0140] 另外,如果客户端在提交验证声音数据时,将验证声音数据切分为若干个声音数 据,则服务器在生成验证声纹时,需要先拼接组成验证声音数据的每个声音数据,并将拼接 后的组成验证声音数据的每个声音数据生成验证声纹。
[0141] 可选地,如果客户端提交验证声音数据时,还提交了服务器生成的电子票据,则为 了保证声纹验证过程的安全性,服务器根据验证声音数据生成验证声纹之前,还需要判断 客户端提交的电子票据与服务器生成的电子票据是否一致;如果客户端提交的电子票据 与服务器生成的电子票据一致,则执行根据验证声音数据生成验证声纹的步骤。如果服务 器确定客户端提交的电子票据与服务器生成的电子票据不一致,则确定当前用户为非法用 户,并终止声纹验证,从而禁止当前用户在该客户端操作业务操作请求中携带的业务类型 对应的业务。
[0142] 关于服务器判断客户端提交的电子票据与服务器生成的电子票据是否一致的方 式,包括但不限于判断客户端提交的电子票据相对于服务器生成的电子票据是否有改变; 如果服务器判断客户端提交的电子票据相对于服务器生成的电子票据未发生改变,则确定 客户端提交的电子票据与服务器生成的电子票据一致。
[0143] 关于终止声纹验证的方法,可以有很多种。具体实施时,包括但不限于通过强制跳 出客户端所在的业务类型对应的页面或者发送提示消息以提示当前用户操作失败,等等。 例如,如果该次声纹验证用于对当前用户的登录业务进行验证,则可以禁止当前用户登录 该客户端。
[0144] 然而,为了进一步确定当前用户是否为合法用户,还可以继续对当前用户的身份 进行验证。因此,服务器也可以采用其它方式对当前用户进行身份验证。其中,服务器在采 用其它方式对当前用户进行身份验证时,可以通过弹出其它方式的验证界面,并获取当前 用户在该验证界面输入的信息来对当前用户进行身份验证。关于根据操作当前用户在该验 证界面输入的信息来对当前用户进行身份验证的具体实现过程,本发明实施例不作具体限 定。
[0145] 可选地,为了保证声纹验证过程在一定的时间范围内有效,服务器还可以设置生 成的电子票据的有效时间,从而将在生成的电子票据的有效时间内的完成的声纹验证确定 为合法,而如果声纹验证过程超过生成的电子票据的有效时间,则将该声纹验证过程确定 为非法。因此,服务器在接收客户端提交的电子票据及验证声音数据之后,还需要确定客户 端提交的电子票据是否在生成的电子票据的预设有效时间内;如果确定客户端提交的电子 票据在生成的电子票据的预设有效时间内,则执行判断客户端提交的电子票据与生成的电 子票据是否一致的步骤。如果确定客户端提交的电子票据不在生成的电子票据的预设有效 时间内,则确定当前用户为非法用户,并终止声纹验证。
[0146] 关于确定预设有效时间的方式,本发明实施例不作具体限定。具体实施时,可以根 据经验统计完成声纹验证的基本时间,并将该基本时间作为预设有效时间。当然,还可以采 用其它方式确定预设有效时间。其中,本发明实施例不对预设有效时间的具体大小进行限 定。
[0147] 关于终止声纹验证的方式,可以有很多种,具体实施时,与上述如果服务器确定客 户端提交的电子票据与服务器生成的电子票据不一致时终止声纹验证的原理一致,具体可 参见上述内容,在此不再赘述。
[0148] 405:服务器确定验证声纹与预先存储的参考声纹之间的相似度分值是否达到业 务类型对应的预设相似度分值,其中,参考声纹为操作客户端的合法用户的声纹,且不同业 务类型对应不同预设相似度分值。
[0149] 为了确定当前用户能否在客户端操作业务类型对应的业务,服务器需要确定验证 声纹与预先存储的操作客户端的合法用户的参考声纹之间的相似度分值是否达到业务类 型对应的预设相似度分值。
[0150] 其中,在确定验证声纹与预先存储的参考声纹之间的相似度分值是否达到业务类 型对应的预设相似度分值之前,需要先确定业务操作请求中携带的业务类型对应的预设相 似度分值。关于确定业务操作请求中携带的业务类型对应的预设相似度分值的方式,包括 但不限于:获取客户端支持的每个业务类型及预设相似度分值之间的映射关系,并根据该 映射关系确定业务操作请求中携带的业务类型对应的预设相似度分值。
[0151] 关于获取客户端支持的每个业务类型及预设相似度分值之间的映射关系的方式, 本发明实施例不作具体限定。具体实施时,可以从本地获取,也可以从其它节点获取。关于 根据映射关系确定业务操作请求中携带的业务类型对应的预设相似度分值的方式,包括但 不限于将业务操作请求中携带的业务类型与映射关系中的每个业务类型一一比对,并将映 射关系中与业务操作请求中携带的业务类型一致的业务类型对应的预设相似度分值作为 业务操作请求中携带的业务类型对应的预设相似度分值。
[0152] 如表一所示,其示出了一种获取客户端支持的所有业务类型及预先设定的每个业 务类型对应的预设相似度分值的映射关系的表格示意图。
[0153] 表一
[0154]

【权利要求】
1. 一种声纹验证方法,其特征在于,所述方法包括: 接收客户端发送的携带业务类型的业务操作请求; 根据所述业务操作请求向所述客户端发送携带验证语料的验证指令; 接收所述客户端获取到的操作所述客户端的当前用户根据所述验证语料输入的验证 声音数据,并根据所述验证声音数据生成验证声纹; 确定所述验证声纹与预先存储的参考声纹之间的相似度分值是否达到所述业务类型 对应的预设相似度分值,所述参考声纹为操作所述客户端的合法用户的声纹;其中,不同业 务类型对应不同预设相似度分值; 如果所述验证声纹与所述参考声纹之间的相似度分值达到所述业务类型对应的预设 相似度分值,则确定所述当前用户通过声纹验证。
2. 根据权利要求1所述的方法,其特征在于,所述确定所述验证声纹与预先存储的参 考声纹之间的相似度分值是否达到所述业务类型对应的预设相似度分值之前,还包括: 获取所述客户端支持的每个业务类型及预设相似度分值之间的映射关系; 根据所述映射关系确定所述业务操作请求中携带的业务类型对应的预设相似度分值。
3. 根据权利要求1所述的方法,其特征在于,所述确定所述验证声纹与预先存储的参 考声纹之间的相似度分值是否达到所述业务类型对应的预设相似度分值之前,还包括: 获取所述参考声纹; 计算所述验证声纹与所述参考声纹之间的相似度分值。
4. 根据权利要求3所述的方法,其特征在于,所述获取所述参考声纹之前,还包括: 获取所述合法用户的第一用户信息; 获取与所述第一用户信息相关的注册语料; 向所述客户端发送所述注册语料; 分预设次数获取所述合法用户根据所述注册语料输入的注册声音数据,得到预设次数 个注册声音数据; 确定所述预设次数个注册声音数据之间的相似度分值是否达到声纹注册相似度分 值; 如果所述预设次数个注册声音数据之间的相似度分值达到所述声纹注册相似度分值, 则根据所述预设次数个注册声音数据生成注册声纹,将所述注册声纹作为所述参考声纹。
5. 根据权利要求1所述的方法,其特征在于,所述确定所述当前用户通过声纹验证之 后,还包括: 存储所述验证声音数据以及所述验证声音数据的属性信息,以将所述验证声音数据以 及所述验证声音数据的属性信息作为后续进化所述参考声纹时筛选进化声音数据的参考。
6. 根据权利要求5所述的方法,其特征在于,所述存储所述验证声音数据以及所述验 证声音数据的属性信息之后,还包括: 确定是否需要进化所述参考声纹; 如果确定需要进化所述参考声纹,则根据多次声纹验证通过后存储的验证声音数据的 属性信息筛选预设数值个进化声音数据; 根据注册声音数据和所述进化声音数据生成进化声纹,将所述进化声纹作为后续声纹 验证的参考声纹。
7. 根据权利要求1所述的方法,其特征在于,所述根据所述业务操作请求向所述客户 端发送携带验证语料的验证指令之前,还包括: 根据所述业务操作请求获取所述当前用户的第二用户信息,并根据所述第二用户信息 生成电子票据; 所述根据所述业务操作请求向所述客户端发送携带验证语料的验证指令,包括: 根据所述业务操作请求向所述客户端发送携带验证语料及生成的电子票据的验证指 令; 所述接收所述客户端获取到的操作所述客户端的当前用户根据所述验证语料输入的 验证声音数据,包括: 接收所述客户端提交的电子票据及所述客户端获取到的操作所述客户端的当前用户 根据所述验证语料输入的验证声音数据; 所述根据所述验证声音数据生成验证声纹之前,还包括: 判断所述客户端提交的电子票据与所述生成的电子票据是否一致; 如果所述客户端提交的电子票据与所述生成的电子票据一致,则执行根据所述验证声 音数据生成验证声纹的步骤。
8. 根据权利要求7所述的方法,其特征在于,所述接收所述客户端提交的电子票据及 验证声音数据之后,还包括: 确定所述客户端提交的电子票据是否在所述生成的电子票据的预设有效时间内; 如果确定所述客户端提交的电子票据在所述生成的电子票据的预设有效时间内,则执 行判断所述客户端提交的电子票据与生成的电子票据是否一致的步骤。
9. 根据权利要求8所述的方法,其特征在于,所述确定所述客户端提交的电子票据是 否在所述生成的电子票据的预设有效时间内之后,还包括: 如果确定所述客户端提交的电子票据不在所述生成的电子票据的预设有效时间内,则 确定所述当前用户为非法用户,并终止声纹验证。
10. 根据权利要求7所述的方法,其特征在于,所述判断所述客户端提交的电子票据与 所述生成的电子票据是否一致之后,还包括: 如果所述客户端提交的电子票据与所述生成的电子票据不一致,则确定所述当前用户 为非法用户,并终止声纹验证。
11. 根据权利要求7所述的方法,其特征在于,所述确定所述当前用户通过声纹验证之 后,还包括: 记录所述第二用户信息,并获取已经存储的上次声纹验证通过后记录的第三用户信 息; 确定所述第二用户信息是否与所述第三用户信息一致; 如果确定所述第二用户信息与所述第三用户信息一致,则将所述当前用户标记为可信 用户。
12. 根据权利要求7所述的方法,其特征在于,所述确定所述当前用户通过声纹验证之 后,还包括: 确定所述当前用户在所述客户端操作所述业务类型对应的业务的时间是否达到预设 时间; 如果所述当前用户在所述客户端操作所述业务类型对应的业务的时间达到预设时间, 则终止所述当前用户在所述客户端操作所述业务类型对应的业务。
13. 根据权利要求1所述的方法,其特征在于,所述确定所述验证声纹与预先存储的注 册声纹之间的相似度分值是否达到所述业务类型对应的预设相似度分值之后,还包括: 如果所述验证声纹与所述参考声纹未达到所述业务类型对应的预设相似度分值,则确 定所述当前用户非法,并终止声纹验证。
14. 一种声纹验证方法,其特征在于,所述方法包括: 向服务器发送携带业务类型的业务操作请求; 接收所述服务器根据所述业务操作请求发送的携带验证语料的验证指令; 获取操作客户端的当前用户根据所述验证语料输入的验证声音数据; 将所述验证声音数据提交至所述服务器,使所述服务器根据所述验证声音数据生成验 证声纹,并根据所述验证声纹与预先存储的操作所述客户端的合法用户的参考声纹对所述 当前用户进行声纹验证。
15. 根据权利要求14所述的方法,其特征在于,所述方法还包括: 接收所述服务器获取到所述合法用户的第一用户信息后发送的与所述第一用户信息 相关的注册语料; 分预设次数获取所述合法用户根据所述注册语料输入的注册声音数据,得到预设次数 个注册声音数据; 将所述预设次数个注册声音数据提交至所述服务器,使所述服务器在确定所述预设次 数个注册声音数据之间的相似度分值达到声纹注册相似度分值后,根据所述预设次数个注 册声音数据生成注册声纹,并将所述注册声纹作为所述参考声纹。
16. 根据权利要求14所述的方法,其特征在于,所述接收所述服务器根据所述业务操 作请求发送的携带验证语料的验证指令之前,还包括: 向所述服务器提交第二用户信息,使所述服务器根据所述第二用户信息生成电子票 据; 所述接收所述服务器根据所述业务操作请求发送的携带验证语料的验证指令,包括: 接收所述服务器发送的携带验证语料及所述服务器生成的电子票据的验证指令; 所述将所述验证声音数据提交至所述服务器,包括: 将所述验证声音数据及所述服务器生成的电子票据提交至所述服务器,使所述服务器 判断提交的电子票据与所述服务器生成的电子票据一致后,根据所述验证声音数据生成验 证声纹。
17. -种声纹验证服务器,其特征在于,所述服务器包括: 第一接收模块,用于接收客户端发送的携带业务类型的业务操作请求; 第一发送模块,用于根据所述业务操作请求向所述客户端发送携带验证语料的验证指 令; 第二接收模块,用于接收所述客户端获取到的操作所述客户端的当前用户根据所述验 证语料输入的验证声音数据; 第一生成模块,用于根据所述验证声音数据生成验证声纹; 第一确定模块,用于确定所述验证声纹与预先存储的参考声纹之间的相似度分值是否 达到所述业务类型对应的预设相似度分值,所述参考声纹为操作所述客户端的合法用户的 声纹;其中,不同业务类型对应不同预设相似度分值; 第二确定模块,用于当所述验证声纹与所述参考声纹之间的相似度分值达到所述业务 类型对应的预设相似度分值时,确定所述当前用户通过声纹验证。
18. 根据权利要求17所述的服务器,其特征在于,所述服务器,还包括: 第一获取模块,用于获取所述客户端支持的每个业务类型及预设相似度分值之间的映 身寸关系; 第三确定模块,用于根据所述映射关系确定所述业务操作请求中携带的业务类型对应 的预设相似度分值。
19. 根据权利要求17所述的服务器,其特征在于,所述服务器,还包括: 第二获取模块,用于获取所述参考声纹; 计算模块,用于计算所述验证声纹与所述参考声纹之间的相似度分值。
20. 根据权利要求19所述的服务器,其特征在于,所述服务器,还包括: 第三获取模块,用于获取所述合法用户的第一用户信息; 第四获取模块,用于获取与所述第一用户信息相关的注册语料; 第二发送模块,用于向所述客户端发送所述注册语料; 第五获取模块,用于分预设次数获取所述合法用户根据所述注册语料输入的注册声音 数据,得到预设次数个注册声音数据; 第四确定模块,用于确定所述预设次数个注册声音数据之间的相似度分值是否达到声 纹注册相似度分值; 第二生成模块,用于当所述预设次数个注册声音数据之间的相似度分值达到所述声纹 注册相似度分值时,根据所述预设次数个注册声音数据生成注册声纹,将所述注册声纹作 为所述参考声纹。
21. 根据权利要求17所述的服务器,其特征在于,所述服务器,还包括: 存储模块,用于存储所述验证声音数据以及所述验证声音数据的属性信息,以将所述 验证声音数据以及所述验证声音数据的属性信息作为后续进化所述参考声纹时筛选进化 声音数据的参考。
22. 根据权利要求21所述的服务器,其特征在于,所述服务器,还包括: 第五确定模块,用于确定是否需要进化所述参考声纹; 筛选模块,用于当确定需要进化所述参考声纹时,根据多次声纹验证通过后存储的验 证声音数据的属性信息筛选预设数值个进化声音数据; 第三生成模块,用于根据注册声音数据和所述进化声音数据生成进化注册声纹,将所 述进化注册声纹作为后续声纹验证的参考声纹。
23. 根据权利要求17所述的服务器,其特征在于,所述服务器,还包括: 第六获取模块,用于根据所述业务操作请求获取所述当前用户的第二用户信息; 第四生成模块,用于根据所述第二用户信息生成电子票据; 所述第一发送模块,用于根据所述业务操作请求向所述客户端发送携带验证语料及生 成的电子票据的验证指令; 所述第二接收模块,用于接收所述客户端提交的电子票据及所述客户端获取到的操作 所述客户端的当前用户根据所述验证语料输入的验证声音数据; 所述服务器,还包括: 判断模块,用于判断所述客户端提交的电子票据与所述生成的电子票据是否一致; 所述第一生成模块,用于当所述客户端提交的电子票据与所述生成的电子票据一致 时,根据所述验证声音数据生成验证声纹。
24. 根据权利要求23所述的服务器,其特征在于,所述服务器,还包括: 第六确定模块,用于确定所述客户端提交的电子票据是否在所述生成的电子票据的预 设有效时间内; 所述判断模块,用于当确定所述客户端提交的电子票据在所述生成的电子票据的预设 有效时间内时,断所述客户端提交的电子票据与生成的电子票据是否一致。
25. 根据权利要求24所述的服务器,其特征在于,所述服务器,还包括: 第七确定模块,用于当确定所述客户端提交的电子票据不在所述生成的电子票据的预 设有效时间内时,确定所述当前用户为非法用户; 第一终止模块,用于终止声纹验证。
26. 根据权利要求23所述的服务器,其特征在于,所述服务器,还包括: 第八确定模块,用于当所述客户端提交的电子票据与所述生成的电子票据不一致时, 确定所述当前用户为非法用户; 第二终止模块,用于终止声纹验证。
27. 根据权利要求23所述的服务器,其特征在于,所述服务器,还包括: 记录模块,用于记录所述第二用户信息; 第七获取模块,用于获取已经存储的上次声纹验证通过后记录的第三用户信息; 第九确定模块,用于确定所述第二用户信息是否与所述第三用户信息一致; 标记模块,用于当确定所述第二用户信息与所述第三用户信息一致时,将所述当前用 户标记为可信用户。
28. 根据权利要求23所述的服务器,其特征在于,所述服务器,还包括: 第十确定模块,用于确定所述当前用户在所述客户端操作所述业务类型对应的业务的 时间是否达到预设时间; 第三终止模块,用于当所述当前用户在所述客户端操作所述业务类型对应的业务的时 间达到预设时间时,终止所述当前用户在所述客户端操作所述业务类型对应的业务。
29. 根据权利要求17所述的服务器,其特征在于,所述服务器,还包括: 第十一确定模块,用于当所述验证声纹与所述参考声纹未达到所述业务类型对应的预 设相似度分值时,确定所述当前用户非法; 第四终止模块,用于终止声纹验证。
30. -种声纹验证客户端,其特征在于,所述客户端包括: 发送模块,用于向服务器发送携带业务类型的业务操作请求; 第一接收模块,用于接收所述服务器根据所述业务操作请求发送的携带验证语料的验 证指令; 第一获取模块,用于获取操作客户端的当前用户根据所述验证语料输入的验证声音数 据; 第一提交模块,用于将所述验证声音数据提交至所述服务器,使所述服务器根据所述 验证声音数据生成验证声纹,并根据所述验证声纹与预先存储的操作所述客户端的合法用 户的参考声纹对所述当前用户进行声纹验证。
31. 根据权利要求30所述的客户端,其特征在于,所述客户端还包括: 第二接收模块,用于接收所述服务器获取到所述合法用户的第一用户信息后发送的与 所述第一用户信息相关的注册语料; 第二获取模块,用于分预设次数获取所述合法用户根据所述注册语料输入的注册声音 数据,得到预设次数个注册声音数据; 第二提交模块,用于将所述预设次数个注册声音数据提交至所述服务器,使所述服务 器在确定所述预设次数个注册声音数据之间的相似度分值达到声纹注册相似度分值后,根 据所述预设次数个注册声音数据生成注册声纹,并将所述注册声纹作为所述参考声纹。
32. 根据权利要求30所述的客户端,其特征在于,所述客户端,还包括: 第三提交模块,用于向所述服务器提交第二用户信息,使所述服务器根据所述第二用 户信息生成电子票据; 所述第一接收模块,用于接收所述服务器发送的携带验证语料及所述服务器生成的电 子票据的验证指令; 所述第一提交模块,用于将所述验证声音数据及所述服务器生成的电子票据提交至所 述服务器,使所述服务器判断提交的电子票据与所述服务器生成的电子票据一致后,根据 所述验证声音数据生成验证声纹。
33. -种声纹验证系统,其特征在于,所述系统包括服务器和客户端; 其中,所述服务器如上述权利要求17至29中任一权利要求所述的服务器; 所述客户端如上述权利要求30至32中任一权利要求所述的客户端。
【文档编号】G10L17/00GK104219050SQ201410388869
【公开日】2014年12月17日 申请日期:2014年8月8日 优先权日:2014年8月8日
【发明者】龙强, 张翔 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1