声纹信息管理方法、装置以及身份认证方法、系统的制作方法_2

文档序号:9811910阅读:来源:国知局
一条基准声纹信息。
[0065] 结合第四方面,在第四方面第三种可行的实施方式中,所述声纹生成器存储所述 基准声纹信息和所述第一用户的身份标识符,包括:
[0066] 判断是否存在对应的第二文本信息与待存储的第一基准声纹信息中的第一文本 信息相同,且对应的第二身份标识符与所述第一基准声纹信息对应的第一身份标识符也相 同的第二基准声纹信息;
[0067] 如果不存在所述第二基准声纹信息,则直接存储所述第一基准声纹信息和所述第 一身份标识符;
[0068] 如果存在所述第二基准声纹信息,则比较所述第一基准声纹信息中的第一语音信 息和所述第二基准声纹信息中的第二语音信息的质量,如果所述第一语音信息的质量低于 所述第二语音信息,则删除所述第一基准声纹信息;
[0069] 如果所述第一语音信息的质量高于所述第二语音信息,则删除所述第二基准声纹 信息,并存储所述第一基准声纹信息和所述第一身份标识符。
[0070] 由以上技术方案可知,本申请通过对相关系统存储的历史语音文件进行过滤,得 到第一用户的语音信息,并通过文本识别处理得到该语音信息对应的文本信息,并将该语 音信息和对应的文本信息编辑为第一用户的基准声纹信息;由于该基准声纹信息中的文本 信息和语音信息都是基于上述历史语音文件得到的,不是相关系统预设的,即是非公开的, 故无论第一用户,还是第二用户,还是其他任何用户都无法预知执行身份认证时需要复读 的文本信息的具体内容,从而无法提前录制对应的声音文件,也即无法通过播放提前录制 的声音文件达到认证成功的目的。因此,相对于现有基于声纹识别的身份认证方式,基于本 申请提供的声纹信息管理方法进行身份认证,认证结果更准确,不存在安全隐患,账户的安 全性更高。
[0071] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不 能限制本申请。
【附图说明】
[0072] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施 例,并与说明书一起用于解释本发明的原理。
[0073] 图1是本申请实施例提供的一种声纹信息管理方法的流程图。
[0074] 图2是本申请实施例提供的另一种声纹信息管理方法的流程图。
[0075] 图3是本申请实施例提供的存储基准声纹信息的方法流程图。
[0076] 图4是本申请实施例提供的一种声纹信息管理系统的结构框图。
[0077] 图5是本申请实施例提供的另一种声纹信息管理系统的结构框图。
[0078] 图6是本申请实施例提供的一种身份认证方法的流程图。
[0079] 图7是本申请实施例提供的另一种身份认证方法的流程图。
[0080] 图8是本申请实施例提供的一种身份认证系统的结构框图。
[0081] 图9是本申请实施例提供的另一种身份认证系统的结构框图。
【具体实施方式】
[0082] 这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及 附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例 中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附 权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
[0083] 图1是本申请实施例提供的一种声纹信息管理方法的流程图,该声纹信息管理方 法应用于一种账户管理系统。如图1所示,该声纹信息管理方法,包括以下步骤。
[0084] S11、获取第一用户与第二用户通话产生的历史语音文件。
[0085] 上述第一用户可以为在账户管理系统中存在对应的私有账户的注册用户,相应 的,第二用户可以为账户管理系统的服务人员。
[0086] S12、对所述历史语音文件执行过滤处理,得到所述第一用户的语音信息。
[0087] S13、对所述语音信息执行文本识别处理,得到所述语音信息对应的文本信息。
[0088] S14、将所述语音信息和对应的文本信息编辑为所述第一用户的基准声纹信息,并 存储基准声纹信息和所述第一用户的身份标识符。
[0089] 一般的,为便于业绩统计、服务质量评估、纠纷处理等,账户管理系统会对注册用 户与服务人员之间的语音通话过程进行录音并存储对应的语音文件。有鉴于此,本申请实 施例将账户管理系统存储的历史语音文件中的机器提示音、服务人员的声音信息等滤除, 得到注册用户的语音信息,通过对该语音信息进行文本识别处理,得到该语音信息对应的 文本信息,该语音信息和对应的文本信息就可以作为该注册用户的一组基准声纹信息。分 别针对每个注册用户执行上述步骤,就可以得到每个注册用户对应的基准声纹信息,完成 声纹库的创建。
[0090] 由以上方法可知,本申请实施例通过对相关系统存储的历史语音文件进行过滤, 得到第一用户的语音信息,并通过文本识别处理得到该语音信息对应的文本信息,并将该 语音信息和对应的文本信息编辑为第一用户的基准声纹信息;由于该基准声纹信息中的文 本信息和语音信息都是基于上述历史语音文件得到的,不是相关系统预设的,即是非公开 的,故无论第一用户,还是第二用户,还是其他任何用户都无法预知执行身份认证时需要复 读的文本信息的具体内容,从而无法提前录制对应的声音文件,也即无法通过播放提前录 制的声音文件达到认证成功的目的。因此,相对于现有基于声纹识别的身份认证方式,基于 本申请实施例提供的声纹信息管理方法进行身份认证,认证结果更准确,不存在安全隐患, 账户的安全性更高。
[0091] 在本申请一个可行的实施例中,可以随机的获取第一用户与第二用户任意一次通 话过程对应的一个历史语音文件,使得声纹库中身份标识符与基准声纹信息一一对应。由 于无法预知实际获取到的历史语音文件对应哪一次通话过程,也就无法预知得到的基准声 纹信息中的文本信息的具体内容;因此,基于本实施例执行身份认证,可以保证认证结果的 准确性,提高账户的安全性。
[0092] 在本申请另一个可行的实施例中,也可以获取第一用户对应的所有历史语音文 件,每个历史语音文件都可以对应至少一组基准声纹信息,使得声纹库中一个身份标识符 可以对应多组基准声纹信息(即第一用户存在多组基准声纹信息);相应的,可以随机的获 取任意一组基准声纹信息,来执行身份认证。由于每组基准声纹信息中的文本信息都是非 公开的,执行身份认证时获取到的基准声纹信息也无法预知,故用于执行身份认证的文本 信息的具体内容也无法预知,从而无法提前录制对应的声音文件,也就无法通过播放提前 录制的声音文件达到认证成功的目的;因此,基于本实施例执行身份认证,可以保证认证结 果的准确性,提高账户的安全性。
[0093] 图2是本申请另一实施例提供的声纹信息管理方法的流程图,该声纹信息管理方 法应用于一种账户管理系统。如图2所示,该声纹信息管理方法,包括以下步骤。
[0094] S21、获取第一用户与第二用户通话产生的历史语音文件。
[0095] S22、对所述历史语音文件执行过滤处理,得到所述第一用户的语音信息。
[0096] S23、对所述语音信息执行文本识别处理,得到所述语音信息对应的文本信息。
[0097] S24、将所述文本信息切分为多个子文本信息,并标记每个子文本信息的起止时 间。
[0098] S25、根据子文本信息的起止时间从所述语音信息中分别截取每个子文本信息对 应的子语音信息。
[0099] S26、将每对子语音信息和子文本信息分别编辑为所述第一用户的一条基准声纹 信息,并存储各条基准声纹信息和第一用户的身份标识符。
[0100] 由于历史语音文件为一段时间内第一用户与第二用户之间的通话录音文件,故过 滤得到的语音信息中包含第一用户的多段声音信息,相应的通过文本识别得到的文本信息 包含多个句子或短语。本申请实施例将文本信息切分为多个子文本信息(每个子文本信息 可以为一个句子、一个短语或一个词语);同时,为切分得到的每个子文本信息标记起止时 间,根据该起止时间在语音信息中截取该子文本信息对应的子语音信息(也即根据子文本 信息切分语音信息)。例如,文本信息中"我的账号被锁定了"这一句子由语音信息的00:03 至00:05时段识别得到,则将"我的账号被锁定了 "切分为一个子文本信息,其起止时间即 为00:03至00:05,相应的,将语音信息中00:03至00:05时段的语音信息截取出来,即得到 "我的账号被锁定了"这一子文本信息对应的子语音信息。通过对文本信息和语音信息的切 分,可以得到多对子文本信息和子语音信息,按照预定格式分别将其编辑为基准声纹信息, 则得到同一用户对应的多条基准声纹信息。
[0101] 本申请实施例中,将子语音信息和对应的子文本信息编辑为基准声纹信息,可以 包括:将子语音信息处理为对应的子声纹信息,并为该子声纹信息设置文件名,文件名的格 式可以为"声纹编号.文件格式后缀",如0989X. WAV ;存储该子声纹信息,以及该子声纹信 息对应的第一用户的身份标识符、子文本信息等信息;基于以上声纹信息管理方法得到的 声纹库的存储结构如表1所示。
[0102] 表1声纹库存储结构示例
[0103]
[0104] 表1中,每一行对应声纹库中的一条基准声纹信息;以身份标识符(即用户ID)为 主键,用于声纹信息的查询和调用;用户声纹编号用于标记同一用户ID对应的基准声纹信 息的个数。以用户ID "139XXXXXXXX"为例,当接收到对该用户ID的身份认证请求时,从上 述声纹库中查询" 139XXXXXXXX "对应的基准声纹信息,可以得到多条查询结果,从中随机提 取一条作为本次认证的基准声纹信息,例如提取该用户ID对应的2号基准声纹信息作为本 次认证的基准声纹信息,输出其中的子文本信息"为什么还么有退款";接收待认证用户复 读该子文件信息得到的待认证语音信息,将其处理为待认证声纹信息,比较该待认证声纹 信息和声纹库中提取的子声纹信息"0389X. WAV",如果二者匹配,则判定身份认证成功,即 认为待认证用户即为" 139XXXXXXXX"对应的第一用户;反之,如果二者不匹配,则判定身份 认证失败。
[0105] 由以上技术方案可知,本申请实施例通过对系统存储
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1