声纹信息管理方法、装置以及身份认证方法、系统的制作方法_5

文档序号:9811910阅读:来源:国知局
的质量低于 所述第二语音信息,则删除所述第一基准声纹信息;
[0180] 如果所述第一语音信息的质量高于所述第二语音信息,则删除所述第二基准声纹 信息,并存储所述第一基准声纹信息和对应的用户身份标识符。
[0181] 基于以上配置的声纹生成器,本申请实施例不仅可以保证所存储的基准声纹信息 中,同一身份标识符对应的任意两条基准声纹信息中的文本信息都不同,还可以保证每一 种文本信息对应的语音信息的质量最高;在基于本申请实施例执行身份认证时,基于质量 更高的语音信息进行声纹对比,可以保证认证的准确性,提高认证效率。
[0182] 本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其 它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或 者适应性变化遵循本发明的一般性原理并包括本申请未公开的本技术领域中的公知常识 或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的 权利要求指出。
[0183] 应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并 且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
【主权项】
1. 一种声纹信息管理方法,其特征在于,包括: 获取第一用户与第二用户通话产生的历史语音文件; 对所述历史语音文件执行过滤处理,得到所述第一用户的语音信息; 对所述语音信息执行文本识别处理,得到所述语音信息对应的文本信息; 将所述语音信息和对应的文本信息编辑为所述第一用户的基准声纹信息,并存储所述 基准声纹信息和所述第一用户的身份标识符。2. 根据权利要求1所述的声纹信息管理方法,其特征在于,还包括: 将所述文本信息切分为多个子文本信息,并标记每个子文本信息的起止时间; 根据子文本信息的起止时间从所述语音信息中分别截取每个子文本信息对应的子语 音信息。3. 根据权利要求2所述的声纹信息管理方法,其特征在于,将所述语音信息和对应的 文本信息编辑为所述第一用户的基准声纹信息,包括: 将每对子语音信息和子文本信息分别编辑为所述第一用户的一条基准声纹信息。4. 根据权利要求1所述的声纹信息管理方法,其特征在于,存储所述基准声纹信息和 所述第一用户的身份标识符,包括: 判断是否存在对应的第二文本信息与待存储的第一基准声纹信息中的第一文本信息 相同,且对应的第二身份标识符与所述第一基准声纹信息对应的第一身份标识符也相同的 第二基准声纹信息; 如果不存在所述第二基准声纹信息,则直接存储所述第一基准声纹信息和所述第一身 份标识符; 如果存在所述第二基准声纹信息,则比较所述第一基准声纹信息中的第一语音信息和 所述第二基准声纹信息中的第二语音信息的质量,如果所述第一语音信息的质量低于所述 第二语音信息,则删除所述第一基准声纹信息; 如果所述第一语音信息的质量高于所述第二语音信息,则删除所述第二基准声纹信 息,并存储所述第一基准声纹信息和所述第一身份标识符。5. -种声纹信息管理系统,其特征在于,包括: 语音过滤器,用于获取第一用户与第二用户通话产生的历史语音文件,并对所述历史 语音文件执行过滤处理,得到所述第一用户的语音信息; 文本识别器,用于对所述语音信息执行文本识别处理,得到所述语音信息对应的文本 信息; 声纹生成器,用于将所述语音信息和对应的文本信息编辑为所述第一用户的基准声纹 信息,并存储所述基准声纹信息和所述第一用户的身份标识符。6. 根据权利要求5所述的声纹信息管理系统,其特征在于,还包括: 文本切割器,用于将所述文本信息切分为多个子文本信息,并标记每个子文本信息的 起止时间; 声纹切割器,用于根据子文本信息的起止时间从所述语音信息中分别截取每个子文本 信息对应的子语音信息。7. 根据权利要求6所述的声纹信息管理系统,其特征在于,所述声纹生成器将所述语 音信息和对应的文本信息编辑为所述第一用户的基准声纹信息,包括: 将每对子语音信息和子文本信息分别编辑为所述第一用户的一条基准声纹信息。8. 根据权利要求5所述的声纹信息管理系统,其特征在于,所述声纹生成器存储所述 基准声纹信息和所述第一用户的身份标识符,包括: 判断是否存在对应的第二文本信息与待存储的第一基准声纹信息中的第一文本信息 相同,且对应的第二身份标识符与所述第一基准声纹信息对应的第一身份标识符也相同的 第二基准声纹信息; 如果不存在所述第二基准声纹信息,则直接存储所述第一基准声纹信息和所述第一身 份标识符; 如果存在所述第二基准声纹信息,则比较所述第一基准声纹信息中的第一语音信息和 所述第二基准声纹信息中的第二语音信息的质量,如果所述第一语音信息的质量低于所述 第二语音信息,则删除所述第一基准声纹信息; 如果所述第一语音信息的质量高于所述第二语音信息,则删除所述第二基准声纹信 息,并存储所述第一基准声纹信息和所述第一身份标识符。9. 一种身份认证方法,其特征在于,包括: 获取第一用户与第二用户通话产生的历史语音文件; 对所述历史语音文件执行过滤处理,得到所述第一用户的语音信息; 对所述用户语音信息语音信息执行文本识别处理,得到所述用户语音信息语音信息对 应的文本信息; 将所述语音信息和对应的文本信息编辑为所述第一用户的基准声纹信息,并存储基准 声纹信息和所述第一用户的身份标识符; 获取待认证用户的身份标识符对应的基准声纹信息; 输出获取到的基准声纹信息中的文本信息,并接收对应的待认证语音信息; 将获取到的基准声纹信息中的语音信息与所述待认证语音信息进行匹配,如果匹配成 功,则判定待认证用户认证成功,如果匹配失败,则判定待认证用户认证失败。10. 根据权利要求9所述的身份认证系统,其特征在于,还包括: 将所述文本信息切分为多个子文本信息,并标记每个子文本信息的起止时间; 根据子文本信息的起止时间从所述语音信息中分别截取每个子文本信息对应的子语 音信息。11. 根据权利要求10所述的身份认证系统,其特征在于,将所述语音信息和对应的文 本信息编辑为所述第一用户的基准声纹信息,包括: 将每对子语音信息和子文本信息分别编辑为所述第一用户的一条基准声纹信息。12. 根据权利要求9所述的身份认证系统,其特征在于,存储基准声纹信息和所述第一 用户的身份标识符,包括: 判断是否存在对应的第二文本信息与待存储的第一基准声纹信息中的第一文本信息 相同,且对应的第二身份标识符与所述第一基准声纹信息对应的第一身份标识符也相同的 第二基准声纹信息; 如果不存在所述第二基准声纹信息,则直接存储所述第一基准声纹信息和所述第一身 份标识符; 如果存在所述第二基准声纹信息,则比较所述第一基准声纹信息中的第一语音信息和 所述第二基准声纹信息中的第二语音信息的质量,如果所述第一语音信息的质量低于所述 第二语音信息,则删除所述第一基准声纹信息; 如果所述第一语音信息的质量高于所述第二语音信息,则删除所述第二基准声纹信 息,并存储所述第一基准声纹信息和所述第一身份标识符。13. -种身份认证系统,其特征在于,包括: 语音过滤器,用于获取第一用户与第二用户通话产生的历史语音文件,并对所述历史 语音文件执行过滤处理,得到所述第一用户的语音信息; 文本识别器,用于对所述语音信息执行文本识别处理,得到所述语音信息对应的文本 信息; 声纹生成器,用于将所述语音信息和对应的文本信息编辑为所述第一用户的基准声纹 信息,并存储基准声纹信息和所述第一用户的身份标识符; 声纹提取器,用于获取待认证用户的身份标识符对应的基准声纹信息; 识别前置器,用于输出获取到的基准声纹信息中的文本信息,并接收对应的待认证语 音信息; 声纹匹配器,用于将获取到的基准声纹信息中的语音信息与所述待认证语音信息进行 匹配,如果匹配成功,则判定待认证用户认证成功,如果匹配失败,则判定待认证用户认证 失败。14. 根据权利要求13所述的身份认证系统,其特征在于,还包括: 文本切割器,用于将所述文本信息切分为多个子文本信息,并标记每个子文本信息的 起止时间; 声纹切割器,用于根据子文本信息的起止时间从所述语音信息中分别截取每个子文本 信息对应的子语音信息。15. 根据权利要求14所述的身份认证系统,其特征在于,所述声纹生成器将所述语音 信息和对应的文本信息编辑为所述第一用户的基准声纹信息,包括: 将每对子语音信息和子文本信息分别编辑为所述第一用户的一条基准声纹信息。16. 根据权利要求13所述的身份认证系统,其特征在于,所述声纹生成器存储基准声 纹信息和所述第一用户的身份标识符,包括: 判断是否存在对应的第二文本信息与待存储的第一基准声纹信息中的第一文本信息 相同,且对应的第二身份标识符与所述第一基准声纹信息对应的第一身份标识符也相同的 第二基准声纹信息; 如果不存在所述第二基准声纹信息,则直接存储所述第一基准声纹信息和所述第一身 份标识符; 如果存在所述第二基准声纹信息,则比较所述第一基准声纹信息中的第一语音信息和 所述第二基准声纹信息中的第二语音信息的质量,如果所述第一语音信息的质量低于所述 第二语音信息,则删除所述第一基准声纹信息; 如果所述第一语音信息的质量高于所述第二语音信息,则删除所述第二基准声纹信 息,并存储所述第一基准声纹信息和所述第一身份标识符。
【专利摘要】本申请是关于一种声纹信息管理方法、装置以及身份认证方法、系统,其通过对相关系统存储的历史语音文件进行过滤,得到第一用户的语音信息,并通过文本识别处理得到该语音信息对应的文本信息,并将该语音信息和对应的文本信息编辑为第一用户的基准声纹信息;由于该基准声纹信息中的文本信息和语音信息都是基于上述历史语音文件得到的,不是相关系统预设的,即是非公开的,任何用户都无法预知执行身份认证时需要复读的文本信息的具体内容,从而无法提前录制对应的声音文件,也即无法通过播放提前录制的声音文件达到认证成功的目的。因此,基于本申请实施例提供的声纹信息管理方法进行身份认证,认证结果更准确,不存在安全隐患,账户的安全性更高。
【IPC分类】H04L9/32, G10L15/26
【公开号】CN105575391
【申请号】CN201410532530
【发明人】熊剑
【申请人】阿里巴巴集团控股有限公司
【公开日】2016年5月11日
【申请日】2014年10月10日
【公告号】WO2016054991A1
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1