语音数据处理方法及终端的制作方法_3

文档序号:9371981阅读:来源:国知局
联系人的声纹特征的对应关系。
[0086]步骤S204,进入会议电话模式,对当前通话中对方发言者的声纹特征进行实时提取,与已保存的联系人的声纹特征匹配,得到通讯录中当前发言者的信息。
[0087]匹配中适配的语音模型包括:矢量化模型、随机模型、神经网络模型。
[0088]步骤S205,显示当前发言者的信息。
[0089]本发明实施例还记载一种计算机存储介质,所述计算机存储介质中存储有可执行指令,所述可执行指令用于执行图1或图3所示的语音数据处理流程。
[0090]本发明实施例中,第一终端处于多终端的语音通信场景中时,可以基于从多终端语音通信场景中获取的语音数据中提取出声纹特征,与第一终端中预设声纹特征匹配,进而得到提取出的声纹特征对应的目标用户的信息,这就克服了多终端语音通信场景中无法识别语音的来源用户(也即目标用户)的问题;同时,第一终端可以基于提取出的目标用户的声纹特征、和/或来源目标用户的信息,对多终端的语音通信场景进行功能扩展,例如提示当前语音的来源用户、与来源用户基于声纹特征进行加密通信,或基于声纹特征对语音数据进行编辑,满足了用户在多终端的语音通信场景中的需求,提升了用户体验。
[0091 ] 本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、随机存取存储器(RAM,Random Access Memory)、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0092]或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、RAM、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
[0093]以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
【主权项】
1.一种语音数据处理方法,其特征在于,所述方法包括: 第一终端从获取的语音数据中提取出声纹特征,将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征; 基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息; 基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。2.如权利要求1所述的方法,其特征在于,所述方法还包括: 所述第一终端从获取的语音数据中提取出声纹特征之前,获取来自第二终端的语音数据,所述来自第二终端的语音数据中承载有所述第二终端的用户的语音; 从来自所述第二终端的语音数据中提取出所述第二终端的用户的声纹特征; 建立所述第二终端的用户的声纹特征与所述第二终端的用户的信息之间的对应关系。3.如权利要求1所述的方法,其特征在于,所述基于与提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令,包括: 所述语音数据中承载有至少两个所述用户的语音; 当确定与所述提取出的声纹特征对应的用户的信息时,基于图形界面呈现与所述提取出的声纹特征对应的用户的信息,直至所接收的所述语音数据中不再承载有与所述用户对应的语音。4.如权利要求1所述的方法,其特征在于,所述基于与提取出的声纹特征、和/或与所述提取出的声纹特征对应的用户的信息响应操作指令,包括: 采集信息,利用所述提取出的声纹特征对所采集到的信息进行加密; 基于与所述提取出的声纹特征对应的目标用户的信息,向所述目标用户对应的第三终端发送加密后的信息;其中, 所述加密后的信息用于使所述第三终端基于所述目标用户的声纹特征进行声纹匹配,以对所述加密后的信息进行解密。5.如权利要求1至4任一项所述的方法,其特征在于,所述基于与提取出的声纹特征响应操作指令,包括: 基于所述提取出的声纹特征,在所述语音数据中滤除与所述声纹特征对应的语音数据; 所述基于与所述提取出的声纹特征对应的用户的信息响应操作指令,包括: 基于所述提取出的声纹特征、以及与所述提取出的声纹特征对应的目标用户的信息,确定所述语音数据中承载有不同所述目标用户的语音的数据段,对所确定的数据段进行语音编辑操作。6.一种终端,其特征在于,所述终端包括: 语音获取模块,用于获取语音数据; 声纹提取模块,用于从所述获取的语音数据中提取出声纹特征, 声纹匹配模块,用于将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征; 声纹关联模块,用于存储所述预设声纹特征与用户的信息的一一对应关系; 声纹识别模块,用于基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述声纹关联模块存储的所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息; 响应模块,用于基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。7.如权利要求6所述的终端,其特征在于, 所述语音获取模块,还用于在所述声纹提取模块从获取的语音数据中提取出声纹特征之前,获取来自第二终端的语音数据,所述来自第二终端的语音数据中承载有所述第二终端的用户的语音; 所述声纹提取模块,还用于从来自所述第二终端的语音数据中提取出所述第二终端的用户的声纹特征; 所述声纹关联模块,还用于建立所述第二终端的用户的声纹特征与所述第二终端的用户的信息之间的对应关系。8.如权利要求6所述的终端,其特征在于, 所述响应模块,还用于当所述声纹识别模块确定与所述提取出的声纹特征对应的用户的信息时,基于图形界面呈现与所述提取出的声纹特征对应的用户的信息,直至所接收的所述语音数据中不再承载有与所述用户对应的语音; 其中,所述语音数据中承载有至少两个所述用户的语音。9.如权利要求6所述的终端,其特征在于,所述响应模块包括: 采集单元,用于采集信息,利用所述提取出的声纹特征对所采集到的信息进行加密; 加密单元,用于基于与所述提取出的声纹特征对应的目标用户的信息,向所述目标用户对应的第三终端发送加密后的信息;其中, 所述加密后的信息用于使所述第三终端基于所述目标用户的声纹特征进行声纹匹配,以对所述加密后的信息进行解密。10.如权利要求6至9任一项所述的终端,其特征在于,所述响应模块包括:触发单元、滤除单元和编辑单元; 所述触发单元,用于基于所述操作指令触发所述滤除单元和/或所述编辑单元;其中, 所述滤除单元,用于基于所述提取出的声纹特征,在所述语音数据中滤除与所述声纹特征对应的语音数据; 所述编辑单元,用于基于所述提取出的声纹特征、以及与所述提取出的声纹特征对应的目标用户的信息,确定所述语音数据中承载有不同所述目标用户的语音的数据段,对所确定的数据段进行语音编辑操作。
【专利摘要】本发明实施例公开了一种语音数据处理方法及终端,方法包括:第一终端从获取的语音数据中提取出声纹特征,将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征;基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息;基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。
【IPC分类】G10L15/26, G10L15/02
【公开号】CN105096937
【申请号】CN201510274283
【发明人】张圣杰, 申世安
【申请人】努比亚技术有限公司
【公开日】2015年11月25日
【申请日】2015年5月26日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1