一种语音合成、删除方法、装置及语音删除合成方法

文档序号:9688743阅读:798来源:国知局
一种语音合成、删除方法、装置及语音删除合成方法
【技术领域】
[0001]本发明涉及语音处理技术领域,尤其涉及一种语音合成、删除方法、装置及语音删除合成方法。
【背景技术】
[0002]随着语音识别技术的发展,其在人们的生活中扮演越来越重要的角色,人们越来越习惯使用语音技术。人们也习惯通过语音进行交互,这样既方便又安全,也体现了智能终端的发展趋势。声纹是用电声学仪器显示的携带言语信息的声波频谱。现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。
[0003]所谓声纹,是用电声学仪器显示的携带言语信息的声波频谱。现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。实验证明,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同。人的发声具有特定性和稳定性。从理论上讲,它同指纹一样具有身份识别(认定个人)的作用。
[0004]但现有技术中对于语音处理的方式负复杂,不适合在移动终端等设备进行简易、快捷的语音处理。

【发明内容】

[0005]本发明的主要目的在于提出一种一种语音合成、删除方法、装置及语音删除合成方法,旨在解决现有技术中语音和成删除技术复杂的问题。
[0006]为实现上述目的,本发明提供的一种语音合成的方法,包含:
[0007]从第一语音信号中提取与预存声纹特征信息对应的声纹特征信号;
[0008]合成所述提取的声纹特征信号与第二语音信号。
[0009]进一步的,合成所述提取的声纹特征信号与第二语音信号具体包含:对第二语音信号进行频谱分析,获取包含基准频率、基准时间在内的信息,将提取的声纹特征信号与所述获取的包含基准频率、基准时间的信息拼接,实现提取的声纹特征信号与第二语音信号的合成。
[0010]进一步的,从第一语音信号中提取与预存声纹特征信息对应的声纹特征信号之前还包含:建立声纹特征信息模型,初始化相关变量,通过所述声纹特征信息模型对选定声音进行至少一次频谱分析,获取所述选定声音的声纹特征信息。
[0011 ]此外,为实现上述目的,本发明还提出一种语音合成装置,
[0012]提取单元,用于从第一语音信号中提取与预存声纹特征信息对应的声纹特征信号;
[0013]合成单元,用于将所述提取的声纹特征信号与第二语音信号进行合成。
[0014]进一步的,所述的合成单元进一步设置为:对第二语音信号进行频谱分析,获取包含基准频率、基准时间在内的信息,将提取的声纹特征信号与所述获取的包含基准频率、基准时间的信息拼接,实现提取的声纹特征信号与第二语音信号的合成。
[0015]进一步的,还包含模型与训练单元,用于建立声纹特征信息模型,初始化相关变量,通过所述声纹特征信息模型对选定声音进行至少一次频谱分析,获取所述选定声音的声纹特征信息。
[0016]以及,一种语音删除方法,包含:
[0017]从第一语音信号中提取与预存声纹特征信息对应的声纹特征信号;
[0018]从第二语音信号中移除带有所述声纹特征信号的声波。
[0019]进一步的,所述从第二语音信号中移除带有所述声纹特征信号的声波具体包含:对第二语音信号进行频谱分析,获取与提取的声纹特征信号相匹配的声波,删除该段声波。
[0020]以及,一种语音删除装置,包含:
[0021]提取单元,用于从第一语音信号中提取与预存声纹特征信息对应的声纹特征信号;
[0022]删除单元,用于从第二语音信号中移除带有所述声纹特征信号的声波。
[0023]进一步的,所述的删除单元进一步设置为:对第二语音信号进行频谱分析,获取与声纹特征信号相匹配的声波,删除该段声波。
[0024]以及,一种语音删除合成的方法,
[0025]获取第一语音信号的声纹特征信号;
[0026]从第二语音信号中移除含有所述第一语音信号声纹特征信号的波形;
[0027]获取第三语音信号的声纹特征信号;
[0028]将所述第三语音信号的声纹特征信号合成到所述第二语音信号中。
[0029]进一步的,所述获取第一语音信号或者第三语音信号的声纹特征信号的过程为:建立声纹特征信息模型,初始化相关变量,通过所述声纹特征信息模型对选定声音进行至少一次频谱分析,获取所述选定声音的声纹特征信息;
[0030]从第一语音信号或者第三语音信号中提取与所述声纹特征信息对应的声纹特征信号。
[0031]进一步的,从第二语音信号中移除含有所述第一语音信号声纹特征信号的波形的过程为:对第二语音信号进行频谱分析,获取与第一语音信号的声纹特征信号相匹配的声波,删除该段声波。
[0032]进一步的,所述将所述第三语音信号的声纹特征信号合成到所述第二语音信号中的过程为:对第二语音信号进行频谱分析,获取包含基准频率、基准时间在内的信息,将提取的第三语音信号的声纹特征信号与所述获取的第二语音信号的包含基准频率、基准时间的信息拼接,使第三语音信号的声纹特征信号合成到所述第二语音信号中。
[0033]进一步的,所述获取第一语音信号、第二语音信号、第三语音信号的方式包括:录
■~>V.曰ο
[0034]本发明提出的语音合成、删除的方法和装置以及删除合成的方法,基于声纹特征信息来识别特定人的声音,在声音合成(或者移除)的时候进行处理,完成后期语音信号的处理,比如录音的时候可以轻易的合成特定人的声音,或者移除特定人的声音,对声音的制作有很大的帮助,使得语音处理更加简洁,方便。
【附图说明】
[0035]图1为本发明实施例一提供的一种语音合成方法流程示意图;
[0036]图2为本发明实施例二提供的一种语音合成方法结构示意图;
[0037]图3为本发明实施例三提供的一种语音合成装置结构示意图;
[0038]图4为本发明实施例四提供的一种语音删除方法流程示意图;
[0039]图5为本发明实施例五提供的一种语音删除装置结构示意图;
[0040]图6为本发明实施例六提供的一种语音删除合成方法流程示意图;
[0041 ]图7为本发明实施例七提供的一种语音删除合成方法流程示意图;
[0042]图8为本发明实施例八提供的一种语音删除合成装置结构示意图。
[0043]本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
【具体实施方式】
[0044]应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0045]现在将参考附图描述实现本发明各个实施例的移动终端。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,"模块"与"部件"可以混合地使用。
[0046]实施例一
[0047]如图1所示,本发明第一实施例提出一种语音合成方法,包括:
[0048]S101,从第一语音信号中提取与预存声纹特征信息
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1