一种语音合成、删除方法、装置及语音删除合成方法_4

文档序号：9688743阅读：来源：国知局

先通过S401寻找到A的声纹特征信号，然后通过S402将B录音中对应A声音的波形删除。
[0113]第二提取单元12，用于提取第三语音信号的声纹特征信号；
[0114]具体的，第二提取单元12提取第三语音信号的声纹特征信号过程同第一提取单元11提取第一语音信号的声纹特征信号的过程，在此不重复描述。
[0115]合成单元20，用于将所述第三语音信号的声纹特征信号合成到所述第二语音信号中。
[0116]具体的，合成单元20对第二语音信号进行频谱分析，获取第二语音信号包含基准频率、基准时间在内的信息，将提取的第三语音信号的声纹特征信号与所述获取的第二语音信号的包含基准频率、基准时间的信息拼接，使第三语音信号的声纹特征信号合成到所述第二语音信号中。假如所述的第三语音信号即为C的声音的声纹特征信号，那么要将C的声音合成到B录音中，在S403去除A的声波的基础上，将C的声纹特征信号合成与A的包含基准频率、基准时间的信息拼接，即可最终完成将B录音中A的声音换成C的声音的目的。
[0117]以上实现的语音删除合成装置，对复合有多种声音的录音，可以将不需要的声音置换为需要的声音，免去重新拍摄的烦恼，在语音处理中有极大的应用前景。
[0118]需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0119]上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。
[0120]通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如R0M/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，月艮务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。
[0121]以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。
【主权项】
1.一种语音合成的方法，其特征在于，包含以下步骤: 从第一语音信号中提取与预存声纹特征信息对应的声纹特征信号；合成所述提取的声纹特征信号与第二语音信号。2.根据权利要求1所述的语音合成方法，其特征在于，合成所述提取的声纹特征信号与第二语音信号具体包含:对第二语音信号进行频谱分析，获取包含基准频率、基准时间在内的信息，将提取的声纹特征信号与所述获取的包含基准频率、基准时间的信息拼接，实现提取的声纹特征信号与第二语音信号的合成。3.根据权利要求1或2所述的语音合成方法，其特征在于还包含，从第一语音信号中提取与预存声纹特征信息对应的声纹特征信号之前还包含:建立声纹特征信息模型，初始化相关变量，通过所述声纹特征信息模型对选定声音进行至少一次频谱分析，获取所述选定声音的声纹特征信息。4.一种语音合成装置，其特征在于包含: 提取单元，用于从第一语音信号中提取与预存声纹特征信息对应的声纹特征信号；合成单元，用于将所述提取的声纹特征信号与第二语音信号进行合成。5.根据权利要求4所述的语音合成装置，其特征在于:所述的合成单元进一步设置为:对第二语音信号进行频谱分析，获取包含基准频率、基准时间在内的信息，将提取的声纹特征信号与所述获取的包含基准频率、基准时间的信息拼接，实现提取的声纹特征信号与第二语音信号的合成。6.根据权利要求4所述的语音合成装置，其特征在于:还包含模型与训练单元，用于建立声纹特征信息模型，初始化相关变量，通过所述声纹特征信息模型对选定声音进行至少一次频谱分析，获取所述选定声音的声纹特征信息。7.一种语音删除方法，其特征在于包含: 从第一语音信号中提取与预存声纹特征信息对应的声纹特征信号；从第二语音信号中移除带有所述声纹特征信号的声波。8.根据权利要求7所述的语音删除方法，其特征在于:所述从第二语音信号中移除带有所述声纹特征信号的声波具体包含:对第二语音信号进行频谱分析，获取与提取的声纹特征信号相匹配的声波，删除该段声波。9.一种语音删除装置，其特征在于包含: 提取单元，用于从第一语音信号中提取与预存声纹特征信息对应的声纹特征信号；删除单元，用于从第二语音信号中移除带有所述声纹特征信号的声波。10.根据权利要求9所述的语音删除装置，其特征在于:所述的删除单元进一步设置为:对第二语音信号进行频谱分析，获取与声纹特征信号相匹配的声波，删除该段声波。11.一种语音删除合成的方法，其特征在于: 获取第一语音信号的声纹特征信号；从第二语音信号中移除含有所述第一语音信号声纹特征信号的波形；获取第三语音信号的声纹特征信号；将所述第三语音信号的声纹特征信号合成到所述第二语音信号中。12.根据权利要求11所述的语音删除合成的方法，其特征在于，所述获取第一语音信号或者第三语音信号的声纹特征信号的过程为:建立声纹特征信息模型，初始化相关变量，通过所述声纹特征信息模型对选定声音进行至少一次频谱分析，获取所述选定声音的声纹特征信息；从第一语音信号或者第三语音信号中提取与所述声纹特征信息对应的声纹特征信号。13.根据权利要求11所述的语音删除合成的方法，其特征在于，从第二语音信号中移除含有所述第一语音信号声纹特征信号的波形的过程为:对第二语音信号进行频谱分析，获取与第一语音信号的声纹特征信号相匹配的声波，删除该段声波。14.根据权利要求11所述的语音删除合成的方法，其特征在于，所述将所述第三语音信号的声纹特征信号合成到所述第二语音信号中的过程为:对第二语音信号进行频谱分析，获取包含基准频率、基准时间在内的信息，将提取的第三语音信号的声纹特征信号与所述获取的第二语音信号的包含基准频率、基准时间的信息拼接，使第三语音信号的声纹特征信号合成到所述第二语音信号中。15.根据权利要求11至14任一项语音删除合成方法，其特征在于，所述获取第一语音信号、第二语音信号、第三语音信号的方式包括:录音。
【专利摘要】本发明公开了一种语音合成、删除方法、装置及语音删除合成方法，包含从第一语音信号中提取与预存声纹特征信息对应的声纹特征信号；合成所述提取的声纹特征信号与第二语音信号或者在第二语音信号中删除带有第一语音信号声纹特征信号的波形。本发明可以实现对一段对话或者录取的录音，进行某个特定人的声音的移除，或者增加某个人的声音进去，方便音频信号后期处理。
【IPC分类】G10L17/02, G10L13/02, G10L13/033
【公开号】CN105448289
【申请号】CN201510781201
【发明人】王维平
【申请人】努比亚技术有限公司
【公开日】2016年3月30日
【申请日】2015年11月16日

完整全部详细技术资料下载

当前第4页1 2 3 4