语音合成方法和装置的制造方法

文档序号：9275419阅读：563来源：国知局

语音合成方法和装置的制造方法
【技术领域】
[0001]本发明涉及语音处理技术领域，尤其涉及一种语音合成方法和装置。
【背景技术】
[0002]语音合成技术根据服务的提供方式可划分为基于云端引擎的语音合成(以下简称:“在线语音合成”)和基于本地引擎的语音合成(以下简称:“离线语音合成”)两种，这两种语音合成技术具有各自的优点和缺点。在线语音合成具有高自然度、高实时性和不占用客户端设备资源等优点，但是其缺点也非常明显，由于使用语音合成的应用(Applicat1n ;以下简称:App)可以一次性发送大段文本到服务器端，但是服务器端合成的语音数据是分段发回给安装上述App的客户端的，而语音的数据量即使经过压缩也相对较大(例如:4kb/s)，如果网络环境的不稳定性，在线语音合成将变得非常缓慢而无法实现连贯的合成；离线语音合成则可以脱离对网络的依赖，能够保证合成服务的稳定性，但是合成的效果相比在线合成较差。
[0003]综上所述，现有技术中使用到语音合成技术的产品都是基于单独的在线语音合成或者单独的离线语音合成，在线语音合成对数据流量消耗较大，遇到网络错误只能提示用户发生错误，而离线语音合成的效果不是特别自然，用户体验较差。

【发明内容】

[0004]本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]为此，本发明的第一个目的在于提出一种语音合成方法。该方法结合在线语音合成与离线语音合成的优点，可以提供更稳定、效果更自然的语音合成服务，保证了用户的语音合成请求总是可以顺利地完成，提高了用户对语音合成服务的认可度和用户体验度。
[0006]本发明的第二个目的在于提出一种语音合成装置。
[0007]为了实现上述目的，本发明第一方面实施例的语音合成方法，包括:对文本进行处理，获得待合成文本；当存在网络连接时，将所述待合成文本发送给在线语音合成系统进行语音合成；如果在所述在线语音合成系统进行语音合成的过程中，所述在线语音合成系统出现故障或者实际使用过程中网络连接中断，则将所述在线语音合成系统未完成语音合成的文本发送给离线语音合成系统进行语音合成。
[0008]本发明实施例的语音合成方法中，当存在网络连接时，将上述待合成文本发送给在线语音合成系统进行语音合成，如果在上述在线语音合成系统进行语音合成的过程中，在线语音合成系统出现故障或者实际使用过程中网络连接中断，则将在线语音合成系统未完成语音合成的文本发送给离线语音合成系统进行语音合成，从而可以结合在线语音合成与离线语音合成的优点，提供更稳定、效果更自然的语音合成服务，保证了用户的语音合成请求总是可以顺利地完成，提高了用户对语音合成服务的认可度和用户体验度。
[0009]为了实现上述目的，本发明第二方面实施例的语音合成装置，包括:文本处理模块，用于对文本进行处理，获得待合成文本；发送模块，用于在存在网络连接时，将所述文本处理模块获得的待合成文本发送给在线语音合成系统进行语音合成；如果在所述在线语音合成系统进行语音合成的过程中，所述在线语音合成系统出现故障或者实际使用过程中网络连接中断，则将所述在线语音合成系统未完成语音合成的文本发送给离线语音合成系统进行语音合成。
[0010]本发明实施例的语音合成装置中，当存在网络连接时，发送模块将上述待合成文本发送给在线语音合成系统进行语音合成，如果在上述在线语音合成系统进行语音合成的过程中，在线语音合成系统出现故障或者实际使用过程中网络连接中断，则将在线语音合成系统未完成语音合成的文本发送给离线语音合成系统进行语音合成，从而可以结合在线语音合成与离线语音合成的优点，提供更稳定、效果更自然的语音合成服务，保证了用户的语音合成请求总是可以顺利地完成，提高了用户对语音合成服务的认可度和用户体验度。
[0011]本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。
【附图说明】
[0012]本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中:
[0013]图1为本发明语音合成方法一个实施例的流程图；
[0014]图2为本发明语音合成方法另一个实施例的流程图；
[0015]图3为本发明语音合成方法再一个实施例的流程图；
[0016]图4为本发明语音合成方法再一个实施例的流程图；
[0017]图5为本发明语音合成装置一个实施例的结构示意图；
[0018]图6为本发明语音合成装置另一个实施例的结构示意图。
【具体实施方式】
[0019]下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。相反，本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
[0020]图1为本发明语音合成方法一个实施例的流程图，如图1所示，该语音合成方法可以包括:
[0021]步骤101，对文本进行处理，获得待合成文本。
[0022]具体地，对文本进行处理可以为:对文本进行断句分词、词性标注、数字符号处理、标注拼音和韵律停顿预测处理。
[0023]以“前方400米有闯红灯拍照”为例，首先经过断句分词、词性标注和数字符号处理得到序列“前方/f四百/m米/q有/V闯红灯/V拍照/V”，其中斜杠后的部分为词性的缩写，标注拼音时会根据词性进行多音字分析；然后再标注拼音得到序列“qian2 fangl si4bai2 mi3 you3 chuang3 hong2 dengl pail zhao4” ；最后一步对韵律停顿进行预测，处理后的序列为“前方四百米$有闯红灯拍照$”，其中空格代表短停顿，$符号代表长停顿。
[0024]步骤102，当存在网络连接时，将上述待合成文本发送给在线语音合成系统进行语音合成。
[0025]本实施例中，当存在网络连接时，客户端会将上述待合成文本发送给在线语音合成系统进行语音合成，在线语音合成系统采用波形拼接的合成方法，将录制好的声音片段按照一定的规则拼接成句子，这种合成方法具有声音质量好、听感自然和更接近真人发音的优点，为了满足声音质量好、听感自然和更接近真人发音的优点的效果，通常云端的音库模型都非常庞大(通常会达到数个G)，无法直接应用在本地。
[0026]步骤103，如果在上述在线语音合成系统进行语音合成的过程中，在线语音合成系统出现故障或者实际使用过程中网络连接中断，则将在线语音合成系统未完成语音合成的文本发送给离线语音合成系统进行语音合成。
[0027]本实施例中，如果在上述在线语音合成系统进行语音合成的过程中，在线语音合成系统出现故障或者实际使用过程中网络连接中断，则客户端将在线语音合成系统未完成语音合成的文本发送给离线语音合成系统进行语音合成，离线语音合成系统通常采用参数合成方法，需要预先从音库中提取出声学参数，然后利用声学参数和声码器重建声音，使用这种办法可以将需要存储的音库数据大小减小到M字节的量级，使得离线语音合成能够在手机等移动设备上使用，但是由于声学参数并不是真实声音，离线语音合成系统合成出来的声音自然度和音质不如在线语音合成系统。
[0028]进一步地，在语音合成完

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：谢延;李秀林;白洁;
技术所有人：百度在线网络技术（北京）有限公司;
我是此专利的发明人

上一篇：一种英语口语自动打分方法及系统的制作方法
上一篇：语音合成方法和系统的制作方法