构建语音特征库的方法、语音合成方法、装置及设备的制造方法

文档序号：9371978阅读：747来源：国知局

构建语音特征库的方法、语音合成方法、装置及设备的制造方法
【技术领域】
[0001]本发明涉及计算机领域，尤其涉及一种构建语音特征库的方法、语音合成方法、装置及设备。
【背景技术】
[0002]个性化的语音会给受众留下深刻的印象。例如，配音员为影视剧中的角色配音，通过配音员个性化的语音征服观众。但目前，无论是影视剧配音、演唱等等都需要人亲自完成。由于人的生老病死，会导致个性化语音消失。
[0003]如何实现个性化语音的使用不受限于人的生老病死，是目前需要解决的问题。

【发明内容】

[0004]本发明解决的技术问题之一是创建个性化的语音特征库，以便能够据此实现个性化的语音合成，使得个性化语音的使用不受限于人的生老病死。
[0005]根据本发明第一方面的一个实施例，提供了一种构建语音特征库的方法，包括:
[0006]将对象的录音转换为个性化的文本信息；
[0007]分析得到每条个性化的文本信息对应的至少一个语境和相同语义的至少一条文本信息；
[0008]在所述对象的语音特征库中关联保存每条个性化的文本信息及对应的文语特征，每条文语特征指示对应的一个语境和一条文本信息；
[0009]对所述录音进行音频采样，得到音频采样值；
[0010]在所述对象的语音特征库中保存音频特征，音频特征指示了音频采样值。
[0011]根据本发明另一方面第二方面的一个实施例，提供了一种构建语音特征库的装置，包括:
[0012]将对象的录音转换为个性化的文本信息的装置；
[0013]分析得到每条个性化的文本信息对应的至少一个语境和相同语义的至少一条文本信息的装置；
[0014]在所述对象的语音特征库中关联保存每条个性化的文本信息及对应的文语特征的装置，每条文语特征指示对应的一个语境和一条文本信息；
[0015]对所述录音进行音频采样，得到音频采样值的装置；
[0016]在所述对象的语音特征库中保存音频特征的装置，音频特征指示了音频采样值。
[0017]根据本发明的第三方面的一个实施例，还提供了一种计算机设备，包括前述构建语音特征库的装置。
[0018]由于本发明推荐候选推荐项目时要考虑用户的场景信息和用户信息构建语音特征库时，针对每条个性化的文本信息，确定至少一个语境和与该条个性化的文本信息相同语义的至少一条文本信息。在后续进行语音合成时，即使提供的文本信息并非所需的个性化语音对应的个性化文本信息，也可以在语音特征库中首先查找到与需要进行语音合成的文本信息语义相同的个性化的文本信息，进而实现个性化的语音合成，从而使得个性化语音的使用不依赖于人的生老病死。
[0019]本发明解决的技术问题之二是进行个性化的语音合成，使得个性化语音的使用不受限于人的生老病死。
[0020]根据本发明第四方面的一个实施例，提供了一种语音合成方法，包括:
[0021]分析得到待进行语音合成的文本信息的语境；
[0022]生成所述待进行语音合成的文本信息对应的文语特征，指示所述待进行语音合成的文本信息及其语境；
[0023]在语音特征库中查找与待进行语音合成的文本信息对应的文语特征匹配的文语特征，所述语音特征库中的每条个性化的文本信息对应的每条文语特征指示对应的一个语境和一个相同语义的文本信息；
[0024]根据查找到的文语特征指示的语境，所述文语特征对应的个性化的文本信息，和所述语音特征库中保存的音频特征，进行语音合成，所述音频特征指示音频采样值。
[0025]根据本发明第五方面的一个实施例，提供了一种语音合成装置，包括:
[0026]语境分析装置，被配置为分析得到待进行语音合成的文本信息的语境；
[0027]文语特征生成装置，被配置为生成所述待进行语音合成的文本信息对应的文语特征，指示所述待进行语音合成的文本信息及其语境；
[0028]文语特征匹配装置，用于在语音特征库中查找与待进行语音合成的文本信息对应的文语特征匹配的文语特征，所述语音特征库中的每条个性化的文本信息对应的每条文语特征指示对应的一个语境和一个相同语义的文本信息；
[0029]语音合成装置，被配置为根据查找到的文语特征指示的语境，所述文语特征对应的个性化的文本信息，和所述语音特征库中保存的音频特征，进行语音合成，所述音频特征指示音频采样值。
[0030]根据本发明的第六方面的一个实施例，还提供了一种计算机设备，包括前述语音合成装置。
[0031]由于本发明所使用的语音特征库中保存有每条个性化的文本信息对应的至少一个语境和与该条个性化的文本信息相同语义的至少一条文本信息。在进行语音合成时，即使提供的文本信息并非所需的个性化语音对应的个性化文本信息，也可以在语音特征库中首先查找到与需要进行语音合成的文本信息语义相同的个性化的文本信息，进而实现个性化的语音合成，从而使得个性化语音的使用不依赖于人的生老病死。
[0032]本领域普通技术人员将了解，虽然下面的详细说明将参考图示实施例、附图进行，但本发明并不仅限于这些实施例。而是，本发明的范围是广泛的，且意在仅通过后附的权利要求限定本发明的范围。
【附图说明】
[0033]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显:
[0034]图1是根据本发明一个实施例的构建语音特征库的方法的流程图。
[0035]图2是根据本发明另一个实施例的构建语音特征库的装置的框图。
[0036]图3是根据本发明一个实施例的语音合成方法的流程图。
[0037]图4是根据本发明另一个实施例的语音合成装置的框图。
[0038]附图中相同或相似的附图标记代表相同或相似的部件。
【具体实施方式】
[0039]下面结合附图对本发明作进一步详细描述。
[0040]图1是根据本发明一个实施例的构建语音特征库的方法的流程图。本发明中的方法主要通过计算机设备中的操作系统或处理控制器来完成。将操作系统或处理控制器称为构建语音特征库的装置。该计算机设备包括但不限于以下中的至少一个:用户设备、网络设备。用户设备包括但不限于计算机、智能手机、PDA等。网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算的由大量计算机或网络服务器构成的云，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个超级虚拟计算机。
[0041]如图1所示，本发明一个实施例提供的构建语音特征库的方法具体包括如下操作:
[0042]步骤100、将对象的录音转换为个性化的文本信息。
[0043]其中，通过语音识别技术，将对象的一段录音识别为对应的文本信息，本发明中称为个性化的文本信息。
[0044]其中，一段录音识别为对应的文本信息后，可以按照预定规则截取成多条文本信息。
[0045]例如，一段录音识别得到的文本信息为“曾经有一份真挚的爱情放在我面前我没有珍惜

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吕文玉;王道龙;刘孟;
技术所有人：百度在线网络技术（北京）有限公司;
我是此专利的发明人

上一篇：一种语音输入方法、装置和系统的制作方法
上一篇：分词词典的生成方法和装置及语音合成方法和装置的制造方法