一种文字转语音的处理方法及系统的制作方法

文档序号：9525205阅读：499来源：国知局

一种文字转语音的处理方法及系统的制作方法
【技术领域】
[0001]本发明涉及文字处理技术领域，尤其涉及一种文字转语音的处理方法及系统。
【背景技术】
[0002]在日常生活中常常出现发送者不方便说话只能通过文字发送信息，但是接收方又只能接收语音信息的情况，这时候用户通过文字转语音的技术就可以将自己编辑好的文字信息转换成语音信息发出去，但目前的文字转语音处理方法转换得到的语音信息仅仅是简单的语音合成和语音拼凑，不能将说话者语音中的感情表达出来，翻译过来的语音显的很生硬，不能将用户想表达的感情特征表现出来。本发明利用感情特征对应的特征值将输入的文字信息转换为带有相应感情特征的声音信息，丰富了输出语音的特征，还原用户想要表达的感情特征，提尚用户体验。

【发明内容】

[0003]本发明提出一种文字转语音的处理方法及系统，该方法利用感情特征对应的特征值将输入的文字信息转换为带有相应感情特征的声音信息，还原用户想要表达的感情特征。
[0004]为达此目的，本发明采用以下技术方案:
[0005]第一方面，本发明提出一种文字转语音的处理方法，包括:
[0006]获取用户输入的文字信息；
[0007]将所述文字信息转换为声音；
[0008]获取所述文字信息的感情特征，读取预存的所述感情特征对应的特征值；
[0009]利用所述特征值对所述声音进行调节，得到输出语音。
[0010]其中，获取所述文字信息的感情特征，包括；
[0011]识别所述文字信息中的关键字、得到所述关键字对应的感情特征，或
[0012]获取用户输入的对应所述文字信息的感情特征。
[0013]其中，将所述文字信息转换为声音之后，利用所述特征值对所述声音进行调节之前，还包括，对所述声音进行音色处理。
[0014]其中，对所述声音进行音色处理，包括:获取所述用户的信息，读取预存的所述用户的语音数据，从语音数据得到音色特点，使用所述音色特点对所述声音进行音色处理。
[0015]其中，使用所述音色特点对所述声音进行音色处理之前，还包括:存储所述用户的语音数据。
[0016]所述读取所述感情特征对应的特征值之前，还包括:存储感情特征对应的特征值。
[0017]其中，感情特征包括:悲伤、愤怒、充满爱、高兴；特征值包括:声音频率、音调、语速、轻重音。
[0018]第二方面，本发明提出一种文字转语音的处理系统，包括:
[0019]第一获取单元:用于获取用户输入的文字信息；
[0020]转换单元:用于将所述文字信息转换为声音；
[0021]第二获取单元:用于获取所述文字信息的感情特征，读取预存的所述感情特征对应的特征值；
[0022]感情处理单元:用于利用所述特征值对所述声音进行调节，得到输出语音。
[0023]其中，第二获取单元包括:
[0024]识别获取单元:用于识别所述文字信息中的关键字、得到所述关键字对应的感情特征；
[0025]直接获取单元:用于获取用户输入的对应所述文字信息的感情特征。
[0026]其中，还包括，音色处理单元:用于所述转换单元将所述文字信息转换为声音之后，对所述声音进行音色处理。
[0027]其中，音色处理单元包括:
[0028]第三获取单元:用于获取所述用户的信息，读取预存的所述用户的语音数据，从语音数据得到音色特点；
[0029]处理单元:用于使用所述音色特点对所述声音进行音色处理。
[0030]其中，还包括，存储单元:用于存储所述用户的语音数据和所述感情特征对应的特征值。
[0031]本发明有益效果:本发明通过获取文字信息的感情特征，利用感情特征对应的特征值将输入的文字信息转换为带有相应感情特征的声音信息，丰富了输出语音的特征；此外本发明还对转换后的语音信息进行音色处理，根据用户的语音数据提取用户的音色特点，使用该音色特点对语音信息进行音色处理，能够针对用户进行个性化的语音转换，更大程度的还原用户想要表达的感情特征，用户体验更好。
【附图说明】
[0032]图1是本发明提供的文字转语音的处理方法实施例一的方法流程图。
[0033]图2是本发明提供的文字转语音的处理方法实施例二的方法流程图。
[0034]图3是本发明提供的文字转语音的处理系统的功能模块图。
[0035]图4是本发明提供的另一种文字转语音的处理系统的功能模块图。
【具体实施方式】
[0036]以下结合附图，通过具体实施例来进一步说明本发明的技术方案。
[0037]实施例一
[0038]参考图1，一种文字转语音的处理方法，包括:
[0039]S101、获取用户输入的文字信息；自动获取用户编辑的想要发送的文字信息。
[0040]S102、将所述文字信息转换为声音。
[0041]主要利用现有的文本转语音(tts，text to speech)技术，将文字信息转换为声音，但是这一步骤仅是简单的将文字转化为声音，只是简单的语音拼凑。
[0042]S103、获取所述文字信息的感情特征，读取预存的所述感情特征对应的特征值。
[0043]对文字信息进行关键字识别，根据关键字识别出文字信息中的感情特征，感情特征包括悲伤、愤怒、充满爱、高兴等；再根据感情特征从数据库中读取预存的感情特征对应的特征值，该特征值为相应感情特征下声音的频率、语速、音调、轻重音等。
[0044]例如，对文字信息进行关键字识别，获得与高兴相关的关键字，则判断出用户想要表达的感情特征为高兴，从数据库中读取预存的感情特征为高兴的对应的声音频率、语速、音调、轻重音等对应的特征值。
[0045]为了提高感情特征的准确性，除根据关键字识别出文字信息中的感情特征之外，用户还可以手动输入想要表达的感情特征。
[0046]S104、利用所述特征值对所述声音进行调节，得到输出语音。
[0047]从数据库中可以获取不同感情特征下声音频率、语速、音调、轻重音等特征值，利用这些特征值对简单转换后得到的声音进行情感处理，最终的输出语音便带有相应的感情色彩，实现将用户的感情特征传达给接收者的目的。
[0048]例如通过上一步骤得知用户要表达的感情特征是高兴，则从数据库中提取的特征值就是高兴时声音的频率、语速、音调、轻重音等，利用这些特征值对简单转换后得到的声音进行优化，转换的声音就能表现出高兴的感情状态。
[0049]本方法通过获取文字信息的感情特征，利用感情特征对应的特征值将输入的文字信息转换为带有相应感情特征的声音信息，丰富了输出语音的特征，还原用户想要表达的感情特征，提尚用户体验。
[0050]实施例二
[0051]参考图2，本实施例提供了另一种文字转语音的处理方法，包括:
[0052]S201、获取用户输入的文字信息，自动获取用户编辑的想要发送的文字信息。
[0053]S202、将所述文字信息转换为声音。
[0054]主要利用现有的文本转语音(tts，text to speech)技术，将文字信息转换为声音，但是这一步骤仅是简单的将文字转化为声音，只是简单的语音拼凑。
[0055]S203、获取所述文字信息的感情特征，读取预存的所述感情特征对应的特征值。该步骤与S103相同，此处不再赘述。
[0056]S204、获取所述用户的信息，读取预存的所述用户的语音数据，从语音数据得到音色特点，使用所述音色特点对所述声音进行音色处理。
[0057]语音数据包括了用户的音色特点。音色特点指用户的声音特点，比如有的人声音低沉，有的人声音清亮，有的人说话时语气轻柔，有的人说话时语气急躁等都是用户的音色特点，不同的人气音色特点均不相同，且同一个用户和不同的人进行交流时表现出的音色特点也有所不同，因此需要对用户的音色特点进行采集和存储，不仅仅需要保存用户本身的音色特点还要保存用户和不同的人进行对话时的音色特点，利用这些音色特点对简单转换后的声音进行音色处理才能使变声处理更具有针对性和个性化，根据不同使用者的风格对简单转换后的声音进行音色处理。
[0058]例如妈妈发送信息给孩子时，可以得知文字信息是妈妈发送给孩子的，则此时就以数据库中保存的妈妈之前与孩子交流时的音色特点为参照，提取出相应的音色特点，利用相应的音色特点对简单转换后的声音进行音色处理，得到具有妈妈的音色特点的声音。
[0059]S205、利用所述特征值对所述声音进行调节，得到输出语音。
[0060]通过上一步骤对转换后的声音进行了音色处理，使得转换的声音具有使用者的音色特点，得到具有音色特点的声音；再根据S203中得到的感情特征对应的特征值，该特征值为相应感情特征下声音的频率、语速、音调、轻重音等。
[0061]利用这些特征值对进行了音色处理的声音再次进行情感处理，得到最终的输出语音，最终的输出语音即带有用户的音色特点又带有用户想要表达的感情特征，将用户的发送的文字信息原汁原味的还原成用户的声音信息，并带有相应的感情特征传达给接收者。
[0062]例如妈妈发送信息给孩子时，根据文字信息通关关键字识别或妈妈手动输入要表达的感情特征，判断得到妈妈想要表达的感情特征为高兴，则在数据库中提取感情特征为高兴时的特征值；其次，可以得知文字信息是妈妈发送给孩子的，则此时就从数据库中保存的妈妈之前与孩子交流时的音色特点为参照，提取出相应的音色特点，利用相应的音色特点对简单转换后的声音进行变声处理，得到具有妈妈的音色特点的声音；最后利用感情特征为高兴时的特征值对具有妈妈的音色特点的声音再次进行优化，最终将输入的文字信息原汁原味的还原成妈妈高兴时的声音作为输出语音发送给孩子。
[0063]本发明通过获取文字信息的感情特征，利用感情特征对应的特征值将输入的文字信息转换为带有相应感情特征的声音信息，丰富了输出语音的特征；此外本发明还对转换后的语音信息进行音色处理，根据用户的语音数据提取用户的音色特点，使用该音色特点对语音信息进行音色处理，能够针对用户进行个性化的语音转换，更大程度的还原用户想要表达的感情特征，用户体验更好。
[0064]实施例三
[0065]参考图3，本实施例提供了一种文字转语音的处理系统，包括:
[0066]101第一获取单元:用于获取用户输入的文字信息；通过第一获取单元自动获取用户编辑的想要发送

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王强;
技术所有人：小天才科技有限公司;
我是此专利的发明人

上一篇：一种终端控制方法、装置、语音控制装置及终端的制作方法
上一篇：声音信号处理装置及其声音信号处理方法