文本转换音频的方法及装置、电子设备、计算机可读存储介质与流程

文档序号：34227026发布日期：2023-05-24 09:44阅读：107来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本公开涉及计算机，特别涉及一种文本转换音频的方法及装置、电子设备、计算机可读存储介质。

背景技术：

1、语音通信是指接收到用户输入的信息之后，人机互动系统以音频的方式向用户呈现响应信息的通信模式。其中，人机互动系统获得音频响应信息的一种实现方式包括：获得响应信息对应的文本，进而，直接将响应信息对应的文本完整的转换为音频。

2、而这种文本转换音频的方式，若文本的字符数相对较多，那么，转换速度相对较慢。在一些场景中，例如，人机互动系统面向多个用户端的场景，该转换方式将成为通信性能的瓶颈。

技术实现思路

1、本公开提供一种文本转换音频的方法及装置、电子设备、计算机可读存储介质。

2、第一方面，本公开提供了一种文本转换音频的方法，该方法包括：

3、获取待转换文本；

4、处理所述待转换文本得到子文本集；

5、确定所述子文本集中包含的至少一个待转换子文本，所述至少一个待转换子文本包括所述子文本集中包含业务信息的子文本，以及所述子文本集中在预设的数据库中未检测到的子文本，所述数据库包括若干历史音频以及相应子文本的对应关系；

6、分别将所述至少一个待转换子文本转换为音频，其中，在所述至少一个待转换子文本的数量大于或者等于预设阈值的情况下，并行转换各个待转换子文本；

7、基于所述子文本集中各个子文本对应的音频得到所述待转换文本的音频。

8、第二方面，本公开提供了一种文本转换音频的装置，该文本转换音频的装置包括：

9、获取模块，用于获取待转换文本；

10、处理模块，用于处理所述待转换文本得到子文本集；

11、确定模块，用于确定所述子文本集中包含的至少一个待转换子文本，所述至少一个待转换子文本包括所述子文本集中包含业务信息的子文本，以及所述子文本集中在预设的数据库中未检测到的子文本，所述数据库包括若干历史音频以及相应子文本的对应关系；

12、转换模块，用于分别将所述至少一个待转换子文本转换为音频，其中，在所述至少一个待转换子文本的数量大于或者等于预设阈值的情况下，并行转换各个待转换子文本；

13、所述确定模块，还用于基于所述子文本集中各个子文本对应的音频得到所述待转换文本的音频。

14、第三方面，本公开提供了一种电子设备，该电子设备包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序，所述一个或多个计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述的文本转换音频的方法。

15、第四方面，本公开提供了一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序在被处理器执行时实现上述的文本转换音频的方法。

16、第五方面，本公开提供了一种计算机程序或计算机程序产品，该计算机程序产品包括计算机程序，计算机程序存储在计算机可读存储介质中，所述计算机程序在被处理器执行时实现上述的文本转换音频的方法。

17、本公开所提供的实施例，在将所获取的待转换文本处理得到子文本集之后，进一步从该子文本集中筛选出包含业务信息的子文本和预设数据库中未检测到的子文本，之后，将所筛选出的子文本作为至少一个待转换子文本，进而将至少一个待转换子文本转换为音频。其中，预设数据库包括若干历史音频以及相应子文本的对应关系，也就是说，预设数据库中维护了已经转换为音频的子文本及相应音频。而包含业务信息的子文本可以是待转换文本中与用户的情况灵活匹配且应当向用户展示的部分子文本。基于此，将至少一个待转换子文本转换为音频，不但无需转换完整的待转换文本，仅需转换待转换文本中的部分子文本，不仅能够减少需转换为音频的文本的量，还能够提高文本转换为音频的效率。由于所转换的部分子文本包括目前并未转换为音频的子文本，以及需要向用户展示的子文本，所以，本公开实施例在转换该完整待转换文本的一部分的基础上，还能够有针对性的转换待转换文本中部分子文本，以提高所转换的子文本的精确程度。进一步的，本公开中，如果待转换子文本大于或者等于两个，本公开的实施例还可以并行转换各个待转换子文本，从而能够进一步提高文本转换为音频的效率。这样在待转换文本的字符数相对较多的场景下，依然可以提高文本转换成语音的效率，能够突破面向多用户场景的性能瓶颈，提高转换的响应速度。

18、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种文本转换音频的方法，其特征在于，包括：

2.根据权利要求1所述的文本转换音频的方法，其特征在于，所述处理所述待转换文本得到子文本集，包括：

3.根据权利要求1所述的文本转换音频的方法，其特征在于，所述处理所述待转换文本得到子文本集，包括：

4.根据权利要求2或3所述的文本转换音频的方法，其特征在于，所述预设拆分规则为：

5.根据权利要求2或3所述的文本转换音频的方法，其特征在于，所述业务属性包括待补充信息位、金额、日期，针对所述至少一个业务信息中的每个业务信息，按照相应的业务属性将该业务信息变更为文本信息，包括：

6.根据权利要求1所述的文本转换音频的方法，其特征在于，在得到至少一个待转换子文本之后，还包括：

7.根据权利要求6所述的文本转换音频的方法，其特征在于，还包括：

8.一种文本转换音频的装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括：

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序在被处理器执行时实现如权利要求1-7中任一项所述的文本转换音频的方法。

技术总结
本公开提供了一种文本转换音频的方法及装置、电子设备、计算机可读介质，该方法包括：获取待转换文本；处理所述待转换文本得到子文本集；确定子文本集中包含的至少一个待转换子文本，至少一个待转换子文本包括子文本集中包含业务信息的子文本，以及子文本集中在预设的数据库中未检测到的子文本；分别将所述至少一个待转换子文本转换为音频；基于所述子文本集中各个子文本对应的音频得到所述待转换文本的音频。根据本公开的实施例能够减少需转换为音频的文本的量，提高文本转换为音频的效率，从而能够突破面向多用户场景的性能瓶颈，提高转换的响应速度。

技术研发人员：夏福森,蒋宁,吴海英,刘磊,杨锋,杨砚
受保护的技术使用者：马上消费金融股份有限公司
技术研发日：
技术公布日：2024/1/12

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：夏福森蒋宁吴海英刘磊杨锋杨砚
技术所有人：马上消费金融股份有限公司
我是此专利的发明人