语音合成标记文本的处理方法及相关装置与流程

文档序号:34226936发布日期:2023-05-24 09:38阅读:82来源:国知局
语音合成标记文本的处理方法及相关装置与流程

本公开涉及语言处理,特别涉及一种语音合成标记文本的处理方法及相关装置。


背景技术:

1、汉语言作为一种有调语音,韵律特征非常复杂,对于同一个音节,出现在不同的环境下,其韵律参数都是各不相同的。因此,基于纯文本的语音合成的效果可能不尽理想,有时听起来可能不够人性化或不够自然、有时候可能很刺耳、甚至出现一些错误,比如:多音字发音错误、误读品牌名称、号码与数字读法无法区分等。

2、为了解决上述问题,在相关技术中,通过语音合成标记文本进行标记,以标注各个文字的读法,语音合成标记文本是指用于协助进行语音合成的标记文本,该语音合成标记文本中可以标记了待语音合成的文本中字词的发音、停顿、中断以及语调等内容。这样一来,在基于语音合成标记文本进行语音合成时,会对读音进行微调和调整,以使得它们听起来更加自然,纠正常见的错误发音,还可以添加诸如中断和暂停,以及加快、减慢或调整语音的高音等。

3、但是,在传统的标记工具中,语音合成标记混杂在被标记的原始文本中,由于语音合成文本可能在原始文本中无法被浏览器解析渲染,使得添加标记后的原始文本的可读性较差,且编辑过程容易出错。


技术实现思路

1、本公开提供了一种语音合成标记文本的处理方法、装置、电子设备,用于提升标记后的原始文本的可读性,降低出错率。

2、第一方面,本公开提供了一种语音合成标记文本的处理方法,包括以下步骤:

3、响应于针对文本标记界面中的原始文本触发的语音合成标记添加请求,确定与所述原始文本相对应的第一语音合成标记;

4、根据预设的标记映射关系,确定与所述第一语音合成标记相对应的第二语音合成标记;

5、针对所述原始文本添加所述第二语音合成标记,得到包含所述第二语音合成标记的第二语音合成标记文本;其中,所述第二语音合成标记文本用于在所述文本标记界面中展示;

6、将所述第二语音合成标记文本中包含的第二语音合成标记转换为对应的第一语音合成标记,得到第一语音合成标记文本;其中,所述第一语音合成标记文本用于提供给语音合成装置进行语音合成处理;第一语音合成标记基于第一标记语言实现,所述第二语音合成标记基于第二标记语言实现;其中,所述第一标记语言为浏览器不支持渲染的语言,所述第二标记语言为浏览器支持渲染的语言。

7、第二方面,本公开提供了一种语音合成标记文本的处理装置,包括:

8、确定模块,适于响应于针对文本标记界面中的原始文本触发的语音合成标记添加请求,确定与所述原始文本相对应的第一语音合成标记;

9、确定模块,还适于根据预设的标记映射关系,确定与所述第一语音合成标记相对应的第二语音合成标记;

10、添加模块,适于针对所述原始文本添加所述第二语音合成标记,得到包含所述第二语音合成标记的第二语音合成标记文本;其中,所述第二语音合成标记文本用于在所述文本标记界面中展示;

11、转换模块,适于将所述第二语音合成标记文本中包含的第二语音合成标记转换为对应的第一语音合成标记,得到第一语音合成标记文本;其中,所述第一语音合成标记文本用于提供给语音合成装置进行语音合成处理;第一语音合成标记基于第一标记语言实现,所述第二语音合成标记基于第二标记语言实现;其中,所述第一标记语言为浏览器不支持渲染的语言,所述第二标记语言为浏览器支持渲染的语言。

12、第三方面,本公开提供了一种电子设备,该电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序,一个或多个所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述方法。

13、第四方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序在被处理器/处理核执行时实现上述方法。

14、本公开所提供的实施例,预先设置了第一语音合成标记与第二语音合成标记之间的映射关系,第一语音合成标记是使用浏览器不支持渲染的第一标记语音实现的,第二语音合成标记是使用浏览器支持渲染的第二标记语音实现的。本申请实施例能够得到两种语音合成标记文本,一种是由原始文本和第一语音合成标记组成的第一语音合成标记文本,另外一种是由原始文本和第二语音合成标记组成的第二语音合成标记文本。由于第一语音合成标记是浏览器不支持渲染的,所以第一语音合成标记文本无法显示给用户看,相反的,第二语音合成标记是浏览器支持渲染的,能够显示在文本标记界面中供用户查看。第一语音合成文本提供给语音合成装置,使得语音合成装置基于此进行语音合成。

15、由此可见,该方式能够使文本标记界面中显示的与提供语音合成装置进行语音合成采用不同种类的语音合成标记文本,从而提升了原始文本的可读性,降低了编辑出错率。

16、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种语音合成标记文本的处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述第一标记语言为语音合成标记语言,所述第二标记语言为超文本标记语言。

3.根据权利要求1所述的方法,其特征在于,所述响应于针对文本标记界面中的原始文本触发的语音合成标记添加请求之前,还包括:

4.根据权利要求3所述的方法,其特征在于,所述针对所述原始文本添加所述第二标记类型的第二语音合成标记,包括:

5.根据权利要求3所述的方法,其特征在于,所述确定与所述原始文本相对应的第一语音合成标记之后,还包括:

6.根据权利要求3所述的方法,其特征在于,所述确定所述原始文本中包含的与所述文本选择操作相对应的目标标注文本之后,还包括:

7.根据权利要求1所述的方法,其特征在于,所述将所述第二语音合成标记文本中包含的第二语音合成标记转换为对应的第一语音合成标记,包括:

8.一种语音合成标记文本的处理装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序在被处理器执行时实现如权利要求1-7中任一项所述的方法。


技术总结
本公开提供了一种语音合成标记文本的处理方法及相关装置,该方法包括:确定与语音合成标记添加请求相对应的第一语音合成标记;确定与第一语音合成标记相对应的第二语音合成标记;针对原始文本添加第二语音合成标记,得到包含第二语音合成标记的第二语音合成标记文本;其中,第二语音合成标记文本用于在文本标记界面中展示;将第二语音合成标记文本中包含的第二语音合成标记转换为对应的第一语音合成标记,得到第一语音合成标记文本;其中,第一语音合成标记文本用于提供给语音合成装置进行语音合成处理。该方式能够提升标记后的原始文本的可读性,降低出错率。

技术研发人员:叶启松,郭剑霓,吴海英,郭江,刘磊
受保护的技术使用者:马上消费金融股份有限公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1