一种文本转语音处理的标记方法及装置与流程

文档序号:31049876发布日期:2022-08-06 06:39阅读:102来源:国知局
一种文本转语音处理的标记方法及装置与流程

1.本发明涉及语音转录技术领域,尤其涉及一种文本转语音处理的标记方法及装置。


背景技术:

2.在文本合成语音音频软件中,可通过添加文本读音和韵律标记提高合成语音的准确率和自然度。
3.现有技术标记方法的文本的标记图标可以进行删除、点击后可弹出弹窗或下拉菜单,但这种标记不可选中和复制。用户需要在不同位置添加相同标记时,必须再次点击功能图标,进而在下拉菜单中进行选择操作、或在弹窗进行输入操作。由此现有技术的标记过程操作步骤过于繁杂,标记效率低下。


技术实现要素:

4.本发明实施例提供一种文本转语音处理的标记方法及装置,用以提出一种标记的复制功能,极大提高标记效率。
5.本发明实施例提供一种文本转语音处理的标记方法,包括:提供多个标记菜单项,每一个标记菜单项具有一类功能的标记工具;选中第一目标文本,并基于标记菜单项对选中的所述第一目标文本添加对应功能的标记;提供临时标记区域;获取在对所述第一目标文本添加目标标记后的复制指令,以将所述目标标记暂存至所述临时标记区域;在第二目标文本被选中的情况下,基于所述临时标记区域,与所述第二目标文本相关联地呈现所述目标标记,以在获取到用户的确认指令后,将所述目标标记赋予所述第二目标文本。
6.可选的,与所述第二目标文本相关联地呈现所述目标标记是通过标记弹窗实现的;在所述标记弹窗被关闭,或者,为所述第二目标文本赋予的标记与所述临时标记区域中的目标标记不同,或者,对所述第二目标文本的操作与所述临时标记区域中的目标标记对应的前提操作不一致的情况下,在所述第二目标文本之后文本被选中后,不进行标记弹窗。
7.可选的,还包括:在第三目标文本被选中后,获取对所述临时标记区域的选中指令,以将所述临时标记区域中的目标标记赋予所述第三目标文本。
8.可选的,多个标记菜单项至少包括:停顿标记、连读标记、多音字标记、局部音量标记、重读标记、别名标记。
9.可选的,多个标记菜单项中的至少部分提供有对应的自定义功能。
10.可选的,对选中的所述第一目标文本添加对应功能的标记后,还包括:获取对所述第一目标文本的标记的点击操作,以修改所述第一目标文本的标记。
11.可选的,还包括:基于所述第一目标文本的标记相关联地提供删除键,以基于所述删除键删除对应的标记。
12.本技术还提出一种文本转语音处理的标记装置,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被处理器执行时实现前述的文本转语音处理的标记方法的步骤。
13.本技术还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述的文本转语音处理的标记方法的步骤。
14.本发明实施例提供多个标记菜单项,并提供临时标记区域,由此通过该临时标记区域暂存用户期望复制的标记,从而实现标记复制,通过这样的方式极大减少了标记过程中的交互频次,提高了文本转语音过程中的标记效率。
15.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
16.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1为本技术实施例的标记方法的基本流程图;图2为本技术实施例的标记复制示例;图3为本技术实施例基于临时标记区域实现标记粘贴的示例;图4为本技术实施例标记弹窗被关闭后的状态示例。
具体实施方式
17.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
18.语音合成软件主要用于将文本合成为音频,但目前机器语音合成效果的准确率和自然度仍有不足,所以需要添加各种文本读音标记及韵律调整标记来改善合成效果,如在文本中添加“别名”“多音字”“停顿”、“连读”、“重读”、“局部变速”、“局部音量”等。
19.本发明实施例提供一种文本转语音处理的标记方法,如图1所示,包括:在步骤s101中,提供多个标记菜单项,每一个标记菜单项具有一类功能的标记工具。文本标记用于改善机器合成语音时不正确的发音或不自然的停顿等韵律问题。具体的参见图2所示,在一些示例中,多个标记菜单项至少包括:停顿标记、连读标记、多音字标记、局部音量标记、重读标记、别名标记。
20.在步骤s102中,选中第一目标文本,并基于标记菜单项对选中的所述第一目标文本添加对应功能的标记。在实际使用过程中,用户可以点击某个标记菜单项,则可以执行对应功能的标记,例如点击多音字标记,则可以为选定的文本设置一个读音,其他的标记工具的用法类似,在此不做一一列举。
21.在步骤s103中,提供临时标记区域。具体参见图2中的“临时标记”,图2中的临时标记区域内没有标记。
22.在步骤s104中,获取在对所述第一目标文本添加目标标记后的复制指令,以将所述目标标记暂存至所述临时标记区域。参见图2以及图3,例如在图2中执行对标记“0.9x”的复制动作后,将该标记“0.9x”暂存至所述临时标记区域,由此可以基于所述临时标记区域,实现对临时标记区域中的标记进行粘贴。具体的复制动作可以通过鼠标右键或者快捷键ctrl+c完成。
23.在步骤s105中,在第二目标文本被选中的情况下,基于所述临时标记区域,与所述第二目标文本相关联地呈现所述目标标记,以在获取到用户的确认指令后,将所述目标标记赋予所述第二目标文本。本示例中所指的第二目标文本可以是文字顺序上,原文本段中在第一目标文本之后的文本,图3示出了一种基于临时标记实现标记粘贴的示例,例如在第二文本被选中后,可以与被选中的文本进行关联呈现临时标记区域中的标记,例如图3中的“0.9x”。通过这样的方式,用户在需要连续使用同样的标记的情况下,可以基于临时标记区域实现标记的复制,从而极大提高文本转语音过程中添加标记的效率。
24.本发明实施例提供多个标记菜单项,并提供临时标记区域,由此通过该临时标记区域暂存用户期望复制的标记,从而实现标记复制,通过这样的方式极大减少了标记过程中的交互频次,提高了文本转语音过程中的标记效率。
25.可选的,与所述第二目标文本相关联地呈现所述目标标记是通过标记弹窗实现的。例如图3中光标附近自动弹出被复制的标记图标“0.9x”,点击悬浮图标可进行标记粘贴,点击后该弹窗后实现粘贴标记,且此弹窗消失。
26.在所述标记弹窗被关闭,或者,为所述第二目标文本赋予的标记与所述临时标记区域中的目标标记不同,又或者对所述第二目标文本的操作(选中文本区域或光标定位)与所述临时标记区域中的目标标记对应的前提操作不一致的情况下,在第二目标文本之后文本被选中后,不再进行标记弹窗。
27.具体的,例如图4中,在后的文本段“从此我们的深情不被辜负”这其中在先目标文本“从此”基于标记弹窗实现粘贴标记“0.9x”后,用户弹窗中的“x”关闭标记弹窗,由此在后的目标文本“深情”则不进行弹窗。在另一些示例中,例如用户为“深情”赋予了与“0.9x”不同的另一个标记,则不执行弹窗。又或者用户未选中文本,而是在文本中进行了鼠标点击操作,则不执行弹窗。
28.在另一些示例中,在对所述第二目标文本的操作与所述临时标记区域中的目标标记对应的前提操作不一致的情况下,在第二目标文本之后文本被选中后,不再进行标记弹窗。本示例中所指的所述临时标记区域中的目标标记对应的前提操作,可以是例如多音字标记功能是必须选中单个字,然后点击“多音字”标记,此时选中单个字的操作可以作为多音字标记的前提操作。停顿是需要鼠标点击文中某个位置进行光标定位,然后点击“停顿”标记,此时光标定位可以作为“停顿”标记的前提操作。通过这样的方式能够更加贴合于用
户的使用场景,从而通过标记弹窗能够在合适的时机出现,从而提高用户的标记效率。
29.在一些实施例中,还包括:在第三目标文本被选中后,获取对所述临时标记区域的选中指令,以将所述临时标记区域中的目标标记赋予所述第三目标文本。具体的,如图4所示,例如在前述标记弹窗被关闭后,此时临时标记区域依然暂存有标记“0.9x”,在后续执行标记的过程中,用户可以点击临时标记区域,从而调出临时标记区域中的标记,并赋予选中的第三目标文本。
30.在一些实施例中,多个标记菜单项中的至少部分提供有对应的自定义功能。
31.可通过在本文中滑选文本内容或光标定位后点击工具栏图标,可直接生成标记或需要在下拉菜单中选择、在输入框中输入、使用滑动条调节到理想数值等。
32.具体的停顿标记:在文本中插入停顿标记时,以光标定位到文本中的某个位置,点击“停顿”标记菜单项,在弹出的下拉菜单中选择“自定义”“无停顿”“0.05s”“0.1s”“0.15s”“0.2s”或输入框中输入自定义停顿时长,即可完成插入停顿标记。
33.连读标记:滑选部分文本(两字以上)后,点击“连读”标记菜单项,文本中随即出现连读标记。
34.多音字标记:滑选单个文字,点击“多音字”标记菜单项,在下拉菜单中选择系统提供的拼音,或在输入框中输入自定义拼音。
35.局部音量标记:选中需要调整音量的文本,点击“局部音量”标记菜单项,在滑动条调整音量至理想数值,或在输入框中输入自定义数值后点击“确定”按钮。
36.在一些实施例中,对选中的所述第一目标文本添加对应功能的标记后,还包括:获取对所述第一目标文本的标记的点击操作,以修改所述第一目标文本的标记。在一些实施例中,还包括:基于所述第一目标文本的标记相关联地提供删除键,以基于所述删除键删除对应的标记。具体的,标记生成后可点击文本中的标记进行修改。点击标记中的删除按钮即可删除标记。
37.本实施例的方法可以快速复制标记,并智能识别想要粘贴标记的动作,提示用户粘贴刚才的标记。保存最近一次复制的标记至临时标记区域,用户可直接点击使用,减少操作多个相同标记的时间,提高文本标记的操作效率,提高文本语音合成效率。
38.本技术还提出一种文本转语音处理的标记装置,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被处理器执行时实现前述的文本转语音处理的标记方法的步骤。
39.本技术还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述的文本转语音处理的标记方法的步骤。
40.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
41.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
42.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下
前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
43.上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1