文本分段方法、装置、芯片、电子设备及介质与流程

文档序号:36245648发布日期:2023-12-02 11:14阅读:38来源:国知局
文本分段方法、装置、芯片、电子设备及介质与流程

本技术涉及电子设备,特别涉及一种文本分段方法、装置、芯片、电子设备及介质。


背景技术:

1、通常情况下,人们说话的速度高于打字写字的速度,为提高书写效率,可以通过语音文本转换功能,将人们说话的语音转换为相应文本。

2、目前,用户输入的语音转换成文本后是一段连续的文本,影响用户的阅读体验。如此有必要提供一种文本分段方法。


技术实现思路

1、本技术实施例提供了一种文本分段方法、装置、芯片、电子设备及介质,能够对语音转换得到的文本进行分段。

2、第一方面,本技术实施例提供一种文本分段方法,包括:在存在对应第一文本的至少一个第二文本待分段的情况下,根据至少一个第二文本和第一文本,获取目标文本特征和目标语音特征;其中,第一文本对应的第一语音为语音段中的任一句语音,至少一个第二文本一一对应于语音段中的在第一语音之前的至少一句语音,且至少一句语音和第一语音在语音段中依次相邻;根据目标文本特征和目标语音特征,确定是否需要在至少一个第二文本和第一文本之间分段;在需要在至少一个第二文本和第一文本之间分段的情况下,在至少一个第二文本和第一文本之间进行分段。

3、根据第一文本及相应的一个或多个待分段文本,来确定文本特征和语音特征,并根据确定出的文本特征和语音特征进行文本分段处理,如此可以实现对文本的准确分段。

4、一个实施例中,在至少一个第二文本和第一文本之间进行分段之后,文本分段方法还包括:通过第一段落展示至少一个第二文本,且通过第二段落展示第一文本;其中,第一段落为已结束分段的段落,第二段落为未结束分段的段落。

5、若判断出第一文本与其对应的至少一个第二文本分属不同段落,则可以进行分段展示,这一展示内容通常与实际分段需求保持一致,如此可便于用户实时查看到分段展示出的语音识别文本,可提升用户阅读体验。

6、一个实施例中,文本分段方法还包括:在无需在至少一个第二文本和第一文本之间分段的情况下,确定第一文本待分段;通过第一段落展示至少一个第二文本和第一文本,其中,第一段落为未结束分段的段落。

7、若判断出第一文本与其对应的至少一个第二文本归属同一段落,则可以不进行分段展示,而是通过同一段落进行展示,这一展示内容通常与实际分段需求保持一致,如此可便于用户实时查看到通过同一段落展示出的语音识别文本,可提升用户阅读体验。

8、一个实施例中,文本分段方法还包括:展示电子设备的第一应用,第一应用包括语音输入控件;获取经语音输入控件输入的第一语音;对第一语音进行语音文本转换处理,得到第一文本。

9、通过文本特征和语音特征进行语音识别文本的文本分段处理,可以解决语音输入文本的分段展示问题,从而提升了语音输入场景下的文本展示效果。

10、一个实施例中,目标文本特征包括第一特征值,第一特征值根据至少一个第二文本得到;根据目标文本特征和目标语音特征,确定是否需要在至少一个第二文本和第一文本之间分段,包括:根据第一映射关系,将第一特征值映射为第一值,其中,第一映射关系使得预设阈值区间基于第一映射关系能够被映射至概率函数的横轴上的指定区间;以第一值作为概率函数的横坐标值,根据概率函数获得对应第一值的纵坐标值,作为第一概率值;根据第一概率值,确定是否需要在至少一个第二文本和第一文本之间分段。

11、先基于一定的映射关系对第一特征值进行映射,再使用映射出的值和概率函数来计算文本分段概率。如此可使得文本分段概率与实际分段需求相一致,从而可实现文本的准确分段,提升用户阅读体验。

12、一个实施例中,根据第一概率值,确定是否需要在至少一个第二文本和第一文本之间分段,包括:在概率函数的纵坐标值区间内,生成随机值;在随机值小于第一概率值的情况下,确定需要在至少一个第二文本和第一文本之间分段;在随机值大于第一概率值的情况下,确定无需在至少一个第二文本和第一文本之间分段。

13、基于生成第一概率值的概率函数,通过在概率函数的纵坐标值区间内生成随机值,以生成的随机值来模拟第一概率值所指示的分段概率,从而可以实现以相应概率进行分段的效果。如此,可以具有分段顺滑效果。

14、一个实施例中,根据目标文本特征和目标语音特征,确定是否需要在至少一个第二文本和第一文本之间分段,包括:根据目标时间间隔、预设最小间隔阈值和预设最大间隔阈值,以及根据目标语速波动率、预设最小波动率阈值和预设最大波动率阈值,确定是否需要在至少一个第二文本和第一文本之间分段;其中,目标时间间隔为第一语音与语音段中的第一语音的前一句语音之间的时间间隔,目标语速波动率为第一文本对应的语速与至少一个第二文本对应的语速的绝对差值除以至少一个第二文本对应的语速所得到的数值。

15、基于第一文本的目标时间间隔、目标语速波动率这些语音特征,可以实现对文本分段与否的准确判断。

16、一个实施例中,根据目标文本特征和目标语音特征,确定是否需要在至少一个第二文本和第一文本之间分段,包括:根据第一文本中的关键词、预设的关键词白名单和预设的关键词黑名单,以及根据至少一个第二文本的总文本长度、预设最小长度阈值、预设居中长度阈值和预设最大长度阈值,以及根据至少一个第二文本的总分句数量、预设最小数量阈值、预设居中数量阈值和预设最大数量阈值,确定是否需要在至少一个第二文本和第一文本之间分段;其中,关键词白名单包括对应分段的关键词,关键词黑名单包括对应不分段的关键词。

17、基于第一文本中的关键词、至少一个第二文本的总文本长度、至少一个第二文本的总分句数量这些文本特征,可以实现对文本分段与否的准确判断。

18、第二方面,本技术实施例提供一种文本分段装置,包括:获取模块,用于在存在对应第一文本的至少一个第二文本待分段的情况下,根据至少一个第二文本和第一文本,获取目标文本特征和目标语音特征;其中,第一文本对应的第一语音为语音段中的任一句语音,至少一个第二文本一一对应于语音段中的在第一语音之前的至少一句语音,且至少一句语音和第一语音在语音段中依次相邻;确定模块,用于根据目标文本特征和目标语音特征,确定是否需要在至少一个第二文本和第一文本之间分段;处理模块,用于在需要在至少一个第二文本和第一文本之间分段的情况下,在至少一个第二文本和第一文本之间进行分段。

19、第三方面,本技术实施例提供一种电子芯片,包括:处理器,其用于执行存储在存储器上的计算机程序指令,其中,当计算机程序指令被处理器执行时,触发电子芯片执行如第一方面中任一项的方法。

20、第四方面,本技术实施例提供一种电子设备,电子设备包括用于存储计算机程序指令的存储器、用于执行计算机程序指令的处理器和通信装置,其中,当计算机程序指令被该处理器执行时,触发电子设备执行如第一方面中任一项的方法。

21、第五方面,本技术实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行如第一方面中任一项的方法。

22、第六方面,本技术实施例提供一种计算机程序产品,计算机程序产品包括计算机程序,当计算机程序在计算机上运行时,使得计算机执行如第一方面中任一项的方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1