文本处理方法、装置、设备、介质及程序产品与流程

文档序号:32482432发布日期:2022-12-09 23:28阅读:79来源:国知局
文本处理方法、装置、设备、介质及程序产品与流程

1.本公开涉及计算机技术领域,尤其涉及一种文本处理方法、文本处理装置、电子设备、计算机可读存储介质及计算机程序产品。


背景技术:

2.在文档编辑过程中,可以将文档内容处理为富文本格式,以提示文档阅读用户关注格式特殊处理后的文档内容,使用户高效的获取文档中的重点信息。
3.随着文档编辑产品功能的日益丰富,可以对文档中的内容进行翻译,相关技术中,对于需要翻译的目标文本,若目标文本为富文本格式,可以忽略目标文本的富文本格式,直接获得译文文本;或者,可以在翻译目标文本内容的过程中,在译文文本中也保留目标文本的富文本格式。
4.但是,相关技术中提供的文档处理技术,在目标文本被翻译后,得到的保留有富文本格式的译文文本,通常与富文本格式的目标文本不对应,导致译文文本不能精准的保留目标文本的富文本格式,影响用户的阅读体验。


技术实现要素:

5.本公开提供一种文本处理方法、装置、设备、介质及程序产品,以至少解决相关技术中译文文本中富文本格式的保留位置不精准的问题。本公开的技术方案如下:
6.根据本公开实施例的第一方面,提供一种文本处理方法,其特征在于,包括:
7.获取待翻译的目标文本,所述目标文本中包含目标字位,所述目标字位的文本格式为富文本格式;
8.根据所述目标文本确定包含所述目标字位的目标词语,以及所述目标词语的译文词语;
9.若确定所述目标词语包括多个字位,则根据所述目标字位在所述目标词语中的位置区间,以及所述目标字位的富文本格式信息,显示所述目标词语的译文词语。
10.可选的,所述根据所述目标字位在所述目标词语中的位置区间,以及所述目标字位的富文本格式信息,显示所述目标词语的译文词语,包括:
11.确定所述目标字位在所述目标词语中的位置区间;
12.将所述目标词语的译文词语中处于所述位置区间的译文字位,确定为所述目标字位的目标译文字位;
13.在显示所述目标词语的译文词语时,按照所述富文本格式信息显示所述目标译文字位。
14.可选的,所述确定所述目标字位在所述目标词语中的位置区间,包括:
15.确定所述目标词语中的第一字位总数量,以及所述目标字位在所述目标词语中的目标位置序号;
16.根据所述目标位置序号和所述第一字位总数量,确定起始端点信息和结束端点信
息;
17.组合所述起始端点信息和所述结束端点信息,得到所述目标字位在所述目标词语中的位置区间。
18.可选的,所述目标字位的数量包括一个,所述根据所述目标位置序号和所述第一字位总数量,确定起始端点信息和结束端点信息,包括:
19.确定所述目标位置序号和参考值的差值,并确定所述差值和所述第一字位总数量的比值,得到所述位置区间的起始端点信息;
20.确定所述目标位置序号和所述第一字位总数量的比值,得到所述位置区间的结束端点信息。
21.可选的,所述目标字位的数量包括相邻的多个,所述根据所述目标位置序号和所述第一字位总数量,确定起始端点信息和结束端点信息,包括:
22.确定相邻的多个所述目标字位中,最小目标位置序号和所述第一字位总数量的比值,得到所述位置区间的起始端点信息;
23.确定相邻的多个所述目标字位中,最大目标位置序号和所述第一字位总数量的比值,得到所述位置区间的结束端点信息。
24.可选的,所述将所述目标词语的译文词语中处于所述位置区间的译文字位,确定为所述目标字位的目标译文字位,包括:
25.确定所述目标词语的译文词语的第二字位总数量;
26.确定所述位置区间的起始端点信息和所述第二字位总数量的乘积,得到目标译文字位的初始字位序号;
27.确定所述位置区间的结束端点信息和所述第二字位总数量的乘积,得到目标译文字位的结束字位序号;
28.将所述目标词语的译文词语中,与所述初始字位序号、所述结束字位序号,以及所述初始字位序号和所述结束字位序号之间的字位序号对应的译文字位,确定为所述目标词语的目标译文字位。
29.可选的,所述方法还包括:
30.若所述目标词语包括一个字位,则根据所述目标字位的富文本格式信息,显示所述目标词语的译文词语。
31.根据本公开实施例的第二方面,提供一种文本处理装置,包括:
32.获取模块,被配置为获取待翻译的目标文本,所述目标文本中包含目标字位,所述目标字位的文本格式为富文本格式;
33.第一确定模块,被配置为根据所述目标文本确定包含所述目标字位的目标词语,以及所述目标词语的译文词语;
34.第一显示控制模块,被配置为若确定所述目标词语包括多个字位,则根据所述目标字位在所述目标词语中的位置区间,以及所述目标字位的富文本格式信息,显示所述目标词语的译文词语。
35.可选的,第一显示控制模块,被配置为:
36.确定所述目标字位在所述目标词语中的位置区间;
37.将所述目标词语的译文词语中处于所述位置区间的译文字位,确定为所述目标字
位的目标译文字位;
38.在显示所述目标词语的译文词语时,按照所述富文本格式信息显示所述目标译文字位。
39.可选的,第一显示控制模块,被配置为:
40.确定所述目标词语中的第一字位总数量,以及所述目标字位在所述目标词语中的目标位置序号;
41.根据所述目标位置序号和所述第一字位总数量,确定起始端点信息和结束端点信息;
42.组合所述起始端点信息和所述结束端点信息,得到所述目标字位在所述目标词语中的位置区间。
43.可选的,第一显示控制模块,被配置为:
44.确定所述目标位置序号和参考值的差值,并确定所述差值和所述第一字位总数量的比值,得到所述位置区间的起始端点信息;
45.确定所述目标位置序号和所述第一字位总数量的比值,得到所述位置区间的结束端点信息。
46.可选的,第一显示控制模块,被配置为:
47.确定相邻的多个所述目标字位中,最小目标位置序号和所述第一字位总数量的比值,得到所述位置区间的起始端点信息;
48.确定相邻的多个所述目标字位中,最大目标位置序号和所述第一字位总数量的比值,得到所述位置区间的结束端点信息。
49.可选的,第一显示控制模块,被配置为:
50.确定所述目标词语的译文词语的第二字位总数量;
51.确定所述位置区间的起始端点信息和所述第二字位总数量的乘积,得到目标译文字位的初始字位序号;
52.确定所述位置区间的结束端点信息和所述第二字位总数量的乘积,得到目标译文字位的结束字位序号;
53.将所述目标词语的译文词语中,与所述初始字位序号、所述结束字位序号,以及所述初始字位序号和所述结束字位序号之间的字位序号对应的译文字位,确定为所述目标词语的目标译文字位。
54.可选的,所述装置还包括,第二显示控制模块,被配置为:
55.若所述目标词语包括一个字位,则根据所述目标字位的富文本格式信息,显示所述目标词语的译文词语。
56.根据本公开实施例的第三方面,提供一种电子设备,包括:
57.处理器;
58.用于存储所述处理器可执行指令的存储器;
59.其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的文本处理方法。
60.根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面所述
的文本处理方法。
61.根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的文本处理方法。
62.本公开的实施例提供的技术方案至少带来以下有益效果:
63.本公开实施例提供的文本处理方法、装置、设备、介质及程序产品,在待翻译的目标文本的译文文本中,可以实现字位级别的富文本格式保留,提升译文文本中保留的富文本格式位置的精准度;避免出现在译文文本中的无关位置保留富文本格式,减少对用户阅读译文文本造成干扰,便于用户快速获取有用信息,提升用户的信息获取效率。
64.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
65.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
66.图1是根据一示例性实施例示出的一种文本处理系统的的示意性架构图;
67.图2是根据一示例性实施例示出的一种文本处理方法的流程图;
68.图3是根据一示例性实施例示出的一种文档编辑界面的示意图;
69.图4是根据一示例性实施例示出的一种显示目标词语的译文词语的流程图;
70.图5是根据一示例性实施例示出的另一种文档编辑界面的示意图;
71.图6是根据一示例性实施例示出的又一种文档编辑界面的示意图;
72.图7是根据一示例性实施例示出的一种文本处理装置的示意图。
73.图8是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
74.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
75.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
76.相关技术中,可编辑富文本格式文档的文档编辑产品,例如,在线文档编辑器和web 文档编辑器,也可以对文档内容进行翻译。若待翻译的目标文本中包括富文本格式的文本内容,文档编辑产品可以在词组或者词语级别上,让目标文本的译文文本保留目标文本中的富文本格式。
77.其中,若目标文本中,包括富文本格式的文本内容在字位上,文档编辑产品会在包含该字位的词语或者词组的译文词语或者词组中保留富文本格式,导致译文文本中保留的富文本格式的精准度不高,不利于用户高效的获取有用信息,影响用户的阅读体验。
78.例如,目标文本为词语“你好”,其中字位“好”的富文本格式为加粗,相关技术中,“你好”翻译后的译文词语为“hello”,其中,整个译文词语均保留有字位“好”的富文本格式:加粗。
79.鉴于上述问题,本公开的示例性实施方式提供一种文本处理方法,该文本处理方法的应用场景包括但不限于:在可编辑富文本格式文档的文档编辑产品中,在获取到待翻译的目标文本后,若确定目标文本中包含富文本格式的目标字位,则确定目标字位的富文本格式信息;根据目标文本确定包含目标字位的目标词语,以及目标词语的译文词语;若确定目标词语包括多个字位,则根据目标字位在目标词语中的位置区间,以及目标字位的富文本格式信息,显示目标词语的译文词语。可以在字位级别上保留富文本格式,提升译文文本中富文本格式保留位置的精准度。
80.在一种可选的实施方式中,终端设备的文本翻译功能需要文本翻译服务方支持,为了实现上述文本处理方法,本公开的示例性实施方式提供一种文本处理系统。图1示出了该文本处理系统的示意性架构图。如图1所示,文本处理系统100可以包括服务器110与终端设备120。其中,服务器110文本翻译服务方部署的后台服务器。终端设备120是安装有可编辑富文本格式文档的文档编辑产品的终端设备,更具体地,终端设备可以是如智能手机、个人电脑、平板电脑等。服务器110与终端设备120可以通过网络建立连接,实现文本处理。
81.应当理解,服务器110可以是一台服务器,也可以是多台服务器形成的集群,本公开对于服务器110的具体架构不做限定。
82.其中,终端设备120可以获取待翻译的目标文本,目标文本中包含目标字位,目标字位的文本格式为富文本格式;并将目标文本以及目标字位发送至服务器110,服务器110 可以根据目标文本确定包含目标字位的目标词语,以及目标词语的译文词语;并将目标文本的译文文本、目标词语,以及目标词语的译文词语返回至终端设备110,若终端设备110 确定目标词语包括多个字位,则根据目标字位在目标词语中的位置区间,以及目标字位的富文本格式信息,显示目标词语的译文词语。
83.在一种可选的实施方式中,终端设备的文本翻译功能可以自行实现,则终端设备可以单独实现本公开实施例中提供的文本处理方法。
84.图2是根据一示例性实施例示出的一种文本处理方法的流程图,文本处理方法可以应用于终端设备中,如图2所示,包括以下步骤s201至步骤s203。
85.步骤s201,获取待翻译的目标文本;
86.在本公开实施例中,目标文本中包含目标字位,目标字位的文本格式为富文本格式。
87.步骤s202,根据目标文本确定包含目标字位的目标词语,以及目标词语的译文词语;
88.步骤s203,若确定目标词语包括多个字位,则根据目标字位在目标词语中的位置区间,以及目标字位的富文本格式信息,显示目标词语的译文词语。
89.综上所述,本公开实施例提供的文本处理方法,对于待翻译的目标文本;根据目标文本确定包含目标字位的目标词语,以及目标词语的译文词语;若确定目标词语包括多个字位,则根据目标字位在目标词语中的位置区间,以及目标字位的富文本格式信息,显示目标词语的译文词语。在待翻译的目标文本的译文文本中,可以实现字位级别的富文本格式
保留,提升译文文本中保留的富文本格式位置的精准度;避免出现在译文文本中的无关位置保留富文本格式,减少对用户阅读译文文本造成干扰,便于用户快速获取有用信息,提升用户的信息获取效率。
90.下面对图2中的每个步骤进行具体说明:
91.在步骤s201中,终端设备可以获取待翻译的目标文本。
92.在本公开实施例中,终端设备中可以运行可编辑富文本格式文档的文档编辑产品,在文档编辑产品的运行过程中,终端设备可以显示文档编辑界面;进一步的,终端设备可以响应于文本翻译操作,获取待翻译的文本内容。如图3所示,图3为终端设备中显示的一种文档编辑界面的示意图,其中,文档编辑界面包括功能控件显示区域301和文档编辑区域302,功能控件显示区域用于显示文档编辑过程中可实现相应功能的控件,例如,保存控件、翻译控件、打印控件或格式修改控件等;文档编辑区域302用于供用户编辑文本内容。
93.其中,在文本内容编辑过程中,终端设备可以响应于对当前正在编辑的文本内容中任一字位被设置为富文本格式,在文本内容的存储位置中,存储文本内容中被设置为富文本格式字位的富文本格式类型。其中,字位为最小的有意义书写符号单位;例如英文中每个字母,或者中文的每个汉字。
94.在一种可选的实施方式中,终端设备获取待翻译的目标文本的过程可以包括:获取待翻译的文本内容,对文本内容进行扫描,确定文本内容是否包含富文本格式的目标字位;若确定文本内容中不包含富文本格式的目标字位,则直接确定文本内容的译文文本,并显示译文文本,结束流程;若确定文本内容中包含富文本格式的目标字位,则确定目标字位的富文本格式信息,并将文本内容确定为目标文本。其中,目标字位的富文本格式信息包括目标字位的富文本格式类型,或者,目标字位的富文本格式信息包括目标字位的富文本格式类型,以及目标字位在文本内容所有字位中的位置信息。其中,富文本格式类型可以为加粗、斜体、加下划线、字体颜色、字体背景颜色或者字体字号等。
95.在一种可选的实施方式中,待翻译的文本内容可以为文档编辑区域中的所有文本内容,则终端设备获获取待翻译的文本内容可以包括:响应于对功能控件显示区域中翻译控件的触发操作,将文档编辑区域中的所有文本内容确定为待翻译的文本内容。其中,触发操作可以包括点击操作或者触控操作等,本公开实施例对此不作限定。
96.在一种可选的实施方式中,待翻译的文本内容可以为文档编编辑区域的部分文本内容,则终端设备获取待翻译的文本内容的过程可以包括:响应于对部分文本内容的选中操作,在被选中文本内容的预设位置,显示针对被选中文档的多个功能控件,该多个功能控件中包括翻译控件;进一步的,终端设备可以响应于对翻译控件的触发操作,将被选中本文内容确定为待翻译的文本内容。
97.在一种可选的实施方式中,目标文本中包含一个字位,则终端设备确定目标字位的富文本格式信息的过程可以包括:在文本内容的存储位置查找目标文本的富文本格式类型,得到目标字位的富文本格式信息。
98.在一种可选的实施方式中,目标文本中包含多个字位,则终端设备确定目标字位的富文本格式信息的过程可以包括:在文本内容的存储位置查找目标文本中目标字位的富文本格式类型,并确定目标字位在目标文本中的位置信息,得到目标字位的富文本格式信息。
99.在步骤s202中,终端设备可以根据目标文本确定包含目标字位的目标词语,以及目标词语的译文词语。
100.在本公开实施例中,词语由至少一个字位组成,可以传达一定的语义信息。如词语“课本”由字位“课”和“本”组成,表示教学用书籍;如“ice cream”由字位“i”、“c”、“e”、“c”、“r”、“e”、“a”以及“m”组成,表示一种冷冻的甜品。目标词语为目标文本中,包含目标字位且可以传达特定语义信息的词语。
101.在一种可选的实施方式中,终端设备可以独立进行文本翻译,则终端设备可以根据目标文本确定包含目标字位的目标词语,以及目标词语的译文词语。
102.可选的,目标文本中包含一个字位,则终端设备根据目标文本确定包含目标字位的目标词语,以及目标词语的译文词语的过程可以包括:将目标文本输入预先训练的文本翻译模型中,确定目标文本为目标词语,对目标词语进行翻译,得到目标文本的译文文本,并确定目标词语,以及目标词语的译文词语之间的映射关系。其中,文本翻译模型可以为自然语言处理(natural language processing,nlp)模型,或者机器学习(machine learning, ml)模型
103.可选的,目标文本中包含多个字位,则终端设备根据目标文本确定包含目标字位的目标词语,以及目标词语的译文词语的过程可以包括:终端设备根据目标文本和目标字位的富文本格式信息,确定包含目标字位的目标词语,以及目标词语的译文词语。目标字位的富文本格式信息包括目标字位的富文本格式类型,以及目标字位在目标文本中的位置信息。
104.其中,终端设备根据目标文本和目标字位的富文本格式信息,确定包含目标字位的目标词语,以及目标词语的译文词语的过程包括:将目标文本输入预先训练的文本翻译模型中,对目标文本进行分词,以获得至少一个词语,并根据目标字位在目标文本中的位置信息,确定包含目标字位的目标词语;进一步的,终端设备可以对每个词语进行翻译得到译文词语,将译文词语进行组合,得到目标文本的译文文本。其中,对于目标词语,在获取到目标词语的译文词语后,可以生成目标词语,以及目标词语的译文词语的映射关系。
105.在一种可选的实施方式中,终端设备需要借助文本翻译服务方进行文本翻译,则终端设备根据目标文本确定包含目标字位的目标词语,以及目标词语的译文词语的过程可以包括:终端设备可以向文本翻译服务方发送文本翻译请求,若目标文本中包含一个字位,则文本翻译请求中包括目标文本,若目标文本中包含一个字位,则文本翻译请求中包括目标文本以及目标字位的富文本格式信息。可以理解的是,文本翻译服务方可以响应于文本翻译请求,根据目标文本确定包含目标字位的目标词语,以及目标词语的译文词语,并返回目标文本的译文信息。译文信息中可以包括目标文本的译文文本,还可以包括目标词语,以及目标词语的译文词语的映射关系。
106.需要说明的是,文本翻译服务方根据目标文本确定包含目标字位的目标词语,以及目标词语的译文词语的过程,可以参考上述终端设备根据目标文本确定包含目标字位的目标词语,以及目标词语的译文词语的过程,本公开实施例对此不作赘述。
107.在上述步骤s203中,若终端设备确定目标词语包括多个字位,则根据目标字位在目标词语中的位置区间,以及目标字位的富文本格式信息,显示目标词语的译文词语。
108.在本公开实施例中,目标词语包括多个字位时,对于目标词语的译文词语,仅需在
与目标字符对应的位置区域,保留富文本格式,实现字位级别的富文本格式保留机制。
109.在一种可选的实施方式中,如图4所示,终端设备根据目标字位在目标词语中的位置区间,以及目标字位的富文本格式信息,显示目标词语的译文词语的过程可以包括步骤 s401至步骤s403:
110.步骤s401,确定目标字位在目标词语中的位置区间。
111.在本公开实施例中,目标字位在目标词语中的位置区间为目标字位在目标词语中占的位置区域。
112.在一种可选的实施方式中,终端设备确定目标字位在目标词语中的位置区间的过程包括:确定目标词语中的第一字位总数量,以及目标字位在目标词语中的目标位置序号;根据目标位置序号和第一字位总数量,确定起始端点信息和结束端点信息;组合起始端点信息和结束端点信息,得到目标字位在目标词语中的位置区间。可以目标字位的在目标词语中的位置序号,以及目标词语的字位总数量,精准的得到目标字位在目标词语中的位置区间。
113.在一种可选的实施方式中,目标字位的数量包括一个,终端设备根据目标位置序号和第一字位总数量,确定起始端点信息和结束端点信息的过程可以包括:确定目标位置序号和参考值的差值,并确定差值和第一字位总数量的比值,得到位置区间的起始端点信息;确定目标位置序号和第一字位总数量的比值,得到位置区间的结束端点信息。其中参考值为1。可以在目标字位的数量为一个时,根据目标字位的在目标词语中的位置序号,以及目标词语的字位总数量,对目标字位在目标词语中的位置区域进行归一化处理,精准的得到目标字位在目标词语中的位置区间。
114.示例的,若目标词语为“你好”,目标字位为“你”,其中,目标词语中的第一字位总数量为2,目标字位为“你”在目标词语“你好”中的目标位置序号为1,则确定目标位置序号1与参考值1的差值为0,确定差值0和第一字位总数量2的比值,得到位置区间的起始端点信息为0;确定目标位置序号1与第一字位总数量2的比值,得到位置区间的结束端点信息为1/2。
115.在一种可选的实施方式中,目标字位的数量包括相邻的多个,终端设备根据目标位置序号和第一字位总数量,确定起始端点信息和结束端点信息的过程可以包括:确定相邻的多个目标字位中,最小目标位置序号和第一字位总数量的比值,得到位置区间的起始端点信息;确定相邻的多个目标字位中,最大目标位置序号和第一字位总数量的比值,得到位置区间的结束端点信息。可以在目标字位的数量为相邻的多个时,根据多个目标字位的中的最小字位序号和最大字位序号,以及目标词语的字位总数量,对目标字位在目标词语中的位置区域进行归一化处理,精准的得到目标字位在目标词语中的位置区间。
116.示例的,若目标词语为“服务器”,目标字位包括“务”和“器”,其中,目标词语中的第一字位总数量为3,目标字位为“务”在目标词语“服务器”中的目标位置序号为 2,目标字位为“器”在目标词语“服务器”中的目标位置序号为3,则确定目标字位“务”的目标位置序号2和第一字位总数量3的比值,得到位置区间的起始端点信息为1/3,确定目标字位“器”的目标位置序号3和第一字位总数量3的比值,得到位置区间的结束端点信息为1。
117.步骤s402,将目标词语的译文词语中处于位置区间的译文字位,确定为目标字位的目标译文字位;
118.在本公开实施例中,目标字位的目标译文字位为需要保留富文本格式的译文字位。
119.在一种可选的实施方式中,终端设备将目标词语的译文词语中处于位置区间的译文字位,确定为目标字位的目标译文字位的过程可以包括:确定目标词语的译文词语的第二字位总数量;确定位置区间的起始端点信息和第二字位总数量的乘积,得到目标译文字位的初始字位序号;确定位置区间的结束端点信息和第二字位总数量的乘积,得到目标译文字位的结束字位序号;将目标词语的译文词语中,与初始字位序号、结束字位序号,以及初始字位序号和结束字位序号之间的字位序号对应的译文字位,确定为目标词语的目标译文字位。可以根据目标字位在目标词语中的位置区间,在目标词语的译文词语中,确定需要保留富文本格式的译文字位,实现字位级别的富文本格式的精准保留。
120.示例的,若目标词语为“你好”,目标字位为“你”,其中,目标字位在目标词语中的位置区间【0,1/2】,目标词语“你好”的译文词语为“hello”,则终端设备可以确定译文词语为“hello”的第二字位总数量为5,确定位置区间的起始端点信息0和第二字位总数量5的乘积,得到目标译文字位的初始字位序号为0;确定位置区间的结束端点信息 1/2和第二字位总数量5的乘积,得到目标译文字位的结束字位序号为3;将目标词语的译文词语中,与初始字位序号0、结束字位序号3,以及初始字位序号和结束字位序号之间的字位序号1和2对应的译文字位,确定为目标词语的目标译文字位“hel”。需要说明的是,字位序号为整数,若目标译文字位的开始或者结束字位序号为小数,可以进行取整处理,取整方式可以基于实际需要确定,本公开实施例对此不作限定。例如,四舍五入或者取整数部分。
121.步骤s403,在显示目标词语的译文词语时,按照富文本格式信息显示目标译文字位。
122.在本公开实施例中,目标译文字位的富文本格式与目标字位的富文本格式一致。
123.在一种可选的实施方式中,终端设备在显示目标词语的译文词语时,可以按照富文本格式信息显示目标译文字位。可以在目标文本的显示过程中,对于包含多个字位的目标词语,将目标字位在目标词语中的位置区间,确定为目标词语的译文词语中需要保留富文本格式的位置区间,并在显示目标词语的译文词语的过程中,在位置区间对应的译文字符中保留富文本格式,实现译文文本中字符级别的富文本格式信息的精准显示。
124.示例的,若目标词语为“你好”,目标字位为“你”,富文本格式信息中富文本格式类型为“加粗”,目标词语的目标译文字位为“hel”,则显示的目标词语的译文词语为“目标词语的目标译文字位“hello”。
125.在一种可选的实施方式中,若目标词语包括一个字位,则根据目标字位的富文本格式信息,显示目标词语的译文词语。可以在目标文本的显示过程中,对于包含一个字位的目标词语,直接在目标词语的译文词语中保留目标字位的富文本格式,实现译文文本中字符级别的富文本格式信息的快速处理。
126.示例的,如图5所示,图5示出了终端设备中显示的一种文档编辑界面的示意图,其中,终端设备响应于文本翻译操作,确定待翻译的目标文本为文档编辑区域302中显示的“你好,世界”,并确定目标字位“你”的富文本格式信息为富文本格式类型“加粗”,以及目标字位“你”在目标文本中的位置1,确定目标字位“世”的富文本格式信息为“加粗”,以及目标字位“世”在目标文本中的位置3。并对目标文本进行分词,以获得两个词语“你好”和“世
界”,并根据目标字位的位置信息,确定两个目标词语“你好”和“世界”,分别对词语进行翻译,得到译文词语,其中,目标词语“你好”的译文词语为“hello”,目标词语“世界”的译文词语为“world”。
127.进一步的,由于两个目标词语均包括两个字位,则对于目标词语“你好”,可以确定目标字位“你”在目标词语中的位置区间为【0,1/2】,将目标词语“你好”的译文词语“hello”中处于位置区间的译文字位“hel”,确定为目标字位的目标译文字位;类似的,对于目标词语“世界”,可以确定目标字位“世”在目标词语中的位置区间为【0,1/2】,将目标词语“世界”的译文词语“world”中处于位置区间的译文字位“wor”,确定为目标字位的目标译文字位。
128.最后,在显示目标文本的译文文本时,显示目标词语“你好”的译文词语“world”时,将目标译文字位“hel”加粗显示,则译文词语“hello”显示为“hello”,显示目标词语“世界”的译文词语“world”时,将目标译文字位“wor”加粗显示,则译文词语“world”显示为“world”,如图6所示。
129.图7是根据一示例性实施例示出的一种文本处理装置的示意图,如图7所示,文本处理装置700,包括:
130.获取模块701,被配置为获取待翻译的目标文本;
131.确定模块702,被配置为根据目标文本确定包含目标字位的目标词语,以及目标词语的译文词语;
132.第一显示控制模块703,被配置为若确定目标词语包括多个字位,则根据目标字位在目标词语中的位置区间,以及目标字位的富文本格式信息,显示目标词语的译文词语。
133.可选的,第一显示控制模块703,被配置为:
134.确定目标字位在目标词语中的位置区间;
135.将目标词语的译文词语中处于位置区间的译文字位,确定为目标字位的目标译文字位;
136.在显示目标词语的译文词语时,按照富文本格式信息显示目标译文字位。
137.可选的,第一显示控制模块703,被配置为:
138.确定目标词语中的第一字位总数量,以及目标字位在目标词语中的目标位置序号;
139.根据目标位置序号和第一字位总数量,确定起始端点信息和结束端点信息;
140.组合起始端点信息和结束端点信息,得到目标字位在目标词语中的位置区间。
141.可选的,第一显示控制模块703,被配置为:
142.确定目标位置序号和参考值的差值,并确定差值和第一字位总数量的比值,得到位置区间的起始端点信息;
143.确定目标位置序号和第一字位总数量的比值,得到位置区间的结束端点信息。
144.可选的,第一显示控制模块703,被配置为:
145.确定相邻的多个目标字位中,最小目标位置序号和第一字位总数量的比值,得到位置区间的起始端点信息;
146.确定相邻的多个目标字位中,最大目标位置序号和第一字位总数量的比值,得到位置区间的结束端点信息。
147.可选的,第一显示控制模块703,被配置为:
148.确定目标词语的译文词语的第二字位总数量;
149.确定位置区间的起始端点信息和第二字位总数量的乘积,得到目标译文字位的初始字位序号;
150.确定位置区间的结束端点信息和第二字位总数量的乘积,得到目标译文字位的结束字位序号;
151.将目标词语的译文词语中,与初始字位序号、结束字位序号,以及初始字位序号和结束字位序号之间的字位序号对应的译文字位,确定为目标词语的目标译文字位。
152.可选的,装置还包括,第二显示控制模块704,被配置为:
153.若目标词语包括一个字位,则根据目标字位的富文本格式信息,显示目标词语的译文词语。
154.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
155.本公开的示例性实施方式还提供了一种电子设备,可以是终端设备。下面参考图8 对该电子设备进行说明。应当理解,图8显示的电子设备800仅仅是一个示例,不应对本公开实施方式的功能和使用范围带来任何限制。
156.如图8所示,电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于:至少一个处理单元810、至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830。
157.其中,存储单元存储有程序代码,程序代码可以被处理单元810执行,使得处理单元810执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元810可以执行如图2所示的方法步骤等。
158.存储单元820可以包括易失性存储单元,例如随机存取存储单元(ram)821和/或高速缓存存储单元822,还可以进一步包括只读存储单元(rom)823。
159.存储单元820还可以包括具有一组(至少一个)程序模块825的程序/实用工具824,这样的程序模块825包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
160.总线830可以包括数据总线、地址总线和控制总线。
161.电子设备800也可以与一个或多个外部设备900(例如键盘、指向设备、蓝牙设备等) 通信,这种通信可以通过输入/输出(i/o)接口840进行。电子设备800还可以通过网络适配器850与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器850通过总线830与电子设备800的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备800使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
162.应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的示例性实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
163.所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或
程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施方式。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施方式仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
164.另外,本公开还提供一种计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如上述实施例所提供的文本处理方法。
165.另外,本公开还提供一种计算机程序产品,包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行如上述实施例所提供的文本处理方法。
166.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
167.应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1