一种在线辅助翻译的译文实时预览方法与流程

文档序号：21459153发布日期：2020-07-10 17:56阅读：585来源：国知局

本发明涉及计算机辅助翻译领域，特别涉及一种在线辅助翻译的译文实时预览方法。

背景技术：

当代计算机辅助翻译，需要将文字提取出来，给译者翻译成指定目标语言以后，再将译文填充回去。通常情况下，译者在翻译过程中无法在编辑器里查看翻译文件的原文和译文。传统的做法是通过文件转换的方法，将原文转换成html格式并通过浏览器渲染给翻译人员查看。但是，翻译人员在编辑过程中形成的译文是无法实时查看的。

技术实现要素：

本发明实例提供了一种自动焊接的管道自动对齐方法。为了对披露的实施例的一些方面有一个基本的理解，下面给出了简单的概括。该概括部分不是泛泛评述，也不是要确定关键／重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念，以此作为后面的详细说明的序言。

根据本发明实施例的第一方面，提供了

一种在线辅助翻译的译文实时预览方法，包括如下步骤：

将原文文件转换成html格式；

将原文解析并分句成按句划分的句段segment数组；

利用循环递归算法，将所述句段segment的中元素id埋到所述html格式文件中的子标签中，形成一一对应的关系；

通过html的dom节点来实现句段segment和html之间的联动，达到实时预览译文的效果。

优选地，所述原文文件格式是doc、docx、rtf、xls、xlsx、ppt、pptx、pdf、sxw、stw、sxc、stc。

优选地，所述将原文文件转换成html格式，具体方法为利用word自身的转换功能或者其他第三方工具进行转换。

优选地，所述将原文解析并分句成按句划分的句段segment数组，具体为将所述分句成按句划分的句段segment为单词、短语或句子。

优选地，所述句段segment数组为句段列表，记录句段segment的文本内容和对应的文本标号。

优选地，所述循环递归算法包括如下步骤：

定义atom类型的类，这个类有两个类型定义为标签tag和文本；

将句段列表中的句段segment内容定义为atom的文本，句段segment的标号定义为atom的标签tag；

算法会循环读取每个atom，根据atom的类型来判断是否放入文本池；

将文本池中的每个atom与atom的标签tag对应，最终形成一个新的带id映射的html子标签的集合。

优选地，所述类atom为自定义类。

优选地，所述每个句段segment是由一个或者多个atom组成。

优选地，所述html的子标签是由一个atom的标签tag构成。

优选地，所述句段segment和html之间的联动的方法为：将atom的标签tag嵌入到html子标签中。

本发明实例提供的技术方案可以包括以下有益效果：

本发明提供了一种算法，可以将辅助翻译中的译文实时的渲染到浏览器中，供译员查看和参考，极大的节省了翻译的时间，有着非常明显的效率提升。如图7所示，译员在翻译第181句时，能实时看到翻译后的句子在译文中的效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的在线辅助翻译的译文实时预览方法示意图；

图2是根据一示例性实施例示出的递归和循环算法的逻辑图；

图3是根据一示例性实施例示出的原文件示例图；

图4是根据一示例性实施例示出的按句划分的句段示意图；

图5是根据一示例性实施例示出的将原文文件通过文件格式转换成html示意图；

图6是根据一示例性实施例示出的标签中将transunitid嵌入示意图；

图7是根据一示例性实施例示出的译文实时预览效果图。

具体实施方式

以下描述和附图充分地示出本发明的具体实施方案，以使本领域的技术人员能够实践它们。实施例仅代表可能的变化。除非明确要求，否则单独的部件和功能是可选的，并且操作的顺序可以变化。一些实施方案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本发明的实施方案的范围包括权利要求书的整个范围，以及权利要求书的所有可获得的等同物。在本文中，各实施方案可以被单独地或总地用术语“发明”来表示，这仅仅是为了方便，并且如果事实上公开了超过一个的发明，不是要自动地限制该应用的范围为任何单个发明或发明构思。本文中，诸如第一和第二等之类的关系术语仅仅用于将一个实体或者操作与另一个实体或操作区分开来，而不要求或者暗示这些实体或操作之间存在任何实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素。本文中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的结构、产品等而言，由于其与实施例公开的部分相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

需要说明的是，尽管在附图中以特定顺序描述了本公开中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

下面结合附图及实施例对本发明做进一步描述：

如图1所示的，一种在线辅助翻译的译文实时预览方法，包括如下步骤：

s1：将原文文件转换成html格式；

s2：将原文解析并分句成按句划分的句段segment数组；

s3：利用循环递归算法，将所述句段segment的中元素id埋到html子标签中，形成一一对应的关系；

s4：通过html的dom节点来实现句段segment和html之间的联动，达到实时预览译文的效果。

根据上述方案，进一步，所述原文文件格式可以是word、excel、ppt、pdf，如图3所示，原文件为word。

在具体的实施例中，如图5所示所述文件格式转换可以利用word自身的转换功能或者其他第三方的开源工具。

根据上述方案，进一步，所述分句成按句划分的句段segment为单词或短语，如图3所示，word中有test.fast文字，被在计算机辅助翻译中会被切成两个句子，句子1：test，句子2：fast。

根据上述方案，进一步，所述句段segment数组为句段列表，记录着句段segment的文本内容和对应的文本标号，如图4所示，在代码实现的时候，我们会将两个句子定义成两个对象，segment1和segment2，transunitid：为句子标号；srcatom：为句子内容。

根据上述方案，进一步，如图2所示，在具体实施例中示出的递归和循环算法的逻辑图的示意图，具体所述循环递归算法包括如下步骤：

s31：定义atom类型的类，这个类有两个类型定义为标签tag和文本；

s32：将句段列表中的句段segment内容定义为atom的文本，句段segment的标号定义为atom的标签tag；

s33：算法会循环读取每个atom，根据atom的类型来判断是否放入文本池；

s34：将文本池中的每个atom与atom的标签tag对应，最终形成一个新的带id映射的html子标签的集合。

具体实施例中，所述类atom为自定义类，并非原有类型。

根据上述方案，进一步，所述每个句段segment是由一个或者多个atom组成。

具体实施例中，所述html的子标签是由一个atom的标签tag构成。

根据上述方案，进一步，所述句段segment和html之间的联动的实现方案为，将atom的标签tag嵌入到html子标签中，如图6所示，为了实现将句子1翻译后的内容能实时的展示在html网页中，我们需要定位到上图p标签下的第一个span标签。最简单的做法就是在标签中讲transunitid嵌入。

本发明提供的一种在线辅助翻译的译文实时预览方法，可以将辅助翻译中的译文实时的渲染到浏览器中，供译员查看和参考，极大的节省了翻译的时间，有着非常明显的效率提升。如图7所示，译员在翻译第181句时，能实时看到翻译后的句子在译文中的效果。

本发明提供了一种算法，可以将辅助翻译中的译文实时的渲染到浏览器中，供译员查看和参考，极大的节省了翻译的时间，有着非常明显的效率提升。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的流程及结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈件;张井;成延;刘旻
技术所有人：上海一者信息科技有限公司
我是此专利的发明人

上一篇：一种掘锚机一键展开和收回的控制系统和方法与流程
上一篇：用于实现内燃机的停机的方法和控制单元与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。