一种翻译文件的方法及系统的制作方法_2

文档序号：8395864阅读：来源：国知局

，存储进翻译语料库。
[0024]进一步，三种转换接口的转换过程如下:
0FFICE2007转换接口的转换过程
a)0FFICE2007文档通过Java中1包中的Zip包的输入流打开，找到其中的xml文件进行解析；
b)首先将解析的xml文件保存为临时文件，对临时文件操作错误不会对源文件数据损坏；
c)读取分段规则文件中的分段规则；
d)根据分段规则将临时文件内容进行转换为xliff格式，并保存为xliff文件；
e)保存待翻译0FFICE2007文档的框架(Skeleton)文件。
[0025]0FFICE2003转换接口的转换过程
a)0FFICE2003文档的转换必须开启OPENOFFICE服务；
b)首先通过OPEN OFFICE 服务将 DOC, XLS, PPT 转成 ODT，0DX, ODP 文件；
c)然后再通过OPENOFFICE服务将0DT，0DX, ODP文件转换为xliff文件；
d)保存待翻译0FFICE2003文档的框架(Skeleton)文件。
[0026]TEXT转换接口的转换过程
a)TEXT文档转换通过Java中的1包读取数据流对象；
b)然后通过分段规则文件对TEXT文档中的文字内容进行分段；
c)最新将分段后的文字按分段单元保存为xliff文件；
d)保存待翻译TEXT文档的框架(Skeleton)文件。
[0027]如图2所示，本发明还公开了一种翻译文件的系统，其特征在于，包括:存储服务器、转换模块、标记模块、拆分模块、翻译平台；
存储服务器，用于存储原文、分段规则文件、框架文件、译文、原文段落、译文段落；
转换模块，与存储服务器相连接，用于将原文转换为xliff文件，并被进一步划分为若干个原文段落，还用于将译文段落根据段落标记进行收集合并，并根据框架文件转换为原文格式；
标记模块，与转换模块相连接，用于对若干个原文段落进行排序标记；
拆分模块，与标记模块相连接，用于将xliff文件按照标记进行拆分；
翻译平台，分别于拆分模块、转换模块、存储服务器相连接，用于将原文段落进行分发翻译形成译文段落；
所述分段规则文件含有分段规则，用于转换待译原文；
所述分段规则，用于将xliff文件划分为若干个原文段落；
所述框架文件存有原文的格式信息。
[0028]优选地，所述存储服务器还包括翻译记忆库，所述翻译记忆库存储有若干语料。
[0029]优选地，所述语料为相互关联的原文段落与译文段落。
[0030]优选地，所述分段规则文件可自行定义。
[0031]以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在【具体实施方式】及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。
【主权项】
1.一种翻译文件的方法，其特征在于，包括: 获取待译原文和分段规则文件；所述分段规则文件中含有分段规则，用于转换待译原文；根据分段规则文件，将原文转换至Xliff文件，同时将原文的格式信息保存形成框架文件；读取分段规则文件中的分段规则，将xliff文件划分为若干个原文段落；对若干个原文段落进行排序标记；将xliff文件按照标记进行拆分；将拆分后的段落通过翻译平台进行分发翻译，形成译文段落；将译文段落根据段落标记收集合并，并根据框架文件转换为具有原文格式的译文；保存译文。
2.根据权利要求1所述的方法，其特征在于，所述分段规则文件可自行定义。
3.根据权利要求1所述的方法，其特征在于，还包括:在将原文转换至xliff文件之前，获取原文的文件类型，根据文件类型调用转换接口。
4.根据权利要求3所述的方法，其特征在于，转换接口包括0FFICE2007转换接口、0FFICE2003转换接口、TEXT转换接口。
5.根据权利要求1所述的方法，其特征在于，还包括:保存译文段落，并与对应的原文段落进行关联，形成语料，存储进翻译语料库。
6.一种翻译文件的系统，其特征在于，包括:存储服务器、转换模块、标记模块、拆分模块、翻译平台；存储服务器，用于存储原文、分段规则文件、框架文件、译文、原文段落、译文段落；转换模块，与存储服务器相连接，用于将原文转换为xliff文件，并被进一步划分为若干个原文段落，还用于将译文段落根据段落标记进行收集合并，并根据框架文件转换为原文格式；标记模块，与转换模块相连接，用于对若干个原文段落进行排序标记；拆分模块，与标记模块相连接，用于将xliff文件按照标记进行拆分；翻译平台，分别与拆分模块、转换模块、存储服务器相连接，用于将原文段落进行分发翻译形成译文段落；所述分段规则文件含有分段规则，用于转换待译原文；所述分段规则，用于将xliff文件划分为若干个原文段落；所述框架文件存有原文的格式信息。
7.根据权利要求6所述的系统，其特征在于，所述存储服务器还包括翻译记忆库，所述翻译记忆库存储有若干语料。
8.根据权利要求7所述的系统，其特征在于，所述语料为相互关联的原文段落与译文段落。
9.根据权利要求6所述的系统，其特征在于，所述分段规则文件可自行定义。
【专利摘要】本发明旨在提供一种翻译文件的方法及系统，将各式各样的文件转换为统一通用的文件格式，并拆分为若干个段落，然后把若干个段落通过翻译平台传输给各个译员翻译，收到翻译的译文段落后，转换为源文件格式的译文。本发明中的翻译文件的方法及系统，具有以下优点：将多种不同格式的文件转换成统一通用的符合xml规范的xliff格式文件，对xliff格式文件基于段落进行拆分，并且可以对段落进行标记，解决了文档拆分的难题；将文件中的各个段落分发给不同译员进行翻译，提供了工作效率，加快了翻译速度，也增强了团队协作能力。
【IPC分类】G06F17-28
【公开号】CN104714944
【申请号】CN201510173154
【发明人】江潮, 张光凌
【申请人】语联网（武汉）信息技术有限公司
【公开日】2015年6月17日
【申请日】2015年4月14日

完整全部详细技术资料下载

当前第2页1 2