一种翻译文件的方法及系统的制作方法

文档序号:8395864阅读:385来源:国知局
一种翻译文件的方法及系统的制作方法
【技术领域】
[0001]本发明涉及一种计算机领域,具体而言,涉及一种翻译文件的方法及系统。
【背景技术】
[0002]随着软件开发技术和计算机辅助翻译的飞速发展,迫切需要将各式各样的文件转换为统一通用的文件格式,这种文件格式便于将文件的分解、组合、传输和逆转换。但是本地文件格式繁多,比如:Word文件、Excel文件、Ppt文件、HTML文件、XML文件等等,XML本地化数据交换格式(Xliff)成为首选。XLIFF是由软件开发商、本地化服务提供商、本地化工具提供商等团体共同倡议和设计,由OASIS标准组织发布的用于本地化数据交换的格式标准。它基于XML技术制定软件资源文件格式的转换规格,其目的在于提高软件的本地化作业效率。
[0003]XLIFF是一种存储抽取的文本并且在本地化多个处理过程进行数据传递的格式规范。它的基本原理是从源文件中抽取出相关的文本数据,并对这些抽取出来的文本数据进行处理,然后再与源文件中不需要处理的数据合并成与源文件相同的格式文件。源文件经过抽取后,那些不需要处理的文件信息保存在框架(Skeleton)文件中,框架文件独立存在。还原文件时,将保存文本数据的xliff文件和框架文件还原成和源文件相同格式的文件。
[0004]

【发明内容】

[0005]本发明旨在提供一种翻译文件的方法及系统,将各式各样的文件转换为统一通用的文件格式,并拆分为若干个段落,然后把若干个段落通过翻译平台传输给各个译员翻译,收到翻译的译文段落后,转换为源文件格式的译文。
[0006]本发明公开了一种翻译文件的方法,其特征在于,包括:
获取待译原文和分段规则文件;
所述分段规则文件中含有分段规则,用于转换待译原文;
根据分段规则文件,将原文转换至xliff文件,同时将原文的格式信息保存形成框架文件;
读取分段规则文件中的分段规则,将xliff文件划分为若干个原文段落;
对若干个原文段落进行排序标记;
将xliff文件按照标记进行拆分;
将拆分后的段落进行分发翻译,形成译文段落;
将译文段落根据段落标记收集合并,并根据框架文件转换为具有原文格式的译文;保存译文。
[0007]进一步,所述分段规则文件可自行定义。
[0008]进一步,还包括:在将原文转换至xliff文件之前,获取原文的文件类型,根据文件类型调用转换接口。
[0009]进一步,转换接口包括0FFICE2007转换接口、0FFICE2003转换接口、TEXT转换接
□O
[0010]进一步,还包括:保存译文段落,并与对应的原文段落进行关联,形成语料,存储进翻译语料库。
[0011]本发明还公开了一种翻译文件的系统,其特征在于,包括:存储服务器、转换模块、标记模块、拆分模块、翻译平台;
存储服务器,用于存储原文、分段规则文件、框架文件、译文、原文段落、译文段落;
转换模块,与存储服务器相连接,用于将原文转换为Xliff文件,并被进一步划分为若干个原文段落,还用于将译文段落根据段落标记进行收集合并,并根据框架文件转换为原文格式;
标记模块,与转换模块相连接,用于对若干个原文段落进行排序标记;
拆分模块,与标记模块相连接,用于将Xliff文件按照标记进行拆分;
翻译平台,分别于拆分模块、转换模块、存储服务器相连接,用于将原文段落进行分发翻译形成译文段落;
所述分段规则文件含有分段规则,用于转换待译原文;
所述分段规则,用于将Xliff文件划分为若干个原文段落;
所述框架文件存有原文的格式信息。
[0012]优选地,所述存储服务器还包括翻译记忆库,所述翻译记忆库存储有若干语料。
[0013]优选地,所述语料为相互关联的原文段落与译文段落。
[0014]优选地,所述分段规则文件可自行定义。
[0015]本发明中的翻译文件的方法及系统,具有以下优点:
1、将多种不同格式的文件转换成统一通用的符合Xml规范的xliff格式文件;
2、对xliff格式文件基于段落进行拆分,并且可以对段落进行标记,解决了文档拆分的难题;
3、拆分时保存了原文格式信息到框架(Skeleton)文件;
4、将文件中的各个段落分发给不同译员进行翻译,提供了工作效率,加快了翻译速度,也增强了团队协作能力;
5、对译员提交的翻译文件具有记忆功能,并能保存句子、术语及其对应的译文;
6、还原文件时,根据xliff文件和框架文件进行还原,保持了原文的格式。
[0016]
【附图说明】
[0017]此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定,在附图中:
图1示出了一种翻译文件的方法的流程图;
图2示出了一种翻译文件的系统的结构图。
【具体实施方式】
[0018]下面将参考附图并结合实施例,来详细说明本发明。
[0019]本如图1所示,本发明公开了一种翻译文件的方法,其特征在于,包括:
获取待译原文和分段规则文件;
所述分段规则文件中含有分段规则,用于转换待译原文;
根据分段规则文件,将原文转换至xliff文件,同时将原文的格式信息保存形成框架文件;
读取分段规则文件中的分段规则,将xliff文件划分为若干个原文段落;
对若干个原文段落进行排序标记;
将xliff文件按照标记进行拆分;
将拆分后的段落进行分发翻译,形成译文段落;
将译文段落根据段落标记收集合并,并根据框架文件转换为具有原文格式的译文;保存译文。
[0020]进一步,所述分段规则文件可自行定义。
[0021]进一步,还包括:在将原文转换至xliff文件之前,获取原文的文件类型,根据文件类型调用转换接口。
[0022]进一步,转换接口包括0FFICE2007转换接口、0FFICE2003转换接口、TEXT转换接
□O
[0023]进一步,还包括:保存译文段落,并与对应的原文段落进行关联,形成语料
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1