一种翻译文件的方法及系统的制作方法_2

文档序号:8395864阅读:来源:国知局
,存储进翻译语料库。
[0024]进一步,三种转换接口的转换过程如下:
0FFICE2007转换接口的转换过程
a)0FFICE2007文档通过Java中1包中的Zip包的输入流打开,找到其中的xml文件进行解析;
b)首先将解析的xml文件保存为临时文件,对临时文件操作错误不会对源文件数据损坏;
c)读取分段规则文件中的分段规则;
d)根据分段规则将临时文件内容进行转换为xliff格式,并保存为xliff文件;
e)保存待翻译0FFICE2007文档的框架(Skeleton)文件。
[0025]0FFICE2003转换接口的转换过程
a)0FFICE2003文档的转换必须开启OPENOFFICE服务;
b)首先通过OPEN OFFICE 服务将 DOC, XLS, PPT 转成 ODT,0DX, ODP 文件;
c)然后再通过OPENOFFICE服务将0DT,0DX, ODP文件转换为xliff文件;
d)保存待翻译0FFICE2003文档的框架(Skeleton)文件。
[0026]TEXT转换接口的转换过程
a)TEXT文档转换通过Java中的1包读取数据流对象;
b)然后通过分段规则文件对TEXT文档中的文字内容进行分段;
c)最新将分段后的文字按分段单元保存为xliff文件;
d)保存待翻译TEXT文档的框架(Skeleton)文件。
[0027]如图2所示,本发明还公开了一种翻译文件的系统,其特征在于,包括:存储服务器、转换模块、标记模块、拆分模块、翻译平台;
存储服务器,用于存储原文、分段规则文件、框架文件、译文、原文段落、译文段落;
转换模块,与存储服务器相连接,用于将原文转换为xliff文件,并被进一步划分为若干个原文段落,还用于将译文段落根据段落标记进行收集合并,并根据框架文件转换为原文格式;
标记模块,与转换模块相连接,用于对若干个原文段落进行排序标记;
拆分模块,与标记模块相连接,用于将xliff文件按照标记进行拆分;
翻译平台,分别于拆分模块、转换模块、存储服务器相连接,用于将原文段落进行分发翻译形成译文段落;
所述分段规则文件含有分段规则,用于转换待译原文;
所述分段规则,用于将xliff文件划分为若干个原文段落;
所述框架文件存有原文的格式信息。
[0028]优选地,所述存储服务器还包括翻译记忆库,所述翻译记忆库存储有若干语料。
[0029]优选地,所述语料为相互关联的原文段落与译文段落。
[0030]优选地,所述分段规则文件可自行定义。
[0031]以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在【具体实施方式】及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
【主权项】
1.一种翻译文件的方法,其特征在于,包括: 获取待译原文和分段规则文件; 所述分段规则文件中含有分段规则,用于转换待译原文; 根据分段规则文件,将原文转换至Xliff文件,同时将原文的格式信息保存形成框架文件; 读取分段规则文件中的分段规则,将xliff文件划分为若干个原文段落; 对若干个原文段落进行排序标记; 将xliff文件按照标记进行拆分; 将拆分后的段落通过翻译平台进行分发翻译,形成译文段落; 将译文段落根据段落标记收集合并,并根据框架文件转换为具有原文格式的译文; 保存译文。
2.根据权利要求1所述的方法,其特征在于,所述分段规则文件可自行定义。
3.根据权利要求1所述的方法,其特征在于,还包括:在将原文转换至xliff文件之前,获取原文的文件类型,根据文件类型调用转换接口。
4.根据权利要求3所述的方法,其特征在于,转换接口包括0FFICE2007转换接口、0FFICE2003转换接口、TEXT转换接口。
5.根据权利要求1所述的方法,其特征在于,还包括:保存译文段落,并与对应的原文段落进行关联,形成语料,存储进翻译语料库。
6.一种翻译文件的系统,其特征在于,包括:存储服务器、转换模块、标记模块、拆分模块、翻译平台; 存储服务器,用于存储原文、分段规则文件、框架文件、译文、原文段落、译文段落; 转换模块,与存储服务器相连接,用于将原文转换为xliff文件,并被进一步划分为若干个原文段落,还用于将译文段落根据段落标记进行收集合并,并根据框架文件转换为原文格式; 标记模块,与转换模块相连接,用于对若干个原文段落进行排序标记; 拆分模块,与标记模块相连接,用于将xliff文件按照标记进行拆分; 翻译平台,分别与拆分模块、转换模块、存储服务器相连接,用于将原文段落进行分发翻译形成译文段落; 所述分段规则文件含有分段规则,用于转换待译原文; 所述分段规则,用于将xliff文件划分为若干个原文段落; 所述框架文件存有原文的格式信息。
7.根据权利要求6所述的系统,其特征在于,所述存储服务器还包括翻译记忆库,所述翻译记忆库存储有若干语料。
8.根据权利要求7所述的系统,其特征在于,所述语料为相互关联的原文段落与译文段落。
9.根据权利要求6所述的系统,其特征在于,所述分段规则文件可自行定义。
【专利摘要】本发明旨在提供一种翻译文件的方法及系统,将各式各样的文件转换为统一通用的文件格式,并拆分为若干个段落,然后把若干个段落通过翻译平台传输给各个译员翻译,收到翻译的译文段落后,转换为源文件格式的译文。本发明中的翻译文件的方法及系统,具有以下优点:将多种不同格式的文件转换成统一通用的符合xml规范的xliff格式文件,对xliff格式文件基于段落进行拆分,并且可以对段落进行标记,解决了文档拆分的难题;将文件中的各个段落分发给不同译员进行翻译,提供了工作效率,加快了翻译速度,也增强了团队协作能力。
【IPC分类】G06F17-28
【公开号】CN104714944
【申请号】CN201510173154
【发明人】江潮, 张光凌
【申请人】语联网(武汉)信息技术有限公司
【公开日】2015年6月17日
【申请日】2015年4月14日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1