一种对交付前双语文件状态快速检查的系统及方法与流程

文档序号:31472756发布日期:2022-09-09 23:40阅读:128来源:国知局
一种对交付前双语文件状态快速检查的系统及方法与流程

1.本发明属于本地化工程处理技术领域,尤其涉及一种对交付前双语文件状态快速检查的系统及方法。


背景技术:

2.trados是一款翻译辅助软件,其承载翻译内容原文和译文的文件我们叫双语文件,后缀名为sdlxliff,是一种xml结构的纯文本文件。每部分原文(通常是一句)和对应译文构成一个句段,每个句段可以设置句段状态,有表示翻译进度的7种状态(未翻译、草稿、已翻译、翻译被否决、翻译被核准、签发被拒绝、已签发),有限制编辑的(锁定),有表示应用过机器翻译的(at标记,at是automatic translation的缩写)。在翻译过程中,译员会严格遵守句段状态使用规范,比如翻译完的句段就用“已翻译”状态,校对完的句段就用“翻译被核准”状态。在本地化工程处理时需要对一批双语文件进行状态检查,比如是否都是“已翻译”状态,是否有应用过机器翻译,是否有“锁定”句段,然后工程人员才能根据状态检查结果判断出当前翻译进度,来决定下一步的操作,比如发现有机器翻译痕迹或表示译文未确认的句段状态时,要和校对人员确认译文是否可用。没有任何表示未确认译文句段状态的文件我们来生成最终译文的版本,用于下一阶段的处理,比如校对、排版、交付客户、
……
。可以看到句段状态的统计结果在文件的处理流程中起着重要的作用,因为它决定了下一步的操作。在文件数量很多的项目中,句段状态检查结果的统计效率就是一个十分值得关注的问题了。
3.传统的句段状态统计方法,是将后缀名为sdlxliff的双语文件导回到对应的trados项目中(没有项目的要新建项目),通过(批处理)中的(翻译统计)来显示一批文件的句段状态。打开文件,通过at标记筛选功能,才能知道是否有机器翻译痕迹的句段。检查锁定句段也可以通过筛选功能来实现,还可以通过分析文件,在分析报告中显示锁定句段的数量。可以看到trados虽然提供了检查句段状态、锁定状态、机器翻译痕迹的方法,但想要通过一步得到三种结果是不可以的,然而在工程处理时这三种结果又是正确文件处理的关键依据所在,所以这个矛盾就是痛点,操作不便且效率低下,遇到文件数量多的项目,这种效率差别将会更加明显。


技术实现要素:

4.为解决上述技术问题,本发明提出了一种对交付前双语文件状态快速检查的方法及系统,能够提升交付前双语文件状态检查效率。
5.一方面为实现上述目的,本发明提供了一种对交付前双语文件状态快速检查的系统,包括:获取模块、累加模块和输出模块;
6.所述获取模块用于获取待检查文件信息;
7.所述累加模块用于对所述待检查文件信息进行分类累加整理;
8.所述输出模块用于对分类累加整理的结果进行输出展示,完成对交付前双语文件
状态的检查。
9.可选地,所述待检查文件信息包括:标签句段状态、锁定状态、机器翻译痕迹和语言对信息。
10.可选地,对所述标签句段状态进行累加整理的过程为:
11.遍历待检查文件的所有句段,获得每个句段对应的标签句段状态,并在每个所述标签句段状态对应的结果数量上加1;
12.将所有对应的所述结果数量进行求和,获得标签句段状态的句段数量。
13.可选地,对所述锁定状态进行累加整理的过程为:
14.遍历待检查文件的所有句段,获得每个句段对应的锁定状态,并在所述锁定状态对应的结果数量上加1;
15.将所有对应的所述结果数量进行求和,获得锁定状态的句段数量。
16.可选地,对所述机器翻译痕迹进行累加整理的过程为:
17.遍历待检查文件的所有句段,获得每个句段对应的机器翻译痕迹状态,并在所述机器翻译痕迹状态对应的结果数量上加1;
18.将所有对应的所述结果数量进行求和,获得机器翻译痕迹状态的句段数量。
19.可选地,对所述语言对信息进行累加整理的过程为:
20.利用xml结构解析属性,获得新语言对信息;
21.将所述新语言对信息与现有语言对信息进行比对,
22.若所述新语言对信息与所述现有语言对信息相同,则在所述现有语言对信息对应的结果数量上加1;
23.若所述新语言对信息与所述现有语言对信息不相同,则创建所述新语言对信息对应的条目,并在对应的结果数量上加1;
24.将所有对应的所述结果数量进行求和,获得语言对信息的句段数量。
25.另一方面为实现上述目的,本发明提供了一种对交付前双语文件状态快速检查的方法,包括以下步骤:
26.获取待检查文件信息;
27.对所述待检查文件信息进行分类累加整理;
28.对分类累加整理的结果进行输出展示,完成对交付前双语文件状态的检查。
29.可选地,所述待检查文件信息包括:标签句段状态、锁定状态、机器翻译痕迹和语言对信息。
30.与现有技术相比,本发明具有如下优点和技术效果:
31.1.提升句段信息统计效率:不再局限于传统的统计要分多步骤的鼠标点来点去,而是输入双语文件路径,一键统计。
32.2.实用性:统计支持子文件夹和多语种混合的文件,将句段状态、锁定状态、机器翻译的at标记整合到一个界面上,使工程处理人员能够直观的了解文件进度,做出下一步的处理决策。
33.3.易于操作:对于没有专业操作经验的人员来说,也可以轻松使用本发明得到统计结果。
附图说明
34.构成本技术的一部分的附图用来提供对本技术的进一步理解,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
35.图1为本发明实施例一的一种对交付前双语文件状态快速检查的系统结构示意图;
36.图2为本发明实施例二的一种对交付前双语文件状态快速检查的方法流程示意图。
具体实施方式
37.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
38.需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
39.实施例一
40.如图1所示,本发明提供一种对交付前双语文件状态快速检查的系统,包括:获取模块、累加模块和输出模块;
41.获取模块用于获取待检查文件信息:
42.进一步地,将要检查的双语文件放到一个文件夹下,可以有子文件夹(支持遍历子文件夹),双语文件可以是不同语言对的(支持不同的语言对一起检查),比如文件夹下既有英语翻简体中文的也有英语翻法语的双语文件。然后遍历根文件夹及所有子文件夹,将其包含的双语文件完整路径输出到待检查的文件列表中。然后利用xml解析技术获取双语文件4种信息,所述4种信息包括:标签句段状态、锁定状态、机器翻译痕迹和语言对信息。这些信息在双语文件中的表现形式会在“其他文件”中贴上截图。
43.累加模块用于对待检查文件信息进行分类累加整理:
44.进一步地,标签句段状态包含7个标签信息:未翻译、草稿、已翻译、翻译被否决、翻译被核准、签发被拒绝、已签发。
45.遍历待检查的文件列表中的所有双语文件的所有句段,去检查标签句段状态,标签句段状态肯定是7种中的一个,每当判断出一个句段用的是某个状态,就在某个状态的对应结果数量上加1。当所有文件的所有句段统计完成之后就得到了所有文件句段数量的显示中的前7条结果。这时候开始计算第8条结果,也就是将前7条结果进行求和得到的结果写到这里。
46.进一步地,机器翻译的at标记与标签句段状态的结果不冲突,属于并列关系,是句段的另一种独立的属性,有两种状态,要么是带at标记,要么什么都没有。这里只要统计是at标记的句段的数量。实际上这个信息的统计在标签句段状态遍历时也同时做了,还是累加得到前7条的结果。第8条结果还是对前7条进行求和得到。
47.进一步地,“锁定”与标签句段状态和机器翻译的at标记的结果都不冲突,属于并列关系,是句段的另一种独立的属性,有两种状态,“锁定”和“未锁定(或什么都没写也表示未锁定)”。这里只要统计是“锁定”的句段的数量。这个信息统计在标签句段状态遍历时也
同时做了,还是累加得到前7条的结果。第8条结果还是对前7条进行求和得到。
48.进一步地,语言对信息和显示本次检查对应语言对信息下的文件个数的结果都是动态生成的。语言对信息条目是动态生成的,每新统计一个双语文件时会检查语言对(语言对信息在双语文件中有属性表示,只要利用xml解析技术来获取就行了,语言对信息在双语文件中的表示形式会在“其他技术材料”中贴图展示),将查到的语言对信息与现有条目中进行挨个比对,如果找到一样的,就在这个条目中的数值上加1。如果找不到就新建,同时将对应条目置为1。显示本次检查对应语言对信息下的文件个数中的第一条数据对应的是语言对信息中的第一个标签“total”,这个标签是固定有的,数据默认是0,每当统计一个文件这个数值就会加1,所以它的意义是表示统计文件的总数。
49.根据上一段落介绍的统计原理可以看到,用户其实是可以得到这两种信息的:首先从语言对信息中可以知道本次统计都出现了哪些语言对(也就是被统计的文件都有哪些语言对)。然后从显示本次检查对应语言对信息下的文件个数中可以知道出现对应语言对信息这个语言对的文件的个数。
50.输出模块用于对分类累加整理的结果进行输出展示,完成对交付前双语文件状态的检查。
51.由于使用传统提供的功能,获得句段状态统计结果的做法,会随着一批要检查文件中的文件数量增多,文件夹结构变复杂,文件中语种不一样,而不能一起统计,极大的增加了工程处理的复杂度和操作的时间开销。本发明为了解决这个痛点,发明了一个新的句段状态统计系统,直接解析双语文件,一次性获取句段状态数据然后整理出想要的结果。
52.根据本实施例的统计结果,从标签句段状态中的结果看到有“未翻译”和“草稿”状态的句段,说明文件很可能译文不全或者存在未确认的临时译文,这就需要和译员确定啦。从带机器翻译at标记的句段的数量中可以看到被检查的文件中有机器翻译的痕迹,如果项目有要求禁止使用机器翻译,那这就有必要和译员说道一下啦。从带锁定状态的句段的数量中可以看到文件中有“锁定”的句段,这个根据项目情况进一步判断,看看为什么加锁,是否需要解锁就行了。语言对信息和显示本次检查对应语言对信息下的文件个数也是很重要的信息,语言对信息可以帮助工程人员核验项目包含的语言对是否就是这些。显示本次检查对应语言对信息下的文件个数可以看到每个语言对对应的文件数量,每个语种的文件数量不一样,这也能够提醒工程人员注意,文件数量不一样是否是丢失文件了呢。
53.实施例二
54.如图2所示,本发明还提供了一种对交付前双语文件状态快速检查的方法,包括以下步骤:
55.获取待检查文件信息;
56.对所述待检查文件信息进行分类累加整理;
57.对分类累加整理的结果进行输出展示,完成对交付前双语文件状态的检查。
58.进一步地,将要检查的双语文件放到一个文件夹下,可以有子文件夹(支持遍历子文件夹),双语文件可以是不同语言对的(支持不同的语言对一起检查),比如文件夹下既有英语翻简体中文的也有英语翻法语的双语文件。然后遍历根文件夹及所有子文件夹,将其包含的双语文件完整路径输出到待检查的文件列表中。然后利用xml解析技术获取双语文件4种信息,所述4种信息包括:标签句段状态、锁定状态、机器翻译痕迹和语言对信息。这些
信息在双语文件中的表现形式会在“其他文件”中贴上截图。
59.以上,仅为本技术较佳的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应该以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1