译员专业翻译能力的量化方法

文档序号:2626234阅读:569来源:国知局
专利名称:译员专业翻译能力的量化方法
技术领域
本发明涉及计算机领域,具体而言,涉及一种译员专业翻译能力的量化方法。
背景技术
目前的译员的能力量化方式,主要是通过完整的语篇翻译。这是翻译测试中最常用的测试方法,主要用于测试译者的跨文化交际能力以及双语转换能力,这是最能测验译者翻译水平的一种测验方式,具有很高的效度,但最大的缺点在于评分标准难以控制,对同一个翻译,不同阅卷人,或者同一阅卷人在不同时候,给出的成绩都可能会有很大的出入。在翻译后,统计每个译员的得分,目前采用的技术是人工判分后,统计每个人的得分,这样处理,效率低,且存在主观性强,得分不够客观,不能实现客观的量化译员的翻译能力。

发明内容
本发明旨在提供一种译员专业翻译能力的量化方法,以解决的上述译员评分过程,不够客观的量化译员的翻译能力问题。在本发明的实施例中,提供了一种译员专业翻译能力的量化方法,包括根据译员的专业测试要求,选择相应的多件测试稿件提供给译员进行翻译测试;将每件译后稿件与相应的标准译稿进行相似性分析,得到其相似度数值;其中,所述相似度值介于O I之间;提取每篇测试稿件内的关键词,与术语语料库进行匹配,确定每篇稿件的术语数量,作为计算稿件权重的基值;通过所述基值、所述测试稿件的翻译难度系数、和译员的翻译速度系数确定出每件测试稿件所占的权重;将每篇测试稿件的权重与该测试稿件的标准译稿同译后稿件的相似度值对应相乘,将所有乘积相加,所得数值乘以100得到一个O 100之间的数值,将该数值作为该译员在该专业的翻译能力分值。本发明的方法,通过客观的译后稿件与标准译稿进行相似性分析,得到相似度,并将术语的数量、测试稿件的难度系数以及译员的翻译速度作为权重计算项,通过相似度和权重二者结合得到译员专业翻译能力的量化值。得到了客观的结果,提高了量化的效率。


此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中图1示出了实施例的流程图;图2示出了实施例中量化过程的流程图;图3示出了实施例中树形结构图。
具体实施例方式下面将参考附图并结合实施例,来详细说明本发明。参见图1,包括以下步骤Sll :根据译员的专业测试要求,选择相应的多件测试稿件提供给译员进行翻译测试;S12 :将每件译后稿件与相应的标准译稿进行相似性分析,得到其相似度数值;其中,所述相似度值介于O I之间;S13:提取每篇测试稿件内的关键词,与术语语料库进行匹配,确定每篇稿件的术语数量,作为计算稿件权重的基值;S14:通过所述基值、所述测试稿件的翻译难度系数、和译员的翻译速度系数确定出每件测试稿件所占的权重;S15:将每篇测试稿件的权重与该测试稿件的标准译稿同译后稿件的相似度值对应相乘,将所有乘积相加,所得数值乘以100得到一个O 100之间的数值,将该数值作为该译员在该专业的翻译能力分值。本发明的方法,通过客观的译后稿件与标准译稿进行相似性分析,得到相似度,并将术语的数量、测试稿件的难度系数以及译员的翻译速度作为权重计算项,通过相似度和权重二者结合得到译员专业翻译能力的量化值。得到了客观的结果,提高了量化的效率。参见图2所示的量化过程流程图,该方法的流程过程如下提取测试稿件一篇中到英的有关汽车发动机制造的测试稿件,其语种信息、行业信息和学科领域信息为语种信息中一英行业信息37交通运输设备制造业372汽车制造3721汽车整车制造学科领域信息470动力与电气工程470. 30动力机械工程470. 3020内燃机工程(包括汽油机、柴油机、气体燃料发动机等)对译员能力进行判断,如果已经经过判定,则进入译员能力选择/比较模块,如果没有经过判定,则进行翻译能力测试系统登陆模块。译员登录平台申请领取测试稿件。系统读取测试稿件的语种、行业、学科、领域等属性信息,若译员具备该属性能力,则进入译员能力比较/选择模块;否则分配测试许可号给该译员进行该专业属性能力的翻译测试;申领译员凭测试许可号登录翻译能力测试系统,进行该语种、行业、学科、领域的翻译能力测试;系统根据测试许可号,从标准测试文档库中提取7篇相关测试文档给待测译员,包括语种类文档I篇,行业类文档3篇(37、372、3721),学科领域类文档3篇(470、470. 30、470. 3020),其难度系数分别为9、6、8、8、7、8、7,排列顺序为语种、行业-交通运输设备制造业(37)、行业-交通运输设备制造业-汽车制造(372)、行业-交通运输设备制造业-汽车制造-汽车整车制造(3721)、学科领域信息-动力与电气工程(470)、学科领域信息-动力与电气工程-动力机械工程(470.30)、学科领域信息-动力与电气工程-动力机械工程-内燃机工程(470.3020),后面的数字顺序与此相同;译员翻译完成后,根据翻译时间得到7篇译文的翻译速度档位值分别为:6、8、7、
6、6、7、7,然后调用相似性比较模块计算译员的译文和标准译文的相似度,得到7篇译文和标准译文的相似度值,分别为:0.6,0.65,0.79,0.83,0.77,0.82,0.85 ;优选地,稿件相似性比较模块进行分析的过程包括:S21:提取每篇译后稿件和与其对应的标准译稿所归属的属于一个专业的多篇标准译稿的全部关键词,得到关键词集合C= {k1;k2,-,kj ;S22:计算C中每个关键词k在稿件集合中出现的概率,即出现关键词k的稿件数和稿件总数之比,记为P (k)。将关键词按P (k)进行降序排序,并将每一个关键词作为一个集合,这样得到初始的m个待合并集合,记为{kj , {k2},..., {kj ;在这m个关键词中,计算在关键词Ici出现的稿件中,关键词kj也出现的概率,记为P (kj Iki),共计P L个条件概率,(I彡i, j彡m ;i关j);P (kj I kj 的计算方法:P (IijIki)=P (^ki) /p Cki),p (Iijki)为 Ii^ki 同时出现在同一篇稿件中的概率。S23:合并集合,当集合I和J同时满足以下两个条件时合并:
权利要求
1.一种译员专业翻译能力的量化方法,其特征在于,包括:根据译员的专业测试要求,选择相应的多件测试稿件提供给译员进行翻译测试;将每件译后稿件与相应的标准译稿进行相似性分析,得到其相似度数值;其中,所述相似度值介于O I之间;提取每篇测试稿件内的关键词,与术语语料库进行匹配,确定每篇稿件的术语数量,作为计算稿件权重的基值;通过所述基值、所述测试稿件的翻译难度系数、和译员的翻译速度系数确定出每件测试稿件所占的权重;将上述所得的权重值结合译后稿件与标准译稿的相似度值得到一个O 100之间的数值,将该数值作为该译员在该专业的翻译能力分值。
2.根据权利要求1所述的方法,其特征在于,所述相似性分析的过程包括:提取每篇译后稿件和与其对应的测试文档库中的标准译稿集合的关键词;该关键词的集合为 C={k1; k2,..., kj ;计算C中每个关键词k在稿件中出现的概率,即出现关键词k的稿件数和稿件总数之比,记为P (k);将C中关键词按P (k)进行降序排序,并将每一个关键词作为一个集合,这样得到初始的m个待合并集合,记为{kj , {k2},..., {kj ;在这m个关键词中,计算在关键词匕出现的稿件中关键词kj出现的概率,记为P(IijIki),共计P I个条件概率,(I 彡 i,j 彡 m ;i 关 j);p (IijIki)=P (^ki)/p Cki),p (Iijki)为h和h同时出现在同一篇稿件中的概率;合并待合并集合,生成以关键词集合C为根节点的关键词概念树。
3.根据权利要求2所述的方法,其特征在于,所述合并过程包括:对于待合并的两个关键词集合Cl和C2,合并条件为:存在Ici属于Cl, kj属于C2,且p(10>阀值?14 (IijIki) >阀值P2,当P (Iii)和P (k」| Iii)大于所述设定阀值时,关键词Iii和h表达相同概念,满足其所在的集合的合并条件之一;在合并后的集合中任给一个关键词ki;其与集合中一半以上关键词都满足条件PCkjIki))阀值 P2。
4.根据权利要求3所述的方法,定义H为生成的概念树的高度,定义depth(k)为节点k在树中的深度,即为从根节点到该节点所经历的边数;定义com Cki, kj)为离节点Ici和k」最近的共同父节点;任两个关键词的积的计算公式AiXkj=Clepth (com Cki, k」))/H ;设向量 A=^a2,..., an}, B= , b2,…,bj ,定义向量计算:
全文摘要
本发明提供了一种译员专业翻译能力的量化方法,包括根据译员的测试要求,系统选择相应的多件测试稿件提供给译员进行翻译测试;将每件译后稿件与相应的标准译稿进行相似性分析,得到相似度数值;提取每篇测试稿件的关键词,与术语语料库进行匹配,确定每篇稿件的术语数量,作为计算稿件权重的基值,再结合稿件的翻译难度和译员的翻译速度通过一定的计算模型得出每件测试稿件所占的权重;通过所得权重和相似度值最终计算出该译员在该专业的翻译能力分值。本发明的方法,通过客观的译后稿件与标准译稿进行相似性分析,得到相似度,再结合译稿的权重,计算出译员专业翻译能力的量化值。得到了相对客观的结果,提高了译员翻译能力测试的效率。
文档编号G09B7/00GK103077630SQ201210591760
公开日2013年5月1日 申请日期2012年12月31日 优先权日2012年12月31日
发明者江潮 申请人:武汉传神信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1