一种译员分级索引的方法

文档序号:6526831阅读:242来源:国知局
一种译员分级索引的方法
【专利摘要】本发明公开了一种译员分级索引的方法,包括:确定归属同一用户ID的多篇译后文档;确定每篇所述译后文档的语句参数和词汇参数,根据所述参数计算出相对应的归一系数;根据所述归一系数在等级标识数据库中匹配相应的级别;建立所述级别与所述用户ID的关联关系;根据所述关联关系,以所述级别作为索引词建立所述用户ID的索引关系。本发明基于统一标准,准确的找到译员翻译能力的级别,提高了评定的准确性、一致性以及评定的效率,解决了快速、准确的检索出合适译员的问题。
【专利说明】一种译员分级索引的方法
【技术领域】
[0001]本发明涉及翻译【技术领域】,具体而言,涉及一种译员分级索引的方法。
【背景技术】
[0002]为将待翻译的文档分配给合适的译员,一个需考虑的重要因素是文档的翻译难度和译员翻译能力的匹配问题,所以对于翻译行业或翻译公司来说,确定译员的翻译能力和翻译等级是一件非常重要的工作。一般对于译员的翻译能力进行判断,是通过标准测试+专家评分的机制进行,即提供标准的测试文档给待测译员进行翻译,然后通过专家对译员的翻译文档进行评分,根据多篇测试文档的评分值,从而得到译员的翻译能力分值,根据译员的能力分值给定相应的翻译等级,这种评测相对比较主观,并没有客观的考虑译员翻译过的稿件中的字符参数。同时这种测试方法由于无法做到实时性,给出的译员的翻译等级相对译员的翻译能力也会有一定滞后。
[0003]不同的译员翻译的词汇和语句不同,目前在为每个译员分配任务时,采用的是主观的分配,并没有客观的考虑待译稿件的字符的参数与译员翻译过的稿件中的字符参数是否匹配,这种匹配也是影响稿件的翻译质量的因素之一。

【发明内容】

[0004]本发明旨在提供一种译员分级索引的方法,解决了由于没有客观的根据译员的译后稿件中的字符参数确定译员翻译等级,影响译员分级检索的问题。
[0005]本发明公开了一种译员分级索引的方法,包括:
[0006]确定归属同一用户ID的多篇译后文档;
[0007]确定每篇所述译后文档的语句参数和词汇参数,根据所述参数计算出相对应的归一系数;
[0008]根据所述归一系数在等级标识数据库中匹配相应的级别;
[0009]建立所述级别与所述用户ID的关联关系;
[0010]根据所述关联关系,以所述级别作为索引词建立所述用户ID的索引关系。
[0011]优选地,在建立了所述级别与所述用户ID的关联关系后,还包括:
[0012]在一定的时间阀值范围内,重新确定所述用户ID的多篇译后文档;
[0013]重新建立所述级别与所述用户ID的关联关系,以用于实时更新所述用户ID的索引关系。
[0014]优选地,所述语句参数为语句复杂度;
[0015]计算所述语句复杂度的过程包括:
[0016]分析出所述译后文档的整句的平均长度、所述整句中的第一类子句的平均长度、长句的平均长度和所述长句中的第二类子句的平均长度;
[0017]按照语句复杂度计算公式计算,得到所述译后文档的所述语句复杂度;所述语句复杂度计算公式如下:
【权利要求】
1.一种译员分级索引的方法,其特征在于,包括: 确定归属同一用户ID的多篇译后文档; 确定每篇所述译后文档的语句参数和词汇参数,根据所述参数计算出相对应的归一系数; 根据所述归一系数在等级标识数据库中匹配相应的级别; 建立所述级别与所述用户ID的关联关系; 根据所述关联关系,以所述级别作为索引词建立所述用户ID的索引关系。
2.根据权利要求1所述的方法,其特征在于,在建立了所述级别与所述用户ID的关联关系后,还包括: 在一定的时间阀值范围内,重新确定所述用户ID的多篇译后文档; 重新建立所述级别与所述用户ID的关联关系,以用于实时更新所述用户ID的索引关系。
3.根据权利要求1所述的方法,其特征在于,确定的所述多篇译后文档为所述用户ID对应的译员在一定的时间 范围内通过审校后的稿件。
4.根据权利要求1所述的方法,其特征在于,所述语句参数为语句复杂度; 计算所述语句复杂度的过程包括: 分析出所述译后文档的整句的平均长度、所述整句中的第一类子句的平均长度、长句的平均长度和所述长句中的第二类子句的平均长度; 按照语句复杂度计算公式计算,得到所述译后文档的所述语句复杂度;所述语句复杂度计算公式如下:
5.根据权利要求4所述的方法,其特征在于,所述词汇参数为词汇复杂度; 计算所述词汇复杂度的过程包括: 分析出所述译后文档中的词汇等级、类符形符比和实义词词义密度; 按照词汇复杂度计算公式计算,得到所述译后文档的词汇复杂度;所述词汇复杂度计算公式如下:

6.根据权利要求5所述的方法,其特征在于,分析所述译后文档的词汇等级的过程包括: 对所述译后文档进行分词处理,得到所述译后文档中的所有词汇,并统计词汇总数;将得到的每个所述词汇在词汇分级表中进行匹配,得到每个所述词汇的词汇级别;所述词汇级别为一级、二级、三级或四级; 分别统计所述词汇级别为二级或二级以上的级别的所述词汇的数量;计算所述文档的词汇等级的过程包括: 按照词汇等级计算公式计算出所述文档的词汇等级,所述词汇等级计算公式如下:

7.根据权利要求5所述的方法,其特征在于,分析所述译后文档的所述类符形符比的过程包括: 确定所述译后文档中的所有词汇,统计其中的类符数和形符数,计算所述类符数与所述形符数之比,得到所述文档的类符形符比;或 将得到的所有所述词汇按照标准数量划分为多个子文档,及I个不足标准数量词汇的子文档,按照类符形符比计算公式计算,得到所述文档的类符形符比;所述类符形符比计算公式如下:

8.根据权利要求5所述的方法,其特征在于,分析所述译后文档的实义词词义密度的过程包括: 确定所述译后文档中的所有词汇,对每个词汇进行词性标注,得到其中的实义词; 将得到的所有所述实义词按照一定顺序进行排列; 根据同义词本体工具得到每个所述实义词的义项数Hieaningsi,其中i为所述实义词的序号;并统计所述实义词的义项总数; 按照实义词词义密度计算公式计算,得到所述文档的实义词词义密度;所述实义词词义密度计算公式如下:

9.根据权利要求5所述的方法,其特征在于,所述归一系数为翻译能力分值; 计算所述翻译能力分值的过程包括: 根据每个所述译后文档的语句复杂度和词汇复杂度进行计算,得到所述译后文档的翻译难度值; 求出所有所述译后文档的所述翻译难度值的平均值作为所述翻译能力分值。
10.根据权利要求9所述的方法,其特征在于,所述翻译难度值的计算过程包括: 按照翻译难度计算公式计算得到所述译后文档的翻译难度值;所述翻译难度计算公式如下:diff—doc = K1 ? diff—word+K2 ? diff—sentence 其中,K1和K2为通过样本计算得到翻译难度调节系数,diff_doc为翻译难度值。
【文档编号】G06F17/30GK103699675SQ201310749990
【公开日】2014年4月2日 申请日期:2013年12月30日 优先权日:2013年12月30日
【发明者】江潮 申请人:武汉传神信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1