一种翻译行业风险项目通用推荐译员方法_2

文档序号:9417354阅读:来源:国知局
求、所述待翻译稿件的字数、所述待翻译稿件提供的翻 译价格。
[0064] 待翻译稿件的语种为稿件的翻译语种方向,例如,中对英、英对中、中对日、日对中 等。待翻译稿件涉及的行业领域例如石油化工领域、航天航空领域、网络信息技术领域等。 待翻译稿件所属稿件类型包括:合同、短件、宣传稿、信件、论文等。待翻译稿件对语言能力 质量的要求是指稿件在语言能力上的评级,具体从低到高分为t0级到t9级。待翻译稿件 对专业能力质量的要求是指稿件在专业能力上的评级,具体从低到高分为P〇级到p9级。
[0065] 如图2所示,一篇待翻译稿件的属性特征为:翻译语种方向为中文简体-俄文;稿 件类型为宣传稿;对语言能力质量要求为不低于t4级;对专业能力的质量要求为不低于p4 级;稿件字数为50字;所提供的翻译价格为6. 5元。
[0066] 所述译员的属性特征包括从存储译员的各属性特征的译员基因库中提取出的评 价译员能力的能力属性特征,能力属性特征至少包括以下之一:
[0067] 译员擅长翻译的语种,如:英语、日语、法语、德语等;译员擅长翻译的行业领域, 如:石油化工领域、航天航空领域、网络信息技术领域等;译员擅长翻译的稿件类型,如:合 同、短件、宣传稿、信件、论文等;译员翻译稿件的速度,一般评价为译员每天所能翻译的字 数;评价译员语言能力的评级,具体从低到高分为t0级到t9级;评价译员专业能力的评 级,具体从低到高分为PO级到P9级;译员对于翻译稿件的价格要求。
[0068] 先根据译员的属性特征同待翻译稿件的属性特征进行筛选,按照待翻译稿件的基 本要求筛选出基本符合标准的译员。筛选之后对译员的每个属性特征进行归一化处理和偏 离度计算。
[0069] 在筛选的过程中,根据如下匹配过程来进行筛选:
[0070] 将待翻译稿件的语种同译员擅长翻译的语种进行匹配;
[0071] 将待翻译稿件设计的行业领域同译员擅长翻译的行业领域进行匹配;
[0072] 将待翻译稿件所述的稿件类型同译员擅长翻译的稿件类型进行匹配;
[0073] 将待翻译稿件对于语言能力质量的要求同译员语言能力评级进行匹配;
[0074] 将待翻译稿件对专业能力质量的要求同译员专业能力的评级进行匹配;
[0075] 将待翻译稿件提供的翻译价格同译员对于翻译稿件的价格要求进行匹配:
[0076] 将根据待翻译稿件对提交时间的要求以及待翻译稿件的字数计算出的待翻译稿 件的翻译速度要求同译员翻译稿件的速度进行匹配。
[0077] 通过上述筛选过程可以选出基本符合要求的译员进行进一步的匹配处理以选出 最合适的译员。
[0078] 在优选的实施例中,在筛选出基本符合待翻译稿件翻译要求的译员后,需对译员 的属性特征进行归一化处理,归一化处理的方法依据的公式为:
[0079] y = (x-MinValue)/(MaxValue-MinValue),
[0080] 其中X为当前译员的当前属性特征的对应值,MaxValue、MinValue分别为全部所 述译员中筛选的当前属性特征的最大值和最小值;y为归一化处理的结果:
[0081] 进行归一化处理的目的是让参与加权计算的"可量化"的译员基因的数据级量保 持一致。
[0082] 在归一化处理后需进行偏离度计算,偏离度的计算依据的公式为:
[0083] Dev = sin ((ProperyValue/20-l)) * (2/ π)
[0084] 其中,ProperyValue表示经归一化处理后的译员的属性特征的值;
[0085] Dev为计算后获得的译员的当前属性特征的偏离度值。
[0086] 偏离度的意义在于选择合适的译员。例如,一个待翻译稿件要求译员的翻译速 度为3000字/天,则根据本发明的匹配方法不会推荐与此值相差太多的译员,例如,速度 6000, 7000,8000等,选用这些译员太浪费资源。相反根据偏离度计算的结果会根据速度权 重情况选择翻译速度在3000上下浮动较小的译员。
[0087] 在进行首次匹配的同时,将待翻译稿件的稿件特征同每个译员的历史翻译的稿件 特征进行相似度匹配。
[0088] 所述相似度匹配的过程包括:
[0089] 根据所述译员的历史翻译稿件的属性特征和待翻译稿件的属性特征进行对比筛 选,筛选选取出属性特征相接近的译员进行相似度匹配;
[0090] 从待翻译稿件中提取稿件的关键词代替待翻译稿件文本本身参与匹配;
[0091] 从译员历史翻译稿件中提取稿件的关键词代替译员历史翻译稿件文本本身参与 匹配;
[0092] 根据译员历史翻译稿件的关键词和待翻译稿件的关键词建立向量空间模型,所述 向量空间模型为:
[0093] Dl = (Til, Wll ;T12, W12 ;T13, W13 ; ......;Tln, Win);
[0094] D2 = (Τ21, W21 ;Τ22, W22 ;Τ23, W23 ; ......;Τ2η,W2n):
[0095] 其中Dl表示待翻译稿件的文本,D2表示当前译员的当前历史翻译稿件的文本:
[0096] Tli(i = 1,2,3……,η)为待翻译稿件提取出的各个关键词,i为关键词的编号;
[0097] Wli(i = 1,2,3……,η)为待翻译稿件提取出的各个关键词出现的频次,i为关键 词的编号;
[0098] T2i(i = 1,2,3……,n)为当前译员的当前历史翻译稿件中提取出的各个关键词, i为关键词的编号;
[0099] W2i(i = 1,2,3……,η)为当前译员的当前历史翻译稿件中提取出的各个关键词 出现的频次,i为关键词的编号;
[0100] 根据公式:
计算出当前译员的当前历史 稿件同待翻译稿件的相似度,式中S頂为相似度匹配后的相似度值,数值介于0~1之间。
[0101] 所述历史翻译稿件的属性特征至少包括以下之一:所述历史翻译稿件的语种、所 述历史翻译稿件涉及的行业领域、所述历史翻译稿件所属稿件类型、所述历史翻译稿件对 语言能力质量的要求、所述历史翻译稿件对专业能力质量的要求、所述历史翻译稿件对提 交时间的要求、所述历史翻译稿件的字数、所述历史翻译稿件提供的翻译价格。
[0102] 历史翻译稿件的语种为稿件的翻译语种方向,例如,中对英、英对中、中对日、日对 中等。历史翻译稿件涉及的行业领域例如石油化工领域、航天航空领域、网络信息技术领域 等。历史翻译稿件所属稿件类型包括:合同、短件、宣传稿、信件、论文等。历史翻译稿件对 语言能力质量的要求是指稿件在语言能力上的评级,具体从低到高分为to级到t9级。历史 翻译稿件对专业能力质量的要求是指稿件在专业能力上的评级,具体从低到高分为p〇级 到p9级。
[0103] 根据所述译员的历史翻译稿件的属性特征和待翻译稿件的属性特征进行筛选,筛 选出基本相似的译员历史翻译稿件,可以减小相似性匹配的工作量。
[0104] 完成两次匹配后,对两次匹配结果进行加权分析,从分析结果中选择出匹配程度 最高的数据所对应的译员。
[0105] 所述加权分析的方法为:
[0106] Sum = A1*W1*D1+A2*W2*D2+. . . An*Wn*Dn+S頂:
[0107] 其中:Sum为加权分析后的结果;
[0108] Ai(i = 1,2,3,......,η)为参加权分析的经归一化处理后的每个所述译员的属性 特征,i为每个所述译员在系统中的编号;
[0109] Wi(i = 1,2,3,……,η)为经归一化处理后的每个所述译员的属性特征所对应的 权重值,i为每个所述译员在系统中的编号;
[0110] Di(i = 1,2,3,……,n)为经归一化处理后的每个所述译员的属性特征所对应的 偏离度的值,i为每个所述译员在系统中的编号;
[0111] S頂为相似度匹配对应的相似度值:
[0112] SIMff为相似度匹配的相似度值所对应的权重值。
[0113] 在优选的实施例中,经过首次匹配和再次匹配选择出匹配程度最高的推荐译员 后,还包括:
[0114] 根据用户反馈信息调整的过程:
[0115] 输出匹配程度最高的推荐译员的信息,接收对所述推荐译员的修正值;
[0116] 根据所述修正值,修正所述译员的属性特征,并重新进行首次匹配和相似度匹配 的操作。
[0117] 该过通过用户的评价判断一个译员是否符合当前待翻译稿件的翻译工作需求,使 得译员的选择更符合用户的标准。
[0118]
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1