机器翻译检查方法

文档序号:6358334阅读:1481来源:国知局
专利名称:机器翻译检查方法
技术领域
本发明涉及一种计算机技术,具体说,涉及一种机器翻译检查方法。
背景技术
机器翻译(machine translation),又称机译(MT),是利用计算机把一种自然语言转变成另一种自然语言的过程。用以完成这一过程的软件叫做机器翻译系统。自20世纪 30年代法国科学家阿尔楚尼提出机器翻译的设想以来,利用计算机在不同语种的文献之间自动实现准确、流畅的翻译,一直是科学家的追求目标。采用统计分析法设计更加智能化的翻译软件,掀起了新一轮研究开发热潮。谷歌公司的计算机翻译专家弗朗斯奥彻认为,提高计算机翻译水平的关键是,需要在软件中建立大约相当于100万本书的数据库。Systran公司总裁赛巴塔卡克斯也表示,他们在翻译专利文献等非常专业的技术文献时也采用了统计分析法,并认为目前计算机翻译界对统计分析法的热衷,在某种程度上也代表了市场需要的技术方向。与此同时,采用统计分析法和采用句子语法结构分析法设计翻译软件的两种技术线路也逐渐开始融合,依靠词组而不是单个单词统计分析方法,也能够处理语义学方面的问题。上述机器翻译过程中,在翻译的时候直接使用了机器翻译结果,而这些结果往往是不准确的,达不到商用效果。

发明内容
本发明所解决的技术问题是提供一种机器翻译检查方法,减少了系统中各个模块之间交互访问的时间。技术方案如下一种机器翻译检查方法,包括机器翻译检查,选择需要检查的语料,定义原文的翻译方向;将原文保存到文本文件中,通过机器翻译模块进行翻译,所述机器翻译模块用于根据翻译方向翻译指定文本内容;检查译文和翻译结果,根据句子中词的相似度阀值及标记设置标记达到相似度的原文内容,并输出报表。进一步在所述检查和标记过程中,依次比对译文和翻译结果,计算相似度阀值, 根据所述相似度阀值判断译文和翻译结果是否大于相似度,如果是,根据标记设置标记原文内容。进一步所述相似度包括高相似度和一般相似度,当所述相似度阀值在0. 8至1之间为所述高相似度,当所述相似度阀值在0. 6至0. 8之间为一般相似度。进一步在所述检查和标记过程中,判断循环是否结束,如果没有继续计算匹配率。进一步如果是最后一条语料表示则结束,如果不是最后一条语料则表示没有结
3束。进一步所述输出报表的内容包括序号、原文、译文、机器译文或者相似度。进一步所述相似度阀值的阀值区间在0-100%之间。技术效果包括1、本发明采用文件翻译方式,一次提交,全部翻译,减少了系统中各个模块之间交互访问的时间,方便快速。2、设定各自的权重比例,综合计算句子的相似度,根据相似度标记颜色,然后通过报表输出,表现更直观。3、本发明翻译准确,缩短了翻译时间。


图1是本发明中机器翻译检查方法的流程图;图2是本发明中检查和标记过程的流程图。
具体实施例方式本发明对原译文和机器译文进行分词,根据词的相似度以及词之间的对应位置, 生成一个二维矩阵,实现标记原文。下面参考附图和优选实施例,对本发明技术方案作详细描述。如图1所示,是本发明中机器翻译检查方法的流程图。下面对机器翻译检查方法作详细描述。通过机器翻译引擎对语料原文进行翻译,然后将机器译文和语料译文进行比对。步骤101 机器翻译检查;步骤102 选择需要检查的语料,然后选择翻译引擎,定义原文的翻译方向;步骤103 机器翻译。将原文保存到文本文件中,通过机器翻译模块进行翻译,机器翻译模块的作用是根据翻译方向翻译指定文本内容。本发明采用文件翻译方式,一次提交,全部翻译方式来处理。将原文保存到文本文件中,每句一行,参考代码如下procedure SaveToFile(CopusList: TCopusList; f: string); var
idx: Integer; ms: TStrings; begin
ms := TStringList.Create; try
for idx := 0 to Length(CopusList) - 1 do begin
ms.Add(CopusList[idx]. Source); end;
ms.SaveToFile(f);
finally
FreeAndNil(ms); end; end;将文本文件提交到后台翻译,参考代码如下
function MachineTranslate(f: string; var ms: TStrings): Boolean; begin
ms := PostToTranslate(f, URL—MACHINE—TS);
end;步骤104 :检查,依次比对译文和翻译结果;步骤105 标记,根据句子中词的相似度阀值(阀值区间在0-100%之间)及标记设置,标记达到相似度(高相似度1 >阀值> 80%,一般相似度80%>阀值> 60% )的原文内容,标记可以选用颜色方式(在报表中体现,不在原语料中标记)。
步骤106 输出报表(内容包括序号、原文、译文、机器译文、相似度等)。标记颜色,输出报表,参考代码如下
权利要求
1.一种机器翻译检查方法,包括机器翻译检查,选择需要检查的语料,定义原文的翻译方向;将原文保存到文本文件中,通过机器翻译模块进行翻译,所述机器翻译模块用于根据翻译方向翻译指定文本内容;检查译文和翻译结果,根据句子中词的相似度阀值及标记设置标记达到相似度的原文内容,并输出报表。
2.如权利要求1所述的机器翻译检查方法,其特征在于在所述检查和标记过程中,依次比对译文和翻译结果,计算相似度阀值,根据所述相似度阀值判断译文和翻译结果是否大于相似度,如果是,根据标记设置标记原文内容。
3.如权利要求2所述的机器翻译检查方法,其特征在于所述相似度包括高相似度和一般相似度,当所述相似度阀值在0. 8至1之间为所述高相似度,当所述相似度阀值在0. 6 至0.8之间为一般相似度。
4.如权利要求2所述的机器翻译检查方法,其特征在于在所述检查和标记过程中,判断循环是否结束,如果没有继续计算匹配率。
5.如权利要求4所述的机器翻译检查方法,其特征在于如果是最后一条语料表示则结束,如果不是最后一条语料则表示没有结束。
6.如权利要求1至5任一项所述的机器翻译检查方法,其特征在于所述输出报表的内容包括序号、原文、译文、机器译文或者相似度。
7.如权利要求1所述的机器翻译检查方法,其特征在于所述相似度阀值的阀值区间在0-100%之间。
全文摘要
本发明公开了一种机器翻译检查方法,包括机器翻译检查,选择需要检查的语料,定义原文的翻译方向;将原文保存到文本文件中,通过机器翻译模块进行翻译,所述机器翻译模块用于根据翻译方向翻译指定文本内容;检查译文和翻译结果,根据句子中词的相似度阀值及标记设置标记达到相似度的原文内容,并输出报表。本发明减少了系统中各个模块之间交互访问的时间。
文档编号G06F17/28GK102184171SQ20111009897
公开日2011年9月14日 申请日期2011年4月20日 优先权日2011年4月20日
发明者江潮 申请人:传神联合(北京)信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1