计算机辅助翻译方法

文档序号:9349935阅读:2820来源:国知局
计算机辅助翻译方法
【技术领域】
[0001]本发明涉及计算机辅助翻译(computer aided translat1n,CAT)方法。
【背景技术】
[0002]目前,基于计算机实现的机器翻译(MT)技术有可分为基于规则的机器翻译(RBMT)、基于统计的机器翻译(SMT)、基于实例的机器翻译(EBMT)、基于模板的机器翻译(TBMT)的机器翻译技术等。另外,还存在以翻译记忆(translat1n memory,TM)技术为代表的计算机辅助翻译技术。
[0003]无论是机器翻译还是计算机辅助翻译,都是将待翻译语言(以下,有时记作第一语言)的语句翻译成目标语言(以下,有时记作第二语言)的语句。但在目前的计算机翻译(包括计算机机器翻译和计算机辅助翻译)产品中,在第一语言和第二语言之间的对应关系的显示方面存在许多问题。
[0004]例如,如图1所示,第一语言位于左侧,作为翻译结果的第二语言位于右侧。它们分别由多个翻译子单元(以下有时简称做子单元)构成。所谓翻译子单元是指句子的各个组成部分,它们可大体分类为具有实际含义的词汇以及仅表示语法信息的元素(例如,日语等中的提示主语的“tt”)等。例如,也可以将eated分为作为表示实际含义的子单元部分“eat”和表示时态语法的子单元部分“ed”。
[0005]如图1所示,在现有的翻译产品中,例如,如果将鼠标放置在第二语言的语句的某个翻译子单元上,则在第一语言的语句中以阴影的方法显示对应的翻译子单元。这种显示方法存在如下问题,首先,必须通过鼠标等切换到显示对应关系的模式,例如,在图1所示例子中,需要将鼠标放置在某个子单元上,切换到显示对应关系的模型,才显示对应关系。如果鼠标不指示某个子单元,则不显示两种语言的子元素之间的对应关系。
[0006]此外,例如如图1所示的例子那样,只能一个一个地显示对应关系。此外,不能显示语序的变化,例如,英语是典型的主谓宾(SVO)语序,而日语是SOV语序,图1所示的产品不能在第二语言中显示出子单位原来的语序位置,必须参考左侧的显示才能掌握原来的语序位置。此外,不能在第二语言中显示出已被隐藏的第一语言的语法元素等。例如,诸如bananas中的“s”表示复数,而中文、日语等往往不使用复数,因此,仅参照第二语言中的“八于于”,则无法知晓于于对应的是“bananas ”还是“ appIe ”。

【发明内容】

[0007]针对上述问题,本发明提供一种计算机辅助翻译方法,其由计算机执行,其中,
[0008]所述计算机辅助翻译方法包含如下处理:
[0009]预翻译处理,将第一语言的语句中的各个翻译子单元处理为第二语言的翻译子单元,并对语序进行调整;
[0010]标记元素显示处理,在通过所述预翻译处理得到的作为第二语言的预翻译结果中,在与所述第一语言的翻译子单元相应的位置显示标记元素;以及
[0011]标记元素清除处理,响应于用户做出的用于清除标记元素的指示,将所述标记元素清除。
[0012]此外,可以是,在所述预翻译处理中,使用基于模板的机器翻译、基于规则的机器翻译、基于统计的机器翻译、基于实例的机器翻译、基于词典的简单替代中的至少一种方式进行所述预翻译。
[0013]此外,可以是,所述相应的位置包括调整语序之前的位置和调整语序之后的位置。
[0014]此外,可以是,所述标记元素为字符或图片。
[0015]通过以上方式,可以在作为第二语言的翻译结果中,直观地表现出第二语言的子单元与第一语言的子单元之间的对应关系。
【附图说明】
[0016]图1示出了用于说明现有的翻译产品中显示对应关系的例子。
[0017]图2示出了辅助翻译程序P的组成结构。
[0018]图3不出了翻译模板的例子。
[0019]图4示出了与翻译模板对应的标记模板的例子。
[0020]图5示出了显示有标记元素的翻译结果的例子。
[0021]图6不出了与辞典对应的标记模板的例子。
【具体实施方式】
[0022]本发明的计算机辅助翻译方法例如可由作为个人计算机的PCl执行辅助翻译程序P来实现。PCl可以是通常的个人计算机,其具有处理器、存储器、显示器和鼠标键盘等,可执行辅助翻译程序P,进行翻译处理。辅助翻译程序P构成为包括预翻译模块P1、标记元素显示模块P2和标记元素清除模块P3。
[0023]例如,用户通过键盘或鼠标指示辅助翻译程序P进行翻译处理。响应于该指示,在预翻译模块Pl中,针对待翻译的第一语言的语句,基于现有的翻译方法进行预翻译。在预翻译中,将第一语言的语句中的各个翻译子单元处理为第二语言的翻译子单元,并对对语序进彳丁调整。
[0024]例如,可以采用基于模板的机器翻译(TBMT)技术来进行预翻译。在基于模板的机器翻译中,例如,如图3所示,在翻译模板库中存在诸如“I like[A]—私?; [Α]汾好吞T才”这样的翻译模板,其表示将“I like [A]”翻译为“私?; [Α]系好吞7才”。例如,针对“Ilike apple”、“I like orange”这样的待翻译语句,在预翻译模块Pl中,针对模板中[A]的部分,通过查找辞典等方法,将[A]处的第一语言的子单元置换为第二语言的子单元,SP,将“apple”置换为“卩> =T ”,将“orange”置换为“才U V P ”,并与模板中的其他部分相结合,从而将 “I like apple,,、“I like orange” 翻译为“私ii; 1J V ?好 ? "?、才”、“私才U V夕汾好吞T才”。
[0025]以上,使用了 TBMT技术来进行预翻译,但不限于此,也可以通过其他方法来进行预翻译。例如,可以采用基于规则的机器翻译技术来进行预翻译。类似地,与存储翻译规则的库中的各个翻译规则对应地建立标记模板,针对基于规则的预翻译结果显示标记元素。
[0026]在标记元素显示模块Ρ2中,针对预翻译的结果,显示标记元素。例如,可以利用助标记元素库来显示标记元素。标记元素库例如可由文本文件实现,在标记元素库中,存在“I like[A]—私<like>[A]汾好g T才〈like〉”这样的标记模板。该标记模板分为三部分:左侧为模板的名称,其可作为键来唯一标识模板;中间部分用于显示标记元素;右侧用于在后述处理中清除标记元素,在要清除的标记元素存在多个的情况下,例如可以使用“ I ”等分隔符分隔各个标记兀素。
[0027]例如,可以通过左侧的名称进行检索。例如,根据“I like[A]”检索与“I like[A]^对应的标记元素的模板,得到“私<like>[A]汾好g T才”。其中,“私<like>[A]汾〈好吞T才〉”中的“ <> ”表示在该位置显示标记元素。
[0028]这样,如图5所示,通过标记元素显示模块P2显示标记元素,“I like apple”的翻译结果为“私like y y =T尕好答”。由此,在作为第二语言的翻译结果中,分别在翻译子单元被调整语序之前的位置和被调整语序之后的位置显示标记元素,使得用户可以直观地在翻译结果中掌握发生语序变换的字段与翻译之前的字段元之间的对应关系和相对位置。类似地,对于which之类的带有从句的复杂长句,在翻译时通常根据情况拆分成容易理解的短句。例如,通过在作为第二语言的翻译结果中的原来的Which的位置嵌入式地显示标记元素,可以使得用户容易理解原有的句子结构而方便地进行修改。
[0029]在该例子中,使用了与其它部分不同的粗斜体来显示标记元素,但在实际应用中,可以用颜色、下划线、字体大小等其他方式来标记元素,只要使得用户通过显示方式而容易分辨出标记元素以及容易判断出子单元之间的对应关系即可。
[0030
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1