翻译方法及装置的制作方法

文档序号:6336132阅读:185来源:国知局
专利名称:翻译方法及装置的制作方法
技术领域
本申请涉及计算机翻译技术领域,特别涉及一种翻译方法及装置。
背景技术
随着计算机的快速发展,利用计算机来实现不同语言之间的翻译技术早已为人所熟知,也称为自动翻译,自动翻译是一种不需要人为参与的翻译方式,用户在自动翻译界面中输入一段源语言文本后,选择源语言种类和目标语言种类,翻译装置自动将输入的源语言文本翻译为目标语言文本,并将翻译后的目标语言文本提供给用户,其中翻译装置通常采用下述三种翻译模式第一种翻译模式,基于翻译规则的翻译模式预先设置由源语言到目标语言的翻译规则和翻译词典,将用户输入的源语言文本划分为多个待翻译的源语言语句,针对每个待翻译的源语言语句进行分析,确定出将该待翻译的源语言语句由源语言翻译为目标语言的翻译规则,然后基于确定出的翻译规则,根据预先设置的翻译词典,将该待翻译的源语言语句由源语言翻译为目标语言,得到目标语言语句,将翻译后的各个目标语言语句组合为翻译后的目标语言文本。第二种翻译模式,基于翻译实例的翻译模式预先获得大量的针对片段的翻译实例,将用户输入的源语言文本划分为多个待翻译源语言语句,再将每个待翻译的源语言语句划分为多个待翻译的源语言片段,每个待翻译的源语言片段包含至少一个短语,查找各个待翻译的源语言片段的翻译实例,根据查找到的翻译实例,将每个待翻译的源语言片段由源语言翻译为目标语言,得到各个目标语言片段,然后由各个目标语言片段组合为翻译后的目标语言语句,再由各个目标语言语句组合为翻译后的目标语言文本。第三种翻译模式,基于模型的翻译模式预先设置翻译模型和语言模型,翻译模型描述了由源语言片段翻译为目标语言片段的概率值,即翻译模型概率值,语言模型描述了目标语言语句符合语法和使用习惯的概率值,即语言模型概率值。将用户输入的源语言文本划分为多个待翻译的源语言语句,再将每个待翻译的源语言语句划分为多个待翻译的源语言片段,确定每个待翻译的源语言片段翻译为目标语言后的各个目标语言片段以及各个目标语言片段对应的翻译模型概率值,针对划分的每个待翻译的源语言语句,由各个待翻译的源语言片段的目标语言片段可以组合出多个目标语言语句,针对组合后的每个目标语言语句,翻译装置确定该目标语言语句的语言模型概率值,然后将该目标语言语句中的每个目标语言片段的翻译模型概率值相乘,得到该目标语言语句的翻译模型概率值,将该目标语言语句的语言模型概率值和翻译模型概率值相乘,得到该目标语言语句的综合权重值,将综合权重值最大的目标语言语句确定为该待翻译的源语言语句翻译后的目标语言语句。自动翻译结束后,用户可能对自动翻译结果不满意,用户可以对自动翻译结果进行修改。例如,自动翻译结果中的某个语句存在语法问题,用户可以对该语句进行修改。为了便于用户检查自动翻译结果,也可以在例句库存储的翻译例句资源中,查找每个待翻译的源语言语句的翻译结果,例句库存储的翻译例句资源包含了各个源语言语句和目标语言语句的对应关系,以及在存储的用户词典中,查找每个待翻译的源语言单词的翻译结果,将查找到的翻译结果提供给用户。若用户对自动翻译结果中的某个语句进行了修改,则可以根据修改后的语句对例句库存储的翻译例句资源进行更新。现有技术中,若用户对自动翻译结果中的某个语句进行了修改,则可以认为该语句在由源语言翻译为目标语言的自动翻译过程中存在翻译错误的问题。但是翻译装置后续对该语句进行由源语言到目标语言的翻译过程中,还是会按照原有的方法进行翻译,因此还是会产生相同的翻译错误问题,这导致自动翻译的翻译的正确性较低。

发明内容
本申请实施例提供一种翻译方法及装置,用以解决现有技术中存在的自动翻译的翻译正确性较低的问题。本申请实施例技术方案如下一种翻译方法,该方法包括步骤获得对自动翻译结果进行修改得到的修改结果; 根据获得的修改结果,对进行自动翻译所需的自动翻译资源进行更新;获得需进行自动翻译的源语言文本;根据更新后的自动翻译资源,将获得的源语言文本翻译为目标语言文本。一种翻译装置,包括修改结果获得单元,用于获得对自动翻译结果进行修改得到的修改结果;自动翻译资源更新单元,用于根据修改结果获得单元获得的修改结果,对进行自动翻译所需的自动翻译资源进行更新;源语言文本获得单元,用于获得需进行自动翻译的源语言文本;翻译单元,用于根据自动翻译资源更新单元更新后的自动翻译资源,将源语言文本获得单元获得的源语言文本翻译为目标语言文本。本申请实施例技术方案中,首先获得对自动翻译结果进行修改得到的修改结果, 然后根据获得的修改结果,对进行自动翻译所需的自动翻译资源进行更新,后续获得需进行自动翻译的源语言文本后,根据更新后的自动翻译资源,将获得的源语言文本翻译为目标语言文本,由上可见,本申请实施例获得修改结果后,根据该修改结果对自动翻译资源进行更新,后续可以根据更新后的自动翻译资源进行自动翻译,因此能够有效地提高自动翻译的正确性,也能够减少用户对自动翻译结果进行修改时的修改量。当然,本申请实施例的任一方法和产品并不一定需要同时达到以上所述的优点。


图1为本申请实施例一中,翻译方法流程示意图;图2为本申请实施例二中,翻译装置结构示意图;图3为本申请实施例二中,自动翻译资源更新单元结构示意图;图4为本申请实施例二中,翻译单元结构示意图;图5为本申请实施例二中,翻译单元结构示意图。
具体实施例方式下面结合各个附图对本申请实施例技术方案的主要实现原理具体实施方式
及其对应能够达到的有益效果进行详细地阐述。
实施例一如图1所示,为本申请实施例一中,翻译方法流程图,其具体处理过如下步骤11,获得对自动翻译结果进行修改得到的修改结果;用户在需要进行自动翻译时,会在自动翻译界面输入待翻译的源语言文本,或是将存储在本地的源语言文本上传到翻译装置。用户输入或上传完待翻译的源语言文本后, 可以选择源语言种类和目标语言种类,例如选择的源语言为中文,选择的目标语言为英文, 用户确认翻译后,翻译装置根据进行自动翻译所需的自动翻译资源,将输入的待翻译的源语言文本翻译为目标语言文本,其中翻译装置一般先将待翻译的源语言文本划分成多个待翻译的源语言语句,再对每个待翻译的源语言语句进行自动翻译,可以但不限于基于翻译规则、翻译实例或者模型等翻译模式进行自动翻译,然后再将翻译后的目标语言语句组合成目标语言文本。翻译装置可以基于不同的翻译模式进行自动翻译,下面分别对基于不同翻译模式时的自动翻译过程进行介绍。(一 )基于翻译规则的翻译模式进行自动翻译翻译规则包括句法规则和语义规贝U,翻译装置首先将待翻译的源语言文本划分为多个待翻译的源语言语句,针对每个待翻译的源语言语句进行分析,确定出将该待翻译的源语言语句由源语言翻译为目标语言的句法规则,例如待翻译的源语言语句为“我爱你”,源语言为中文,目标语言为英文,首先对该待翻译的源语言语句进行分析,得到该源语言语句的句法结构为“人称代词+动词+人称代词”,该句法结构为中文的句法结构,该语句翻译为英文后的句法结构相应为“人称代词+ 动词+人称代词”,和中文的句法结构一样,翻译装置根据翻译词典,将每个待翻译的源语言单词翻译为目标语言单词,然后确定每个目标语言单词在翻译后的目标语言语句中的语义规则,例如“我爱你”中的“我”对应的目标语言单词为“I”或“me”,“我”在该语句中为人称代词做作主语,因此根据其语义规则,应翻译为“I”,翻译得到的目标语言语句为“I love you”,最后将翻译出的各目标语言语句组合为翻译后的目标语言文本。( 二)基于翻译实例的翻译模式进行自动翻译翻译装置首先将待翻译的源语言文本划分为多个待翻译的源语言语句,再将每个待翻译的源语言语句划分为多个待翻译的源语言片段,每个待翻译的源语言片段包含至少一个源语言短语,翻译装置预先存储了大量的翻译实例,每个翻译实例均是源语言片段和目标语言片段的对应关系,翻译装置查找各个待翻译的源语言片段的翻译实例,根据查找到的翻译实例,将每个待翻译的源语言片段由源语言翻译为目标语言,得到各个目标语言片段,然后由各个目标语言片段组合为翻译后的目标语言语句,再由各个目标语言语句组合为翻译后的目标语言文本。(三)基于模型的翻译模式进行自动翻译模型包括翻译模型和语言模型,翻译模型描述了由源语言片段翻译为目标语言片段的概率值,即翻译模型概率值,语言模型描述了目标语言语句符合语法和使用习惯的概率值,即语言模型概率值,翻译装置首先将待翻译的源语言文本划分为多个待翻译的源语言语句,再将每个待翻译的源语言语句划分为多个待翻译的源语言片段,每个待翻译的源语言片段包含至少一个源语言短语,确定每个待翻译的源语言片段翻译为目标语言后的各个目标语言片段以及各个目标语言片段对应的翻译模型概率值,例如源语言片段“爱”翻译为“like”的翻译模型概率值为0. 4,翻译为 "love"的翻译模型概率值为0. 5,翻译为“affection”的翻译模型概率值为0. 1,针对划分的每个待翻译的源语言语句,由各个待翻译的源语言片段的目标语言片段可以排列组合出多个目标语言语句,例如待翻译的源语言语句为“我爱你”,划分为三个源语言片段分别为 “我”、“爱”和“你”,其中“我”对应的目标语言片段为“ I,,和“me”,“爱”对应的目标语言片段为“like,,、“love,,和"affection", “你”对应的目标语言片段为“you”,因此可以排列组合出36个目标语言语句,针对组合后的每个目标语言语句,翻译装置确定该目标语言语句的语言模型概率值,然后将该目标语言语句中的每个目标语言片段的翻译模型概率值相乘,得到该目标语言语句的翻译模型概率值,其中语言模型概率值和翻译模型概率值分别对应相应的权重值,例如,语言模型概率值为X,翻译模型概率值为Y,语言模型概率值的权重值为A,翻译模型概率值的权重值为B,则该目标语言语句的综合权重值的计算方式可以但不限于为下述Al og2X+B Iog2Y然后将综合权重值最大的目标语言语句确定为该待翻译的源语言语句翻译后的目标语言语句。翻译装置将自动翻译得到的自动翻译结果提供给用户,用户在自动翻译界面就能够看到自动翻译结果,用户可以对自动翻译结果进行语法、句法等检查,若检查到存在问题,则可以对自动翻译结果进行修改,例如源语言文本为“她的名字是史密斯”,自动翻译结果为"Sie name is Smith”,用户检查到自动翻译结果中的“Sre”不符合语法规则,应该为 “Her”,因此用户可以对该自动翻译结果进行修改。用户可以但不限于直接将光标移到自动翻译结果需修改的语句中进行修改。为了便于用户检查自动翻译结果,翻译装置可以在用户确认需要对自动翻译结果进行修改(例如将光标移到自动翻译结果需修改的语句中) 后,首先确定用户需要修改的目标语言语句对应的源语言语句,由翻译装置从例句库中选择出该源语言语句和对应的目标语言语句提供给用户,方便用户根据相似语句的翻译情况来修改自动翻译结果。其中,所述例句库中预先存储了每个例句的源语言语句与目标语言语句的对应关系,翻译装置确定需修改的目标语言语句对应的源语言语句与例句库中存储的各源语言语句之间的匹配度,然后选择出匹配度大于规定阈值的源语言语句,或按照匹配度由高到低的顺序排列后,选择前规定数目个源语言语句和对应的目标语言语句提供给用户。此外,由于一个源语言单词可能对应多个目标语言单词,因此翻译装置也可以将需修改的目标语言语句对应的源语言语句中的每个单词的翻译情况提供给用户,以便用户在多个目标语言单词中选择合适的目标语言单词,翻译装置将需修改的目标语言语句对应的源语言语句划分为多个源语言单词,针对每个源语言单词,翻译装置在翻译词典中查找对应的目标语言单词,查找到的目标语言单词可能为多个,翻译装置将每个源语言单词和查找到的对应的目标语言单词提供给用户,例如源语言单词为“爱”,查找到的目标语言单词包括“love”、“like”、“affeCti0n”,因此翻译装置将下述对应关系提供给用户
权利要求
1.一种翻译方法,其特征在于,包括获得对自动翻译结果进行修改得到的修改结果; 根据获得的修改结果,对进行自动翻译所需的自动翻译资源进行更新; 获得需进行自动翻译的源语言文本;根据更新后的自动翻译资源,将获得的源语言文本翻译为目标语言文本。
2.如权利要求1所述的翻译方法,其特征在于,根据获得的修改结果,对进行自动翻译所需的自动翻译资源进行更新,具体包括确定进行自动翻译的翻译模式;根据确定出的翻译模式,确定进行自动翻译所需的自动翻译资源; 根据获得的修改结果,对确定出的自动翻译资源进行更新。
3.如权利要求2所述的翻译方法,其特征在于,根据确定出的翻译模式,确定进行自动翻译所需的自动翻译资源,具体包括若确定出的翻译模式为基于翻译规则的翻译模式,则将翻译规则和翻译词典确定为进行自动翻译所需的自动翻译资源;若确定出的翻译模式为基于翻译实例的翻译模式,则将翻译实例确定为进行自动翻译所需的自动翻译资源;若确定出的翻译模式为基于模型的翻译模式,则将翻译模型和语言模型确定为进行自动翻译所需的自动翻译资源。
4.如权利要求1所述的翻译方法,其特征在于,根据更新后的自动翻译资源,将获得的源语言文本翻译为目标语言文本,具体包括按照预设的划分规则,将获得的源语言文本划分为至少一个待翻译的源语言语句; 针对划分的每个待翻译的源语言语句,分别执行在例句库存储的翻译例句资源中,确定各个源语言语句与该待翻译的源语言语句之间的匹配度;选择出与该待翻译的源语言语句之间的匹配度值最大的源语言语句;判断选择出的源语言语句与该待翻译的源语言语句之间的匹配度是否超过规定阈值;若判断结果为是,则将选择出的源语言语句在例句库存储的翻译例句资源中对应的目标语言语句确定为该待翻译的源语言语句由源语言翻译为目标语言后的目标语言语句;若判断结果为否,则根据更新后的自动翻译资源,对该待翻译的源语言语句进行自动翻译,将自动翻译得到的目标语言语句确定为该待翻译的源语言语句由源语言翻译为目标语言后的目标语言语句;由翻译后的各个目标语言语句组合为目标语言文本。
5.如权利要求1所述的翻译方法,其特征在于,根据更新后的自动翻译资源,将获得的源语言文本翻译为目标语言文本,具体包括按照预设的划分规则,将获得的源语言文本划分为至少一个待翻译的源语言语句; 针对划分的每个待翻译的源语言语句,分别执行根据更新后的自动翻译资源,对该待翻译的源语言语句进行自动翻译;以及在例句库存储的翻译例句资源中,确定各个源语言语句与该待翻译的源语言语句之间的匹配度;选择出与该待翻译的源语言语句之间的匹配度值最大的源语言语句;判断选择出的源语言语句与该待翻译的源语言语句之间的匹配度是否超过规定阈值;若判断结果为是,则将选择出的源语言语句在例句库存储的翻译例句资源中对应的目标语言语句确定为该待翻译的源语言语句由源语言翻译为目标语言后的目标语言语句;若判断结果为否,则将自动翻译得到的目标语言语句确定为该待翻译的源语言语句由源语言翻译为目标语言后的目标语言语句;由翻译后的各个目标语言语句组合为目标语言文本。
6.如权利要求1所述的翻译方法,其特征在于,还包括根据获得的修改结果,对例句库存储的翻译例句资源进行更新。
7.如权利要求1所述的翻译方法,其特征在于,还包括 获得新增的用户词条;根据获得的用户词条,对存储的用户词典进行更新。
8.一种翻译装置,其特征在于,包括修改结果获得单元,用于获得对自动翻译结果进行修改得到的修改结果; 自动翻译资源更新单元,用于根据修改结果获得单元获得的修改结果,对进行自动翻译所需的自动翻译资源进行更新;源语言文本获得单元,用于获得需进行自动翻译的源语言文本; 翻译单元,用于根据自动翻译资源更新单元更新后的自动翻译资源,将源语言文本获得单元获得的源语言文本翻译为目标语言文本。
9.如权利要求8所述的翻译装置,其特征在于,自动翻译资源更新单元具体包括 翻译模式确定子单元,用于确定进行自动翻译的翻译模式;自动翻译资源确定子单元,用于根据翻译模式确定子单元确定出的翻译模式,确定进行自动翻译所需的自动翻译资源;更新子单元,用于根据修改结果获得单元获得的修改结果,对自动翻译资源确定子单元确定出的自动翻译资源进行更新。
10.如权利要求9所述的翻译装置,其特征在于,若翻译模式确定子单元确定出的翻译模式为基于翻译规则的翻译模式,则自动翻译资源确定子单元将翻译规则和翻译词典确定为进行自动翻译所需的自动翻译资源;若翻译模式确定子单元确定出的翻译模式为基于翻译实例的翻译模式,则自动翻译资源确定子单元将翻译实例确定为进行自动翻译所需的自动翻译资源;若翻译模式确定子单元确定出的翻译模式为基于模型的翻译模式,则自动翻译资源确定子单元将翻译模型和语言模型确定为进行自动翻译所需的自动翻译资源。
11.如权利要求8所述的翻译装置,其特征在于,翻译单元具体包括第一语句划分子单元,用于按照预设的划分规则,将源语言文本获得单元获得的源语言文本划分为至少一个待翻译的源语言语句;第一匹配度确定子单元,用于针对第一语句划分子单元划分的每个待翻译的源语言语句,分别在例句库存储的翻译例句资源中,确定各个源语言语句与该待翻译的源语言语句之间的匹配度;第一源语言语句选择子单元,用于针对第一语句划分子单元划分的每个待翻译的源语言语句,分别选择出与该待翻译的源语言语句之间的匹配度值最大的源语言语句;第一判断子单元,用于针对第一语句划分子单元划分的每个待翻译的源语言语句,分别判断第一源语言语句选择子单元选择出的源语言语句与该待翻译的源语言语句之间的匹配度是否超过规定阈值;第一目标语言语句确定子单元,用于针对第一语句划分子单元划分的每个待翻译的源语言语句,分别在第一判断子单元的判断结果为是时,将第一源语言语句选择子单元选择出的源语言语句在例句库存储的翻译例句资源中对应的目标语言语句,确定为该待翻译的源语言语句由源语言翻译为目标语言后的目标语言语句;第一自动翻译子单元,用于针对第一语句划分子单元划分的每个待翻译的源语言语句,分别在第一判断子单元的判断结果为否时,根据自动翻译资源更新单元更新后的自动翻译资源,对该待翻译的源语言语句进行自动翻译;第二目标语言语句确定子单元,用于针对第一语句划分子单元划分的每个待翻译的源语言语句,分别将第一自动翻译子单元进行自动翻译得到的目标语言语句,确定为该待翻译的源语言语句由源语言翻译为目标语言后的目标语言语句;第一目标语言文本组合子单元,用于由翻译后的各个目标语言语句组合为目标语言文本。
12.如权利要求8所述的翻译装置,其特征在于,翻译单元具体包括 第二语句划分子单元,用于按照预设的划分规则,将源语言文本获得单元获得的源语言文本划分为至少一个待翻译的源语言语句;第二自动翻译子单元,用于针对第二语句划分子单元划分的每个待翻译的源语言语句,分别根据自动翻译资源更新单元更新后的自动翻译资源,对该待翻译的源语言语句进行自动翻译;第二匹配度确定子单元,用于针对第二语句划分子单元划分的每个待翻译的源语言语句,分别在例句库存储的翻译例句资源中,确定各个源语言语句与该待翻译的源语言语句之间的匹配度;第二源语言语句选择子单元,用于针对第二语句划分子单元划分的每个待翻译的源语言语句,分别选择出与该待翻译的源语言语句之间的匹配度值最大的源语言语句;第二判断子单元,用于针对第二语句划分子单元划分的每个待翻译的源语言语句,分别判断第二源语言语句选择子单元选择出的源语言语句与该待翻译的源语言语句之间的匹配度是否超过规定阈值;第三目标语言语句确定子单元,用于针对第二语句划分子单元划分的每个待翻译的源语言语句,分别在第二判断子单元的判断结果为是时,将第二源语言语句选择子单元选择出的源语言语句在例句库存储的翻译例句资源中对应的目标语言语句,确定为该待翻译的源语言语句由源语言翻译为目标语言后的目标语言语句;第四目标语言语句确定子单元,用于针对第二语句划分子单元划分的每个待翻译的源语言语句,分别在第二判断子单元的判断结果为否时,将第二自动翻译子单元进行自动翻译得到的目标语言语句,确定为该待翻译的源语言语句由源语言翻译为目标语言后的目标语言语句;第二目标语言文本组合子单元,用于由翻译后的各个目标语言语句组合为目标语言文本。
13.如权利要求8所述的翻译装置,其特征在于,还包括翻译例句资源更新单元,用于根据修改结果获得单元获得的修改结果,对例句库存储的翻译例句资源进行更新。
14.如权利要求8所述的翻译装置,其特征在于,还包括 用户词条获得单元,用于获得新增的用户词条;用户词典更新单元,用于根据用户词条获得单元获得的用户词条,对存储的用户词典进行更新。
全文摘要
本申请公开了一种翻译方法及装置,该方法包括步骤获得对自动翻译结果进行修改得到的修改结果;根据获得的修改结果,对进行自动翻译所需的自动翻译资源进行更新;获得需进行自动翻译的源语言文本;根据更新后的自动翻译资源,将获得的源语言文本翻译为目标语言文本。采用本申请技术方案,解决了现有技术存在的自动翻译的翻译正确性较低的问题。
文档编号G06F17/28GK102467498SQ20101054867
公开日2012年5月23日 申请日期2010年11月18日 优先权日2010年11月18日
发明者刘涛, 初敏, 唐晶明, 孙健, 胡覃, 郭稷, 马永亮 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1