一种翻译方法及装置与流程

文档序号:11250876
一种翻译方法及装置与流程
本发明实施例涉及计算机技术领域,具体涉及一种翻译方法及装置。

背景技术:
现有技术存在的翻译方法,可以将用户输入的文本从源语言翻译到目标语言,例如从中文翻译到英文。在进行翻译时,用户输入的文本中若存在成语、古诗词、网络热词等较难翻译的部分时,现有技术不能提供准确的翻译结果,例如,当用户输入“空山不见人,但闻人语响”时,现有技术提供的翻译结果为“Nomountains,buthearavoice”。由此可见,现有技术的翻译方法,对于成语、古诗词、网络热词等较难翻译的语句不能够提供准确、理想的翻译结果。

技术实现要素:
本发明实施例旨在提供一种翻译方法及装置,可以识别出源语言文本中的固定语义单元,并获取所述固定语义单元的源语言释义,利用所述源语言释义得到目标语言的翻译结果,准确率高、覆盖范围广。为此,本发明实施例提供如下技术方案:第一方面,本发明实施例提供了一种翻译方法,包括:获取源语言文本,识别所述源语言文本是否包含固定语义单元;当识别出所述源语言文本中包含固定语义单元时,获取所述固定语义单元的源语言释义;所述源语言释义通过采用源语言解释所述固定语义单元的含义得到;对所述源语言释义进行翻译,得到以目标语言表示的翻译结果;所述目标语言与所述源语言属于不同语种。第二方面,本发明实施例提供了一种翻译装置,包括:识别单元,用于获取源语言文本,识别所述源语言文本是否包含固定语义单元;释义单元,用于当识别出所述源语言文本中包含固定语义单元时,获取所述固定语义单元的源语言释义;所述源语言释义通过采用源语言解释所述固定语义单元的含义得到;翻译单元,用于对所述源语言释义进行翻译,得到以目标语言表示的翻译结果;所述目标语言与所述源语言属于不同语种。第三方面,本发明实施例提供了一种用于翻译的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取源语言文本,识别所述源语言文本是否包含固定语义单元;当识别出所述源语言文本中包含固定语义单元时,获取所述固定语义单元的源语言释义;所述源语言释义通过采用源语言解释所述固定语义单元的含义得到;对所述源语言释义进行翻译,得到以目标语言表示的翻译结果;所述目标语言与所述源语言属于不同语种。第四方面,本发明实施例提供了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如第一方面所示的翻译方法。本发明实施例提供的翻译方法及装置,可以识别出源语言文本中包含的固定语义单元,并获取所述固定语义单元的源语言释义,利用所述源语言释义得到目标语言的翻译结果,准确率高、覆盖范围广。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明一实施例提供的翻译方法流程图;图2为本发明一实施例提供的翻译装置示意图;图3是根据另一示例性实施例示出的一种翻译的装置的框图;图4是根据一示例性实施例示出的服务器的框图。具体实施方式现有技术中,当用户输入的源语言文本包含固定语义单元时,例如源语言文本包含古诗词、成语或者网络用语时,往往不能够得到准确的翻译结果。举例说明,用户输入的源语言文本为“我好蓝瘦香菇啊”,现有技术提供的译文为“I'msoblueandthinletinousedodes”,与源语言文本的含义相去甚远。再例如,用户输入的源语言文本为“一叶障目很可怕”,现有技术提供的译文为“Haveaterrible”。由此可见,当在一个句子或段落中出现成语、古文或者网络用语时,现有技术不能提供准确的翻译。申请人经过研究发现,当源语言文本存在生涩难懂的内容时,例如存在成语、古文或者网络用语时,理解源语言文本本身就很难,直接对其翻译则更难。这是因为与此相关的双语训练语料稀少,机器翻译模型较难学会如何翻译。此外,由于成语、古文或者网络用语相对于普通词汇较为精炼,存在许多隐含含义,因此较难翻译。而本发明旨在提供一种翻译方法及装置,可以识别出源语言文本中包含的固定语义单元,并获取所述固定语义单元的源语言释义,所述源语言释义是相对简单易懂的表述,再利用所述释义得到目标语言的翻译结果,由此获得的翻译结果准确率高、覆盖范围广。其中,语义单元可以但不限于包括字符、字符串、短语或短句等,例如古诗词、成语或者网络用语等。为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。下面将结合附图1对本发明示例性实施例示出的翻译方法进行介绍。参见图1,为本发明一实施例提供的翻译方法流程图。如图1所示,可以包括:S101,获取源语言文本,识别所述源语言文本是否包含固定语义单元。具体实现时,源语言文本具体可以为用户输入的待翻译文本。用户还可以通过用户界面选择需要翻译为的目标语言,翻译结果使用目标语言表示。一般地,源语言与目标语言属于不同语种。本发明可以识别源语言文本中包含的固定语义单元。本发明可以预先建立语义单元库,用于存储预设的语义单元。在识别源语言文本是否包含固定语义单元时,可以将所述源语言文本与语义单元库中包括的预设语义单元进行匹配;若存在匹配结果,确定所述源语言文本中包含固定语义单元。其中,所述固定语义单元包括成语、网络用语、古诗词或者歇后语。举例说明,用户输入的源语言文本为中文句子“我好蓝瘦香菇”时,可以将源语言文本与预设的固定语义单元库中的语义单元进行匹配,当源语言文本中存在或者包括与预设的固定语义单元匹配的语义单元时,例如“蓝瘦香菇”,可以对识别出的语义单元“蓝瘦香菇”进行标记,进而在S102中获取进行标记的语义单元的释义。又如,用户输入的源语言文本为中文句子“无为在歧路,儿女共沾巾”时,将源语言文本与语义单元库中的语义单元进行匹配,存在匹配结果“无为在歧路,儿女共沾巾”,这时可以标记匹配结果,将其作为S102的输入,获取相应释义。又如,用户输入的源语言文本为中文句子“一叶障目很可怕”时,可以识别出所述源语言文本存在成语“一叶障目”。需要说明的是,只要源语言文本中的部分语义单元与语义单元库中的语义单元匹配,即可以确定存在匹配结果。S102,当识别出所述源语言文本中包含固定语义单元时,获取所述固定语义单元的源语言释义;所述源语言释义通过采用源语言解释所述固定语义单元的含义得到。其中,所述源语言释义与所述固定语义单元属于同一语种且所述释义由基本词汇构成。需要说明的是,本发明实施例可以将复杂的源语言文本转换为较简单的源语言释义,再将源语言释义翻译为目标语言,大大降低了翻译的复杂度,提高了翻译的准确性。其中,释义与源语言文本属于同一语种。释义通过解释所述固定语义单元的含义得到。所述释义与所述固定语义单元属于同一语种,一般地,释义由基本词汇构成。基本词汇一般是语言词汇中最主要的部分,一般是日常生活中最必须、最常用、最普遍、最明确,能够被使用这种语言的群体所共同理解和使用。因此,将固定语义单元转换成简单易懂的、由基本词汇构成的释义,再对释义进行源语言到目标语言的翻译,则更容易获得准确的翻译结果。举例说明,释义可以理解为解释词语或者短句的含义,例如是将语言A下的词语a,转换为语言A下的解释b。其中,词语a与解释b的含义相同,但表述不同,解释b更简单通用、易于理解。需要说明的是,释义一般是通过解释短语或者短句的含义得到,并不等同于同义词或者近义词。根据固定语义单元的种类不同,获取所述固定语义单元的释义可以包括以下几种情况:(1)当所述固定语义单元为成语时,获取使用现代文表示的所述成语的含义。举例说明,若源语言文本存在成语“一叶障目”,则获取“一叶障目”的释义为“一片叶子挡在眼前会让人看不到外面的广阔世界”。又如,若源语言文本存在成语“坐井观天”,则获取“坐井观天”的释义为“坐在井底看天,用来比喻和讽刺眼界狭窄或学识肤浅之人”。(2)当所述固定语义单元为网络用语时,获取使用基本词汇表示的所述网络用语的含义。举例说明,若源语言文本存在网络用语“蓝瘦香菇”,则获取“蓝瘦香菇”的释义为“难受,想哭”。(3)当所述固定语义单元为古诗词时,获取现代文表示的所述古诗词的含义。举例说明,若源语言文本存在古诗词“空山不见人,但闻人语响”,则获取“空山不见人,但闻人语响”的释义为“幽静的山谷里看不见人,只能听到那说话的声音。”(4)当所述固定语义单元为歇后语时,获取使用基本词汇表示的所述歇后语的含义。举例说明,若源语言文本存在歇后语“竹篮打水一场空”,则获取“竹篮打水一场空”的释义为“白费力气”。需要说明的是,在一些实施方式中,可以预先建立释义翻译模型。具体地,可以利用固定语义单元以及与其匹配的释义的同语语料,训练得到释义翻译模型。则所述获取所述固定语义单元的释义包括:利用预先建立的释义翻译模型对所述固定语义单元进行解释,得到与所述固定语义单元对应的释义。以中文为例进行说明,可以利用古诗、成语、网络词语等到现代文的语料,训练机器翻译模型,得到古诗、成语、网络用语到现代文的语料翻译模型。其中,训练使用的机器翻译模型可以使用通用的模型,例如可以使用基于统计的机器翻译模型,也可使用基于神经网络的机器翻译模型。在建立释义翻译模型后,即可以利用释义翻译模型对所述固定语义单元进行解释,得到与所述固定语义单元对应的释义。需要说明的是,释义翻译模型的精度相对不高,但是可以对任意输入进行释义,覆盖度较好。在另一些实施方式中,还可以建立释义挖掘模型。所述释义挖掘模型用于从网络上获取语义单元的同语言释义。在获取所述固定语义单元的释义时,可以利用预先建立的释义挖掘模型从网络上获取与所述固定语义单元匹配的释义。举例说明,可以从网络等公开环境中挖掘古诗、成语、网络用语的释义。例如,可以利用古诗库、成语库、网络用语库,挖掘其释义。以...
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1