一种用于英语翻译的文本数据处理方法与流程

文档序号:16670177发布日期:2019-01-18 23:31阅读:277来源:国知局

本发明涉及英语翻译技术领域,具体涉及一种用于英语翻译的文本数据处理方法。



背景技术:

随着国际交流的不断深入,对英语文件的翻译需求也越来越大,促使了一大批英语翻译的工具的出现,这些英语翻译工具通常分为在线版和本地版,而无论在线版和本地版都是在数据库中搜索译文进行翻译,这些翻译工具的出现极大的满足了用户的翻译需求,对提高翻译效率,推动社会进步作出了贡献。

而由于英语的语法、规则众多,翻译工具的数据库中不一定能够完全匹配到需要翻译的语句,基本上都是将待翻译的语句进行一对一的单词翻译,时态和语序经常发生错误,并且翻译生硬,达不到翻译中常说的信、达、雅的翻译要求。此时还需要有英语基础的用户进行逐句的校对,理顺语序,调整时态,根据自己的语法知识重新组织语言,这些对于英语基础差的用户来说就显得无能无力了。



技术实现要素:

为解决上述问题,本发明提供了一种用于英语翻译的文本数据处理方法。

为实现上述目的,本发明采取的技术方案为:

一种用于英语翻译的文本数据处理方法,包括如下步骤:

s1、将待翻译数据进行分割,识别所述待翻译数据中的标点,以句号为分割位置,得到以句子为单位的文本信息;

s2、基于预设的检索模型完成所述文本信息中特征项的识别,若存在所述特征项,则将该文本数据输送至人工翻译模块/特殊翻译模块进行翻译,若不存在所述特征项,则进入步骤s3;

s3、基于预设的英语翻译规则将所述文本信息的分割成由单词、短语组成的几个模块,并完成该文本信息中各单词、短语排列规则的获取;

s4、以所述单词、短语为查询条件在本地数据库中查询对应的翻译数据,然后基于所述文本信息中各单词、短语排列规则,将查询到的数据对应的翻译结果进行排列,输出句子翻译结果;

s5、重复步骤s3-s4,完成所有无特征项句子的翻译,然后将所有无特征句子的翻译与有特征句子的人工翻译模块的翻译结果/特殊翻译模块的翻译结果进行整合输出至客户端。

进一步地,所述检索模型为概率检索模型、布尔逻辑模型中的一种。

进一步地,所述特征项为需要特定翻译的英语语法。

进一步地,还包括将有特征项的句子及其对应的人工翻译结果存储在特殊翻译资料数据库内的步骤。

进一步地,所述特殊翻译模块以具有特征项的句子为查询条件在特殊翻译资料数据库内进行最接近数据的查询,

进一步地,所述最接近数据与查询条件的相似率不得低于百分之80,若低于百分之80,则启动人工翻译模块。

进一步地,所述步骤s5基于各句子所在的位置进行各翻译结果的整合。

本发明具有以下有益效果:

首先将带翻译数据拆分为需要特定翻译的英语语法部分和常规翻译部分,然后再将常规翻译部分依据预设的英语翻译规则拆成单词部分和短语部分,从而避免了翻译时时态以及语序的错误,同时可以通过人工翻译模块对特定翻译部分进行翻译,一方面可以使得翻译更加准确,另一方面也实现了数据库内数据的更新填充。

具体实施方式

为了使本发明的目的及优点更加清楚明白,以下结合实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

实施例1

一种用于英语翻译的文本数据处理方法,包括如下步骤:

s1、将待翻译数据进行分割,识别所述待翻译数据中的标点,以句号为分割位置,得到以句子为单位的文本信息;

s2、基于预设的概率检索模型完成所述文本信息中特征项的识别,若存在所述特征项,则将该文本数据输送至特殊翻译模块进行翻译,特殊翻译模块以具有特征项的句子为查询条件在特殊翻译资料数据库内进行最接近数据的查询,其中,所述最接近数据与查询条件的相似率不得低于百分之80,若低于百分之80,则启动人工翻译模块;若不存在所述特征项,则进入步骤s3;

s3、基于预设的英语翻译规则将所述文本信息的分割成由单词、短语组成的几个模块,并完成该文本信息中各单词、短语排列规则的获取;

s4、以所述单词、短语为查询条件在本地数据库中查询对应的翻译数据,然后基于所述文本信息中各单词、短语排列规则,将查询到的数据对应的翻译结果进行排列,输出句子翻译结果;

s5、重复步骤s3-s4,完成所有无特征项句子的翻译,然后将所有无特征句子的翻译与有特征句子的人工翻译模块的翻译结果/特殊翻译模块的翻译结果进行整合输出至客户端。

实施例2

一种用于英语翻译的文本数据处理方法,包括如下步骤:

s1、将待翻译数据进行分割,识别所述待翻译数据中的标点,以句号为分割位置,得到以句子为单位的文本信息;

s2、基于预设的布尔逻辑模型完成所述文本信息中特征项的识别,若存在所述特征项,则将该文本数据输送至特殊翻译模块进行翻译,特殊翻译模块以具有特征项的句子为查询条件在特殊翻译资料数据库内进行最接近数据的查询,其中,所述最接近数据与查询条件的相似率不得低于百分之80,若低于百分之80,则启动人工翻译模块;若不存在所述特征项,则进入步骤s3;

s3、基于预设的英语翻译规则将所述文本信息的分割成由单词、短语组成的几个模块,并完成该文本信息中各单词、短语排列规则的获取;

s4、以所述单词、短语为查询条件在本地数据库中查询对应的翻译数据,然后基于所述文本信息中各单词、短语排列规则,将查询到的数据对应的翻译结果进行排列,输出句子翻译结果;

s5、重复步骤s3-s4,完成所有无特征项句子的翻译,然后将所有无特征句子的翻译与有特征句子的人工翻译模块的翻译结果/特殊翻译模块的翻译结果进行整合输出至客户端。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。



技术特征:

技术总结
本发明公开了一种用于英语翻译的文本数据处理方法,包括如下步骤:将待翻译数据分割成以句子为单位的文本信息,然后基于检索模型完成文本信息中特征项的识别,若存在特征项,则将该文本数据输送至人工翻译模块/特殊翻译模块进行翻译,若不存在,则基于预设的英语翻译规则将文本信息的分割成由单词、短语组成的几个模块,并完成该文本信息中各单词、短语排列规则的获取;以单词、短语为查询条件在本地数据库中查询对应的翻译数据,然后基于排列规则,将查询到的数据对应的翻译结果进行排列,输出句子翻译结果;完成无特征句子与有特征句子的翻译结果的整合,输出至客户端。本发明避免了翻译时时态以及语序的错误,同时可以缩小系统的翻译盲区。

技术研发人员:王萍
受保护的技术使用者:九江学院
技术研发日:2018.08.20
技术公布日:2019.01.18
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1