翻译方法、系统、终端以及存储介质与流程

文档序号:17696988发布日期:2019-05-17 21:39阅读:176来源:国知局
翻译方法、系统、终端以及存储介质与流程

本发明涉及语言翻译技术领域,具体涉及一种翻译方法、系统、终端以及存储介质。



背景技术:

现阶段,手机端存在的翻译技术可以分为三种:人工翻译、计算机辅助翻译以及机器翻译。人工翻译准确度较高,但是速度较慢,并且准确度取决于译员自身的能力水平;机器翻译速度快,然而大部分机器翻译的结果并不能直接拿来使用,因为通常会存在明显的错翻以及语法错误,还是需要通过人工翻译进行进一步校正;计算机辅助翻译则是介于二者之间的一种翻译方法,其基本思路是由计算机对待译语料进行初步翻译,初步翻译结果中,待译语料中的绝大部分都能准确翻译。

但是,由于手机端中待译语料中会存在少量的格式、特殊字符或者含义特殊化的简写等不需要翻译的标签,且由于手机端无法对不需要翻译的标签进行保留,从而导致翻译过程中会出现待译语料中不需要翻译的标签的格式或者位置被修改的情况,甚至导致漏翻和错翻,使翻译结果不甚准确,需要进行二次的人工检查并替换和添加不需要翻译的标签。



技术实现要素:

本发明针对手机端提供一种翻译方法、系统、终端以及存储介质,以解决以上现有技术中的至少一个技术问题。

本发明第一方面提供了一种翻译方法,包括:

选取包括需翻译内容和不需要翻译的不翻译标签的词句,并将所述不翻译标签替换为专有图标;

将所述需翻译内容和所述专有图标输出进行翻译;其中,所述专有图标输出后为不可修改的图标,在翻译完所述需翻译内容后,将所述专有图标设置在所述需翻译内容对应的翻译译文的起始位置和终止位置;

将所述专有图标替换为所述不翻译标签。

在一种实施方式中,将所述不翻译标签替换为专有图标的步骤包括:

将所述词句所在待翻译文本的文件扩展名修改为压缩文件扩展名;

将修改后的所述待翻译文本解压,获取文件扩展名为可扩展标识语言(如.xml,theextensiblemarkuplanguage)的文件;

打开扩展名为可扩展标识语言的文件,其中,可扩展标识语言文件中符号“<”和符号“>”之间的代码为所述不翻译标签的代码;

抽取可扩展标识语言文件中所述不翻译标签的代码,并根据抽取代码的类型设置特定的所述专有图标的代码;

将可扩展标识语言文件中所述不翻译标签的代码替换为特定的所述专有图标的代码;

将修改后的所述待翻译文本的文件扩展名修改为原文件的扩展名,以将特定的所述专有图标的代码转化为所述专有图标。

在一种实施方式中,所述专有图标的代码基于手机开发平台,调用手机核心功能接口模拟手机应用进行编译。

在一种实施方式中,将所述专有图标替换为所述不翻译标签的步骤包括:

将所述翻译译文所在的翻译文本的文件扩展名修改为压缩文件扩展名;

将修改后的所述翻译文本解压,获取扩展名为可扩展标识语言的文件;

将可扩展标识语言文件中特定的所述专有图标的代码替换为对应类型的所述不翻译标签的代码;

将修改后的所述翻译文本的文件扩展名修改为原文件的扩展名,以将所述不翻译标签的代码转化为所述不翻译标签。

在一种实施方式中,在翻译过程中,所述专有图标在手机端能被复制和粘贴。

在一种实施方式中,将所述需翻译内容和所述专有图标输出进行翻译的步骤包括:

将所述待翻译文本进行分段,以使所述专有图标和对应的所述需翻译内容作为一个整体输出进行翻译,直至输出全部所述待翻译文本。

在一种实施方式中,所述将所述专有图标替换为所述不翻译标签的步骤之前还包括:

检测所述翻译译文中所述专有图标的数量;

将所述翻译译文中所述专有图标的数量与输出的所述专有图标的数量进行比对;

在所述翻译译文与输出的所述专有图标数量不同的情况下,发出对所述翻译译文进行纠正的指令,直至所述翻译译文与输出的所述专有图标数量相同且对应。

在一种实施方式中,所述不翻译标签为专业术语、设定文本内容以及文字以外的文本属性、文本格式中的至少一种,所述文本格式包括加粗、下划线、带颜色字体、网站链接、底色、删除线以及脚注。

本发明第二方面提供了一种翻译系统,包括:

图标替换单元,所述图标替换单元用于选取包括需翻译内容和不需要翻译的不翻译标签的词句,并将所述不翻译标签替换为专有图标;

输出单元,所述输出单元用于将所述需翻译内容和所述专有图标输出进行翻译;其中,所述专有图标输出后为不可修改的图标,在翻译完所述需翻译内容后,将所述专有图标设置在所述需翻译内容对应的翻译译文的起始位置和终止位置;

标签替换单元,所述标签替换单元用于将所述专有图标替换为所述不翻译标签。

在一种实施方式中,在所述标签替换单元之前还包括:

检测单元,所述检测单元用于检测所述翻译译文中所述专有图标的数量;

比对单元,所述比对单元用于将所述翻译译文中所述专有图标的数量与输出的所述专有图标的数量进行比对;

纠正单元,所述纠正单元用于在所述翻译译文与输出的所述专有图标数量不同的情况下,发出对所述翻译译文进行纠正的指令,直至所述翻译译文与输出的所述专有图标数量相同。

本发明第三方面提供了一种翻译终端,所述终端包括:

一个或者多个处理器;

存储装置,用于存储一个或者多个程序;

当所述一个或者多个程序被所述一个或者多个处理器执行时,使得所述一个或者多个处理器实现如上述任一实施方式中所述的翻译方法。

本发明第四方面提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现如上述任一实施方式中所述的翻译方法。

本发明通过将待翻译文本中不翻译标签替换为专有图标,以使翻译时保存不翻译标签,从而提高了翻译的准确性。

上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。

附图说明

在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。

图1为本发明实施例中翻译方法的一示意性流程图;

图2为本发明实施例中翻译方法步骤演示流程图;

图3为本发明实施例中翻译方法的另一示意性流程图;

图4为本发明实施例中翻译方法步骤另一演示流程图;

图5为本发明实施例中翻译方法的又一示意性流程图;

图6为本发明实施例中翻译系统的结构框架图;

图7为本发明实施例中翻译系统的另一结构框架图。

具体实施方式

在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。

本实施例第一方面提供了一种翻译方法。

参见图1所示,翻译方法包括:

步骤s110:选取包括需翻译内容和不需要翻译的不翻译标签的词句,并将不翻译标签替换为专有图标。通常专有图标为一个图片格式的方框、数码等。

在该步骤,将需翻译内容和不翻译标签作为选取的词句。在待翻译文本中出现不翻译标签时,将不翻译标签替换为专有图标,并将两个相同专有图标设置在需翻译内容的两端,即需翻译内容的起始位置和终止位置,从而定位不翻译标签在待翻译文本中具体的位置。不翻译标签包括如下划线、引号、特殊字体等格式标注。参见图2所示,例如:翻译原文的语句为“nocross,nocrown”,其中,下划线为不翻译标签,则将下划线替换为专有图标“图标1”,由于下划线是位于需翻译内容“nocross,nocrown”中,替换的“图标1”则设置在需翻译内容“nocross,nocrown”两端,即“图标1nocross,nocrown图标1”。其中“图标1”仅为一种说明示例,“图标1”可替换为文字、图片、标识等具有标识性图标。

步骤s120:将需翻译内容和专有图标输出进行翻译;其中,专有图标输出后为不可修改的图标,在翻译完需翻译内容后,将专有图标设置在需翻译内容对应的翻译译文的起始位置和终止位置。

具体而言,将不翻译标签全部换成专有图标之后,该输出的待翻译文本中仅有专有图标和需翻译内容,并不会出现不翻译标签。然后将专有图标和需翻译内容输出,作为译员翻译参考文本。专有图标在输出后,转化为一种图片格式或者一种不可修改的格式。在翻译过程中,只需要翻译需翻译内容,在翻译完需翻译内容之后,通过复制、粘贴或移动等方式,将专有图标移动至与待翻译文本中需翻译内容对应的翻译译文的起始位置和终止位置。例如,参见图2所示,英语需翻译内容“nocross,nocrown”的中文翻译为“没有十字架就没有王冠”,由于语言的特性,译文会出现与原文的字符数出现差异。在翻译时,需要设置专有图标“图标1”,这样,专有图标“图标1”在原文中出现在需翻译内容“nocross,nocrown”的两端,而在译文中,该专有图标则对应设置在需翻译内容的翻译译文“没有十字架就没有王冠”的两端,即“图标1没有十字架就没有王冠图标1”。两端,即指起始位置和终止位置。

步骤s130:将专有图标替换为不翻译标签。根据上述步骤可知,接收专有图标和翻译译文时,两个专有图标在翻译文本中位于包括不翻译标签的需翻译内容对应的翻译译文的两端,因此在将专有图标替换为不可翻译标签时,需要以第一次出现的专有图标为标签起始位置,并以第二次出现的相同专有图标为标签终止位置。在一种具体实施例中,参见图2所示,翻译译文为:“图标1没有十字架就没有王冠图标1”,而图标1对应的不可翻译标签为下划线,则从第一出现的“图标1”开始出现下划线,到第二出现的相同的“图标1”终止下划线,即,将“图标1没有十字架就没有王冠图标1”替换为“没有十字架就没有王冠”。

在译员确认需翻译语句翻译完成后,将完成的翻译译文接收,同时在将翻译译文中带有的专有图标替换为不翻译标签,通过不翻译标签在翻译过程中的转化,保证不翻译标签输出进行翻译时不发生变化和修改。

本实施例通过将待翻译文本中不翻译标签替换为专有图标,以使翻译时保存不翻译标签,从而提高了翻译的准确性。

在一种实施例中,参见图3所示,步骤s110中将不翻译标签替换为专有图标的步骤包括:

步骤s111:将词句所在待翻译文本的文件扩展名修改为压缩文件扩展名,如.zip或.rar等。通过修改文件的扩展名,即后缀,可以将大部分主流的文档修改为需要的文档类型。

步骤s112:将修改后的待翻译文本解压,获取文件扩展名为可扩展标识语言的文件,如xml文件。通过解析可扩展标识语言文件,可以找到文档的各种内容,包括不需要翻译标签。

步骤s113:打开扩展名为可扩展标识语言的文件,其中,可扩展标识语言文件中符号“<”和符号“>”之间的代码为不翻译标签的代码。

步骤s114:抽取可扩展标识语言文件中不翻译标签的代码,并根据抽取代码的类型设置特定的专有图标的代码,其中,专有图标的代码输出后为不可修改的图标。

步骤s115:将可扩展标识语言文件中不翻译标签的代码替换为特定的专有图标的代码。

步骤s116:将修改后的待翻译文本的文件扩展名修改为原文件的扩展名,以将特定的专有图标的代码转化为专有图标。

本实施例通过修改文件后缀,从而将带翻译文档转换为特定的文档,进而将不可翻译标签抽取和替换为特定的专有图标。

在一具体实施例中,若待翻译文本的文件为test.docx文件,在待翻译文本中选取不翻译标签,并将不翻译标签替换为专有图标的步骤包括:

将待翻译文本的test.docx文件的后缀修改为test.zip文件(zip是一个文件的压缩的算法),再把修改后的test.zip文件进行解压获得扩展名为.xml的文件(即,可扩展标识语言文件),打开扩展名为xml的文件,其中,扩展名为xml的文件中所有的“<xxxxxxx>”标签均为不需要翻译标签,下划线、标色字体、加粗等都是“<xxxxxxx>”标签,x表示未知代码,通过代码抽取,将扩展名为xml的文件中所有的“<xxxxxxx>”标签依次替换为专有图标,其中,每种类型的“<xxxxxxx>”标签均有对应的特定的专有标签,比如,参见图2和图4所示,不翻译标签与专有图标互换时,下划线对应的特定的专有标签为“图标1”,而加粗对应的特定的专有标签则为“图标2”,将扩展名为xml的文件中所有的“<xxxxxxx>”标签依次替换为专有图标后,再将文件按照之前的恢复成待翻译文本的文件类型,即test.docx文件。压缩文件也包括.rar文件。

在一种实施例中,专有图标的代码基于手机开发平台,调用手机核心功能接口模拟手机应用进行编译。在一具体实施例中,专有图标的代码基于原生app接口开发,对于手机端的android系统使用java编写,手机端的ios系统使用object-c编写,因此,该专有图标实际是一种专门针对手机的专有图标,进而使翻译过程也是在对应的手机端进行。

在一种实施例中,将专有图标替换为不翻译标签的步骤包括:

将所述翻译译文所在的翻译文本的文件扩展名修改为压缩文件扩展名(如zip或.rar等);通过修改文件的后缀,可以将大部分主流的文档修改为需要的文档类型。

将修改后的待翻译文本解压,获取扩展名为可扩展标识语言的文件;可扩展标识语言为可扩展标记语言。通过解析可扩展标识语言文件,可以找到文档的各种内容,包括专有图标。

将可扩展标识语言文件中特定的专有图标的代码替换为对应类型的不翻译标签的代码;在不翻译标签替换为专有图标的步骤中,使用的特定的专有图标的代码均需要进行记录,以方便在专有图标替换为不翻译标签时进行代码替换,并根据记录的数量进行查验。

将修改后的翻译文本的文件扩展名修改为原文件的扩展名,以将不翻译标签的代码转化为不翻译标签。这样,就可以获得具有不翻译标签的翻译文本,翻译文本中的不翻译标签是可以进行修改,本步骤可以在输出翻译时,使不翻译标签具有不可以修改的特性,从而增加翻译的准确性。

该步骤与将不翻译标签替换为专有图标的步骤为相似,均是通过将文件转化为扩展名为可扩展标识语言的文件,然后抽取和替换扩展名为可扩展标识语言的文件中的代码,从而实现不翻译标签与专有图标之间的替换,其中,本发明替换专有图标是根据定义的不翻译标签进行的,扩展名为可扩展标识语言的文件中各种标签的代码都显示出来,在一种具体实施例中,包括一种替换方法,确定不翻译标签的类型,获取每一种不翻译标签的具体代码,在扩展名为可扩展标识语言的文件中查询中与获取的具体代码相同的代码并进行抽取,同时替换成专有图标的代码,且每种不翻译标签的代码对应被替换为一种专有图标的代码,若在不同位置出现相同的不翻译标签的代码,则使用同一专有图标的代码。

在一种实施例中,在翻译过程中,专有图标能被复制和粘贴,不能被修改。这样,翻译过程中,根据待翻译文字和翻译文字之间产生的字符差异,通过粘贴和复制调整专有图标的位置,使专有图标在翻译文本中也设置在翻译词语的两端,具体参照步骤s120所述。

在一种实施例中,将需翻译内容和专有图标输出进行翻译的步骤包括:

将待翻译文本进行分段,以使专有图标和对应的需翻译内容作为一个整体输出进行翻译,直至输出全部待翻译文本。这样,专有图标与需翻译内容存在对应关系,以使在翻译译文产生字符差异时,可以简单且准确移动专有图标在翻译译文整体的两端即可,从而使专有图标在翻译文本中位于正确位置。同时,该步骤也可以防止整个文本进行翻译,忘记将专有图标移动至正确位置。

在一种实施例中,参见图5所示,步骤s130中将专有图标替换为不翻译标签的步骤之前还包括:

s121:检测翻译译文中专有图标的数量;专有图标仅具有不可修改性,在翻译过程中可以被剪切,检测专有图标的数量可以增加翻译译文的准确性。

s122:将翻译译文中专有图标的数量与输出的专有图标的数量进行比对;通过比对来判断翻译译文是否具备正确数量的专有图标。

s123:在翻译译文与输出的专有图标数量不同的情况下,发出对翻译译文进行纠正的指令,直至翻译译文与输出的专有图标数量相同且对应。这样,可以有效防止专有图标缺失,提供翻译准确性,从而在图标与标签替换后,翻译译文具有正确的不可翻译标签。

在一种实施例中,不翻译标签为专业术语、设定文本内容以及文字以外的文本属性、文本格式中的至少一种。文本格式包括加粗、下划线、带颜色字体、网站链接、底色、删除线以及脚注等,包含但不限于此。具体的不翻译标签类型可以自行设定,只要将设定的标签的具体代码确定,就可以在扩展名为可扩展标识语言的文件中抽取和替换。

参见图6所述,本实施例第二方面提供了一种翻译系统,包括:图标替换单元110、输出单元120以及标签替换单元130。

图标替换单元110用于选取包括需翻译内容和不需要翻译的不翻译标签的词句,并将不翻译标签替换为专有图标。通常专有图标为一个图片格式的方框、数码等。专有图标作为待翻译文本输出时,可转化为不可修改的图标。在需翻译内容中出现不翻译标签时,将不翻译标签替换为专有图标,并将两个相同专有图标设置在需翻译内容的两端,即需翻译内容的起始位置和终止位置,从而定位不翻译标签在待翻译文本中具体的位置。

输出单元120用于将需翻译内容和专有图标输出进行翻译;其中,专有图标输出后为不可修改的图标,在翻译完需翻译内容后,将专有图标设置在需翻译内容对应的翻译译文的起始位置和终止位置。将不翻译标签全部换成专有图标之后,输出的待翻译文本中仅有专有图标和需翻译内容,并不会出现不翻译标签。然后将专有图标和需翻译内容输出,作为译员翻译参考文本。专有图标在输出后,转化为一种图片格式或者一种不可修改的格式。在翻译过程中,只需要翻译需翻译内容,在翻译完需翻译内容之后,通过复制、粘贴或移动等方式,将专有图标移动至需翻译内容对应的翻译译文的起始位置和终止位置。

标签替换单元130用于接收专有图标和翻译译文,并将专有图标替换为不翻译标签。两个专有图标在翻译文本中位于具有不翻译标签语句的两端,因此在将专有图标替换为不可翻译标签时,需要以第一次出现的专有图标为不翻译标签起始位置,并以第二次出现的相同专有图标为不翻译标签终止位置。

本实施例翻译系统通过将待翻译文本中不翻译标签替换为专有图标,以使翻译时保存不翻译标签,从而提高了翻译的准确性。

在一种实施例中,参见图7所示,在标签替换单元130之前还包括:检测单元140、比对单元150和纠正单元160。

检测单元140用于检测翻译译文中专有图标的数量;专有图标仅具有不可修改性,在翻译过程中可以被剪切,检测专有图标的数量可以增加翻译文本的准确性。

比对单元150用于将翻译译文中专有图标的数量与输出的专有图标的数量进行比对。通过比对来判断翻译译文是否具备正确数量的专有图标。

纠正单元160用于在翻译译文与输出的专有图标数量不同的情况下,发出对翻译译文进行纠正的指令,直至翻译译文与输出的专有图标数量相同且对应。这样,可以有效防止专有图标缺失,提供翻译准确性,从而在图标与标签转化后,翻译译文具有正确的不可翻译标签。

在一种实施例中,图标替换单元110包括修改子单元、解压子单元、抽取子单元以及替换子单元。

修改子单元配置成用于将词句所在待翻译文本的文件扩展名修改为压缩文件扩展名。

解压子单元配置成用于将修改后的待翻译文本解压,获取文件扩展名为可扩展标识语言的文件。

抽取子单元配置成用于打开扩展名为可扩展标识语言的文件,其中,可扩展标识语言文件中符号“<”和符号“>”之间的代码为所述不翻译标签的代码;并抽取可扩展标识语言文件中不翻译标签的代码,并根据抽取代码的类型设置特定的专有图标的代码。

替换子单元配置成用于将可扩展标识语言文件中不翻译标签的代码替换为特定的专有图标的代码。

修改子单元还配置成用于将修改后的待翻译文本的文件扩展名修改为原文件的扩展名,以将特定的专有图标的代码转化为专有图标。

本实施例第三方面提供了一种翻译终端,终端包括:

一个或者多个处理器;

存储装置,用于存储一个或者多个程序;

当一个或者多个程序被一个或者多个处理器执行时,使得一个或者多个处理器实现如上述任一实施方式中的翻译方法。

本实施例翻译终端利用如上述任一实施方式中的翻译方法,将待翻译文本中不翻译标签替换为专有图标,以使翻译时保存不翻译标签,从而提高了翻译的准确性。

本实施例第四方面提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现如上述任一实施方式中的翻译方法。

本实施例计算机可读存储介质存储的程序可实现上述任一实施方式中的翻译方法,将待翻译文本中不翻译标签替换为专有图标,以使翻译时保存不翻译标签,从而提高了翻译的准确性。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接,还可以是通信;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

在本发明中,除非另有明确的规定和限定,第一特征在第二特征之“上”或之“下”可以包括第一和第二特征直接接触,也可以包括第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。而且,第一特征在第二特征“之上”、“上方”和“上面”包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度小于第二特征。

上文的公开提供了许多不同的实施方式或例子用来实现本发明的不同结构。为了简化本发明的公开,上文中对特定例子的部件和设置进行描述。当然,它们仅仅为示例,并且目的不在于限制本发明。此外,本发明可以在不同例子中重复参考数字和/或参考字母,这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施方式和/或设置之间的关系。此外,本发明提供了的各种特定的工艺和材料的例子,但是本领域普通技术人员可以意识到其他工艺的应用和/或其他材料的使用。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1