机票类目CAT规则的翻译方法和装置与流程

文档序号:17049254发布日期:2019-03-05 19:52阅读:635来源:国知局
机票类目CAT规则的翻译方法和装置与流程

本申请涉及规则文本翻译的技术领域,具体涉及一种机票类目cat规则的翻译方法,另外还涉一种机票类目cat规则的翻译装置。



背景技术:

为了方便用户从网上订购机票,很多机票订购平台提供订购机票的功能,但是每个航空公司会有不同的机票订购规则,而这些规则将会通过gds(全球分销系统)接口输入至不同的机票订购平台。但是,不同航空公司的机票购买规则采用的表述语言是自然语言描述的,并且各航空公司的录入习惯也不一致,没有官方统一的写法和标准,造成不同航空公司的规则各不相同且描述语言没有规律可循,因此,获知的机票订购规则需要翻译成计算机可执行和运用的语言。

其中,利用计算机技术对于这种比较随意的非结构化数据,自动进行有用信息提取,可称为上述的翻译。但是,现有技术中采用的翻译方式是将整个规则文本翻译之后,将翻译结果与整个规则文本存储。整个规则文本的翻译解析需要大量的人力资源来维护,更大的问题是有新的规则只要与存储的整个规则文本不能完全匹配的(可能只是多了几个空格的情况),就需要人工介入重新对新的规则进行翻译解析。

因此,现有技术面临着开发逻辑零碎,代码复杂,难维护等问题,以及由于各种未知描述格式带来的变化,导致需要经常修改代码,耗费人力资源等的问题。



技术实现要素:

本申请提供一种机票类目cat规则的翻译方法,以解决现有技术中存在的上述问题。

本申请另外提供一种机票类目cat规则的翻译装置。

本申请提供一种机票类目cat规则的翻译方法,该方法包括:

确定机票cat规则文本中包含的cat,所述机票cat规则文本中包含与至少一个cat相关的规则数据;

按照确定的所述cat,将所述机票cat规则文本拆分成以cat为单位的子文本;

调用翻译引擎,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则;

组合所述子文本对应的cat子规则,得到所述机票cat规则文本对应的机票cat规则。

可选的,预先设置有用于配置结构化数据的翻译规则的脚本配置文件;

所述调用翻译引擎,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则,包括:

利用所述翻译引擎加载所述脚本配置文件,解析得到所述结构化数据的翻译规则;

利用所述翻译规则,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则。

可选的,所述脚本配置文件是用户根据自定义脚本模板所自定义配置的脚本文件。

可选的,所述结构化数据的翻译规则中包括:为不同类别的cat配置有对应的cat子规则,以将该cat对应的子文本翻译为相应的结构化的cat子规则。

可选的,所述为不同类别的cat配置有对应的cat子规则中,采用的配置方式包括:

通过正则表达式的方式,查找与所述子文本相匹配的结构化的cat子规则;

将查找得到的结构化的cat子规则配置给相应的子文本。

可选的,所述为不同类别的cat配置有对应的cat子规则中,所述子文本为多个时,为子文本配置结构化的cat子规则的方式包括:

确定多个子文本之间的优先级顺序;

按照所述优先级顺序依次为所述子文本配置相应的结构化的cat子规则。

可选的,若所述机票cat规则文本中包含多个cat;每个cat拆分出多个子文本;

所述确定多个子文本之间的优先级顺序,包括:确定每个cat中拆分出的多个子文本之间的优先级顺序;

为处于同等优先级顺序的子文本同时配置相应的结构化的cat子规则。

本申请还提供一种机票类目cat规则的翻译方法,该方法包括:

确定航空公司提供的机票cat规则文本中包含的cat,所述机票cat规则文本中包含与至少一个cat相关的规则数据;

按照所述机票cat规则文本中包含的cat,将所述机票cat规则文本拆分成以cat为单位的子文本;

调用翻译引擎,分别对所述子文本进行翻译,得到所述子文本对应的结构化cat规则;

组合所述子文本对应的结构化cat规则,得到所述航空公司的机票cat规则。

可选的,预先设置有用于配置结构化数据的翻译规则的脚本文件;

所述调用翻译引擎,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则,包括:

利用所述翻译引擎加载所述脚本配置文件,解析得到所述结构化数据的翻译规则;

利用所述翻译规则,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则。

本申请还提供一种票务类目cat规则的翻译方法,所述票务能够按照类目cat划分,每个cat包括票务相关的规则,包括:

确定票务cat规则文本中包含的cat,所述票务cat规则文本中包含与至少一个cat相关的规则数据;

按照所述票务cat规则文本中包含的cat,将所述票务cat规则文本拆分成以cat为单位的子文本;

调用翻译引擎,分别对所述子文本进行翻译,得到所述子文本对应的结构化cat规则;

组合所述子文本对应的结构化cat规则,得到所述票务cat规则。

可选的,预先设置有用于配置结构化数据的翻译规则的脚本文件;

所述调用翻译引擎,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则,包括:

利用所述翻译引擎加载所述脚本配置文件,解析得到所述结构化数据的翻译规则;

利用所述翻译规则,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则。

本申请还提供一种机票类目cat规则的翻译装置,该装置包括:

确定单元,用于确定机票cat规则文本中包含的cat,所述机票cat规则文本中包含与至少一个cat相关的规则数据;

拆分单元,用于按照确定的所述cat,将所述机票cat规则文本拆分成以cat为单位的子文本;

调用单元,用于调用翻译引擎,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则;

组合单元,用于组合所述子文本对应的cat子规则,得到所述机票cat规则文本对应的机票cat规则。

可选的,该装置还包括:

预设单元,用于预先设置有用于配置结构化数据的翻译规则的脚本文件;

所述调用单元包括:

解析子单元,用于利用所述翻译引擎加载所述脚本配置文件,解析得到所述结构化数据的翻译规则;

翻译子单元,用于利用所述翻译规则,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则。

可选的,所述预设单元包括:

设置子单元,用于为不同类别的cat配置有对应的cat子规则,以将该cat对应的子文本翻译为相应的结构化的cat子规则。

可选的,所述设置子单元包括:

查找子单元,用于通过正则表达式的方式,查找与所述子文本相匹配的结构化的cat子规则;

匹配子单元,用于将查找得到的结构化的cat子规则配置给相应的子文本。

可选的,所述子文本为多个时;

所述设置子单元包括:

优先级设置子单元,用于确定多个子文本之间的优先级顺序;

顺序配置子单元,用于按照所述优先级顺序依次为所述子文本配置相应的结构化的cat子规则。

本申请还提供一种机票类目cat规则的翻译装置,该装置包括:

确定单元,用于确定航空公司提供的机票cat规则文本中包含的cat,所述机票cat规则文本中包含与至少一个cat相关的规则数据;

拆分单元,用于按照所述机票cat规则文本中包含的cat,将所述机票cat规则文本拆分成以cat为单位的子文本;

调用单元,用于调用翻译引擎,分别对所述子文本进行翻译,得到所述子文本对应的结构化cat规则;

组合单元,用于组合所述子文本对应的结构化cat规则,得到所述航空公司的机票cat规则。

本申请还提供一种票务类目cat规则的翻译装置,所述票务能够按照类目cat划分,每个cat包括票务相关的规则,该装置包括:

确定单元,用于确定票务cat规则文本中包含的cat,所述票务cat规则文本中包含与至少一个cat相关的规则数据;

拆分单元,用于按照所述票务cat规则文本中包含的cat,将所述票务cat规则文本拆分成以cat为单位的子文本;

调用单元,用于调用翻译引擎,分别对所述子文本进行翻译,得到所述子文本对应的结构化cat规则;

组合单元,用于组合所述子文本对应的结构化cat规则,得到所述票务cat规则。

与现有技术相比,本申请具有以下优点:

本申请提供一种机票类目cat规则的翻译方法,该方法包括以下步骤:确定机票cat规则文本中包含的cat,所述机票cat规则文本中包含与至少一个cat相关的规则数据;按照确定的所述cat,将所述机票cat规则文本拆分成以cat为单位的子文本;调用翻译引擎,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则;组合所述子文本对应的cat子规则,得到所述机票cat规则文本对应的机票cat规则。。

采用本申请提供的该方法可以将机票cat规则文本中的规则文本按照cat为单位的子文本进行翻译,获得相对应的cat子规则,最终将所有cat子规则组合为完整的机票cat规则。所述规则文本为非结构化数据,而最终形成的机票cat规则则是结构化数据,因此,采用本申请提供的方法实现非结构化数据转换为结构化数据的过程。另外,本申请采用的方法是将机票cat规则文本拆分成以cat为单位的子文本,针对单个的子文本进行翻译,因此,可以将翻译细节从流程里面分离出来,代码层只用控制翻译的流程,不需要关注每个子文本翻译的细节,最终将每个子规则组合起来就可以形成完整的机票cat规则。总之,采用该方法可起到易扩展,易维护,因为不需要关注翻译细节因此不需要重新发布应用,并且能够做到修改及时生效。

附图说明

图1是本申请第一实施例提供的机票类目cat规则的翻译方法的流程图。

图2是本申请第一实施例提供的机票类目cat规则的翻译方法的具体过程图。

图3是本申请第二实施例提供的机票类目cat规则的翻译装置的示意图。

图4是本申请第三实施例提供的机票类目cat规则的翻译方法的流程图。

图5是本申请第四实施例提供的机票类目cat规则的翻译装置的示意图。

图6是本申请第五实施例提供的机票类目cat规则的翻译方法的流程图。

图7是本申请第六实施例提供的机票类目cat规则的翻译装置的示意图。

具体实施方式

本申请提供一种机票类目cat规则的翻译方法,该方法主要可以在服务端执行,所述机票类目cat规则的翻译的过程实际是将非结构化数据翻译为结构化数据的过程,以方便计算机采用机器语言进行数据的处理和传输。

以下通过具体的实施例对本申请提供的方法进行详细的介绍和说明。

图1是本申请第一实施例提供的机票类目cat规则的翻译方法的流程图。请参照图1,本申请第一实施例提供的机票类目cat规则的翻译方法,该方法包括以下步骤:

步骤s101,确定机票cat规则文本中包含的cat,所述机票cat规则文本中包含与至少一个cat相关的规则数据。

该步骤是确定机票cat规则文本中包含的cat的过程,并且,一般情况下,所述机票cat规则文本中包含与多个cat相关的规则数据。

所述cat是category,类别、类目的含义,而每个机票cat表示与机票相关的某一块业务数据,如下表:

从上表可以看出,不同的机票cat所表征的数据类型是不同的,例如,cat0是指该运价所适用的范围,可能该适用范围限制于学生,或者仅适合年龄超过50岁的人群使用等。又例如,cat10是指儿童或者婴儿的折扣价格,在该类目的数据中,仅适用于儿童或者婴儿的情况下有折扣。从上表可以明确的看出不同的cat所代表的不同类型的数据的情况。

cat规则可以理解成每个类别的数据,这些数据描述的是机票的能够如何被使用,即使用的条件,所以我们一般称这些数据为“规则”。例如:上表中的cat1数据描述的是乘客的身份,它可能限制使用的规则是:只有学生可以使用这个机票,或者仅适合年龄超过50岁的人群使用等。又例如,cat10数据表述是折扣的限制人群,它限制的是仅儿童或者婴儿可以享受该折扣价格。除了上表中列出的类目,还可以包括一些对机票的价格限制,机票对应的可允许的行李重量条件的限制等规则数据的其他未列出的类目。

机票cat规则数据本身的分类已经确定,每个cat名称就可以是类别名,类别里面的数据是机票使用的规则,只是每个类别描述的机票产品的属性不同,而机票的规则均可以从属于其中一个类别中。

另外,每个航空公司发过来的机票cat规则各有不同,输入方式也可能不同,因此,通过本申请提供的方法完成自动的机器翻译,将不同的机票cat规则文本变成结构化的机票cat规则,从而能够大大提高效率。

上述翻译过程是指将非结构化数据(机票cat规则文本)翻译为结构化数据(机票cat规则)的过程,以下是关于结构化数据和非结构化数据的特性进行介绍和说明。

在信息社会,信息可以划分为两大类。一类信息能够用数据或统一的结构加以表示,我们称之为结构化数据,如数字、符号;而另一类信息无法用数字或统一的结构表示,如文本、图像、声音、网页等,我们称之为非结构化数据。而针对计算机可执行和处理的数据一般采用的是结构化数据,而在很多情况下,数据源发送的为非结构化数据,而方便计算机的处理和数据管理,往往需要将非结构化数据转换为结构化数据。

以上是对机票cat以及结构化数据和非结构化数据的介绍和说明,而针对该步骤,不同航空公司发过来的机票cat规则文本是通过自然语言描述的,不具规律性,但是,不管是何种方式描述的cat规则文本均会包括至少一个cat,也就是每个cat规则文本均可以对应至少一个cat类目,而每个cat类目对应相应的机票规则数据。

另外,本实施例提供的方法是指机票类目cat规则,因此,该方法的适用的场景可以是订购机票的票务系统中,由于各个航空公司所采用的机票规则的描述方式和描述语言等的不同,各个机票订购平台将会从全球分销系统gds接口获取到不同的航空公司发送来的机票规则。

其中,所述gds(全球分销系统)是应用于民用航空运输及整个旅游业的大型计算机信息服务系统。通过gds,遍及全球的旅游销售机构可以及时地从航空公司、旅馆、租车公司、旅游公司获取大量的与旅游相关的信息,从而为顾客提供快捷、便利、可靠的服务。

因此,机票订购平台可以从gds接口中得到不同的航空公司的机票cat规则文本,然后确定机票cat规则文本中包含的cat。

确定机票cat规则文本中包含的cat之后,需要执行下一步骤。

请继续参照图1,步骤s102,按照确定的所述cat,将所述机票cat规则文本拆分成以cat为单位的子文本。

该步骤是将翻译细节从流程里面分离出来,代码层只需要控制翻译的流程,不需要关注翻译的细节的主要的实现方式。

按照确定的所述cat,将所述机票cat规则文本拆分成以cat为单位的子文本,每个cat中的数据是不同类别的规则数据,但规则数据均是与机票相关的数据。

因此,经过该步骤之后,完整的机票cat规则文本将会被分为若干个按照cat未单位分出的子文本,而后续步骤中将会对每个子文本进行翻译,因此,代码层只需要控制翻译的流程,而每个子文本的翻译细节将不会干扰到翻译流程的进行。

请继续参照图1,步骤s103,调用翻译引擎,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则。

该步骤是将通过调用翻译引擎,对拆分的每个子文本进行翻译的过程,对应的翻译结果是每个子文本相对应结构化的cat子规则。

上述从整体上描述了通过调用翻译引擎,获得每个子文本对应的cat子规则的过程,而具体的,如何通过计算机实现调用翻译引擎的过程可通过下述描述进行详细的介绍和说明。

首先对翻译引擎的背景进行介绍:计算机并不能直接地接受和执行用高级语言编写的源程序,源程序在输入计算机时,通过“翻译程序”翻译成机器语言形式的目标程序,计算机才能识别和执行。这种“翻译”通常有两种方式,即编译方式和解释方式。编译方式是指利用事先编好的一个称为编译程序的机器语言程序,作为系统软件存放在计算机内,当用户将高级语言编写的源程序输入计算机后,编译程序便把源程序整个地翻译成用机器语言表示的与之等价的目标程序,然后计算机再执行该目标程序,以完成源程序要处理的运算并取得结果。解释方式是指源程序进入计算机后,解释程序边扫描边解释,逐句输入逐句翻译,计算机逐句执行,并不产生目标程序。

该翻译引擎可以采用多种方式实现,而本实施例提供一种最方便快捷的方式,采用预先设置脚本配置文件的方式实现。

该步骤不参与翻译流程的进行,只涉及每个子文本的翻译细节问题,而具体采用何种方式将每个子文本翻译为结构化的子规则,采用的翻译方式为:通过提前所预先设置有的用于配置结构化数据的翻译规则的脚本配置文件的方式实现。具体的实现方式如下:

在预先设置有用于配置结构化数据的翻译规则的脚本配置文件的基础上,相应的,所述调用翻译引擎,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则,包括:利用所述翻译引擎加载所述脚本配置文件,解析得到所述结构化数据的翻译规则;利用所述翻译规则,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则。

由于所述脚本配置文件是用于配置结构化数据的翻译规则的文件,可以通过该脚本配置文件解析获知到所述结构化数据的翻译规则,从而利用该翻译规则,为每个子文本查找到相应的结构化的子规则。

具体的,所述脚本配置文件是用户根据自定义脚本模板所自定义配置的脚本文件。

需要说明的是,所述自定义脚本配置文件可以是xml自定义脚本配置,或者也可以是groovy自定义脚本配置,也就是,所述加载自定义脚本,包括加载xml自定义脚本或groovy自定义脚本。所有翻译的步骤都在xml脚本中配置,同时也支持groovy脚本配置,从而起到易扩展和隔离变化的作用。

而所述结构化数据的翻译规则中包括:为不同类别的cat配置有对应的cat子规则,以将该cat对应的子文本翻译为相应的结构化的cat子规则。

具体的,所述为不同类别的cat配置有对应的cat子规则中,采用的配置方式包括:通过正则表达式的方式,查找与所述子文本相匹配的结构化的cat子规则;将查找得到的结构化的cat子规则配置给相应的子文本。

所述正则表达式又称规则表达式。计算机科学的一个概念,正则表通常被用来检索、替换那些符合某个模式(规则)的文本。正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。由于正则表达式主要应用对象是文本,因此它在各种文本编辑器场合都有应用,同样比较适合本实施例中的作为非结构化数据的机票cat规则文本。

通过正则表达式的方式可以为结构化的cat子规则配置给相应的子文本,从而可以将每个子文本翻译为结构化的cat子规则。

另外,在子文本翻译的过程中,还存在多个子文本的翻译顺序的问题,可以是多个子文本不管先后顺序同时翻译的情况,有可以是按照时间顺序依次翻译的情况。

针对有先后顺序的情况,例如,在关于旅行去程时间以及回程时间的信息翻译时,首先会将去程作为优先级高的层级,之后,根据匹配关系,再查询去程对应的时间,该时间的查询可以看作优先级比去程低层级的关系。回程时间也是同样道理。根据层级划分可以明确将信息进行有效翻译。如果先获知时间,而该时间是不确定是什么时间的,因此,翻译出来的信息也是没有意义的。所以采用层级递进的优先级顺序进行翻译可以为用户提供最准确的翻译后的信息和数据。

具体的,所述为不同类别的cat配置有对应的cat子规则中,所述子文本为多个时,为子文本配置结构化的cat子规则的方式包括:确定多个子文本之间的优先级顺序;按照所述优先级顺序依次为所述子文本配置相应的结构化的cat子规则。

上述方式是通过确定多个子文本之间的优先级顺序,按照优先级顺序依次为所述子文本配置相应的结构化的cat子规则,也就是每个子文本的翻译也存在时间的顺序,而该优先级可以根据子文本的关键顺序设定优先级顺序,遵循关键的子文本优先进行翻译的规则执行。

除了上述确定优先级顺序的对子文本配置相应的子规则之外,若存在相同优先级顺序的情况下,可以采用如下的方式解决:

若所述机票cat规则文本中包含多个cat;每个cat拆分出多个子文本。相应的,所述确定多个子文本之间的优先级顺序,包括:确定每个cat中拆分出的多个子文本之间的优先级顺序;为处于同等优先级顺序的子文本同时配置相应的结构化的cat子规则。

当多个子文本处于同一优先级顺序时,则可以多个子文本同时翻译,因此,本实施例提供的方法不但可以实现自动翻译,还可以提高翻译的速率。

以上介绍的调用翻译引擎,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则的过程,将多个子规则组合的过程在下一步骤中介绍和说明。

请继续参照图1,步骤s104,组合所述子文本对应的cat子规则,得到所述机票cat规则文本对应的机票cat规则。

该步骤是最终将步骤s103得到的多个cat子规则进行组合的过程,组合的方式不受限制,可以按照原来的机票cat规则文本的顺序组合,也可以随意进行组合,或者按照关键信息优先的方式组合。不管采用何种方式组合,最终可以确定出机票cat规则文本对应的机票cat规则。

以下通过具体的实施例对该方法进行介绍和说明:

该具体实施例的方法的应用场景可以是票务系统中票价的采集平台,该票务一般可设定为机票。所述接收非结构化数据可以包括文本格式的数据,例如:数据源是全球分销系统gds接口规则的非结构化数据(完整机票cat规则文本文本)。

图2是本申请第一实施例提供的机票类目cat规则的翻译方法的具体过程图。请参照图2,在图2中可以看出:一个cat的规则文本包含多个cat数据,首先需要经过预处理,将文本拆分成以cat为单位的文本块,然后逐个cat进行翻译;每个cat根据业务需求,将翻译拆解成多个步骤,每个步骤(对应一个翻译细节点)都去调用翻译引擎得到结构化子数据;翻译引擎从数据库中(database)加载自定义的xml脚本配置,解释脚本并执行;所有翻译的细节都在xml脚本中配置(同时支持groovy脚本配置),起到易扩展和隔离变化的作用。

总之,采用本申请提供的该方法可以将机票cat规则文本中的规则文本按照cat为单位的子文本进行翻译,获得相对应的cat子规则,最终将所有cat子规则组合为完整的机票cat规则。所述规则文本为非结构化数据,而最终形成的机票cat规则则是结构化数据,因此,采用本申请提供的方法实现非结构化数据转换为结构化数据的过程。另外,本申请采用的方法是将机票cat规则文本拆分成以cat为单位的子文本,针对单个的子文本进行翻译,因此,可以将翻译细节从流程里面分离出来,代码层只用控制翻译的流程,不需要关注每个子文本翻译的细节,最终将每个子规则组合起来就可以形成完整的机票cat规则。总之,采用该方法可起到易扩展,易维护,因为不需要关注翻译细节因此不需要重新发布应用,并且能够做到修改及时生效。

因此,本申请提供的方法是采用机器自动翻译,将翻译细节从流程里面分离出来,代码层只用控制翻译的流程,不关注翻译的细节,起到易扩展,易维护,不需要发布应用,修改及时生效。

在上述的第一实施例中,提供了一种机票类目cat规则的翻译方法,与之相对应的,本申请第二实施例还提供一种机票类目cat规则的翻译装置。请参看图3,其为本申请第二实施例提供的一种机票类目cat规则的翻译装置的实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。

本实施例的一种机票类目cat规则的翻译装置,该装置包括:

确定单元301,用于确定机票cat规则文本中包含的cat,所述机票cat规则文本中包含与至少一个cat相关的规则数据;

拆分单元302,用于按照确定的所述cat,将所述机票cat规则文本拆分成以cat为单位的子文本;

调用单元303,用于调用翻译引擎,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则;

组合单元304,用于组合所述子文本对应的cat子规则,得到所述机票cat规则文本对应的机票cat规则。

可选的,该装置还包括:

预设单元,用于预先设置有用于配置结构化数据的翻译规则的脚本文件;

所述调用单元包括:

解析子单元,用于利用所述翻译引擎加载所述脚本配置文件,解析得到所述结构化数据的翻译规则;

翻译子单元,用于利用所述翻译规则,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则。

可选的,所述预设单元包括:

设置子单元,用于为不同类别的cat配置有对应的cat子规则,以将该cat对应的子文本翻译为相应的结构化的cat子规则。

可选的,所述设置子单元包括:

查找子单元,用于通过正则表达式的方式,查找与所述子文本相匹配的结构化的cat子规则;

匹配子单元,用于将查找得到的结构化的cat子规则配置给相应的子文本。

可选的,所述子文本为多个时;

所述设置子单元包括:

优先级设置子单元,用于确定多个子文本之间的优先级顺序;

顺序配置子单元,用于按照所述优先级顺序依次为所述子文本配置相应的结构化的cat子规则。

总之,采用本申请提供的该装置可以将机票cat规则文本中的规则文本按照cat为单位的子文本进行翻译,获得相对应的cat子规则,最终将所有cat子规则组合为完整的机票cat规则。所述规则文本为非结构化数据,而最终形成的机票cat规则则是结构化数据,因此,采用本申请提供的装置实现非结构化数据转换为结构化数据的过程。另外,本申请采用的装置是将机票cat规则文本拆分成以cat为单位的子文本,针对单个的子文本进行翻译,因此,可以将翻译细节从流程里面分离出来,代码层只用控制翻译的流程,不需要关注每个子文本翻译的细节,最终将每个子规则组合起来就可以形成完整的机票cat规则。总之,采用该装置可起到易扩展,易维护,因为不需要关注翻译细节因此不需要重新发布应用,并且能够做到修改及时生效。

因此,本申请提供的装置是采用机器自动翻译,将翻译细节从流程里面分离出来,代码层只用控制翻译的流程,不关注翻译的细节,起到易扩展,易维护,不需要发布应用,修改及时生效。

另外,本申请第三实施例提供一种机票类目cat规则的翻译方法,图4是本申请第三实施例提供的机票类目cat规则的翻译方法的流程图,请参照图4,该方法包括以下步骤:

步骤s401,确定航空公司提供的机票cat规则文本中包含的cat,所述机票cat规则文本中包含与至少一个cat相关的规则数据;

步骤s402,按照所述机票cat规则文本中包含的cat,将所述机票cat规则文本拆分成以cat为单位的子文本;

步骤s403,调用翻译引擎,分别对所述子文本进行翻译,得到所述子文本对应的结构化cat规则;

步骤s404,组合所述子文本对应的结构化cat规则,得到所述航空公司的机票cat规则。

可选的,预先设置有用于配置结构化数据的翻译规则的脚本文件;

所述调用翻译引擎,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则,包括:

利用所述翻译引擎加载所述脚本配置文件,解析得到所述结构化数据的翻译规则;

利用所述翻译规则,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则。

本实施例提供的方法与第一实施例提供方法的不同在于,确定了机票cat规则文本的来源,其来源于航空公司提供的。相应的,最终组合所述子文本对应的结构化cat规则,得到的是所述航空公司的机票cat规则。其他步骤与第一实施例的步骤相同,可参考第一实施例部分的说明。

对应第三实施例提供的机票类目cat规则的翻译方法,本申请第四实施例提供一种机票类目cat规则的翻译装置,请参看图5,其为本申请第四实施例提供的一种机票类目cat规则的翻译装置的实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。

本申请第四实施例提供一种机票类目cat规则的翻译装置,该装置包括:

确定单元501,用于确定航空公司提供的机票cat规则文本中包含的cat,所述机票cat规则文本中包含与至少一个cat相关的规则数据;

拆分单元502,用于按照所述机票cat规则文本中包含的cat,将所述机票cat规则文本拆分成以cat为单位的子文本;

调用单元503,用于调用翻译引擎,分别对所述子文本进行翻译,得到所述子文本对应的结构化cat规则;

组合单元504,用于组合所述子文本对应的结构化cat规则,得到所述航空公司的机票cat规则。

此外,本申请第五实施例还提供一种票务类目cat规则的翻译方法,图6是本申请第五实施例提供的票务类目cat规则的翻译方法的流程图,请参照图6,该方法中所述票务能够按照类目cat划分,每个cat包括票务相关的规则。具体的该方法包括以下步骤:

步骤s601,确定票务cat规则文本中包含的cat,所述票务cat规则文本中包含与至少一个cat相关的规则数据;

步骤s602,按照所述票务cat规则文本中包含的cat,将所述票务cat规则文本拆分成以cat为单位的子文本;

步骤s603,调用翻译引擎,分别对所述子文本进行翻译,得到所述子文本对应的结构化cat规则;

步骤s604,组合所述子文本对应的结构化cat规则,得到所述票务cat规则。

可选的,预先设置有用于配置结构化数据的翻译规则的脚本文件;

所述调用翻译引擎,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则,包括:

利用所述翻译引擎加载所述脚本配置文件,解析得到所述结构化数据的翻译规则;

利用所述翻译规则,对所述子文本进行翻译,得到所述子文本对应的结构化的cat子规则。

本实施例提供的方法与第一实施例提供的方法的区别在于,该方法中所述票务能够按照类目cat划分,每个cat包括票务相关的规则。而第一实施例中定义为机票类目cat的翻译,本实施例在步骤之前有前提条件,所述票务能够按照类目cat划分,每个cat包括票务相关的规则,限制的票务是具有按照cat进行类目划分的规则,此条件下的票务类目的翻译也可以按照第一实施例的方法进行实施。其他步骤的说明可参考第一实施例的部分的说明。

对应第五实施例提供的机票类目cat规则的翻译方法,本申请第六实施例提供一种机票类目cat规则的翻译装置,请参看图7,其为本申请第六实施例提供的一种机票类目cat规则的翻译装置的实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。

本申请第六实施例提供一种机票类目cat规则的翻译装置,所述票务能够按照类目cat划分,每个cat包括票务相关的规则,该装置包括:

确定单元701,用于确定票务cat规则文本中包含的cat,所述票务cat规则文本中包含与至少一个cat相关的规则数据;

拆分单元702,用于按照所述票务cat规则文本中包含的cat,将所述票务cat规则文本拆分成以cat为单位的子文本;

调用单元703,用于调用翻译引擎,分别对所述子文本进行翻译,得到所述子文本对应的结构化cat规则;

组合单元704,用于组合所述子文本对应的结构化cat规则,得到所述票务cat规则。

本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1