机票订单可信度评价方法和装置与流程

文档序号:13032113阅读:248来源:国知局
机票订单可信度评价方法和装置与流程
本发明涉及民航数据处理领域,具体而言,涉及一种机票订单可信度评价方法和装置。
背景技术
:术语解释旅客订座记录(passengernamerecord,简称为pnr):航空客票销售系统以pnr的方式管理旅客座位预订及出票。机票代理商利用订票系统漏洞,先虚假占座造成旅客已经订满航班座位紧缺的假象,随后再加高价出售给特定旅客,严重影响旅客经济利益,同时导致航班上座率低,使民航收益受到重大损失,更严重扰乱了机票销售市场。代理商订票时不需要真实旅客姓名和证件号,订票系统对于实时订单也并没有很好的监控和识别,所以导致代理商可以任意虚假占座。如何快速识别虚假订单,针对订单可信度给予不同的处置策略,对于提高航空公司收益,提升航空公司向旅客提供的服务质量,提升航空公司的竞争力具有重要的现实意义。技术实现要素:本发明提供了一种机票订单可信度评价方法和装置,以至少解决相关技术中实时订单中的虚假订单难以监控和识别的技术问题。根据本发明的一个方面,提供了一种机票订单可信度评价方法,包括:从航信系统的订单数据库获取历史订单数据;根据所述历史订单数据,生成可信度评估指标,其中,所述可信度评估指标包括以下至少之一:旅客诚信度指标、代理人诚信度指标、不同舱位等级出票可信度指标、订票时间距离起飞时间的不同时间区间出票可信度指标;采用层次化分析法,确定所述可信度评估指标的权重系数;根据所述可信度评估指标和所述可信度评估指标的权重系数,计算实时订单的订单可信度得分;将所述订单可信度得分存储到数据库中。可选地,根据所述历史订单数据,生成可信度评估指标包括:从所述历史订单数据中获取旅客历史订单状态数据,并根据所述旅客历史订单状态数据计算旅客出票率和旅客出行率;利用信息熵计算所述旅客出票率的熵权和所述旅客出行率的熵权;根据所述旅客出票率的熵权和所述旅客出行率的熵权,修正所述旅客出票率的权重系数和所述旅客出行率的权重系数,得到所述旅客出票率的修正权重系数和所述旅客出行率的修正权重系数;根据所述旅客出票率、所述旅客出行率、所述旅客出票率的修正权重系数和所述旅客出行率的修正权重系数,计算所述旅客诚信度指标。可选地,根据所述历史订单数据,生成可信度评估指标包括:从所述历史订单数据中获取代理人历史订单数据,并根据所述代理人历史订单数据计算代理人取消订单率和代理人退票率;利用信息熵计算所述代理人取消订单率的熵权和所述代理人退票率的熵权;根据所述代理人取消订单率的熵权和所述代理人退票率的熵权,修正所述代理人取消订单率的权重系数和所述代理人退票率的权重系数,得到所述代理人取消订单率的修正权重系数和所述代理人退票率的修正权重系数;根据所述代理人取消订单率、所述代理人退票率、所述代理人取消订单率的修正权重系数和所述代理人退票率的修正权重系数,计算所述代理人诚信度指标。可选地,根据所述历史订单数据,生成可信度评估指标包括:从所述历史订单数据中获取历史订单的舱位等级数据和历史订单状态数据,并根据所述历史订单的舱位等级数据和所述历史订单状态数据,计算所述不同舱位等级出票可信度指标。可选地,根据所述历史订单数据,生成可信度评估指标包括:从所述历史订单数据中获取历史订单的订票时间距离起飞时间的天数以及历史订单状态数据,并根据所述订票时间距离起飞时间的天数和所述历史订单状态数据,计算所述不同时间区间出票可信度指标。可选地,在根据所述历史订单数据,生成可信度评估指标之后,所述方法还包括:分别将不同的可信度评估指标存储到对应的数据链表中。可选地,在根据所述可信度评估指标和所述可信度评估指标的权重系数,计算实时订单的订单可信度得分之后,所述方法还包括:采用jaccard相似系数评估所述订单可信度的准确性,并根据评估结果调整所述可信度评估指标的权重系数。可选地,在根据所述可信度评估指标和所述可信度评估指标的权重系数,计算实时订单的订单可信度得分之后,所述方法还包括:根据所述实时订单的所述订单可信度得分,确定所述实时订单的出票时限,其中,订单可信度得分表示该订单可信度越低,出票时限越短。根据本发明的另一个方面,还提供了一种机票订单可信度评价装置,包括:获取模块,用于从航信系统的订单数据库获取历史订单数据;生成模块,用于根据所述历史订单数据,生成可信度评估指标,其中,所述可信度评估指标包括以下至少之一:旅客诚信度指标、代理人诚信度指标、不同舱位等级出票可信度指标、订票时间距离起飞时间的不同时间区间出票可信度指标;第一确定模块,用于采用层次化分析法,确定所述可信度评估指标的权重系数;计算模块,用于根据所述可信度评估指标和所述可信度评估指标的权重系数,计算实时订单的订单可信度得分;第一存储模块,用于将所述订单可信度得分存储到数据库中。可选地,所述生成模块包括:第一计算单元,用于从所述历史订单数据中获取旅客历史订单状态数据,并根据所述旅客历史订单状态数据计算旅客出票率和旅客出行率;第二计算单元,用于利用信息熵计算所述旅客出票率的熵权和所述旅客出行率的熵权;第三计算单元,用于根据所述旅客出票率的熵权和所述旅客出行率的熵权,修正所述旅客出票率的权重系数和所述旅客出行率的权重系数,得到所述旅客出票率的修正权重系数和所述旅客出行率的修正权重系数;第四计算单元,用于根据所述旅客出票率、所述旅客出行率、所述旅客出票率的修正权重系数和所述旅客出行率的修正权重系数,计算所述旅客诚信度指标。可选地,所述生成模块包括:第五计算单元,用于从所述历史订单数据中获取代理人历史订单数据,并根据所述代理人历史订单数据计算代理人取消订单率和代理人退票率;第六计算单元,用于利用信息熵计算所述代理人取消订单率的熵权和所述代理人退票率的熵权;第七计算单元,用于根据所述代理人取消订单率的熵权和所述代理人退票率的熵权,修正所述代理人取消订单率的权重系数和所述代理人退票率的权重系数,得到所述代理人取消订单率的修正权重系数和所述代理人退票率的修正权重系数;第八计算单元,用于根据所述代理人取消订单率、所述代理人退票率、所述代理人取消订单率的修正权重系数和所述代理人退票率的修正权重系数,计算所述代理人诚信度指标。可选地,所述生成模块包括:第九计算单元,用于从所述历史订单数据中获取历史订单的舱位等级数据和历史订单状态数据,并根据所述历史订单的舱位等级数据和所述历史订单状态数据,计算所述不同舱位等级出票可信度指标。可选地,所述生成模块包括:第十计算单元,用于从所述历史订单数据中获取历史订单的订票时间距离起飞时间的天数以及历史订单状态数据,并根据所述订票时间距离起飞时间的天数和所述历史订单状态数据,计算所述不同时间区间出票可信度指标。可选地,所述装置还包括:第二存储模块,用于在根据所述历史订单数据,生成可信度评估指标之后,分别将不同的可信度评估指标存储到对应的数据链表中。可选地,所述装置还包括:调整模块,用于采用jaccard相似系数评估所述订单可信度的准确性,并根据评估结果调整所述可信度评估指标的权重系数。可选地,所述装置还包括:第二确定模块,用于根据所述实时订单的所述订单可信度得分,确定所述实时订单的出票时限,其中,订单可信度得分表示该订单可信度越低,出票时限越短。根据本发明的另一个方面,还提供了一种存储介质,位于设备中,所述存储介质中存储的程序代码用于控制所述设备执行上述的机票订单可信度评价方法。通过本发明,采用从航信系统的订单数据库获取历史订单数据;根据所述历史订单数据,生成可信度评估指标,其中,可信度评估指标包括以下至少之一:旅客诚信度指标、代理人诚信度指标、不同舱位等级出票可信度指标、订票时间距离起飞时间的不同时间区间出票可信度指标;采用层次化分析法,确定可信度评估指标的权重系数;根据可信度评估指标和可信度评估指标的权重系数,计算实时订单的订单可信度得分;将订单可信度得分存储到数据库中的方式,解决了实时订单中的虚假订单难以监控和识别的技术问题,实现了对实时订单中虚假订单的监控和预测。附图说明此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:图1是根据本发明实施例的机票订单可信度评价方法的流程图;图2是根据本发明实施例的机票订单可信度评价装置的结构框图;图3是根据本发明优选实施例的旅客诚信度和代理人诚信度自学习方法的流程图;图4是根据本发明优选实施例的机票订单可信度评价方法的流程图;图5是根据本发明优选实施例的机票订单可信度评价系统的结构示意图。具体实施方式下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。在本实施例中提供了一种机票订单可信度评价方法,图1是根据本发明实施例的机票订单可信度评价方法的流程图,如图1所示,该流程包括如下步骤:步骤s101,从航信系统的订单数据库获取历史订单数据;步骤s102,根据历史订单数据,生成可信度评估指标,其中,可信度评估指标包括以下至少之一:旅客诚信度指标、代理人诚信度指标、不同舱位等级出票可信度指标、订票时间距离起飞时间的不同时间区间出票可信度指标;步骤s103,采用层次化分析法,确定可信度评估指标的权重系数;步骤s104,根据可信度评估指标和可信度评估指标的权重系数,计算实时订单的订单可信度得分;步骤s105,将订单可信度得分存储到数据库中。通过上述步骤,至少从旅客诚信度、代理人诚信度、不同舱位等级出票的可信度、不同时间区间出票的可信度四个指标来综合考察实时订单的订单可信度,从而解决了实时订单中的虚假订单难以监控和识别的技术问题,实现了对实时订单中虚假订单的监控和预测。在上述步骤中,可信度评估指标中,旅客出票率、旅客出行率、代理人取消订单率、代理人退票率的权重系数可以采用熵权法来确定。可选地,根据历史订单数据,生成可信度评估指标包括:从历史订单数据中获取历史订单状态数据,并根据历史订单状态数据计算旅客出票率和旅客出行率;利用信息熵计算旅客出票率的熵权和旅客出行率的熵权;根据旅客出票率的熵权和旅客出行率的熵权,修正旅客出票率的权重系数和旅客出行率的权重系数,得到旅客出票率的修正权重系数和旅客出行率的修正权重系数;根据旅客出票率、旅客出行率、旅客出票率的修正权重系数和旅客出行率的修正权重系数,计算旅客诚信度指标。其中,熵值越小对应指标的熵权越大,修正后的权重系数也越大。可选地,根据历史订单数据,生成可信度评估指标包括:从历史订单数据中获取代理人历史订单数据,并根据代理人历史订单数据计算代理人取消订单率和代理人退票率;利用信息熵计算代理人取消订单率的熵权和代理人退票率的熵权;根据代理人取消订单率的熵权和代理人退票率的熵权,修正代理人取消订单率的权重系数和代理人退票率的权重系数,得到代理人取消订单率的修正权重系数和代理人退票率的修正权重系数;根据代理人取消订单率、代理人退票率、代理人取消订单率的修正权重系数和代理人退票率的修正权重系数,计算代理人诚信度指标。其中,熵值越小对应指标的熵权越大,修正后的权重系数也越大。可选地,根据历史订单数据,生成可信度评估指标包括:从历史订单数据中获取历史订单的舱位等级数据和历史订单状态数据,并根据历史订单的舱位等级数据和历史订单状态数据,计算不同舱位等级出票可信度指标。可选地,根据历史订单数据,生成可信度评估指标包括:从历史订单数据中获取历史订单的订票时间距离起飞时间的天数以及历史订单状态数据,并根据订票时间距离起飞时间的天数和历史订单状态数据,计算不同时间区间出票可信度指标。可选地,在根据历史订单数据,生成可信度评估指标之后,方法还包括:分别将不同的可信度评估指标存储到对应的数据链表中。可选地,在根据可信度评估指标和可信度评估指标的权重系数,计算实时订单的订单可信度得分之后,方法还包括:采用jaccard相似系数评估订单可信度的准确性,并根据评估结果调整可信度评估指标的权重系数。可选地,在根据可信度评估指标和可信度评估指标的权重系数,计算实时订单的订单可信度得分之后,方法还包括:根据实时订单的订单可信度得分,确定实时订单的出票时限,其中,订单可信度得分表示该订单可信度越低,出票时限越短。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。在本实施例中还提供了一种机票订单可信度评价装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。图2是根据本发明实施例的机票订单可信度评价装置的结构框图,如图2所示,该装置包括:获取模块21、生成模块22、第一确定模块23和计算模块24,第一存储模块25,其中,获取模块21,用于从航信系统的订单数据库获取历史订单数据;生成模块22,耦合至获取模块21,用于根据历史订单数据,生成可信度评估指标,其中,可信度评估指标包括以下至少之一:旅客诚信度指标、代理人诚信度指标、不同舱位等级出票可信度指标、订票时间距离起飞时间的不同时间区间出票可信度指标;第一确定模块23,耦合至生成模块22,用于采用层次化分析法,确定可信度评估指标的权重系数;计算模块24,耦合至第一确定模块23,用于根据可信度评估指标和可信度评估指标的权重系数,计算实时订单的订单可信度得分;第一存储模块25,耦合至计算模块24,用于将订单可信度得分存储到数据库中。可选地,生成模块22包括:第一计算单元,用于从历史订单数据中获取旅客历史订单状态数据,并根据旅客历史订单状态数据计算旅客出票率和旅客出行率;第二计算单元,用于利用信息熵计算旅客出票率的熵权和旅客出行率的熵权;第三计算单元,用于根据旅客出票率的熵权和旅客出行率的熵权,修正旅客出票率的权重系数和旅客出行率的权重系数,得到旅客出票率的修正权重系数和旅客出行率的修正权重系数;第四计算单元,用于根据旅客出票率、旅客出行率、旅客出票率的修正权重系数和旅客出行率的修正权重系数,计算旅客诚信度指标。可选地,生成模块22包括:第五计算单元,用于从历史订单数据中获取代理人历史订单数据,并根据代理人历史订单数据计算代理人取消订单率和代理人退票率;第六计算单元,用于利用信息熵计算代理人取消订单率的熵权和代理人退票率的熵权;第七计算单元,用于根据代理人取消订单率的熵权和代理人退票率的熵权,修正代理人取消订单率的权重系数和代理人退票率的权重系数,得到代理人取消订单率的修正权重系数和代理人退票率的修正权重系数;第八计算单元,用于根据代理人取消订单率、代理人退票率、代理人取消订单率的修正权重系数和代理人退票率的修正权重系数,计算代理人诚信度指标。可选地,生成模块22包括:第九计算单元,用于从历史订单数据中获取历史订单的舱位等级数据和历史订单状态数据,并根据历史订单的舱位等级数据和历史订单状态数据,计算不同舱位等级出票可信度指标。可选地,生成模块22包括:第十计算单元,用于从历史订单数据中获取历史订单的订票时间距离起飞时间的天数以及历史订单状态数据,并根据订票时间距离起飞时间的天数和历史订单状态数据,计算不同时间区间出票可信度指标。可选地,装置还包括:第二存储模块,耦合至生成模块22和第一确定模块23之间,用于在根据历史订单数据,生成可信度评估指标之后,分别将不同的可信度评估指标存储到对应的数据链表中。可选地,装置还包括:调整模块,耦合至计算模块24,用于采用jaccard相似系数评估订单可信度的准确性,并根据评估结果调整可信度评估指标的权重系数。可选地,装置还包括:第二确定模块,耦合至计算模块24,用于根据实时订单的订单可信度得分,确定实时订单的出票时限,其中,订单可信度得分表示该订单可信度越低,出票时限越短。需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述模块分别位于多个处理器中。本发明的实施例还提供了一种软件,该软件用于执行上述实施例及优选实施方式中描述的技术方案。在本实施例中还提供了一种存储介质,位于设备中,存储介质中存储的程序代码用于控制设备执行上述的机票订单可信度评价方法。本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。为了使本发明实施例的描述更加清楚,下面结合优选实施例进行描述和说明。本发明优选实施例提供的机票订单可信度评价方法,通过选择影响订单可信度的特征,通过数据挖掘计算并设置对应特征指标的权重,随后提取实时订单的特征数据,并为其计算可信度得分。其中关键技术是采用熵权法和层次分析法确定特征指标权重。熵权法是一种客观赋权方法。在具体使用过程中,熵权法根据各指标的变异程度,利用信息熵计算出各指标的熵权,再通过熵权对各指标的预置权重系数进行修正,从而得出较为客观的指标权重系数(在本实施例中称为修正权重系数)。如果某个指标的熵值越小,说明其指标值的变异程度越大,提供的信息量越多,在综合评价中该指标起的作用越大,其权重应该越大。如果某个指标的熵值越大,说明其指标值的变异程度越小,提供的信息量越少,在综合评价中起的作用越小,其权重也应越小。故在具体应用时,可根据各指标值的变异程度,利用熵来计算各指标的熵权,利用各指标的熵权对所有的指标进行加权,从而得出较为客观的评价结果。美国运筹学家a.l.saaty于本世纪70年代提出的层次分析法(analyticalhierar-chyprocess,简称ahp方法),是一种定性与定量相结合的决策分析方法。它是一种将决策者对复杂系统的决策思维过程模型化、数量化的过程。应用这种方法,决策者通过将复杂问题分解为若干层次和若干因素,在各因素之间进行简单的比较和计算,就可以得出不同方案的权重,为最佳方案的选择提供依据。为了解决相关技术中实时机票订单中的虚假订单难以监控和识别的技术问题,在本优选实施例中采用了下列的技术方案:一种基于熵权法和ahp的机票订单可信度评价方法。该方法包括如下步骤:步骤1,对历史订单数据进行数据预处理,包括:根据旅客证件号获得该旅客历史订单数据,根据订单状态计算旅客出票率和出行率,生成旅客链表,链表信息包括旅客证件号、旅客历史订票总数、旅客出票率v1、旅客出行率v2;其中:根据相同代理号获得该代理人的全部历史订单数据,计算该代理人取消订单率和退票率,生成代理人链表;链表的信息包括代理号、代理人历史订票总数、代理人取消订单率v3、代理人退票率v4;其中:步骤2,根据旅客出票率v1和旅客出行率v2计算旅客诚信度spassenger,其中:spassenger=v1·ω1+v2·ω2,根据代理人取消订单率v3和代理人退票率v4计算代理人诚信度sagent,其中:sagent=1-(v3·ω3+v4·ω4);其中权重ω1、ω2、ω3、ω4采用熵权法来确定;所述熵权法是根据所有旅客出票率v1和旅客出行率v2数据,利用信息熵计算出v1和v2的熵权,再根据熵权对v1和v2的预置权重系数进行修正,从而得出v1的修正权重系数ω1和v2的修正权重系数ω2;同样地,根据代理人取消订单率v3和代理人退票率v4数据,利用信息熵计算出v3的熵权和v4的熵权,再通过熵权对v3和v4的预置权重系数进行修正,从而得出指标v3和v4的修正权重系数ω3和ω4;具体过程如下:假设共有m个项目,共有n个评价指标,生成原始矩阵r:r=(rij)m×n;其中:rij为第j个指标下第i个项目的评价值;根据下面公式计算第j个指标下第i个项目的指标值的比重pij:根据下面公式计算第j个指标的熵值ej:其中:k=1/lnm根据下面公式计算第j个指标的熵权ωj:根据下面公式确定指标的修正权重系数βj:其中:αi为评估者根据自己的目的和要求设置的指标重要性的权重系数,即预置权重系数;步骤3,选取实时订单信息中订单舱位等级p、订票时间距离起飞时间的天数d并为其打分,包括:分析历史订单数据,统计不同舱位等级的出票率及可信度得分分析所有订单中订票时间doder距离起飞时间ddeparture的时间差dorder-ddeparture的分布区域,计算各区间的出票率及各区间的可信度得分步骤4,采用层次分析法确定二级指标权重,即代理人诚信度权重ωagent,旅客诚信度权重ωpassenger,舱位等级权重ωc和时间权重ωd;根据求得的二级指标权重,综合计算订单得分s总;例如:为一个订单做可信度评估,提取该订单中旅客证件号,代理号,舱位等级ci,起飞时间距离订票时间差di,根据旅客证件号从旅客链表中获得该旅客可信度得分spassenger,根据代理号从代理人链表中获得该代理的可信度得分sagent,舱位等级得分和时间差得分步骤5,采用jaccard相似系数评估模型准确性,调整参数,优化模型;包括:根据订单数据的不断更新,代理人诚信度,旅客诚信度,票价等级数据都会发生变化,定期进行更新;根据历史订单数据,选择出票订单和未出票订单,选择测试样本,并根据模型计算订单的可信度得分,得到可信订单和可疑订单集合,通过真实数据和预测结果计算jaccard相似系数,有监督的训练模型参数。优选实施例一参考图3至图5,在本优选实施例一中提供了一种基于熵权法和ahp的机票订单可信度评价方法,包括:步骤一:对历史订单数据进行数据预处理,根据旅客证件号获得该旅客历史订单数据,根据订单状态计算旅客出票率v1和出行率v2,生成旅客链表,链表信息包括旅客证件号,历史订票次数,出票率,出行率。根据相同代理号获得该代理人的所有历史订单数据,计算该代理人取消订单率v3和退票率v4,生成代理人链表,链表信息包括代理号,历史订票次数,取消订单率,退票率。步骤二:根据旅客出票率v1和出行率v2计算旅客诚信度,根据代理人取消订单率v3和退票率v4计算代理人诚信度。其中权重分配采用熵权法确定,得到旅客出票率修正权重系数ω1和出行率修正权重系数ω2,代理人取消订单率修正权重系数ω3和代理人退票率修正权重系数ω4。熵权法是根据各指标的变异(离散)程度,利用信息熵计算出各指标的熵权,再通过熵权对各指标的预置权重系数进行修正,从而得出较为客观的指标权重。具体过程如下:假设共有m个项目,共有n个评价指标,生成原始矩阵r:r=(rij)m×n;其中:rij为第j个指标下第i个项目的评价值;根据下面公式计算第j个指标下第i个项目的指标值的比重pij:根据下面公式计算第j个指标的熵值ej:其中:k=1/lnm根据下面公式计算第j个指标的熵权ωj:根据下面公式确定指标的修正权重系数βj:其中:αi为评估者根据自己的目的和要求设置的指标重要性的权重,即预置权重系数;根据已求得的权重计算代理人诚信度得分sagent和旅客诚信度得分spassenger:spassenger=v1·ω1+v2·ω2sagent=1-(v3·ω3+v4·ω4)步骤三:选取实时订单信息中订单舱位等级p、订票时间距离起飞时间的天数d并为其打分。具体步骤如下:分析历史订单数据,统计不同舱位等级的出票率γ,如表1所示。表1不同舱位等级的出票率据表1显示,越低折扣的订单成交率越低。分析原因如下:大部分的占座订单,抢占的都是低折扣的座位。购买更低票价的旅客群,计划更具有波动性。购买更高舱位的旅客群,出行目标明确,不易更改。不同舱位的出票率即为各舱位订单出票的可信度,得到舱位等级可信度得分表,如表2所示:表2不同舱位等级的可信度得分分析所有订单中订票时间doder距离起飞时间ddeparture的时间差dorder-ddeparture的分布区域,计算各区间的出票率及各区间的可信度得分,如表3所示:表3各区间的可信度得分dorder-ddeparture(天)[1,7][8,15][16,30][31,60][61,120][121,365]出票率(%)868075624426可信度得分(sd)0.860.800.750.620.440.26步骤四:采用层次分析法(ahp)确定二级指标权重,即代理人诚信度权重ωagent,旅客诚信度权重ωpassenger,舱位等级权重ωc和时间区域权重ωd。根据求得的二级指标权重,综合计算订单得分s总。s总=sagent·ωagent+spassenger·ωpassenger+sd·ωd+sc·ωc步骤五:采用jaccard相似系数评估模型准确性,调整参数,优化模型。根据订单数据的不断更新,代理人诚信度,旅客诚信度,票价等级数据都会发生变化,定期更新这些数据。根据历史订单数据,选择出票订单和未出票订单,选择测试样本根据模型计算各订单的可信度得分,得到可信订单和可疑订单集合,通过真实数据和预测结果计算jaccard相似系数,有监督的训练模型参数,使其达到最好的预测效果。本发明将影响订单可信度的多维特征提取出来,通过对历史数据的离线处理,提取旅客和代理人诚信度指标,采用熵权法确定指标权重,最后计算得到旅客和代理人诚信度,用以支持实时订单可信度评价。随后为订单的票价等级和时间紧迫度定级评分,采用层次分析法为旅客诚信度、代理人诚信度、票价等级和时间紧迫度设置权重,最终得到订单可信度综合评价结果。本发明用于实现可疑订单识别模块,可用于民航收益管理系统的时限管理模块。优选实施例二在本优选实施例二中提供了一种基于熵权法和ahp的订单可信度评价方法,参考图3和图4,该方法包括下列步骤:步骤一:对两年内的订单数据进行数据预处理,根据旅客证件号获得旅客历史订单数据,计算各旅客两年内的订票次数,出票率,出行率,生成旅客链表,如表4所示。表4旅客链表id证件号(加密)总订票次数出票率v1出行率v21430602196007114709120.8330.9211010119021116421480.50.75...根据代理号获得代理人的两年内的订单数据,计算各代理人历史订票次数,取消订单率,退票率,生成代理人链表,如表5所示。表5代理人链表id代理号总订票次数取消订单率v3退票率v41882118461280.3430.28426020390580230.2800.171...步骤二:根据旅客出票率v1和出行率v2计算旅客诚信度,根据代理人取消订单率v3和退票率v4计算代理人诚信度。采样旅客出票率和出行率,采用熵权法得到旅客出票率修正权重系数ω1=0.6273,出行率修正权重系数ω2=0.3727,旅客诚信度=v1×w1+v2×w2,如表6所示;采样代理人取消订单率和退票率,采用熵权法得到代理人取消订单率修正权重系数ω3=0.3925和代理人退票率修正权重系数ω4=0.6075,如表7所示;代理人诚信度=1-(v3×w3+v4×w4)。表6旅客诚信度表7代理人诚信度id代理号总订票次数取消订单率v3退票率v4诚信度1882118461280.3430.2840.6926020390580230.2800.1710.79...步骤三:获得实时订单中的旅客证件号id,代理号agent,舱位等级c,订单时间距离起飞时间天数d。例如:某实时订单,订单号为locator1,提取信息如下:旅客id=430602196007114709,agent=60203905,c=y,d=20,获得对应的旅客诚信度得分spassenger=0.86,代理人诚信度得分sagent=0.79,舱位等级得分sc=0.43,时间区域得分sd=0.80。步骤四:采用层次分析法(ahp)得到二级指标权重,代理人诚信度权重ωagent=0.3256,旅客诚信度权重ωid=0.3018,票价等级权重ωc=0.2498和时间权重ωd=0.1228。根据求得的二级指标权重,综合计算订单locator1得分s总。s总=sagent·ωagent+sid·ωid+sd·ωd+sc·ωc=0.79×0.3256+0.86×0.3018+0.43×0.2498+0.80×0.1228=0.72步骤五:采用jaccard相似系数评估模型准确性,调整参数,优化模型。根据历史订单数据,选择出票订单和未出票订单,选择测试样本根据模型计算各订单的可信度得分,得到可信订单和可疑订单集合,通过真实数据和预测结果计算jaccard相似系数,有监督的训练模型参数,使其达到最好的预测效果。优选实施例三如图3所示,在本优选实施例三中提供了一种用于实现实施例一所述方法的系统,其包括:用于处理历史订单数据的数据预处理模块,处理后得到的数据包括:旅客链表(旅客证件号、历史订票次数、出票率、出行率、诚信度得分),代理人链表(代理号、历史订票次数、取消订单率、退票率、诚信度得分)。订单可信度计算模块针对实时订单信息,得出相应的旅客证件号、代理号、航班起飞时间、订票时间、票价等级,计算票价等级得分、时间紧迫度得分,并从数据预处理模块得到的旅客和代理人链表中获得旅客和代理人诚信度得分。按照最终得到的旅客诚信度、代理人诚信度、票价等级得分、时间紧迫度得分的非零个数,采用层次分析法计算权重分配,并计算最终订单可信度得分,完成订单可信度评价。通过采用上述技术方案,本发明在对实时订单进行可信度评价时,综合考虑了相关旅客的历史数据,相关代理人的历史数据,票价信息和起飞时间信息,使得对订单评价更全面、准确。根据历史数据采用离线计算旅客和代理人诚信度得分,提高在线计算效率,使得对实时订单的评价更快速。采用熵权法和ahp确定各级特征指标权重,既考虑了数据本身的离散程度和历史数据特点,又结合了专家经验,使得该评价方法更准确可靠。本发明在历史数据基础上对新增加的订单数据进行定期更新,同时调整模型参数,使评价方法保持准确性和有效性。本发明可用于民航收益管理系统的时限管理模块,通过对实时订单数据的评价,快速甄别虚假占座订单,并为各订单设置出票时限,弥补现有时限管理模块仅靠专家经验手动设置出票时限的不足。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1