旅客出行目的预测方法及装置的制造方法

文档序号:9751412阅读:383来源:国知局
旅客出行目的预测方法及装置的制造方法
【技术领域】
[0001 ]本发明涉及数据处理技术,尤其涉及一种旅客出行目的预测方法及装置。
【背景技术】
[0002] 近20年来,得益于科技进步以及互联网技术的迅猛发展,中国民航的技术水平经 历了几次大的飞跃,这反映在旅客乘机的所有环节,包括旅客预定座位、购买客票、值机从 机场离港等过程,出现了电子客票、手机值机、网上值机等新技术,同时旅客的行为也越来 越多样化,这些都会以数据的形式留存在数据仓库中,是一个巨大的宝藏等着去挖掘。
[0003] 旅客出行目的是旅客出行的一个终点状态,乘坐飞机则只是为了达到目的的一个 过程和手段,所有的出行行为细节都会反映出行目的。
[0004] 民航业中对旅客的出行目的分析至今还是一个空白。现有的旅客数据中并没有真 实的出行目的标识,如何从纷繁的旅客行为数据中找到旅客出行目的踪迹和指向,并通过 构建模型来预测出行目的,是急需解决的问题。

【发明内容】

[0005] 为解决现有存在的技术问题,本发明实施例提供一种旅客出行目的预测方法及装 置。
[0006] 为达到上述目的,本发明实施例的技术方案是这样实现的:
[0007] -种旅客出行目的预测方法,所述方法包括:
[0008] 从旅客全景视图中读取旅客出行行为记录;
[0009] 提取并计算所述旅客出行记录的特征值;
[0010] 调用预测模型对所述特征值进行计算,得到旅客出行目的的预测结果。
[0011] 其中,在读取旅客出行记录之前,所述方法还包括:基于支持向量机SVM决策树算 法建立所述预测模型。
[0012] 其中,在读取旅客出行行为记录之前,所述方法还包括建立所述预测模型的步骤, 该步骤包括:
[0013] 采集多条训练数据,每条所述训练数据包括一个旅客一次出行的出行记录和出行 目的;
[0014] 分别提取和计算所述多条训练数据的特征值;
[0015]基于所述多条训练数据的特征值训练预须彳模型;
[0016] 验证所述预测模型的准确率;
[0017] 保存通过验证的预测模型。
[0018] 其中,所述特征值可以包括如下的任意一种或任意组合:常客卡级别、起飞日期类 型、乘客年龄区间、性别、证件类型、起飞时间类型、0D目的地类型、提前订票天数区间、值机 方式、提前值机时间、航段国际国内、同行人关系、订票渠道、是否使用大客户编码、是否购 买往返票、舱位类型、折扣率区间、团队标识。
[0019] 其中,建立所述预测模型之前,所述方法还包括:构造特征值计算规则,并选择特 征值。
[0020] 其中,所述训练预测模型包括:读取所述特征值的文件,将所述文件的每一行变量 作为输入,调用SVM决策树算法进行预测模型的训练;如果读取到的特征值不是数值型,则 先进行数值化处理。
[0021] 其中,所述保存预测模型为:以文本文件的形式保存通过验证的预测模型。
[0022] -种旅客出行目的预测装置,所述装置包括:
[0023] 读取模块,用于从旅客全景视图中读取旅客出行记录;
[0024] 特征值模块,用于提取并计算所述旅客出行记录的特征值;
[0025] 预测模块,用于调用预测模型对所述特征值进行计算,得到旅客出行目的的预测 结果。
[0026] 其中,所述预测模块,包括:计算子模块和建立子模块,其中,
[0027] 建立子模块,用于基于支持向量机SVM决策树算法建立所述预测模型;
[0028] 所述计算子模块,用于调用所述预测模型对所述特征值进行计算,得到旅客出行 目的的预测结果。
[0029] 其中,所述读取模块,还用于采集多条训练数据,每条所述训练数据包括一个旅客 一次出行的出行记录和出行目的;
[0030] 所述特征值模块,还用于分别提取和计算所述多条训练数据的特征值;
[0031] 所述预测模块的建立子模块,具体用于基于所述多条训练数据的特征值训练预测 模型,验证所述预测模型的准确率,并保存通过验证的预测模型。
[0032] 其中,所述特征值可以包括如下的任意一种或任意组合:常客卡级别、起飞日期类 型、乘客年龄区间、性别、证件类型、起飞时间类型、0D目的地类型、提前订票天数区间、值机 方式、提前值机时间、航段国际国内、同行人关系、订票渠道、是否使用大客户编码、是否购 买往返票、舱位类型、折扣率区间、团队标识。
[0033] 其中,所述所述特征值模块,还用于构造特征值计算规则,并选择特征值;以及,用 于基于所述特征值计算规则,提取和计算特征值。
[0034] 其中,所述建立子模块用于训练预测模型,包括:读取所述特征值的文件,将所述 文件的每一行变量作为输入,调用SVM决策树算法进行预测模型的训练;如果读取到的特征 值不是数值型,则先进行数值化处理。
[0035]其中,所述建立子模块用于以文本文件的形式保存通过验证的预测模型。
[0036] 本发明实施例的旅客出行目的预测方法及装置,能够基于旅客的乘机出行行为记 录,自动预测出旅客每次出行的目的,解决了当前航空业务领域无法针对旅客出行目的进 行预测的技术问题,为航空业务的分析提供一种更加深入用户的维度,使得航空业务能够 更好地支持旅客的个性化服务,便于航空业务系统在旅客的每个接触点为其提供更具针对 性的服务。
【附图说明】
[0037] 在附图(其不一定是按比例绘制的)中,相似的附图标记可在不同的视图中描述相 似的部件。具有不同字母后缀的相似附图标记可表示相似部件的不同示例。附图以示例而 非限制的方式大体示出了本文中所讨论的各个实施例。
[0038] 图1为本发明实施例旅客出行目的预测方法的流程示意图;
[0039] 图2为本发明实施例预测模型建立流程示意图;
[0040] 图3为本发明实施例旅客出行目的预测装置的组成结构示意图。
【具体实施方式】
[0041] 本发明实施例提供一种旅客出行目的预测方法及装置,能够基于民航旅客的乘机 出行行为记录,预测旅客每次的出行目的。换而言之,本发明实施例可以从旅客的乘机记录 出发,抽取以及清洗基础数据、分析旅客出行中所有环节的行为特点,利用旅客身份特征、 同行人关系、行程特点、个人乘机偏好等信息来预测旅客的出行目的。
[0042] 本发明实施例旅客出行目的预测方法,如图1所示,主要可以包括如下步骤:
[0043] 步骤101:读取旅客全景视图中的旅客出行记录;
[0044] 本步骤中,读取旅客全景视图中的旅客出行记录,获得旅客行为详细数据的某些 字段,为特征值的计算做准备。
[0045] 这里,预测旅客出行目的需要采集旅客的全流程行为数据,从开始订票到出票、离 港一系列的接触点都会通过各种信息系统回传并存储在中心系统中,这些数据经过清洗整 理存储在旅客全景视图中。本发明实施例的数据就来源于该旅客全景视图。其中,旅客全景 视图是从旅客的角度进行的数据整合,数据粒度为航段级,包括了旅客从订座到出票,再到 离港的全流程记录,故称"全景视图"。
[0046] 特别地,读取每日的旅客全景视图表,该旅客全景视图表存在于数据仓库中,每行 表示一个旅客的一个航段级信息,包含旅客所有行为的最详细数据,是未经加工过的原始 数据,并不适合直接作为特征值。
[0047]步骤102:特征值提取和计算;
[0048]本发明实施例预先规定了特征值的计算规则,将步骤101读取的数据作为输入并 根据特征值的计算规则结合预先配置的参照表进行计算,即可得到N个特征值。
[0049]特别地,本发明实施例的数据来源是部署在Hadoop平台的旅客全景视图,包含了 100多个旅客行为字段,根据航行业务的特点选择比较典型的、反映关键业务点的N个字段 作为特征值。这N个特征值涵盖了订座、出票、离港、旅客特征等多个方面,能够真实地反映 旅客的行为特征和出行目的。
[0050] 步骤103:调用预测模型进行计算,得到旅客出行目的。
[0051] 本发明实施例中,在步骤102计算特征值之后,再调用预先保存的预测模型进行计 算,得到的结果即为旅客出行目的。具体地,调用预测模型,输入为步骤102得到的特征值文 件,返回结果,该结果为一个文件,该文件的每行包含:当前旅客每次出行记录的若干字段 和预测结果。
[0052]本发明实施例使用支持向量机(SVM,Support Vector Machine)最优决策树算法 建立所述预测模型,该算法对多维数据的支持比较好,适用于具有多个特征值的数据,比较 符合旅客数据的特征,旅客全景视
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1