用户乘飞机出行行为的建模方法

文档序号:9844538阅读:454来源:国知局
用户乘飞机出行行为的建模方法
【技术领域】
[0001]本发明涉及建模技术领域,特别涉及一种用户乘飞机出行行为的建模方法。
【背景技术】
[0002] 现在乘坐飞机是一种非常普遍和便捷的出行方式,据中国民用航空局的统计, 2015年5月,在中国乘坐飞机出行的乘客超过35,000,000人次,因此理解用户的出行行为模 式对于预测航空出行需求等应用是十分重要的。现有的理解和发现用户的出行行为模式的 方法大部分是基于分析用户填写的调研报告。这些调研报告帮助探索和发现用户的偏好, 从而估计一些有价值的指标,比如所节省的出行时间的价值。然而这些方法都只是提供了 一些粗粒度的概括性的行为描述,无法提供针对单个用户的有效信息。
[0003] 针对单个用户的乘坐飞机出行行为模式的分析和建模。随着互联网和在线支付工 具的普及,越来越来的有出行需求的用户开始在航空公司(例如东方航空、南方航空)的网 站或者其它机票预订网站(比如携程网、去哪儿网)上提前预订机票。例如,当一个有出行需 求的用户在携程网上订票时,他/她需要选择出发城市、到达城市、舱位等级、出行时间、航 空公司、是否换乘等信息,当该用户订票成功时,在线订票网站会记录下该用户的一次订票 (出行)行为。利用这些来自在线订票网站的庞大的订票数据集,在线订票网站能够分析它 的用户的出行行为,特别是能够针对单个用户的出行行为进行分析。对于在线订票网站来 说,理解和发现用户的出行行为模式能够帮助它们提供更准确的推荐和更精准的个性化服 务。具体来讲,本发明主要关注如何建立一个用户级的出行行为模型。一个乘客的出行行为 由以下几个关键特征描述:起飞时间、到达时间、提前订票天数、价格、舱位等级等。本发明 试图利用历史的订票数据针对单个用户,建立一个概率模型作为用户乘飞机出行行为的描 述。
[0004] 建立一个用户级的出行行为模型面临着许多挑战。首先,对于用户的出行行为建 模是一个多元建模问题,因为用户的出行行为模式跟上述的多个特征有关。其次,关于用户 级行为建模的相关研究非常少。现在广泛使用的一些含参数的概率模型比如高斯分布、泊 松分布等并不适合用来作为用户出行行为的概率模型。另外,一个用户自身的有限数目的 历史订票记录不足以训练得到一个精确的概率模型。

【发明内容】

[0005] 本发明的目的在于提供一种用户乘飞机出行行为的建模方法,以解决现有用户乘 飞机出行行为的建模方法得到的概率模型精准度不高的问题。
[0006] 为解决上述技术问题,本发明提供一种用户乘飞机出行行为的建模方法,包括如 下步骤:
[0007] 在用户集合中选定一目标用户,根据目标用户的部分历史订票数据进行核密度估 计建立第一概率密度模型;
[0008] 在目标用户在所述用户集合中的补集中选取K个相似用户,并根据K个相似用户的 历史订票数据进行核密度估计建立第二概率密度模型,1 〇〇<丨《 + S,S为用户集合中用 户的总量;
[0009]基于所述第一概率密度模型和所述第二概率密度模型构建混合模型;
[0010]利用期望最大化算法和所述目标用户剩余的历史订票数据计算所述混合模型。 [0011]可选的,在所述的用户乘飞机出行行为的建模方法中,根据目标用户的部分历史 订票数据进行核密度估计建立第一概率密度模型,包括如下步骤:
[0012] 将所述目标用户的部分历史订票数据划分为第一部分数据和第二部分数据;
[0013] 根据所述第一部分数据进行核密度估计建立初始第一概率密度模型;
[0014] 根据初始第一概率密度模型和第二部分数据计算初始第一概率密度模型的似然 函数;
[0015] 将最大的似然函数所对应的带宽作为最佳带宽;
[0016] 根据最佳带宽和第一部分数据进行核密度估计建立第一概率密度模型。
[0017] 可选的,在所述的用户乘飞机出行行为的建模方法中,选取K个相似用户的过程如 下:
[0018] 统计用户集合中所有用户的特征向量;
[0019] 计算所述目标用户的特征向量与所述用户集合中每个用户的特征向量之间的欧 几里德距离;
[0020] 将计算的欧几里德距离由小到大进行排序,取前K个欧几里德距离所对应的用户 作为目标用户的相似用户。
[0021] 可选的,在所述的用户乘飞机出行行为的建模方法中,所述特征向量中的元素包 括:出行频率、乘坐舱型比例、出行时间比例、订票提前的平均天数、目的地城市的差异性。
[0022] 可选的,在所述的用户乘飞机出行行为的建模方法中,所述欧几里德距离越小,两 个用户越相似;距离越大,两个用户差别越大。
[0023] 可选的,在所述的用户乘飞机出行行为的建模方法中,所述混合模型表示为如下 公式:
[0024] M = aGl+bG2;
[0025] 其中,a,b为所述混合模型的权重参数,a+b = 1,G1为第一概率密度模型,G2第二概 率密度模型。
[0026] 可选的,在所述的用户乘飞机出行行为的建模方法中,还包括利用所述目标用户 剩余的历史订票数据中的部分数据测试所述混合模型的准确性的步骤。
[0027] 在本发明所提供的用户乘飞机出行行为的建模方法中,通过将用户的出行行为建 模为混合模型,所述混合模型基于第一概率密度模型和第二概率密度模型构建,第一概率 密度模型基于目标用户的数据构建,而第二概率密度模型基于与目标用户最为相似的K个 用户构建,从而避免了由于单个用户的历史订票数据的稀少带来的过拟合问题,提高了用 户出行行为所建模型的精准度。本发明设计的用户乘飞机出行行为的建模方法适用于针对 单个用户指导推荐和个性化服务。
【附图说明】
[0028] 图1是本发明一实施例中用户乘飞机出行行为的建模方法的流程图。
【具体实施方式】
[0029] 以下结合附图和具体实施例对本发明提出的用户乘飞机出行行为的建模方法作 进一步详细说明。根据下面说明和权利要求书,本发明的优点和特征将更清楚。需说明的 是,附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发 明实施例的目的。
[0030] 请参考图1,其为本发明一实施例中用户乘飞机出行行为的建模方法的流程图,如 图1所示,所述的用户乘飞机出行行为的建模方法包括如下步骤:
[0031] 首先,执行步骤S1,在用户集合中选定一目标用户,根据目标用户的部分历史订票 数据Di进行核密度估计建立第一概率密度模型;
[0032] 其中,根据目标用户的部分历史订票数据0:进行核密度估计建立第一概率密度模 型,包括如下步骤:
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1