乘客航线预测算法

文档序号:10687716阅读:931来源:国知局
乘客航线预测算法
【专利摘要】本发明是一个乘客个人航线预测算法,可以对乘客下一航线选择进行预测。在基础研究中提出了吸引力模型中,考虑了基础设施网络对出行所带来的影响。通过实验论文了人们出行的行程分布特性是由基础设施网络所导致的。在对乘客的下一航线进行预测,通过比较当前航线的出发机场,目的机场与Home之间的关系,分别进行预测,并充分考虑了乘客的飞行特性。当前航线的目的机场等于Home时,考虑乘客的当前状态,上一次出发的星期,时间段,城市的吸引以及时间的距离远近,并分别用公式进行表示。在乘客选择新的航线时考虑了群集特性,机场与机场之间的距离,通过选择下一最有可能的距离来选择机场。通过实验发现,模型的平均预测精度可以达到68%,并通过改变实验的环境,改变预测的长度和预测人数,发现预测相对比较稳定。
【专利说明】乘客航线预测算法 所属技术领域
[0001] 本发明涉及乘客航线预测系统,是对乘客的下一航线选择进行预测。
【背景技术】
[0002] 近年来,信息技术广泛应用在各行各业,数据增长速度越来越快,庞大的数据量对 海量数据处理技术提出来挑战。在民航运输业,随着各机场、航空公司信息化建设的深入, 电子设备产生的大量旅客出行数字痕迹得以保留,其数据规模达到了PB级,具备大数据的 规模性、多样性和高速性三个特点。民航交通分布与乘客出行密切相关,民航业大数据隐含 了大量旅客出行的模式信息。现有的交通分布模型并未考虑旅客出行的规律性和可预测 性。人类空间移动行为表现出的无标度特性是由基础设施网络本身无标度特性决定,但是 该结论缺少足够的证据。在地面交通网络上,对乘客的下一地点的预测已有一些研究,但是 在空中交通网络上对乘客的航线进行预测还未有相关研究。航空公司对乘客的个性化服 务,所以了解乘客的下一去向是很有必要。

【发明内容】

[0003] 在乘客的群集特性上提出了吸引力模型,实证了乘客的出行特性,发现具有拉伸 指数分布,而并不是之前认为的幂率分布或指数分布。数据上让人类空间行程分布特性增 加了丰富性的同时对人类行程分布的特性提出了新的结果。通过数据预处理,提取了航空 基础设施网络,利用Netlogo在基础设施网络上进行模拟出行。首先利用了 RM随机游走模型 进行模拟人的出行,模拟数据得到的旅客的行程分布是对数正态,与实际的拉伸指数并不 一致。在此基础上,对模型进行修改,考虑了不同的乘客具有不同的吸引力,一级城市(比如 北京)对乘客的吸引力更强。吸引力计算公式:M =竭",其中Cl1表示机场节点的连通度, k是一个自由参数。该模型为吸引力模型,利用模型得到的乘客行程分布特性与实际数据特 性一致,且参数值吻合,模型再现了人们出行的行程分布特性。人们的出行既有返回已经去 过的特性,同时会探索新的地点。利用乘客的历史航线轨迹,当前的航线及时间特性等,提 出了排行榜模型,对乘客的下一航线的选择进行预测。通过实验验证,本方法的预测效果最 好可以达到68%的预测精度。
[0004] 本发明的核心思想是通过数据分析,利用参数估计和假设检验对乘客的出行距离 进行分布实证得到其分布,进而用数学表达式进行刻画。该思想使得可以脱离以前研究的 假设,具有重要意义。针对乘客的飞行特性,分情况进行预测,既能对预测出乘客中已经去 过的地点同时可以预测出乘客没有去过的地点,获得了良好的预测精度。
[0005] 本发明的有益效果是,研究乘客行程分布的内在机制,可以使得我们更加了解基 础设施网络对出行所产生的影响。通过对乘客的下一航线进行预测,了解了乘客下一航线 选择的影响因素,以便可以对乘客进行个性化服务。
【附图说明】
[0006] 下面结合附图对本发明进行进一步说明。
[0007] 图1技术路线。
[0008] 图2预测算法流程图。
[0009] 图3乘客航线预测结果。
【具体实施方式】
[0010] 图1中,为乘客航线预测的路线,利用旅客的出行数据,通过大数据预处理,将数据 一部分用来分析建模,另一部分用来验证模型的有效性。采用了假设检验,多Agent技术仿 真探求乘客的行程分布特性以及出行影响因素。在个体特性研究方面,利用了信息熵、统计 学习方法挖掘乘客的飞行模式以及计算了理论的可预测值。最后利用了机器学习和人类动 力学的方法,提出了航线预测模型。
[0011] 图2中,为乘客航线预测算法的流程图。根据乘客当前航线的出发机场与目的机场 与乘客的Home之间的关系,分别进行预测。如果当前航线的出发机场等于Home,那么,构建 改进的1阶马尔科夫状态转移矩阵,用转移的次数代替转移的比例。根据当前的状态找出可 能性最大的两个值,并计算二者之差,如果大于给定的阈值,那么选择最大值所对应的航 线,否则认为乘客下一航线会回家。当出发机场和目的机场均不为Home时,同上计算最大的 两个值的差值,并与阈值比较,如果大于阈值,选择最大值所对应的航线,否则判断最大值 所对应的航线如果是在空中进行往返或者是回家,那么选择最大值所对应的航线,否则认 为乘客的下一次出行为回家。当乘客的目的机场为Home时,此时乘客有两种选择,一种是选 择已经去过的地点,另外一种是选择没有去过的地点。利用朴素贝叶斯的思想,计算公式 为:
123456 选取的乘客的四个特征为:乘客的历史航线总数,乘客不同的航线数,乘客不同航 线数\乘客的历史航线总数,乘客探索新航线的次数。 2 如果乘客选择已经去过的地点的话,那么乘客下一地点的选择因素主要有X(n), Hs(n),Ws(n),Att,T_short,决定,计算公式如下所示: 3
4 其中,X(n)为当前的状态,为一阶马尔科夫链 5 F(X(n+l) |X(n)) =F(X(n+l) =sn+11X(n) =sn) 6 表示出发的星期和出发的时段,将一天分成了四个时段,0代表的时间段为〇:〇〇: 00~6:00:00,1表示的时间段为6:00:00~12:00:00,2表示的时间段为12:00:00~18:00: 00,3表示的时间段为18:00:00~24:00:00,计算公式表示为:
[0020]
[0021 ] Att1表示不同城市的吸引,公式表达为,
[0022]

[0023] 为了表示时间的最近相关性,引入TT_short,用次数来代替时间,可由以下公式 表达:
[0024]
[0025] 当乘客返回之前去过的地点时,考虑乘客的群集特性,以及机场之间的距离,首先 选择下一最有可能的距离,并在符合距离的机场中选择吸引力最高的机场。
[0028] 图3,为乘客航线的预测结果,可以看出效果还不错。
[0026]
[0027]
【主权项】
1. 乘客的个体出行距离具有差异性,在群集上乘客的行程分布具有拉伸指数的分布特 性。对行程分布的特性的内在机制是什么?人类动力学的一些研究从人的角度出发,考虑了 周期性、阵发性等特性,但很少考虑基础设施网络的影响。通过建模发现人们出行的行程分 布特性是由基础实施网络影响。乘客飞行具有以某一个地点为中心,向四周进行辐射,经常 在某几个地点活跃,偶尔会去探索新的地点。针对乘客的飞行特性,采用机器学习和人类动 力学的方法,对乘客的下一航线的选择进行预测。预测精度达到68%。2. 根据权利1所建立的乘客的群集出行模型,航空基础设施网络中不同的节点有着不 同的连通度,不同机场的吸引力也不同,乘客的出行受到基础设施网络中机场节点吸引力 的影响。3. 根据权利1所建立的乘客的下一航线预测模型,根据乘客的当前航线的出发机场和 目的机场,与乘客的home进行比较,分情况进行预测。当当前航线的目的机场等于home,乘 客在探索新的地点时,利用群集出行模型的特性,从群集角度出发,对新地点的选择进行预 测 。
【文档编号】G06Q10/04GK106056249SQ201610395307
【公开日】2016年10月26日
【申请日】2016年6月6日
【发明人】彭舰, 陈继德, 宁黎苗, 陈瑜, 李梦诗, 黄飞虎, 徐文政, 刘唐, 黎红友
【申请人】四川大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1