考虑预测不确定性的机票购买决策方法和系统与流程

文档序号：17132126发布日期：2019-03-16 01:25阅读：355来源：国知局

本发明涉及购买消费决策领域，具体地，涉及一种考虑预测不确定性的机票购买决策方法和系统。

背景技术：

随着航空业的逐渐发展，航空公司大多数采用复杂的定价策略来提高其收益，从而导致飞机的票价呈现出极高的不确定性，并且由于定价所依据的诸多因素均不为公众所知，普通消费者往往难以把握价格的变动趋势。已有的方法大多从航空公司的角度出发，以提高公司收益为目的设计收益管理策略。从为购买者节省支出的角度出发设计一种购买策略，对于广大消费者以及在线票务服务公司都有重要应用价值。

根据常识，越早购买获得较低价格的可能性较高，但是根据对真实机票数据的统计，最低价格在起飞日期之前的分布趋近于均匀分布。在已有的研究中，一种方法是利用时间序列预测的方法预测价格并设置一个阈值进行决策，但是这些方法不能很好的适应机票订价的动态性以及不能完整把握整个时间内价格变动的趋势。机票购买是一种时序决策问题，最优停止理论用概率模型的方式给出最优性证明，但是该理论有强假设条件，即随机变量服从同分布，这个条件限制了其普适性。

机票价格预测，是指预测某一个给定航班机票的在未来一个或多个时间点的具体价格。准确地预测机票价格，无论对于消费者节省预算，抑或是机票经销商把握市场动向都有极大的正向促进作用。机票价格预测是一个典型的回归学习问题，作为输出值的票价是一个连续型的变量。在当前的研究和实践领域，直接针对机票价格预测的理论和方法较少。对于时间序列预测问题，较常用的方法是多元线性回归。由于其模型简单且可以适用于多元变量的特点，多元线性回归目前已被应用于许多实际问题中。由于航空公司的定价策略动态变化以及买卖双方的信息不对称性，机票价格预测的误差是不可避免的。而使用有误差的预测结果作为购买决策的基础可能会导致策略效果不好。因此，在做决策的时候应该考虑预测结果的准确性。多元线性回归的置信区间估计是对给定的自变量给出因变量均值的区间估计，通过该估计，可以衡量预测结果的不确定性。

技术实现要素：

针对现有技术中的缺陷，本发明的目的是提供一种考虑预测不确定性的机票购买决策方法和系统。

根据本发明提供的一种考虑预测不确定性的机票购买决策方法，包括：

获取原始价格数据步骤：确定购买的目标航班，获取目标航班的出发日期到当前日期为止的历史机票观测值，基于历史机票观测值生成原始数据集合；

训练数据集步骤：基于原始数据集合，生成特征数据集；

多步预测步骤：利用特征数据集训练对应不同预测步长的多元线性回归模型；

置信区间估计步骤：计算不同预测步长的置信区间估计，得到当前日期至目标航班的出发日期之间每天的预测价格概率分布；

生成购买策略步骤：利用预测价格概率分布的多重采样，得到多条模拟价格路径，对多条模拟价格路径进行倒推，得到最小代价期望值、当前日期代价，若最小代价期望值小于当前日期代价，则购买策略建议推迟购买，否则，则建议当前日期购买。

优选地，所述特征数据集主要包括目标航班在当前日期之前的临近日期价格目标航班在当前日期之前的临近日期价格平均值目标航班在当前日期之前的临近日期价格最小值目标航班临近日期出发的航次临近日期的价格目标航班距离出发日期的天数、目标航班在当前日期之前设定时间内的提价次数中的任一项或任多项；

其中，来表示目标航线r出发日期为d起飞前i天的票价；下标i表示天数；r表示目标航班；d表示目标航班的出发日期；表示目标航线r出发日期为d起飞前i天的票价总和。

优选地，所述当前日期至目标航班的出发日期之间每天的预测价格概率分布表示为：

式中，p表示预测价格概率分布；

t表示目标航班的出发日期；

s表示当前日期；

表示当前日期到目标航班的出发日期之间每天的预测价格概率分布；

hs表示历史价格数据；

f(hs)表示价格预测模型。

优选地，所述多元线性回归模型表示为：

式中，pi表示第i个价格预测值；

表示多维向量；

ei表示第i个价格预测值的随机误差；

表示第i个向量的转置。

优选地，所述特征数据集训练中，最小二乘法估计参数：

βols＝x(x^tx)^-1x^tp，

估计值为：

残差平方和为：

均方误差为：

mse＝sse/(n-p)

置信区间估计为：

式中，能够用正态分布代替；

进而得到t日期的预测价格概率分布为：

式中，βols表示最小二乘估计参数；

x表示特征矩阵；

x^t表示特征矩阵的转置；

p表示价格向量；

表示价格预测值；

e(p|x)表示预测值的期望；

x^t表示向量的转置；

β表示参数向量；

sse表示和方差；

表示余项平方；

mse表示均方差；

n表示样本数；

p表示特征维数；

表示估计量t分布；

表示置信区间；

表示特征向量的转置；

xf表示特征向量；

表示t日期预测价格分布；

ci()表示置信区间估计；

表示t日期预测概率价格；

表示t日期预测价格置信区间。

根据本发明提供的一种考虑预测不确定性的机票购买决策系统，包括：

获取原始价格数据模块：确定购买的目标航班，获取目标航班的出发日期到当前日期为止的历史机票观测值，基于历史机票观测值生成原始数据集合；

训练数据集模块：基于原始数据集合，生成特征数据集；

多步预测模块：利用特征数据集训练对应不同预测步长的多元线性回归模型；

置信区间估计模块：计算不同预测步长的置信区间估计，得到当前日期至目标航班的出发日期之间每天的预测价格概率分布；

生成购买策略模块：利用预测价格概率分布的多重采样，得到多条模拟价格路径，对多条模拟价格路径进行倒推，得到最小代价期望值、当前日期代价，若最小代价期望值小于当前日期代价，则购买策略建议推迟购买，否则，则建议当前日期购买。

与现有技术相比，本发明具有如下的有益效果：

本发明给出机票购买的消费者代价模型，考虑机票价格预测的不确定性，决策基于决策时到出发日期之前的完整价格路径的完整分析。通过置信区间估计价格分布并采用多重采样模拟决策过程，能够对推迟购买后带来的效果充分考虑。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为机票购买决策流程图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变化和改进。这些都属于本发明的保护范围。

通过多元线性回归的置信区间估计，分析机票价格预测结果的不确定性，在此基础上通过多次采样模拟决策过程计算未来代价的期望，并在此基础上做出决策，以一定程度上弥补当前机票购买决策领域的理论空缺。

根据本发明提供的一种考虑预测不确定性的机票购买决策方法，包括：

获取原始价格数据步骤：确定购买的目标航班，获取目标航班的出发日期到当前日期为止的历史机票观测值，基于历史机票观测值生成原始数据集合；

训练数据集步骤：基于原始数据集合，生成特征数据集；

多步预测步骤：利用特征数据集训练对应不同预测步长的多元线性回归模型；

置信区间估计步骤：计算不同预测步长的置信区间估计，得到当前日期至目标航班的出发日期之间每天的预测价格概率分布；

生成购买策略步骤：利用预测价格概率分布的多重采样，得到多条模拟价格路径，基于最小期望代价算法，对多条模拟价格路径进行倒推，得到最小代价期望值、当前日期代价，若最小代价期望值小于当前日期代价，则购买策略建议推迟购买，否则，则建议当前日期购买。

根据本发明提供的一种考虑预测不确定性的机票购买决策系统，包括：

获取原始价格数据模块：确定购买的目标航班，获取目标航班的出发日期到当前日期为止的历史机票观测值，基于历史机票观测值生成原始数据集合；

训练数据集模块：基于原始数据集合，生成特征数据集；

多步预测模块：利用特征数据集训练对应不同预测步长的多元线性回归模型；

置信区间估计模块：计算不同预测步长的置信区间估计，得到当前日期至目标航班的出发日期之间每天的预测价格概率分布；

生成购买策略模块：利用预测价格概率分布的多重采样，得到多条模拟价格路径，基于最小期望代价算法，对多条模拟价格路径进行倒推，得到最小代价期望值、当前日期代价，若最小代价期望值小于当前日期代价，则购买策略建议推迟购买，否则，则建议当前日期购买。

本发明提供的考虑预测不确定性的机票购买决策系统，可以通过考虑预测不确定性的机票购买决策方法的步骤流程实现。本领域技术人员可以将考虑预测不确定性的机票购买决策方法理解为所述考虑预测不确定性的机票购买决策系统的优选例。

具体地，所述特征数据集主要包括目标航班在当前日期之前的临近日期价格目标航班在当前日期之前的临近日期价格平均值目标航班在当前日期之前的临近日期价格最小值目标航班临近日期出发的航次临近日期的价格目标航班距离出发日期的天数、目标航班在当前日期之前设定时间内的提价次数中的任一项或任多项；

具体地，所述当前日期至目标航班的出发日期之间每天的预测价格概率分布表示为：

式中，p表示预测价格概率分布；

t表示目标航班的出发日期；

s表示当前日期；

表示当前日期到目标航班的出发日期之间每天的预测价格概率分布；

hs表示历史价格数据；

f(hs)表示价格预测模型

具体地，所述多元线性回归模型表示为：

式中，pi表示第i个预测价格；

β表示多维向量；

ei,表示第i个价格预测值的随机误差；

表示第i个向量的转置。

具体地，所述特征数据集训练中，最小二乘法估计参数：

βols＝x(x^tx)^-1x^tp，

估计值为：

残差平方和为：

均方误差为：

mse＝sse/(n-p)

置信区间估计为：

式中，能够用正态分布代替；

进而得到t日期的预测价格概率分布为：

式中，βols表示最小二乘估计参数；

x表示特征矩阵；

x^t表示特征矩阵的转置；

p表示价格向量；

表示价格预测值；

e(p|x)表示预测值的期望；

x^t表示向量的转置；

β表示参数向量；

sse表示和方差；

表示余项平方；

mse表示均方差；

n表示样本数；

p表示特征维数；

表示估计量t分布；

表示置信区间；

表示特征向量的转置；

xf表示特征向量；

表示t日期预测价格分布；

ci()表示置信区间估计；

表示t日期预测概率价格；

表示t时刻预测价格置信区间。

本发明的核心思想在于将机票价格序列视作时间序列，通过多元线性回归对出发日之前的价格进行多步预测，然后利用多元线性回归模型的置信区间估计方法度量预测结果的不确定性。预测方法所依赖的数据，主要为机票的历史价格观测数据。

假设目标航班出发日期为t，在t时刻之前需要在每个时刻给出购买或者等待的建议，如果给出购买建议或者到达出发日期则决策过程结束。下面对购买代价模型进行简要说明。消费者购买机票时，除了机票价格外还应该考虑推迟购买导致的升舱或购买失败风险。该风险随着出发日期临近会越来越高，且在靠近出发日之前的较短一段时间内显著提高。因此将购买代价中的风险部分用指数模型表示。从而将t时刻的消费者购买代价表示为：

cost(t,θ,δ)＝pt+θδ^t-t,

其中θ是最大风险常数(对应t时刻的风险)，δ是风险折扣因子，且0＜δ≤1。

本发明的方法由两个阶段组成：预测阶段和决策阶段。预测阶段中，根据历史价格观测数据对从当前时刻到出发之前的每天的价格分布进行预测，表示为：

其中hs是历史价格数据。本发明中对该多步预测问题采用直接策略，即对每个步长分别建立预测模型。

下面对价格分布预测方法进行说明。本发明的基础预测模型是多元线性回归模型，表示为：

其中是多维向量，ei,是随机误差。本发明使用最小二乘法估计参数：

βols＝x(x^tx)^-1x^tp，

那么估计值表示为：

残差平方和为：

均方误差为：

mse＝sse/(n-p)。

置信区间估计为：

本问题中，由于样本数量很大，可以用正态分布代替。t时刻的价格分布预测为：

第二阶段是决策阶段。决策策略的核心是，根据价格分布预测结果，对未来价格多次采样，并模拟决策过程，从而计算如果选择推迟购买后可能取得的最小代价的期望：

e[π(ps+1,δ,θ,p)]

决策的原则是，如果未来期望最小代价比当前时刻低，则选择推迟购买，否则选择在当前时刻购买，表示为：

e[π(ps+1,δ,θ,p)]≤(ps+θδ^t-s)

本发明给出期望代价的算法：根据价格预测的结果，可以得到当前时刻到出发日之间每天的价格分布因为预测价格的不确定性，采样后使用根据预测价格的概率分布可以得到对应的概率，将多次采样的结果用概率作为权重加权，即可得到该时刻的期望代价。因为未来最小代价需要多次递归计算，而预测价格分布的估计都是独立的，为了提高效率，采用倒推法计算。倒推的过程中模拟了采用该决策策略进行决策的完整过程。因为预测价格不是单一值而是一系列分布，可以根据这些分布产生多种不同代价路径，为了充分考虑预测不确定性，本发明采用多次采样的方法。最小代价期望算法的伪代码如表一所示。

以下结合图1对本发明的优选例作进一步阐述。

本发明实施方案按照以下步骤进行：

步骤1：确定购买的目标航班，并获取该航班到当前日期为止的所有历史机票观测值。例如，目标航班定为2018年10月1日北京到上海的mu5137次航班，当前日期为2018年9月10日，则原始数据集合当中应包含所有在2018年9月10日及以前观测到的机票价格记录。使用来表示航线r出发日期为d起飞前i天的票价。

步骤2：在原始数据集合的基础上生成特征数据集。特征包括：该航班在该观测日期之前的临近日期价格该航班在该观测日期之前的临近日期价格平均值该航班在该观测日期之前的临近日期价格最小值该航班临近日期出发的航次临近日期的价格距离出发日期的天数，该航班在观测日期之前一段时间内提价次数。

步骤3：利用特征数据集训练对应不同预测步长的多元线性回归模型。

步骤4：计算不同预测步长的置信区间估计，得到从2018年9月11日到2018年10月1日之间每天的预测价格概率分布。

步骤5：利用预测价格分布多重采样得到多条模拟价格路径。根据最小期望代价算法，从2018年10月1日开始向前模拟价格路径倒推，在每个日期把当前代价和未来最小代价比较，取最小值。该过程直到2018年9月11日结束，得到2018年9月10日若选择推迟购买的最小代价期望。如果该期望值小于2018年9月10日的代价，则策略建议推迟购买，否则在该日期购买。

表一最小代价期望算法的伪代码表

本领域技术人员知道，除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外，完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以，本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件，而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构；也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变化或修改，这并不影响本发明的实质内容。在不冲突的情况下，本申请的实施例和实施例中的特征可以任意相互组合。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曹健;徐誉畅
技术所有人：上海交通大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。