一种基于多因子聚合模型的景区畅游度预测范式方法与流程

文档序号：26009643发布日期：2021-07-23 21:29阅读：131来源：国知局

本发明涉及互联网大数据旅游服务领域，具体来说，涉及一种基于多因子聚合模型的景区畅游度预测范式方法。

背景技术：

随着社会生活水平的日益改善，人们的生活方式也不仅仅限于普通的衣、食、住、行。在物质方面得到提升的同时精神方面也追求一个质的飞跃，因此近些年旅游业也井喷式的发展，与此同时各景区的服务质量也需要同步的提升，提高有客户的旅游体验，特别是节假日的时间段，各个地区的景区游客常常出现较严重的拥堵跟滞留现象等问题。

因此为解决上述的问题现提出景区畅游度模型，该模型的目的是通过满足游客和管理两方面的需求，来改善游客旅游体验、转变景区服务观念，加快旅游智慧化建设。游客方面，游客通过获取景区畅游度信息，选择最恰当的出行时间和最合适的景点出游，从而获得较高满意度；景区管理方面，通过畅游度信息的发布，及时的向游客推荐最佳路线，避免游客集中部分景点，来提升景区服务水平和知名度。

技术实现要素：

本发明的目的是克服上述背景中的不足之处，提出一种基于多因子聚合模型的景区畅游度预测范式方法。

该方法包括如下步骤：

步骤s1：获取游客畅游景区影响因素；

步骤s2：建立游客畅游度数据集；

步骤s3：构建游客多因子聚合模型；

步骤s4：输出未来短期客流量预测数据；

步骤s5：构建景区畅游度模型；

步骤s6：畅游度指数结果输出。

优选地，所述步骤s1中游客畅游景区影响因素包括景区开放性、游客舒适度、道路通畅度和设施完善度。

优选地，所述步骤s2中游客畅游度数据集包括省内重点景区动态信息、天气预报信息、空气质量指数信息、pm2.5实时浓度信息、景区类型、景区游客量、道路拥挤度、高速卡口车流量、景区停车场停车余位、景区厕所密度和景区饭店密度信息。

所述步骤s3中构建游客多因子聚合模型主要包括如下步骤：

步骤s31：统计收集样本景区每小时客流量历史数据；

步骤s32：出游状态信息结果输出；

步骤s33：计算斯皮尔曼(spearman)相关系数ρ；

步骤s34：采用arima(p,d,q)模型预测未来一周每小时的客流量值。

优选地，所述多因子聚合模型步骤s31中样本景区每小时客流量历史数据的时间周期为t-t0，其中t代表当前时刻，t0代表1周前的此时刻。

优选地，所述多因子聚合模型步骤s32中出游状态信息结合了天气预报信息、空气质量指数信息、pm2.5实时浓度信息、气象预警和出游景点匹配性，具体结果包括适宜、较适宜、一般、较不宜、不适宜，并分别赋值为1、0.75、0.5、0.25、0。

优选地，所述多因子聚合模型步骤s33中斯皮尔曼(spearman)相关系数ρ包括各景点的历史客流量和出游状态值，相关系数ρ的计算方式为：

其中n数值为84，i代表其中的一个景点，xi代表景点i客流量，代表样本景点客流量均值，yi代表景区i出游状态，代表样本景区出游状态均值；基于各景点的历史客流量和出游状态值，采用spearman方法计算每个月周一至周日内两者相关性ρ值(调整系数)，得到12*7＝84个观察样本。

所述多因子聚合模型步骤s34中arima(p,d,q)模型具体为：

其中，l是滞后算子，d为整数且大于0，i代表景点数，p代表自回归项数，φ代表自回归系数多项式，q代表滑动平均项数，θ代表滑动平均系数多项式，εt代表零均值白噪声序列。

首先，对历史客流量的时间序列进行平稳性分析，若为非平稳数据则需进行d阶差分，化为平稳非白噪声序列。其次，计算自相关系数acf(autocorrelationfunction)和偏自相关系数pacf(partialautocorrelationfunction)，判断最佳阶层p和阶数q；最后，回归分析并验证结果；经过回归分析，计算客流量预测值；同时观察arima(autoregressiveintegratedmovingaveragemode)模型下的残差是否服从正态分布，并检验残差是否(自)相关。

优选地，所述多因子聚合模型步骤s34中预测的结果为：未来一周每小时客流量ξ1＝未来一周每小时的客流量预测值*(1+ρ)，其中，调整系数ρ是根据客流量与出游状态值两者相关系数进行确定。

预测景区未来一小时客流状态ξ2＝1-未来一周每小时的客流量/日承载最大客流量，

其中，ξ≦0.2对应报警状态，0.2<ξ≦0.4对应拥挤状态，0.4<ξ≦0.6对应适中状态，0.6<ξ≦1对应舒适状态。

所述步骤s5中景区畅游度模型评价指标包括游客舒适度、道路通畅度和设施完善度；其中景区闭园情况下的畅游度定义为0，景区开园情况下的畅游度模型构建包括如下步骤：

步骤s51：采用ahp方法构建游客舒适度、道路畅通度和设施完善度各维度指数分项指标；

步骤s52：对分项指标进行min-max归一化处理；

步骤s53：采用主成分分析法(pca)确认各分项指标权重；

步骤s54：综合评估畅游度指数。

优选地，所述步骤s52中分项指标min-max归一化处理方法如下：

x^*＝(xi-xmin)/(xmax-xmin)

其中，xi表示实际值，xmin和xmax为对应的极小值和极大值，x*取值范围介于0至1之间。

优选地，所述步骤s53中主成分分析法(pca)具体定义如下：

假设存在p个景区观察点r＝(x1，x2,…,xp)^t，每个样本景点涵盖i个特征xp＝(x¹,x²,…,xⁱ)，xⁱ对应是特定观察点的分项指标；

对样本矩阵r进行变换，求出相关系数矩阵，变换方法为标准化：

标准化其中，均值方差求解相关系数矩阵为r＝[rij]p*p，其中，其中，xij代表景区对应的观察特征指标，∑代表求和运算，zij代表标准化后的z值；

根据矩阵特征方程|r-λip|＝0，解出特征值λ和特征向量ip，得到主成分：j取1，2，...，n，并分析各指标的方差贡献率，若利用率达85％以上，确定权重wi值。

倘若方差贡献率不满足条件，指标间相关性较弱，那么需通过熵值法重新计算各维度权重大小。

根据标准化后的指标数据计算出信息熵：然后确定指标的权重大小：

最终，综合评价结果如下：

景区畅游度指数＝游客舒适度*w1+道路通畅度*w2+设施完善度*w3

优选地，所述步骤s6中畅游度指数结果输出主要包括如下结果：

a、客流量预测：

未来一周每小时客流量＝未来一周每小时的客流量预测值*(1+ρ)

b、畅游度指数：

景区畅游度指数＝游客舒适度*w1+道路通畅度*w2+设施完善度*w3。

本发明的有益效果在于：

(1)从游客方面来说，游客通过获取景区畅游度信息，选择最恰当的出行时间和最合适的景点出游，从而获得较高满意度。

(2)从景区管理方面来说，通过畅游度信息的发布，及时的向游客推荐最佳路线，避免游客集中部分景点，来提升景区服务水平和知名度。

(3)该发明通过建立多种模型来综合考虑景区畅游度，此方法灵活简洁具有十分广泛的实用性。

附图说明

图1是本发明景区畅游度预测范式方法构建流程图；

图2是本发明游客多因子聚合模型构建流程图；

图3是本发明景区开园情况下的畅游度模型构建流程图。

具体实施方式

下面将结合附图和实例对本发明作进一步的详细说明。

结合图1可知，该发明所述方法具体分为6个步骤，其中步骤s1获取游客畅游景区影响因素，其中影响因素包括了景区开放性、游客舒适度、道路通畅度和设施完善度。步骤s2建立游客畅游度数据集，其中数据包括省内重点景区动态信息、天气预报信息、空气质量指数信息、pm2.5实时浓度信息、景区类型、景区游客量、道路拥挤度、高速卡口车流量、景区停车场停车余位、景区厕所密度和景区饭店密度等信息。步骤s3中通过收集的数据构建游客多因子聚合模型，该聚合模型最终可以预测出未来一周每小时的客流量值，在步骤s4中输出未来短期客流量预测数据。步骤s5中景区畅游度模型评价指标包括游客舒适度、道路通畅度和设施完善度；其中景区闭园情况下的畅游度定义为0，景区开园情况下的畅游度模型构建。最后步骤s6中畅游度指数结果输出主要包括如下结果：

a、客流量预测：

未来一周每小时客流量＝未来一周每小时的客流量预测值*(1+ρ)

b、畅游度指数：

景区畅游度指数＝游客舒适度*w1+道路通畅度*w2+设施完善度*w3。

结合图2，步骤s3构建游客多因子聚合模型时，具体的又分为4个步骤，其中s31中样本景区每小时客流量历史数据的时间周期为t-t0，其中t代表当前时刻，t0代表1周前的此时刻。步骤s32中出游状态信息结合了天气预报信息、空气质量指数信息、pm2.5实时浓度信息、气象预警和出游景点匹配性，具体结果包括适宜、较适宜、一般、较不宜、不适宜，并分别赋值为1、0.75、0.5、0.25、0。步骤s33中斯皮尔曼(spearman)相关系数ρ包括各景点的历史客流量和出游状态值，相关系数ρ的计算方式为：

其中n数值为84，i代表其中的一个景点，xi代表景点i客流量，代表样本景点客流量均值，yi代表景区i出游状态，代表样本景区出游状态均值；基于各景点的历史客流量和出游状态值，采用spearman方法计算每个月周一至周日内两者相关性ρ值(调整系数)，得到12*7＝84个观察样本。步骤s34中arima(p,d,q)模型具体为：

其中，l是滞后算子，d为整数且大于0，i代表景点数，p代表自回归项数，φ代表自回归系数多项式，q代表滑动平均项数，θ代表滑动平均系数多项式，εt代表零均值白噪声序列

首先，对历史客流量的时间序列进行平稳性分析，若为非平稳数据则需进行d阶差分，化为平稳非白噪声序列。其次，计算自相关系数acf和偏自相关系数pacf，判断最佳阶层p和阶数q；最后，回归分析并验证结果；经过回归分析，计算客流量预测值；同时观察arima模型下的残差是否服从正态分布，并检验残差是否(自)相关。步骤s34中预测的结果为：未来一周每小时客流量ξ1＝未来一周每小时的客流量预测值*(1+ρ)，其中，调整系数ρ是根据客流量与出游状态值两者相关系数进行确定。

预测景区未来一小时客流状态ξ2＝1-未来一周每小时的客流量/日承载最大客流量，

其中，ξ≦0.2对应报警状态，0.2<ξ≦0.4对应拥挤状态，0.4<ξ≦0.6对应适中状态，0.6<ξ≦1对应舒适状态。

结合图3，景区开园情况下的畅游度模型构建包括如下5个步骤，其中步骤s51采用ahp方法构建游客舒适度、道路畅通度和设施完善度各维度指数分项指标。步骤s52中分项指标min-max归一化处理方法如下：

x^*＝(xi-xmin)/(xmax-xmin)

其中，xi表示实际值，xmin和xmax为对应的极小值和极大值，x*取值范围介于0至1之间。

步骤s53中：假设存在p个景区观察点r＝(x1，x2,…,xp)^t，每个样本景点涵盖i个特征xp＝(x¹,x²,…,xⁱ)，xⁱ对应是特定观察点的分项指标；

对样本矩阵r进行变换，求出相关系数矩阵，变换方法为标准化：

标准化其中，均值方差求解相关系数矩阵为r＝[rij]p*p，其中，其中，xij代表景区对应的观察特征指标，∑代表求和运算，zij代表标准化后的z值；

根据矩阵特征方程|r-λip|＝0，解出特征值λ和特征向量ip，得到主成分：j取1，2，...，n，并分析各指标的方差贡献率，若利用率达85％以上，确定权重wi值。倘若方差贡献率不满足条件，指标间相关性较弱，那么需通过熵值法重新计算各维度权重大小。

根据标准化后的指标数据计算出信息熵：然后确定指标的权重大小：

最终，综合评价结果如下：

景区畅游度指数＝游客舒适度*w1+道路通畅度*w2+设施完善度*w3

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨荣平;宋佳维
技术所有人：江苏唱游数据技术有限公司
我是此专利的发明人

上一篇：多显示器系统及多显示器系统的调整方法与流程
上一篇：一种组合物及含连续玻璃相的多孔陶瓷雾化芯的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。