基于地理空间信息的停车占用率预测方法及系统与流程

文档序号:31458275发布日期:2022-09-07 15:14阅读:86来源:国知局
基于地理空间信息的停车占用率预测方法及系统与流程

1.本发明涉及智慧停车技术领域,具体的,涉及基于地理空间信息的停车占用率预测方法及系统。


背景技术:

2.在城市地区找到一个位置合适的停车位可能是一项非常具有挑战性的任务。平均而言,停车搜索交通量,即四处寻找适宜停车位的车辆,占某些城市地区总交通量的30%。因此,它产生了深远的社会经济和环境影响,大量的燃料被浪费,越来越多的交通事故与寻找停车位有关。
3.帮助减轻停车搜索的一个可行解决方案是提供与停车相关的数据,例如通过在停车场部署智能传感器。理想情况下,这些信息可以以动态停车地图的形式传输到驾驶员的导航系统,以搜索停车位。为了开发更适应性的交通管理和智能停车系统,近年来停车占用率预测受到了广泛关注,通过这种方式,司机可以提前计划他们的行程,允许他们定制目的地和出发时间。一旦接近目的地,司机就可以直接进入一个空停车位。目前,停车占用率预测的准确性比较低,不能满足实际需求。


技术实现要素:

4.本发明提出基于地理空间信息的停车占用率预测方法及系统,解决了相关技术中停车占用率预测方法准确度低的问题。
5.本发明的技术方案如下:
6.第一方面,基于地理空间信息的停车占用率预测方法,包括:
7.获得历史占用率、待预测时间点和待预测街道区段的地理空间信息;所述地理空间信息包括中心性数据、关键兴趣点数据和土地用途数据;
8.将所述历史占用率、待预测时间点和地理空间信息输入到机器学习模型,得到待预测时间点对应的停车占用率;所述机器学习模型根据n天历史数据训练得到。
9.第二方面,基于地理空间信息的停车占用率预测系统,包括:
10.第一获得单元,用于获得历史占用率、待预测时间点和待预测街道区段的地理空间信息;所述地理空间信息包括中心性数据、关键兴趣点数据和土地用途数据;
11.第一处理单元,用于将所述历史占用率、待预测时间点和地理空间信息输入到机器学习模型,得到待预测时间点对应的停车占用率;所述机器学习模型根据n天历史数据训练得到。
12.第三方面,一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于地理空间信息的停车占用率预测方法的步骤。
13.本发明的工作原理及有益效果为:
14.本发明通过将待预测街道区段的地理空间信息纳入停车占用预测模型,并对地理
空间信息中的中心性数据、关键兴趣点数据和土地用途数据进行量化,量化结果用于停车占用率的预测,有利于提高预测效果。
附图说明
15.下面结合附图和具体实施方式对本发明作进一步详细的说明。
16.图1为本发明方法流程图;
17.图2为本发明中训练数据集范围对预测性能影响趋势示意图;
18.图3为本发明中地理空间的重要性示意图;
19.图4为预测范围对预测性能的影响趋势示意图;
具体实施方式
20.下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都涉及本发明保护的范围。
21.1.数据引用
22.1.1停车占用数据
23.本文中使用的历史停车占用率数据是由选取国内北方某城市海港新区的历史数据,作为一个城市级智能停车项目的一部分,其总体目标是提高路内外停车效率、城市综合交通管理水平和司机体验,并评估需求响应或分时段分区域停车定价及收费管理等。为了监控停车占用率,在路内停车位配备了传感器,并连续记录停车占用率。数据涵盖了分布在312个路内停车场(6291个停车位)的小时占用情况。
24.1.2地理空间数据
25.主要是利用开放式街道地图数据来表示街道网络,其提供了一个详细的街道和行人网络,土地使用数据由该城市有关专业部门提供,其中这些数据包括每个地块的土地使用类别。在这项工作中,我们考虑了三类:工业(生产、运输等)、商业(办公楼、商业服务、旅游)和住宅。我们还选择了三类关键兴趣点数据,包括商业、公共交通、旅游景点、业务包括所有注册企业的位置等;公共交通包括城市内火车站、长途汽车站和公共交通站点的位置等。
26.1.3数据预处理
27.本实施例中,我们共选择了11周的数据记录,每个路内区域的停车场的占用率如下:
[0028][0029]
在本文中,我们计算了每天每个停车路段的占用率,计算步长为1h,换句话说,上述方程的分母等于1h=3600s。
[0030]
此外,对所有停车段位置进行地理参考,并将开放式街道地图数据转换为网络数据集。我们考虑了两种类型的网络:一个包括所有行车道路的路网数据,以及一个人行道网络,被定义的网格,为以米为单位的间距。
[0031]
1.4地理空间信息的量化过程
[0032]
为了将地理空间信息作为预测模型的输入特征,需要以一种有意义的方式进行量化,即通过此量化过程,为每个停车区段的位置分配值来创建地理预测器。下面,我们描述了本文中推导地理空间特征的三种主要方法。
[0033]
1.4.1中心性
[0034]
中心性是网络分析中的一个基本概念,已被应用于社会网络分析、城市规划和交通等多个领域。特别是在城市地区,对中心性的研究方法是将街道网络的边缘转化为关系图,将城市街道格局表示为空间网络(所谓的折线图)。通过这样做,街道被映射到图节点上,街道片段的交叉点被映射到节点之间的边缘上。在本文中,我们考虑并计算了每个街道区段的3个中心性指数:接近中心性,中间中心性和α中心性。下面是按顺序的指数的数学表达式:
[0035][0036]
x=(i-αa)-1eꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0037]
其中σ
st
为从节点s到节点t的最短路径数,σ
st
(v)为经过v的节点s到节点t的最短路径数;d(w,v)是顶点v和w之间的距离,α是内生因素与外源因素在确定中心性方面的相对重要性,a是邻接矩阵,e是外部状态特征的影响。
[0038]
一个节点(在本文中的特指街道区段)的接近中心性量化了该节点与网络中所有其他节点之间最短路径的平均长度。一个节点的得分越高,它就越接近所有其他节点,因此在网络中越处于中心位置,一个节点的中间性中心性衡量的是该节点在两个其他节点之间的最短路径上的次数,在这条最短路径上扮演“桥梁”的角色。因此,高分表示网络中的关键节点。最后,α中心性是特征向量中心性的一种变化,它基于一个概念,即网络中的一个节点如果与相邻的重要节点相连,它就更重要。对于这三个指标,中心性得分越高,表明该街道区段在网络中的重要性越高。
[0039]
1.4.2服务区定义
[0040]
服务区用于评估设施的可达性,例如,沿着交通网络提供的服务。在本文中,沿着人行道网络绘制相关的缓冲半径。假设由此产生的服务区域代表从路内停车的街道区段步行距离很短的区域,有调查表明,司机愿意步行到目的地的最大距离是500米,因此将服务区半径设置为500m。
[0041]
在每个路内停车街道区段的服务区内,对住宅、办公写字楼和工业的土地使用特征进行了量化。第一个土地利用特征是根据每个服务区所包含的住宅单位的数量来衡量的,而写字楼和工业特征分别是根据其占地面积之和来评估的。在这样做时,土地使用地块被认为部分或全部位于服务区域内。同样,在每个服务区域内计算业务关键兴趣点位置的数量。
[0042]
1.4.3最短路径定义
[0043]
对于与停车路段相关的旅游、商业服务和公共交通的量化,计算了最短路径,在本文中,我们计算了从每个停车区段的中心点到人行道网络上所有关键兴趣点的单源最短路径。结果计算了平均距离(即从每个停车区段到所有点的所有最短路径的平均距离)。
[0044]
1.5地理空间特征的选择
[0045]
利用上述方法,共得到了9个地理空间特征。对中心性、关键兴趣点和土地用途分别分配了三个特征。表1显示了所有的地理空间特征及其推导结果。
[0046]
表1各停车街道区段的地理空间特征概述
[0047][0048]
2预测框架
[0049]
该预测框架的目的是预测未来特定时间内停车路段的占用率[0,1]。考虑了从1步到10步的预测范围,一个时间步长对应于1小时,我们预测了提前1小时到10小时的停车占用率,这是通过使用历史占用率作为数据输入来实现的。因此,为了提前1步进行预测,我们考虑了在要预测占用率的时间前1小时的占用率。此外,在数据输入中还考虑了地理空间特征和时间区段(即一天中的时间)。x被定义为数据输入(即特征向量),y对应于预测输出。因此,预测问题一般可以描述如下:
[0050]
x={t,o(t-k),gf1,...,gfi},y=o(t)
ꢀꢀ
(3)
[0051]
其中t为时间(即一天的小时),o(t)为时间t的占用,k是提前预测的步数(即小时),gf1...gfi是地理空间特征;根据表2中使用的特征集,可能存在0(即特征集1)到9(即特征集8-具有所有特征)的地理空间特征。
[0052]
为了评估不同的预测因素(即不同的输入特征)对预测模型的影响,定义了8个特征集(特征集1到特征集8),其地理空间信息输入有所不同。表2总结了每个特性集及其各自的输入类别。
[0053]
表2特性集概述
[0054][0055]
3.实施例设计
[0056]
为了解决第1节中提到的问题,我们对所有8个特征集进行了实施例设计。为了分析不同的输入场景,我们采用了不同的训练和测试分割。对于每个特征集,训练数据的量被设置为从1天到10天,以1天为增量。此外,为了考虑到工作日之间的潜在差异,数据集在相同的工作日进行训练。例如,对于3天的训练数据输入,考虑连续3个星期一。这种情况下的测试数据集由下周一的记录组成。最后取不同工作日的预测表现的平均值。对于所有的组合,都采用了十倍交叉验证的精度估计方法。因此,数据训练中地理空间信息和测试子集分别占总参考数据的90%和10%。
[0057]
此外,对于每个数据输入场景和特征集,我们考虑了不同的预测范围。实施例中均采用随机森林和人工神经网络算法,并进行平均绝对误差、平均平方误差和r2结果比较。评价地理空间信息对预测模型的贡献形成了一个关键的创新点,这是通过比较基线(特征集1)与其他所有特征集(特征集2到特征集8)在每个训练期间的预测性能来实现的;同样,对每个预测视界,分析了地理空间特征的影响。此外,为了评估每个特征的预测重要性,我们得到了平均平方误差的增加百分比(%incmse)。它表示由于特征被排列(即值被随机打乱)而导致的误差增加。值越高,特性就越重要。在最后一步中,我们分析了模型的预测性能作为地理空间的函数的变化。值得注意的是,我们以定量和定性的方式对所有路外停车场和路内停车区段进行了模型性能评估。
[0058]
3.1预测范围
[0059]
表3示出了所有特征集在1、5和10步/小时的预测范围上的性能比较,显然,对特征集的比较显示,短期预测(即提前几步/小时的预测)几乎没有差异。对于提前1步/小时的预测,不同特征集之间的结果几乎相同。然而,随着预测范围的增加,差异变得更加显著。
[0060]
当考虑到随机森林模型时,对包含地理空间信息的特征集的预测(特征集2到特征集8)在所有预测步骤上始终优于基线(特征集1)。更重要的是,基于所有地理空间特征类别(即特征集8)的预测比所有其他特征集表现得都要好得多。同样的方法也适用于神经网络模型。
[0061]
表3所有特征集在1、5和10步/小时的预测范围上的性能比较
[0062][0063]
3.2训练数据集范围
[0064]
为了分析在不同数量的训练数据下预测结果的变化趋势,我们以1天为增量,将训练数据集的范围从1天变化到10天。这个训练数据集的范围可用于模型培训可能非常有限,特别是在数据收集开始时。图2说明了在5步/h的预测范围内的训练数据集范围和预测性能之间的关系。
[0065]
当考虑随机森林模型时(图2(a)),增加数据输入量是有益的,直到有一个包含5天的训练数据集,并达到最佳状态。输入额外的训练数据(即6至10天)与模型改进无关。这适用于所有的预测范围(尽管只显示了提前5步的预测结果)。此外,无论预测范围如何,模式都非常相似。然而,需要注意的是,作为训练数据集范围的函数的性能差异相对较小。还应该注意的是,所有特征集的总体模式都非常相似,而且基线的表现都优于所有其他特征集。同样,使用特征集8的预测始终取得了最好的结果。
[0066]
与随机森林模型相比,训练数据集的范围对人工神经网络模型的影响在模式和大小方面都是不同的(图2(b))。虽然通常使用大约5天的训练数据集也能获得最好的结果,但该模型在更大程度上受益于不断增加的训练数据量。这在较短的预测范围中尤其明显。此外,与随机森林的结果相似,使用特征集8通常都获得了最好的结果。
[0067]
3.3.地理空间特征的贡献
[0068]
3.3.1地理空间特征的重要性
[0069]
图3显示了各因素在%incmse方面特性的重要性。(%incmse-平均平方误差的增加百分比)
[0070]
当考虑所有预测视界的平均值时,时间特征超过了%incmse的0.05,对预测模型的贡献最大,其次是历史占用率。在地理空间特征方面,土地利用特征商业写字楼具有最高的预测重要性,关键兴趣点的特色旅游景点的贡献略少,其次是关键兴趣点的其他特色商
务业务。中间中心性和α中心性特征对预测模型的贡献最小。
[0071]
3.3.2对预测模型性能的影响
[0072]
图4显示了性能改进作为预测范围的函数。对于随机森林算法(图4(a)),当将特征集2到特征集8的结果与基线(特征集1)的结果进行比较时,预测范围的长度与模型性能的改善明显相关。预测范围越长,每个特征集的值发散得越大。因此,在短期预测视界上,包含了地理空间信息的预测模型产生了3.1-4.2%的改进,而在10步的预测阶段中,这些值达到了16.5

25.4%。特征集8在所有预测范围内都记录了最显著的改进,其中包括了所有三种地理空间特征。
[0073]
与随机森林模型不同的是,人工神经网络模型的性能改进并没有随着预测范围的函数而稳步增加(图4(b))。然而,在更长的预测范围内,还是取得了改进。平均而言,特征集8在所有预测范围内表现出最大的改善,范围约为0-7%。需要注意的是,某些预测范围(例如,第3步和第8步)比其他预测范围显示出更多的改进,但却没有明确的演进模式。
[0074]
3.4结果汇总
[0075]
地理空间信息的结合始终有助于改进预测模型;与基线(特征集1)相比,在长期预测范围内(如提前预测10小时),提高了高达25.4%;
[0076]
包含更多的地理空间信息与更好的模型性能相关;土地用途和关键兴趣点信息比区段的中心性更有利。在所有的地理空间特征中,土地用途特征中商业写字楼的预测性最强,其次是旅游和商务服务特征;
[0077]
预测范围越长,预测的可靠性就越低;
[0078]
随着本方法目前实施的随机森林和前馈神经网络模型,训练数据量的增加(即更多天数的训练数据)并不一定会改善预测模型;本实施例中,包含5天的训练数据集,可以达到最佳状态。
[0079]
前馈神经网络模型在所有指标上都优于随机森林模型。此外,随机森林模型从地理空间信息中受益更大。
[0080]
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1