一种考虑空间依赖性的港口船舶交通流量预测方法与流程

文档序号:30244824发布日期:2022-06-02 00:30阅读:175来源:国知局
一种考虑空间依赖性的港口船舶交通流量预测方法与流程

1.本发明属于水运交通领域,具体涉及一种考虑空间依赖性的港口船舶交通流量预测方法。


背景技术:

2.全球经济的发展使得海运贸易的需求不断提高,而港口作为海运贸易的节点,其重要性也日益提升。但海运运输需求以及运输船舶数量的逐步增长也同时对港口运营效率提出了更高的要求。而对港口的船舶交通流量预测不仅可以帮助港口提前进行交通管理,还可以为港口未来长久的建设发展提供重考依据。因此,如何准确预测港口的船舶交通流量对港口而言有着重要意义。
3.有关港口船舶交通流量预测的研究,较早主要使用时间序列模型和回归模型,基于历史数据和其他相关的影响因素进行流量预测。随着人工智能的快速兴起,机器学习等模型逐渐替代了传统的时间序列模型和回归模型,神经网络、支持向量机、集成学习等人工智能模型成为预测港口船舶交通流量的主流。但当前相关的研究主要着眼于提升预测模型的能力,从而最大限度从某一港口的历史数据中提取信息,最终实现港口的船舶交通流量预测。但港口的船舶交通流量不仅仅与该港口的历史流量相关,还受到其他主要港口和全球的航运网络的影响,因此,只考虑某一港口的历史流量无法将其他关联港口和整个网络的变化和影响纳入预测模型中,进而忽视了港口之间的空间依赖性。
4.图卷积神经网络作为一种考虑图结构的人工智能算法,可以将相邻节点的特征聚合到一起,从而将相邻节点间的空间依赖性纳入预测模型。当前,已有学者利用图卷积神经网络对道路交通的流量进行预测。首先将交叉口作为节点,将连接的道路作为边,从而组成图结构,然后基于图卷积神经网络对道路交通流量进行预测。该方法解决了传统流量预测方法忽略空间依赖性的问题,而以港口为节点,以航线为边组成的港口网络已经被学者证明为是一个复杂网络,同样可以利用图卷积神经网络对港口船舶流量进行预测。在水运预测领域,已有学者利用图卷积网络,将船舶航速、船舶密度等特征作为输入,对水运通航密度进行预测。但该方法直接应用于港口船舶流量预测时仍然存在缺点,港口网络中的船舶流量不仅仅与船舶自身航速等特征相关,还与网络的整体特征、该港口在网络中的地位等因素存在紧密联系。而普通的图卷积神经网络无法充分挖掘相关特征,因此,需要一个更适应港口网络特点的改进图卷积神经网络来充分挖掘港口间的空间依赖性,从而实现对港口船舶交通流量的更准确预测。
5.针对上述问题,本发明使用ais船舶大数据,在数据预处理后,对船舶挂港进行辨识,并基于辨识结果,构建了港口网络拓扑图。在此基础上,本发明依据复杂网络理论,得到港口在复杂网络拓扑结构中的特征以及港口复杂网络的公共特征,并将这两个特征与港口的历史船舶交通流量一起作为预测模型的输入特征,然后建立了基于图卷积神经网络的港口船舶交通流量预测模型,对港口的流量进行预测,最后进行预测误差测试。该方法以复杂网络为理论基础,在图卷积神经网络预测模型的基础上,加入了港口在复杂网络中的特征
以及港口网络的整体特征,从而使模型充分考虑了港口间的空间依赖性,避免了只利用港口自身历史数据预测的局限,为港口的交通管理提供了重要参考依据。


技术实现要素:

6.本发明要解决的技术问题是:克服上述现有技术的不足,提出一种港口船舶交通流量预测方法。
7.本发明的技术方案为:
8.一种考虑空间依赖性的港口船舶交通流量预测方法,包括以下步骤:
9.步骤一:ais数据获取与预处理
10.本步骤中的ais数据从船舶实际航行中获取,通过ais解码算法解析原始ais数据,然后提取所需的ais数据字段,包含了船舶名称、航速、船舶地理坐标、时间等信息,再对数据进行预处理,包括数据清洗、数据异常值剔除和数据补全。
11.步骤二:船舶挂港辨识
12.在该步骤中,基于ais的船舶地理坐标、时间和航速等信息进行船舶挂港辨识。第一步,将船舶地理坐标信息的点与所有港口停靠范围的面进行空间连接,提取出地理位置在港口停靠空间范围内的ais数据。第二步,计算船舶在港口的连续停留时间t,判断连续停留时间t大于停留时间阈值t
α
。第三步,若停留时间大于时间阈值,则计算船舶在停留时间内的平均航速和最大航速v
max
,若平均航速小于平均航速阈值v
β
,最大航速v
max
小于最大航速阈值v
γ
,则判断该船舶成功挂靠过该港口,完成船舶挂港辨识。
13.步骤三:建立港口网络拓扑图
14.基于步骤二中辨识出的挂港信息,建立港口网络拓扑图。以所有船舶挂靠过的港口为节点,连接两港口间的船舶航线为边,即建立了港口网络拓扑图g。g=(v,e)为有向图,当有船舶从港口a前往港口b时,港口a到港口b有航线相连,但港口b到港口a则没有航线相连。图g包含点的集合v和边的集合e,其中:
[0015][0016]
式中,n为港口网络中所有港口的数量,vi为第i个港口;
[0017][0018]
式中,e
ij
为从第i个港口到第j个港口的边。
[0019]
步骤四:构建港口特征矩阵
[0020]
该步骤中,基于步骤三中已经建立的港口网络拓扑图,生成港口的特征矩阵x。港口的特征矩阵x是一个n*q的矩阵,q表示矩阵的特征维度。港口的特征共分为三个部分,包括港口的历史船舶交通流量、港口在网络拓扑结构中的特征以及港口网络的公共特征。
[0021]
港口的历史船舶交通流量由对应预测时间段前的m个港口历史时间段的船舶交通流量组成。
[0022]
而港口在网络拓扑中的特征则基于复杂网络理论的指标计算得到,现有研究已经证明由ais数据构建的航运网络是一个复杂网络,因此可以采用复杂网络中的指标来反映港口在网络拓扑中的特征,并量化港口与网络中其他港口的关联程度。被选取的指标包括出度、入度、加权入度、加权出度、中介中心性和港口聚类系数,指标公式如下:
[0023][0024]
式中,ui为第i个港口的入度,x
ij
表示从第i个港口出发到第j个港口是否连通,若相连为1,反之则为0。
[0025][0026]
式中,si为第i个港口的出度。
[0027][0028]
式中,uwi为第i个港口的加权入度,w
ij
表示从第i个港口出发到第j个港口的船舶数量,即边的权重。
[0029][0030]
式中,swi为第i个港口的加权出度。
[0031][0032]
式中,bi为第i个港口的中介中心性,g
jk
表示从第j个港口出发到第k个港口的存在的最短路径的数量,g
ji
(i)表示从第j个港口出发到第k个港口的最短路径经过第i个港口的数量。
[0033]
港口的聚类系数反映港口间的聚集情况,在有向图中,假设港口i与ki个港口单向或双向连接,则这ki个港口之间最多存在ki(k
i-1)条边,由此,港口的聚类系数公式如下:
[0034][0035]
式中,ci为第i个港口的聚类系数,ri为ki个港口之间实际存在的边数。
[0036]
港口网络的公共特征同样可以利用复杂网络指标来计算,加入公共特征使得特征矩阵包含了整体港口网络的信息。被选取的指标包括平均最短路径、网络效率和网络聚类系数,指标公式如下:
[0037][0038]
式中,d为港口网络的平均最短路径,d
ij
表示从第i个港口出发到第j个港口的最短路径。
[0039][0040]
式中,e为港口网络的网络效率。
[0041][0042]
式中,c为港口网络的网络聚类系数。
[0043]
由此,得到了m维的港口历史船舶交通流量、6维的港口在网络拓扑结构中的特征以及3维的港口网络的公共特征。将这些特征组合即得到了n*q维的特征矩阵x,其中q=m+9。
[0044]
步骤五:基于图卷积神经网络模型预测港口船舶交通流量
[0045]
在该步骤中,建立的预测模型为双层图卷积神经网络,将步骤四中得到的港口特征矩阵作为模型的输入进行预测。模型的每一层传播规则如下:
[0046][0047]
式中,h
(1)
为第1层的港口特征,σ为激活函数,为连接后的邻接矩阵,表示的度矩阵,w
(l)
为第1层的参数矩阵。
[0048][0049]
式中,a为图g的邻接矩阵,i为n*n维的单位矩阵。
[0050]
通过传播规则,图卷积神经网络可以将相邻港口的特征聚合到一起,从而将港口之间的空间依赖性纳入船舶交通流量预测的考虑范围。在模型的第一层中,输入的矩阵为步骤三中得到的港口特征矩阵,即h
(0)
=x。当第一层图卷积神经网络计算结束后,港口的信息已经被一阶相邻港口的信息所更新,并输入第二层图卷积神经网络,第二层完成相同的计算,此时,港口又得到了二阶相邻港口的信息,最后使用softmax函数输出预测结果。基于此,得到模型的输出结果如下:
[0051][0052]
式中,z为模型输出的n*1的特征向量,softmax和relu均为激活函数。
[0053]
步骤六:预测误差测试
[0054]
在得到步骤五中模型的预测港口船舶交通流量后,对预测结果进行误差测试,以验证预测效果,使用的指标为平均绝对误差mae和平均绝对百分比误差mape。指标公式如下:
[0055][0056][0057]
式中,为第i个港口的船舶交通流量预测值,yi为第i个港口的船舶交通流量实际值。
[0058]
本发明的有益效果是:本发明从港口网络层面对船舶交通流量进行预测,能够从整体上对港口的船舶交通流量动向进行评估,同时,使用适合港口网络拓扑结构的图卷积神经网络为基础构建预测模型,可以充分挖掘港口间的空间依赖性,从而提高港口船舶交通流量的预测精度。除此之外,本发明依据复杂网络理论,将港口在网络中的拓扑特征及港口网络公共特征共同输入模型,使得港口的在网络中的地位得以进一步体现在预测模型中。本发明对港口船舶交通流量的预测可以为港口提前管理泊位、规划港口建设等提供参考依据。
附图说明
[0059]
图1是本发明提供的预测方法的整体流程框图。
具体实施方式
[0060]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
[0061]
实施例1。
[0062]
如图1所示,一种考虑空间依赖性的港口船舶交通流量预测方法,包括以下步骤:
[0063]
步骤一:ais数据获取与预处理
[0064]
本步骤中的ais数据从船舶实际航行中获取,通过ais解码算法解析原始ais数据,然后提取所需的ais数据字段,包含了船舶名称、航速、船舶地理坐标、时间等信息,再对数据进行预处理,包括数据清洗、数据异常值剔除和数据补全。
[0065]
首先,对ais数据进行数据清洗,包括统一数据格式,对船舶名称中缺失的数据进行填充。
[0066]
然后,对ais数据进行异常值剔除,将数据中地理坐标异常、时间异常、航线速度异常和信息重复的数据进行删除。
[0067]
最后,利用卡尔曼滤波对缺失的船舶航速和空间位置等数据进行补全。
[0068]
步骤二:船舶挂港辨识
[0069]
在该步骤中,基于ais的船舶地理坐标、时间和航速等信息进行船舶挂港辨识。第一步,将船舶地理坐标信息的点与所有港口停靠范围的面进行空间连接,提取出地理位置在港口停靠空间范围内的ais数据。第二步,计算船舶在港口的连续停留时间t,判断连续停留时间t大于停留时间阈值t
α
。第三步,若停留时间大于时间阈值,则计算船舶在停留时间内的平均航速和最大航速v
max
,若平均航速小于平均航速阈值v
β
,最大航速v
max
小于最大航速阈值v
γ
,则判断该船舶成功挂靠过该港口,完成船舶挂港辨识。
[0070]
步骤三:建立港口网络拓扑图
[0071]
基于步骤二中辨识出的挂港信息,建立港口网络拓扑图。以所有船舶挂靠过的港口为节点,连接两港口间的船舶航线为边,即建立了港口网络拓扑图g。g=(v,e)为有向图,当有船舶从港口a前往港口b时,港口a到港口b有航线相连,但港口b到港口a则没有航线相连。图g包含点的集合v和边的集合e,其中:
[0072][0073]
式中,n为港口网络中所有港口的数量,vi为第i个港口;
[0074][0075]
式中,e
ij
为从第i个港口到第j个港口的边。
[0076]
步骤四:构建港口特征矩阵
[0077]
该步骤中,基于步骤三中已经建立的港口网络拓扑图,生成港口的特征矩阵x。港口的特征矩阵x是一个n*q的矩阵,q表示矩阵的特征维度。港口的特征共分为三个部分,包括港口的历史船舶交通流量、港口在网络拓扑结构中的特征以及港口网络的公共特征。
[0078]
港口的历史船舶交通流量由对应预测时间段前的m个港口历史时间段的船舶交通
流量组成。
[0079]
而港口在网络拓扑中的特征则基于复杂网络理论的指标计算得到,现有研究已经证明由ais数据构建的航运网络是一个复杂网络,因此可以采用复杂网络中的指标来反映港口在网络拓扑中的特征,并量化港口与网络中其他港口的关联程度。被选取的指标包括出度、入度、加权入度、加权出度、中介中心性和港口聚类系数,指标公式如下:
[0080][0081]
式中,ui为第i个港口的入度,x
ij
表示从第i个港口出发到第j个港口是否连通,若相连为1,反之则为0。
[0082][0083]
式中,si为第i个港口的出度。
[0084][0085]
式中,uwi为第i个港口的加权入度,w
ij
表示从第i个港口出发到第j个港口的船舶数量,即边的权重。
[0086][0087]
式中,swi为第i个港口的加权出度。
[0088][0089]
式中,bi为第i个港口的中介中心性,g
jk
表示从第j个港口出发到第k个港口的存在的最短路径的数量,g
ji
(i)表示从第j个港口出发到第k个港口的最短路径经过第i个港口的数量。
[0090]
港口的聚类系数反映港口间的聚集情况,在有向图中,假设港口i与ki个港口单向或双向连接,则这ki个港口之间最多存在ki(k
i-1)条边,由此,港口的聚类系数公式如下:
[0091][0092]
式中,ci为第i个港口的聚类系数,ri为ki个港口之间实际存在的边数。
[0093]
港口网络的公共特征同样可以利用复杂网络指标来计算,加入公共特征使得特征矩阵包含了整体港口网络的信息。被选取的指标包括平均最短路径、网络效率和网络聚类系数,指标公式如下:
[0094][0095]
式中,d为港口网络的平均最短路径,d
ij
表示从第i个港口出发到第j个港口的最短路径。
[0096]
[0097]
式中,e为港口网络的网络效率。
[0098][0099]
式中,c为港口网络的网络聚类系数。
[0100]
由此,得到了m维的港口历史船舶交通流量、6维的港口在网络拓扑结构中的特征以及3维的港口网络的公共特征。将这些特征组合即得到了n*q维的特征矩阵x,其中q=m+9。
[0101]
步骤五:基于图卷积神经网络模型预测港口船舶交通流量
[0102]
在该步骤中,建立的预测模型为双层图卷积神经网络,将步骤四中得到的港口特征矩阵作为模型的输入进行预测。模型的每一层传播规则如下:
[0103][0104]
式中,h
(1)
为第1层的港口特征,σ为激活函数,为连接后的邻接矩阵,表示的度矩阵,w
(1)
为第1层的参数矩阵。
[0105][0106]
式中,a为图g的邻接矩阵,i为n*n维的单位矩阵。
[0107]
通过传播规则,图卷积神经网络可以将相邻港口的特征聚合到一起,从而将港口之间的空间依赖性纳入船舶交通流量预测的考虑范围。在模型的第一层中,输入的矩阵为步骤三中得到的港口特征矩阵,即h
(0)
=x。当第一层图卷积神经网络计算结束后,港口的信息已经被一阶相邻港口的信息所更新,并输入第二层图卷积神经网络,第二层完成相同的计算,此时,港口又得到了二阶相邻港口的信息,最后使用softmax函数输出预测结果。使用双层图卷积神经网络则可以使对应港口获取没有直接连接但间接相连的二阶相邻港口的特征,同时,又可以避免影响较弱的三阶及以上相邻港口冲淡重要关联港口的信息权重。基于此,得到模型的输出结果如下:
[0108][0109]
式中,z为模型输出的n*1的特征向量,softmax和relu均为激活函数。
[0110]
步骤六:预测误差测试
[0111]
在得到步骤五中模型的预测港口船舶交通流量后,对预测结果进行误差测试,以验证预测效果,使用的指标为平均绝对误差mae和平均绝对百分比误差mape。指标公式如下:
[0112][0113][0114]
式中,为第i个港口的船舶交通流量预测值,yi为第i个港口的船舶交通流量实际值。
[0115]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其
发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1