一种基于TSH压缩和DBSCAN聚类的船舶轨迹分析方法

文档序号:34361375发布日期:2023-06-04 17:15阅读:135来源:国知局
一种基于TSH压缩和DBSCAN聚类的船舶轨迹分析方法

本发明涉及船舶轨迹挖掘,具体而言,尤其涉及一种基于tsh压缩和dbscan聚类的船舶轨迹分析方法。


背景技术:

1、在当今大数据时代,数据挖掘技术是当前世界科学研究中一个较为前沿的领域,ais数据挖掘是海事大数据研究的重要内容。船舶轨迹聚类作为一种常用的数据挖掘方法,将不同船舶的轨迹数据整合到不同的类别或聚类簇中,这有利于海上交通管理利益相关者了解区域交通的运行状态和运动特征。并随着海上交通的蓬勃发展,海上航行安全的重要性与日俱增,船舶轨迹的提取和分析对于保障航行安全具有重要作用。

2、目前轨迹的压缩方法大多都是基于dp(douglas-peucker,道格拉斯普克算法)算法进行的。然而,利用dp算法是将每一条船舶轨迹视为二维空间中的一条线,但是船舶轨迹有其他重要的额外维度,如时间、航速和航向。为了解决此问题,本发明利用tsh算法进行轨迹压缩,综合考虑了船舶轨迹的几个重要维度(时间、航速和航向)。在船舶航行的多种复杂情况下,dbscan聚类都提供了良好的结果,但dbscan聚类的邻域样本数和密度半径难以确定,不同参数的选取影响着dbscan聚类算法的成败。


技术实现思路

1、根据上述提出的技术问题,提供一种基于tsh压缩和dbscan聚类的船舶轨迹分析方法。本发明主要解决了船舶轨迹压缩质量问题,考虑了ais数据的多维信息(经度、纬度、时间、航速和航向);针对dbscan聚类参数难以确定的问题,提出了聚类结果的综合评价指标scch,根据scch得分实现参数的自适应选择。

2、本发明采用的技术手段如下:

3、一种基于tsh(time-speed-heading-based,时间航速航向的压缩算法)压缩和dbscan(density-based spatial clustering of applications with noise,dbscan)聚类的船舶轨迹分析方法,包括:

4、s1、对船舶轨迹进行清洗;

5、s2、利用tsh对船舶轨迹进行压缩;

6、s3、利用hausdorff距离进行轨迹之间的相似性度量,并得到相似性度量矩阵;

7、s4、利用dbscan对得到的相似性度量矩阵进行聚类;

8、s5、计算综合指标scch得分,根据scch得分的变化曲线,选择最佳的初始参数,实现参数的自适应选择。

9、进一步地,所述步骤s1中,对船舶轨迹进行清洗包括:数据删除和数据修复;其中:

10、所述数据删除,用于对经过解码的ais数据进行清洗,去除明显的ais数据错误;

11、所述数据修复,用于对船舶轨迹进行重建,选择三次样条插值法对船舶轨迹进行修复。

12、进一步地,所述步骤s2中,利用tsh对船舶轨迹进行压缩,包括:

13、s21、基于tr算法,计算成对的估计时间同步位置之间的距离,一个在原始轨迹上,一个在相应的近似轨迹上;

14、s22、基于sp算法,计算每两个轨迹点的航速差,将每个航速差值与规定阈值比较,若相邻两端轨迹点的航速差值均大于阈值,那么则保留中间点,否则将被丢弃;若两个条件有一条不满足,将对下一个轨迹点进行判断,直到遍历轨迹中所有点,算法结束;

15、s23、基于hd算法,依次计算每个轨迹点对应转向角θi,把得到的转向角θi再依次与规定阈值θth进行比较,若θ>θth则留下当前轨迹点i为关键点;若θ≤θth则对一下轨迹点i+1进行判断,直到遍历轨迹中所有点;

16、s24、根据船舶航速和航向变化的运动特征来考虑船舶行为,同时也根据真实轨迹点与时间同步点的欧式距离来检查时间。在算法每次递归中,依次检查三个停止条件,同步欧氏距离、航速差和航向差,如果同步欧氏距离、航速差和航向差都分别大于其各个阈值,则保留该点,否则将其剔除。

17、进一步地,在所述步骤s21中,基于tr算法,计算成对的估计时间同步位置之间的距离,具体包括:

18、假设pa-p1-p2-p3-pb为原始轨迹上的点,其中p1′是p1的时间同步点,位于近似轨迹lpa-pb上,p1′的坐标(x′i,y′i)使用线性插值计算为:

19、

20、

21、基于确定的时间同步点,计算p1和p1′之间的距离;如果此距离大于定义的阈值,则该点将包含在结果集中,否则将被丢弃。

22、进一步地,在所述步骤s22中,基于sp算法,计算每两个轨迹点的航速差,具体包括:

23、假设轨迹点依次为p1-p2-p3-p4-p5,则每两个轨迹点的航速差为sp2-p1、sp3-p2、sp4-p3、sp5-p4。

24、进一步地,在所述步骤s3中,利用hausdorff距离进行轨迹之间的相似性度量,并得到相似性度量矩阵,包括:

25、s31、利用双向hausdorff距离来获得船舶轨迹之间的距离;

26、s32、计算船舶轨迹的相似度矩阵,轨迹之间的相似度度量函数表达式如下:

27、

28、其中,尺度参数δ表示相似性和距离之间的增减关系;当尺度参数过小时,噪声的影响较大;当尺度参数过大时,亲和矩阵震荡较大;δa、δb分别为轨迹a、b与其他轨迹之间的hausdorff距离的平均值。

29、进一步地,在所述步骤s5中,计算综合指标scch得分,根据scch得分的变化曲线,选择最佳的初始参数,实现参数的自适应选择,包括:

30、引入综合聚类性能指标scch,考虑到算法的有效性和可靠性,提出的聚类性能指标综合了ch分数和sc分数,scch分数定义为:

31、

32、其中,θsc和θch分别表示当前输入参数得到聚类结果的sc得分和ch得分,θsc和θch表示所有输入参数得到聚类结果的sc得分向量和ch得分向量,θsc norm和θch norm是sc得分和ch得分的归一化结果;θscch越大,聚类效果越好。

33、较现有技术相比,本发明具有以下优点:

34、1、本发明提供的基于tsh压缩和dbscan聚类的船舶轨迹分析方法,利用tsh算法对修复后的船舶轨迹进行压缩;利用hausdorff距离对整体数据集合的整条轨迹两两度量,得到了hausdorff距离矩阵;通过dbscan对hausdorff距离矩阵进行聚类;计算不同输入参数的scch得分;根据scch得分曲线选择最优初始参数;利用最优初始参数对hausdorff距离矩阵进行dbscan聚类,最终提取到了一个区域的船舶轨迹簇,得到了一类船舶的行驶路线。

35、2、本发明提供的基于tsh压缩和dbscan聚类的船舶轨迹分析方法,解决了船舶轨迹压缩质量问题,考虑了ais数据的多维信息(经度、纬度、时间、航速和航向)。

36、3、本发明提供的基于tsh压缩和dbscan聚类的船舶轨迹分析方法,针对dbscan聚类参数难以确定问题,提出了聚类结果的综合评价指标scch,根据综合聚类性能指标的统计特性,自适应地选取最佳聚类参数。

37、基于上述理由本发明可在船舶轨迹挖掘等领域广泛推广。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1