基于DBSCAN的VMS定置刺网渔船网次提取方法与流程

文档序号:16975999发布日期:2019-02-26 19:00阅读:749来源:国知局
基于DBSCAN的VMS定置刺网渔船网次提取方法与流程

本发明涉及渔船船位数据挖掘技术领域,特别是涉及一种基于dbscan的vms定置刺网渔船网次提取方法。



背景技术:

渔船监测系统(vms,vesselmonitoringsystem)能够提供渔船时间、位置和动态信息,目前我国渔船安装船舶自动识别设备(ais)、北斗卫星船位监控系统,cdma公众移动通讯设备等,初步实现对海洋渔船船位的实时联络及跟踪监控。其中北斗卫星传送的经纬度船位数据的时间分辨率为3分钟记录一次,空间分辨率约为10米,时空精度高,实时性强,在渔船捕捞行为研究方面有较强的应用价值。网次是捕捞努力量计算,渔业资源调查,渔业生产管理中的重要统计参数,目前针对定置刺网网次提取的方法较多是基于航向、航速特征进行统计分析,而基于位置信息经聚类来识别网次的方法尚未出现。



技术实现要素:

本发明所要解决的技术问题是提供一种基于dbscan的vms定置刺网渔船网次提取方法,能够计算定置刺网渔船作业网次数量,并得到各网次网长。

本发明解决其技术问题所采用的技术方案是:提供一种基于dbscan的vms定置刺网渔船网次提取方法,包括以下步骤:

(1)统计各个点回报的即时航速的频数,判断定置刺网捕捞的收网和放网状态,提取收网状态下的船位数据;

(2)使用回报时间得到网次间时间间隔阈值,根据各点的航速、网次间时间间隔计算聚类参数,带入dbscan算法判断定置刺网的网次,依次计算网次内各点距离,提取定置刺网各网次长度。

所述步骤(1)具体包括:根据定置刺网渔船航速统计船位点在各航速出现的频数,找到频数峰值,获取峰值两侧的谷值作为定置刺网收网的航速阈值的最小值与最大值,利用航速阈值筛选出可能处于收网状态的点。

所述步骤(2)中使用回报时间得到网次间时间间隔阈值具体为:计算可能处于收网状态的点中相邻船位点的时间间隔,统计在各时间间隔出现的频数,对时间间隔频次取对数,找到分布图中变化趋于平稳时的最小值,作为网次间时间间隔的阈值。

所述步骤(2)具体包括:根据时间分辨率、定置刺网收网状态下的速度阈值和网次间时间间隔阈值计算出dbscan算法的参数,对vms船位数据进行聚类提取各个网次,通过计算相邻网次间起止点的距离和时间将归属同一网次的不同网次进行合并,依次计算网次内各点距离,提取单次刺网网次的长度。

所述步骤(2)中dbscan算法聚类参数中半径范围为时间分辨率和定置刺网收网状态下的速度阈值的乘积,半径内指定点的数目为3。

有益效果

由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明基于位置信息提取出定置刺网作业网次并可统计出放网长度,准确性高,适用于所有定置刺网作业渔船。结果可作为定置刺网捕捞努力量进行捕捞经济效益的深入分析,也可作为重要的统计量参与限额捕捞等生产管理和渔业资源调查评估。

附图说明

图1是定置刺网渔船出海作业轨迹点示意图;

图2是定置刺网船位点在各航速出现的频数统计图;

图3是航速阈值筛选可能的定置刺网收网点(粗的黑色点)示意图;

图4是定置刺网网次重叠现象示意图;

图5是相邻船位点各时间间隔出现的频次取对数后统计图;

图6是dbscan算法概念示意图;

图7是同一网次被判断为多网次的现象示意图;

图8是定置刺网网次提取示意图;

图9是定置刺网各网次放网长度统计图。

具体实施方式

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

本发明的实施方式涉及一种基于dbscan的vms定置刺网渔船网次提取方法,包括以下步骤:统计各个点回报的即时航速的频数,判断定置刺网捕捞的收网和放网状态,提取收网状态下的船位数据;使用回报时间得到网次间时间间隔阈值,根据各点的航速、网次间时间间隔计算聚类参数,带入dbscan算法判断定置刺网的网次,依次计算网次内各点距离,提取定置刺网各网次长度。具体如下:

根据定置刺网渔船航速统计船位点在各航速出现的频数,找到频数峰值,获取峰值两侧的谷值作为定置刺网收网的航速阈值的最小值与最大值;利用航速阈值筛选出可能处于收网状态的点,然后计算相邻船位点的时间间隔,统计在各时间间隔出现的频数,对各时间间隔频次取对数,找到分布图中变化趋于平稳时的最小值,作为网次间时间间隔的阈值;根据vms船位数据的时间分辨率、定置刺网收网状态下的速度阈值、网次间时间间隔阈值计算出dbscan算法的参数,对vms船位数据进行聚类提取各个网次;通过计算相邻网次间起止点的距离和时间将归属同一网次的不同网次进行合并;依次计算各网次内点间距离得到定置刺网各网次长度。

本实施方式所用dbscan算法是一种基于密度的聚类方法,它可以发现任意形状的聚类、自动确定聚类数以及有效剔除噪声点。其中心思想是聚类空间中某点一定区域内若所包含的对象的数目不小于某一给定阈值,则将当前对象与附近对象标记为一个类,对该类中未检索的对象进行相同判断,从而对该类进行扩展。普通dbscan算法中主要涉及到两个参数:邻域(eps)和邻域密度阈值(minps)。由于定置刺网的作业点聚集在网具周围,不同月份的数据往往叠置在一起,因此在判断网次时增添网次间时间间隔t进行约束,以区分各网次。

下面以具体的实施例来进一步说明本发明,一艘定置刺网渔船在2017年全年船位点的空间分布如图1,按照时间排序组成空间轨迹点。定置刺网渔船作业时通常以较大速度行至渔场做放网准备,放网时航速较快,随后渔船处于抛锚或漂流等待,此时航速基本为0m/s。一段时间后开始收网,收网时速度较慢且持续时间较长。在收网过程中若渔获量较少则采取边收边放网的作业方式,否则先收网,取鱼后放网。由于定置刺网渔船放网时速度较快,与航行时速度范围存在重叠,而收网过程速度较其他状态区别较大,因此定置刺网网次的起止点,用收网起止点来表示。

1.航速频数统计

根据定置刺网渔船航速统计船位点在各航速下出现的频数,渔船进行收网作业时,处于一个相对接近的较低的航速,因此,找到航速频数的峰值,获取峰值两侧的谷值可以作为刺网收网的航速阈值的最小值与最大值;可以认为,只有航速处于航速阈值内的船位点,才是正在进行收网作业的船位点。图2是渔船的航速频数曲线,第一个峰值为渔船收网状态,峰值两侧获取收网状态的阈值,即最小值为0.4m/s,最大值为2m/s,通过航速阈值筛选可能的刺网收网点(图3中粗的黑色点)。

2.网次间时间间隔频数统计

根据定置刺网作业的特点,渔船往往在固定海域进行多次作业,且收网结束后多存在立刻下网的操作,因此相同海域往往存在多次作业情况,且网次间船位点以较小的距离间隔密集存在(图4),在通过点间距离进行聚类时会将不同网次的点识别为同一类。为避免此类情况,必须先区分网次。北斗vms数据中包含了各船位点的时间,定置刺网各网次间都有一定的时间差,在提取可能的定置刺网收网点后,可计算相邻船位点的时间间隔,统计各时间间隔出现的频数。如图5所示,对时间间隔频数取对数后观察其变化。时间间隔主要集中在0-30分钟,30分钟以内对应频数呈现下降的趋势;30分钟后时间间隔跨度较大,且频次主要在低值范围内波动。定置刺网作业往往是在起网结束后放网或继续航行至下一网次,由于前期提取的是起网状态下的作业点数据,因此时间间隔较大的值多表示前一网次作业结束点和后一网次作业起始点的时间差,且网次时间间隔具有随机性,任一时间间隔对应的频次不高,结合这一特点可知,收网状态下相邻网次时间间隔主要集中在30分钟以后,因此以30分钟为阈值区分网次。

3.dbscan算法参数的确定及定置刺网网次初步提取

结合北斗数据时间分辨率及速度提取阈值,选择以3min、2m/s为阈值,得到半径eps为360m;检索点3min前后应各包含一点,因此minpts为3;网次间时间间隔阈值t为30min。算法执行中重要一步是判断检索点与eps邻域内其他点的时间间隔,统计有效点数。如图6所示为dbscan算法概念示意图,其中核心点表示在该点的eps邻域内存在不少于minpts的样本点数。如点a所示,其邻域内包含5个点(包括点a),由于a点时间间隔大于t,实际有效点数为4,因此判断为核心点。边界点表示该点在某核心点邻域内,但其本身不是核心点,如点b所示;噪声点为邻域内有效点数不满3个的点。其中核心点多为网次内部点,边界点为网次起止点。

在算法执行过程中,需要计算周围点与核心点的距离,判断其是否在360m以内,由于地球是一个两级部位略扁的不规则球体,在进行大地坐标系的计算时,一般可将其作为一个球体计算。因此,地球上已知经纬度的两点之间,可以使用球面距离公式计算其距离。假设两个船位点a,b,其经纬度分别为alon,alat,blon,blat。那么a、b两点之间的距离d可以用半正矢公式(haversineformula)求得,其公式为:

其中r为地球平均半径6378145m。

本实施例使用java编程实现dbscan算法,提取聚类后每一类的时间最小值与最大值作为该网次的起始点和结束点,存入mysql数据库,表结构如下。

表1定置刺网网次提取表

4.网次合并

在初步提取网次之后发现,由于时隙冲突等问题可能导致船位信息发生缺失,在聚类时因为点间距离的原因,使得一个完整的网次被划分为多个相邻网次(图7),从而在网次数的统计上出现误差。为了减少网次的误判,将当前网次的起止点分别与前一网次的终点及下一网次的起点进行计算,得到其距离和时间间隔,如果满足时间间隔小于30min,且两点间距离小于时间间隔与速度最大值(本例中为2m/s)的乘积,则将两个网次合并,最后提取的网次如图8所示。

5.定置刺网网次长度提取

根据收网时各网次内船位点经纬度,依次累加相邻两点的空间距离,即可得到定置刺网渔船单个网次的网长。本例中示例渔船2017年全年共计201个网次,图9表示了各网次长度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1