一种基于时空大数据的巡河轨迹集中度分析方法与流程

文档序号:24528416发布日期:2021-04-02 10:06阅读:114来源:国知局
一种基于时空大数据的巡河轨迹集中度分析方法与流程

本发明涉及大数据分析技术领域,涉及时空大数据特征挖掘技术,更具体地说它是一种基于时空大数据的巡河轨迹集中度分析方法,可应用于智慧河长建设中,可辅助管理人员判断巡河集中区域是否合理,指导其进行后续巡河工作部署安排。



背景技术:

近年来,各省市县都在大力推进河长制工作,期间收集了大量的河长巡河数据,但如何运用时空大数据分析方法,判断巡河集中度是否合理,是各级管理人员在河长制精细化、智慧化管理中的急切需求;

当前对巡河集中度分析主要是对时间和空间两个维度的分析,在时间维度上,是统计在年、季度、月、周等时间段内的巡河次数,在空间维度上,是统计在省、市、县、乡、村等行政区划内的巡河次数。但该方法在时间维度上,未考虑考核周期影响,在空间维度上,未考虑行政区划内巡河轨迹有效性、河长数量、河流分布疏密等因素的影响。比如,行政区划内河段越多,河长就越多,那自然巡河次数就多;相较于河流分布稀疏的地方,河流分布越密集的地方,其集中度自然也更高;且存在巡河时间过短、巡河里程过短以及巡河轨迹离河道岸线太远等无效巡河。如果忽略这些因素,将极大的影响巡河集中度计算的科学性,导致无法有效的判断巡河集中度是否合理,并不能用于指导其进行后续巡河工作部署安排;

因此,开发一种保证合理性的巡河轨迹集中度分析方法很有必要。



技术实现要素:

本发明的目的是为了提供一种基于时空大数据的巡河轨迹集中度分析方法,保证海量巡河轨迹集中度计算结果的合理性;解决当前巡河集中度分析中未考虑考核周期、巡河时空分布特征、巡河有效性等因素,导致巡河集中度分析失真的问题。

为了实现上述目的,本发明的技术方案为:一种基于时空大数据的巡河轨迹集中度分析方法,其特征在于:包括如下步骤,

s1:在时间维度和空间维度上,设定巡河有效性智能判断规则及其参数;

s2:根据预设的有效性判断规则,预处理每次巡河数据,过滤掉无效巡河记录,提取有效巡河数据;

s3:在有效巡河数据的基础上,对每条河流关联的巡河轨迹进行网格化,计算每个网格内的巡河次数;

s4:利用方差法,计算每条河流的巡河集中度;

s5:利用地理集中度指数法,计算区域内所有河流的综合巡河集中度。

在上述技术方案中,在s1中,时间维度包括两个判断规则:一是,单次巡河的时长大于5min;当单次巡河的时长小于或等于5min时,判定此次巡河无效;

二是,单次巡河在前3天内的巡河总次数小于3次;当单次巡河在前3天内的巡河总次数大于或等于3次时,判定此次巡河无效;

空间维度包括两个判断规则:一是,单次巡河的里程大于100米;当单次巡河的里程小于或等于100米时,判定此次巡河无效;

二是,单次巡河至少有20%的轨迹点落在河道岸线2公里范围内;当单次巡河小于20%的轨迹点落在河道岸线2公里范围内时,判定此次巡河无效。

在上述技术方案中,在s3中,对每条河流关联的巡河轨迹进行网格化后计算每个网格内的巡河次数,具体步骤如下:

s3.1:按巡河关联的河流,分组所有巡河轨迹,即一条河流对应多条巡河记录;

s3.2:根据每条河流关联的有效巡河轨迹的最小外接矩形,均匀划分宽度和高度固定的网格;

s3.3:通过网格与巡河轨迹的空间相交分析方法,循环计算每个网格和所有有效巡河轨迹的相交性,来统计每个网格内的巡河次数;

网格与巡河轨迹的空间相交分析方法如下:

当网格和有效巡河轨迹相交时,则网格内的巡查次数加一;当网格和有效巡河轨迹不相交时,则网格内的巡查次数不变;

s3.4:去除巡河次数为0的网格。

在上述技术方案中,在步骤s4中,利用如下的方差公式(1)计算每条河流的巡河集中度;方差越大,表示巡河越分散;方差越小,则巡河越集中;

(1)

公式(1)中:sj为第j条河流的方差,n为第j条河流关联的网格数量;ai为落在第i个网格内的有效巡河轨迹数;xi和yi为第i个网格中心点经纬度坐标;xj和yj为第j条河流所有网格的加权中心点经纬度坐标,其具体计算方式如下公式(2)所示:

(2)

公式(2)中:n为第j条河流关联的网格数量;ai为落在第i个网格内的有效巡河轨迹数;xi和yi为第i个网格中心点经纬度坐标。

在上述技术方案中,在s5中,利用如下地理集中度指数计算公式(3),计算区域内所有河流的巡河集中度;指数越大,表示巡河越集中;指数越小,则巡河越分散;

(3)

公式(3)中:g为区域内巡河集中度指数,sj为第j条河流的方差,m为区域内河流数量。

与现有技术相比,本发明的有益效果如下:

(1)合理性;本发明分析的是单条河或一个地区巡查轨迹是否集中和分散;本发明在计算巡河集中度时,过滤了无效巡河记录的影响,在计算模型上采用了方差法和地理集中指数法,能更灵敏的反映巡河轨迹的离散度,使计算结果能正确反映真实的巡河集中度;

(2)实用性;本发明将巡河集中度从区域维度分解至河流维度,既能反映单条河流的巡河集中度,也能反映区划内的巡河集中度,对于辅助管理人员判断巡河集中区域是否合理,指导其进行后续巡河工作部署安排具有重要意义;

(3)本发明通过s1中预设的四条有效性判断规则,可过滤掉无效巡河记录对集中度计算的影响;本发明采用网格与巡河轨迹相交性,来统计每个小区域内的巡河次数,来作为方差计算的权重;本发明采用常用于计算集中度的方差公式和地理集中度指数公式来量化集中度;河长制涉及到省市县乡村5级河长,全国河长有25万人以上,乡镇级河长要求每周要巡河一次,因此全国每年的巡查记录在1000万条以上,省级每年的巡查记录在50万条以上;河长制从2017年开始实行,每个省累计的巡河记录都在100万条以上,而且还在逐年增加,而本发明可应用于各种河长巡河轨迹集中度分析,本方法处理的数据量是海量级的。

附图说明

图1为本发明所述的基于时空大数据的巡河轨迹集中度分析方法的流程图;

图2为本发明的图1中s3巡河轨迹网格化的流程图;

图3为本发明的图1中s3所述单条河流的巡河记录网格化示意图;

图4为本发明的实施例所使用的2020年重庆丰都县龙河流域的巡河轨迹分布图;

图5为本发明的实施例所使用的龙河巡河轨迹网格化后的分级效果图。

图1中的s1、s2、s3、s4、s5分别表示基于时空大数据的巡河轨迹集中度分析方法的步骤s1、步骤s2、步骤s3、步骤s4、步骤s5;

图2中的s3.1、s3.2、s3.3、s3.4分别表示计算每个网格内的巡河次数方法的步骤s3.1、步骤s3.2、步骤s3.3、步骤s3.4;

图3是对空间维度的第二个判断规则(巡河轨迹不能离河道岸线太远,即单次巡河应至少有20%的轨迹点落在河道岸线2公里范围内)以及网格化的示意图;图3中,虚线为距河道岸线2km有效范围线,在虚线内的巡河轨迹有效,在虚线外的巡河轨迹则无效;通过图3中所示的横竖网格可统计落在每个网格内的巡河次数,该巡河次数值可标识每个小网格范围内的巡河密集度;

图4是本发明实验数据在执行步骤s2之后,区分出了有效巡河轨迹和无效巡河轨迹,其中,实线表示无效巡河轨迹,虚线表示有效巡河轨迹;

图5是本发明实验数据在执行步骤s3之后,计算出了每个小网格内的巡河次数,根据巡河次数将密集度分为了三级,网格填充色越深表示巡河次数越大。

具体实施方式

下面结合附图详细说明本发明的实施情况,但它们并不构成对本发明的限定,仅作举例而已。同时通过说明使本发明的优点更加清楚和容易理解。

本发明分析方法采用了:①首先综合采用了空间和时间维度的4个规则判断巡河有效性,把无效巡河剔除出巡河集中度计算,避免计算偏差;②采用空间分析方法,分析每个地理小网格与有效巡河轨迹的相交性,若相交,则网格内巡查次数加一,来量化计算巡河密集度;③采用方差和地理集中度指数来量化一条河流以及一个区域内的巡河集中度;

本发明将上述三点应用在河湖长制巡河轨迹集中度分析中,能更灵敏的反映巡河轨迹的离散度,使计算结果能正确反映真实的巡河集中度,保证海量巡河轨迹集中度计算结果的合理性;

本发明在s3.3中的空间相交分析方法,计算时引入一些gis专业库并编写代码计算;其中,空间相交分析方法为本领域的公知技术,在编码时有成熟的开源算法库可集成。

参阅附图可知:一种基于时空大数据的巡河轨迹集中度分析方法,包括如下步骤,

s1:在时间维度和空间维度上,设定巡河有效性智能判断规则及其参数;

s2:根据预设的有效性判断规则,预处理每次巡河数据,过滤掉无效巡河记录,提取有效巡河数据;

s3:在有效巡河数据的基础上,对每条河流关联的巡河轨迹进行网格化,计算每个网格内的巡河次数;

s4:利用方差法,计算每条河流的巡河集中度;

s5:利用地理集中度指数法,计算区域内所有河流的综合巡河集中度(如图1所示);本发明综合考虑了巡河在时间和空间维度上的多重因素,为巡河集中度计算提供了科学有效的分析手段,能够有效保证海量巡河轨迹集中度计算结果的合理性。

进一步地,在s1中,时间维度包括两个判断规则:

时间维度的第一个判断规则是:每次巡河时长不能过短,需要超过一定时长,即单次巡河的时长应大于5min,否则判定此次巡河无效,不参与巡河集中度计算;

时间维度的第二个判断规则是:每次河长考核周期内的巡河次数不能太过密集,即单次巡河在前3天内的巡河总次数应小于3次;否则判定此次巡河无效,不参与巡河集中度计算;

如村级河长每月应巡4次,应均匀的每周巡查一次,当几次巡河都集中在一小段时间范围内,则后续几次巡河可判定为无效;

空间维度也包括两个判断规则:

空间维度的第一个判断规则是:每次巡河里程不能过短,需要超过一定里程,即单次巡河的里程应大于100米;否则判定此次巡河无效,不参与巡河集中度计算;

空间维度的第二个判断规则是:巡河轨迹不能离河道岸线太远,即单次巡河应至少有20%的轨迹点落在河道岸线2公里范围内,否则判定此次巡河无效,不参与巡河集中度计算;

通过上述预设的四个有效性判断条件,剔除无效巡河对巡河集中度计算影响。

进一步地,在s3中,对每条河流关联的巡河轨迹进行网格化后计算每个网格内的巡河次数(如图2所示),具体步骤如下:

s3.1:按巡河关联的河流,分组所有巡河轨迹,即一条河流对应多条巡河记录;

s3.2:如图3所示,根据每条河流关联的有效巡河轨迹的最小外接矩形,均匀划分宽度和高度固定的网格;

s3.3:通过网格与巡河轨迹的空间相交分析方法,循环计算每个网格和所有有效巡河轨迹的相交性,来统计每个网格内的巡河次数;

网格与巡河轨迹的空间相交分析方法如下:

当网格和有效巡河轨迹相交时,则网格内的巡查次数加一;当网格和有效巡河轨迹不相交时,则网格内的巡查次数不变;

s3.4:去除巡河次数为0的网格;

采用小网格与巡河轨迹的相交性,量化每个地区的巡河集中度。

更进一步地,在步骤s4中,利用如下的方差公式(1)计算每条河流的巡河集中度;方差越大,表示巡河越分散;方差越小,则巡河越集中;

(1)

公式(1)中:sj为第j条河流的方差,n为第j条河流关联的网格数量;ai为落在第i个网格内的有效巡河轨迹数;xi和yi为第i个网格中心点经纬度坐标;xj和yj为第j条河流所有网格的加权中心点经纬度坐标,其具体计算方式如下公式(2)所示:

(2)

公式(2)中:n为第j条河流关联的网格数量;ai为落在第i个网格内的有效巡河轨迹数;xi和yi为第i个网格中心点经纬度坐标;

采用方差公式对单条河的巡河集中度进行了量化。

更进一步地,在s5中,利用如下地理集中度指数计算公式(3),计算区域内所有河流的巡河集中度;指数越大,表示巡河越集中;指数越小,则巡河越分散;

(3)

公式(3)中:g为区域内巡河集中度指数,sj为第j条河流的方差,m为区域内河流数量;

采用地理指数法对一个区域的巡河集中度进行了量化;根据巡河次数将密集度分为三级,通过三级量化解决不同地理尺度下的巡河集中度计算问题(如图5所示)。

实施例

现通过本发明应用于某地区的巡河轨迹集中度分析为实施例对本发明进行详细说明,对本发明应用于其他地区的巡河轨迹集中度分析同样具有指导作用。

本实施例采用的一种基于时空大数据的巡河轨迹集中度分析方法一实施例的流程图如图1和图2所示,本实施例使用重庆丰都县龙河流域的巡河数据作为示例数据(如图4所示),为2020年重庆丰都县龙河流域内的2765条巡河轨迹分布图,虚线为有效巡河,实线为无效巡河。

本实施例对某地区基于时空大数据的巡河轨迹集中度分析方法,具体步骤如下:

s1、设置4条有效性判断规则的判断参数,分别为:

①有效巡河的时长应超过5分钟;

②有效巡河的巡查次数在前3天内应小于3次;

③有效巡河的里程应超过100米;

④有效巡河的巡河轨迹应有20%在河道岸线2公里范围内;

s2、从河长制系统中读取2020年重庆丰都县龙河流域的所有巡河记录,共计2765条巡河记录,根据预设的4条有效性判断规则,计算得到:有624条巡河记录无效,有2141条巡河记录有效;

s3、在有效巡河数据的基础上,对每条河流关联的巡河轨迹进行网格化,计算每个网格内的巡河次数,具体步骤如下:

s3.1、按巡河关联的河流,分组所有巡河轨迹,即一条河流对应多条巡河记录,其中龙河的有效巡河是761条,双鹰河的有效巡河是102条,石马河的有效巡河是392条,包鸾河的有效巡河是337条,暨龙河的有效巡河是310条,董家河的有效巡河是239条;

s3.2、根据每条河流关联的有效巡河轨迹的最小外接矩形,均匀划分宽度固定的网格,以龙河为例,其最小外接矩形为(107.721639,29.747651,108.045639,29.915651),以每个网格的长和宽都为0.002°,即大约为200米,可均匀切分成83×162=13446个网格;

s3.3:通过网格与巡河轨迹的空间相交分析方法,循环计算每个网格和所有有效巡河轨迹的相交性,来统计每个网格内的巡河次数;

网格与巡河轨迹的空间相交分析方法如下:

当网格和有效巡河轨迹相交时,则网格内的巡查次数加一;当网格和有效巡河轨迹不相交时,则网格内的巡查次数不变;

s3.4、去除巡河次数为0的网格,以龙河为例,除去后,余下1353个网格有值,其网格化后的分级效果如图5所示,颜色越深表示集中度越高;

s4、利用方差公式,计算每条河流的巡河集中度;计算得出:龙河方差值为0.009377304264898788,双鹰河方差值为0.0004546770456277842,石马河方差值为0.0028801627494366823,包鸾河方差值为0.0017587730516899274,暨龙河方差值为0.003932220708302711,董家河方差值为0.0024805831750711526;说明相较而言,双鹰河巡河最集中,龙河巡河最分散;

s5、利用地理集中度指数计算公式,计算得到2020年重庆丰都县龙河流域内所有河流的综合巡河集中度为52.7%。

本实施例采用2020年重庆丰都县龙河流域的2765条巡河记录进行巡河集中度计算,在图4中展示了巡河轨迹分布图,从图4中可看到龙河巡河轨迹分布比较均匀,而双鹰河巡河轨迹分布在河流的一端,分布比较集中,这与最后的计算结果贴合的较好。

结论:本实施例采用基于时空大数据的巡河轨迹集中度分析方法,能够解决当前巡河集中度分析中未考虑考核周期、巡河时空分布特征、巡河有效性等因素,导致巡河集中度分析失真的问题,为巡河集中度计算提供了科学有效的分析手段,能够有效保证海量巡河轨迹集中度计算结果的合理性。

其它未说明的部分均属于现有技术。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1