一种确定城市街道占道经营高发区域的方法及系统的制作方法

文档序号:10552955阅读:309来源:国知局
一种确定城市街道占道经营高发区域的方法及系统的制作方法
【专利摘要】本发明涉及一种确定城市街道占道经营高发区域的方法及系统。该方法包括:采用优化的DBSCAN算法对采集到的城市街道占道经营数据进行处理,对城市街道占道经营区域进行分类;根据所述对城市街道占道经营区域的分类结果确定城市街道占道经营高发区域;其中,所述优化的DBSCAN算法选择当前数据对象预设阈值邻域半径外的点作为下一个待处理数据对象。本发明采用优化的DBSCAN算法,选择当前数据对象预设阈值邻域半径外的点作为下一个待处理数据对象,避免公共邻域对象的重复查询,减少对核心对象邻域查询的计算,降低了算法的复杂度,提高可确定街道占道经营的高发区域的效率,为城市管理工作提供信息和辅助决策。
【专利说明】
一种确定城市街道占道经营高发区域的方法及系统
技术领域
[0001] 本发明涉及空间数据挖掘技术领域,尤其涉及一种确定城市街道占道经营高发区 域的方法及系统。
【背景技术】
[0002] 随着经济社会的快速发展,各地城市违章占道经营现象屡禁不止,难以根治,这直 接影响着城市文明程度的提升,影响着周边群众的生活质量。在市容环境工作中,占道经营 已经成为城市市容环境卫生管理上的一大顽疾。各级政府和职能部门采取了各种手段进行 治理,但收效甚微。空间数据挖掘是指从空间数据库中提取事先未知、潜在有用、隐含其中、 最终可理解的空间或非空间的一般的知识规则的过程。伴随各地城市网格化管理系统的建 立和运行,势必会产生大量城市管理相关数据,利用空间数据挖掘算法可以对这些数据进 行有效分析,找出城市街道占道经营的高发区域。
[0003] DBSCAN算法是一种基于密度的空间数据聚类算法,由Ester Martin等人提出。其 基本思想是:对于空间数据库中的一个点,在给定半径的邻域内只要其包含的数据对象个 数大于某个给定值,就继续聚类。现有的通过DBSCAN算法确定城市街道占道经营高发区域 的方法时间复杂度高、效率低。

【发明内容】

[0004] 本发明所要解决的技术问题是:现有的确定城市街道占道经营高发区域的方法时 间复杂度高、效率低的问题。
[0005] 为解决上述技术问题,本发明一方面提出了一种确定城市街道占道经营高发区域 的方法,该方法包括:
[0006] 采用优化的DBSCAN算法对采集到的城市街道占道经营数据进行处理,对城市街道 占道经营区域进行分类;
[0007] 根据所述对城市街道占道经营区域的分类结果确定城市街道占道经营高发区域;
[0008] 其中,所述优化的DBSCAN算法选择当前数据对象预设阈值邻域半径外的点作为下 一个待处理数据对象。
[0009] 可选地,在所述采用优化的DBSCAN算法对采集到的城市街道占道经营数据进行处 理之前,还包括:
[0010] 采集城市街道占道经营数据,并将所述城市街道占道经营数据存储在数据集中。
[0011] 可选地,所述城市街道占道经营数据包括发生地点、发生时间和事件说明。
[0012] 可选地,在所述采用优化的DBSCAN算法对采集到的城市街道占道经营数据进行处 理之前,还包括:
[0013] 确定优化的DBSCAN算法的邻域半径EPS和密度阈值MinPts。
[0014] 可选地,所述采用优化的DBSCAN算法对采集到的城市街道占道经营数据进行处 理,对城市街道占道经营区域进行分类包括:
[0015] 将每个城市街道占道经营数据作为数据对象,若当前数据对象为核心对象,则将 当前数据对象的预设阈值邻域半径内的点归为一类,并将当前数据对象的预设阈值邻域半 径外的点存入搜索数据集合S中;
[0016] 遍历搜索数据集合S,对搜索数据集合S中的数据对象进行分类。
[0017] 可选地,所述预设阈值大于等于2/3小于等于3/4。
[0018] 本发明另一方面提出了一种确定城市街道占道经营高发区域的系统,该系统包 括:
[0019] 区域分类单元,用于采用优化的DBSCAN算法对采集到的城市街道占道经营数据进 行处理,对城市街道占道经营区域进行分类;
[0020] 高发区域确定单元,用于根据所述对城市街道占道经营区域的分类结果确定城市 街道占道经营高发区域;
[0021 ]其中,所述优化的DBSCAN算法选择当前数据对象预设阈值邻域半径外的点作为下 一个待处理数据对象。
[0022] 可选地,该系统还包括:
[0023]占道经营数据存储单元,用于采集城市街道占道经营数据,并将所述城市街道占 道经营数据存储在数据集中。
[0024] 可选地,所述城市街道占道经营数据包括发生地点、发生时间和事件说明。
[0025] 可选地,所述区域分类单元进一步用于:
[0026] 将每个城市街道占道经营数据作为数据对象,若当前数据对象为核心对象,则将 当前数据对象的预设阈值邻域半径内的点归为一类,并将当前数据对象的预设阈值邻域半 径外的点存入搜索数据集合S中;
[0027] 遍历搜索数据集合S,对搜索数据集合S中的数据对象进行分类。
[0028]本发明提供的确定城市街道占道经营高发区域的方法及系统,采用优化的DBSCAN 算法对采集到的城市街道占道经营数据进行处理,选择当前数据对象预设阈值邻域半径外 的点作为下一个待处理数据对象,避免公共邻域对象的重复查询,减少对核心对象邻域查 询的计算,降低了算法的复杂度,提高可确定街道占道经营的高发区域的效率,为城市管理 工作提供信息和辅助决策。
【附图说明】
[0029]通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理 解为对本发明进行任何限制,在附图中:
[0030] 图1示出了本发明一个实施例的确定城市街道占道经营高发区域的方法的流程示 意图;
[0031] 图2示出了本发明一个实施例的优化的DBSCAN算法的对公共数据对象的限定查询 的不意图;
[0032]图3示出了本发明一个实施例的优化的DBSCAN算法的流程图;
[0033]图4a示出一年内某地区街道占道经营事件的二维分布示意图;
[0034]图4b示出了根据本发明优化的DBSCAN算法找出的占道经营高发区域的结果示意 图;
[0035]图5示出了本发明一个实施例的确定城市街道占道经营高发区域的系统的结构示 意图。
【具体实施方式】
[0036]下面将结合附图对本发明的实施例进行详细描述。
[0037]图1示出了本发明一个实施例的确定城市街道占道经营高发区域的方法的流程示 意图。如图1所示,该实施例的确定城市街道占道经营高发区域的方法,包括:
[0038] S11:采用优化的DBSCAN算法对采集到的城市街道占道经营数据进行处理,对城市 街道占道经营区域进行分类;
[0039] S12:根据所述对城市街道占道经营区域的分类结果确定城市街道占道经营高发 区域;
[0040] 其中,所述优化的DBSCAN算法选择当前数据对象预设阈值邻域半径外的点作为下 一个待处理数据对象。
[0041] 本实施例的确定城市街道占道经营高发区域的方法,采用优化的DBSCAN算法对采 集到的城市街道占道经营数据进行处理,选择当前数据对象预设阈值邻域半径外的点作为 下一个待处理数据对象,避免公共邻域对象的重复查询,减少对核心对象邻域查询的计算, 降低了算法的复杂度,提高可确定街道占道经营的高发区域的效率,为城市管理工作提供 信息和辅助决策。
[0042]在一种可选的实施方式中,在所述采用优化的DBSCAN算法对采集到的城市街道占 道经营数据进行处理之前,还包括:
[0043] 采集城市街道占道经营数据,并将所述城市街道占道经营数据存储在数据集中。
[0044] 进一步地,所述城市街道占道经营数据包括发生地点、发生时间和事件说明。
[0045]在所述采用优化的DBSCAN算法对采集到的城市街道占道经营数据进行处理之前, 还包括:
[0046] 确定优化的DBSCAN算法的邻域半径EPS和密度阈值MinPts。
[0047]具体地,所述采用优化的DBSCAN算法对采集到的城市街道占道经营数据进行处 理,对城市街道占道经营区域进行分类包括:
[0048] 将每个城市街道占道经营数据作为数据对象,若当前数据对象为核心对象,则将 当前数据对象的预设阈值邻域半径内的点归为一类,并将当前数据对象的预设阈值邻域半 径外的点存入搜索数据集合S中;
[0049] 遍历搜索数据集合S,对搜索数据集合S中的数据对象进行分类。
[0050] 优选地,所述预设阈值大于等于2/3小于等于3/4。
[0051] 在实际应用中,完整的确定城市街道占道经营高发区域的方法可以包括以下步 骤:
[0052]步骤1:数据采集,城市网格区域管理员上报发现的日常占道经营事件,网格化管 理系统存储相关事件,事件属性包括事件类别,发生地点(二维坐标位置),发生时间,事件 详细说明等。将网格管理员在日常巡查中发现的占道经营事件及城管部门接到的占道经营 事件相关举报,提取事件类别、发生地点、发生时间、事件详细说明等信息,上传到网格化管 理系统。
[0053]对网格化管理系统中的业务数据进行筛选,针对其中的占道经营事件,根据事件 发生地点、发生时间,将相关属性存储到数据库中。为下一步数据挖掘操作做好准备。
[0054]步骤2:参数设置,根据城市道路及街区规模,设定DBSCAN算法的邻域半径EPS和密 度阈值MinPts。
[0055]算法邻域半径的设置一般要参照城市道路长短、人口密集程度、街区规模大小等 因素。密度阈值MinPts-般由相关部门统计占道经营事件的发生频度来设置。
[0056]步骤3:采用优化的DBSCAN算法对采集到的城市街道占道经营事务数据进行处理。 [0057] DBSCAN算法优化的基本思想是:在对数据集中的点进行邻域查询时不必对每个点 都进行查询操作。如图1所示,当前数据对象P操作完毕后,选择下一个待处理数据对象前先 排除当前数据对象预设阈值邻域半径内的点,选择邻域内其他区域的点,避免部分数据对 象的重复查询,从而减少查询时间。两个数据对象之间的距离采用欧几里得数学模型,如 下:
[0058] d(x,y)=Jl:|L1{xi.....於)2,其中d(x,y)满足以下三个条件:
[0059] d(x,y)多0,
[0060] 当 x = y 时,d(x,y)=0,
[0061] d(x,y)=d(y,x);
[0062]其中,x,y代表两个数据对象,可理解为两个点,当x = y时,即x和y表示同一个点 时,d(x,y) = 0,即x和y之间的距离为0。(1(1,7)=(1(7 4)表示(1(1,7)和(1(7 4)都代表1和7点 之间的距离。
[0063]步骤4:将聚类分析结果通过程序可视化直观的反映给管理者,方便管理者做出决 断。根据步骤1采集到的数据,提取占道经营事件的二维坐标属性,绘制出占道经营事件二 维分布图,如图4a所示。经由步骤3处理后的数据集,根据ID属性标记(各个数据对象的类 别),将得到聚类结果可视化的反馈给管理人员,如图4b示。
[0064] 图3示出了本发明一个实施例的优化的DBSCAN算法的流程图。如图3所示,本实施 例的优化的DBSCAN算法包括如下步骤:
[0065] ⑴原始数据集的初始化
[0066] ①在数据对象的数据结构定义中添加一个新的字段ID,表示聚类分类结果,初始 化为零。
[0067] ②定义一个临时搜索数据集合S,用于存储检索结果。
[0068] ③初始化密度阈值MinPts和邻域半径EPS。
[0069]⑵遍历原始数据集
[0070]①将数据集每一个点依次作为种子节点进行考察,令i = 1,j = 1,Cluster = 1。对 于当前对象(^,若W ? ID = 0,则搜索它的邻域,若邻域内包含点数大于密度阈值MinPts,说 明其为核心对象,把W及其邻域内所有对象的ID置为Cluster,并将w邻域内距离其2/3邻域 半径(本实施例的预设阈值为2/3,在实际应用中,预设阈值可以是大于等于2/3小于等于3/ 4的值)外的所有点存入S中。
[0071]②对S进行遍历,把S中每一个点作为种子点依次进行考察,对于点?1,若Pl当前不 属于任何类即Pi. ID = 0,搜索它的邻域。若pi是核心对象,说明它是qj的直接密度可达点,令 Pi. ID = Cluster,同时将其邻域内所有对象的ID置为Cluster,并将pi邻域内距离其2/3邻域 半径外的所有点存入S中。最后删除S中的Pl。
[0072]③令i = i+l,执行步骤②直到S为空。
[0073] ⑶令j = j+1,Cluster = Cluster+l,重复步骤⑵,直到对数据集中所有对象都进行 了遍历。
[0074] 优化的DBSCAN算法选择当前数据对象预设阈值邻域半径外的点作为下一个待处 理数据对象,避免公共邻域对象的重复查询,减少对核心对象邻域查询的计算,降低了算法 的复杂度,提高可确定街道占道经营的高发区域的效率,为城市管理工作提供信息和辅助 决策。
[0075] 图5示出了本发明一个实施例的确定城市街道占道经营高发区域的系统的结构示 意图。如图5所示,该实施例的确定城市街道占道经营高发区域的系统包括区域分类单元51 和高发区域确定单元52,具体地,
[0076]区域分类单元51,用于采用优化的DBSCAN算法对采集到的城市街道占道经营数据 进行处理,对城市街道占道经营区域进行分类;
[0077]高发区域确定单元52,用于根据所述对城市街道占道经营区域的分类结果确定城 市街道占道经营高发区域;
[0078]其中,所述优化的DBSCAN算法选择当前数据对象预设阈值邻域半径外的点作为下 一个待处理数据对象。
[0079] 在一种可选的实施方式中,该系统还包括:
[0080] 占道经营数据存储单元,用于采集城市街道占道经营数据,并将所述城市街道占 道经营数据存储在数据集中。
[0081] 进一步地,所述城市街道占道经营数据包括发生地点、发生时间和事件说明。
[0082]具体地,区域分类单元51进一步用于:
[0083] 将每个城市街道占道经营数据作为数据对象,若当前数据对象为核心对象,则将 当前数据对象的预设阈值邻域半径内的点归为一类,并将当前数据对象的预设阈值邻域半 径外的点存入搜索数据集合S中;
[0084] 遍历搜索数据集合S,对搜索数据集合S中的数据对象进行分类。
[0085] 本实施例所述的确定城市街道占道经营高发区域的系统可以用于执行上述方法 实施例,其原理和技术效果类似,此处不再赘述。
[0086]本发明提供的确定城市街道占道经营高发区域的方法及系统,采用优化的DBSCAN 算法对采集到的城市街道占道经营数据进行处理,选择当前数据对象预设阈值邻域半径外 的点作为下一个待处理数据对象,避免公共邻域对象的重复查询,减少对核心对象邻域查 询的计算,降低了算法的复杂度,提高可确定街道占道经营的高发区域的效率,为城市管理 工作提供信息和辅助决策。
[0087]虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发 明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求 所限定的范围之内。
【主权项】
1. 一种确定城市街道占道经营高发区域的方法,其特征在于,包括: 采用优化的DBSCAN算法对采集到的城市街道占道经营数据进行处理,对城市街道占道 经营区域进行分类; 根据所述对城市街道占道经营区域的分类结果确定城市街道占道经营高发区域; 其中,所述优化的DBSCAN算法选择当前数据对象预设阈值邻域半径外的点作为下一个 待处理数据对象。2. 根据权利要求1所述的确定城市街道占道经营高发区域的方法,其特征在于,在所述 采用优化的DBSCAN算法对采集到的城市街道占道经营数据进行处理之前,还包括: 采集城市街道占道经营数据,并将所述城市街道占道经营数据存储在数据集中。3. 根据权利要求1所述的确定城市街道占道经营高发区域的方法,其特征在于,所述城 市街道占道经营数据包括发生地点、发生时间和事件说明。4. 根据权利要求1所述的确定城市街道占道经营高发区域的方法,其特征在于,在所述 采用优化的DBSCAN算法对采集到的城市街道占道经营数据进行处理之前,还包括: 确定优化的DBSCAN算法的邻域半径EPS和密度阈值MinPts。5. 根据权利要求1所述的确定城市街道占道经营高发区域的方法,其特征在于,所述采 用优化的DBSCAN算法对采集到的城市街道占道经营数据进行处理,对城市街道占道经营区 域进行分类包括: 将每个城市街道占道经营数据作为数据对象,若当前数据对象为核心对象,则将当前 数据对象的预设阈值邻域半径内的点归为一类,并将当前数据对象的预设阈值邻域半径外 的点存入搜索数据集合S中; 遍历搜索数据集合S,对搜索数据集合S中的数据对象进行分类。6. 根据权利要求5所述的确定城市街道占道经营高发区域的方法,其特征在于,所述预 设阈值大于等于2/3小于等于3/4。7. -种确定城市街道占道经营高发区域的系统,其特征在于,包括: 区域分类单元,用于采用优化的DBSCAN算法对采集到的城市街道占道经营数据进行处 理,对城市街道占道经营区域进行分类; 高发区域确定单元,用于根据所述对城市街道占道经营区域的分类结果确定城市街道 占道经营高发区域; 其中,所述优化的DBSCAN算法选择当前数据对象预设阈值邻域半径外的点作为下一个 待处理数据对象。8. 根据权利要求7所述的确定城市街道占道经营高发区域的系统,其特征在于,还包 括: 占道经营数据存储单元,用于采集城市街道占道经营数据,并将所述城市街道占道经 营数据存储在数据集中。9. 根据权利要求7所述的确定城市街道占道经营高发区域的系统,其特征在于,所述城 市街道占道经营数据包括发生地点、发生时间和事件说明。10. 根据权利要求7所述的确定城市街道占道经营高发区域的系统,其特征在于,所述 区域分类单元进一步用于: 将每个城市街道占道经营数据作为数据对象,若当前数据对象为核心对象,则将当前 数据对象的预设阈值邻域半径内的点归为一类,并将当前数据对象的预设阈值邻域半径外 的点存入搜索数据集合S中; 遍历搜索数据集合S,对搜索数据集合S中的数据对象进行分类。
【文档编号】G06F17/30GK105912598SQ201610206554
【公开日】2016年8月31日
【申请日】2016年4月5日
【发明人】彭波, 史春雷, 张磊
【申请人】中国农业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1