一种基于K-means聚类的道路交通畅通度判断方法

文档序号:10513278阅读:1498来源:国知局
一种基于K-means聚类的道路交通畅通度判断方法
【专利摘要】一种基于K?means聚类的道路交通畅通度判断方法,首先通过基本的数据阀值清除掉无效的数据,使得进行数据初步清洗后数据的分布更加的集中,利于数据的进一步处理,提高数据分析的效率以及增强结果精度;然后根据道路的最高限速得到初始的K值,分别对应不同的交通状态;最后通过K?means聚类将不同的车载GPS数据聚类到不同的K值点上,最后通过分析每个K值点所包含的数据的数量,将数量最多的作为当前道路交通通行状态的指标。本发明通过对车载GPS速度数据进行聚类分析,实现路网交通通行状态信息的采集,实施成本较低且技术难度较小。
【专利说明】
_种基于K-means聚类的道路交通畅通度判断方法
技术领域
[0001] 本发明涉及一种道路畅通度判断,计算机应用领域,尤其涉及的是,一种基于κ-means聚类的道路交通畅通度判断方法。
【背景技术】
[0002] 近年来随着我国城市化进程的加快,城市内机动车数量的激增,城市环境状况日 趋严峻,单纯通过城市道路基础设施建设无法缓解当前的交通压力。智能交通有助于保障 交叉路口的畅通,达到缓解交通拥堵的目的,进而在一定程度上解决城市交通事故、交通堵 塞、环境污染和能源消耗等社会问题,其中道路交通状态信息的采集是实现智能交通的基 础。
[0003] 城市真实车辆行车路况复杂,车辆行驶过程中会包含加速、减速、匀速、静止四种 状态,而采集的数据则是这三种数据的集合,在某些特殊情况下的数据并不能作为判断路 况的依据,比如采集设备的故障引起的数据异常、人员下车时的车辆静止数据(速度为零)、 车辆违章超速行驶(车速远大于限速)、车辆紧急制动过程中的速度数据(比如遇到行人急 刹车),因为这些特殊情况下车辆速度的变化并不是交通路况的客观原因引起的,所以有必 要将一些显然无效的数据剔除。
[0004] 同一道路上的车辆数量较多,而采集的速度信息快慢不一,并不能直接反应出道 路的通行状况,通过K-means聚类算法可以将同一道路的车辆速度信息进行归类,从而判断 出该道路在某时间段的通行状态。表示交通状态的描述通常包括交通密度、通行速度、占有 率等,虽然这些因素都可以反应出一条道路的通行状态,但交通密度和占有率等难以测量。

【发明内容】

[0005] 为了克服通过传统的视频监控等方法获取道路交通状态信息实施成本较高且技 术难度较大的不足,本文发明提供一种基于K-means聚类的道路交通通畅度判断方法,通过 对车载GPS速度数据进行聚类分析,实现路网交通通行状态信息的采集,实施成本较低且技 术难度较小。
[0006] 本发明解决其技术问题所采用的技术方案是:
[0007] -种基于K-means聚类的道路交通畅通度判断方法,其特征在于:所述检测方法包 括以下步骤::
[0008] 1)清理无效数据:
[0009] 1.1)如果某时刻某道路上车辆速度为零的数据少于总数据的10%,则认为车辆停 止并不是交通拥堵引起的,判断该数据无效;
[001 0] 1.2)如果车辆速度远大于道路限速,则认为该车辆违规驾驶,或者是采集设备发 生故障导致采集数据异常,此类数据判定为无效;
[0011] 2)选择K 值:
[0012] 假设道路存在N种状态,其中每种状态的代表速度为Vn,将这N种状态的代表速度 插入到原始数据集中作为初始K值点进行K-means聚类计算快速的将数据集聚集到N个类 中,那么第η个灯直!^的选取如下;
[0013] Kn=Vn,n= 1,2,3 · · · Ν (1)
[0014] 其中Kn的取值随着道路的不同可能会有所不同,以道路的最高限速Vmax为上限,将 限速进行等分计算,并取对应位置的速度¥"作为K n的值,速度Vn根据如下公式得到:
[0016] 3)聚类计算:
[0017] 3.1)首先选择~个中心点1(1,1(2,1(3...1^,其中每个1(值得取值计算如公式(1)所 示,它们分别代表道路的对应的通行状态,设置迭代次数为g;
[0018] 3.2)依次遍历速度信息,并对比速度和中心点的差值大小,将其归为差值最小的 类中,判断公式如下所示:
[0019] Si-Kn=min{ ISi-Kil,|Si-K2|,|Si-K3卜· · |Si-KN| },η=1,2,3 · · · N (3)
[0020] 其中Si代表第i个速度数据,Kn表第n个K值,如果满足上述条件,则说明Si属于第n 类;
[0021] 3.3)迭代计算g次后,依次统计每个类中包含的样本数量,数量最大的类所包
[0022]含的K值点代表了道路的通行状态。
[0023] 本发明的构思思路为:同一道路上的车辆数量较多,而采集的速度信息快慢不一, 并不能直接反应出道路的通行状况,通过K-means聚类算法可以将同一道路的车辆速度信 息进行归类,从而判断出该道路在某时间段的交通通行状态。
[0024] 本发明的有益效果主要表现在:通过对道路车载GPS数据进行K-means聚类分析, 将车辆速度信息转化为更加直观地道路路况信息,解决了道路车载GPS数据状态分散而不 能直接反应道路路况的问题,同时简单的K值选择具有较高的计算效率,可以满足实际应用 中对实时性的要求。
【附图说明】
[0025]图1是全部速度散点图。
[0026]图2是数据清理后的散点图。
[0027]图3是速度聚类的流程图。
[0028]图4是聚类结果示意图。
[0029] 图5是一种基于K-means聚类的道路交通畅通度判断方法的流程图。
【具体实施方式】
[0030] 下面结合附图对本发明做进一步的描述。
[0031] 参照图1~图5,一种基于K-means聚类的道路交通畅通度判断方法,包括以下步 骤:
[0032] 1)清理无效数据:
[0033]某道路15分钟内车辆速度信息数据为例,速度散点分布信息如图1所示,将某时刻 某道路上车辆速度为零的数据少于总数据的10 %的数据剔除,将车辆速度大于道路限速的 数据剔除;
[0034]清理后的结果如图2所示,其中图中圆点为无效数据,置于图形左下角的因为速度 为零且速度为零的数据少于总数据的10%而被判定为无效数据,而置于图形右上角的速度 因为大于普通公路的限速而被认为是超速或者设备故障引起的无效数据,数据初步清洗后 数据的分布更加的集中,利于数据的进一步处理,提高数据分析的效率以及增强结果精度; [0035] 2)选择K 值:
[0036] 假设道路存在N种状态,其中每种状态的代表速度*Vn,第η个K值的选取如下:
[0037] Kn=Vn,n= 1,2,3 · · · Ν (1)
[0038] 以道路的最高限速Vmax为上限,将限速进行等分计算,并取对应位置的速度¥"作为 Kn的值,速度Vn^以根据如下公式得到:
[0040] 3)聚类计算:
[0041 ]聚类计算过程如图3所示;
[0042] 3.1)首先选择N个中心点· · · Kn,其中每个K值得取值计算如公式⑴所 示,它们分别代表道路的对应的通行状态,设置迭代次数为g;
[0043] 3.2)依次遍历速度信息,并对比速度和中心点的差值大小,将其归为差值最小的 类中,判断公式如下所示:
[0044] Si-Kn=min{ ISi-Kil,|Si-K2|,|Si-K3卜· · |Si-KN| },η=1,2,3 · · · N (3)
[0045] 其中Si代表第i个速度数据,Kn表第n个K值,如果满足上述条件,则说明Si属于第n 类;
[0046] 3.4)迭代计算g次后,依次统计每个类中包含的样本数量,数量最大的类所包含的 K值点代表了道路的通行状态;
[0047]聚类结果如图4所示;
[0048] 本实例,对某道路15min内56条车载GPS信息进行聚类分析,一种基于K-means聚类 的道路交通畅通度判断方法,包括以下步骤:
[0049] 1)清理无效数据:
[0050]某道路限速50km/h,将该道路上车辆速度为零的数据少于总数据的10 %的数据剔 除,将车辆速度大于道路限速的数据剔除,清理后有效数据为44条。2)选择K值:
[0051]某道路限速为50km/h,选择心,1(2,1(3,1(4四个值作为中心点进行聚类运算,分别代 表实际交通路况为无法通行、拥堵、正常、通畅的四种情况,通过判断四种聚类的大小来判 定道路的通行状态,四个K值分别如下所示:
[0053] 3)聚类计算:
[0054] 3.1)首先选择4个中心点L,K2,K3,K4,其中每个K值得取值计算如公式(1)所示,它 们分别代表道路的对应的通行状态,取迭代次数g为1〇〇;
[0055] 3.2)依次遍历速度信息,并对比速度和中心点的差值大小,将其归为差值最小的 类中,判断公式如下所示:
[0056] Si-Kn=min{ |Si-Ki| , |Si-K2| , |Si-K3| · · · | Si-KN| } ,n=l ,2,3 · · ·Ν (2)
[0057] 其中Si代表第i个速度数据,Kn表第n个K值,如果满足上诉条件,则说明Si属于第η 类;
[0058] 3.3)重复迭代100次,完成聚类计算;
[0059]聚类结果数据如下表1所示,其中总共包含车辆速度信息44条,其中聚类到对应Κ 值点的数量分别为1条、2条、38条和3条,因此可以得出该道路在该15分钟的时间段内大多 数车辆的速度都在正常范围内,因此该道路的路况正常。
[0061] 表 1
[0062] 以上阐述的是本发明给出的一个实施例表现出来的优良优化效果,显然本发明不 仅适合上述实施例,在不偏离本发明基本精神及不超出本发明实质内容所涉及内容的前提 下可对其做种种变化加以实施。
【主权项】
1. 一种基于κ-means聚类的道路交通畅通度判断方法,其特征在于:所述检测方法包括 以下步骤:: 1) 清理无效数据: 1.1如果某时刻某道路上车辆速度为零的数据少于总数据的10%,则认为车辆停止并 不是交通拥堵引起的,判断该数据无效; 1.2如果车辆速度远大于道路限速,则认为该车辆违规驾驶,或者是采集设备发生故障 导致采集数据异常,此类数据判定为无效; 2) 选择K值: 假设道路存在N种状态,其中每种状态的代表速度SVn,将这N种状态的代表速度插入到 原始数据集中作为初始K值点进行K-means聚类计算快速的将数据集聚集到N个类中,那么 第η个Ι^Κη的选取如下; Kn = Vn,n=l ,2,3 · · · N (1) 其中Kn的取值随着道路的不同可能会有所不同,以道路的最高限速Vmax为上限,将限速 进行等分计算,并取对应位置的速度¥"作为Kn的值,速度Vn根据如下公式得到:(2) 3) 聚类计算: 3.1) 首先选择~个中心点1(1,1(2,1(3***&,其中每个1(值得取值计算如公式(1)所示,它 们分别代表道路的对应的通行状态,设置迭代次数为g; 3.2) 依次遍历速度信息,并对比速度和中心点的差值大小,将其归为差值最小的类中, 判断公式如下所示; Si-Kn=min{ |Si-Ki| , |Si-K2| , |Si-K3| · · · | Si-Kn |} ,n= 1,2,3 · · ·Ν (3) 其中Si代表第i个速度数据,Kn表第n个K值,如果满足上述条件,则说明Si属于第n类; 3.3) 迭代计算g次后,依次统计每个类中包含的样本数量,数量最大的类所包含的Κ值 点代表了道路的通行状态。
【文档编号】G08G1/01GK105869398SQ201610304571
【公开日】2016年8月17日
【申请日】2016年5月10日
【发明人】张贵军, 李栋炜, 周晓根, 姚俊, 陈凯, 丁情, 徐东伟, 李章维
【申请人】浙江工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1