1.一种基于地铁数据进行站点聚类的可视化方法,其特征在于,包括以下步骤:
S1:对地铁数据进行预处理,包括地铁刷卡数据的清洗以及地铁基础数据的规范化处理;
S2:对S1所述地铁数据进行时空探索;包含以下步骤:
S2.1:将地铁线路站点信息映射到OpenStreetMap地图上;
S2.2:用户交互的进行时间和空间上的过滤;
S2.3:对S2.2所述过滤结果进行可视化展示,包括显示进出站客流量变化情况的环形图和折线图;
S3:通过聚类算法对地铁站点进行聚类;包含以下步骤:
S3.1:时间划分:根据地铁站客流特征,将一天划分成m个时间段;
S3.2:空间划分:根据所述地铁基础数据,将每个地铁站点作为一个空间单元,划分成n个空间单元;
S3.3:对于S3.2所述的每个空间单元,分别统计其在S3.1所述的m个时间段内的进站人数和出站人数,形成n*2m的地铁站点客流特征矩阵;将此矩阵记为D,它是一个包含n个对象的数据集;
S3.4:接收用户动态输入的参数k(k≤n),并作为站点聚类算法的簇数;
S3.5:从D中随机选取k个对象,作为k个簇各自的中心,初始化后的k个簇的中心分别记为:
S3.6:分别计算D中各个对象j∈{1,...,n}到k个簇中心的相似度,将这些对象分别划分到最接近的中心点所在的簇,公式如下:Cluster(t)(j)←arg mini||μi-xj||2
S3.7:根据S3.6聚类结果,重新计算k个簇各自的中心,计算公式如下:
S3.8:重复步骤S3.6–S3.7,直到每个簇的中心点μi不再发生变化;
S4:可视化展示聚类结果,包含如下步骤:
S4.1:在地铁基础数据集上,标记每个站点所属的簇Clusteri(0≤i<k);
S4.2:通过地铁乘客刷卡数据,得到每次旅程的起始站点所属的簇、目的站点所属的簇和出行所属时间段;
S4.3:根据所述S4.2中的数据,计算不同时间段,不同簇之间乘客的流动模式;
S4.4:绘制弦图,用户选择时间段,通过弦图对比不同簇之间的客流模式,分析人类移动规律。