一种基于地铁数据进行站点聚类的可视化方法与流程

文档序号：12364254阅读：来源：国知局

技术特征：

1.一种基于地铁数据进行站点聚类的可视化方法，其特征在于，包括以下步骤：

S1：对地铁数据进行预处理，包括地铁刷卡数据的清洗以及地铁基础数据的规范化处理；

S2：对S1所述地铁数据进行时空探索；包含以下步骤：

S2.1：将地铁线路站点信息映射到OpenStreetMap地图上；

S2.2：用户交互的进行时间和空间上的过滤；

S2.3：对S2.2所述过滤结果进行可视化展示，包括显示进出站客流量变化情况的环形图和折线图；

S3：通过聚类算法对地铁站点进行聚类；包含以下步骤：

S3.1：时间划分：根据地铁站客流特征，将一天划分成m个时间段；

S3.2：空间划分：根据所述地铁基础数据，将每个地铁站点作为一个空间单元，划分成n个空间单元；

S3.3：对于S3.2所述的每个空间单元，分别统计其在S3.1所述的m个时间段内的进站人数和出站人数，形成n*2m的地铁站点客流特征矩阵；将此矩阵记为D，它是一个包含n个对象的数据集；

S3.4：接收用户动态输入的参数k(k≤n)，并作为站点聚类算法的簇数；

S3.5：从D中随机选取k个对象，作为k个簇各自的中心，初始化后的k个簇的中心分别记为：

S3.6：分别计算D中各个对象j∈{1，...，n}到k个簇中心的相似度，将这些对象分别划分到最接近的中心点所在的簇，公式如下：Cluster^(t)(j)←arg min_i||μ_i-x_j||²

S3.7：根据S3.6聚类结果，重新计算k个簇各自的中心，计算公式如下：

$<mrow> <msup> <msub> <mi>μ</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mrow> <mi>t</mi> <mo>+</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> </msup> <mo>&LeftArrow;</mo> <mi>arg</mi> <mi> </mi> <msub> <mi>min</mi> <mi>μ</mi> </msub> <munder> <mo>Σ</mo> <mrow> <mi>j</mi> <mo>:</mo> <mi>C</mi> <mi>l</mi> <mi>u</mi> <mi>s</mi> <mi>t</mi> <mi>e</mi> <mi>r</mi> <mrow> <mo>(</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>i</mi> </mrow> </munder> <mo>|</mo> <mo>|</mo> <mi>μ</mi> <mo>-</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> </mrow>$

S3.8：重复步骤S3.6–S3.7，直到每个簇的中心点μ_i不再发生变化；

S4：可视化展示聚类结果，包含如下步骤：

S4.1：在地铁基础数据集上，标记每个站点所属的簇Cluster_i(0≤i＜k)；

S4.2：通过地铁乘客刷卡数据，得到每次旅程的起始站点所属的簇、目的站点所属的簇和出行所属时间段；

S4.3：根据所述S4.2中的数据，计算不同时间段，不同簇之间乘客的流动模式；

S4.4：绘制弦图，用户选择时间段，通过弦图对比不同簇之间的客流模式，分析人类移动规律。

完整全部详细技术资料下载

当前第2页1 2 3