本发明涉及以公共交通为导向型(TOD)城市发展模式领域,尤其涉及一种基于城市数据的TOD城市区域划分与挖掘方法。
背景技术:
TOD城市发展模式已经成为解决城市可持续发展的一种可能方案,该种发展模式可重塑城市发展的形态,提升其品质,缓解城市面临的诸多问题。要想进行TOD型城市的建设,首要的问题便是合理划分区域,接着便是要选择最有价值的区域作为TOD区域进行相应的开发。本发明将利用公共交通站点数据来确定区域中心和边界方法,之后利用公共交通路线来挖掘TOD区域。但现有的技术中,往往是根据经纬度直接将区域进行划分,或者根据路网数据来进行区域划分,而这些并不能很好的体现公共交通中心,不利于城市围绕公共交通进行发展。
技术实现要素:
本发明的目的主要针对上述现有研究的一些不足之处,提出一种数据驱动的公共交通导向型城市区域划分与挖掘方法,通过对公共交通站点数据处理,来确定区域中心和区域边界,利用公共交通路线数据,来挖掘出TOD区域,为城市发展规划提供有效信息。
本发明是通过以下技术方案达到上述目的,一种数据驱动的公共交通导向型城市区域划分与挖掘方法,其包括如下步骤:
1)对于距离小于d的公共交通站点,建立一条边,得到公共交通网络,d为预先设置的阈值。
2)根据1)中的公共交通网络,提取出各个连通分量中的点集S,加入到点集S的集合T中。
3)对于每个点集检查是否符合期望。不符合做调整。
4)计算每个点集中的中心,得到区域中心。
5)根据4)中的区域中心,区域中的的点属于距离最近的区域中心,得到区域边界。
6)利用公共交通路线数据在区域之间建边,得到区域网络。
7)根据6)中的区域网络,来计算区域排名。
8)输出前N个区域作为TOD区域。
步骤1)具体步骤:
将每一个站点作为一个节点,对于任意两个距离小于d的站点建立一条边,则整个公共交通网络中会形成多个连通分量。
步骤2)具体步骤:
遍历图中的每一个连通分量,每次遍历新的连通分量的时候,生成空集合S,将遍历的节点加入到集合S,该连通分量遍历结束的时候,将集合S加入集合的集合T中。
步骤3)对于每个点集检查是否符合期望。不符合做调整。包括以下步骤:
3.1)针对每个集合中的节点,如果存在两个节点之间的距离大于2d,则可认为该集合中的节点,至少能分成两个集合,则执行3.2);如果均不存在,则可认为每个集合中的所有节点离其中心位置都不超过d,则点集符合期望,执行步骤4)
3.2)将该集合中距离最远的两个节点作为k-means算法中初始化的质心,然后在该集合中执行k-means算法,形成两个簇。
3.3)删除原先的点集合,将两个簇当成新生成的点集加入T中,继续检查新的集合。
步骤4)计算每个点集中中心的公式:
其中n为区域中的节点数量,lat(i)为第i个节点的纬度,lng(i)为第i个节点的经度。lng(center)和lat(center)即为得到的中心的位置。
步骤5)得到区域边界的公式:
我们将从基于连通分量的聚类算法中获得的R个聚合站点(即候选中心)P={p1,p2,...,pR}作为种子,将整个研究区域X进行Voronoi划分,从而形成R个不相交的Voronoi多边形,一个多边形就是一个以聚合站点pi为中心的TOD候选发展区域ri,正式定义如公式所下。
ri={x∈X|D(x,pi)≤D(x,pj),i,j={1,2,...,R},i≠j}
在上式公式中,我们使用欧几里得度量作为其中的距离函数D。
步骤6)利用公共交通路线数据在区域之间建边,得到区域网络具体步骤:
我们赋予每条地铁线的质量为wk,快速公交线的质量为wn,普通公交线的质量为wm,并且数值依次降低,然后将所有路线的连续两站的区域,作为两个节点,建立一条相应权值的边,若路线的连续两站在同一区域,则忽略。
步骤7)计算区域排名具体步骤:
我们将基于随机游走模型的PageRank算法应用在区域关系网络中,作为计算区域重要性的基础。
7.1)给定所有R个区域(即节点)的RandomWalk值(简称RW值)RWi(0),并且满足
7.2)迭代进行计算,计算第k步的公式如下:
其中,d为阻尼系数,一般取0.85。由si,j所组成的R行R列的矩阵S一般称为转移矩阵。
7.3)当RW(k)–RW(k-1)的绝对值的和不超过阈值W的,停止迭代计算。
7.2)中转移矩阵的具体定义:
7.2.1)连接重要性:
我们赋予每条地铁线的质量为wk,快速公交线的质量为wn,普通公交线的质量为wm,并且数值依次降低。那么,在区域连接网络中,节点vi和节点vj的连接重要性w(vi,vj)可由如下公式计算得出。
w(vi,vj)=mi,jwm+ni,jwn+ki,jwk
7.2.2)转移矩阵:
在确定连接重要性之后,根据各边重要性占目标节点出边总重要性的比例进行概率转移,即改进后转移矩阵S中的元素si,j根据如下公式计算,
其中,w(vi,vj)代表节点vi和节点vj之间的连接重要性,可由7.2.1)中公式计算得出,集合N(vj)是节点vj邻居节点的集合,即与节点vj相连的节点。
附图说明
图1为本发明实施案例提供的一种数据驱动的公共交通导向型城市区域划分与挖掘方法的流程图;
图2为本发明实施案例提取出区域中心的流程图;
图3为一种数据驱动的公共交通导向型城市区域划分与挖掘方法实施案例利用杭州市公共交通站点数据得到的区域划分结果图;
图4为一种数据驱动的公共交通导向型城市区域划分与挖掘方法实施案例利用杭州市公共交通路线数据得到的区域挖掘结果图;
具体实施方式
本发明实施例提供了一种数据驱动的公共交通导向型城市区域划分与挖掘方法,如图1所示,该方法包括:
步骤1:利用杭州市公共交通站点数据建立公共交通网络,d值这里取800,对于每一个点对(u,v),若距离distance(u,v)小于d,则添加边edge(u,v),最终形成公共交通网络。
公共交通线路及站点数据如下所示。
本文研究了三种类型的公共交通站点及路线:普通公交、快速公交和地铁。在我们所获得的数据集中,直接包含了2015年2月杭州市641条普通公交线路的8255个站点,以及14条快速公交线路的446个站点信息,其格式如表1所示。
表1 公交线路及站点数据格式
Tab.1Format of bus dataset
由于该数据集中缺少地铁的相关信息,而地铁在TOD发展中扮演者不可或缺的作用,所以我们手动加入杭州1、2、4、5和6号地铁线共127个地铁站点,及其相关的重要信息,例如,经度和纬度。
步骤2:根据杭州市公共交通网络,形成点集的集合T。
遍历图中的每一个连通分量,每次遍历新的连通分量的时候,生成空集合S,将遍历的节点加入到集合S,该连通分量遍历结束的时候,将集合S加入集合的集合T中。
步骤3:对于每个点集检查是否符合期望。不符合做调整。包括以下步骤:
3.1)针对每个集合中的节点,如果存在两个节点之间的距离大于2d,则可认为该集合中的节点,至少能分成两个集合,则执行3.2);如果均不存在,则可认为每个集合中的所有节点离其中心位置都不超过d,则点集符合期望,执行步骤4)
3.2)将该集合中距离最远的两个节点作为k-means算法中初始化的质心,然后在该集合中执行k-means算法,形成两个簇。
3.3)删除原先的点集合,将两个簇当成新生成的点集加入T中,继续检查新的集合。
步骤4:根据每个点集中中心的公式:
提取出每个点集的中心。
步骤5:根据公式ri={x∈X|D(x,pi)≤D(x,pj),i,j={1,2,...,R},i≠j},划分区域边界。
步骤6:利用公共交通路线数据在区域之间建边,得到区域网络具体步骤:
我们赋予每条地铁线的质量为wk,快速公交线的质量为wn,普通公交线的质量为wm,并且数值依次降低,然后将所有路线的连续两站的区域,作为两个节点,建立一条相应权值的边,若路线的连续两站在同一区域,则忽略。这里取wk=1,wn=2,wm=3。
步骤7:计算区域排名具体步骤:
我们将基于随机游走模型的PageRank算法应用在区域关系网络中,作为计算区域重要性的基础。
7.1)给定所有R个区域(即节点)的RandomWalk值(简称RW值)RWi(0),并且满足
7.2)迭代进行计算,计算第k步的公式如下:
其中,d为阻尼系数,一般取0.85。由si,j所组成的R行R列的矩阵S一般称为转移矩阵。
7.3)当RW(k)–RW(k-1)的绝对值的和不超过阈值W的,停止迭代计算,这里W取的是所有和不超过10-16。
7.2)中转移矩阵的具体定义:
7.2.1)连接重要性:
我们赋予每条地铁线的质量为wk,快速公交线的质量为wn,普通公交线的质量为wm,并且数值依次降低。那么,在区域连接网络中,节点vi和节点vj的连接重要性w(vi,vj)可由如下公式计算得出。
w(vi,vj)=mi,jwm+ni,jwn+ki,jwk
7.2.2)转移矩阵:
在确定连接重要性之后,根据各边重要性占目标节点出边总重要性的比例进行概率转移,即改进后转移矩阵S中的元素si,j根据如下公式计算,
其中,w(vi,vj)代表节点vi和节点vj之间的连接重要性,可由7.2.1)中公式计算得出,集合N(vj)是节点vj邻居节点的集合,即与节点vj相连的节点。
步骤8:输出排名前N个区域作为TOD区域,这里N取50。
图3是根据杭州市公共交通站点数据得到的区域划分结果。图3中划分出的645个区域大小适中,位于繁华和偏僻地段的区域面积相差不大,并且从多边形的中心和边界来看,也符合实际地理状况,例如图中的区域边界符合钱塘江的走向。从所得实验结果可知,我们提出的基于连通分量聚类的区域划分方法可以有效解决冗余车站的问题,能够划分出合理的区域,并且也避免了原始聚类算法中K值的确定以及结果不稳定等问题。
图4是根据杭州市公共交通路线数据得到的区域挖掘结果。从图4中可以看出,基于连接重要性导向的随机游走算法可以识别出城市规划中的绝大部分的各级新城,在整体分散的同时达到了局部聚集的效果,与实际更相符。