一种评估城市各功能区之间联系需求紧密度的方法和装置与流程

文档序号:18823428发布日期:2019-10-09 01:09阅读:472来源:国知局
一种评估城市各功能区之间联系需求紧密度的方法和装置与流程

本发明涉及城市规划领域,特别是一种评估城市各功能区之间联系需求紧密度的方法和装置。



背景技术:

城市区域划分是城市规划中的最要环节,合理的区域划分对城市发展至关重要。toolejl等人利用由手机产生的新的动态数据,测量人口的时空变化,利用了机器学习算法识别具有相同功能的区域,测量土地使用的不均匀性[1]。taop等人从移动电话数据中还原出用户的活动,挖掘社会功能特征,结合城市土地本身的物理特征,利用了模糊聚类的方法得到了城市土地的功能类型[2]。wangm等人建立了一个线性回归模型来预测北京市的交通流量,探讨区域功能与人类活动性之间的关系[3]。zhongg等人利用手机数据对交通枢纽的客流进行了表征,研究了不同时间间隔下城市旅客的出行特征,提出了基于时空聚类的旅客活跃区识别方法[4]。xuhuim等人提出了一种基于路网可达性的分区方法,建立可达性矩阵分析网络可达性,选择最优可达性节点作为核心节点,核心节点的节点簇作为子区域结果[5]。这些研究方法将城市区域的功能进行了度量,将城市区域进行了划分,但是没有将区域划分后的面积控制在合理范围内,有可能出现面积过大或过小的区域。

随着经济一体化进程加快,城市区域间的联系与分工也更为明确。dongl等人借助旅游经济学模型,探讨了旅游区域相互关系的强度和区域间旅游经济的隶属度,通过对区域间联系强度和方向的计算,研究分析了旅游经济的内部联系[6]。trasartir等人针对巴黎地区和整个法国这两个不同空间尺度的真实场景,提出了一种提取时间和空间约束的序列模式,该模式能够根据估计的显著共同变化捕获地理区域之间的相关性[7]。xuejund等人根据南京的地理特征和旅游景点系统,运用相关性维度法,对南京市旅游景区系统的空间结构进行了研究,并测定了南京旅游区域之间的分维值[8]。timberlakem以城市的功能区为研究单位,加强了对城镇密集区域的研究,探求了区域之间的契合关系[9]。zhanj等人认为区域基础设施建设是区域城市化的先决条件,通过研究公共基础设施的完备情况,探究了城乡之间相互依存、相互作用的关系[10]。pingdez等人运用计量经济学软件eviews,研究了物流业、城市与区域经济增长之间的定量关系,对相关区域进行了经济协调关系的度量[11]。这些研究都是从单一方面入手,对区域联系的影响因素考虑不够全面,并且所用数据是传统的静态数据,对区域间联系的描述具有片面性。



技术实现要素:

本发明实施例提供一种评估城市各功能区之间联系需求紧密度的方法和装置,通过对用户上网流量日志进行处理,产生基站流量时间序列,再从统计学、时域、频域三个方面对基站流量时间序列进行特征提取,运用聚类算法得到基站的功能特征,再将基站的经纬度坐标转换成墨卡托坐标,作为基站的地理位置特征,然后将基站的功能特征和地理位置特征作为输入,运用聚类算法得到城市区域划分的结果,最后计算区域的人口迁入量、迁出量和区域间的距离,运用提出的基于人口活动的牛顿引力模型,得到区域间的联系紧密度,对了解区域间联系、提升居民生活水平、发展城市经济具有重要意义。

本发明实施例公开了一种评估城市各功能区之间联系需求紧密度的方法,包括:确定城市区域划分的数据集;根据基站流量时间序列的特征,通过聚类算法确定基站处于的功能区;通过基站处于的功能区数据集和基站的地理位置数据集,对基站进行聚类,得到城市各功能区划分结果;针对已经划分好的各个功能区域的人口迁入量、迁出量,和区域之间的距离,基于人口活动的牛顿引力模型,评估各功能区之间的联系需求紧密度指标。

本发明实施例还公开了一种评估城市各功能区之间联系需求紧密度的装置,包括:参数集设定模块,用于设定聚类算法相应的参数集;数据集获取及预处理模块,用于获取基站流量时间序列以及将其预处理成基站特征数据集;划分模型模块,用于将处理好的特征数据集作为输入,运用聚类算法,得到区域划分结果;联系紧密度计算模块,用于计算划分好的区域间的联系紧密度。

从上述本发明的实施例可以看出,本发明实施例根据实际情况,综合考虑了基站的功能与地理位置,确定聚类算法中的输入特征。同时,本发明实施例中的聚类算法采用了k-means++算法,而非传统的k-means。k-means中初始的k个聚类中心需要人为给定或随机生成,初始中心不同可能导致最后聚类结果不同。k-means++只初始化1个类中心,剩下的k-1个类中心会在算法运行过程中进行选取,相对于k-menas,中心点的选取更为合理。本发明在衡量区域间联系紧密度时,综合考虑了区域的人口迁入迁出和区域间的距离等因素,考虑的因素多样化,具有一定的合理性。本发明解决了区域划分中区域面积不合理、区域数量不合理、区域形状不合理等局限性,满足了城市规划中区域划分的基本要求,对了解区域之间的联系、提升区域经济发展有积极作用。

附图说明

图1为本发明评估城市各功能区之间联系需求紧密度的方法的一个实施例流程图;

图2为本发明评估城市各功能区之间联系需求紧密度的方法的另一个实施例流程图;

图3为本发明获得基站功能特征数据集方法的流程图;

图4为本发明获得基站地理位置特征数据集方法的流程图;

图5为本发明获得区域间联系方法的流程图;

图6为本发明评估城市各功能区之间联系需求紧密度的装置的实施例结构图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本发明。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。

下面结合附图对本发明实施例进行详细描述。

实施例一

本发明的实施例提供一种评估城市各功能区之间联系需求紧密度的方法,请参阅图1,包括以下步骤:

步骤101:确定城市区域划分的数据集;

步骤102:根据基站流量时间序列的特征,通过聚类算法确定基站处于的功能区;

步骤103:通过基站处于的功能区数据集和基站的地理位置数据集,对基站进行聚类,得到城市各功能区划分结果;

步骤104:针对已经划分好的各个功能区域的人口迁入量、迁出量,和区域之间的距离,基于人口活动的牛顿引力模型,评估各功能区之间的联系需求紧密度指标。

请参阅图2,为本发明评估城市各功能区之间联系需求紧密度的方法的另一个实施例流程图,包括以下步骤:

步骤201:确定聚类算法中相应的参数集,主要的参数有聚类的类别个数、最大迭代次数、不同的初始中心运行算法的次数、达到收敛的最小阈值等;

步骤202:确定城市区域划分时基站的功能特征数据集;

上述构建基站的功能特征数据集的方法的具体实现方式请查阅图3,包括以下步骤:

步骤301:构建基站流量时间序列;

步骤302:从统计学提取基站流量时间序列的特征,选取均值、方差、偏度、峰度四个指标。

均值是对数据集中趋势的度量,计算公式如下:

其中,μ为均值,xi为第i个数值,n为数据个数。

方差是反映数据离散程度的统计量,计算公式如下:

其中,σ2为方差,μ为均值,xi为第i个数值,n为数据个数。方差越大,数据离散程度越大,数据分布就越分散。

偏度是表示数据分布对称情况的量数,计算公式如下:

其中,s表示偏度,μ为均值,xi为第i个数值,n为数据个数。若偏度为0,则是完美的对称,数据表现为正态分布;偏度大于0,数据为正偏态,表现为右侧长尾;偏度小于0,数据为负偏态,表现为左侧长尾。

峰度是反映数据分布陡缓程度的测度值,计算公式如下:

其中,k表示峰度,μ为均值,xi为第i个数值,n为数据个数。通常以正态分布的峰度为参照标准,来判断数据峰度的高低。正态分布的峰度为3,若峰度大于3,则数据分布曲线比正态分布更尖峭,若峰度小于3,则更为平缓。

步骤303:从时域提取基站流量的特征,选取了hurst指数这个指标。

hurst指数是用于判断时间序列数据是随机游走还是有偏随机游走的指标。hurst指数的计算过程分为七步,具体如下:

(1)时间序列x={x1,...,xi,...,xt},求得其对数序列y={y1,...,yi,...,yt-1},其中,yi的计算公式为

将序列y划分成n个子区间,每个子区间长度为l,每个子区间定义为aj={a1j,...,aij,...,alj},1<j<n

(2)计算每个子区间的均值μj

(3)计算每个子区间aj对于均值的累积截距ek,j

(4)计算极差rj

rj=max(ek,j)-min(ek,i),1≤k≤n

(5)计算每个子区间aj的标准差sj

(6)每个rj都由对应的sj进行标准化,重新定义为r/s:

(7)不断增加区间长度l,重复1到6步,直到l=(t-1)/2。以log(n)为自变量,log((r/s)n)为因变量,对log((r/s)n)=h·log(n)+c进行线性回归,其中,c为常数,斜率h为预估的hurst值。

步骤304:从频域提取基站流量的特征,选取了dwt变换后的系数。

dwt利用少数小波参数来表示原来的时间序列。将时间序列看作离散信号x[n],信号x[n]通过了一个带有冲击响应的低通滤波器g,信号同时又被一个高通滤波器h分解。之后从低通滤波器输出的信号会进行降采样,并再次通过一个新的低通滤波器和一个新的高通滤波器,并且以此不断的重复延伸。

结构中第i层输出:

步骤305:将基站流量的特征作为输入,运用聚类算法,输出为基站的功能特征,即基站服务于工作区、居住区、混合区中的某一功能区。

在获得了基站的功能特征数据集后,返回到城市区域划分方法的流程中,并执行步骤203。

步骤203:确定城市区域划分时基站的地理位置特征数据集;

上述构建基站的地理位置特征数据集的方法的具体实现方式请查阅图4,包括以下步骤:

步骤401:将基站的位置区码(locationareacode,lac)与小区识别码(cellid,ci)结合在一起,其可以唯一确定一个基站。

步骤402:将基站的lac与ci对照转换表,转换成对应的经纬度,确定基站的具体物理位置坐标。

步骤403:将基站的经纬度坐标转换成墨卡托坐标。地球表面一点的经纬度为(α,β),其对应的墨卡托坐标(x,y)的计算公式:

x=r·(α-α0)

y=ln(tan(α)+sec(α))

其中,r为赤道半径,α0为中央经线的经度。

在获得了基站的地理位置特征数据集后,返回到城市区域划分方法的流程中,并执行步骤204。

步骤204:将基站的功能特征和地理位置特征作为输入,运用聚类算法,按照输入的参数集进行参数的设定,输出为城市区域划分结果。

步骤205:针对已经划分好的区域,计算区域间联系紧密度。

上述计算区域间联系紧密度的方法的具体实现方式请查阅图5,包括以下步骤:步骤501:确定区域的人口迁入量和迁出量。在原数据中提取有关用户和基站的字段,将基站用基站所在区域代替,并按照时间排序,得到用户初步的移动行为记录;该用户可能有一段连续的记录显示其处于同一个区域内,这时候要将这些连续的记录合并成一条,由此处理得到用户最终的移动行为数据,由此处理得到用户最终的移动行为数据,形式如下:

其中,qm表示第m个用户的移动行为数据,m表示用户数量,代表了第m个用户在时刻处于区域内,z表示数据维度。获取用户在区域之间的移动数据后,可以计算区域i的人口迁入数量ii和迁出数量oi,计算公式如下:

ii=ci-gi

oi=ci-hi

其中,ci是所有用户移动行为数据中区域i出现的次数,gi是所有用户移动行为数据中区域i作为用户移动的起点而出现的次数,hi所有用户移动行为数据中区域i作为用户移动的终点而出现的次数。

步骤502:确定每个区域的中心。设区域i中的基站的经纬度坐标为区域i的中心计算公式如下:

其中,lon(i)和lat(i)是区域i中心的经度和纬度,是区域i中第p个基站的经度和和纬度,n是区域i中的基站数量。

步骤503:对区域i和区域j中心之间的距离di,j进行求解。此时区域i和区域j会有相距较远的情况,无法直接用平面的欧式距离求解,所以本文采用了可以直接计算球面距离的haversine公式去求解di,j,具体公式如下:

di,f=2r·arcsin(h)

其中,r为赤道半径,

其中,lon(i)和lat(i)是区域i中心的经度和纬度,lon(j)和lat(j)是区域j中心的经度和纬度。

步骤504:运用基于人口活动的牛顿引力模型计算区域联系,公式如下:

其中,fi,j是区域i和区域j的联系,ii和oi是区域i的人口迁入和迁出数量,ij和oj是区域j的人口迁入和迁出数量,di,j是区域中心之间的距离。由于本文研究的是不同区域之间的联系,所以将区域与自身的联系忽略,将其值设置为0。

至此,已经完成了本发明评估城市各功能区之间联系需求紧密度方法的所有实施步骤。

实施例二

本发明的实施例提供一种评估城市各功能区之间联系需求紧密度的装置,请参阅图6。该装置包括参数集设定模块601、数据集获取及预处理模块602、划分模型模块603和联系紧密度计算模块604。下面结合该装置的工作原理进一步介绍其内部结构以及连接关系。

参数集设置模块601,用于设定聚类算法的参数集;

数据集获取及预处理模块602,用于获取基站流量时间序列以及将其预处理成基站特征数据集;

划分模型模块603,用于将处理好的特征数据集作为输入,运用聚类算法,得到最终的划分结果。

联系紧密度计算模块604,针对划分好的区域,运用基于人口活动的牛顿引力模型,计算区域间的联系紧密度。

其中,数据集获取及预处理模块602,包括:

基站流量时间序列构建模块605,用于将用户的上网流量日志数据处理成基站流量时间序列;

基站功能特征构建模块606,用于提取基站流量时间序列的特征,并运用聚类算法,得到基站的功能特征,即基站服务于某一功能区;

基站地理位置特征构建模块607,用于将基站的经纬度坐标转换成墨卡托坐标,得到基站的地理位置特征。

其中,联系紧密度计算模块604,包括:

区域人口迁入量和迁出量计算模块608,用于将用户的上网流量日志数据处理成用户区域转移数据,得到区域的人口迁入量和迁出量;

区域间距离计算模块609,用于计算得到区域的中心位置,再利用haversine公式计算区域之间的距离;

基于人口活动的牛顿引力模型模块610,用于将区域人口迁入量、迁出量和区域间的距离作为输入,输出为区域间的联系紧密度。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

参考文献

[1]toolejl,ulmm,gonzálezmc,etal.inferringlandusefrommobilephoneactivity[a].//proceedingsoftheacmsigkddinternationalworkshoponurbancomputing[c],newyork:acm,2012:1-8.

[2]taop,sobolevskys,rattic,etal.anewinsightintolanduseclassificationbasedonaggregatedmobilephonedata[j].internationaljournalofgeographicalinformationscience,2014,28(9):1988-2007.

[3]wangm,yangs,suny,etal.humanmobilitypredictionfromregionfunctionswithtaxitrajectories[j].plosone,2017,12(11):e0188735.

[4]zhongg,wanx,zhangj,etal.characterizingpassengerflowforatransportationhubbasedonmobilephonedata[j].ieeetransactionsonintelligenttransportationsystems,2017,18(6):1507-1518.

[5]xuhuima,yafeih,zhonghehe.trafficcontrolsubzonedivisionapproachbasedonreachabilityofroadnet-work[j].computerengineeringandapplications,2017,53(17):224-228.

[6]dongl,zhao-pingy,huis,etal.therelationshipbetweenregionaltourisminterrelationandfractalstructureofscenicspotsinxinjiang[a].//internationalconferenceonmanagementscience&engineering[c],harbin:ieee,2013:218-223.

[7]trasartir,olteanu-raimondam,nannim,etal.discoveringurbanandcountrydynamicsfrommobilephonedatawithspatialcorrelationpatterns[j].telecommunicationspolicy,2015,39(3-4):347-362.

[8]xuejund,dengshand.correlationfractaldimensionofspatialstructureoftouristspotssystems——acasestudyinnanjingcity[j].resourcesscience,2006,28(1):180-185.

[9]timberlakem.thepolycentricmetropolis:learningfrommega-cityregionsineurope[j].journaloftheamericanplanningassociation,2008,74(3):384-385.

[10]zhanj,qilu.assessmentandempiricalstudyontherelationshipbetweeninfrastructureconstructionandurban-ruraldevelopment[j].2003,4:133-141.

[11]pingdez,jianqianz.logisticsindustryinguangzhou,shenzhenandhongkonganditsrelationshiptoeconomicgrowthintheprdcitygroups[j].tropicalgeography,2009,29(1):37-42.

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1