一种基于数据挖掘的建设用地承载效率测度方法

文档序号:8361634阅读:349来源:国知局
一种基于数据挖掘的建设用地承载效率测度方法
【技术领域】
[0001] 本发明涉及建设用地承载效率的研宄领域,特别涉及一种基于数据挖掘的建设用 地承载效率测度方法。
【背景技术】
[0002] 在建设用地承载效率的相关研宄中,近期国外有学者用有序响应模型去研宄土 地发展强度和土地所有者的关系(NazneenFerdous, 2013),对于居住活动的多样化发展 (Yin,elal,2011)也有所涉及。在国内,很早就有学者提出土地集约利用的必要性(顾湘 等,2006),曾勇等(2004)也对土地利用与人口规模的匹配有所研宄。许多学者从经济角度 出发研宄土地利用效率,包括建立全要素土地利用效率理论模型(赵晓波,2013),使用DEA 法进行模型研宄(袁磊等,2009),石忆邵(2013)还利用熵值法对广州大学城地区的土地 利用做出综合性评价,也有在熵值法基础上利用层次分析法做出评价的探索(尚天成等, 2009)。但综合性的土地承载力测度直到近年才有学者涉及(祝秀芝,2013)。与此同时,国 内的建设用地演化特征及影响也处于研宄当中(李昶,2013)。然而既有的研宄多基于区域 经济层面,拙于在空间层面上的探讨,这类以经济为主体的研宄模式的弊端在于过分强调 抽象的区域范围层面,且由于数据更新迟滞,无法对具体的地块进行效率的评估,对分析结 果的准确性和时效性有一定影响。
[0003] 信息技术的进步加速了知识、技术、人才、资金等的时空交换,流空间成为区域、城 市以及居民活动的主要载体(Castells,1996),早期有学者提出城市是人群活动的高度聚 集体,人在城市的行为对城市研宄占据更主导的因素(I.Gordon,2008),而以统计年鉴数据 为主导的区域性建设用地产出效率分析恰恰忽略了社会个体的行为特征,这也是现有研宄 的缺陷之一。
[0004] 近年来,大数据的出现一定程度上解决了过去长期存在的数据短缺问题,使得部 分无法进行的定量分析变得可行(Delyser、Sui,2013)。也在测度城市活动方面有了较大突 破,城市的经济、文化、交通、娱乐等方面都已经和信息化的数字空间紧密结合(王静远等 2014),人群活动及空间分布的数据研宄通过微博等社交工具成为可能。目前应用大数据 探索居民出行和交通的研宄相对较多,且多从电信运营商、社交网站、出租车及公交智能卡 等多种途径获取数据进行研宄(Becker,2011 ;Kang,2012 ;Mark,2011 ;Naaman,2012 ;龙瀛, 张宇,崔承印,2012 ;Batty,2013)。相关研宄成果的涌现,为新时期的城乡规划学科发展提 供了卓有成效的技术导引。由于互联网数据更新的实时性,且能准确定位使用者的地理位 置,通过人群活动数据研宄的范围可缩小至具体街区,由此,土地承载效率的大数据分析更 为有效,避免了一般统计数据无法判别具体用地效率的问题。
[0005] 现实中,国内规划领域一直拙于对建设用地的承载效率测度,多依赖于经济统计 年鉴数据等方式,这种粗口径的研宄方式虽然能判别宏观尺度下城市建成环境的优劣,但 囿于空间尺度的有限性,无法更加细致的判别土地承载效率的空间特征。另一方面,建设用 地承载效率不能脱离社会个体的活动,借助于统计年鉴数据的承载效率测度虽然可以计算 整体的城市发达程度,但这种结构性的测度容易忽略个体的空间活动,甚至与市民的日常 行为之间形成明显的断裂。

【发明内容】

[0006] 本发明的主要目的在于克服现有技术的缺点与不足,提供基于数据挖掘的建设用 地承载效率测度方法。
[0007] 为了达到上述目的,本发明采用以下技术方案:
[0008] 一种基于数据挖掘的建设用地承载效率测度方法,包括下述步骤:
[0009] S1、数据挖掘,以网络数据作为主要数据来源,并以人口普查等传统数据作为补 充,通过对各项活动数据的挖掘和空间定位,探索建设用地承载效率的空间特征;所述网络 数据包括居住活动数据、就业活动数据、游憩活动数据、社交网站和网络购物消费数据;
[0010] S2、数据解析,对于网络购物数据和企业数据中的地址进行地址解析,通过百度 LBS开放平台中WebAPI页面下GeocodingAPI的服务功能,将地址的文本信息转换为经炜 坐标;
[0011] S3、空间匹配,在完成数据收集后,将前述方法得到的地址解析数据进行坐标转 换,转化为GIS平台可以使用的位置数据,并与建设用地进行关联匹配;
[0012] S4、在数据挖掘、解析以及空间降维的基础上,基于数据的多元特征,通过综合测 度实现建设用地承载效率的区位差异测度,具体包括单要素数据的空间测度和综合数据的 空间叠合,具体为:
[0013] S4. 1、单要素数据的空间测度,对居住、企业、游憩的各项活动的分布密度进行测 度,利用开放平台、企事业名录的多维数据进行地址解析,获取各项活动的区位分布,并结 合建设用地和人口的密度分布状况,反映城市整体层面的单要素承载强度;
[0014] S4. 2、综合数据的空间叠合,在每项指标要素中,对各类指标值进行空间栅格化处 理后,综合熵值法和层次分析法,确定指标权重,对单要素承载强度进行主客观综合加权计 算,由此形成建设用地承载效率的综合评定,并对高值、低值区域进行空间判别。
[0015] 优选的,步骤Sl中,所述社交网络数据包括新浪微博的数据,对于新浪微博的数 据获取,通过微博API服务中的微博接口和地理信息接口主要获取其发布微博的文本信息 和地理坐标信息,具体为:
[0016] SI.1、根据相关要求填写网页应用信息,获取AppKey以及AppSecret;
[0017]SI. 2、登陆新浪微博的开放平台,进入数据抓取界面,在参数设置区域内设置参 数,点击调用接口,显示请求返回的结果;
[0018] SL3、进入地理信息接口中"2/place/nearby_timeline"子接口,根据请求参数编 写请求URL,确定抓取的中心点、搜索半径以及搜索的起止时间,Python文件批量获取搜索 内容,所述搜索内容包括:发布微博的时间信息、地理坐标信息、发布文本内容、用户id、距 离中心点距离、性别以及用户所在地信息,通过Python文件批量获取搜索内容的具体步骤 如下:
[0019] SI. 3. 1、实例化APIClient类对象,向用户发送Auth认证请求,客户端用已保存的 用户账户密码登陆,模拟同意授权;
[0020] SL3. 2、获得用户同意授权后的的URL:
[0021] YOUR_REGISTERED_REDIRECT_URI/ ?code=CODE,监听HTTP过程,在回调网页中 截取code的值;
[0022] SI. 3. 3、提交code给API服务器,使用获得的 0Auth2.OAccessToken调用API;
[0023]SI. 3. 4、通过调用place/pois/users、place/pois/tips、place/poi_timeline等 接口得到包含POI点的签到数、带有地理位置的微博、用户信息等信息的JSON格式数据;
[0024]SI. 3. 5、解析Json格式的数据,保存在本地。
[0025] 优选的,所述网络数据还包括图片数据,对于图片数据的抓取,是通过panoramio 网站进行,通过panoramio开放平台中GeocodingAPI页面下的WebAPI服务功能,根据其 参数要求,编写发送http请求的URL,并借助LocoySpider软件,批量发送和接收http请求 返回的数据。
[0026] 优选的,步骤S2中,数据解析的具体方法为:
[0027]S2. 1、获取API接口 密钥;
[0028]S2. 2、使用获取的密钥,根据其参数要求,编写发送http请求的URL;
[0029] S2. 3、借助LocoySpider软件,批量发送和接收http请求返回的数据,由此完成文 本信息的地址解析。
[0030] 优选的,步骤S4. 1中,在建设用地承载效率的单要素测度方面,从三大类基本活 动的强度分布入手,首先对栅格内的居住活动、游憩活动的原子化数据的数量进行汇总,企 业活动则通过营业额进行汇总,并计算第k项要素在空间单元i中的活动强度rik,并对各 项活动的绝对强度数据进行归一化处理,即:
【主权项】
1. 一种基于数据挖掘的建设用地承载效率测度方法,其特征在于,包括下述步骤: 51、 数据挖掘,以网络数据作为主要数据来源,并以人口普查等传统数据作为补充,通 过对各项活动数据的挖掘和空间定位,探索建设用地承载效率的空间特征;所述网络数据 包括居住活动数据、就业活动数据、游憩活动数据、社交网站和网络购物消费数据; 52、 数据解析,对于网络购物数据和企业数据中的地址进行地址解析,通过百度LBS开 放平台中Web API页面下Geocoding API的服务功能,将地址的文本信息转换为经炜坐标; 53、 空间匹配,在完成数据收集后,将前述方法得到的地址解析数据进行坐标转换,转 化为GIS平台可以使用的位置数据,并与建设用地进行关联匹配;
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1