一种基于数据挖掘的建设用地承载效率测度方法_2

文档序号:8361634阅读:来源:国知局
54、 在数据挖掘、解析以及空间降维的基础上,基于数据的多元特征,通过综合测度实 现建设用地承载效率的区位差异测度,具体包括单要素数据的空间测度和综合数据的空间 叠合,具体为: S4. 1、单要素数据的空间测度,对居住、企业、游憩的各项活动的分布密度进行测度,利 用开放平台、企事业名录的多维数据进行地址解析,获取各项活动的区位分布,并结合建设 用地和人口的密度分布状况,反映城市整体层面的单要素承载强度; S4. 2、综合数据的空间叠合,在每项指标要素中,对各类指标值进行空间栅格化处理 后,综合层次分析法AHP和熵值法,确定指标权重,对单要素承载强度进行主客观综合加权 计算,由此形成建设用地承载效率的综合评定,并对高值、低值区域进行空间判别。
2. 根据权利要求1所述的基于数据挖掘的建设用地承载效率测度方法,其特征在于, 步骤Sl中,所述社交网络数据包括新浪微博的数据,对于新浪微博的数据获取,通过微博 API服务中的微博接口和地理信息接口主要获取其发布微博的文本信息和地理坐标信息, 具体为: SI. 1、根据相关要求填写网页应用信息,获取App Key以及App Secret ; SI. 2、登陆新浪微博的开放平台,进入数据抓取界面,在参数设置区域内设置参数,点 击调用接口,显示请求返回的结果; SI. 3、进入地理信息接口中"2/place/nearby_timeline"子接口,根据请求参数编写 请求URL,确定抓取的中心点、搜索半径以及搜索的起止时间,Python文件批量获取搜索内 容,所述搜索内容包括:发布微博的时间信息、地理坐标信息、发布文本内容、用户id、距离 中心点距离、性别以及用户所在地信息,通过Python文件批量获取搜索内容的具体步骤如 下: S1. 3. 1、实例化APICl ient类对象,向用户发送Auth认证请求,客户端用已保存的用户 账户密码登陆,模拟同意授权; SI. 3. 2、获得用户同意授权后的的URL : YOUR_REGISTERED_REDIRECT_URI/ ? code = CODE,监听 HTTP 过程,在回调网页中截取 code的值; SI. 3. 3、提交code给API服务器,使用获得的0Auth2. 0 Access Token调用API ; SI. 3· 4、通过调用 place/pois/users、place/pois/tips、place/poi_timeline 等接口 得到包含POI点的签到数、带有地理位置的微博、用户信息等信息的JSON格式数据; SL 3. 5、解析Json格式的数据,保存在本地。
3. 根据权利要求1所述的基于数据挖掘的建设用地承载效率测度方法,其特征在于, 所述网络数据还包括图片数据,对于图片数据的抓取,是通过panoramio网站进行,通过 panoramio开放平台中Geocoding API页面下的Web API服务功能,根据其参数要求,编写 发送http请求的URL,并借助LocoySpider软件,批量发送和接收http请求返回的数据。
4. 根据权利要求1所述的基于数据挖掘的建设用地承载效率测度方法,其特征在于, 步骤S2中,数据解析的具体方法为: S2. 1、获取API接口密钥; S2. 2、使用获取的密钥,根据其参数要求,编写发送http请求的URL ; S2. 3、借助LocoySpider软件,批量发送和接收http请求返回的数据,由此完成文本信 息的地址解析。
5. 根据权利要求1所述的基于数据挖掘的建设用地承载效率测度方法,其特征在于, 步骤S4. 1中,在建设用地承载效率的单要素测度方面,从三大类基本活动的强度分布入 手,首先对栅格内的居住活动、游憩活动的原子化数据的数量进行汇总,企业活动则通过营 业额进行汇总,并计算第k项要素在空间单元i中的活动强度r ik,并对各项活动的绝对强 度数据进行归一化处理,即:
其中Si为第i栅格空间单元的建设用地面积,N i为第i栅格k项活动的数量和;再运 用Arcscene软件将其空间分布三维化展示。
6. 根据权利要求1所述的基于数据挖掘的建设用地承载效率测度方法,其特征在于, 步骤S4. 2中,在综合测度方面,将四类分项要素活动数据与人口数据空间叠合,综合层次 分析法AHP和熵权法,对五类指标进行加权计算,形成建设用地承载效率的综合评定,建设 用地效率的综合评价模型为:
对于各类要素活动的综合权重a k,采用综合赋权法,记Pk、qk分别表示k 项要素通过层次分析法AHP赋权、熵权法赋权得到的权重, a k= c !*pk+c2*qk (3) 〇
7. 根据权利要求6所述的基于数据挖掘的建设用地承载效率测度方法,其特征在于, S4. 2中,根据层次分析法AHP确定各要素的权重pk,具体为: S4. 2. 1、建立层次结构模型,构造判断矩阵A ;
S4. 2. 2、通过两两排序确定各项要素活动的重要性排序;对判断矩阵A,计算满足AW = λ _W,其中λ max为A的最大特征根,W为对应于λ max的正规化特征向量,W的分量W k就是 对应元素单排序的权重值,应用方根法求解归一化特征向量和特征值;具体为: 首先计算判断矩阵每一行标度的乘积的η次方根
Mk为判断矩阵中每一行元素的值; 将方根向量进行归一化处理,得到特征向量W的第k个分量
(AW) k为向量AW的第k个分量; S4. 2. 3、再经过一致性检验,最后确定各项要素活动的排序; 检验判断矩阵的一致性,计算其一致性指标: CI = ( λ max-k) / (k-1) (9) 并将Cl与平均随机一致性指标RI进行比较,记为CR,当CR = CI/RKO. 10时,认为判 断矩阵具有令人满意的一致性; S4. 2. 4、确定层次分析法各项要素活动的权重pk;
式中Pk为指标层权重,a 准则层各要素相对于目标层的权重,为指标呈各因素相 对于准则层的权重; 总排序一致性公式:
当CR〈0. 10时,认为总排序具有满意的一致性,即得到各要素的权重。
8.根据权利要求6所述的基于数据挖掘的建设用地承载效率测度方法,其特征在于, 根据熵权法计算qk确定各类活动的客观权重,具体方法为: S4. 2. 5、以镇街为单位,计算各单元常住人口密度; S4. 2. 6、根据熵值法确定权重系数,则有
其中rmax、rmin分别表示k项要素在所有栅格单元中的最大值、最小值; S4. 2. 7、计算各项要素评价指标的熵值,先定义
式中:i = 1,2,…,m ;k = 1,2, 3, 4, 5 根据熵的概念定义各项要素评价指标的熵值为:
由于fik= O时,Inf ik无意义,故参考孟宪萌(2009)的方法,将f ik进行修正,则:
54. 2. 8、利用修正后的测度指标计算各要素的熵权:
9.根据权利要求1所述的基于数据挖掘的建设用地承载效率测度方法,其特征在于, 步骤S4中,承载效率的综合测度具体为: 55. 1、计算各栅格单元综合承载效率;
S5. 2、通过Arcscene软件将其空间分布三维化展示,由此得到建设用地承载效率的综 合评价; S5. 3、算低值得分,根据最后确定的综合分数,通过差值法搜索承载效率较低的空间单 元,并将数据进行归一化处理,计算各空间单元的低值得分
S5. 4、计算平均值μ,计算所有栅格单元中建设用地承载效率的算术平均值,有效栅格 单元数为m,
S5. 5、计算标准差δ,根据上两步计算得到的低值和平均值,计算所有栅格单元建设用 地承载效率的标准差S ;
S5. 6、低值区域判别,通过各单元平均差值偏离标准差的倍数找出承载效率洼地,则有
S5. 7、计算各镇街栅格个数Nt,以镇街为单元,通过GIS软件以归属面积择大原则计算 各镇街包含的栅格单元个数Nt; S5. 8、以镇街为单位判别效率洼地,计算各镇街建设用地承载洼地单元数偏离全市标 准差倍数的平均值;
由此判断各镇街的建设用地是否属于承载效率的洼地区域。
【专利摘要】本发明公开了一种基于数据挖掘的建设用地承载效率测度方法,包括下述步骤:S1、数据挖掘,以网络开放数据作为主要数据来源,并以人口普查等传统数据作为补充,探索建设用地承载效率的空间特征;S2、数据解析,对于网络购物数据和企业数据中的地址进行地址解析;S3、数据空间匹配,在完成数据收集后,将前述方法得到的地址解析数据进行坐标转换,转化为GIS平台可以使用的位置数据,并与建设用地进行关联匹配;S4、基于数据的多元特征,通过综合测度实现建设用地承载效率的区位差异测度。本发明采用数据挖掘的方式,获取相关的网络开放数据,通过空间地址匹配,反映了企业或者居民微观个体的社会活动,解决了建设用地承载效率的测度问题。
【IPC分类】G06F17-50
【公开号】CN104679942
【申请号】CN201510047806
【发明人】赵渺希, 徐高峰, 李欣建, 郭芒, 钟烨, 郭振松, 张平成, 李榕榕
【申请人】华南理工大学
【公开日】2015年6月3日
【申请日】2015年1月29日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1