基于夜间灯光数据的社会统计参量预测方法

文档序号:26007283发布日期:2021-07-23 21:26阅读:237来源:国知局

本发明涉及夜间灯光数据社会统计参量预测领域,特别是涉及夜间灯光数据校正和社会统计参量模拟与预测的方法。



背景技术:

夜间灯光数据,如dmsp-ols、npp-viirs、珞珈1号,可以完整准确地反映全球、区域、地区间的经济活动状况,因为在更精细的空间尺度上它们具有补充社会统计数据缺失的能力[1],因此,夜间灯光数据在人口统计[2]、经济发展[3]、城市扩张[4]、空气质量监测[5]、能源消耗碳排放[6]等领域具有广阔的应用前景。相关学者在夜间灯光数据校正、噪声消除、社会统计量的空间模拟和分析领域做出了重要贡献。在社会统计量分析方面,文献[7]使用线性函数模拟行政区划内的总夜间灯光(totalnighttimelight,tnl)和能源消耗碳排放之间的关系。文献[8]通过对比npp-viirs的5种灯光指数确定了灯光数据与第二、三产业gdp呈现幂函数相关关系。文献[9]发现相比其他传统拟合函数,基于npp-viirs夜间灯光数据使用一元二次函数模型模拟的gdp更准确。在模拟的社会统计量精度指标方面,相关系数(r2)、中误差(rootmeansquareerror,rmse)分别被采用来对比dmsp-ols和npp-viirs夜间灯光数据预测电力消耗量的精度[10,11]。综上所述,基于夜间灯光数据,传统的数学回归模型来对不同的社会统计参量进行预测计算的精度较低,急需一种新型的智能化数学模型来预测社会统计参量。



技术实现要素:

本发明的目的在于克服上述背景技术存在的缺陷,提供一种基于夜间灯光数据的社会统计参量预测方法,减少了夜间灯光数据的过饱和与灯光溢出现象,增强弱灯光和无灯光区域的城市识别率,提高夜间灯光数据的社会统计参量的预测精度。

本发明的技术方案:一种基于夜间灯光数据的社会统计参量预测方法,该方法包括如下步骤:

(1)、夜间灯光数据的校正方法;

(2)、lssvm的非线性回归模型的社会统计参量模拟;

(3)、社会统计参量模拟量的校正方法;

(4)、社会统计参量预测精度评价。

所述步骤(1)具体是:

通过设计的encsi灯光指数校正夜间灯光数据,消除夜间灯光数据的饱和与溢出现象。

所述步骤(2)具体是:

根据结构风险最小化原理,lssvm建模的非线性回归模型用于夜间灯光数据的社会统计量预测。首先,将夜间灯光数据的数值归一化到[0,1]区间;使用trainlssvm函数训练数据建立模型,simlssvm函数用作预估模型,使用夜间灯光数据和simlssvm函数分别模拟gdp、人口和能源消耗量等社会统计参量。

所述步骤(3)具体是:

在保持各行政区划实际统计的社会统计参量总量不变的前提下,对行政区域内模拟的社会统计参量值进行逐像元纠正。

所述步骤(4)是具体是:

具体是分别使用500m、1km和2km分辨率的dmsp-ols和nppviirs夜间灯光数据,运用所述的4种数学回归模型预测区域gdp、人口和能源消耗等社会统计参量,通过中误差和相关系数评价预测的社会统计量的精度。

与现有技术相比,本发明具有的优点是:

以dmsp-ols、npp-viirs夜间灯光数据为数据源,选取gdp、人口、能源消耗作为社会统计量实例,通过encsi灯光指数校正夜间灯光数据,采用lssvm回归模型预测社会统计参量,预测社会统计参量精度远高于传统数学回归模型,本发明满足了单元格网尺度条件下的社会统计参量空间分析的需求。具体优势如下:

1.本发明设计了新型的encsi灯光指数校正夜间灯光数据,消除夜间灯光数据的饱和与溢出现象,能显著提高暗灯光区域和无灯光区域城市区域的识别精度。

2.本发明将lssvm建模的非线性回归模型用于夜间灯光数据的社会统计量预测。首先,将夜间灯光数据的数值归一化到[0,1]区间;使用trainlssvm函数训练数据建立模型,simlssvm函数用作预估模型,使用夜间灯光数据和simlssvm函数分别模拟gdp、人口和能源消耗量等社会统计参量。在保持各行政区划实际统计的社会统计参量总量不变的前提下,对行政区域内模拟的社会统计参量值进行逐像元纠正。

具体实施方式

下面通过具体实施例对本发明作进一步的说明。本发明的实施例是为了更好地使本领域的技术人员更好地理解本发明,并不对本发明作任何的限制。

基于夜间灯光数据社会统计参量模拟方法的具体步骤如下:

1)夜间灯光数据的校正方法:

利用modis09a1地表反射率数据生成改进的归一化差异水体指数(modifiednormalizeddifferencewaterindex,mndwi)和modis13a1归一化植被指数(normalizeddifferencevegetationindex,ndvi)产品,利用绿波段g和中红外波段mir生成mndwi的指数公式如下:

求城市中心区域的平均mndwi和平均ndvi,分别以表示,r表示形成的距离,d表示任意一点的mndwi和ndvi的距离,ntl表示原始夜间灯光数据的dn值,下面以公式表示encis指数的计算方法:

经过encsi夜间灯光指数的校正,夜间灯光数据的过饱和与灯光溢出现象得到纠正,同时暗夜光和无夜光区域的城市土地像元得到增强。

2)lssvm的非线性回归模型的社会统计参量模拟

首先,对输入夜间灯光数据变量和输出社会统计参量变量归一化到[0,1]区间;采用rbf核函数作为支持向量机模型的核函数并令sig2=0.2;确定核函数后,设置惩罚系数gamma=10;将夜间灯光与社会统计参量的原始样本集分为70%的训练样本集和30%的测试样本集,将得到的参数优化结果输入模型中,基于matlab软件平台建立训练预测模型,分别获得训练集和测试集预测拟合结果。利用lssvmlab工具箱的trainlssvm函数用来训练建立模型,simlssvm函数用于预估模型,plotlssvm函数是专用的绘图函数。

3)社会统计参量的校正

当直接用夜间灯光像元值来代替tnl计算单像元对应的社会统计参量时误差会很大,所以需要对此时预测的单像元社会统计参量进行校正。在保持各行政区划内统计的社会统计参量的总量不变的前提下,对行政区域内模拟的社会统计参量值进行逐像元校正,校正公式如下:

pt=pj×(pt/pall)(3)

式中,pt为校正后的社会统计参量值;pj为每个格网预测的社会统计参量值;pt为该行政区划内统计的实际社会统计参量值;pall为该行政区划内模拟的社会统计参量的总量。

4)社会统计参量预测精度评价

分别使用500m、1km、2km分辨率的dmsp-ols和nppviirs夜间灯光数据,以2013年京津冀地区的社会统计参量(gdp、人口、能源消耗)为例,运用lssvm回归模型预测京津冀地区的gdp、人口和能源消耗,通过中误差和相关系数评价预测的社会统计量的精度,如表1-表6所示,中误差的计算公式为:

式中,表示第i个行政单元的社会统计量实际统计值;n为行政区域个数。

以下就京津冀地区为例展开说明本发明的实施效果:

京津冀地区包括北京市、天津市和河北省,是中国北方地区的政治、文化、经济、科技的重要核心区,面积占全国的2.4%,人口占全国的7.2%。京津冀地区位于华北平原以北,南临华北平原,东靠渤海湾,西倚太行山脉,北部和西部地势较高,南部和东部地势平坦。京津冀地区作为我国的首都圈,坚持优势互补、互利共赢的发展理念,各区域相互促进,成为中国发展最快的城市群之一。京津冀地区中,属北京和天津经济发达,而河北省各市县经济发展不均衡,地区差异性较大,因此,京津冀地区的夜间灯光数据在社会统计测量的预测研究方面具有很好的代表性。

选取的社会统计量预测方法包括线性函数、一元二次多项式函数、幂函数、lssvm,通过rmse评估夜间灯光对社会统计量的预测精度。根据“无灯光无社会统计量”的原则,设置线性和一元二次多项式回归函数的截距为0。预测社会统计量的5种数学回归模型如下:

线性、一元二次多项式、幂函数回归模型的公式如下:

pi=a·tnli(5)

pi=a·tnli2+btnli(6)

式中,pi和tnli分别表示第i个行政单元的社会统计量预测值和夜间灯光总量;a、b分别表示回归模型的系数。

lssvm建模的非线性回归模型为:根据结构风险最小化原理,lssvm问题变为:

根据拉格朗日乘法得:

通过对各个变量求导并令导数等于0得:

通过消去ξ和ω,优化问题转化为求解线性方程组:

式中,e=[1;1;…;1];α=[α1;α2;…;αn];y=[y1;y2;…;yn];i表示单位阵;为核函数矩阵,k选用rbf函数。b和α可由式(7)解出,可得回归模型为:

利用已有的2013年京津冀地区的统计资料和rmse公式评价500m、1km、2km分辨率的dmsp-ols和nppviirs夜间灯光数据预测社会统计参量的精度。表1-表6显示,无论是dmsp-ols夜间灯光数据还是npp-viirs夜间灯光数据在500m、1km和2km分辨率上lssvm预测的社会统计参量(gdp、人口、能源消耗)的rmse都是其他3种常用数学回归模型中最小的,因此,lssvm回归模型预测的社会统计参量的精度最高。

表1500m分辨率dmsp-ols数据的4种回归模型的社会统计量预测误差

表2500m分辨率npp-viirs数据的4种回归模型的社会统计量预测误差

表31km分辨率dmsp-ols数据的4种回归模型的社会统计量预测误差

表41km分辨率npp-viirs数据的4种回归模型的社会统计量预测误差

表52km分辨率dmsp-ols数据的4种回归模型的社会统计量预测误差

表62km分辨率npp-viirs数据的4种回归模型的社会统计量预测误差

应当理解的是,这里所讨论的实施方案及实例只是为了说明,对本领域技术人员来说,可以加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

相关文献:

[1]zhaoj,cheny,jig,etal.residentialcarbondioxideemissionsattheurbanscaleforcounty-levelcitiesinchina:acomparativestudyofnighttimelightdata[j].journalofcleanerproduction,2018,180:198-209.

[2]崔晓临,张佳蓓,吴锋,等.基于多源数据融合的北京市人口时空动态分析[j].地球信息科学学报,2020,22(11):2199-2211.

[3]sunj,dil,sunz,etal.estimationofgdpusingdeeplearningwithnpp-viirsimageryandlandcoverdataatthecounty-levelinconus[j].ieeejournalofselectedtopicsinappliedearthobservationsandremotesensing,2020,99:1-16.

[4]张景奇,周思静,修春亮.基于夜间灯光数据的中国五大区域级城市群空间扩张协同性对比[j].中国土地科学,2019,33(10):56-65.

[5]shik,shenj,wangl,etal.amultiscaleanalysisoftheeffectofurbanexpansiononpm2.5concentrationsinchina:evidencefrommultisourceremotesensingandstatisticaldata[j].buildingandenvironment,2020,174:106778.

[6]yangd,luanw,qiaol,etal.modelingandspatio-temporalanalysisofcity-levelcarbonemissionsbasedonnighttimelightsatelliteimagery[j].appliedenergy,2020,268:114696.

[7]lvq,liuh,wangj,etal.multiscaleanalysisonspatiotemporaldynamicsofenergyconsumptionco2emissionsinchina:utilizingtheintegratedofdmsp-olsandnpp-viirsnighttimelightdatasets[j].scienceofthetotalenvironment,2019,703:134394.

[8]李峰,米晓楠,刘军,等.基于npp-viirs夜间灯光数据的北京市gdp空间化方法[j].国土资源遥感,2016,28(3):19-24.

[9]李峰,卫爱霞,米晓楠,等.基于npp-viirs夜间灯光数据的河北省gdp空间化方法[j].信阳师范学院学报(自然科学版),2016,29(1):152-156.

[10]zhaoj,jig,yueyl,etal.spatio-temporaldynamicsofurbanresidentialco2emissionsandtheirdrivingforcesinchinausingtheintegratedtwonighttimelightdatasets[j].appliedenergy,2019,235:612-624.

[11]zhangx,wuj,pengj,etal.theuncertaintyofnighttimelightdatainestimatingcarbondioxideemissionsinchina:acomparisonbetweendmsp-olsandnpp-viirs[j].remotesensing,2017,9(8):797.

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1