基于自适应核密度估计算法的地面气温观测资料分析方法与流程

文档序号:18197493发布日期:2019-07-17 05:56阅读:648来源:国知局
基于自适应核密度估计算法的地面气温观测资料分析方法与流程

本发明涉及地面气温观测资料分析领域,特别发明了一种改进的核密度估计算法对地面气温要素进行分析。



背景技术:

近年来,全球变暖的趋势愈发明显,气温变化给社会带来了严重的影响,因此得到了各国学者的广泛关注,以此为研究得到了许多有意义的结论。就我国而言,对地理位置特殊的地区如高原、盆地等研究较多,取得了许多成果,而气温较为稳定的东南地区研究不足。传统气温分析方法多数建立在时间序列的基础上来预测并分析未来的变化趋势,在空间角度上各国专家学者也进行了一系列的研究,但是影响气温变化的因素非常复杂,且存在明显的区域性与季节性差异。已有的研究对造成气温变化的原因分析不足。



技术实现要素:

本发明为了解决现有技术中存在的问题,提供一种用于地面气温观测资料分析的方法。

为了达到上述目的,本发明提出的技术方案为:一种基于自适应核密度估计算法的地面气温观测资料分析方法,包括如下步骤:

步骤1、选取目标地区地面气温观测资料的一段时间序列内的站点数据样本,第i个站点数据为xi=(xi1,xi2,…xij,…,xin)t

步骤2、根据核密度估计公式计算核密度估计值;其中k(x)为核函数,h为窗宽,hi为第i的站点对应的窗宽,n为样本容量;

步骤3、设计窗宽系数则自适应窗宽为hi*=λihi,将自由适应窗宽替换核密度估计公式中的窗宽,得到自适应核密度估计公式

其中g为的算数平均值;α为灵敏参数,满足0≤α≤1;

步骤4、设计最优窗宽将最优窗宽替代自适应核密度估计公式中的窗宽,得到

其中,c为参数,为站点数据样本的标准差。

对上述技术方案的进一步设计为:所述核函数采用gaussian函数。

采用调整的粒子群算法分别对参数c与α进行选取,则步骤4中最优窗宽公式调整为:得到改进的自适应核密度估计公式:

其中,ω与μ为参数,取值范围分别在[-0.5,0.5]和[-0.1,0.5]之间。

参数c与α初值设定为1.06与0.2。

本发明相比于现有技术所产生的有益效果为:

本发明的自适应核密度估计算法无论是精度还是拟合程度都比传统的固定窗宽算法好,另外本发明提出的算法在多尺度下均具有良好的预测精度与拟合程度,而传统算法只能在小尺度下进行应用。

从原理层面上来看,了解气温的变化特征以及多时间尺度下各个区域的变化特点,有助于对气温变化趋势及其影响因素的深入理解,因此需要剖析地面气温观测资料的频次、数值大小、趋势等属性以及在多时间尺度下气候、位置对于气温的影响,进而能够深入进行分析与研究。本发明提出的算法可以很好的分析了我国地面气温观测资料的统计特性,为进一步研究地面气温观测资料提供理论基础。

本发明提出的方法可以有效的分析地面气温观测资料的统计特性,并且对其影响原因也可进行进一步的分析,因此可以有效的应用于地面气温观测资料的分析与应用。

附图说明

图1为本发明实施例流程图;

图2a为本发明方法与传统固定窗宽的核密度估计算法的mae效果对比柱形图;

图2b为本发明方法与传统固定窗宽的核密度估计算法的rmse效果对比柱形图;

图2c为本发明方法与传统固定窗宽的核密度估计算法的nsc效果对比柱形图;

图2d为本发明方法与传统固定窗宽的核密度估计算法的ioa效果对比柱形图;

图2e为本发明方法与传统固定窗宽的核密度估计算法的mae效果对比折线图;

图2f为本发明方法与传统固定窗宽的核密度估计算法的rmse效果对比折线图;

图2g为本发明方法与传统固定窗宽的核密度估计算法的nsc效果对比折线图;

图2h为本发明方法与传统固定窗宽的核密度估计算法的ioa效果对比折线图;

图3a为本发明方法在徐州站点的核密度估计算法试验结果图;

图3b为本发明方法在宿迁站点的核密度估计算法试验结果图;

图3c为本发明方法在连云港站点的核密度估计算法试验结果图;

图3d为本发明方法在淮安站点的核密度估计算法试验结果图;

图3e为本发明方法在扬州站点的核密度估计算法试验结果图;

图3f为本发明方法在南京站点的核密度估计算法试验结果图;

图3g为本发明方法在镇江站点的核密度估计算法试验结果图;

图3h为本发明方法在常州站点的核密度估计算法试验结果图;

图3i为本发明方法在盐城站点的核密度估计算法试验结果图;

图3j为本发明方法在无锡站点的核密度估计算法试验结果图;

图3k为本发明方法在苏州站点的核密度估计算法试验结果图;

图3l为本发明方法在南通站点的核密度估计算法试验结果图;

图4为江苏省12站点分布图。

具体实施方式

下面结合附图以及具体实施例对本发明进行详细说明。

按照本发明实施例方法的流程图,如图1所示,首先要采集所需站点在一定时间序列内的气温资料,然后对数据进行基本的预处理,接着,分别进行不同的核密度估计试验,采用不同的评价指标进行评价,最后利用本文提出的算法进行江苏省12站点的试验并进行分析。

以下将对江苏省徐州(站号:58027)、宿迁(站号:58131)、连云港(站号:58044)、淮安(站号:58141)、扬州(站号:58245)、南京(站号:58238)、镇江(站号:58248)、常州(站号:58343)、盐城(站号:58154)、无锡(站号:58354)、苏州(站号:58349)、南通(站号:58259)共计12个站点1988年到2007年日、夜、季度平均气温值作为观测资料进行实施例分析,进一步说明本发明:

对比例一

选取江苏省12个站点地面气温观测资料1988年到2007年气温六小时数据以及月平均数据作为观测资料,对以上获取的资料进行预处理,预处理数据为:取其中08时与14时气温的平均值作为日均温,取20时与02时气温的平均值作为夜均温,取1-3月为第一季度,4-6月为第二季度,7-9月为第三季度,10-12月为第四季度,得到相应的时间序列x=(x1,x2,…,x12),其中第i个站点数据为xi=(xi1,xi2,…xij,…,xin)t

采用固定窗宽的传统核密度估计算法进行试验,根据核密度估计的公式进行计算,其中k(x)为核函数,h>0为窗宽参数,固定值一般选取1.8~2,n为样本容量。

选取数学性质较好的gaussian核函数:作为核函数。

基于最小平方差(lscv)的思想,根据积分均方误差(mise)最小,推导求出最优的固定窗宽,具体推理过程如下:根据积分均方误差公式其中偏差公式为方差对偏差公式进一步化简可得:以及将其偏差与方差代入积分均方误差公式其中,k2=∫x2k(x)dx,令如果需要mise最小,则amise达到最小,所以对amis求一阶导数令其等于0,求出最优窗宽h。推导出的最优窗宽h为:当核函数确定为高斯核后,可推得:其中为样本的标准差。

对比例二

对比例一所采用的窗宽均为固定窗宽,不能够有效反应样本观测值的稀疏程度所带来的影响,本对比例在对比例一的基础上加入了自适应算法。

根据对比例一得到的核密度估计值在hi与成比例的基础上,通过设计窗宽系数来改进,其中g为的算术平均:即α为灵敏参数,满足0≤α≤1,实际应用中α为0.5时效果最好,因此自适应窗宽为hi*=λihi,替换对比例一中的hi,即可求得自适应核密度估计但是上述方法直接应用到地面气温观测资料分析上并不合适,其中初始h缺乏一个选择标准,通过代入最优窗宽的选择方法,针对不同站点选取不同的初始窗宽hi,结合自适应参数得出适用于地面气温观测资料的自适应核密度估计公式:

实施例

通过对比例二的算法在地面气温观测数据下得出的结果不能满足所有均方误差均为最小,说明该方法不完全适用于地面气温观测资料,因此需要重新确定最优窗宽的选取方法,本实施例提出优化方法为:基于最优窗宽公式给出新的窗宽公式:其中c跟a参数均为可变量,为了使得得出的核密度估计曲线图贴近于数据真实情况,采用智能寻优算法来确定其中的参数c与a,使得rmse值越小越好,改进后的公式为:

其中n为样本容量,k(x)为高斯核,为自适应窗宽系数,参数c与α待定。本实施例采用调整的粒子群算法分别对参数c与α进行选取:以核密度估计函数为目标函数,假设一个n维空间,由多个站点的气温数据组成的粒子种群x=(x1,x2,…,xd),其中第i个粒子数据xi=(xi1,xi2,…xij,…,xin)t通过目标函数计算可以得出核密度估计的一组潜在解:再以均方根误差rmse为适应度函数,其中,初始解中参数c与α参照固定窗宽算法中的最优窗宽来设定,为1.06与0.2,将传统pso的速度v调整为双重变化因子ω与μ,位置x调整为窗宽则其公式调整为:同时将参数ω与μ范围限制在[-0.5,0.5]以及[-0.1,0.5]之间,通过以上方法得到改进的自适应核密度估计公式:

本实施例对于真实数据的拟合程度更好,能够展现出数据本身的趋势。

如图2所示,选取四个常用评价参数:平均绝对误差(mae)、均方根误差(rmse)、纳什系数(nsc)和一致性指标(ioa)来描述在固定窗宽、最优固定窗宽以及改进的自适应窗宽下的试验效果:

其中,n为样本点数,为第ij个核密度估计值,y(xij)为第ij个原始数据频率直方图每个直方的均值,为频率直方图均值。

如图3所示,将改进的核密度估计算法应用于江苏省12站地面气温观测资料进行试验,并结合位置(图4所示)以及气候特征对其试验结果图分析并总结。

上述三种算法的试验效果在指标mae、rmse、nsc和ioa对比下,说明了在精度与拟合程度上传统固定窗宽算法在江苏省地面气温观测资料季度气温方面的应用并不合适,而改进过后的自适应核密度估计算法无论是精度还是拟合程度都较好。进一步发现,本发明实施例提出的算法在多尺度下的精度以及拟合效果都是最优,而对比例一中传统固定窗宽算法只能应用在小尺度数据的试验,综上本文提出的方法就精度与拟合方面在多站点与多尺度下相较于传统方法都有足够优良的效果。

气候特征的影响因子大于位置特征,在季度尺度下,位置越往南部,整体均温越高,温度变化越稳定,以15℃代表的春秋季均温加长,海洋的调节作用一定程度上弥补了位置偏南带来的影响;在日夜尺度下,对以20℃-30℃代表的夏季,气候影响均温的变化趋势,位置则影响均温的持续时长,气候中海洋性气候与季风性气候带来的影响差别不大,海洋调节会提高均温的大小与时长;对以10℃-20℃代表的春秋季,越靠近东南沿海地区,日夜均温曲线间差异越大;对以0℃-10℃代表的冬季,位置越偏西北,夜均温持续时间越长且始终高于日均温,由此可以发现在不同的时间尺度下,气候与位置对气温变化的影响方式与影响能力都不相同,因此在分析不同特征对气温的影响有助于后续研究的深入。

本发明的方法不局限于上述各实施例,凡采用等同替换方式得到的技术方案均落在本发明要求保护的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1