一种台站气象数据分区空间拼接拟合方法与流程

文档序号:16745348发布日期:2019-01-28 13:29阅读:350来源:国知局
一种台站气象数据分区空间拼接拟合方法与流程

本发明涉及数据处理技术领域,尤其是涉及一种中国大陆台站气象数据分区空间拼接拟合方法。



背景技术:

随着社会的发展,越来越多领域都开始使用数据分析和数据处理技术。在使用海量数据的很多领域,特别是需要从海量检测设备提取数据的领域,都可能面对部分数据丢失的风险。

气象数据是一种极其典型的海量数据集,气象数据要综合多种数据源的海量数据,其中台站检测到的数据是极其重要的一部分。但是台站由于天气原因或设备故障原因,可能会偶发数据丢失的情况;而有些地区由于各种原因导致未设置台站。由于气象数据都具有空间连续性和时间连续性,因此可以采用插值的方式来估算缺失的数据。但是现有技术中在进行空间插值时计算精度低且运算速度慢的问题。



技术实现要素:

针对当前的进行空间插值时计算精度低且运算速度慢的问题,本发明实施例提出了一种台站气象数据分区空间拼接拟合方法,能够通过社会经济指标、土地利用类型、土地利用类型进行经济社会用水预估。

为了实现上述目的,本发明实施例提供了一种台站气象数据分区空间拼接拟合方法,包括:

步骤1、获取台站的观测数据,其中所述观测数据中包括以下的至少一种:近地面1.5米气温、气压、相对湿度、近地面10米风速、累积降水、日照时数;

步骤2、将中国大陆地区划分为四个区域,且相邻的两个区域的重叠区域具有100公里宽度的重叠区域;该重叠区域同时属于该两个区域;

步骤3、对每一区域内的观测数据进行插值以获取3小时分辨率的观测数据,然后3小时分辨率的观测数据对辅助资料进行修正以获取处理后观测数据,其中每一区域的处理后观测数据具有相同的时间分辨率;

步骤4、将四个区域的处理后观测数据进行拼接以形成完整的国大陆地区的总数据。

进一步的,所述步骤3中的对每一区域内的观测数据进行插值以获取3小时分辨率的观测数据,具体包括:

获取近地面1.5米气温、气压、相对湿度、近地面10米风速、累积降水、日照时数的观测数据,并对日观测数据进行插值以获取3小时分辨率的观测数据;其中插值为其相邻的两个时刻的观测数据的平均值。

进一步的,所述辅助资料为ncep公司的cfsr全球耦合再分析数据,该cfsr全球耦合再分析数据为3小时分辨率的再分析数据。

进一步的,对于近地面1.5米气温、气压、近地面10米风速的每一观测数据,将其对应的3小时分辨率的辅助资料减去该辅助数据的日平均值,并加上对应的插值后的3小时分辨率的观测数据,作为近地面1.5米气温、气压、近地面10米风速的处理后观测数据。

进一步的,对于相对湿度、日照时数的每一观测数据,将其对应的3小时分辨率的辅助资料除以该辅助数据的日平均值,并乘以对应的插值后的3小时分辨率的观测数据,作为相对湿度、日照时数的处理后观测数据。

进一步的,所述步骤4还包括:

如果经纬线的格点位于两个区域的重叠区域内,且该格点在两个区域内具有不同的插值,则获取该格点与两个区域的边界的距离,并将其中距离较短的一个区域的插值作为该格点的插值。

本发明的技术方案具有以下优势:上述方案提出了一种台站气象数据分区空间拼接拟合方法,能够将分区后的台站的观测数据进行插值,然后再进行拼接。上述方案解决了台站数据在空间上插值计算精度不高、运算较慢问题。

附图说明

通过下面结合附图对本发明的一个优选实施例进行的描述,本发明的技术方案及其技术效果将变得更加清楚,且更加易于理解。其中:

图1为本发明实施例的流程图;

图2为分区域的示意图。

具体实施方式

以下将结合所附的附图对本发明的一个优选实施例进行描述。

如图1所示的,本发明实施例的台站气象数据分区空间拼接拟合方法具体包括:

步骤1、获取台站的观测数据,其中所述观测数据中包括以下的至少一种:近地面1.5米气温、气压、相对湿度、近地面10米风速、累积降水、日照时数;

步骤2、将中国大陆地区划分为四个区域,且相邻的两个区域的重叠区域具有100公里宽度的重叠区域;该重叠区域同时属于该两个区域;

步骤3、对每一区域内的观测数据进行插值以获取3小时分辨率的观测数据,然后3小时分辨率的观测数据对辅助资料进行修正以获取处理后观测数据,其中每一区域的处理后观测数据具有相同的时间分辨率;

步骤4、将四个区域的处理后观测数据进行拼接以形成完整的国大陆地区的总数据。

其中,所述步骤3具体包括:

获取近地面1.5米气温、气压、相对湿度、近地面10米风速、累积降水、日照时数的观测数据,并对日观测数据进行插值以获取3小时分辨率的观测数据;其中插值为其相邻的两个时刻的观测数据的平均值;

所述辅助资料为ncep公司的cfsr全球耦合再分析数据,该cfsr全球耦合再分析数据为3小时分辨率的再分析数据。

对于近地面1.5米气温、气压、近地面10米风速的每一观测数据,将其对应的3小时分辨率的辅助资料减去该辅助数据的日平均值,并加上对应的插值后的3小时分辨率的观测数据,作为近地面1.5米气温、气压、近地面10米风速的处理后观测数据;

对于相对湿度、日照时数的每一观测数据,将其对应的3小时分辨率的辅助资料除以该辅助数据的日平均值,并乘以对应的插值后的3小时分辨率的观测数据,作为相对湿度、日照时数的处理后观测数据。

如果经纬线的格点位于两个区域的重叠区域内,且该格点在两个区域内具有不同的插值,则获取该格点与两个区域的边界的距离,并将其中距离较短的一个区域的插值作为

具体来说,本发明实施例采用了来自于中国气象局(chinameteorologicaladministration,cma)气象信息中心常规气象要素740台站的观测数据(其中2007-2010年的产品是在nmic计算完成)。涉及的观测变量有:近地面1.5米气温、气压、相对湿度、近地面10米风速、累积降水、日照时数。

由于国家气象信息中心(nationalmeteorologicalinformationcenterofchina,nmic)提供的观测数据是经过质量控制的并且误差控制在2%以内。为了计算更准确也更方便,本发明实施例中基于地形和站点观测密度的因素考虑,将中国大陆地区如图2所示的分成四个分区:1区、2区、3区、4区。其中,在两个区交叉的区域有100公里宽度的重叠区域。

这套观测数据的不同变量在不同时段的观测频次也不同:其中降水和日照时数这两个变量在整个1958-2010年驱动数据的制备过程中是日观测数据。而对于近地面气温、相对湿度、风速和气压的观测数据,1958-1989年是日尺度观测;1990-1997年是6小时频率的观测;1998-2010年的观测资料是3小时频率。由此可见所有台站观测数据的颗粒度不同。

此外,中国地区的近地面气温、相对湿度、风速和气压的台站观测数据在1998-2006年期间虽然是3小时观测,但是各时刻之间的观测数量很不均匀;即:一天中的3、9、15、21时的观测数据量比0、6、12、18时的数据量少。由此可见所有台站观测数据之间有缺失。

本发明实施例利用薄板平滑样条模型的理论来将这个时间段3,9,15,21时刻的观测补全。

本发明实施例中应用ncepcfsr再分析资料中的近地面气温、相对湿度、风速和气压变量的3小时分辨率的数据;其中0、6、12、18时是用再分析数据,而3、9、15、21是用的预报数据。ncepcfsr资料是ncep最新的一套全球耦合再分析数据,发展该数据集的主要目标就是为大气、海洋、陆地和海冰模式提供初始场。

cfsr再分析资料中的大气变量的空间分辨率为0.3125×0.3125(约38km),37个气压层,时间覆盖范围是1979-2011,同化的时间间隔是6小时并且有逐小时的预报产品。cfsr资料在整个时间段内都对卫星观测的辐射率进行了同化,这是ncep首次将卫星辐射率直接同化进它的全球再分析产品中;cfsr资料采用的模式分辨率是t382,水平分辨率约为38公里,垂直分层是64层等面,最高0.266hpa,相比于ncep之前的模式有较大的提高;cfsr在产生6小时初猜场时还耦合了海洋模式,并加入了交互的海冰模式,在辐射的参数化方案中考虑了co2、气溶胶和其它痕量气体的变化;cfsr的陆面模块采用noah陆面模式。

本发明实施例用到了1979-2010年cfsr数据集中的近地面气温、气压、相对湿度、风速和降水变量。

在某些情况下,观测资料只是一日4次,即0、6、12、18世界时。这样只能在这4个时刻之间进行插值。这时其它4个时刻3、9、15、21世界时的驱动场将估计为他们的相邻时刻的驱动场的平均。

如果只存在日平均观测资料,本发明实施例只能得到插值的日资料。这时本发明实施例用插值的日资料去订正某个3小时的辅助资料,以达到时间降尺度的目的。这个辅助资料视情况可以是cfsr再分析资料、princeton大气驱动资料、gewexsrb下行短波辐射资料等等。

其中,对气温、气压、风速和辐射等变量,将3小时的辅助资料减去它的日平均再加上插值的日资料;对降水和湿度等变量,将3小时的辅助资料除以它的日平均再乘以插值的日资料。这样订正后的辅助资料的日平均与插值的日资料相等。

在进行插值后,需要将四个区域的数据进行拼接。

如果一个区域中的数据较多,用薄板样条函数(thinplatesplines)拟合该区域的数据计算量会较大。本发明实施例将中国地区分别划分为多个区域,并使相邻的区域的边界有100公里的重合地带,具体如图2所示的。

本发明实施例中,首先对每一个区域分别进行空间插值,然后再将各个区域的插值结果进行拼接。

本发明实施例分区的第一个目的是使区域的观测数少于800,这主要是为了减少薄板样条函数拟合数据的计算量;第二个目的是使区域内的观测尽量分布均匀;第三个目的是使区域的边界尽量规范化,特别是所有的边界都在经纬线上。

如果不对全国进行分区,则对全国都应用同一个薄板样条函数的光滑参数λ;这显然不太合理。而分区可以对不同的观测密度采用不同的光滑参数,从而减少了误差。

若格点处于两个区域的重合部分,则按照点到两个区域边界距离的比例对两个区域中的插值进行加权平均。说的更直观些,假定某格点同时落在区域1和区域2的重合地带,并在区域1和区域2中存在两个不同的插值;如果格点靠区域1的边界比靠区域2的边界更近,则对区域1的插值权重更小,而对区域2的插值权重大,反之亦然。

对于所属技术领域的技术人员而言,随着技术的发展,本发明构思可以不同方式实现。本发明的实施方式并不仅限于以上描述的实施例,而且可在权利要求的范围内进行变化。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1