一种运用K临近算法进行降水类型分类的方法与流程

文档序号:18269769发布日期:2019-07-27 09:32阅读:271来源:国知局
一种运用K临近算法进行降水类型分类的方法与流程

本发明涉及气象与水文领域,降水类型的分类,具体为一种运用k临近算法进行降水类型分类的方法。



背景技术:

降水可以分为层云性降水和对流性降水,对流性降水系统一般具有强上升速度,小范围和高降水强度的特点,而层云性降水系统具有较弱的上升速度,较大的降水范围和较弱降水强度的特点。

对流型降水和层云型降水具有不同的降水增长机制,二者产生的物理原理也不尽相同。对对流型降水和层云型降水分别讨论和研究,能够更好探究其中的物理机制。

积云系统对于大气的热力平衡也有着十分重要的影响,而热力学差异会导致不同的潜热分布,因此会产生对地球气候不同的影响。积云系统和大气的能量经常通过视热源和视水汽汇进行传递。视热源难以被测量,但是可以通过云的降水量进行估算。传统降水估计采用z-i关系,通过雷达回波强度和降水量之间的关系,由雷达回波强度计算得到估计的降水量。由于不同类型云具有不同的结构和降水增长机制,采用单一的z-i关系不能够很好的对降水进行估计。将降水云分类,对不同种类的云分别采用不同的z-i关系,也有助于提高降水估计的准确度。

天气雷达能够观测到云的三维结构,且雷达的回波反射率因子与降水强度之间有明显的关系。这种关系往往是z=a∙ib的形式,其中z为雷达回波强度,i为降水量,a和b为参数。此外,雷达测量受到液滴尺寸分布变化和垂直空气运动(上升气流和下气流)的影响,特别是在云的对流部分。许多科学家推断出反射率与降雨率之间的关系是高度可变的。这些变化可归因于与不同降水类型(例如对流,层状和过渡阶段)相关的微物理过程的差异。因此理论上可以通过某一位置的雷达回波强度计算出该点的降水强度。研究表明z-i关系对热带雨微物理特性演变的定量依赖性。考虑到两种降水方式的天气系统的气候特征将导致更合适且变化较小的z-i关系。joss,waldvogel.[1990]提出了回波的几个特征来识别雨的特征,从而可以更好地选择z-i关系。austin.[1987]也证明了这些物理因素对z-i关系有效性的影响。最近的研究表明,对流降雨分数与z-i关系选择的敏感性可能相当大。当降雨分类用于雷达降雨估算算法时,雷达雨量计根系平方差异减少了15%。

热带降水测量卫星trmm于1997年发射成功,搭载5种遥感探测仪器,可以识别扫描范围内的降水,同时可以对降水类型进行分类,获得降水系统的三维结构,从而对降水量进行预测,得到5天,30天的降水图。相较于地基降水雷达,热带降水测量卫星trmm可以做到全球范围内观测,提供地面没有雷达覆盖地区的降水资料。soroochian,[2002]应用神经网络技术把微波图像仪和降水雷达资料反演成降水,并进一步得出热带亚热带月平均的每小时降水量日变化形式;root,[2000]把热带降水测量卫星trmm和特种传感器微波成像仪数据加入到多分析过程的数值天气预报模式中,对全球和局地的预报准确性都有改进,利用以上方法他们准确地预报出1999年主要飓风的路径,同时对降水量预报的准确性有所提高;marecal,etal.,[2000]利用热带降水测量卫星trmm资料估计的地表降水率进行四维变分同化试验,他们利用热带降水测量卫星trmm资料进行一次一维变分方法15天预报试验,所有的预报结果都有一定的提高;wentz,etal.,[2000]等人提出用热带降水测量卫星trmm的微波图像仪资料反演海面温度,由于微波在穿透云层和气溶胶时的衰减很小,所以可以得到除了有降水区域以外所有地方的海面温度。利用以上的反演结果发现了1998年的拉尼娜现象和台风过后右侧留下的冷轨迹。

k邻近算法最开始由fix,hodges.[1951]提出,可在拥有已知种类样本的情况下对新加入的未知种类样本进行分类。k临近算法构建出一个训练集用于储存之前具有标签的样本,当有新的未分类样本输入时,计算出新样本和储存各个样本的距离,通过调整参数k,选取离输入样本最近的k个训练样本,新样本的分类标签即为k个训练样本中同种类标签数目最多的标签。k临近算法广泛用于多个行业,相比于传统的分类方法,k临近算法具有可调参数少,操作简单,分类精度高,对异常值不敏感,五数据输入假定等优点。



技术实现要素:

本发明公开了一种运用k临近算法进行降水类型分类的方法,在现有的业务数据预报平台上,实现对降水类型的快速准确划分,改善降水量估计(估测)。

为解决上述问题,本发明的一种运用k临近算法进行降水类型分类的方法,其特征在于:包括如下步骤:

a)选取训练数据集,所述的训练数据集由多个训练样本组成,并确定每个训练样本的分类类型;

b)选取验证样本,所述的验证样本的分类类型已知;

c)计算验证样本与训练数据集中每个训练样本的距离;

d)选取k值,训练数据集中与验证样本距离最近的k个样本的分类类型及为验证样本的分类类型;

e)选取不同的k值,按步骤d)确定在选取不同k值时训练数据集中的训练样本与已知的验证样本的分类类型相同的训练样本的数量,训练数据集中的训练样本与已知的验证样本的分类类型相同的训练样本的数量最多的k值为最佳k值;

f)选取实时样本,计算实时样本与训练数据集中每个训练样本的距离,选取步骤e)确定的最佳k值,训练数据集中与实时样本距离最近的k个训练样本的分类类型即为实时样本的分类类型。

进一步的,所述步骤啊a)的训练样本为选取卫星云类型资料和地基雷达资料在时间空间上对应较好且有明显天气现象发生,如风、云、雾、雨、雪、霜、雷、雹等个例作为训练样本。

进一步的,所述步骤a)-f)的训练样本的具体数据,验证样本的具体数据和实时样本的具体数据为雷达数据中2km高度处回波强度ref2km和垂直积分液态水含量mvil;将卫星资料中降水类型产品2a23产品数据插值至雷达数据网格点上,作为训练样本的分类类型。

进一步的,所述步骤c)的验证样本与训练数据集中每个训练样本的距离和实时样本与训练数据集中每个训练样本的距离为欧式距离。

进一步的,所述步骤c)选取至少一个验证样本组成验证样本集。通过验证样本集中多个验证样本的分类,有效提高最佳k值的分类效果,提高最终分类效果。

进一步的,所述步骤f)选取至少一个实时样本组成实时样本集。

本发明的有益效果是:包括如下步骤,1)选取训练数据集,2)选取验证样本,3)计算验证样本与训练数据集中每个训练样本的距离;4)选取k值,训练数据集中与验证样本距离最近的k个样本的分类类型及为验证样本的分类类型;5)选取不同的k值计算对比,通过不同k值分类结果与热带降水测量卫星trmm卫星降水类型产品资料对比结果的准确率,虚警率等评估标准确定最佳k值。6)选取实时样本,利用确定的最佳k值进行计算对比,确定实时样本的分类类型。本发明基于k邻近算法,使用地基雷达资料和热带降水测量卫星trmm卫星降水类型产品资料对降水类型进行分类,在现有的业务数值预报平台上,实现对降水类型的快速准确划分,改善降水量估测。

附图说明

图1为本发明对飑线过程的一次实验结果图;

图2为本发明对层云过程的一次实验结果图;

图3为本发明对非层云过程的一次实验结果图。

具体实施方式

本发明的一种运用k临近算法进行降水类型分类的方法,具体包括如下步骤:

a)选取训练数据集,所述的训练数据集由多个训练样本组成,并确定每个训练样本的分类类型;选取的训练样本为选取卫星云类型资料在空间上扫描范围和地基雷达资料空间上扫描范围一致,扫描时间相同且有明显天气现象发生,如风、云、雾、雨、雪、霜、雷、雹等个例作为训练样本;

b)选取验证样本,所述的验证样本的分类类型已知;

c)计算验证样本与训练数据集中每个训练样本的距离;验证样本与训练数据集中每个训练样本的距离和实时样本与训练数据集中每个训练样本的距离为欧式距离;

d)选取k值,训练数据集中与验证样本距离最近的k个样本的分类类型及为验证样本的分类类型;

e)选取不同的k值,按步骤d)确定在选取不同k值时训练数据集中的训练样本与已知的验证样本的分类类型相同的训练样本的数量,训练数据集中的训练样本与已知的验证样本的分类类型相同的训练样本的数量最多的k值为最佳k值;

f)选取实时样本,计算实时样本与训练数据集中每个训练样本的距离,选取步骤e)确定的最佳k值,训练数据集中与实时样本距离最近的k个训练样本的分类类型即为实时样本的分类类型。

所述步骤a)-f)的训练样本的具体数据,验证样本的具体数据和实时样本的具体数据为雷达数据中2km高度处回波强度ref2km和垂直积分液态水含量mvil;将卫星资料中降水类型产品2a23产品数据插值至雷达数据网格点上,作为训练样本的分类类型。

所述步骤c)选取至少一个验证样本组成验证样本集。通过验证样本集中多个验证样本的分类,有效提高最佳k值的分类效果,提高最终分类效果。所述步骤f)选取至少一个实时样本组成实时样本集。

为了探究本发明对降水类型分类的实际准确程度,选取2012年7月4日13:25(utc)江苏连云港地区一次飑线过程,2010年6月7日13:47(utc)安徽阜阳地区的一次层云和2007年7月8日01:41(utc)安徽阜阳地区的一次非层云过程过程进行研究。

图1为本发明对飑线过程的一次实验结果图,实验对象为2012年7月4日13:25(utc)江苏连云港地区一次飑线过程,图1(a)为降水雷达pr卫星分类结果,图1(b)为使用本发明得到的分类结果,图1(c)为垂直积分液态水含量mvil图,图1(d)为雷达数据中2km高度处回波强度ref2km图;图1(b),图1(c)和图1(d)中的黑色线条为pr卫星扫描范围边界,在垂直积分液态水含量mvil图和雷达数据中2km高度处回波强度ref2km图中均为高值区,且为多个高值中心排列成为的带状区域,且高值中心中垂直积分液态水含量mvil的最大值大于14kg/m2,雷达数据中2km高度处回波强度ref2km的最大值大于51dbz,因此可以判定为一次飑线过程,而带状的高值中心为对流中心。降水雷达pr卫星将高值中心对应的位置分类为对流型降水,与实际情况比较符合。本发明的分类结果在降水雷达pr卫星扫描范围内与降水雷达pr卫星的相似度比较高,分类为对流型降水的范围和形状与降水雷达pr卫星分类结果基本一致。在降水雷达pr卫星扫描范围之外本发明的分类结果无法通过卫星资料进行验证,通过对比相应位置的垂直积分液态水含量mvil和雷达数据中2km高度处回波强度ref2km值进行分析。本发明的分类为对流型降水的区域,垂直积分液态水含量mvil大于4kg/m2,雷达数据中2km高度处回波强度ref2km大于36dbz,垂直剖面图上没有亮带的特征,因此可以判断为对流型降水区域。从对比图可以看出,采用本发明得到的飑线过程分类结果和pr卫星分类结果具有较好的相似性,且在pr卫星扫描范围之外的分类结果依然可靠。

图2为本发明对层云过程的一次实验结果图,实验对象为2010年6月7日13:47(utc)安徽阜阳地区的一次层云过程,图2(a)为层云过程降水雷达pr卫星分类结果,图2(b)为层云过程使用本发明得到的分类结果,图2(c)为层云过程垂直积分液态水含量mvil图,图2(d)为层云过程雷达数据中2km高度处回波强度ref2km图。在降水雷达pr卫星扫描范围内,均分类为层云性降水,对应的雷达数据中2km高度处回波强度ref2km均小于30dbz,垂直积分液态水含量mvil均小于1.5kg/m2,可以判断为层云,在降水雷达pr卫星扫描范围之外,本发明分类为层云的部分与雷达数据中2km高度处回波强度ref2km和垂直积分液态水含量mvil也有很好的对应。从对比图可以看出,采用本发明得到的层云过程分类结果和pr卫星分类结果具有较好的相似性,且在pr卫星扫描范围之外的分类结果依然可靠。

图3为本发明对非层云过程的一次实验结果图,实验对象为2007年7月8日01:41(utc)安徽阜阳地区的一次非层云过程,图3(a)为非层云过程降水雷达pr卫星分类结果,图3(b)为非层云过程使用本发明得到的分类结果,图3(c)为非层云过程垂直积分液态水含量mvil图,图3(d)为非层云过程雷达数据中2km高度处回波强度ref2km图。在降水雷达pr卫星扫描范围内,mvil图和2km高度处回波强度ref2km图中均存在一个弓形的高值区,高值区中垂直积分液态水含量mvil最大值大于4kg/m2,2km高度处回波强度ref2km的最大值大于36dbz,因此可以判定为有对流发生,该过程为一次非层云过程,弓形的高值中心即为对流中心。降水雷达pr卫星将高值中心对应位置分类为对流型降水,与实际情况比较符合。本发明的分类结果在降水雷达pr卫星扫描范围之内与降水雷达pr卫星的相似度比较高,分类为对流型降水的范围和形状与降水雷达pr卫星的分类结果基本一致。在降水雷达pr卫星扫描范围之外本发明的分类结果无法通过卫星资料进行验证,通过对比相应位置的垂直积分液态水含量mvil和雷达数据中2km高度处回波强度ref2km值进行分析,本发明的分类为对流型降水的区域,垂直积分液态水含量mvil大于4kg/m2,雷达数据中2km高度处回波强度ref2km大于36dbz,垂直剖面图上没有亮带的特征,因此可以判断为对流型降水区域。从对比图可以看出,采用本发明得到的非层云过程分类结果和pr卫星分类结果具有较好的相似性,且在pr卫星扫描范围之外的分类结果依然可靠。

本发明分类的整体结果,用准确率pod,虚警率far,和临界成功指数csi进行评估,计算公式如下:

pod=ns/(ns+nf)

far=nfa/(ns+nfa)

csi=ns/(ns+nf+nfa)

对于某一种类型的降水,ns为分类正确的网格点数,nf为分类错误的网格点数,nfa为误报的网格点数。pod能够反映分类的准确程度,其值越高说明越准确,far能够反映错分类的情况,其值越低说明分类越准确,csi为分类正确的点在所有分类的点中的百分比,值越高分类效果越好。表1为2012年5月至9月江苏省南京市,南通市,徐州市和常州市4部雷达资料和同时间段分类结果结合2a23产品的评估数据,本发明对层云的识别具有很高的pod,且far比较低,因此csi较高;对流型降水的分类结果,pod较高,far较低,csi超过50%,能够对大多数对流型降水进行正确分类。将分类结果与anagnostou.[2004]在文章中使用的传统分类方法对比,可以看出,在层云降水中准确率pod高于shy95和bl00,虚警率far低于shy95和bl00,临界成功指数csi高于shy95和bl00;对流型降水中在虚警率far上较传统方法shy95和bl00提升显著,在准确率pod上差异不大,因此在反映整体分类效果的临界成功指数csi上明显高于shy95和bl00。

表中knn为k临近算法,shy95为shy95降水分类算法,bl00为bl00降水分类算法。

从案例分析和整体分类评估结果都可以看出,本发明对降水类型分类具有较高的准确性,对于不同的降水系统均能够表现出良好的通用性,且本发明在实际应用中可变参数少,操作简单,为目前业务降水量估计(估测)提供良好的可行性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1