一种基于卷积神经网络的云分类方法与流程

文档序号:16136784发布日期:2018-12-01 01:05阅读:493来源:国知局

本发明属于气象领域,特别涉及了一种基于卷积神经网络的云分类方法。

背景技术

云是在不同天气系统演变过程之中形成的,可以预示未来天气变化。云同时是大气辐射系统中重要的组成部分,云覆盖率的改变会影响整个大气辐射的收支平衡,进而对气候系统产生影响(p.duda,minnis,khlopenkov,l.chee,&boeke,2013)。现在对云的研究主要包括卫星和地面观测所获得的数据,但是大尺度的卫星图像很难获得云的详细的信息,因此现在的对云的研究主要集中在地面观测仪器所获的图像(liu&zhang,2016),随着观测仪器的不断发展,如whole-skyimager(wsi)(shields等,2003),total-skyimager(tsi)(pfister等,2003),all-skyimager(asi)(lu等,2004)。这些仪器可以提供连续并且高分辨率的云图,基于这些仪器许多学者在云分类做了许多研究。利用图像纹理测度算法(buch等,1995),局部二值模式(lbp)(ojala,2000),借助自相关和共生矩阵从云图中提取特征(singh&glennen,2005),利用自动分类算法提取光谱特征和一些简单的纹理特征去分类7种不同类别的云(heinle,macke,&srivastav,2010),通过统计颜色的变形去获得纹理和颜色信息(zhuo,cao,&xiao,2014),整合颜色和纹理两种信息在云分类中取得很好的效果(dev,lee,&winkler,2015)。尽管这些工作对云分类起到了推动作用,但是云分类问题还没有得到很好地解决。这些方法中都有一些相同的问题。例如,数据集中样本有限,类别不能包括气象中最基本的十类云,最重要是分类精度较低。近年来,卷积神经网络在其他领域(如人脸识别,图像分类)取得显著的成果,该方法基本结构包括两层,其一为特征提取层,每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征;其二是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性。此外,由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数。卷积神经网络中的每一个卷积层都紧跟着一个用来求局部平均与二次提取的计算层,这种特有的两次特征提取结构减小了特征分辨率。利用该方法不仅有助于提高云分类的准确度,同时也避免了传统的依靠许多经验性的分类误差。根据我们的文献调研,迄今为止,利用深度学习对云进行分类的研究甚少,准确的云分类将对大气数值模式,气候模式中提高模式预报准确度以及具体的业务工作中将产生重要的影响。



技术实现要素:

本发明的目的是克服上述背景技术的不足,提供一种基于多维密集连接卷积神经网络的地基气象云图分类方法,克服了传统神经网络对云图特征利用率不够的缺陷,克服了传统方法分类精度低,不能满足业务气象预报要求,同时也克服了深度学习中卷积神经网络层数加深后计算参数量大,信号传递缓慢的缺陷。为了实现上述技术目的,本发明的技术方案为:所述基于卷积神经网络的云分类方法,基于cloudnet框架,包括如下步骤:

所述基于卷积神经网络的云分类方法,基于alexnet框架,包括如下步骤:

步骤1)删除alexnet框架的conv_3层形成改进的alexnet框架cloudnet模型;

步骤2)使用cloudnet对swimcat数据集与自建的ccsn云图数据集进行训练;

步骤3)将尾迹云作为新的类别加入到已有的swimcat数据集和ccsn数据集的类别;

步骤4)通过对swimcat数据集和ccsn数据集两个数据集中按照训练集与测试集设定的比例进行划分,在深度学习软件包caffe中通过多次训练调整参数,并通过cloudnet模型进行云分类。

所述基于卷积神经网络的云分类方法的进一步设计在于,步骤2)中在数据处理时使用数据增强的方法防止过拟合。

所述基于卷积神经网络的云分类方法的进一步设计在于,步骤4)在caffe训练过程中需要设置每次训练的数量、测试的数量以及是否开启镜像模式、裁剪的尺寸、学习率、学习率的计算、权值衰减的速率以及动量。

所述基于卷积神经网络的云分类方法的进一步设计在于,步骤2)在训练学习过程中,对模型可视化,不断优化网络结构。

所述基于卷积神经网络的云分类方法的进一步设计在于,步骤4)中设定的比例为4:1。

所述基于卷积神经网络的云分类方法的进一步设计在于,ccsn数据集为从网上收集的不同区域不同时间段的特征明显的云图,经过仔细筛选,严格按照世界气象组织提供的标准划分为10类共1110张并统一处理为400*400像素。

所述基于卷积神经网络的云分类方法的进一步设计在于,swimact数据集包含784张云的图像,分为5个明显的类别。

本发明的有益效果为:

(1)与传统的云分类方法(如buch等,1995;singh等,2005;calbó等2008;heinle等,2010;dev等,2015)相比,卷积神经网络可以对云的类别进行准确分类(top-1,91%.top-5,96%),同时在数据集中将地基观测到的尾迹云图做为一个新的类别,扩充了数据量,增加了云分类难度,使该训练好的模型具有很强的泛化能力。

(2)以往的云分类借助于人工统计分析方法(根据云的外貌、颜色、亮度、分布、移动以及云底高等情况),通过采用不同的算法考虑云的纹理特征以及不同的云的类别划分,这些方法具有经验性和耗时费力,还可能产生模棱两可的结果。本项目拟采用卷积神经网络(cnns)采用两种云类别划分标准,通过对模型可视化,选择特征明显的层次,调整网络结构,不断优化网络结构,改进后的结构命名为cloudnet。

(3)通过cloudnet框架在两个数据集上的表现,为基于深度学习进行云分类提供一种可靠的参考标准,同时我们自建的10类云图数据集ccsn公开后也将推动深度学习在云分类的应用。

具体实施方式

下面对本申请作进一步详细的说明。

首先利用深度学习软件包caffe(jia等,2014),对现有模型alexnet的优化后的cloudnet结构,然后通过对两个规模不同数据集(swimcat,ccsn)的训练学习,对模型可视化,不断优化网络结构,调整参数。然后在两个数据集中都加入尾迹云做为新的类别,扩充数据集,提高模型的泛化性,同时能对气象中主要类型的云有不错的分类能力,针对研究路线中的研究内容和拟解决的问题,具体实施方案如下:

本实施例拟将卷积神经网络作为一种新的云分类方法,同时通过对alexnet框架的优化,将极大的提高云分类的准确度。通过两个不同规模云图数据集的测试应用,使该方法在云分类中具有很强的适用性和鲁棒性,具体云分类方案如下:

cloudnet模型

自alex等人在2012年提出alexnet以来卷积神经网络已经取得了长足的发展,其中网络结构设计中都有许多巧妙的设计,利用这个设计可以减少参数量,训练时间,同时能提高分类精度。alexnet总共包括8层,其中前5层为卷积层,后面三层为全连接层。表1为改进后的cloudnet各层中具体参数的设置。其中使用了像修正线性单元(rectifiedlinearunit,relu),dropout,dateaugmentation等方法,其中relu的作用是在神经网络中加入非线性因素,使神经网络能够有效拟合非线性函数;dropout是为了防止过拟合,舍弃一些神经元;数据扩充(dataaugmentation)是通过对云图进行随机的反转、平移、增强对比度等方式增加云图数量。通过对两种数据集的多次训练,并对卷积后的结果进行仔细分析后,其中conv_3、conv_4、conv_5这三层卷积对特征提取的效果不明显,尤其是不易区分尾迹云与其它几种云,因此本实施例对alexnet框架进行了改进,去掉了conv_3层。

表1

设置两个规模不同的数据集,分别为swimact数据集与ccsn数据集。

swimact数据集:该数据集包含784张云的图像,分为5个类别,具体见表2,所有的图像都是125*125像素,这些图像是由新加坡南阳科技大学,经过校准的wahrsis陆基全天空成像仪获得的,利用2013年1月到2014年5月共17个月的云图,新加坡气象局专家为其进行人工分类。

表2swimcat中各类云的数量

ccsn数据集:该数据集是从网上(http://www.clouds-online.com/)收集的不同区域不同时间段的特征明显的云图,经过仔细筛选,严格按照wmo(worldmeteorologicalorganization)提供的标准划分为10类共1110张,然后统一处理为400*400像素。具体见表3。

表3ccsn数据集中各类云的数量

优化两种数据集及具体参数的设置:该方法中使用两种规模不同的数据集,在本实施例中需要将整个数据集划分为测试和训练集,并为每一张云图都赋予标签。表4为swimcat数据集5类共784张云图训练集与测试集的具体划分。由于swimcat数据的5类不能包括现在气象标准中所有云的类型。因此,使用自建的ccsn数据集,其中10类共1110张云图,包括了气象中主要的类型。表5为具体测试集与训练集的具体划分。

线性尾迹云可以单独存在,但通常会出现在自然卷云的周围,与其它类型的云同时存在,因此将尾迹云作为一种新的类别加入到上述两种数据集,不仅仅增加了数据样本数量,同时准确的识别尾迹云将提高尾迹云对气候变化,辐射响应的认识。全面而精准的云分类方法,可以更加提高对各种云类的认识。表6为增加尾迹云后的swimcat数据集的具体划分,表7为增加尾迹云后的ccsn数据集的具体划分。

在caffe训练过程中需要设置每次训练的数量(train_batchsize)、测试的数量(test_batchsize)以及是否开启镜像模式(mirror)、裁剪的尺寸(crop_size)、学习率(base_lr)、学习率的计算(learning_policy)、权值衰减的速率(weight_decay),动量(momentum)等参数。表8为训练过程中两种不同方案参数的具体设置。

表4swimcat训练集与测试集的具体划分

表5ccsn训练集和测试集的具体划分

表6增加尾迹云后的swimcat数据集的具体划分

表7增加尾迹云后的ccsn数据集的具体划分

表8训练过程中两种不同方案参数的设置

本实施例的与传统的云分类方法(如buch等,1995;singh等,2005;calbó等2008;heinle等,2010;dev等,2015)相比,卷积神经网络可以对云的类别进行准确分类(top-1,91%.top-5,96%),同时在数据集中将地基观测到的尾迹云图做为一个新的类别,扩充了数据量,增加了云分类难度,使该方法具有很强的泛化能力,能够对云进行准确的分类。一方面,与以往的云分类方法:借助于人工统计分析方法(根据云的外貌、颜色、亮度、分布、移动以及云底高等情况),采用不同的算法考虑云的纹理特征,以及不同的云的类别划分相比较,传统方法具有经验性和耗时费力,并且依赖于预报员,还可能产生模棱两可的结果。本项目拟采用卷积神经网络(cnns)采用两种云类别划分标准,通过对模型可视化,选择特征明显的层次,调整网络结构,不断优化网络结构,最终在云分类任务上取得不错的效果。另一方面,通过cloudnet框架在两个数据集上的表现,为基于深度学习进行云分类提供一种可靠的参考标准,同时我们自建的10类ccsn云图数据集的公开,将推动深度学习在云分类的研究。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1