本发明属于气象领域,特别涉及了一种基于卷积神经网络的云分类方法。
背景技术
云是在不同天气系统演变过程之中形成的,可以预示未来天气变化。云同时是大气辐射系统中重要的组成部分,云覆盖率的改变会影响整个大气辐射的收支平衡,进而对气候系统产生影响(p.duda,minnis,khlopenkov,l.chee,&boeke,2013)。现在对云的研究主要包括卫星和地面观测所获得的数据,但是大尺度的卫星图像很难获得云的详细的信息,因此现在的对云的研究主要集中在地面观测仪器所获的图像(liu&zhang,2016),随着观测仪器的不断发展,如whole-skyimager(wsi)(shields等,2003),total-skyimager(tsi)(pfister等,2003),all-skyimager(asi)(lu等,2004)。这些仪器可以提供连续并且高分辨率的云图,基于这些仪器许多学者在云分类做了许多研究。利用图像纹理测度算法(buch等,1995),局部二值模式(lbp)(ojala,
技术实现要素:
本发明的目的是克服上述背景技术的不足,提供一种基于多维密集连接卷积神经网络的地基气象云图分类方法,克服了传统神经网络对云图特征利用率不够的缺陷,克服了传统方法分类精度低,不能满足业务气象预报要求,同时也克服了深度学习中卷积神经网络层数加深后计算参数量大,信号传递缓慢的缺陷。为了实现上述技术目的,本发明的技术方案为:所述基于卷积神经网络的云分类方法,基于cloudnet框架,包括如下步骤:
所述基于卷积神经网络的云分类方法,基于alexnet框架,包括如下步骤:
步骤1)删除alexnet框架的conv_3层形成改进的alexnet框架cloudnet模型;
步骤2)使用cloudnet对swimcat数据集与自建的ccsn云图数据集进行训练;
步骤3)将尾迹云作为新的类别加入到已有的swimcat数据集和ccsn数据集的类别;
步骤4)通过对swimcat数据集和ccsn数据集两个数据集中按照训练集与测试集设定的比例进行划分,在深度学习软件包caffe中通过多次训练调整参数,并通过cloudnet模型进行云分类。
所述基于卷积神经网络的云分类方法的进一步设计在于,步骤2)中在数据处理时使用数据增强的方法防止过拟合。
所述基于卷积神经网络的云分类方法的进一步设计在于,步骤4)在caffe训练过程中需要设置每次训练的数量、测试的数量以及是否开启镜像模式、裁剪的尺寸、学习率、学习率的计算、权值衰减的速率以及动量。
所述基于卷积神经网络的云分类方法的进一步设计在于,步骤2)在训练学习过程中,对模型可视化,不断优化网络结构。
所述基于卷积神经网络的云分类方法的进一步设计在于,步骤4)中设定的比例为4:1。
所述基于卷积神经网络的云分类方法的进一步设计在于,ccsn数据集为从网上收集的不同区域不同时间段的特征明显的云图,经过仔细筛选,严格按照世界气象组织提供的标准划分为10类共1110张并统一处理为400*400像素。
所述基于卷积神经网络的云分类方法的进一步设计在于,swimact数据集包含784张云的图像,分为5个明显的类别。
本发明的有益效果为:
(1)与传统的云分类方法(如buch等,1995;singh等,2005;calbó等2008;heinle等,2010;dev等,2015)相比,卷积神经网络可以对云的类别进行准确分类(top-1,91%.top-5,96%),同时在数据集中将地基观测到的尾迹云图做为一个新的类别,扩充了数据量,增加了云分类难度,使该训练好的模型具有很强的泛化能力。
(2)以往的云分类借助于人工统计分析方法(根据云的外貌、颜色、亮度、分布、移动以及云底高等情况),通过采用不同的算法考虑云的纹理特征以及不同的云的类别划分,这些方法具有经验性和耗时费力,还可能产生模棱两可的结果。本项目拟采用卷积神经网络(cnns)采用两种云类别划分标准,通过对模型可视化,选择特征明显的层次,调整网络结构,不断优化网络结构,改进后的结构命名为cloudnet。
(3)通过cloudnet框架在两个数据集上的表现,为基于深度学习进行云分类提供一种可靠的参考标准,同时我们自建的10类云图数据集ccsn公开后也将推动深度学习在云分类的应用。
具体实施方式
下面对本申请作进一步详细的说明。
首先利用深度学习软件包caffe(jia等,2014),对现有模型alexnet的优化后的cloudnet结构,然后通过对两个规模不同数据集(swimcat,ccsn)的训练学习,对模型可视化,不断优化网络结构,调整参数。然后在两个数据集中都加入尾迹云做为新的类别,扩充数据集,提高模型的泛化性,同时能对气象中主要类型的云有不错的分类能力,针对研究路线中的研究内容和拟解决的问题,具体实施方案如下:
本实施例拟将卷积神经网络作为一种新的云分类方法,同时通过对alexnet框架的优化,将极大的提高云分类的准确度。通过两个不同规模云图数据集的测试应用,使该方法在云分类中具有很强的适用性和鲁棒性,具体云分类方案如下:
cloudnet模型
自alex等人在2012年提出alexnet以来卷积神经网络已经取得了长足的发展,其中网络结构设计中都有许多巧妙的设计,利用这个设计可以减少参数量,训练时间,同时能提高分类精度。alexnet总共包括8层,其中前5层为卷积层,后面三层为全连接层。表1为改进后的cloudnet各层中具体参数的设置。其中使用了像修正线性单元(rectifiedlinearunit,relu),dropout,dateaugmentation等方法,其中relu的作用是在神经网络中加入非线性因素,使神经网络能够有效拟合非线性函数;dropout是为了防止过拟合,舍弃一些神经元;数据扩充(dataaugmentation)是通过对云图进行随机的反转、平移、增强对比度等方式增加云图数量。通过对两种数据集的多次训练,并对卷积后的结果进行仔细分析后,其中conv_3、conv_4、conv_5这三层卷积对特征提取的效果不明显,尤其是不易区分尾迹云与其它几种云,因此本实施例对alexnet框架进行了改进,去掉了conv_3层。
表1
设置两个规模不同的数据集,分别为swimact数据集与ccsn数据集。
swimact数据集:该数据集包含784张云的图像,分为5个类别,具体见表2,所有的图像都是125*125像素,这些图像是由新加坡南阳科技大学,经过校准的wahrsis陆基全天空成像仪获得的,利用2013年1月到2014年5月共17个月的云图,新加坡气象局专家为其进行人工分类。
表2swimcat中各类云的数量
ccsn数据集:该数据集是从网上(http://www.clouds-online.com/)收集的不同区域不同时间段的特征明显的云图,经过仔细筛选,严格按照wmo(worldmeteorologicalorganization)提供的标准划分为10类共1110张,然后统一处理为400*400像素。具体见表3。
表3ccsn数据集中各类云的数量
优化两种数据集及具体参数的设置:该方法中使用两种规模不同的数据集,在本实施例中需要将整个数据集划分为测试和训练集,并为每一张云图都赋予标签。表4为swimcat数据集5类共784张云图训练集与测试集的具体划分。由于swimcat数据的5类不能包括现在气象标准中所有云的类型。因此,使用自建的ccsn数据集,其中10类共1110张云图,包括了气象中主要的类型。表5为具体测试集与训练集的具体划分。
线性尾迹云可以单独存在,但通常会出现在自然卷云的周围,与其它类型的云同时存在,因此将尾迹云作为一种新的类别加入到上述两种数据集,不仅仅增加了数据样本数量,同时准确的识别尾迹云将提高尾迹云对气候变化,辐射响应的认识。全面而精准的云分类方法,可以更加提高对各种云类的认识。表6为增加尾迹云后的swimcat数据集的具体划分,表7为增加尾迹云后的ccsn数据集的具体划分。
在caffe训练过程中需要设置每次训练的数量(train_batchsize)、测试的数量(test_batchsize)以及是否开启镜像模式(mirror)、裁剪的尺寸(crop_size)、学习率(base_lr)、学习率的计算(learning_policy)、权值衰减的速率(weight_decay),动量(momentum)等参数。表8为训练过程中两种不同方案参数的具体设置。
表4swimcat训练集与测试集的具体划分
表5ccsn训练集和测试集的具体划分
表6增加尾迹云后的swimcat数据集的具体划分
表7增加尾迹云后的ccsn数据集的具体划分
表8训练过程中两种不同方案参数的设置
本实施例的与传统的云分类方法(如buch等,1995;singh等,2005;calbó等2008;heinle等,2010;dev等,2015)相比,卷积神经网络可以对云的类别进行准确分类(top-1,91%.top-5,96%),同时在数据集中将地基观测到的尾迹云图做为一个新的类别,扩充了数据量,增加了云分类难度,使该方法具有很强的泛化能力,能够对云进行准确的分类。一方面,与以往的云分类方法:借助于人工统计分析方法(根据云的外貌、颜色、亮度、分布、移动以及云底高等情况),采用不同的算法考虑云的纹理特征,以及不同的云的类别划分相比较,传统方法具有经验性和耗时费力,并且依赖于预报员,还可能产生模棱两可的结果。本项目拟采用卷积神经网络(cnns)采用两种云类别划分标准,通过对模型可视化,选择特征明显的层次,调整网络结构,不断优化网络结构,最终在云分类任务上取得不错的效果。另一方面,通过cloudnet框架在两个数据集上的表现,为基于深度学习进行云分类提供一种可靠的参考标准,同时我们自建的10类ccsn云图数据集的公开,将推动深度学习在云分类的研究。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。