一种基于支持向量机的海雾识别方法与流程

文档序号:20953552发布日期:2020-06-02 20:16阅读:482来源:国知局
一种基于支持向量机的海雾识别方法与流程

本发明属于气象预测技术领域,具体涉及一种基于支持向量机的海雾识别方法。



背景技术:

海雾是指发生在海上、岸滨和岛屿上空低层大气中,由于水汽凝结而产生的大量水滴或冰晶使得水平能见度小于1km的危险性天气。海雾引起的能见度下降对船舶航行有严重的影响,是引发海上和沿海地区多种事故的重要原因。海雾的运动和登陆对沿海地区也有重要影响,容易造成航班延误、列车晚点,甚至造成航班起降事故、高速公路交通事故等严重后果。海雾对海上及沿海地区生产、生活造成了严重影响,因此有必要对海雾进行准确的识别和监测。

常规的海雾监测方法是通过在陆海表面布设站点进行人工或仪器自动观测,不仅耗费大量的人力物力,而且观测站点的密度也难以满足监测的需要,特别是在海洋上,只有极少数甚至没有观测站点。与站点监测相比,气象卫星观测资料具有覆盖范围广、时空分辨率高的特点,使得其在监测雾的生消动态方面具有独特的优势。因此,研究基于卫星观测数据的海雾识别方法有重要意义。

传统的基于卫星数据的海雾识别方法以阈值法为主,主要通过对卫星通道值的统计分析,确定海雾区域的通道阈值或双通道差阈值,从而将海雾与云、海面等目标区分开来,实现识别海雾的目的。

随着卫星观测技术的不断进步,卫星搭载的传感器具备的通道数越来越多,统计分析方法在寻找高维阈值方面的局限性逐渐体现出来,海雾识别的准确率受到较大的限制。因此,如何在海雾识别问题中应用适合解决高维阈值问题的新方法,对提高海雾识别准确率非常重要。

近年来,人工神经网络、支持向量机等机器学习算法在图像分类中取得了较大的进展,越来越多的被应用于遥感图像识别等气象问题的研究中。支持向量机(supportvectormachine,svm)是在统计学习理论的基础上发展成的一种新的模式识别方法,其在解决小样本、非线性及高维模式识别问题上表现出统计方法和传统的神经网络所不具备的优势,并能够推广到函数拟合、分类等机器学习问题中。支持向量机的基本思想是:通过非线性变换将输入空间变换到一个高维空间,在这个高维空间中求取最优分类面,这种非线性变换是通过定义适当的满足mercer条件的内积核函数实现的。



技术实现要素:

本发明提供了一种结构风险小,适合样本量要求低的学习问题,并且最终的决策函数只由少数的支持向量确定,避免了维数灾难的一种基于支持向量机的海雾识别方法。

具体而言本发明提供了一种基于支持向量机的海雾识别方法,其特征在于,所述海雾识别方法包括以下步骤:

步骤s1:在一段时间内,获取卫星通道圆盘投影数据x0和船舶观测原始数据y0;

步骤s2:对所述卫星通道圆盘投影数据x0和船舶观测原始数据y0进行解码,获取卫星通道格点数据x和能见度观测数据y及对应时次的船舶位置信息;

步骤s3:对所述卫星通道格点数据x进行标准化处理获取卫星通道标准化数据xstd;对所述能见度数据y进行有雾/无雾的二值化处理获取观测点能见度二值化数据ystd;

步骤s4:将对应时间、位置的所述卫星通道格点标准化数据xstd与所述能见度数据ystd进行融合,生成训练和测试样本集,并对支持向量机模型进行训练;

步骤s5:通过训练过的所述支持向量机模型对待检测的数据进行海雾识别。

更进一步地,在步骤s2中,对所述卫星通道圆盘投影数据x0进行解码采用通过像素点在以卫星为原点的坐标系中的位置和地球的赤道半径和极半径,根据几何原理推算出该像素点的经纬度坐标,进而获取出该像素点在圆盘图的经纬度信息,并插值到等间距的经纬度格点上,得到所述卫星通道格点数据x。

更进一步地,在步骤s2中,对所述船舶观测原始数据y0进行解码从所述船舶观测原始数据y0提取所述能见度观测数据y及对应时次的船舶位置信息。

更进一步地,在步骤s3中,还包括以下步骤:

步骤s31:分别提取卫星各通道数据的最大值的经验常量xmax和最小值的经验常量xmin

步骤s32:采用最大值最小值的标准化方法分别对16个通道的所述卫星通道数据x进行标准化处理:

公式中,xstd是卫星通道标准化数据,x是卫星通道格点数据,xmax是卫星通道格点数据最大值的经验常量,xmin是卫星通道格点数据最小值的经验常量。

更进一步地,步骤s4中,还包括以下步骤:

步骤s41:对给定的时刻t,选取t时刻的所述能见度ystd和对应的经纬度坐标(lon,lat),共n组;

步骤s42:选取t时刻的16个所述卫星通道标准化数据xstd;

步骤s43:对步骤s41中筛选出的n组所述能见度ystd和对应的经纬度坐标(lon,lat)数据,分别读取t时刻16个所述卫星通道标准化数据xstd中距离坐标(lon,lat)最近的格点的数值,组成特征量f;

步骤s44:对样本集中的所有时刻t,重复步骤s41-步骤s43,得到与所述能见度ystd对应的特征集f;

步骤s45:将特征集f分为训练样本和验证样本,其中训练样本包括有雾或无雾的标签,而验证样本不包括有雾或无雾的标签;

步骤s46:将所述训练样本输入支持向量机模型进行训练,并通过所述验证样本检验所述支持向量机模型训练准确程度。

更进一步地,步骤s5中,还包括以下步骤:

步骤s51:将低维的卫星通道标准化数据xstd∈rn,通过核函数k(xstd,xi)映射到高维空间eh,并在h中构建最优超平面;

步骤s52:在高维空间rh最优超平面中构建线性函数:

步骤s53:通过对所述线性函数通过阶跃函数计算,并对输出结果进行判决。

更进一步地,步骤s51中,所述映射与核函数k(xstd,xi)模型为:

f(xstd)=w·k(xstd,xi)+b

公式中,w是线性函数的斜率,b是线性函数的截距。

更进一步地,步骤s52中,所述线性函数是:

f(xstd)=w·k(xstd,xi)+b

公式中,w是线性函数的斜率,b是线性函数的截距。

更进一步地,步骤s53中,所述对输出结果的判决为:

ystd=sgn(f(xstd))

公式中,sgn是阶跃函数;若ystd=1,则判定为有雾;ystd=0,则判定为无雾。

本发明的有益效果是:

本发明采用新一代静止气象卫星葵花8号作为模型输入数据;与现有技术中使用较多的goes、mtsat、fy-2等卫星相比,葵花8号卫星具备更全的通道和更高的空间分辨率(2km),可以获得更加精细的识别结果。同时,针对现有技术中传统阈值法识别准确率低的问题,提出基于支持向量机的海雾识别技术。与现有技术中传统的阈值法相比,支持向量机在解决小样本、非线性、高维模式识别问题上具备较大优势,可提高卫星识别海雾的准确率。

附图说明

图1是本发明实施例提供的一种基于支持向量机的海雾识别方法的流程示意图;

图2是本发明实施例提供的一种基于支持向量机的海雾识别方法中卫星圆盘投影坐标示意图;

图3是本发明实施例提供的一种基于支持向量机的海雾识别方法中标准化的卫星通道数据部分样本示意图;

图4是本发明实施例提供的一种基于支持向量机的海雾识别方法中二值化后的船舶观测能见度数据部分样本示意图;

图5是本发明实施例提供的一种基于支持向量机的海雾识别方法中我国东南沿海地区海雾识别结果示意图。

具体实施方式

下面通过实施例,并结合附图1-5,对本发明的技术方案作进一步具体的说明。

如附图1所示,本发明的目的是提供了一种基于支持向量机的海雾识别方法,包括如下步骤:

步骤s1:在一段时间内,获取卫星通道圆盘投影数据x0和船舶观测原始数据y0;

步骤s2:对卫星通道圆盘投影数据x0和船舶观测原始数据y0进行解码,获取卫星通道格点数据x和能见度观测数据y及对应时次的船舶位置信息;

步骤s3:对卫星通道格点数据x进行标准化处理获取卫星通道标准化数据xstd;对能见度数据y进行有雾/无雾的二值化处理获取观测点能见度二值化数据ystd;

步骤s4:将对应时间、位置的卫星通道格点标准化数据xstd与能见度数据ystd进行融合,生成训练和测试样本集,并对支持向量机模型进行训练;

步骤s5:通过训练过的支持向量机模型对测试样本集进行海雾识别。

在步骤s1中,从葵花8号卫星获取卫星通道圆盘投影数据x0;从国际海洋气象综合数据库(icoads)获取船舶观测原始数据y0,船舶观测原始数据y0包括观测点的坐标、能见度和观测时间。

如附图2所示,在步骤s2中,数据解码还包括以下步骤:

步骤s21:对葵花8号静止卫星所提供的16通道圆盘投影数据进行解码。

具体的,通过像素点在以卫星为原点的坐标系中的位置和地球的赤道半径和极半径,根据几何原理推算出该像素点的经纬度坐标,进而获取出该像素点在圆盘图的经纬度信息,并插值到等间距的经纬度格点上,得到卫星通道格点数据x。卫星通道格点数据x是一个二维矩阵,二维矩阵中每个位置的数值代表对应位置经纬度格点的卫星采集到的地表辐射值数据;由于卫星提供16通道的数据,二维矩阵中每个位置有16个数值(或理解为16个二维矩阵)分别对应每一个卫星通道。

步骤s22:从国际海洋气象综合数据库(icoads)船舶观测原始数据y0中提取能见度观测数据y及对应时次的船舶位置(经纬度)信息。

如图3-4所示,在步骤s3中,数据标准化处理还包括以下步骤:

步骤s31:分别提取卫星各通道数据的最大值的经验常量xmax和最小值的经验常量xmin。

步骤s32:采用最大值最小值的标准化方法分别对16个通道的卫星通道数据x进行标准化处理:

公式中,xstd是卫星通道标准化数据,x是卫星通道格点数据,xmax是卫星通道格点数据最大值的经验常量,xmin是卫星通道格点数据最小值的经验常量。

步骤s33:按icoads数据说明文档中对能见度记录的规定,设定阈值th,本发明中取th=93为有无海雾的阈值,将船舶观测能见度数据按以下公式进行二值化处理:

公式中,y是观测点能见度观测数据,ystd是观测点能见度二值化数据。

在步骤s4中,数据融合包括:

步骤s41:对给定的时刻t,选取t时刻的观测点能见度二值化数据ystd和对应的经纬度坐标(lon,lat),共n组;其中,n是由国际海洋气象综合数据库(icoads)中获取的船舶观察点数,每获取一搜船舶观察数据即增加一组观测点能见度二值化数据ystd和对应的经纬度坐标(lon,lat);

步骤s42:选取t时刻的16个卫星通道标准化数据xstd;

步骤s43:对步骤s41中筛选出的n组观测点能见度二值化数据ystd和对应的经纬度坐标(lon,lat)数据,分别读取t时刻葵花8号卫星16个卫星通道标准化数据xstd中距离坐标(lon,lat)最近的格点的数值,组成特征量f;

步骤s44:对样本集中的所有时刻t,重复步骤s41-步骤s43,得到与观测点能见度二值化数据ystd对应的特征集f;

步骤s45:将特征集f分为训练样本和验证样本,其中训练样本包括有雾或无雾的标签,而验证样本不包括有雾或无雾的标签;

步骤s46:将训练样本输入支持向量机模型进行训练,并通过验证样本检验支持向量机模型训练准确程度。

在步骤s5中,基于卫星多通道数据的海雾识别存在海雾标签样本少、特征维度高等问题,属于小样本、高维度的模式识别问题;支持向量机在解决此类高维模式识别问题上具备较大优势。因此,本发明选用支持向量机模型进行海雾识别。

支持向量机模型对海雾进行识别还包括以下步骤:

步骤s51:将待检测的低维卫星通道标准化数据xstd∈rn,通过核函数k(xstd,xi)映射到高维空间rh

(φ(xstd),φ(xi))=k(xstd,xi)

公式中,φ是特征映射;xi是支持向量,由支持向量机模型训练获得。

并在h中构建最优超平面;

步骤s52:在高维空间rh最优超平面中构建线性函数:

f(xstd)=w·k(xstd,xi)+b

公式中,w是线性函数的斜率,b是线性函数的截距。

步骤s53:对输出结果进行判决:

ystd=sgn(f(xstd))

公式中,sgn是阶跃函数;若ystd=1,则判定为有雾;ystd=0,则判定为无雾。

在一种实施例中,为验证模型鲁棒性和识别准确率,用独立的实测数据集对模型进行验证。独立测试集采用随机抽取的方法确定,共包含4200组样本,其中有雾样本1200个,无雾样本3000个。测试结果中对有雾样本进行识别,得出识别有雾结果1013个,识别无雾结果187个;对无雾样本进行识别,得出识别有雾结果362个,识别无雾结果2638个。

测试结果表明,准确率虚警率

如图5所示,在另一种实施例中,本发明中支持向量机模型对我国东南沿海地区海雾的识别的结果。由此个例可见,本发明能对中国沿海地区海雾进行有效的识别。

虽然本发明已经以较佳实施例公开如上,但实施例并不是用来限定本发明的。在不脱离本发明之精神和范围内,所做的任何等效变化或润饰,同样属于本发明之保护范围。因此本发明的保护范围应当以本申请的权利要求所界定的内容为标准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1