一种基于支持向量机分类树的地基云图识别方法

文档序号:6436786阅读:250来源:国知局
专利名称:一种基于支持向量机分类树的地基云图识别方法
技术领域
本发明属于模式识别领域,具体涉及利用多种特征及基于支持向量机的分类树对地基云图进行识别的方法。
背景技术
云在大气辐射传输中扮演着重要的角色,云的形态、分布、数量及其变化标志着大气运动的状况。因此,实现云的自动定量观测对于天气预报、飞行保障有着重要的意义。目前人们普遍使用的方法是利用气象卫星得到的卫星云图对云团种类进行识别,由专家对卫星云图上的云团情况进行解释后再配合其它预报工具使用。这种人工分析的方法具有一定程度上的主观性,且效率较低,因此难免漏掉许多有用信息,容易产生错判误判。相比于传统卫星云图的大范围、大尺度的分布特点,地基可见光云图的观测范围较小,能够反映出云块大小、排列方式以及云的高低分布等局部分布信息,且其纹理信息更为丰富,有利于人们采用相应的纹理特征对其进行分类识别,从而进行短时、小范围的天气预报。国际上通常将云分为十属四种云,云的类别多,合混度大,因此如何解决多类云图分类识别并满足一定的分类精度,是当前陆基可见光云图分类研究中的一个关键问题。在目前的云图分类应用中,采用较多的方法有多谱阈值法、神经网络法、聚类分析法等;所采用的特征有灰度共生矩阵、灰度-梯度共生矩阵、基于Gabor滤波的均值方差等。 其中,灰度共生矩阵和灰度-梯度共生矩阵只对图像在空间域的特性进行分析,而Gabor的均值方差统计量过于简单。更为重要的是,这些工作都只采用了单一的特征,没有考虑到云图的复杂性和不同类别之间的差异性,所以分类能力有限。目前较为常用的分类器有K均值聚类法、贝叶斯分类器、神经网络等。其中K均值聚类法容易受到类别初始中心选择的影响;贝叶斯法则需要知道各类别的先验概率等因素,而这些因素在实际情况中往往不可预知;神经网络法则存在训练速度慢,当样本类别较多时分类准确率较低等缺点。

发明内容
本发明的目的在于提出一种基于支持向量机分类树的地基云图识别方法,使用支持向量机作为分类器,并对其进行集成从而进行分类,该方法能达到较高的分类准确率。实现本发明目的所采用的具体技术方案为一种基于支持向量机的分类树的陆基云图分类方法,包括以下步骤(1)在参考云图上截取若干子块作为训练样本;0)Gab0r滤波器组参数选择,将图像在频率域分解为S个尺度和T个角度,使用所得滤波器组对所有训练样本进行滤波,得到训练样本的滤波图像集合,记为P ;(3)从P中提取任一训练样本的排序直方谱特征向量或感兴趣算子特征向量,得到提取特征后的训练样本集合,记为F ;(4)对每一类别中的训练样本进行有监督聚类,得到新的训练样本集合F'。
(5)基于SVM分类树模型的建立。利用训练样本集合F'进行训练,解算出分类树各层分类器的参数,并确定分类树不同层之间的分类规则;(6)按照(3)的步骤,对检验样本提取相应排序直方谱特征向量和感兴趣算子特征向量,得到检验样本特征向量集合,记为T';(7)利用( 中训练好的分类树模型对T'中的样本进行分类,得到相应的分类结果;本发明采用Gabor分析方法,通过提取合适的反映图像纹理信息的多维特征向量,并采用有监督聚类方法选择合适的训练样本,使用非线性变换将样本特征空间的划分问题转换为高维特征空间的线性分类问题,利用有限的支持向量点的线性组合建立分类决策函数并建立相应的分类树。试验结果表明该方法计算速度快,分类准确率较高。本发明对空间域和频率域同时进行分析,因此能够获取更多有助于分类的图像纹理信息;计算排序直方谱特征向量和反映图像不同方向方差信息的感兴趣算子特征向量, 并将其作为本发明所需要的统计量;在提取出图像不同纹理特征量的条件下,本发明采用支持向量机(SVM)并将其组合成分类树,进行陆基云图分类。根据线性可分原则确定最优分类面,不但将两类样本无错误的分开,而且使得两类样本之间的分类间隙最大,从而提高了分类精度。


图1为本发明的总体流程图;图2为提取任一训练样本的排序直方谱特征向量流程图;图3为提取任一训练样本的感兴趣算子特征向量流程图;图4为对训练样本图像进行划分子块的示意图;图5为基于SVM分类树的原理图;图6为本发明与一般方法的分类准确率比较表格。
具体实施例方式下面结合附图和实施例对本发明做详细说明。一般云类可分为多种类型,本发明目的即是将任意一张陆基云图识别为其中的某一种类型。云类的类型可以根据具体情况选定,本实施例中设定云类类型值为M,优选云类的类型为4种(即M = 4),包括淡积云、积雨云、卷积云及毛卷云。当然,采用其他种类也可以进行分类识别。本实施例的识别方法具体步骤如下(1)截取训练样本有M类云图样本需要分类。在陆基可见光云图上,分别在每一类别样本的图像中截取若干子图作为训练样本(本实施例中取70*70大小),令第m (1彡m彡M,m = 1,2,... M) 类的第η个训练样本为/。(2)使用Gabor滤波器组对图像进行频域分解(2. 1) Gabor滤波器组参数选择。Gabor滤波器组的设计必须满足滤波器必须在频域上不重叠地覆盖全部区域。在本发明中,设计将频域分解为S个尺度和T个角度,即该滤波器组共包含S*T个滤波器。 设第1个尺度,第r个角度的Gabor滤波器为6[。本实施例中采用4个尺度和6个角度。例如采用4个尺度,其中心频率分别为0. 338388,0. 253791,0. 169194,0. 084597 ;6个角度分别为0,30,60,90,120,150度,总共产生24个滤波器。(2. 2)利用上述Gabor滤波器组对训练样本进行滤波,得到训练样本的滤波图像
皇A
朱口 ο对应于每一个训练样本,采用Gabor滤波器组中每一个滤波器与其进行滤波,可以得到一幅滤波后图像。例如对于训练样本/二和滤波器,对二者进行卷积F1m^n =Conv(InJGrl)可以得到滤波后的图像巧f 。利用(2. 1)中得到的Gabor滤波器组对所有训练样本进行滤波,滤波后图像的集合,记为P。(3)提取每个样本在不同尺度下的排序直方谱特征向量。滤波图像集合P中的任一训练样本^fn在第1个尺度下提取排序直方谱特征向量, 按照以下步骤完成(3. 1)确定训练样本^fn的直方谱统计范围令丨4=腿(《肀彳其中,<:(χ,;;)为滤波后图像的像素的灰度值,[Pmin,PfflaJ为巧的直方谱统计范围。(3. 2)确定滤波图像的直方谱统计区间将步骤(3. 1)得到的直方谱统计范围均勻划分为c个区间(本实施例中c = 10),
则可以相应的直方谱区间长度为
P -Prange = ^~^
c令其第ζ个直方谱统计区间是[Pmin+range* (z_l),Pmin+range*z] (ζ = 1,2,· · ·,c)(3. 3)计算训练样本在所有尺度下的滤波图像直方谱集合定义滤波图像的直方图为0(祀; (1),祀; (2),...,0)),其中H1 二 (z) = sum (Pmm + range(z -1) < Flm:n (χ, y) < Pmm + range * ζ) (ζ = 1,2,…,c)同时,定SLU1二 = max、Η: (ζ), ζ = 1,2,..工}为圯: 的特征值。训练样本/二通过第1个尺度下不同角度的滤波器滤波后,可以得到T幅滤波图像的集合,则可以得到这些滤波图像相应的直方谱集合为,则对应的特征
值的集合为{"二,"二,…,“二}。(3. 4)对集合内的直方谱进行排序由步骤(3. 3),得到训练样本在第1个尺度下的直方图集合为
权利要求
1.一种基于支持向量机的分类树的陆基云图分类方法,包括以下步骤(1)在陆基云图中,挑选不同的云类并截取其中若干图像作为训练样本;(2)使用Gabor滤波器组对训练样本进行频域分解,将频域分解为S个尺度和T个角度,即该滤波器组共包含S*T个滤波器,进而进行滤波,得到训练样本的滤波图像集合,其中S和T均为正整数;(3)从所述滤波图像集合中提取每个滤波图像的排序直方图谱特征向量和感兴趣算子特征向量,得到提取特征后的训练样本集合;(4)将训练样本集合中任意K个类别的训练样本按照指定的聚类数目进行聚类,其中聚类数目由待聚类的类别数据的稀疏程度和样本数决定,然后将聚类后的每个类中心作为该类的训练样本,得到新的训练样本集合,K为正整数;(5)建立基于支持向量机分类器的分类树模型利用所述新的训练样本集合进行训练,解算出分类器的参数,并确定分类树不同层之间的分类规则;(6)对于待检测的陆基云图,提取每幅图像的排序直方图谱特征向量和感兴趣算子特征向量,再利用步骤(5)中训练好的分类树模型进行分类,即可得到相应的分类结果。
2.根据权利要求1所述的方法,其特征在于,所述提取图像的排序直方谱特征向量的具体步骤如下(3. 1)确定图像的直方谱统计范围;(3. 2)根据所述直方谱统计范围确定图像的直方谱统计区间;(3. 3)计算图像在所有尺度下的滤波图像直方谱集合;(3. 4)对特征值集合内的直方谱进行排序,具体为对S个尺度中的任一尺度1下所有直方谱依据其特征值由小到大依次排序,得到训练样本在该尺度1下的排序直方谱特征向量,进一步得到图像在所有S个尺度下的排序直方谱特征向量;(3. 5)将S个尺度下的排序直方谱特征向量进行连接,即得到该滤波图像的排序直方谱特征向量。
3.根据权利要求1或2所述的方法,其特征在于,所述提取感兴趣算子特征向量的具体过程为(4. 1)将图像划分为不重叠的多个子区域;(4. 2)提取图像的感兴趣算子特征向量首先,对每一个子块,提取其在任一尺度下的感兴趣算子特征向量,对图像中每一个子块进行相应的特征提取,即得到图像在尺度下的感兴趣算子特征向量,其中,感兴趣算子特征向量是指滤波图像在其水平、垂直和两个对角线方向上的灰度方差;然后,获得图像在所有S个尺度下的感兴趣算子特征向量;(4. 3)将该S个尺度下的感兴趣算子特征向量进行连接,即得到最终的代表该图像的感兴趣算子特征向量。
4.根据权利要求1-3之一所述的方法,其特征在于,所述的步骤(4)的聚类过程具体为(5. 1)对任意的第m类的训练样本集合,根据该第m类样本的样本数目和稀疏程度将其聚类,得到P个子类,其中m为正整数,m^K;(5. 2)将各子类的聚类中心作为该类样本的新的训练样本;(5. 3)遍历所有类别的样本,并得到各类样本聚类后的新的训练样本集合。
5.根据权利要求1-4之一所述的方法,其特征在于,所述的尺度S为4个,所述角度T 为6个,
6.根据权利要求5所述的方法,其特征在于,所述4个尺度的中心频率分别为 0. 338388,0. 253791,0. 169194 和 0. 084597 ;所述 6 个角度分别为 0 度,30 度,60 度,90 度, 120度和150度。
全文摘要
本发明公开了一种基于支持向量机的分类树的陆基云图分类方法,包括(1)在陆基云图中挑选训练样本(2)使用Gabor滤波器组对训练样本进行频域分解(3)提取每个滤波图像的排序直方图谱特征向量和感兴趣算子特征向量,得到训练样本集合(4)将训练样本集合中K个类别的训练样本按照指定的聚类数目聚为ni类,然后将ni个类中心作为该类的训练样本,得到新的训练样本集合(5)建立基于支持向量机分类器的分类树模型(6)对T中的样本进行分类,完成陆基云图的分类。本发明针对地基云图考虑了不同云类之间的多种特征值,并将SVM机器学习算法和分类树算法结合进行多类云图自动分类识别,具有较强的鲁棒性和较快的分类速度,分类准确率高。
文档编号G06K9/66GK102393914SQ20111033512
公开日2012年3月28日 申请日期2011年10月28日 优先权日2011年10月28日
发明者刘瑞涛, 吴洋, 张航, 曹治国, 杨卫东 申请人:华中科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1