基于二类支持向量机和粒子群算法的近海水质评价方法

文档序号:6378534阅读:808来源:国知局
专利名称:基于二类支持向量机和粒子群算法的近海水质评价方法
技术领域
本发明属于模式识别与质量评价技术领域,特别是涉及一种基于二类支持向量机和粒子群算法的近海水质评价方法。
背景技术
海洋是地球赖以生存的重要水资源,但是目前面临着越来越严重的水质污染问题。水环境质量评价作为环境质量评价的一项重要内容,是进行环境管理的重要手段之一。对于海水水质综合评价的方法,早期国内外学者大多使用如综合指数法、模糊综合评价法、模糊聚类法等方法,但是这些方法都要事先假定模式或主观规定的一些参数如模糊综合评价法要给定水质参数的权值;模糊聚类分析要给定隶属函数等,评价结果具有很强的主观性。近年来,国内外都在努力探索更为合理的评价方法,其中人工神经网络评价法被广泛 使用,但用其建立水质评价模型存在两个问题训练样本不足,计算精度不够。由于神经网络结构太大而出现“过拟合”现象,这样建立的模型就无法保证其具有较好的泛化能力和预测能力,所以迫切需要更加精确的水质评价模型。支持向量机(Support Vetor Machine, SVM)算法是目前在模式识别领域研究的热点,其是Vapnik及其合作者在统计学习理论的基础上,于1995年提出的一种新型机器学习方法,其基本思想是通过事先选择的线性/非线性映射将输入向量X映射到一个高维特征空间Z,然后在这个特征空间中构造最优化的数据分类/数据回归超平面。支持向量机是一种非参数机器学习方法,以结构风险最小化为基本原则,具有严格的理论基础,它根据有限的样本信息在模型的复杂性和学习能力之间寻找最佳折中,以期获得最好的泛化能力,解决了困扰以往机器学习方法的许多问题。但早期的支持向量机只能对线性可分的二类问题进行分类,本发明提出的核函数技巧可以改变这个状况。所谓核函数技巧就是通过一个核函数将线性不可分的样本特征向量映射到一个高维空间中,在这个高维空间类样本能够线性可分;而本发明通过由多个二类支持向量机构造的支持向量机网络,可以解决多类划分问题。但支持向量机的学习能力和泛化能力很大程度上取决于参数的选择,本发明采用的粒子群优化算法是一种群体智能优化算法,可以解决支持向量机的参数寻优问题。粒子群优化算法初始化为一群随机粒子,即随机的初始解,然后粒子们根据自身的飞行经验和群体的飞行经验来调整自己的飞行轨迹,参照最优粒子的位置在解空间中搜索,并通过迭代找到最优解。

发明内容
本发明所要解决的技术问题是提供一种基于二类支持向量机和粒子群算法的近海水质评价方法,其通过多个利用核函数方法的二类支持向量机构造了支持向量机网络,并使用粒子群优化算法进行参数的优化,实现了根据选定的近海海域的污染物特征进行多类近海水质等级的评价。本发明是通过下述技术方案来解决上述技术问题的一种基于二类支持向量机和粒子群算法的近海水质评价方法,其特征在于,其包括以下步骤SI、选择近海水质评价因素作为特征信息,建立样本数据集,并对特征信息进行归一化处理,完成特征信息的预处理,将所有的特征信息组成特征向量;S2、确定近海水质评价等级,对近海水质评价等级进行二进制编码,并构造支持向量机网络;S3、为了能够在更大范围内寻找二类支持向量机的惩罚参数和核函数参数的最佳值,采用粒子群优化算法进行参数寻优并得到最优向量参数;S4、采用步骤S3所得的最优向量参数对支持向量机网络中的每个二类支持向量机进行训练;S5、利用步骤S4训练完成的支持向量机网络,输入待分类的样本集,获得对其预测的结果,完成近海水质的等级评价。 优选地,所述步骤SI具体还包括以下两个步骤步骤SI. 1,选取有效的近海水质特征信息,特征信息的选择主要根据已经检测获得的近海海域的污染物特征,包括溶解氧、化学需氧量、活性磷酸盐、无机氮和石油类五项污染指标,收集至少一百种样本作为样本数据集并组成特征信息;步骤S I. 2,选定特征信息后进行归一化处理,根据每项特征信息的最大值和最小值,完成特征信息的归一化后,将所有的特征信息组成特征向量。优选地,所述归一化处理中使用的公式如下式
, j - mini X),、 .
X=-:-, max(.v)本 mm(..V)max(.v)- min(.v)
x' = l, niax(.v) = 111111(1-)其中,X为归一化前的特征信息值,max (X)和min (X)分别表示对x取最大值和最小值,X’为归一化后的特征信息值。优选地,所述步骤S2具体还包括以下两个步骤步骤S2. 1,确定近海水质评价等级;步骤S2. 2,对近海水质等级进行二进制编码,具体是指为每个近海水质等级分配一个二进制编号;步骤S2. 3,根据二进制编码的形式,构造出两层的支持向量机网络。优选地,所述支持向量机均采用径向基函数,其公式为以下式所示[(xf,x) = e-K其中,x,xi为数据样本,是η个d维特征向量,Y是核函数参数。优选地,所述步骤S3具体还包括以下两个步骤步骤S3. I,初始化种群;步骤S3. 2,计算各粒子的适应度;步骤S3. 3,评价种群,比较各适应度大小,计算出个体极值和全局极值;步骤S3. 4,更新粒子的速度和位置的公式,产生新种群;步骤S3. 5,设置寻优结束条件为寻优达到最大进化代数,或评价值小于给定精度;检查结束条件,若满足结束条件,则结束寻优;否则转至步骤S3. 2。本发明的积极进步效果在于一、高效率利用二进制编码方式进行支持向量机网络的构造,减少了支持向量机网络中的向量机数目,提高了得出评价等级的速度,这样可提高效率。二、准确性高使用粒子群优化算法对二类支持向量机的参数进行优化,降低了参数选择的盲目性和不准确性,提高了预测精度和稳定性,这样可提高准确性。


图I为本发明基于二类支持向量机和粒子群算法的近海水质评价方法的流程图。图2为近海污染物分界值样本和近海水质等级对应关系示意图。图3 (a)是近海水质等级的二进制编码示意图。图3 (b)是利用二进制编码构造的支持向量网络的示意图。图4是粒子群算法进行参数寻优的方法流程图。
具体实施例方式为了使本发明所要解决的技术问题、技术方案更加清楚,以下结合附图以实施例,对本发明进一步详细说明。如图I所示,本发明基于二类支持向量机和粒子群算法的近海水质评价方法包括以下步骤步骤1,选择近海水质评价因素作为特征信息,建立样本数据集,并对特征信息进行归一化处理,完成特征信息的预处理,将所有的特征信息组成特征向量。步骤I具体还包括以下两个小步骤步骤I. 1,选取有效的近海水质特征信息。特征信息的选择主要根据已经检测获得的近海海域的污染物特征,包括溶解氧、化学需氧量、活性磷酸盐、无机氮和石油类五项污染指标,收集至少一百种(或组)样本作为样本数据集并组成特征信息。本实施例中选取渤海湾近岸海域五个测试点在2004— 2007年枯水期和丰水期的实测数据作为实验,选取其中至少一百组作为样本数据集并组成特征信息。随机选择约三分之二的样本数据作为训练样本数据,用于建立预测模型;剩余的约三分之一的样本数据作为预测样本数据,用于对所建模型进行评价和验证。步骤I. 2,选定特征信息后进行归一化处理,根据每项特征信息的最大值和最小值,将每项特征信息的所有数据线性地转化到
区间内。归一化处理中使用的公式(转化公式)如下式(I):

权利要求
1.一种基于二类支持向量机和粒子群算法的近海水质评价方法,其特征在于,其包括以下步骤 51、选择近海水质评价因素作为特征信息,建立样本数据集,并对特征信息进行归一化处理,完成特征信息的预处理,将所有的特征信息组成特征向量; 52、确定近海水质评价等级,对近海水质评价等级进行二进制编码,并构造支持向量机网络; 53、为了能够在更大范围内寻找二类支持向量机的惩罚参数和核函数参数的最佳值,采用粒子群优化算法进行参数寻优并得到最优向量参数; 54、采用步骤S3所得的最优向量参数对支持向量机网络中的每个二类支持向量机进行训练; 55、利用步骤S4训练完成的支持向量机网络,输入待分类的样本集,获得对其预测的结果,完成近海水质的等级评价。
2.如权利要求I所述的基于二类支持向量机和粒子群算法的近海水质评价方法,其特征在于,所述步骤SI具体还包括以下两个步骤步骤SI. I,选取有效的近海水质特征信息,特征信息的选择主要根据已经检测获得的近海海域的污染物特征,包括溶解氧、化学需氧量、活性磷酸盐、无机氮和石油类五项污染指标,收集至少一百种样本作为样本数据集并组成特征信息;步骤SI. 2,选定特征信息后进行归一化处理,根据每项特征信息的最大值和最小值,完成特征信息的归一化后,将所有的特征信息组成特征向量。
3.如权利要求2所述的基于二类支持向量机和粒子群算法的近海水质评价方法,其特征在于,所述归一化处理中使用的公式如下式
4.如权利要求I所述的基于二类支持向量机和粒子群算法的近海水质评价方法,其特征在于,所述步骤S2具体还包括以下两个步骤步骤S2. 1,确定近海水质评价等级;步骤S2. 2,对近海水质等级进行二进制编码,具体是指为每个近海水质等级分配一个二进制编号;步骤S2. 3,根据二进制编码的形式,构造出两层的支持向量机网络。
5.如权利要求4所述的基于二类支持向量机和粒子群算法的近海水质评价方法,其特征在于,所述支持向量机均采用径向基函数,其公式为以下式所示 [(XiJ) = e-K 其中,x,xi为数据样本,是η个d维特征向量,Y是核函数参数。
6.如权利要求I所述的基于二类支持向量机和粒子群算法的近海水质评价方法,其特征在于,所述步骤S3具体还包括以下两个步骤步骤S3. I,初始化种群;步骤S3. 2,计算各粒子的适应度;步骤S3. 3,评价种群,比较各适应度大小,计算出个体极值和全局极值;步骤S3. 4,更新粒子的速度和位置的公式,产生新种群;步骤S3. 5,设置寻优结束条件为寻优达到最大进化代数,或评价值小于给定精度;检查结束条件,若满足结束条件,则结束寻优;否则转至步骤S3. 2。
全文摘要
本发明公开了一种基于二类支持向量机和粒子群算法的近海水质评价方法,其包括以下步骤选择近海水质评价因素作为特征信息,建立样本数据集,并对特征信息进行归一化处理,完成特征信息的预处理,将所有的特征信息组成特征向量;确定近海水质评价等级,对近海水质评价等级进行二进制编码,并构造支持向量机网络;采用粒子群优化算法进行参数寻优并得到最优向量参数;采用最优向量参数对支持向量机网络中的每个二类支持向量机进行训练;S5、利用训练完成的支持向量机网络,输入待分类的样本集,获得对其预测的结果,完成近海水质的等级评价。本发明实现了根据选定的近海海域的污染物特征进行多类近海水质等级的评价。
文档编号G06K9/62GK102902985SQ20121038118
公开日2013年1月30日 申请日期2012年10月10日 优先权日2012年10月10日
发明者倪彤光, 顾晓清, 张艳慧 申请人:常州大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1