基于多维云模型-模糊支持向量机的生态风险评价方法与流程

文档序号:14715450发布日期:2018-06-16 01:15阅读:413来源:国知局

本发明属于生态风险评价技术,具体涉及一种基于多维云模型-模糊支持向量机的生态风险评价方法。



背景技术:

经济的迅速增长使越来越多的人工合成化合物进入到生态系统中,可持续发展的要求也急需一个有效的方法体系对环境中化合物的风险进行评估。生态风险评价的概念从诞生自今不过短短20年,相关技术方法还不成熟,应用和实践都存在一定的问题,因此,改进生态风险评价方法,引进新方法加入评价体系,有着迫切的现实需求。

由于评价系统的非线性特征,特别是在多指标决策问题上,大部分评价模型并没有很好地解决评价因子与评价等级之间的非线性关系,评价过程中须要对权重进行人为设计,不仅对结果的可靠性有所影响,而且降低了模型的普适性。

支持向量机(Support Vector Machine,SVM)引入了松弛变量借此容忍噪声和离群点,顾全了更多的样本而不只是接近边界的训练样本,并用惩罚因子C刻画对正确分类以及泛化能力之间的取舍,使得分类的结果更加稳健。模糊支持向量机(Fussy support vector machine,FSVM)引入了隶属度函数si,以si事先对样本归属于某一类别的重要程度进行刻画,利用Csi以实现对不同样本赋予不同惩罚因子从而实现了对不同样本区别考虑最小约束条件的破坏程度和最大化间隔的权衡。

si从模糊集理论而来,而在风险评价过程中不仅存在模糊性,随机性作为客观世界的普遍特征同样存在于风险评价中。云模型作为一个不确定性转换模型,考虑了客观世界中广泛存在的随机性和模糊性。

目前还未有多维云模型与模糊支持向量机相结合应用于生态风险评价的方法,且云模型的参数超熵仍未有较为合适的确定方法,一般认为超熵用以表征熵的不确定性,是对同一概念的共性认识程度的度量。从定性的认识到量化的度量过程中,用现有的方法难以刻画。



技术实现要素:

发明目的:本发明的目的在于解决现有技术中存在的不足,提供一种基于多维云模型-模糊支持向量机的生态风险评价方法。

技术方案:本发明一种基于多维云模型-模糊支持向量机的生态风险评价方法,依次包括如下步骤:

(1)根据评价对象的特征及属性,参考国内外评价指标,选取相应的评价标准以及评价因子;根据标准中的分级指标将风险从低到高分为共Y个等级,依次为I,II,III……,其中I级表示风险最低;

(2)将Y个等级的评定视为n类分类问题,将选取的m个评价因子视为待评价样本的m维属性;

(3)选取某一评价因子Xi,根据选定的评价标准,确定各级别对应的评价因子范围[Cmin,Cmax];将各分级指标阈值按情况最优到最劣排列,分别记为1,2,阈值j…Y;Xi为第j风险级别中任一评价因子,Cmin为第j-1分级指标阈值,Cmax为第j分级指标阈值;若j=0或j=Y,视为单边界限即缺省一边边界;重复以上内容,评价因子范围均已确定;

(4)对于隶属于同一级别的m个评价因子,确定该级别云模型的3个数字特征,由正向多维正态云发生器或半云发生器生成该级别的训练样本及样本的确定度;

对具有双边约束[Cmin,Cmax]的指标,用式(1)来近似计算云模型的参数:

Ex=(Cmin+Cmax)/2

En=(Cmax-Cmin)/6

He=k·En (1)

式中,k为参量,k服从N(0.39,0.0021)的正态分布;Ex为期望值,En为熵值;He为超熵;

对于单边界限的变量,根据数据的最大值或最小值确定其缺省边界参数,再参照式(1)计算云参数;

(5)重复步骤(2)和(3),直至产生N个不同风险级别的m维训练样本,生成训练集;

(6)用多维云模型的确定度替代模模糊支持向量机的隶属度,选取径向基函数为核函数,对n类分类问题应用一对一方法,构建(n-1)n/2个二类分类机并组成多类分类机;

(7)参数寻优,利用k-折交叉验证和网格寻优确定最优参数C和σ;

(8)应用训练样本集训练模型;

(9)确定多维云模型-模糊支持向量机模型;

(10)读取某地区监测点的实测数据,通过多维云模型-模糊支持向量机模型

判断风险级别,得到评价结果。

有益效果:本发明通过云模型同时考量了评价过程中的随机性和模糊性,改进了模糊支持向量机,与现方法下相比本发明具有以下优点:

(1)本发明改进了现有超熵的确定方法,以参量k和熵的乘积来确定超熵。从定性到评价语集到定量化表示中,期望和熵容易从评价标准中获得,但超熵表征的是对概念的共性认识,从正向云发生器难以对He加以确定。引入正态分布,对k加以刻画,以此表征共性认识的不确定性;且两步随机数(En’,k)比一步随机数(En’)所冒的犯错的风险较小,更合适于刻画概念的复杂性;同时,超熵是熵的不确定性的度量,上述关系式可将二者联系起来,表示熵与超熵之间的关系。

(2)本发明结合模糊支持向量机和多维云模型能够实现多指标的综合评价,具有可行性和有效性。MCM-FSVM评价法将多因子的风险评价视为多维样本的分类问题,将一种风险源对应于一个评价因子从而生成由多个评价因子组成的多维样本,将不同等级的判定视为多类分类问题,通过多维云模型考量样本的模糊性和随机性对FSVM的隶属度函数加以改进,应用改进过FSVM模型进行分类进而判定样本的风险等级,由此实现多指标的综合评价。

(3)MCM-FSVM法结合FSVM及MCM的特点,能够较好地处理评价因子与评价结果之间的非线性映射关系,并且能考虑到风险评价中的模糊性和随机性。MCM-FSVM法引入支持向量机,应用核函数将数据从低维映射到高维,巧妙地实现了样本的非线性分划;并引入多维云模型及确定度的概念,通过云的数字特征对样本的模糊性和随机性加以反映和度量,应用确定度对模糊支持向量机的隶属度函数进行改进,并应用正向多维云发生器产生训练样本,对改进FSVM进行有监督学习,以此提高分类的效果。

综上所述,本发明耦合了多维云模型和模糊支持向量机,既能实现生态风险评价的综合评价,又能同时考量评价过程中存在的随机性和模糊性,具有合理性和有效性。同时本发明也改进了超熵的确定方法,通过乘积的方式将超熵与熵联系起来,并根据现有研究(熵与超熵的商大约在3-18内),用服从于N(0.39,0.0021)的参量k来刻画概念共性认识的不确定性和概念的复杂性。

附图说明

图1为本发明的流程示意图。

具体实施方式

下面对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。

便于理解本发明,做以下说明:

多维云模型:

定义1:云的参数分别为期望,熵,超熵。

期望Ex(Expected value):云滴在论域空间分布的期望是语言概念量化的最典型样本点,也是概念在论域空间的中心值。

熵En(Entropy):熵是概念不确定性的度量,既是概念亦此亦彼的度量,也反映了代表了云滴出现的随机性。

超熵He(Hyper entropy):即熵的熵,是熵的不确定性的度量,它的大小间接地反应了云的厚度。

定义2::设U{x1,x2…xm}是一个用精确数值表示的m维定量论域,C是U{x1,x2…xm}上的定性概念,若定量值x∈U,且X(x1,x2…xm)是定性概念C的一次随机实现,若X(x1,x2…xm)满足:

X(x1,x2…xm)~N(Ex(Ex1,Ex2…Exm),(En'(En'1,En'2…En'm)2),

其中,

En'(En'1,En'2…En'm)2~N(En(En1,En2…Enm),He(He1,He2…Hem)2),

且X(x1,x2…xm)对C的确定度μ(x(x1,x2…xm))∈[0,1]满足:

则X(x1,x2…xm)在U{x1,x2…xm}上的分布称为m维正态云。

定义3:正向一维正态云发生器算法

(1)生成以En为期望值,He为标准差的一个正态随机数En';

(2)生成以Ex为期望值,En'为标准差的一个正态随机数x,x成为论域空间中的一个云滴;

(3)计算y=exp(-(x-Ex)2/2En'2),令y为x属于定性概念C的确定度;

重复(1)~(3),直到产生N个云滴为止。

定义4:正向正态云的“En规则”

对于论域U中的定性概念A有贡献的云滴,主要落在区间[Ex-3En,Ex+3En],可以忽略[Ex-3En,Ex+3En]区间之外的云滴对定性概念A的贡献。

如图1所示,本发明一种基于多维云模型-模糊支持向量机的生态风险评价方法,依次包括如下步骤:

(1)根据评价对象的特征及属性,参考国外评价指标,选取相应的评价标准(如GB18668-2002,美国环保署生态风险阈值等)以及评价因子(持久性有机污染物、重金属等)。根据标准中的分级指标将风险从低到高分为(I,II,III……)共Y个等级,其中I级表示风险最低;

(2)将Y个等级的评定视为n类分类问题,将选取的m个评价因子视为待评价样本的m维属性;

(3)选取某一评价因子Xi,根据选定的评价标准,确定各级别对应的评价因子范围[Cmin,Cmax]。将各分级指标阈值按情况最优到最劣排列,分别记为1,2,…j…Y。Xi第j风险级的参数Cmin为第j-1分级指标阈值,Cmax为第j分级指标阈值。若j=0或j=Y,视为单边界限(缺省一边边界)。重复以上内容,评价因子范围都已经确定;

(4)对于隶属于同一级别的m个评价因子,确定该级别云模型的3个数字特征,由正向多维正态云发生器或半云发生器生成该级别的训练样本及样本的确定度;

对具有双边约束[Cmin,Cmax]的指标,用式(1)来近似计算云模型的参数:

Ex=(Cmin+Cmax)/2

En=(Cmax-Cmin)/6

He=k·En (1)

式中,k服从正态分布N(0.39,0.0021);Ex为期望值,En为熵值;He为超熵;

对于单边界限的变量,根据数据的最大值或最小值确定其缺省边界参数,再参照式(1)计算云参数;

(5)重复步骤(2)和(3),直至产生N个不同风险级别的m维训练样本,生成训练集;

(6)用多维云模型的确定度替代模模糊支持向量机的隶属度,选取径向基函数为核函数,对n类分类问题应用一对一方法,构建(n-1)n/2个二类分类机并组成多类分类机;

(7)参数寻优,利用k-折交叉验证和网格寻优确定最优参数C和σ;

(8)应用训练样本集训练模型;

(9)确定多维云模型-模糊支持向量机模型;

(10)读取某地区监测点的实测数据,通过多维云模型-模糊支持向量机模型判断风险级别,得到评价结果。

实施例:本实施例以长江口潮滩表层沉积物持久性有机污染物的生态风险作为实际应用

以长江口潮滩表层沉积物持久性有机污染物的实测数据为例,以DDTs、HCHs和PCBs作为评价因子,用多维云模型-模糊支持向量机法进行生态风险评价。

(1)实测数据(ng/g)

n.d:not detected。

(2)评价标准——海洋沉积物质量(GB18668-2002)

(3)各评价因子的各级别的评价指标范围

(4)各评价因子的云模型参数

(5)最终评价结果(C=10.2601,σ=3.9677)

通过上述实施例看出,本发明综合FSVM及多维云模型各自的特点,通过多维云模型的数字特征来构造风险分级和样本数据间的映射关系,并应用确定度代替隶属度作为衡量样本对正确分类的重要程度,以多维云模型表示风险评价的多维属性,根据云模型的3En规则并改进了云模型的参数的确定方法,更适合于生态风险评价的情况,且更为直观。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1