基于确定性集合建模的水质参数多模型协同反演方法与流程

文档序号:11578823阅读:294来源:国知局

本发明涉及水质遥感监测领域,尤其涉及基于确定性集合建模的水质参数多模型协同反演方法。



背景技术:

随着水污染问题的日益严重,水质监测成为社会经济可持续发展必须解决的重大问题,尤其是内陆水体,其水质已经对国民的生产和生活用水安全产生威胁,实现对内陆水体水质准确、快速监测对保障国民用水安全具有重要意义。常规水质监测多采用实验室分析手段,虽然监测精度高,但费时、费力且只能获取监测断面上水质状况,难以满足对水质进行大范围、多时相动态监测的需求;遥感技术作为一种区域性监测手段,可克服常规水质监测方法的不足。

随着遥感技术的不断发展,遥感技术应用于水质监测的研究越来越多,反演模型主要有经验模型、半经验/半分析模型、分析模型以及机器学习模型等。经验模型是基于多光谱数据源的一种水质反演模型,该模型较为简单,应用最多,但精度有限;随着高光谱技术的发展,半经验和半分析模型越来越多的应用于水质遥感当中,由于半经验/半分析模型具有一定的物理意义,模型精度有所提高;分析模型虽具有明确的物理意义,但由于输入参数过多、模型机理尚未十分明确、水体固有光学参数获取困难等因素限制,分析模型在实际中应用较少;机器学习模型具有很强的非线性模拟能力,在复杂水环境下水质遥感反演中表现出特有的优势,但模型相对复杂,容易过拟合,泛化能力还需进一步提高。由于内陆水环境的复杂性,上述水质参数单一反演模型在建模和验证精度上往往不一致,难以同时达到较高的精度,模型稳定性较差。



技术实现要素:

针对上述技术问题,本发明的主要目的在于提供一种基于确定性集合建模的水质参数多模型协同反演技术,目的在于综合水质参数多个反演模型特点,实现水质参数的多模型协同反演,建立高稳定性的水质参数集合反演模型。

为了达到上述目的,本发明的具体技术方案为:

基于确定性集合建模的水质参数多模型协同反演方法,包括以下步骤:

预处理步骤:获取研究区水体实测高光谱反射率,并对采样点处实测的高光谱反射率进行预处理;

特征变量选取步骤:选择2/3采样点作为建模采样点,分别利用建模采样点处预处理后的光谱变量和水质参数浓度进行相关性分析,确定反演水质参数的特征变量;

单一模型构建步骤:利用特征变量建立水质参数多个反演模型;

精度评价步骤:对所建模型进行精度评价,计算各单一模型的建模综合误差、验证综合误差和模型综合误差;

集合建模步骤:根据精度评价结果,选择模型综合误差最小的模型形式进行集合建模,利用熵权法和集对原理确定各单一模型权重,对各单一模型反演结果进行加权求和,建立反演水质参数的集合模型,计算集合模型综合误差。

具体的,预处理步骤包括:

获取研究区水体实测高光谱反射率,并进行归一化、一阶微分和波段比值等预处理。

其中,所述归一化处理公式如下:

式中r*(λi)为λi处归一化反射率;r(λi)为λi处反射率;n为400-750nm的波段数;

其中,所述一阶微分处理公式如下:

式中,λi-1、λi和λi+1为相邻波长;r(λi-1)和r(λi+1)分别为波长λi-1、λi+1处反射率;r′(λi)为波长λi处反射率一阶微分值,n为400-750nm的波段数;

其中,所述波段比值处理公式如下:

式中r(λi/λj)为λi处光谱反射率和λj处光谱反射率的比值;r(λi)为λi处光谱反射率;r(λj)为λj处光谱反射率;n为400~850nm波段数。

具体的,特征变量选取步骤:分别利用建模采样点处归一化光谱反射率、一阶微分反射率和波段反射率比值和水质参数浓度进行相关性分析,确定反演水质参数的特征变量;

其中,所述水质参数浓度包括:叶绿素a浓度、总悬浮物浓度和浊度。

其中,所述分别利用建模采样点处归一化光谱反射率、一阶微分光谱反射率以及波段反射率比值和水质参数浓度进行相关性分析,分析方法如下:

分别建模采样点处计算归一化光谱反射率、一阶微分光谱反射率以及波段反射率比值和水质参数浓度之间的系数,计算公式如下:

式中,xi为建模采样点i处实测高光谱经预处理后得到的归一化光谱反射率、一阶微分光谱反射率以及波段反射率比值;yi为建模采样点i处水质参数浓度(叶绿素a浓度、总悬浮物浓度和浊度);为均值;n为建模采样点个数。

其中,所述确定反演水质参数的特征变量,确定方法如下:

获取和水质参数浓度具有最大正相关系数的λm处归一化光谱反射率,和水质参数浓度具有最大负相关系数的λe处归一化光谱反射率,和水质参数浓度相关系数绝对值最大的λs处一阶微分光谱反射率以及λu和λv处光谱反射率比值,选择λm处归一化光谱反射率、λe处归一化光谱反射率、λs处一阶微分光谱反射率以及λu和λv处光谱反射率比值为反演水质参数的特征变量。

其中,单一模型建模步骤包括:利用λm处归一化光谱反射率、λe处归一化光谱反射率、λs处一阶微分光谱反射率以及λu和λv处光谱反射率比值建立水质参数多个反演模型。

其中,所述多个反演模型,包括:单波段模型、一阶微分模型和波段比值模型。

所述单波段模型,建模过程如下:

选择λm处归一化光谱反射率建立反演水质参数浓度的线性回归模型、一元二次回归模型和指数回归模型,模型分别用如下公式表示:

cwq=a1*r*(λm)+a2(线性回归模型)

cwq=b1*r*2(λm)+b2*r*(λm)+b3(一元二次回归模型)

cwq=c1*exp(c2*r*(λm))(指数回归模型)

式中cwq为水质参数浓度;a1-a3、b1-b3、c1-c2为回归系数;r*(λm)为λm处归一化光谱反射率。

所述一阶微分模型,建模过程如下:

选择λs处一阶微分光谱反射率建立反演水质参数浓度的线性回归模型、一元二次回归模型和指数回归模型,模型分别用如下公式表示:

cwq=a1*r′(λs)+a2(线性回归模型)

cwq=b1*r′2(λs)+b2*r′(λs)+b3(一元二次回归模型)

cwq=c1*exp(c2*r′(λs))(指数回归模型)

式中cwq为水质参数浓度;a1-a3、b1-b3、c1-c2为回归系数;r*(λs)为λs处一阶微分光谱反射率。

所述波段比值模型,包括:原始光谱反射率比值模型和归一化光谱反射率比值模型,原始光谱反射率比值模型建模过程如下:

选择λu和λv处光谱反射率比值建立反演水质参数浓度的线性回归模型、一元二次回归模型和指数回归模型,模型分别用如下公式表示:

(线性回归模型)

(一元二次回归模型)

(指数回归模型)

式中cwq为水质参数浓度;a1-a3、b1-b3、c1-c2为回归系数;r(λu)/r(λv)为λu和λv处光谱反射率比值。

归一化光谱反射率比值模型建模过程如下:选择λm和λe处归一化光谱反射率比值建立反演水质参数浓度的线性回归模型、一元二次回归模型和指数回归模型,模型分别用如下公式表示:

(线性回归模型)

(一元二次回归模型)

(指数回归模型)

式中cwq为水质参数浓度;a1-a3、b1-b3、c1-c2为回归系数;r*(λm)/r*(λe)为λm和λe处光谱反射率比值。

具体的,精度评价步骤:对所建的单波段模型、一阶微分模型和波段比值模型进行精度评价,计算各模型的建模综合误差、验证综合误差和模型综合误差。

其中,所述计算各模型的建模综合误差、验证综合误差和模型综合误差,误差计算指标包括:相对均方根误差、相对误差和综合误差。

所述相对均方根误差计算公式如下:

式中,rrmse为相对均方根误差;rmse为均方根误差;yi为建模或验证采样点i处水质参数浓度实测值;为建模或验证采样点实测参数浓度的平均值;为建模或验证采样点i处水质参数浓度反演值;n为建模或验证采样点的个数。

所述相对误差计算公式如下:

式中,are为相对误差;yi为建模或验证采样点i处水质参数浓度实测值;为建模或验证采样点实测参数浓度的平均值;为建模或验证采样点i处水质参数浓度反演值;n为建模或验证样本点的个数。

所述综合误差计算公式如下:

式中,rrmse_c为建模相对均方根误差;are_c为建模相对误差;ce_c为建模综合误差;rrmse_v为验证相对均方根误差;are_v为验证相对误差;ce_v为验证综合误差;ce为模型综合误差。

具体的,集合建模步骤:根据精度评价结果,选择模型综合误差最小的模型形式进行集合建模,利用熵权法和集对原理确定各单一模型权重,对各单一模型反演结果进行加权求和,建立反演水质参数的集合模型,计算集合模型综合误差。

其中,所述利用熵权法确定各单一模型权重,确定方法如下:

计算各个模型在建模采样点处的反演相对误差:

式中,ei(k)为第i个模型在第k个建模采样点处的反演相对误差;i为模型编号,i=1,2,…,n;y(k)为第k个建模采样点处水质参数浓度实测值,为第i个模型在建模采样点k处的反演值。

计算各模型相对误差权重:

式中,pi(k)为第i个模型在第k个建模采样点处的反演相对误差权重;ei(k)为第i个模型在第k个建模采样点处的反演相对误差;n为建模所用采样点的个数。

不同模型反演相对误差的熵值计算:

式中,hi为第i个模型反演相对误差的熵值;pi(k)为第i个模型在第k个建模采样点处的反演相对误差权重;n为建模所用采样点的个数。

根据上述计算得到的熵值,获取各模型反演误差序列的变异程度系数:

di=1-hi

式中,di为第i个模型反演误差序列的变异程度系数;hi为第i个模型反演相对误差的熵值。

变异程度越大,权重越小,各模型权重系数计算公式如下:

式中,wei为第i个模型权重;di为第i个模型反演误差序列的变异程度系数。

具体的,所述利用集对原理确定各单一模型权重,确定方法如下:

利用y和构成集对计算集对的三元联系度μi=si+fiii+pij

其中,y={y1,y2,y3,…,yn}为建模采样点处实测的水质参数浓度值,为各单一模型在建模采样点处的水质参数浓度反演值,i为模型编号;μi为模型i的三元联系度;si=si/n;fi=fi/n;pi=pi/n;si为模型i同一性个数;fi为模型i差异性个数;pi为模型i对立性个数;ii为差异不确定系数;j为对立系数。

同一性个数si是指模型i反演相对误差<30%的建模采样点的个数;差异性个数fi是指模型i反演相对误差介于30%~60%的建模采样点的个数;对立性个数pi是指模型i反演相对误差>60%的建模采样点的个数。

将联系度转换成联系数μ′i需要计算ii和j的值,令j=-1,ii计算公式如下:

经过转化后的μ′i介于-1到1之间,其值越接近于-1,说明模型模拟的结果与实测结果差异性越大,μ′i其值越接近于1,说明差异性越小,根据联系数计算各模型的相对隶属度v:

vi=1/n+1/n·μ′i

用相对隶属度确定各个模型权重wsi,公式如下:

其中,所述对各单一模型反演结果进行加权求和,建立反演水质参数的集合模型,集合模型如下:

式中,为基于熵权法的集合模型反演值;为基于集对原理的集合模型反演值;分别为第1个到第n个单一模型的反演值;we1,···,wen为基于熵权法确定的各单一模型权重;ws1,···,wsn为基于集对原理确定的各单一模型权重。

其中,所述计算集合模型综合误差,集合模型综合误差包括:集合模型建模综合误差ce_c、集合模型验证综合误差ce_v和集合模型综合误差ce。

本发明提供的基于确定性集合建模的水质参数多模型协同反演方法,综合不同水质参数反演模型特点,利用熵权法和集对原理两种确定性集合建模方法实现水质参数多模型协同反演,提高水质参数反演结果的稳定性。

附图说明

图1是本发明的流程图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。

如图1所示,本发明实施例所述的一种基于确定性集合建模的水质参数多模型协同反演技术,包括:

预处理步骤101:获取研究区水体实测高光谱反射率,并对采样点处实测的高光谱反射率进行预处理。

实施时,本实例所述的研究区为南四湖,获取南四湖40个采样点处水体实测高光谱反射率,选择28个采样点为建模采样点,对28个采样点处实测高光谱反射率进行归一化、一阶微分和波段比值等预处理。

特征变量选取步骤102:选择2/3采样点作为建模采样点,分别利用建模采样点处预处理后的光谱变量和水质参数浓度进行相关性分析,确定反演水质参数的特征变量。

应说明的是,本实例所述的水质参数选择的是叶绿素a浓度。

实施时,所述分别利用预处理后的光谱变量和水质参数浓度进行相关性分析,分析方法如下:分别计算南四湖28个建模采样点处归一化光谱反射率、一阶微分光谱反射率以及波段反射率比值和水体叶绿素a浓度之间的相关系数,计算公式如下:

式中,xi为南四湖第i个建模采样点处实测高光谱经预处理后得到的归一化光谱反射率、一阶微分光谱反射率以及波段反射率比值;yi为第i个建模采样点处叶绿素a浓度,ug·l-1为均值;n=28。

实施时,所述确定反演水质参数的特征变量,确定方法如下:

获取和水质参数浓度具有最大正相关系数的λm处归一化光谱反射率,和水质参数浓度具有最大负相关系数的λe处归一化光谱反射率,和水质参数浓度相关系数绝对值最大的λs处一阶微分光谱反射率以及λu和λv处光谱反射率比值,选择λm处归一化光谱反射率、λe处归一化光谱反射率、λs处一阶微分光谱反射率以及λu和λv处光谱反射率比值为反演水质参数的特征变量。最终确定λm=692.1nm,λe=403.4nm,λs=584.1nm,λu=696.2nm,λv=401.9nm。

单一模型构建步骤103:利用特征变量建立水质参数多个反演模型;

实施时,所述单一模型建模步骤包括:利用692.1nm处归一化光谱反射率、403.4nm处归一化光谱反射率、584.1nm处一阶微分光谱反射率以及696.2nm和401.9nm处光谱反射率比值建立水质参数多个反演模型。

实施时,所述多个反演模型,包括:单波段模型、一阶微分模型和波段比值模型。

实施时,所述单波段模型,建模过程如下:

选择692.1nm处归一化光谱反射率建立反演水体叶绿素a浓度的线性回归模型、一元二次回归模型和指数回归模型,模型分别用如下公式表示:

cchl_a=33.841*r*(692.1nm)-25.543(线性回归模型)

cchl_a=-36.542*r*2(692.1nm)+110.08*r*(692.1nm)-67.92(一元二次回归模型)

cchl_a=0.0073*exp(6.3213*r*(692.1nm))(指数回归模型)

式中,cchl_a为叶绿素a浓度,ug·l-1;r*(692.1nm)为692.1nm处归一化光谱反射率。

实施时,所述一阶微分模型,建模过程如下:

选择584.1nm处一阶微分光谱反射率建立反演水体叶绿素a浓度的线性回归模型、一元二次回归模型和指数回归模型,模型分别用如下公式表示:

cchl_a=9491.8*r′(584.1nm)+11612(线性回归模型)

cchl_a=-5e+06*r′2(584.1nm)+4565.4*r′(584.1nm)+11.036(一元二次回归模型)

cchl_a=12.926*exp(1725.2*r′(584.1nm))(指数回归模型)

式中,cchl_a为叶绿素a浓度,ug·l-1;r*(584.1nm)为584.1nm处一阶微分光谱反射率。

实施时,所述波段比值模型,包括:原始光谱反射率比值模型和归一化光谱反射率比值模型,原始光谱反射率比值模型建模过程如下:

选择696.2nm和401.9nm处光谱反射率比值建立反演水体叶绿素a浓度的线性回归模型、一元二次回归模型和指数回归模型,模型分别用如下公式表示:

(线性回归模型)

(一元二次回归模型)

(指数回归模型)

式中,cchl_a为叶绿素a浓度,ug·l-1;r(696.2nm)/r(401.9nm)为696.2nm和401.9nm处光谱反射率比值。

归一化光谱反射率比值模型建模过程如下:选择692.1nm和403.4nm处归一化光谱反射率比值建立反演水质参数浓度的线性回归模型、一元二次回归模型和指数回归模型,模型分别用如下公式表示:

(线性回归模型)

(一元二次回归模型)

(指数回归模型)

式中,cchl_a为叶绿素a浓度,ug·l-1;r*(692.1nm)/r*(403.4nm)为692.1nm和403.4nm处光谱反射率比值。

精度评价步骤104:对所建模型进行精度评价,计算各单一模型的建模综合误差、验证综合误差和模型综合误差。

实施时,所述计算各模型的建模综合误差、验证综合误差和模型综合误差,误差计算指标包括:相对均方根误差、相对误差和综合误差。

实施时,所述相对均方根误差计算公式如下:

式中,rrmse为相对均方根误差;rmse为均方根误差;yi为建模或验证采样点i处叶绿素a浓度实测值;为叶绿素a浓度的平均值;为建模或验证采样点i处叶绿素a浓度反演值;n为建模或验证采样点的个数。

实施时,所述相对误差计算公式如下:

式中,are为相对误差;yi为建模或验证采样点i处叶绿素a浓度实测值;为叶绿素a浓度的平均值;为建模或验证采样点i处叶绿素a浓度反演值;n为建模或验证样本点的个数。

实施时,所述综合误差计算公式如下:

式中,rrmse_c为建模相对均方根误差;are_c为建模相对误差;ce_c为建模综合误差;rrmse_v为验证相对均方根误差;are_v为验证相对误差;ce_v为验证综合误差;ce为模型综合误差。

集合建模步骤105:根据精度评价结果,选择模型综合误差最小的模型形式进行集合建模,利用熵权法和集对原理确定各单一模型权重,对各单一模型反演结果进行加权求和,建立反演水质参数的集合模型,计算集合模型综合误差。

实施时,所述根据精度评价结果,选择模型综合误差最小的模型形式进行集合建模,各单一模型中模型综合误差最小包括:r*692.1nm线性反演模型(ce_c=0.2729,ce_v=0.3075,ce=0.29.02)、r′581.4nm线性反演模型(ce_c=0.3423,ce_v=0.4459,ce=0.3941)、r696.2nm/r401.9nm线性反演模型(ce_c=0.2781,ce_v=0.2967,ce=0.2874)和r*692.1nm/r*403.4nm线性反演模型(ce_c=0.2918,ce_v=0.3273,ce=0.3095)。

实施时,所述利用熵权法确定各单一模型权重,确定方法如下:

计算r*692.1nm线性反演模型、r′581.4nm线性反演模型、r696.2nm/r401.9nm线性反演模型和r*692.1nm/r*403.4nm线性反演模型在建模采样点处的反演相对误差:

式中,ei(k)为第i个模型在第k个建模采样点处的反演相对误差;i为模型编号,i=1,2,3,4;y(k)为第k个建模采样点处叶绿素a浓度实测值,为第i个模型在建模采样点k处的反演值。

计算各模型反演相对误差权重:

式中,pi(k)为第i个模型在第k个建模采样点处的反演相对误差权重;ei(k)为第i个模型在第k个建模采样点处的反演相对误差;n为建模所用采样点的个数,取28。

不同模型相对误差的熵值计算:

式中,hi为第i个模型反演相对误差的熵值;pi(k)为第i个模型在第k个建模采样点处的反演相对误差权重。

根据上述计算得到的熵值,获取各模型误差序列的变异程度系数:

di=1-hi

式中,di为第i个模型反演误差序列的变异程度系数;hi为第i个模型反演相对误差的熵值。

变异程度越大,权重越小,各模型权重系数计算公式如下:

式中,wei为第i个模型权重;di为第i个模型误差序列的变异程度系数。

利用熵权法确定的r*692.1nm线性反演模型、r′581.4nm线性反演模型、r696.2nm/r401.9nm线性反演模型和r*692.1nm/r*403.4nm线性反演模型权重分别为0.2474、0.2340、0.2653和0.2533。

实施时,所述利用集对原理确定各单一模型权重,确定方法如下:

利用y和构成集对计算集对的三元联系度μi=si+fiii+pij

其中,y={y1,y2,y3,…,yn}为建模采样点处实测的叶绿素a浓度值,为各单一模型在建模采样点处的叶绿素a浓度反演值,i为模型编号;μi为模型i的三元联系度;si=si/n;fi=fi/n;pi=pi/n;si为模型i同一性个数;fi为模型i差异性个数;pi为模型i对立性个数;ii为差异不确定系数;j为对立系数。

同一性个数si是指模型i反演相对误差<30%的建模采样点的个数;差异性个数fi是指模型i反演相对误差介于30%~60%的建模采样点的个数;对立性个数pi是指模型i反演相对误差>60%的建模采样点的个数。

将联系度转换成联系数μ′i需要计算ii和j的值,令j=-1,ii计算公式如下:

经过转化后的μ′i介于-1到1之间,其值越接近于-1,说明模型模拟的结果与实测结果差异性越大,μ′i其值越接近于1,说明差异性越小,根据联系数计算各模型的相对隶属度v:

vi=1/n+1/n·μ′i

用相对隶属度确定各个模型权重wsi,公式如下:

利用集对原理确定的r*692.1nm线性反演模型、r′581.4nm线性反演模型、r696.2nm/r401.9nm线性反演模型和r*692.1nm/r*403.4nm线性反演模型权重分别为0.2720、0.2332、0.2461和0.2487。

实施时,所述对各单一模型反演结果进行加权求和,建立反演叶绿素a浓度的集合模型,集合模型如下:

式中,为基于熵权法的集合模型叶绿素a浓度反演值;为基于集对原理的集合模型叶绿素a浓度反演值;分别为r*692.1nm线性反演模型、r′581.4nm线性反演模型、r696.2nm/r401.9nm线性反演模型和r*692.1nm/r*403.4nm线性反演模型的叶绿素a浓度反演值。

实施时,所述计算集合模型综合误差,集合模型综合误差包括:集合模型建模综合误差ce_c、集合模型验证综合误差ce_v和集合模型综合误差ce。其中,基于熵权法的集合模型建模综合误差ce_c=0.2525,ce_v=0.3295,ce=0.2910;基于集对原理的集合模型建模综合误差ce_c=0.2529,ce_v=0.3295,ce=0.2912。

本发明通过构建水质参数多个反演模型,利用熵权法和集对原理两种确定性集合建模技术,确定水质参数各单一反演模型权重,对各单一模型反演结果进行加权求和,实现水质参数的多模型协同反演,使集合模型同时具有较高的建模精度和验证精度,可以提高模型的稳定性。

以上所述是本发明的优选实施方式,本实施例中选择基于水体实测高光谱数据的水质参数部分反演模型参与集合建模,应当指出,该技术同样适用于基于卫星高光谱数据的水质参数多模型协同反演,若有水质参数其他反演模型,同样可以用该技术进行集合建模;同时,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1