基于时间序列和支持向量回归的水质预测方法及装置与流程

文档序号:17727603发布日期:2019-05-22 02:37阅读:223来源:国知局
基于时间序列和支持向量回归的水质预测方法及装置与流程

本发明实施例涉及环境污染水质监测技术领域,尤其涉及一种基于时间序列和支持向量回归的水质预测方法及装置。



背景技术:

随着我国经济的快速发展,水资源短缺和污染问题日益突出,有效的对水质进行预测,对加强水资源保护、预防水质污染具有重要意义;在水产养殖方面,优良的养殖水质对水产品的成长具有重要作用,一旦养殖水域水质恶化会严重影响水产品的生存并给养殖企业以及个人造成大量的损失,因此,将信息处理技术与水产养殖结合起来,对养殖水域重要水质参数做出预测,具有重要意义,为了掌握水质现状及其发展趋势,有效控制和改善水质恶化情况,推动水产养殖领域快速发展,需要改善现有的水质预测方法。

在现有技术中,根据预设的水质指标获取水质样本,并通过预设的聚类算法对水质样本进行聚类分析,然后根据聚类分析后的水质样本获取三层前馈神经网络模型的结果、偏最小二乘模型的结果和支撑向量回归模型的结果,并根据三层前馈神经网络模型的结果、偏最小二乘模型的结果和支撑向量回归模型获取集成模型,最后根据集成模型为待测水样进行水质预测。

然而,在数据采集过程中,由于恶劣的作业条件、设备老化和断电等一些无法控制的因素,采集到的原始时间序列中往往存在缺失数据,这使得原始数据的质量难以满足精确数据的分析需求,导致预测精度较低,预测运算量较大,降低了预测水质参数的效率。



技术实现要素:

针对现有技术存在的问题,本发明实施例提供一种基于时间序列和支持向量回归的水质预测方法及装置。

第一方面,本发明实施例提供一种基于时间序列和支持向量回归的水质预测方法,包括:

获取历史水质参数的完整时间序列;

对所述完整时间序列分别进行时间序列趋势性分析、时间序列突变性分析和时间序列波动信息分析,得到待预测数据集;

基于训练后的支持向量回归水质预测模型,对所述待预测数据集进行预测,获取到目标水质预测参数。

第二方面,本发明实施例提供了一种基于时间序列和支持向量回归的水质预测装置,包括:

获取模块,用于获取历史水质参数的完整时间序列;

分析处理模块,用于对所述完整时间序列分别进行时间序列趋势性分析、时间序列突变性分析和时间序列波动信息分析,得到待预测数据集;

水质参数预测模块,用于基于训练后的支持向量回归水质预测模型,对所述待预测数据集进行预测,获取到目标水质预测参数。

第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。

第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。

本发明实施例提供的一种基于时间序列和支持向量回归的水质预测方法及装置,针对部分或大量观测数据缺失的情况,利用压缩感知理论方法对数据进行修复和补全,根据历史时间序列分析方法得到时间序列的趋势性预测结果、突变性预测结果和波动率预测结果,在时间序列分析结果的基础上,综合观测数据以及外部环境数据运用支持向量机的方法实现相关水质参数的预测,提高了水质预测的精确性,降低了水质预测的复杂程度,提高了水质预测的效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于时间序列和支持向量回归的水质预测方法的流程示意图;

图2为本发明实施例提供的基于时间序列和支持向量回归的水质预测装置的结构示意图;

图3为本发明实施例提供的基于时间序列和支持向量回归的水质预测装置的设计框架示意图;

图4为本发明实施例提供的电子设备结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明实施例提供的基于时间序列和支持向量回归的水质预测方法的流程示意图,如图1所示,本发明实施例提供了一种基于时间序列和支持向量回归的水质预测方法,包括:

步骤101,获取历史水质参数的完整时间序列;

步骤102,对所述完整时间序列分别进行时间序列趋势性分析、时间序列突变性分析和时间序列波动信息分析,得到待预测数据集;

步骤103,基于训练后的支持向量回归水质预测模型,对所述待预测数据集进行预测,获取到目标水质预测参数。

在本发明实施例中,针对水质参数的数据采集过程中发生大量数据缺失或连续缺失的情况,通过步骤101,获取历史水质参数的完整时间序列,在本发明实施例中,以压缩感知理论的方法进行缺失数据的预测和补全,避免因数据缺失导致预测精度下降或预测结果偏差过大的情况,从而提高原始数据的质量。通过步骤102,对历史水质参数的完整时间序列分别进行时间序列趋势性分析、时间序列突变性分析和时间序列波动信息分析,针对完整时间序列的趋势性、突变性和波动信息对目标水质参数预测提供支持和补充,从而得到待预测数据集。然后,将历史水质参数的待预测数据集输入到支持向量回归水质预测模型中,通过步骤103,基于训练后的支持向量回归水质预测模型,对所述待预测数据集进行预测,获取到目标水质预测参数,在本发明实施例中,通过选择时间序列分析法和支持向量机预测法进行水质预测,在保证预测精度的情况下,从而减小预测计算量。

本发明实施例针对部分或大量观测数据缺失的情况,利用压缩感知理论方法对数据进行修复和补全,根据历史时间序列分析方法得到时间序列的趋势性预测结果、突变性预测结果和波动率预测结果,在时间序列分析结果的基础上,综合观测数据以及外部环境数据运用支持向量机的方法实现相关水质参数的预测,提高了水质预测的精确性,降低了水质预测的复杂程度,提高了水质预测的效率。

在上述实施例的基础上,在所述获取历史水质参数的完整时间序列之前,所述方法还包括:

获取样本水质参数的时间序列,若所述时间序列有数据缺失,则对所述时间序列中的缺失数据进行预测和补全,得到样本时间序列;

对所述样本时间序列进行分析处理,得到样本数据集,所述样本数据集包括所述样本水质参数、样本外部环境数据、样本时间序列趋势性分析结果数据、样本时间序列突变性分析结果数据和样本时间序列波动信息;

将所述样本数据集输入到待训练的支持向量机中,对所述待训练的支持向量机进行训练,得到所述样本水质参数的样本水质预测参数,从而获取到所述训练后的支持向量回归水质预测模型。

在本发明实施例中,通过压缩感知理论对样本水质参数的时间序列进行预测和补全,得到补全数据的样本时间序列,并对样本时间序列分别进行趋势性分析、突变性预测和波动性预测,从而得到对应的预测结果数据。随后将这些对于的预测结果数据作为样本数据集输入到待训练的支持向量机中,并采用交叉验证法对支持向量机中的模型参数进行优化,得到相关的样本水质参数预测结果,并对样本水质参数预测结果进行验证,从而得到训练好的支持向量回归水质预测模型。

本发明实施例通过对数据进行修复和补全,根据历史时间序列分析方法得到时间序列的趋势性预测结果、突变性预测结果和波动率预测结果,同时用在时间序列分析结果的基础上,综合观测数据以及外部环境数据运用支持向量机的方法实现相关水质参数的预测,提高了水质预测的精确性,降低了水质预测的复杂程度,提高了水质预测的效率。

在上述实施例的基础上,所述获取样本水质参数的时间序列,若所述时间序列有数据缺失,则对所述时间序列中的缺失数据进行预测和补全,得到样本时间序列,包括:

根据压缩感知理论对所述样本水质参数的时间序列中的缺失数据进行预测和补全,得到所述样本时间序列。

在本发明实施例中,样本水质参数包括水体温度参数、溶解氧参数、电导率参数和氨氮参数。根据压缩感知理论可知,如果信号本身是稀疏的或在某个稀疏表示基下是稀疏的,就可以对信号数据进行欠采样处理,通过部分或少量的采样值,较大程度恢复出原信号的数据。因此,在本发明实施例中,在获取到样本水质参数的时间序列之后,若时间序列中存在数据缺失的情况,基于压缩感知理论对水体温度参数、溶解氧参数、电导率参数和氨氮参数的时间序列的缺失数据进行预测与补全。

首先,获取样本水质参数的历史数据时间序列:

其中,n为序列长度,xn为n时刻的样本水质参数,则x=ψθ,ψn×n为稀疏矩阵,θ∈rn是x在稀疏矩阵ψ下的表示系数。然后,将稀疏的n维向量x投影到m(m<n)维空间中,即:

其中,为观测矩阵,y∈rm为投影后的测量向量,根据公式:

θ=argmin||θ||;

进行求解优化,则通过可求出样本时间序列

具体地,由于水体水质参数中的水温、溶解氧、氨、氮和电导率都具有天然的时域平滑性,时间序列值仅在少数时刻发生较大变化,因此,时间序列的两个向邻采样值之间仅有少量较大差,其余大部分可以忽略。若构建矩阵:

则时间序列在矩阵ω1下的投影向量为:

其中,θ中的元素xi-xi+1表示时间序列中的两个相邻采样值之差。根据二阶差分方程构建用于表示时域平滑性的矩阵:

则时间序列在ω2下的投影向量为:

统称θ1和θ2为θ,ψ1和ψ2为ψ,则可通过利用时间序列的时域平滑特性设计稀疏表示基ψ,将时间序列中的缺失数据预测问题转化为恢复稀疏向量θ,根据得到进行缺失数据补全和预测的样本时间序列。需要说明的是,在本发明实施例中,在缺失数据的预测和修复过程中,还可以主要针对少量数据缺失的情况,选择利用数理统计的方法建立简单的数值分析模型、状态空间模型和随机模型等,根据收集到的数据发现潜在的规律,从而预测缺失数据,并进行补正,同样达到补全缺失历史数据的目的。

本发明实施例根据压缩感知理论方法对数据进行修复和补全,为之后的水质参数预测提供了精确的预测数据,提高了水质预测的精确性,降低了水质预测的复杂程度,提高了水质预测的效率。

在上述实施例的基础上,所述对所述样本时间序列进行分析处理,得到样本数据集,包括:

根据r/s分析法和kendall秩次相关检测法对所述样本时间序列进行趋势性分析,得到所述样本时间序列趋势性分析结果数据。

在本发明实施例中,针对已经完成缺失数据补全的样本时间序列,根据r/s分析法和kendall秩次相关检测法对样本时间序列进行趋势性分析。首先,通过r/s分析法分析样本时间序列中的趋势成分,其计算步骤为:

步骤s1,获取样本时间均值序列,设样本时间序列为:

{x(t)},t=1,2,…,n;

对应任意正整数τ=1,定义样本时间序列序列为:

步骤s2,获取样本时间序列的累积利差,公式为:

步骤s3,获取极差序列,公式为:

r(τ)=maxx(t,τ),1≤t≤τ;

步骤s4,获取标准差序列,公式为:

步骤s5,获取极差序列和标准差序列之间的比值,公式为:

r(τ)/s(τ)=(ατ)h

根据对数变换,得到ln[r(τ)/s(τ)]=hlnτ+hlnα,其中a为常数,h为hurst指数,根据样本时间序列{x(t)},t=1,2,…,n,利用最小二乘法,得到对应的直线回归方程,其中,直线的斜率为hurst指数,0<h<1,存在以下3种情况:当h=0.5时,时间序列是一个随机游动序列;当0<h<0.5时,时间序列是为反持久性时间序列,即水质参数变化的总体趋势和过去历史趋势相反,且h越接近0,反持续性就越强;当0.5<h<1时,时间序列为持续性时间序列,即水质参数变化的总体趋势和过去历史趋势相同,且h越接近1,持续性就越强。

在完成r/s分析法之后,在本发明实施例中,使用kendall秩次相关检测法提取样本时间序列变化趋势以及变化显著程度,对应时间序列为首先,确定所有对偶观测值(xi,xj,j>i)中xi<xj出现的个数p,计算步骤如下:

其中,z是kendall秩次相关系数,τ是肯德尔统计量,p是样本时间序列中所有对偶观测值(rj,ri,j<i)中rj<ri出现的次数总和,n为序列长度,根据计算结果可知,当z>0时,则样本时间序列呈增长趋势;当z<0时,则样本时间序列呈下降趋势,且|z|越大,则变换趋势越显著。

在上述实施例的基础上,所述对所述样本时间序列进行分析处理,得到样本数据集,还包括:

对所述样本时间序列进行突变性分析,得到所述样本时间序列突变性分析结果数据。

在本发明实施例中,对已完成缺失数据补全的样本时间序列进行突变型分析。首先,设设样本时间序列为{x(t)},t=1,2,…,n,通过统计量来检测两个子系列x1,x2,…,xi和xi+1,xi+2,…,xn是否来自于同一个分布函数,统计量ut,n通过以下计算步骤得到:

ut,n=ut-1,n+vt,n,t=2,3,…,n;

其中,当计算不同位置t处的统计量ut,n之后,获得最大ut,n对应位置的t可能为突变点,即kτ={max(|ut,n|),1≤t≤n},并对突变点的显著性进行检验,公式为:

若poa<0.05,则表示在0.05置信水平以下,该序列所在位置t处发生显著突变。

在上述实施例的基础上,所述对所述样本时间序列进行分析处理,得到样本数据集,还包括:

根据所述样本时间序列构建广义自回归条件异方差模型,以对所述样本时间序列的波动性进行预测,得到所述样本时间序列波动信息。

在本发明实施例中,首先,建立自回归条件异方差模型(autoregressiveconditionalheteroskedasticity,简称arch),设扰动项为εt,方差为则时刻t的扰动项εt对应的方差依赖于时刻(t-1)的平方误差大小,即依赖于在历史数据已知的情况下,零均值和纯随机残差序列都有异方差性,且在残差平方序列中包含相关信息。因此,通过构建arch模型提取相关信息以获取序列异方差的波动特性,则arch(q)模型表示为:

其中,arch(q)模型满足以下条件:

进一步地,建立广义自回归条件异方差模型(generalizedautoregressiveconditionalheteroskedasticity,简称garch),表示为garch(p,q),garch模型通过考虑异方差函数的p阶自相关性,可以有效拟合长期记忆性的异方差函数,则调整arch(q)模型成garch(p,q)模型的条件方差公式为:

其中,p是garch项的阶数,q是arch项的阶数,garch模型满足以下条件:

其中,是衰减系数,表示外部冲击对εt波动影响的持久性,若衰减系数小于1,则εt是平稳过程,外部冲击对εt波动性产生的影响会逐步衰减;若衰减系数等于1或无线接近于1,则εt是非平稳过程,则外部冲击对εt波动性产生的影响不会逐步衰减,并且持续较长时间。需要说明的是,在本发明实施例中,根据赤池信息准则(akaikeinformationcriterion,简称aic)和贝叶斯信息准则(bayesianinformationcriterion,简称bic)对garch模型进行定阶。aic准则定阶公式为:

aic=2k-2ln(l);

其中,k是模型参数个数,l是似然函数,因此,根据aic准则,从一种可供选择的不同garch模型中,选择aic最小的模型作为最优模型;而bic准则考虑样本数量,当样本数量过高时,能够有效防止模型精度过高造成的模型复杂程度过高,bic准则定阶公式为:

bic=kln(n)-2ln(l);

根据bic准则,惩罚项在维数过大且训练样本数据相对较少的情况下,可以有效避免维度灾难现象。

本发明实施例根据历史时间序列分析方法得到时间序列的趋势性预测结果、突变性预测结果和波动率预测结果,将水质参数历史时间序列分析方法、garch模型和支持向量机理论相结合,综合观测数据以及外部环境数据实现相关水质参数的预测,提高了水质预测的精确性,降低了水质预测的复杂程度,提高了水质预测的效率。

在上述实施例的基础上,在所述将所述样本数据集输入到待训练的支持向量机中,对所述待训练的支持向量机进行训练之前,所述方法还包括:

根据交叉验证法优化支持向量机的模型参数,得到所述待训练的支持向量机。

在本发明实施例中,在构建支持向量回归水质预测模型之后,使用交叉验证法,在充分反映水质参数信息的同时,寻找出模型的最优解,从而增强模型的学习能力和泛化能力。首先,将样本水质参数、样本外部环境数据、样本时间序列趋势性分析结果、样本时间序列突变性分析结果以及样本时间序列波动信息作为变量输入到支持向量回归水质预测模型中,并选取径向基函数:

作为支持向量回归水质预测模型的核函数,运用交叉验证法对模型参数进行寻优,得到所述待训练的支持向量机,最终得到相关水质参数预测结果。

具体地,将样本数据集随机平均分为k个数量相同的组。其中,第一组为验证集,并针对剩余k-1组上拟合的模型进行误差验证,得到均方误差mse1;再将第二组作为验证集,针对剩余k-1组上拟合的模型进行误差验证,得到均方误差mse2;在重复k次之后,得到k个测试误差值:mse1,mse2,...,msek。求解上述k个误差值的平均数,即获得交叉验证的估计结果,从而对模型参数进行寻优。

本发明实施例通过对支持向量回归水质预测模型进行交叉验证,从而优化了模型参数,提高了模型的预测精准度。

图2为本发明实施例提供的基于时间序列和支持向量回归的水质预测装置的结构示意图,如图2所示,本发明实施例提供了一种基于时间序列和支持向量回归的水质预测装置,包括:获取模块201、分析处理模块202和水质参数预测模块203,其中,获取模块201用于获取历史水质参数的完整时间序列;分析处理模块202用于对所述完整时间序列分别进行时间序列趋势性分析、时间序列突变性分析和时间序列波动信息分析,得到待预测数据集;水质参数预测模块203用于基于训练后的支持向量回归水质预测模型,对所述待预测数据集进行预测,获取到目标水质预测参数。

本发明实施例提供的一种基于时间序列和支持向量回归的水质预测装置,针对部分或大量观测数据缺失的情况,利用压缩感知理论方法对数据进行修复和补全,根据历史时间序列分析方法得到时间序列的趋势性预测结果、突变性预测结果和波动率预测结果,在时间序列分析结果的基础上,综合观测数据以及外部环境数据运用支持向量机的方法实现相关水质参数的预测,提高了水质预测的精确性,降低了水质预测的复杂程度,提高了水质预测的效率。

在上述实施例的基础上,所述装置还包括:样本采集模块、样本分析模块和支持向量机训练模块,其中,样本采集模块用于获取样本水质参数的时间序列,若所述时间序列有数据缺失,则对所述时间序列中的缺失数据进行预测和补全,得到样本时间序列;样本分析模块用于对所述样本时间序列进行分析处理,得到样本数据集,所述样本数据集包括所述样本水质参数、样本外部环境数据、样本时间序列趋势性分析结果数据、样本时间序列突变性分析结果数据和样本时间序列波动信息;支持向量机训练模块用于将所述样本数据集输入到待训练的支持向量机中,对所述待训练的支持向量机进行训练,得到所述样本水质参数的样本水质预测参数,从而获取到所述训练后的支持向量回归水质预测模型。

在上述实施例的基础上,所述样本采集模块包括:数据补全单元,用于根据压缩感知理论对所述样本水质参数的时间序列中的缺失数据进行预测和补全,得到所述样本时间序列。

在上述实施例的基础上,所述样本分析模块包括:第一分析单元,用于根据r/s分析法和kendall秩次相关检测法对所述样本时间序列进行趋势性分析,得到所述样本时间序列趋势性分析结果数据。

在上述实施例的基础上,所述样本分析模块还包括:第二分析单元,用于对所述样本时间序列进行突变性分析,得到所述样本时间序列突变性分析结果数据。

在上述实施例的基础上,所述样本分析模块还包括:第三分析单元,用于根据所述样本时间序列构建广义自回归条件异方差模型,以对所述样本时间序列的波动性进行预测,得到所述样本时间序列波动信息。

在本发明实施例中,基于时间序列和支持向量回归的水质预测装置中还设置有环境信息采集模块,部署在需要监测的目标水域附近。环境信息采集模块功能是通过外联传感器获取目标水域温度、溶氧量、电导率和氨氮等环境信息,并通过usb接口上传至嵌入式微处理器中。嵌入式微处理器控制数据通信模块从用户远程监控中心接收外部环境数据,并向用户远程监控中心传送采集到的环境信息和水质参数预测信息。用户远程监控中心对这些环境信息进行显示和存储,以便管理人员实时查看并作出相应的参数设置、工作状态管理等操作。图3为本发明实施例提供的基于时间序列和支持向量回归的水质预测装置的设计框架示意图,如图3所示,水质预测装置外联多个水质参数传感器,并内置arm芯片,具备与云端进行通讯的功能。

本发明实施例提供的装置是用于执行上述各方法实施例的,具体流程和详细内容请参照上述实施例,此处不再赘述。

图4为本发明实施例提供的电子设备结构示意图,如图4所示,该电子设备可以包括:处理器(processor)401、通信接口(communicationsinterface)402、存储器(memory)403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信。处理器401可以调用存储器403中的逻辑指令,以执行如下方法:获取历史水质参数的完整时间序列;对所述完整时间序列分别进行时间序列趋势性分析、时间序列突变性分析和时间序列波动信息分析,得到待预测数据集;基于训练后的支持向量回归水质预测模型,对所述待预测数据集进行预测,获取到目标水质预测参数。

此外,上述的存储器403中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:获取历史水质参数的完整时间序列;对所述完整时间序列分别进行时间序列趋势性分析、时间序列突变性分析和时间序列波动信息分析,得到待预测数据集;基于训练后的支持向量回归水质预测模型,对所述待预测数据集进行预测,获取到目标水质预测参数。

本发明实施例提供一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储服务器指令,该计算机指令使计算机执行上述实施例所提供的基于时间序列和支持向量回归的水质预测方法,例如包括:获取历史水质参数的完整时间序列;对所述完整时间序列分别进行时间序列趋势性分析、时间序列突变性分析和时间序列波动信息分析,得到待预测数据集;基于训练后的支持向量回归水质预测模型,对所述待预测数据集进行预测,获取到目标水质预测参数。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1