一种基于数据融合的水产养殖水质溶解氧预测方法

文档序号:10594708阅读:545来源:国知局
一种基于数据融合的水产养殖水质溶解氧预测方法
【专利摘要】本发明涉及一种基于数据融合的水产养殖水质溶解氧预测方法,主要包括如下步骤:S1:获得多处溶解氧数值和气象数据,并对溶解氧数值进行归一化处理;S2:通过K?聚类算法优化的RBF网络对归一化后的数据进行处理,得到更准确的溶解氧数值;S3:将更准确的溶解氧数值和步骤S1的气象数据重新组合形成样本预测训练样本,利用训练样本训练最小二乘支持向量机模型,获取最优最小二乘支持向量机预测模型;S4:在线实时采集水产养殖生态环境的溶解氧数据和气象环境数据,利用最优最小二乘支持向量机预测模型获得溶解氧预测值。采用本发明的方法可实现溶解氧精确、高效预测,为后续实现水产养殖的在线预测预警和智能控制奠定基础。
【专利说明】
-种基于数据融合的水产养殖水质溶解氧预测方法
技术领域
[0001] 本发明属于水产养殖技术领域,具体设及一种基于数据融合的水产养殖水质溶解 氧预测方法。
【背景技术】
[0002] 池塘水产养殖过程中,溶解氧是水产品赖W生存的重要指标,及时准确的掌握溶 解氧浓度的变化趋势是确保高密度水产养殖的关键。若不能精确掌握养殖池塘溶解氧浓度 的变化趋势,增氧补救不及时,低氧或者严重缺氧的胁迫环境不仅制约着水产品健康甚至 导致大面积水产死亡,给用户带来巨大的经济损失,还严重影响水产养殖业的健康持续发 展。为此,基于智能信息处理技术对养殖水体溶解氧浓度进行准确预测,及时掌握养殖溶解 氧的变化规律,辨识溶解氧异常变化,防范水质恶化及疾病爆发、水环境保护与治理提供科 学决策依据。
[0003] 目前现有的水质溶解氧预测模型,输入参数多来自于单一传感器,易出现数据缺 失、数据异常等问题,预测得到的溶解氧数值准确性、可靠性较低,不能很好的满足水产养 殖的需求。

【发明内容】

[0004] 本发明的目的是针对现有技术存在的缺陷和不足,提供一种基于数据融合的水产 养殖水质溶解氧预测方法,该方法通过布设多个溶解氧传感器、获取多个溶解氧数据值,通 过数据融合方法实现溶解氧的可靠实时测量,然后依据可靠、准确的数据源建立的预测模 型将实现更加精确的养殖水质溶解氧预测。
[0005] 本发明的目的是通过如下技术方案实现的:
[0006] -种基于数据融合的水产养殖水质溶解氧预测方法,包括如下步骤:
[0007] Sl:数据获取与预处理:采集水产养殖生态环境的溶解氧数据和气象环境数据,作 为原始数据集,并将采集到的溶解氧数据进行归一化处理;
[000引S2:数据融合处理:通过K-聚类算法优化的RB巧巾经网络算法对步骤Sl归一化处理 后的溶解氧数据进行融合,获得更准确的溶解氧数值;
[0009] S3:预测模型构建:将所述更准确的溶解氧数值与步骤Sl中同时刻采集的气象数 据重新组合作为预测模型的训练样本,利用所述训练样本训练最小二乘支持向量机模型并 优化最小二乘支持向量机的参数,W获取最优最小二乘支持向量机预测模型;
[0010] S4:溶解氧实时预测:在线实时采集水产养殖生态环境的溶解氧数据和气象环境 数据,利用所述最优最小二乘支持向量机预测模型获得溶解氧预测值。
[0011] 其中,为了提高预测的精准度,步骤Sl中,每次采集的溶解氧数据为4-8个,优选6 个。由于随着池塘水深的改变,溶解氧的浓度也会发生改变,为了进一步确保测定结果的精 准度,所述溶解氧数据优选从均布在同一水层的4-8个溶解氧传感器处获取。
[0012] 气象环境的变化会引起溶解氧浓度的变化,而溶解氧受水体环境和气象因子的影 响呈非线性变化,本发明将气象环境数据作为输入样本的一部分可进一步增加预测的精准 性。
[0013] 优选地,本发明所述的气象环境数据包括水溫、空气湿度、空气溫度、风速、光照强 度5种。水溫由设置在池塘中的水溫传感器提供,空气湿度、空气溫度、风速、光照强度等参 数由布设在池塘岸边的气象数据采集装置提供。
[0014] 其中,步骤Sl中,归一化方法为本领域公知的方法,即采用如下公式对采集到溶解 氧原始数据进行归一化处理:
[0015]
[0016] 其中,Xi为第i个输入数据,Xmin为输入数据中的最小值,Xmax为输入数据中的最大 值,n为数据的总个数,f(Xi)为归一化后数据。
[0017] 步骤S2中采用K-聚类算法对RB巧巾经网络进行优化,其具体优化方法包括如下步 骤:
[0018] S21:将采集的光照强度、风速、空气溫度、空气湿度、水溫、及多处溶解氧作为样本 向量XiQ = I ,2. . .n),初始化聚类中屯、Cj( j = l ,2. . .k);
[0019]其中,n为样本数量,k聚类中屯、个数。
[0020] S22:把样本向量XiQ = 1,2.. .n)分配给初始化聚类中屯、CjO = 1,2.. .k)的聚类集 合0^ i = 1,2. . . k),按公5
计算每个0J中训练样本的平均值作为新的聚类中 屯、,根据聚类中屯、Cj与它最邻近的聚类中屯、之间的距离确定隐含层神经元节点的基宽向量 bj = Od"隐含层到输出层之间的权值通过最小二乘法得到,即W=化THrVd;
[0021] 其中,山=minllCi-如I,为第i个聚类中屯、与最邻近聚类中屯、之间的距离,O为重 叠系数;H=比l,h2. . .hn],hn为高斯基函数;n为样本数量。
[0022] S23:依据Step22获得RB巧巾经网络的最优的聚类中屯、C,计算RB巧巾经网络宽度〇的 值,利用最小二乘法计算RB巧巾经网络连接权值W,构建RBF网络,W溶解氧数据为输入数据, 利用构建的RBF网络,获得更准确的溶解氧参数数值。
[0023] 步骤S3中,所述最小二乘支持向量机模型LS_SVM为:
[0024]

[0025] 其中,X为所述训练样本集中任意一个样本向量,所述样本向量为特征向量{VI, V2,…,VI,…,Vn} ,F(X)为X的溶解氧样预测值,a功拉格朗日乘子,〇<ai<A,参数b是Qi的偏差 值;
[00%] ]所述LS_SVM的径向基核函数;其中,Ci为径向基核函数的中屯、, O为核函数覆盖宽度。
[0027]优选地,本发明W回归误差平方和最小为适应度,采用改进的粒子群算法对最小 二乘支持向量机的正则化参数C和RBF核函数的覆盖宽度O进行优化,获得最小二乘向量机 的参数(C,O)最优解,具体包括如下步骤:
[0028] S31:计算所述粒子群中所有粒子的适度值,所述适度值的计算公式如下:
[0029]
[0030] 其中,fitnessUi(t))为t代第i的适度值,Xi为训练样本集中的第i个样本向量,f (Xi)为所述Xi的溶解氧预测值,N为训练样本集中样本向量的个数,t为正整数,i = 1,2,…, 妒;
[0031] Step32:粒子惯性权重U根据粒子适度值的改变进行调整,其表达式为: 巧Pm、,fi化郎s(Xj,)< fitness(pgbest,)
[0032] "二 私-{\ + fitness(pgbestj)< fitness(Xjj)< fitnesS(pbesti六
[0033] 其中,Pm是随机因子,范围为PmG [0,lLfitness(pgbestj)代表全局最优粒子适度 值,f i tness (pbestij)代表个体最优粒子适度值。
[0034] St邱33:依据Step32中调整的粒子惯性权重,更新粒子的速度和位置:
[0035] vij(t+l)=u ? Vij+ciri(pbestij(t)-Xij(t))+C2r2(pgbestij(t)-Xij(t))
[0036] xij(t+l)=xij(t)+vij(t+l)
[0037] 其中,vu(t)表示第t次迭代的第i个粒子在第j维的速度,i = l,2,…,N2;u为惯性 权重,11 = 0.5,(31,02为学习因子,(31,02均为正常数;〇,^为介于[0,1]区间的随机数;
[0038] St邱34:计算训练样本集的均方根误差RMSE,判断RMSE<0.0 l是否成立,若成立,则 停止迭代;否则,当前t的值加1作为新的t,执行步骤Step32。
[0039] 巧中所沐挽力?巧误差RMSR的公式为:
[0040]
[0041 ] N为样本数量,yi为溶解氧真实值,夾为预测值。
[0042] 本发明提供的方法通过布设多处溶解氧传感器,及气象数据传感器,通过数据融 合算法将多点溶解氧参数值进行融合获得更加准确的溶解氧数据,然后与气象数据重新组 合作为预测模型的训练样本,经过样本训练获得最优最小二乘支持向量机的回归模型,并 通过该预测模型对养殖水质的溶解氧进行预测,实现溶解氧精确、高效预测,为后续实现水 产养殖的在线预测预警和智能控制奠定了基础。
【附图说明】
[0043] 图1为本发明溶解氧预测方法的流程图;
[0044] 图2为本发明一种【具体实施方式】中传感器的布设示意图;
[0045] 图3为基于数据融合算法的数据样本处理流程图。
【具体实施方式】
[0046] W下实施例用于说明本发明,但不用来限制本发明的范围。
[0047] 实施例1
[0048] -种基于数据融合的水产养殖水质溶解氧预测方法,包括如下步骤:
[0049] SI:数据获取与预处理:采集水产养殖生态环境的溶解氧数据和气象环境数据,作 为原始数据集,并将采集到的溶解氧数据进行归一化处理;
[0050] 具体地,W - 130mX45m的池塘为例,在同一水层均匀布设6个溶解氧传感器(具体 布设位置请参考图2 ),在池塘岸边设置气象数据采集装置,在池塘水中设置水溫传感器,每 隔IOmin采集一次溶解氧、空气湿度、空气溫度、风速、光照强度、水溫数据,连续采集10天, 形成原始数据样本,所述原始数据样本中包括1440组数据,其中溶解氧数据为8640 (1440 X 6)个。将Sfi4O个媛傭氧狱报格昭加下公古讲巧归一化々h巧;
[0化1 ]
[0052] 其中,Xi为第i个输入数据,Xmin为输入数据中的最小值,Xmax为输入数据中的最大 值,n为数据的总个数,f(xi)为归一化后数据。
[0053] S2:采用K-聚类算法优化RB巧申经网络得到中屯、向量和基宽向量,并依据运两个向 量构建RBF网络,然后W每组六个溶解氧数据作为输入数据,获得更准确的溶解氧数值。
[0054] 其中,K-聚类算法优化R邸神经网络的方法具体为:
[0055] S21:将采集的光照强度、风速、空气溫度、空气湿度、水溫、及多处溶解氧作为样本 向量XiQ = I ,2. . .n),初始化聚类中屯、Cj( j = l ,2. . .k);
[0056] 其中,n为样本数量,k聚类中屯、个数。
[0057] S22:把样本向量沿。=1,2...11)分配给初始化聚类中屯、(:^〇 = 1,2...1〇的聚类集 合0^ i = 1,2. . . k),按公J
十算每个0J中训练样本的平均值作为新的聚类中 屯、,根据聚类中屯、Cj与它最邻近的聚类中屯、之间的距离确定隐含层神经元节点的基宽向量 bj = Od"隐含层到输出层之间的权值通过最小二乘法得到,即W=化邮-1的;
[0化引其中,dj=min M Ci-Cj I I,为第i个聚类中屯、与最邻近聚类中屯、之间的距离,O为重 叠系数;H=比l,h2. . .hn],hn为高斯基函数;n为样本数量。
[0059] S23:依据Step22获得RB巧巾经网络的最优的聚类中屯、C,计算RB巧巾经网络宽度〇的 值,利用最小二乘法计算RB巧巾经网络连接权值W,构建RBF网络,W溶解氧数据为输入数据, 利用构建的RBF网络,获得更准确的溶解氧参数数值。
[0060] S3:预测模型构建:将所述更准确的溶解氧数值与步骤Sl中同时刻采集的气象数 据重新组合作为预测模型的训练样本,利用所述训练样本训练最小二乘支持向量机模型并 优化最小二乘支持向量机的参数,W获取最优最小二乘支持向量机预测模型;
[0061 ]其中,所述最小二乘支持向量机模型LS_SVM为:
[0062]
[0063] 共T,训巧巧夺荣T化思一/1、巧本向量,所述样本向量为特征向量{Vi, V2,…,VI,…,Vn} ,F(X)为X的溶解氧样预测值,a功拉格朗日乘子,0<〇1分,参数b是Qi的偏差 值;
[0064]
^^$LS_SVM的径向基核函数;其中,Cl为径向基核函数的中屯、, O为核函数覆盖宽度。
[0065] 本发明采用粒子群算法对最小二乘支持向量机的正则化参数C和核函数的覆盖宽 度曰进行优化。粒子群算法在运行过程中,如果某粒子发现一个当前最优位置,其它粒子将 迅速向其靠犹,如果该最优值为局部最优点,粒子群就无法解决空间内重新捜索,算法就陷 入局部最优,出现了早熟收敛现象。为了克服传统粒子群算法的缺点,提高算法的性能,针 对粒子群(PSO)算法中出现的早熟收敛现象,本发明采用的粒子群算法对粒子速度进行了 变异,进而可改变粒子的前进方向,有望跳出局部最优,从而得到全局最优的参数(〇2,〇, 所述步骤具体包括:
[0066] SSl.宵祈冰輪早掛由祈巧輪早的谭度值,所述适度值的计算公式如下:
[0067]
[00側其中,fitness(Xi(t))为t代第i的适度值,X功训练样本集中的第i个样本向量,f (Xi)为所述Xi的溶解氧预测值,N为训练样本集中样本向量的个数,t为正整数,i = l,2,…, 妒;
[0069] Step32:粒子惯性权重U根据粒子适度值的改变进行调整,其表达式为: \u ? (I - Pw),fitness(x ) < fitness(pghest.)
[0070] 二 ^ J IA ? {}-午 p,。),fitness{p咨best I) < fiMess{x!-!) < fitness{phest;j)
[0071] 其中,Pm是随机因子,范围为PmG [0,1];
[0072] vij(t+l)=u ? Vij+ciri(pbestij(t)-Xij(t))+C2r2(pgbestij(t)-Xij(t))
[0073] xij(t+l)=xij(t)+vij(t+l)
[0074] 其中,vu(t)表示第t次迭代的第i个粒子在第j维的速度,i = l,2,…,N2;u为惯性 权重,11 = 0.5,(31,02为学习因子,(31,02均为正常数;〇,^为介于[0,1]区间的随机数;
[00巧]St邱34:计算训练样本集的均方根误差RMSE,判断RMSE<0.0 l是否成立,若成立,则 停止迭代;否则,当前t的值加1作为新的t,执行步骤Step32。
[0076]其中所述均方根误差MSE的公式为:
[0077;
[007引其中,N为样本
数量,yi为溶解氧真实值,友为预测值。
[0079] S4:在线实时采集水产养殖生态环境的溶解氧数据和气象环境数据,利用所述最 优最小二乘支持向量机预测模型获得溶解氧预测值。
[0080] 具体地,例如实时采集t时刻的6个溶解氧数据,5个气象数据(水溫、光照强度、空 气溫度、空气湿度、风速),对6个溶解氧数据进行归一化处理,然后通过步骤S2化-聚类算法 优化的RB巧巾经网络算法)对归一化数据进行融合,获得更准确的溶解氧数值;将该更准确 的溶解氧数值与t时刻的气象数据组合输入步骤S3得到的最优最小二乘支持向量机预测模 型中,即可获得该最优最小二乘支持向量机预测模型的输出,即t+1时刻的溶解氧预测值。
[0081] 本发明的方法通过数据验证,所得RMSE为0.4057,运行时间为3.2143秒,本发明的 预测方法具有误差小,运算快的特点。
[0082] 本领域技术人员可W理解,本发明的方法可采用软件、硬件、固件或=者任意组合 的方式实现。
[0083] 虽然,上文中已经用一般性说明、【具体实施方式】及试验,对本发明作了详尽的描 述,但在本发明基础上,可W对之作一些修改或改进,运对本领域技术人员而言是显而易见 的。因此,在不偏离本发明精神的基础上所做的运些修改或改进,均属于本发明要求保护的 范围。
【主权项】
1. 一种基于数据融合的水产养殖水质溶解氧预测方法,其特征在于,包括如下步骤: S1:数据获取与预处理:采集水产养殖生态环境的溶解氧数据和气象环境数据,作为原 始数据集,并将采集到的溶解氧数据进行归一化处理; S2:数据融合处理:通过K-聚类算法优化的RBF神经网络算法对步骤S1归一化处理后的 溶解氧数据进行融合,获得更准确的溶解氧数值; S3:预测模型构建:将所述更准确的溶解氧数值与步骤S1中同时刻采集的气象数据重 新组合作为预测模型的训练样本,利用所述训练样本训练最小二乘支持向量机模型并优化 最小二乘支持向量机的参数,以获取最优最小二乘支持向量机预测模型; S4:溶解氧实时预测:在线实时采集水产养殖生态环境的溶解氧数据和气象环境数据, 利用所述最优最小二乘支持向量机预测模型获得溶解氧预测值。2. 根据权利要求1所述的预测方法,其特征在于:步骤S1中,每次采集的溶解氧数据为 4-8个,优选6个。3. 根据权利要求2所述的预测方法,其特征在于:所述溶解氧数据为同一水层不同位置 的数据。4. 根据权利要求1-3任一项所述的预测方法,其特征在于:所述气象环境数据为水温、 空气湿度、空气温度、风速和光照强度。5. 根据权利要求1-4任一项所述的预测方法,其特征在于:步骤S2具体包括如下步骤: S21:将采集的光照强度、风速、空气温度、空气湿度、水温、及多处溶解氧作为样本向量 Xi(i = l ,2. . .η),初始化聚类中心C」(j = l,2. . .k); 其中,η为样本数量,k聚类中心个数; S22:把样本向量Xi(i = l ,2. . .η)分配给初始化聚类中心Cj( j = l,2. . .k)的聚类集合0j (i = l,2...k),按公式十算每个h中训练样本的平均值作为新的聚类中心,根 据聚类中心Q与它最邻近的聚类中心之间的距离确定隐含层神经元节点的基宽向量匕=〇 山;隐含层到输出层之间的权值通过最小二乘法得到,即w=(妳"的; 其中,dj = min| |Ci-Cj| I,为第i个聚类中心与最邻近聚类中心之间的距离,σ为重叠系 数;H=[hi,h2. . .hn],hn为高斯基函数;η为样本数量; S23:依据Step22获得RBF神经网络的最优的聚类中心C,计算RBF神经网络宽度σ的值, 利用最小二乘法计算RBF神经网络连接权值w,构建RBF网络,以溶解氧数据为输入数据,利 用构建的RBF网络,获得更准确的溶解氧参数数值。6. 根据权利要求1-5任一项所述的预测方法,其特征在于:所述最小二乘支持向量机模 型 LS_SVM 为:其中,X为所述训练样本集中任意一个样本向量,所述样本向量为特征向量{V1,V2,···, Vi,…,vn},F(x)为X的溶解氧样预测值,cii为拉格朗日乘子,〇〈α?〈λ,参数b是ai的偏差值;%所述LS_SVM的径向基核函数;其中,ci为径向基核函数的中心,σ为 核函数覆盖宽度。7. 根据权利要求1-6任一项所述的预测方法,其特征在于:步骤S3中,以回归误差平方 和最小为适应度,采用改进的粒子群算法对最小二乘支持向量机的正则化参数C和RBF核函 数的覆盖宽度σ进行优化,获得最小二乘向量机的参数(C, 〇)最优解,具体包括如下步骤: S31:计算所述粒子群中所有粒子的适度值,所述适度值的计算公式如下:其中,fitness(xi(t))为t代第i的适度值,xi为训练样本集中的第i个样本向量,f (xi) 为所述Xl的溶解氧预测值,N为训练样本集中样本向量的个数,t为正整数,? = 1,2,···,Ν2; Step32:粒子惯性权重u根据粒子适度值的改变进行调整,其表达式为:其中,Pm是随机因子,范围为pme[〇,l]; Step33:依据Step32中调整的粒子惯性权重,更新粒子的速度和位置: Vij(t+1) = u · Vij+ciri(pbestij(t)-Xij(t))+C2r2(pgbestij(t)-Xij(t)) Xij(t+l) = Xij(t)+Vij(t+l) 其中,vij( t)表示第t次迭代的第i个粒子在第j维的速度,i = 1,2,…,N2; u为惯性权重, 1! = 0.5,(:1,(32为学习因子,(31,(32均为正常数# 142为介于[0,1]区间的随机数; Step34:计算训练样本集的均方根误差RMSE,判断RMSE〈0.01是否成立,若成立,则停止 迭代;否则,当前t的值加1作为新的t,执行步骤Step32。8. 根据权利要求7所述的预测方法,其特征在于:所述均方根误差RMSE公式为:其中,N为样本数量,yi为溶解氧真实值,骂为预测值。
【文档编号】G06Q10/04GK105956702SQ201610285482
【公开日】2016年9月21日
【申请日】2016年4月29日
【发明人】陈英义, 于辉辉, 李道亮, 位耀光, 刘延忠, 许静, 甄珠米, 杨昊, 孙传仁, 王利民, 魏晓华, 薛佳妮
【申请人】中国农业大学, 山东省农业科学院科技信息研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1