基于偏最小二乘回归的疏浚作业产量预测模型建立方法

文档序号:6620374阅读:427来源:国知局
基于偏最小二乘回归的疏浚作业产量预测模型建立方法
【专利摘要】本发明公开了一种基于偏最小二乘回归的疏浚作业产量预测模型建立方法,采取一种先进的多元回归分析方法,通过将自变量和因变量的高维数据空间投影到相应的低维特征空间,分别得到自变量与因变量的相互正交的特征向量,再建立自变量和因变量的特征向量间的线性回归关系。它在选取特征向量时强调自变量对因变量的解释和预测作用,去除了对回归无益的噪声的影响,使模型包含最小的变量数,因而其模型具有较好的鲁棒性和预测的稳定性。可为疏浚作业产量的优化研究打下理论基础,达到高效率、高产量、低能耗的目的,对挖泥船进行产量预测具有重要意义。
【专利说明】基于偏最小二乘回归的疏浚作业产量预测模型建立方法

【技术领域】
[0001] 本发明涉及基于偏最小二乘回归分析在疏浚作业产量预测模型中的应用,属于疏 浚工程领域。

【背景技术】
[0002] 疏浚工程是水利水运工程的重要项目。现代疏浚作业主要依靠挖泥船来进行,而 产量是衡量挖泥船效率的重要标准。绞吸式挖泥船疏浚作业是一个多因素相互作用、相互 影响的过程,产量的影响因素非常多且复杂。在现阶段疏浚施工中,主要还是以人工优化为 基础,依靠以往经验判断疏浚施工的主要作业参数,施工效率较低。如何确保合理有效的工 艺决策,减少调控参数,降低操作复杂性,成为疏浚低能耗、低排放、高效率的关键问题。因 此,实现疏浚作业产量预测模型意义重大。
[0003] 偏最小二乘法(Partial least squares, PLS)是一种先进的多元回归分析方法, 通过将自变量和因变量的高维数据空间投影到相应的低维特征空间,分别得到自变量和因 变量的相互正交特征向量,再建立自变量和因变量特征向量的一元线性回归关系。与主成 分分析(Primary Component Analysis,PCA)相比较:PLS不仅可有效地克服普通最小二乘 回归方法的共线性问题,它在选取特征向量时强调自变量对因变量的解释和预测作用,去 除了对回归无益噪声的影响,是模型包含最少的变量数,因而PLS模型具有更好的鲁棒性 和预测稳定性。PLS方法的良好性能使得它在工业过程的建模与控制中得到广泛的应用。


【发明内容】

[0004] 本发明的目的在于克服上述缺陷,利用现有的偏最小二乘回归方法,提供基于偏 最小二乘回归的疏浚作业产量预测模型建立方法,对挖泥船产量预测模型建立进行分析, 为疏浚作业产量的优化研究打下理论基础,达到高效率、高产量、低能耗的目的,对挖泥船 进行产量预测具有重要意义。
[0005] 为了解决上述问题,本发明装置所采用的技术方案为:一种基于偏最小二乘回归 的疏浚作业产量预测模型建立方法,其特征在于包括以下步骤:
[0006] 步骤(1):收集影响疏浚作业产量因素变量的数据资料,确定P个分析变量,列出 因变量与自变量样本矩阵;其中,P为正整数;
[0007] 步骤(2):对样本矩阵进行标准化处理;
[0008] 步骤(3):根据标准样本矩阵,提取主成分;
[0009] 步骤(4):根据提取主成分终止判断准则,依次计算出主成分对自变量、因变量信 息的解释能力;
[0010] 步骤(5):确定主成分个数;
[0011] 步骤(6):根据主成分个数,建立回归预测方程。
[0012] 上述步骤(1)中的样本矩阵如下:
[0013] 设对p个自变量x2,…xp和q个因变量yp y2,…yq行了 η次观测,分别记自 变量与因变量的"样本点X变量"型的数据矩阵为:
[0014] X = (XijOnxp = (Xi,x2, . . . xp), i = 1,2. . . , n ; j = 1,2, . . . P
[0015] Y = (yij)nxq = (yi? y2? · · · yq)? ? = 1? 2 , . . . , n ;j = 1,2, . . . q
[0016] 上述步骤(2)中矩阵标准化处理如下:
[0017] 记标准化后的数据矩阵为:
[0018] E0 = (eiJ)nXp 和 Ε0 = (?^)ηΧ(1
[0019] 其中

【权利要求】
1. 基于偏最小二乘回归的疏浚作业产量预测模型建立方法,其特征在于,包括以下步 骤: 步骤(1):收集影响疏浚作业产量因素变量的数据资料,确定P个分析变量,列出因变 量与自变量样本矩阵;其中,P为正整数; 步骤(2):对样本矩阵进行标准化处理; 步骤(3):根据标准样本矩阵,提取主成分; 步骤(4):根据提取主成分终止判断准则,依次计算出主成分对自变量、因变量信息的 解释能力; 步骤(5):确定主成分个数; 步骤(6):根据主成分个数,建立回归预测方程。
2. 根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法,其 特征在于,所述步骤(1)中的样本矩阵如下: 设对P个自变量Xi,x2,…xp和q个因变量丫:,%,…行了 η次观测,分别记自变量 与因变量的"样本点X变量"型的数据矩阵为: X - (xj j) nXp - (Xj,x2,· · · Xp),i - 1? 2 . . . , n ; j - 1,2,···ρ Y = (yij)nxq = (yi,y2,· · · yq),i = i,2...,n;j = i,2,...q。
3. 根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法,其 特征在于,所述步骤(2)中矩阵标准化处理过程如下: 记标准化后的数据矩阵为: E 〇 = (θυ)ηΧρ 和 F〇=知)- 其中
(1-1)

(1-2) 式中(1-1)和式中(1-2)中,
分别为矩阵X与Y的第j列数据的平均值,sxpsyj 为矩阵X与Y的第j列数据的标准差。
4. 根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法,其 特征在于,步骤(3)中主成分提取的计算步骤如下: ①第一轮主成分提取 求矩阵
的最大特征值所对应单位特征向量Wl,得自变量的第一个主成分,h =EqW! 求矩阵
的最大特征值所对应单位特征向量Cl,得因变量的第一个主成分, ul = F0C! 求残差矩阵
0-3) (1-4) 式中(1-3)中
式中(1-4)中
②新一轮主成分提取 令^ = Ερ匕=匕,对残差矩阵进行新一轮的主成分提取 设第h步的计算结果为 th = Eh-iWh (1-5) % = Fh-ich (1-6)
(1-7)
(1-8) 式(1-5)?(1-8)中,
5. 根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法,其 特征在于,所述步骤(4)中的提取主成分终止判断准则采用复测定系数准则, 由统计量
(1-9) 评价自变量系统的前h个主成分是否对因变量Y系统有足够的解释能力; 复测定系数
度量的是由前h个主成分构建的回归方程能够解释的变异信息量占总 变异的百分比,当h = m且复测定系数
的值足够大时,可在第m步终止主成分提取计算, 其中
在复测定系数.
i的应用中,参考统计量
(1-10) 值的大小,
度量的是自变量X系统被提取的变异信息量。
6. 根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法,其 特征在于,所述步骤(4)中主成分对自变量、因变量信息的解释能力的计算过程如下: 记P 2 (y」;th)是主成分th与因变量yj的简单相关系数的平方,t h对因变量系统Y的解 释能力: RcKyj ;th) = p 2(yj ;th) (1-11)
(M2) h,t2, · · ·,tm对因变量系统Y的累计解释能力:
(1-13) 依据式(1-11)?(1-13),计算各主成分对因变量Υ的解释能力; 记Ρ 2 ;th)是主成分th与自变量&的简单相关系数的平方,th对自变量系统X的解 释能力: Rd(Xj ;th) = p 2(xj ;th) (1-14)
(M5) h,t2, · · ·,tm对自变量系统X的累计解释能力
(1-16) 依据式(1-14)?(1-16)计算各主成分对自变量X的解释能力。
7. 根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法,其 特征在于所述步骤(5)中主成分个数的确定如下: 分别绘制主成分和主成分对因变量Y解释能力总信息及自变量X解释能力总信息柱状 图,找出Rdh(Cum) > 85%时,两者的主成分个数,然后对其两者取主成分个数交集。
8. 根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法,其 特征在于,所述步骤¢)中根据主成分个数,建立回归预测方程过程如下: ① 建立F。关于主成分tp t2,...,乜的多元线性回归方程
(1-17) ② 变换为关于标准化变量的PLS回归方程 将
代入方程(1-17),得F。关于E。的PLS回归方程
(1-18) 其中,
为单位矩阵。 ③ 还原为关于原始变量的PLS回归方程 将方程(1-18)还原成关于原始变量的PLS回归方程
(1-]9} 其中,ak是矩阵
的第k个列向量,知是%的第i个分量,i = 1,2,…, m, k 二 1,2, · · · , q〇
【文档编号】G06F19/00GK104123451SQ201410340375
【公开日】2014年10月29日 申请日期:2014年7月16日 优先权日:2014年7月16日
【发明者】李凯凯, 许焕敏, 穆乃超, 宋庆峰, 周玉刚 申请人:河海大学常州校区
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1