基于偏最小二乘回归的疏浚作业产量预测模型建立方法

文档序号：6620374阅读：427来源：国知局

基于偏最小二乘回归的疏浚作业产量预测模型建立方法
【专利摘要】本发明公开了一种基于偏最小二乘回归的疏浚作业产量预测模型建立方法，采取一种先进的多元回归分析方法，通过将自变量和因变量的高维数据空间投影到相应的低维特征空间，分别得到自变量与因变量的相互正交的特征向量，再建立自变量和因变量的特征向量间的线性回归关系。它在选取特征向量时强调自变量对因变量的解释和预测作用，去除了对回归无益的噪声的影响，使模型包含最小的变量数，因而其模型具有较好的鲁棒性和预测的稳定性。可为疏浚作业产量的优化研究打下理论基础，达到高效率、高产量、低能耗的目的，对挖泥船进行产量预测具有重要意义。
【专利说明】基于偏最小二乘回归的疏浚作业产量预测模型建立方法

【技术领域】
[0001] 本发明涉及基于偏最小二乘回归分析在疏浚作业产量预测模型中的应用，属于疏浚工程领域。

【背景技术】
[0002] 疏浚工程是水利水运工程的重要项目。现代疏浚作业主要依靠挖泥船来进行，而产量是衡量挖泥船效率的重要标准。绞吸式挖泥船疏浚作业是一个多因素相互作用、相互影响的过程，产量的影响因素非常多且复杂。在现阶段疏浚施工中，主要还是以人工优化为基础，依靠以往经验判断疏浚施工的主要作业参数，施工效率较低。如何确保合理有效的工艺决策，减少调控参数，降低操作复杂性，成为疏浚低能耗、低排放、高效率的关键问题。因此，实现疏浚作业产量预测模型意义重大。
[0003] 偏最小二乘法（Partial least squares, PLS)是一种先进的多元回归分析方法，通过将自变量和因变量的高维数据空间投影到相应的低维特征空间，分别得到自变量和因变量的相互正交特征向量，再建立自变量和因变量特征向量的一元线性回归关系。与主成分分析（Primary Component Analysis，PCA)相比较：PLS不仅可有效地克服普通最小二乘回归方法的共线性问题，它在选取特征向量时强调自变量对因变量的解释和预测作用，去除了对回归无益噪声的影响，是模型包含最少的变量数，因而PLS模型具有更好的鲁棒性和预测稳定性。PLS方法的良好性能使得它在工业过程的建模与控制中得到广泛的应用。

【发明内容】

[0004] 本发明的目的在于克服上述缺陷，利用现有的偏最小二乘回归方法，提供基于偏最小二乘回归的疏浚作业产量预测模型建立方法，对挖泥船产量预测模型建立进行分析，为疏浚作业产量的优化研究打下理论基础，达到高效率、高产量、低能耗的目的，对挖泥船进行产量预测具有重要意义。
[0005] 为了解决上述问题，本发明装置所采用的技术方案为：一种基于偏最小二乘回归的疏浚作业产量预测模型建立方法，其特征在于包括以下步骤：
[0006] 步骤（1):收集影响疏浚作业产量因素变量的数据资料，确定P个分析变量，列出因变量与自变量样本矩阵；其中，P为正整数；
[0007] 步骤（2):对样本矩阵进行标准化处理；
[0008] 步骤（3):根据标准样本矩阵，提取主成分；
[0009] 步骤（4):根据提取主成分终止判断准则，依次计算出主成分对自变量、因变量信息的解释能力；
[0010] 步骤（5):确定主成分个数；
[0011] 步骤（6):根据主成分个数，建立回归预测方程。
[0012] 上述步骤（1)中的样本矩阵如下：
[0013] 设对p个自变量x2，…xp和q个因变量yp y2，…yq行了 η次观测，分别记自变量与因变量的"样本点X变量"型的数据矩阵为：
[0014] X = (XijOnxp = (Xi，x2, . . . xp), i = 1,2. . . , n ； j = 1,2, . . . P
[0015] Y = (yij)nxq = (yi? y2? · · · yq)? ? = 1? 2 , . . . , n ；j = 1,2, . . . q
[0016] 上述步骤（2)中矩阵标准化处理如下：
[0017] 记标准化后的数据矩阵为：
[0018] E0 = (eiJ)nXp 和 Ε0 = (?^)ηΧ(1
[0019] 其中

【权利要求】
1. 基于偏最小二乘回归的疏浚作业产量预测模型建立方法，其特征在于，包括以下步骤：步骤（1):收集影响疏浚作业产量因素变量的数据资料，确定P个分析变量，列出因变量与自变量样本矩阵；其中，P为正整数；步骤（2):对样本矩阵进行标准化处理；步骤（3):根据标准样本矩阵，提取主成分；步骤（4):根据提取主成分终止判断准则，依次计算出主成分对自变量、因变量信息的解释能力；步骤（5):确定主成分个数；步骤（6):根据主成分个数，建立回归预测方程。
2. 根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法，其特征在于，所述步骤（1)中的样本矩阵如下：设对P个自变量Xi，x2，…xp和q个因变量丫:，％，…行了 η次观测，分别记自变量与因变量的"样本点X变量"型的数据矩阵为： X - (xj j) nXp - (Xj，x2，· · · Xp)，i - 1? 2 . . . , n ； j - 1，2，···ρ Y = (yij)nxq = (yi，y2，· · · yq)，i = i，2...，n;j = i，2，...q。
3. 根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法，其特征在于，所述步骤（2)中矩阵标准化处理过程如下：记标准化后的数据矩阵为： E 〇 = (θυ)ηΧρ 和 F〇=知）- 其中
(1-1)

(1-2) 式中（1-1)和式中（1-2)中，
分别为矩阵X与Y的第j列数据的平均值，sxpsyj 为矩阵X与Y的第j列数据的标准差。
4. 根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法，其特征在于，步骤（3)中主成分提取的计算步骤如下： ①第一轮主成分提取求矩阵
的最大特征值所对应单位特征向量Wl，得自变量的第一个主成分，h =EqW! 求矩阵
的最大特征值所对应单位特征向量Cl，得因变量的第一个主成分， ul = F0C! 求残差矩阵
0-3) (1-4) 式中（1-3)中
式中（1-4)中
②新一轮主成分提取令^ = Ερ匕=匕，对残差矩阵进行新一轮的主成分提取设第h步的计算结果为 th = Eh-iWh (1-5) % = Fh-ich (1-6)
(1-7)
(1-8) 式（1-5)?（1-8)中，
5. 根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法，其特征在于，所述步骤（4)中的提取主成分终止判断准则采用复测定系数准则，由统计量
(1-9) 评价自变量系统的前h个主成分是否对因变量Y系统有足够的解释能力；复测定系数
度量的是由前h个主成分构建的回归方程能够解释的变异信息量占总变异的百分比，当h = m且复测定系数
的值足够大时，可在第m步终止主成分提取计算，其中
在复测定系数.
i的应用中，参考统计量
(1-10) 值的大小，
度量的是自变量X系统被提取的变异信息量。
6. 根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法，其特征在于，所述步骤（4)中主成分对自变量、因变量信息的解释能力的计算过程如下：记P 2 (y」；th)是主成分th与因变量yj的简单相关系数的平方，t h对因变量系统Y的解释能力： RcKyj ；th) = p 2(yj ；th) (1-11)
(M2) h，t2, · · ·，tm对因变量系统Y的累计解释能力：
(1-13) 依据式（1-11)?（1-13)，计算各主成分对因变量Υ的解释能力；记Ρ 2 ;th)是主成分th与自变量&的简单相关系数的平方，th对自变量系统X的解释能力： Rd(Xj ；th) = p 2(xj ；th) (1-14)
(M5) h，t2, · · ·，tm对自变量系统X的累计解释能力
(1-16) 依据式（1-14)?（1-16)计算各主成分对自变量X的解释能力。
7. 根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法，其特征在于所述步骤（5)中主成分个数的确定如下：分别绘制主成分和主成分对因变量Y解释能力总信息及自变量X解释能力总信息柱状图，找出Rdh(Cum) > 85%时，两者的主成分个数，然后对其两者取主成分个数交集。
8. 根据权利要求1所述的基于偏最小二乘回归的疏浚作业产量预测模型建立方法，其特征在于，所述步骤￠)中根据主成分个数，建立回归预测方程过程如下： ① 建立F。关于主成分tp t2,...，乜的多元线性回归方程
(1-17) ② 变换为关于标准化变量的PLS回归方程将
代入方程（1-17)，得F。关于E。的PLS回归方程
(1-18) 其中，
为单位矩阵。 ③ 还原为关于原始变量的PLS回归方程将方程（1-18)还原成关于原始变量的PLS回归方程
(1-]9} 其中，ak是矩阵
的第k个列向量，知是％的第i个分量，i = 1，2,…， m, k 二 1,2, · · · , q〇
【文档编号】G06F19/00GK104123451SQ201410340375
【公开日】2014年10月29日申请日期:2014年7月16日优先权日:2014年7月16日
【发明者】李凯凯, 许焕敏, 穆乃超, 宋庆峰, 周玉刚申请人:河海大学常州校区

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李凯凯;许焕敏;穆乃超;宋庆峰;周玉刚
技术所有人：河海大学常州校区
我是此专利的发明人

上一篇：一种机柜网线的部署方法
上一篇：一种针对信息检索结果多元化的分数规范化方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。