一种根据海况与操纵条件预测船舶油耗的方法与流程

文档序号:12469307阅读:1010来源:国知局
一种根据海况与操纵条件预测船舶油耗的方法与流程

本发明属于船舶航运领域,具体涉及一种根据海况与操纵条件预测船舶油耗的方法。



背景技术:

船舶航行过程中的燃油消耗受到气象海况条件、船舶航行状态以及操纵条件等多种不确定因素的影响,而油耗预测对船舶航速、航向等操纵具有重要的指导意义。精确的油耗计算能够更好地指导船员操纵船舶航行,保证在船期要求时间内以低油耗、低排放、高效益的操纵方案航行。然而,影响因素的不确定性以及一些因素之间的高度相关性致使油耗与各影响因素之间的函数关系无法准确确定,也无法准确地计算船舶在航期间的油耗。

统计机器学习是基于大量历史数据的分布,结合统计学理论建立模型假设,通过设计算法过程从数据和模型估计参数,不断学习从而改进模型性能,自动寻找数据之间存在的规律,计算得到一个对自然模型近似的函数关系,并利用所得函数关系对未知数据进行预测,测试模型的泛化能力并验证模型假设的一种研究方法

回归分析是数据挖掘中常用的方法之一,它反映了数据属性值的特性,并通过函数形式表达数据映射的关系,从而发现属性值之间的依赖关系。回归分析方法被广泛应用于对数据序列的预测及相关关系的研究中。

LASSO算法是机器学习算法中一种能够实现指标集合精简,并能处理具有多重共线性性质数据的有偏估计方法。该算法通过在损失函数中引入L1惩罚函数,在回归系数的绝对值之和小于一个常数的约束条件下,使残差平方和最小化,从而使一些指标的回归系数严格等于零,也就是说,LASSO算法具有变量稀疏的特性,能够消除冗余特征,发现问题需要且仅需要的变量,实现指标集合精简的同时得到对结果具有较强解释能力的模型。

LARS算法用于决定哪些变量被选入模型并给出相应变量的参数估计。该算法不是在每一步前向逐步回归中直接加入某个变量,而是先找出和因变量相关度最高的那个变量,然后沿着最小平方误差的方向对变量的系数进行调整,在调整过程中,该变量和残差项的相关系数会逐渐减小直到出现新的变量与残差的相关性大于此时该变量与残差的相关性,然后重新沿着最小平方误差的方向进行调整,重复进行该过程,直至所有变量被选入自变量集合中,最终得到所求的参数估计。



技术实现要素:

本发明提供了一种根据海况与操纵条件预测船舶油耗的方法,能够解决船舶航行过程中油耗计算问题,综合考虑影响船舶航行的气象、海况、航行状态和操纵性能等因素,通过构建统计模型并结合机器学习算法对模型进行参数学习及模型训练,最终训练得到一个油耗预测模型用于解决多种因素影响下船舶油耗的快速、准确预测。

本发明提供的一种根据海况与操纵条件预测船舶油耗的方法,主要发明点是基于LASSO算法的船舶油耗预测模型框架。

基于LASSO算法的船舶油耗预测模型框架基于船舶历史航行数据和气候海况数据,首先建立线性回归预测模型并提出假设,然后采用LASSO算法定义一个代价函数,并转换为求解L1约束下平方误差损失最小化的凸二次规划问题,结合LARS算法求解LASSO问题的稀疏解,实现系数收缩与变量选择,最后训练得到船舶油耗预测模型。

为了实现以上目的,本发明主要包括以下步骤:

步骤(1)原始数据采集。主要采用不同的设备及途径采集气候海况数据、船舶航行状态数据和船舶操纵数据。

步骤(2)数据预处理。针对(1)中采集的原始数据进行数据筛选,对数据去噪、裁剪和同步等处理,然后集成来自多个数据源的数据同时去除冗余,最后对集成的数据进行统一的归一化处理,得到模型训练数据集。

步骤(3)建立油耗预测模型。根据步骤(2)中训练数据集的分布特点以及经验假设输入特征变量与对应预测输出变量之间满足线性关系,建立多元线性回归预测模型。

步骤(4)参数学习与模型训练。基于步骤(2)中得到的训练数据,采用LASSO算法定义一个代价函数,并转换为求解L1约束下平方误差损失最小化的凸二次规划问题,最终结合交叉验证与LARS算法对模型参数进行学习,并采用Osborne对偶算法求解LASSO估计。最后将LASSO估计值代入步骤(3)中建立的油耗预测模型中,得到训练后的油耗预测模型。

步骤(5)模型应用。将未知的气象海况数据和船舶操纵数据输入步骤(5)中得到的油耗预测模型中,可以输出最终的油耗预测结果。

本发明与现有的人工神经网络(BP-ANN)、支持向量回归(SVR)预测模型相比,具有以下特点:

1.本发明能够实现变量稀疏,解决多重共线性问题和过拟合等问题。

本发明主要是采用LASSO算法结合最小二乘法定义一个代价函数,基于训练数据,结合交叉验证与LARS算法求解稀疏解,实现参数收缩与选择,从而实现变量选择的同时解决了多重共线性问题。此外,LASSO算法在目标函数中引入了L1正则化项,通过正则化系数权衡正则化项与平方误差项之间的比重,在一定程度上防止了模型过拟合的情况。

2.本发明有较强的泛化能力以及结果解释能力。

本发明综合考虑了多种影响船舶油耗预测的可能因素,在未知测试数据集上能够得到准确的油耗预测结果,并且能够较好地预测影响因素突变造成的油耗量突变,具有较强的泛化能力和对预测结果的解释能力。。

附图说明

图1为本发明中一种根据海况与操纵条件预测船舶油耗的方法组成框图;

图2为LASSO、BP-ANN和SVR预测模型预测结果对比图;

图3为LASSO、BP-ANN和SVR预测模型预测结果的累计分数对比图;

图4为LASSO、BP-ANN和SVR预测模型预测结果的平均绝对误差值。

具体实施方式

下面结合附图详细描述本发明提供的一种根据海况与操纵条件预测船舶油耗的方法。图1为一种根据海况与操纵条件预测船舶油耗的方法组成框图。

如图1,本发明模型的构建主要包括五个步骤:步骤(1)原始数据采集。主要采用不同的设备及途径采集气候海况数据、船舶航行状态数据和船舶操纵数据;步骤(2)数据预处理。针对(1)中采集的原始数据进行数据筛选,对数据去噪、裁剪和同步等处理,然后集成来自多个数据源的数据同时去除冗余,最后对集成的数据进行统一的归一化处理,得到模型训练数据集;步骤(3)建立油耗预测模型。根据步骤(2)中训练数据集的分布特点以及经验假设输入特征变量与对应预测输出变量之间满足线性关系,建立多元线性回归预测模型;步骤(4)参数学习与模型训练。基于步骤(2)中得到的训练数据,采用LASSO算法定义一个代价函数,并转换为求解L1约束下平方误差损失最小化的凸二次规划问题,最终结合交叉验证与LARS算法对模型参数进行学习,并采用Osborne对偶算法求解LASSO估计。最后将LASSO估计值代入步骤(3)中建立的油耗预测模型中,得到训练后的油耗预测模型;步骤(5)模型应用。将未知的气象海况数据和船舶操纵数据输入步骤(4)中得到的油耗预测模型中,可以输出最终的油耗预测结果。

步骤一:原始数据采集

原始数据主要包括气象海况数据、船舶航行历史数据和船舶操纵数据。气象数据主要来自气象局发布的气象预报信息,海况数据一些传感器间接测量,船舶航行历史数据和操纵数据通过航行日志正午报告和安装在船上的高速、高精度传感器组件获取,最后将数据传送至数据库服务器进行存储和分析。为了进行船舶油耗预测,需要采集的信号包括油耗、燃油密度、燃油温度、纵倾角、横倾角、舷高、螺距、舵角、真航向、偏航角、吃水、风角、风速、对水速度、对地速度、经度、纬度,其中油耗作为输出响应,其他变量作为模型的输入变量。

步骤二:数据预处理

数据预处理是保证高质量的模型预测结果的前提。实际中采集的海量原始数据中一般存在着大量不完整、不一致、重复、高维度且含噪声的数据,严重影响了机器学习算法的执行效率和模型的复杂度。本发明中对步骤一中采集的原始数据通过数据筛选、数据集成和归一化处理得到样本数据集。

步骤三:建立油耗预测模型

由于船舶油耗是有多种因素共同作用的结果,假设油耗与各影响因素之间满足线性关系,因此采用多元线性回归建立预测模型,油耗预测模型可用以下式子表示:

yi=βTxi+∈i(1)

式中,xi表示第i个样本,yi是第i个样本对应的响应变量,即油耗。∈i是服从正态分布的随机误差,β=(β12,…,βp)T是回归系数变量,其中βj表示第j个回归系数。

步骤四:参数学习与模型训练

由于影响油耗的因素之间可能存在高度相关性,比如风速和浪高,气压和风的强度,货物重量和吃水等,为了保证步骤四中各输入变量之间相互独立,本发明中采用LASSO算法进行参数收缩与变量选择。LASSO算法可被表示为如下求解L1约束下平方误差损失最小的问题:

式中,N表示样本大小,p表示每个样本包含的输入变量数目,xij表示第i个样本对应的第j个输入变量,βj表示第j个输入变量对应的回归系数,t表示预先设定的决定正则化程度的自由参数,t≥0。

将(2)式表示为矩阵形式:

s.t.||βj||1≤t (3)

因为所以,

式(3)可以重新写为:

s.t.||βj||1≤t (5)

拉格朗日乘子法表示为:

式中,λ≥0为调节参数,权衡误差平方项与L1正则化项的比重。本发明中采用交叉验证法与LARS算法相结合,计算参数正则化路径,同时求解式(6)中的参数λ,λ对应所有交叉验证结果的平均值中最小的那个均方误差对应的λ值。然后采用Osborne对偶算法求解LASSO估计。最后将LASSO估计值代入式(1)中求得油耗预测模型。

步骤五:模型应用

将气象海况条件和船舶操纵条件数据输入步骤四中训练得到的油耗预测模型中,可以预测得到船舶在该气象海况条件和操纵条件下的燃油消耗量。通过预测的油耗值根据油耗与航速之间的立方函数关系推算出未来船舶航行的速度,从而指导船员在保证航行安全的前提下,在规定船期内,以低油耗、低排放、高效益的操纵方案航行。

如图2为LASSO、BP-ANN和SVR预测模型预测结果对比图。图中显示了将20组未知的气象海况数据和船舶操纵数据输入三种油耗预测模型中,输出的最终油耗预测结果和真实油耗值。从图中可以看出,在相同的航行条件下,LASSO预测模型对油耗的预测更准确,对航行环境的改变更敏感,而且预测结果更稳定。

如图3为LASSO、BP-ANN和SVR预测模型预测结果的累计分数对比图。平均绝对误差(MAE)是指预测值与真实值之差的绝对值求平均值的结果。累计分数定义为:

其中,M是未知数据集的大小,Me<δ表示预测结果的绝对误差小于δ吨/天的数据集大小。从图中可以看出LASSO模型的预测结果与真实值之间的误差相比BP-ANN模型和SVR模型要小,预测精度更高。

如图4为LASSO、BP-ANN和SVR预测模型预测结果的平均绝对误差值比较结果,该结果是在5000个测试集基础上得到。从中可以看出,LASSO模型的预测结果的平均绝对误差最小,平均绝对误差的变化范围也最小。

本领域的技术人员可以对本发明进行各种改型和改变。因此,本发明覆盖了落入所附的权利要求书及其等同物的范围内的各种改型和改变。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1