考虑船舶事故数据漏报问题的Bootstrap-Tobit船舶事故经济损失预测方法与流程

文档序号:19117702发布日期:2019-11-13 01:20阅读:556来源:国知局
考虑船舶事故数据漏报问题的Bootstrap-Tobit船舶事故经济损失预测方法与流程

本发明涉及航运领域,具体涉及船舶事故数据漏报问题解决方法以及船舶事故经济损失分析和预测方法。

技术背景

可靠的航运事故数据库对船舶事故分析至关重要。然而,当前在记录船舶事故方面的工作仍然存在许多漏洞。船舶事故漏报问题是影响航运事故数据库可靠性的一个主要问题,也是海事当局改善海上安全环境所面临的重大挑战之一。

一般来说,海事当局通过改善其事故上报制度/立法来改善航运事故数据漏报问题是最根本的解决办法。然而,对于已经存在漏报情况的船舶历史事故数据来说,补充缺失或漏报事故是完善船舶事故数据库的一种有效途径。

预测船舶事故造成的经济损失,有利于决策者制定有效的管理规定,降低导致重大经济损失的船舶事故的可能性,同时也有利于保险公司制定适当的船舶保险费率。目前,许多模型都可以用来预测船舶事故经济损失,但一般方法未考虑船舶事故经济损失存在上限的问题。如若不考虑这个问题,模型估计结果可能会存在一定程度的右删失偏差。此外,由于船舶事故漏报是普遍存在的问题,很难收集到充足的高质量事故数据样本来保障后续预测过程的准确性。因此,提高船舶事故经济损失预测可靠性是十分必要的。



技术实现要素:

本发明的目的是在解决船舶事故数据漏报问题的前提下,准确构建影响因素与船舶事故经济损失间的关系,为海事当局制定合理的海上安全对策提供理论支持。

本发明提供的考虑水域内船舶事故漏报经济情况的船舶事故经济损失预测方法是这样实现的,主要包括以下步骤:

s1.历史数据收集并处理。收集某一特定统计期内目标水域船舶交通事故数据,并将其按照船舶事故类型、船舶信息、环境特征、船舶事故起因等类别进行分类梳理;

s2.问卷调查。设计面向船长、船员和海事局官员的调查问卷收集关于水域内严重事故和一般事故数据的漏报情况,对目标水域船舶事故不同漏报程度的概率进行问卷调查。

s3.模型建立。包括三个主要步骤:产生bootstrap样本、建立tobit模型、bootstrap-tobit模型估计。将原始样本划分为严重船舶事故样本和一般船舶事故样本,从中有放回的抽取不同漏报率的事故数据并和原始样本合并,得到相应的bootstrap样本;对原始样本和bootstrap样本采用tobit回归模型进行估计,得到相应的模型系数;最后应用相应的公式处理计算得到的模型系数,得到bootstrap-tobit模型结果。

s4.船舶事故经济损失预测。基于步骤一收集到的数据,产生bootstrap样本,对原始样本和bootstrap样本采用tobit回归模型进行估计,得到相应的模型系数,根据bootstrap-tobit模型系数,对船舶事故的经济损失作出预测。

在一些实施方式中,步骤s1.所描述的自变量具体包括碰撞事故、触碰事故、搁浅事故、沉没事故、火灾/爆炸事故、倾覆事故、货船、渔船、lnglpg船、其他船舶类型、船舶总吨、航行状态、发生时间、能见度、大风/浪、事故位置、判断错误、瞭望疏忽、操作失误、机械故障20个变量与船舶事故经济损失因变量。

在一些实施方式中,在步骤s2所描述的关于漏报率概率的问卷调查结果的可靠性直接影响bootstrap-tobit模型结果的精确性。

与现有技术相比,本发明提供的基于bootstrap-tobit模型的船舶事故经济损失预测方法首次加入了对船舶事故漏报问题的考虑,提高了模型结果的精确度,对于船舶经济损失的预测更为准确。

与现有技术相比,当前的船舶经济损失预测模型均未曾考虑船舶事故漏报问题带来的影响,因此相比之下本发明提供的模型更具优越性。

附图说明

为了更清楚地说明本发明实例或

背景技术:
中的技术方案,下面对本发明实例或背景技术中所需要使用的附图进行说明。

图1为本发明实施例提供的不严重船舶事故漏报率的累积密度函数图。

图2为本发明实施例提供的关于bootstrap-tobit模型方法以及船舶事故样本数据关系的原理图。

图3为本发明实施例提供的bootstrap-tobit模型中船舶事故类型系数期望值的相对变化。

图4为本发明实施例提供的bootstrap-tobit模型中船舶类型系数期望值的相对变化。

图5为本发明实施例提供的bootstrap-tobit模型中船舶总吨系数期望值的相对变化。

图6为本发明实施例提供的bootstrap-tobit模型中航行状态系数期望值的相对变化。

图7为本发明实施例提供的bootstrap-tobit模型中环境因素系数期望值的相对变化。

图8为本发明实施例提供的bootstrap-tobit模型中船舶事故致因系数期望值的相对变化。

图9为本发明实施例提供的采用tobit模型和bootstrap-tobit模型的船舶事故经济损失边际效应对比图。

具体实施方式

以下以福建水域2000年至2014年的船舶事故数据,进一步说明本发明方法。

本发明利用所构造的bootstrap-tobit模型来补充漏报船舶事故数据,并评估船舶事故各影响因素对事故后果的影响,应用于福建水域船舶事故经济损失预测与分析的具体方法如下:

s1.根据福建海事局公布的数据,收集福建水域2000年至2014年的船舶事故数据,并将其按照事故发生的船舶事故类型、船舶信息、环境特征、船舶事故起因等类别进行分类梳理。

对所分类梳理完成的1248条船舶事故数据中的碰撞事故、触碰事故、搁浅事故、沉没事故等自变量及因变量经济损失进行描述性统计分析。

表1变量描述

s2.设计面向船长、船员和海事局官员的调查问卷来收集关于水域内严重事故和一般事故数据的漏报情况,处理问卷结果,得到不同漏报程度的概率。假设船舶事故的漏报率为r(仅限水域内使用),即缺失数据样本量与原始船舶事故样本量之比。fserious(r)和fnon-serious(r)表示严重事故和一般事故的概率密度函数。将船舶事故漏报率划分为[0%,10%)、[10%,30%)、[30%,50%)、[50%,80%)、[80%,100%)、[100%,150%)、[150%,180%)和[180%,+∞)八个区间,并将设计好的调查问卷向该海域船员进行发放。调查结果表明严重事故存在漏报的可能性微乎其微,可以忽略不计,即fserious(0)=1。而得到的一般事故漏报率累积密度函数如图1所示,其中累计密度函数表示为fnon-serious(r)(在图1中用fnon-serious(r)表示fnon-serious(r))。每个区间的权重值依次为w1=0.462,w2=0.221,w3=0.141,w4=0.071,w5=0.081,w6=0.009,w7=0.002,w8=0.014。

s3.通过整理好的福建水域船舶事故数据和漏报率调查问卷的结果建立bootstrap-tobit模型,过程如图2所示。具体采用如下步骤进行模型构建:

a.产生bootstrap样本,根据船舶事故后果进行划分,将原始船舶事故数据划分为严重船舶事故样本和一般船舶事故样本,分别用来随机生成缺失数据样本。

对于严重船舶事故和一般船舶事故漏报率的情形,本专利中漏报率定义为漏报船舶事故的样本量与原始样本量的比值,假设我们考虑h组漏报率的情形;对于任一组漏报率,分别都需要抽取k次相应数量的缺失数据样本。

将分别从严重船舶事故样本和一般船舶事故样本中随机有放回的抽取比例为rserious和rnon-serious的船舶事故数据添加至原始样本中生成的h*k个缺失数据样本分别和原始船舶事故数据合并,作为bootstrap样本。

假设共有h对严重船舶事故漏报率和不严重漏报率的组合,对每对漏报率小组重复步骤(2)k次,其中k值大小具体根据后期迭代情况而定。

b.采用tobit模型估计方法分别对原始船舶事故数据和h*k个bootstrap样本数据进行估计,得到原始样本模型系数β和bootstrap样本模型系数βbootstrap。

tobit模型表达如下;

log(y)=βx+ε

ε~n(0,σ2)

其中,y表征各类船舶事故的经济损失的因变量;c是船舶事故经济损失的上限值;y*是船舶事故经济损失的估计值;x代表影响船舶事故经济损失因变量的解释变量,即x=(x1,x2,...,xn);β是所需估计的船舶事故解释变量系数;ε是服从正态分布的随机误差项。

假设考虑h组漏报率情形,每个情形产生k个bootstrap样本,因此共建立k*h个tobit回归模型。

c.bootstrap-tobit模型估计,对各组相应漏报率的bootstrap样本模型系数求均值,得到:

是h个漏报率小组的bootstrap系数均值,k是相应漏报率小组所产生的bootstrap样本数量。

考虑通过调查问卷得到的处于不同区间内的漏报率权重,可靠的漏报率权重值可有效提高模型精度,可得到bootstrap样本模型系数的理论期望值:

fserious(r)和fnon-serious(r)代表严重船舶事故和一般船舶事故的概率密度函数,是考虑所有可能漏报情形的bootstrap系数期望值。

因实际情况下,所有漏报率情形不可能完全考虑到,因此本发明对漏报率采用权重分配方式计算实际期望值:

d.为确保k的数量足以得到可靠的bootstrap样本系数期望值,使用变化率来表示船舶事故样本系数期望值和bootstrap样本数量之间的关系:

图3至图8描述了船舶事故样本系数期望值的变化率随bootstrap样本数量的变化趋势;若所有变量满足变化率趋于稳定的条件,即认定k的大小符合要求。

e.使用bootstrap的类比思想计算bootstrap-tobit模型系数,表示如下:

f.表2船舶事故经济损失的tobit模型估计结果对比

s4.在产生bootstrap样本基础上,对原始样本和bootstrap样本采用tobit回归模型进行估计,得到相应的模型系数,根据bootstrap-tobit的模型系数,对船舶事故的经济损失作出预测代入回tobit模型的公式中,可对船舶事故的经济损失作出预测。

图9表示根据原始tobit模型和bootstrap-tobit模型系数,各变量单位变化对船舶事故的经济损失影响。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1