基于负二项回归的水上交通事故调查分析和预测方法

文档序号:6519367阅读:741来源:国知局
专利名称:基于负二项回归的水上交通事故调查分析和预测方法
技术领域
本发明涉及一种基于负二项回归的水上事故调查分析和预测方法。
背景技术
事故预测的精确性主要基于两个基本前提一是可知的信息,目前世界各国政府 和组织已经意识到建立灾害数据库的重要性,也正积极地开展工作;二是正确的事故预测 方法。船舶事故的分析、预测、评价及预防决策控制技术已成为现代船舶安全管理的核 心。海上交通安全究竟存在多大的危险性,可能对社会造成多大的损失,可接受的风险值是 多大,如何进行海上交通安全保障才能将系统的危险程度降低到安全指标内,这些都依赖 于事故调查和分析研究。探索灾变传导过程中孕灾体、致灾体、受灾体的脆弱性、传染性和稳定性,提取和 凝练其机理机制是安全科学最核心的问题。当安全科学研究的重点从探索事故致因转移到 探索事故优生,标志着事故预测技术日益成为当前安全保障技术研究中最基本的科学问题 之一。事故发生后如何有效地对其进行调查分析,防止类似事故再次发生,选择合适的分析 方法是关键。分析国内外研究现状及其发展趋势,事故预测目前主要表现在以下几个方面1)定性预测方法定性预测是指预测者依靠熟悉业务知识、具有丰富经验和综合分析能力的人员与 专家,根据已掌握的历史资料和直观材料,运用个人的经验和分析判断能力,对事物的未来 发展做出性质和程度上的判断,然后,再通过一定形式综合各方面的意见,作为预测未来的 主要依据。2)定量预测方法定量预测是指采用一定的数学模型,利用历史和现有的具体数据进行计算并最终 得到具体的数值方法。事故预测的数学模型和方法有多种形式,常用且比较可行的数学方 法有回归预测法、时间序列预测法、马尔可夫预测法、灰色预测法、贝叶斯网络预测法、人工 神经网络预测法、支持向量机预测法等。3)系统安全分析评价方法已经得到了广泛推厂,但都是针对系统和行业特点开展 方法研究,制定相关标准,颁布有关规定和办法,局限性较大。正在研究和发展的安全评价 方法主要采用的是定性预测法,专家根据现有信息和资料,利用工作经验作出判断,并将这 些判断定量化。一些定量指标的权值数量需要逐步完善。4)目前一些事故统计分析预测主要采用直观预测法和对比分析法,只能进行短期 预测或同过去进行比较。评价指标体系的建立以及评价合成技术等通过数学理论分析,建 立模型进行事故统计分析处于研究试用阶段,目前尚无较为系统的安全事故统计数理方面 的事故预测与安全分析评价方法。近年来事故调查分析技术与方法逐渐成为研究的热点。现代事故调查与分析方法的发展往往是多种调查分析方法的交叉运用和相互渗透,因此,难以进行绝对的划分。目 前,学者们的研究成果如下张玲根据事故的原因结果模型、过程模型、能量模型、逻辑树模型、SHE管理模型将 事故调查分析技术方法归纳为5大类,多种调查技术组合分析适用于复杂事故的调查 ’考 虑事件次序及其影响因素的调查方法,便于提出预防事故再次发生和减少风险的建议。杨家轩提出采用电子海图技术建立水上交通事故信息系统,根据事故数据的属性 和空间特性,确定基于电子海图的水上交通事故管理系统的内容特点,设计了事故管理系 统的功能结构和技术开发流程,已经成为海上交通管理、事故分析的一个先进有效的技术 手段。黄志提出通过采用灰色系统理论中的关联分析原理,建立事故种类与导致事故原 因、船舶尺度大小、事故发生地理位置及事故发生时间的灰色关联矩阵,并运用台湾海峡船 舶海损事故统计资料,对台湾海峡发生事故的特点及规律进行分析,为分析海上交通事故 提供了新的方法。徐国裕提出运用灰色关联系统分别分析了所有船舶和300gt及以上的船舶在台 湾海峡及附近水域中发生的海难事故,并对碰撞、触礁或搁浅、触碰、失火或爆炸、机械故 障、倾斜或倾覆等六类海难事故,进行了灰色关联矩阵运算及分析。熊清平通过分析我国与IMO及世界其他国家在水上交通事故的分类、统计方法的 区别,指出我国在分类、统计方法上的不足,指出目前我国对事故的分类、统计不规范、不完 善,缺乏可比性和准确性。何易培通过对宁波-舟山海区发生的10起重大涉渔碰撞事故进行归类统计和逐 案剖析,构建涉渔碰撞事故多发原因结构模型,提出了针对性的预警预防预控措施。牟军敏提出为克服事故数据库中数据多维、稀疏、不全等的不利影响,有效地识别 和发现事故数据的新模式及其内在规律,提出应用数据挖掘技术全面整理、分析内河船舶 交通事故的思想。刘正江在收集100个碰撞事故调查报告的基础上,利用数据挖掘技术中的关联规 则对人为失误与其影响因素之间的关系进行挖掘,初步确定了船舶避碰过程中人为失误 与引发因素之间的对应关系。王风武提出针对大风浪天气发生的海损事故,运用灰色系统理论中的关联分析方 法,建立了大风浪海损事故与其致因间的关联矩阵,进行了事故原因的灰色关联分析,从定 量的角度得出造成海损事故的主因是船舶不适航和人为因素。于卫红提出分析了建立海难数据仓库的意义,提出了海难数据仓库的雪花模型, 结果表明,利用数据挖掘技术对海难历史数据作深层次分析,可挖掘出大量的知识,为航海 安全提供借鉴。以上研究对事故致因研究进行了较详尽的阐述,但仍缺乏事故伤亡定量分析和预 测方面的研究。

发明内容
针对上述现有技术中存在的问题,本发明提出一种水上交通事故调查分析和预测 方法,通过对水面交通事故进行分析,建立分析预测模型,达到提高预防水平,减少事故发生的目的。为了实现上述目的,本发明采用如下技术方案一种基于负二项回归的水上交通事故调查分析和预测方法,按如下步骤进行a)变量和数据选择在建模之前进行一系列描述性的统计和相关分析,确定可能 影响事故发生的最为基本和最为重要的因素,最终确定可以进入模型的若干个相互独立的 变量;根据因变量和自变量的特点选择合适的模型类型。当因变量为计数变量,即取事件发 生的数目时,应考虑使用计数(Count Data)模型。模型应用于因变量是离散的整数且具有 数值小、取零的个数较多而自变量大多是表示属性的名义变量的情况,需要用能反映这种 特点的模型形式来改进普通最小二乘法,EViews提供计数数据的多种估计方法,除标准泊 松和负二项极大似然法(ML)外,还有拟极大似然法(QML)。当解释变量为定性变量时,试验 或观察结果称为计数资料,例如水上交通事故调查结果事故起数、沉船艘数、死亡和失踪 人数、受伤人数、直接经济损失等。b)模型假设定性变量的常见分布类型有二项分布、多项分布、Poisson分布、负 二项分布等;由于事故起数、死亡和失踪人数、受伤人数是任意非负整数,是典型的计数数 据,不服从正态分布,而可能是服从泊松分布或负二项分布,所以在计量分析时采用计数模 型比线性模型更适合,假定被解释变量的离散取值服从某种泊松分布,其分布函数为
权利要求
1.基于负二项回归的水上交通事故调查分析和预测方法,按如下步骤进行a)变量和数据选择在建模之前进行一系列描述性的统计和相关分析,确定可能影响 事故发生的最为基本和最为重要的因素,最终确定可以进入模型的若干个相互独立的变 量;根据因变量和自变量的特点选择合适的模型类型,当因变量为计数变量,即取事件发生 的数目时,考虑使用计数(Count Data)模型;b)模型假设定性变量的常见分布类型有二项分布、多项分布、Poisson分布、负二项 分布等;由于事故起数、死亡和失踪人数、受伤人数是任意非负整数,是典型的计数数据,不 服从正态分布,而可能是服从泊松分布或负二项分布,所以在计量分析时采用计数模型比 线性模型更适合,假定被解释变量的离散取值服从某种泊松分布,其分布函数为P(Y = y,)= , ~^yi = 1,2,3, Λ兄!其中E(yi) = λ,Yariy1) = λ,即随机变量y的均值与方差均为λ,若以X= (χ17χ2, A, xffl)表示影响λ的m个自变量,泊松回归模型就是描述服从泊松分布的目标变量y的均 值λ与解释变量X之间关系的回归模型,可以表示为IogA = Χβ其中β为待估计的参数,它可以采用迭代非线性加权最小二乘法或极大似然法来来 估算,在给定Xi的条件下,Yi的条件密度就是“I ”、e-^Mx^y·f(y, F,,β) =-~—如果随机变量的均值等于方差,那么泊松最大似然估计就是一致和有效的,而实际 上的事故次数数据往往具有过离散(over-dispersion)特征,如果随机变量^过度发散, 方差大于均值,即方差大于均值,在这些情况下,如果仍然使用泊松回归模型,可能会低估 参数的标准误差,高估其显著性水平,从而在模型中保留多余的解释变量,最终导致不合理 的结果,为消除这种不利影响,使用负二项回归模型(Negative Binomial Regression)来 代替泊松回归模型进行估计,通过引入伽马分布的误差项构建负二项分布,负二项回归模 型在条件均值μ中引入了一个独立的随机效应u,从而扩展了泊松回归模型,S卩=Iogyi = logXi+logUi,则负二项回归模型的回归形式为logy i = Xi β +ej上式中为随机误差,eXp(ei)服从Γ分布,在负二项回归模型中,yjfXi,Ui的条件 分布仍为泊松分布JXy1 h ,U1) = [exp(-/l凡 XA1U1 Yi ]/ γ, !此时,随机变量Yi的条件均值和方差分别为λ,λ (1+η2λ),其中η2 = 1/Vi,是对条 件方差超出条件均值程度即发散程度的衡量;c)参数估计和验证1)用拟极大似然函数法(QML)进行参数估计拟极大似然函数法是在一系列分布假 定下才能实现,它的估计比较稳健,即使分布指定错误也能产生正确定义条件均值参数的 一致估计,结果的这种稳健性类似于普通回归即使残差分布非正态,ML估计也是一致的, 普通最小二乘法中,一致性要求是条件均值m(x,β) = χ' β,而在QML中,一致性要求有2)参数估计检验离散数据计数模型的参数估计是通过极大似然估计实现的,估计参 数的检验主要通过Wald检验来完成,参数检验有助于对抽样总体的均值做出一些推断, Wald检验类似于线性回归模型中的t检验,因此常被称为广义t检验,Wald检验的假设为 H0 β」=0,建立t统计量为
全文摘要
本发明公开了一种基于负二项回归的水上交通事故调查分析和预测方法,首先确定可能影响事故发生的最为基本和最为重要的因素,确定若干个相互独立的变量并根据数据的特征选择合适的模型类型,然后在此基础上进行模型假设,确定描述问题的基本模型,最后通过一系列准则下对模型进行参数估计、验证,对模型进行修正,建立更准确的模型。本发明的分析预测模型,具有较好预测精度,为水上交通事故的分析预测提供了一种好的方法。
文档编号G06Q50/00GK102103715SQ20101054914
公开日2011年6月22日 申请日期2010年11月18日 优先权日2010年11月18日
发明者张 浩, 李松, 杨小军, 白响恩, 肖英杰, 郑剑 申请人:上海海事大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1