一种航班延误保险的动态报价方法与流程

文档序号:14176479阅读:181来源:国知局
一种航班延误保险的动态报价方法与流程
本发明涉及民航信息数据利用分析处理领域,具体涉及航班延误保险的动态报价方法。
背景技术
:航班延误保险是指投保人根据航班延误保险合同规定,向保险公司支付保险费,当合同约定的航班延误情况发生时,保险公司依约给付保险金的商业保险。目前市场上绝大部分航班延误险产品是对所有航班约定固定延误情况、保费和保额,即统一条件,各个航班之间不具备差异性。但通过历史航班数据分析显示,航班延误情况分布不均匀,主要体现在几个方面,一是不同季节航班延误情况差异较大,夏季航班的延误率明显高于其他三个季节;二是不同航段的航班延误情况差异较大,以南方机场为出发地或目的地的航段的延误率比其他航段高;三是不同时段起飞(落地)的航班延误情况有差异,晚上的航班比其他时段的航班延误率高。中国专利“cn103400053a航班准点起飞的预估方法”提供了航班预估航班准点起飞概率的方法,可由此计算出不准点起飞的概率,但一般航班延误险中约定的延误情况为延误2小时或3小时等某个具体的延误时长,不适用以准点率或不准点率替代。目前对所有航班均固定延误情况、保费和保额的航班延误险产品是基于历史航班的平均延误概率得到的,综合历史数据的出险情况,制定统一的标准。其优点是产品简单,用户容易接受。其缺点是:当年的航班延误情况并不会与历史情况完全一致,产品缺乏灵活性;出险率高的季节或出险率高的航段的保单量较多时,容易出现赔付金额比保费多的情况,造成保险公司亏损;在出险率低的季节或出险率低的航段投保的用户,用同样的条件购买保单产品,但出险率较低,对投保人缺乏吸引力。技术实现要素:本发明的目的是针对航班延误分布的不均匀性,综合评估影响航班延误的各个因素,计算出每个航班发生延误的概率,进而提供一种航班延误保险的动态报价方法。一种航班延误保险的动态报价方法,包括如下步骤:步骤一:建立影响航班延误因素数据库,从中筛选若干影响航班延误的维度数据,备用;步骤二:对步骤一中筛选出的维度数据进行数值化处理;步骤三:将步骤二得到的数据传入lr模型,进行迭代计算,得到每个维度对航班延误率的影响权重值,即得到航班延误概率预测模型,并预测未来航班延误概率;步骤四:确定未来航班延误概率与保费的对应关系;步骤五:基于步骤三得到的预测未来航班延误概率和步骤四确定的未来航班延误概率与保费的对应关系,计算得到最终保费的报价。优选地,所述影响航班延误因素数据库中的数据包括航班日期、航班号、出发地、目的地、出发地天气、目的地天气、航班起飞时间、航班落地时间、航空公司、机型、飞行距离、是否靠近廊桥、机龄、是否经停、航班飞行次序、前序航班延误时长和本航班延误时长信息。优选地,步骤一中的维度数据包括月份、天气(出发地和目的地)、航班起降时间、航空公司、机型、航段(出发地至目的地)、航班的值飞次序以及前序航班延误时长。优选地,步骤二中选择去年同期前后15天和最近15天的维度数据进行数值化处理。优选地,对所述前序航班延误时长进行如下预处理:当间隔小于0.5小时时,前序延误时长直接使用;否则用两个航班的间隔时长减去0.75小时得t1,其中,若t1<0,则令t1=0,若t1≥0,则保留t1值;再用前序航班的实际延误时长减去t1得t2,将t2作为修正后的前序航班延误时长,其中,若t2<0,则令t2=0,若t2≥0,则保留t2值。优选地,步骤三中预测未来航班延误概率包括如下步骤:1、从气象局对机场城市的天气预报数据中提取天气数据并进行编码转换;2、从航班计划数据中提取起降时间、航空公司、机型、航段、航班序列5个维度数据并做编码转换;3、使用航班序列和实时航班动态数据生成前序延误时长;4、把转化后的各维度数据输入到航班延误概率预测模型中,模型输出每个航班延误0.5小时以内、[0.5,1)小时、[1,2)小时、[2,3)小时、[3,4)小时、4小时以上的概率值。优选地,步骤四中包括如下步骤:1、收集近15天的航班历史数据,包括实际延误时长和预测延误概率;2、按预测延误概率从小到大进行分组统计,分组刻度为0.001,统计每组航班的延误比率,并按此比率计算出相应保费;3、选择曲线拟合步骤2中预测延误率与保费的关系。采用本发明的方法对航班进行延误率预测后,根据预测结果对航班进行分类,平均延误[0.5,1)小时、[1,2)小时、[2,3)小时、[3,4)小时、4小时以上的概率准确率比平均比率提高4至6倍,可以有效的区分航班的延误概率。根据预测出的延误概率,实现当延误率高时保费较高,延误概率低时保费较低的动态调整,达到不同航班差异报价的目的,从而实现经济效益的最大化。附图说明图1为本发明的流程图;图2为本发明中预测延误率与保费的拟合曲线示意图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。结合图1所示,一种航班延误保险的动态报价方法,包括如下步骤:步骤一:建立影响航班延误因素数据库,从中筛选若干影响航班延误的维度数据,备用。国内航班历史数据(含后期整理合并的)包括航班日期、航班号、出发地、目的地、出发地天气、目的地天气、航班起飞时间、航班落地时间、航空公司、机型、飞行距离、是否靠近廊桥、机龄、是否经停、航班飞行次序、前序航班延误时长、本航班延误时长等信息。其中航班值飞次序是指当天同一架飞机值飞航班的次序。为验证哪些信息与航班延误相关,以本航班延误0.5小时以上为延误标准,分别按各维度进行分组统计,观察各维度内航班延误率变化:1)把航班日期转化为月份,统计各月之间航班延误率的变化情况。统计数据显示每年5至8月份航班延误率明显高于其他月份,不同飞行日期对航班延误率有明显影响。2)以出发地天气和目的地天气类型作为组合维度,统计各种天气类型组合的情况航班延误率的变化情况。统计数据显示当天出发地或目的地出现恶劣天气(如大雨、暴雨等)时,延误率明显偏高,其他天气组合条件下延误率也有差异。可判断该因素对航班延误率有影响。3)把航班起降时间均转化至小时级别,统计各有个起、降小时组合内的航班延误率。统计数据显示起、降时间越晚的航班延误率较高。可判断该因素对航班延误率有影响。4)按各航班所属航空公司对延误率进行分组统计,各航空公司之间延误率有明显差异。可判断该因素对航班延误率有影响。5)按各航班的机型分组对延误率进行统计,各机型的延误率差异也比较明显。可以判断该因素对航班延误率有影响。6)按各航班的飞行距离分组对延误率进行统计,各飞行距离中延误率没有明显趋势,分布没有规律,可以判断该因素对航班延误率没有影响。7)按是否靠近廊桥属性分组对延误率进行统计,两个延误率值差异不明显,可以判断该因素对航班延误率没有影响。8)按机龄分组对延误率进行统计,不同机龄的航班延误率变化不大,可以判断该因素对航班延误率没有影响。9)按航段分组对延误率进行统计,不同航段间的延误率有明显差异,可以判断该因素对航班延误率有影响。10)按航班值飞次序分组对延误率进行统计,值飞次序靠中后部的航班延误概率明显大于靠前的航班高,可以判断该因素对航班延误率有影响。11)按前序航班延误时长对延误率进行统计,当前序航班发生延误时,后序航班的延误概率显著提高,可以判断该因素对航班延误率有影响。综上分析,影响航班延误的因素,主要选取月份、天气(出发地和目的地),航班起降时间、航空公司、机型、航段(出发地至目的地)、航班的值飞次序、前序航班延误时长8个。步骤二:对步骤一中筛选出的维度数据进行数值化处理。基于以上分析得到的8个影响航班延误的因素,需要做进一步的数值化处理才能使用lr算法进行建模,主要处理方法:1)航班日期的处理,不同时间内航班的发生延误情况也不同,为了在模型中实现时间对延误率的影响,本发明提出每天重新计算模型的解决办法,即使用去年同期前后15天的历史航班数据和最近15天的航班历史数据作为生成模型的训练数据,每天生成模型的训练数据在不断变化,生成的模型参数也在变化。2)天气类型的处理,由于天气类型均为汉字且不标准,本发明中把天气类型均转化为天气类型编码,转化时根据其对航班延误率影响大小做了合并处理(例如晴天、多云的编码均为0)。天气类型编码数据如下:天气类型天气编码天气类型天气编码多云0中雨20轻雾0中雪20晴天0阵雪20少云0阵雨20阴天0大雨25毛毛雨10大雪25沙尘10冰雹25雾10雷25小雨10强雷雨25霾10强雨25雷阵雨20强阵雨25强尘暴20暴雪30小雪20暴雨30雨203)航班起降时间、航空公司、机型、航段、航班的值飞次序等因素数值编码转化,但由于数值大小与航班延误率并没有线性相关性,所以在计算过程中,把编码值做哑变量处理。哑变量处理即把某属性每个值做为一列,当记录中属性与该列相同时取值1,否则取0。例如,航空公司属性共有44个国内航空公司,把这44个航空公司做为44列,当某航班为南方航空时,则南方航空那一列的值取1,其他43列值取0。4)前序延误时长的具体取值并不是直接取前序航班的实际延误时长,需要考虑航班降落至起飞的间隔对延误时长的影响,当间隔小于0.5小时时,前序延误时长直接使用;否则用两个航班的间隔时长减去0.75小时得t1,其中,若t1<0,则令t1=0,若t1≥0,则保留t1值;再用前序航班的实际延误时长减去t1得t2,将t2作为修正后的前序航班延误时长,其中,若t2<0,则令t2=0,若t2≥0,则保留t2值。步骤三:将步骤二得到的数据传入lr模型,进行迭代计算,得到每个维度对航班延误率的影响权重值,即得到航班延误概率预测模型。在得到航班延误概率预测模型后,收集未来航班的相关数据,按规则做数值编码转化后,就可以做概率预测了,主要流程包括以下步骤:步骤1:从气象局对机场城市的天气预报数据中提取天气数据并进行编码转换;步骤2:从航班计划数据中提取起降时间、航空公司、机型、航段、航班序列等5个维度数据并做编码转换;步骤3:使用航班序列和实时航班动态数据生成前序延误时长;步骤4:把转化后的各维度数据输入到预测模型中,模型输出每个航班延误0.5小时以内、[0.5,1)小时、[1,2)小时、[2,3)小时、[3,4)小时、4小时以上的概率值。步骤四:确定未来航班延误概率与保费的对应关系。预测的延误概率与航班的实际延误情况并不是完全一致的,不能使用预测的延误概率直接用于保费的计算,需要经过以下步骤的处理:步骤1:收集近15天的航班历史数据,包括实际延误时长和预测延误概率;步骤2:按预测延误概率从小到大进行分组统计,分组刻度为0.001,统计每组航班的延误比率,并按此比率计算出相应保费;步骤3:选择曲线拟合上步中预测延误率与保费的关系,得到曲线公式中的a、b、c、d4个参数值,其中,x为预测延误率,预测拟合曲线示意如图2所示:步骤五:基于步骤三得到的预测未来航班延误概率和步骤四确定的未来航班延误概率与保费的对应关系,计算得到最终保费的报价。示例1:7月1日航班ca1521从北京飞往上海,一般保险产品的方案为:航班到达延误3小时以上时支付保额300元,保费为20元;经过该系统计算后,认为该航班到达延误3小时以上的概率比较高,计算保费为30元,该航班实际到达延误为2小时。该示例显示,通过本系统的保费报价可以降低保险公司的风险。示例2:7月1日航班mu2106从北京飞往西安,一般保险产品的方案为:航班到达延误3小时以上时支付保额300元,保费为20元;经过该系统计算后,认为该航班到达延误3小时以上的概率比较低,计算保费为15元,该航班实际到达延误为0.2小时。该示例显示,通过本系统的保费报价可以提升该保险产品对用户的吸引力。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1