保险赔付支出的预测方法、电子装置及存储介质与流程

文档序号:17931025发布日期:2019-06-15 00:51阅读:202来源:国知局
保险赔付支出的预测方法、电子装置及存储介质与流程

本发明涉及智能决策技术领域,尤其涉及一种保险赔付支出的预测方法、电子装置及存储介质。



背景技术:

目前可通过当前保单信息、理赔等信息进行险种的保险赔付支出计算,该计算方法只能计算当前时点的保险赔付支出,未能预测未来风险保费的发展趋势。



技术实现要素:

本发明提供一种保险赔付支出的预测方法、电子装置及存储介质,其主要目的在于实现对保险赔付支出的预测,进而帮助保险产品定价以及指导保险产品销售。

为实现上述目的,本发明提供一种保险赔付支出的预测方法,该方法包括:

筛选步骤:获取各保险产品的产品数据,并在所述产品数据中筛选得到各保险产品的特征因子集合;

建立步骤:获取多个第一预设时间区间内各保险产品的赔付支出观测值及所述各特征因子的特征因子观测值,利用所述赔付支出观测值及特征因子观测值,按照预设建立规则逐一建立各保险产品对应的赔付支出预测方程;

第一预测步骤:在接收到预测指令时,获取第二预设时间区间内各保险产品的赔付支出观测值及特征因子观测值,并根据所述各保险产品的赔付支出预测方程、第二预设时间区间内各保险产品的赔付支出观测值及特征因子观测值,对第三预设时间区间内各保险产品的赔付支出进行预测,得到第三预设时间区间内各保险产品的赔付支出的预测值。

优选地,所述筛选步骤包括:

第一筛选步骤:利用预设的模型对各保险产品的产品数据进行初步筛选,将与赔付支出不相关的产品数据过滤掉。

第二筛选步骤:利用预先确定的筛选规则,从初步筛选后各保险产品的剩余产品数据中筛选得到各保险产品的所述特征因子集合。

优选地,所述各保险产品的产品数据包括各保险产品保险单的保单年度、保费、保额、保单所属地理区域、保单赔付责任、投保人群年龄及身体状况等。

优选地,所述某保险产品的特征因子包括该保险产品的保单在各地理区域的分布数据、该保险产品的投保人群年龄分布数据。

优选地,该保险产品的保单在各地理区域的分布数据的获取方法包括:

a1、在第一预设时间区间中设置统计时点,获取统计时点时该保险产品的保单信息,所述保单信息包括各保单所属保险机构;

a2、确定该保单所属保险机构对应的地理区域;

a3、对该保险产品在各个地理区域的保单数量进行统计,得到各个地理区域的保单数量总和,即为该保险产品的保单在各地理区域的分布数。

优选地,该保险产品的投保人群年龄分布数据的获取方法包括:

b1、在第一预设时间区间中设置统计时点,获取该保险产品在该统计时点时的投保用户信息,所述投保用户信息包括各投保用户的年龄信息;

b2、根据该保险产品的各个投保用户的年龄信息,统计各个预设年龄区间的投保用户数量,即为该保险产品的投保人群年龄分布数据。

优选地,所述预设建立规则包括:

c1、获取某保险产品在n个连续的第一预设时间区间中的赔付支出观测值及特征因子的观测值。

c2、通过预设公式确定该保险产品分别在第一个至第n-1个第一预设时间区间中的赔付支出变动系数。

所述预设公式如下:

其中,上述yt代表该保险产品在第t个第一预设时间区间中的赔付支出变动系数,ct+1代表保险产品在第t+1个第一预设时间区间中的赔付支出观测值,ct代表保险产品在第t个第一预设时间区间中的赔付支出观测值,dt+1代表第t+1个第一预设时间区间的时长,dt代表第t个第一预设时间区间的时长。其中,t∈[1,n-1],t为正整数。

c3、将所述n-1个第一预设时间区间对应的各特征因子的观测值作为回归方程的自变量,且将所述n-1个第一预设时间区间对应的赔付支出变动系数作为因变量y进行回归分析,得到回归方程:

y代表赔付支出变动系数,xk代表第k个特征因子的观测值,a0代表常数,ak代表第k个特征因子的系数,其中,k∈[1,n],n代表该保险产品的特征因子总数量,n、k为正整数。

c4、根据回归方程,确定预测方程:

其中,ci+1代表第三预设时间区间(例如,下一个月)内该保险产品的赔付支出预测值,ci代表第二预设时间区间(例如,本月)内该保险产品的赔付支出观测值,di+1代表第三预设时间区间的时长,di代表第二预设时间区间的时长,xik代表该保险产品的第k个特征因子在第二预设时间区间的观测值,a0代表常数,ak代表第k个特征因子的系数,其中,k∈[1,n],n代表该保险产品的特征因子总数量,n、k为正整数。

优选地,在预测步骤之后,该方法还可以包括:

第二预测步骤,根据第三预设时间区间内各保险产品的赔付支出的预测值、赔付支出预测方程及第二预设时间区间内各保险产品的特征因子观测值,对第四预设时间区间内各保险产品的赔付支出进行预测,得到第四预设时间区间内各保险产品的赔付支出的预测值。

此外,为实现上述目的,本发明还提供一种电子装置,该电子装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的保险赔付支出预测程序,所述保险赔付支出预测程序被所述处理器执行时实现如下步骤:

筛选步骤:获取各保险产品的产品数据,并在所述产品数据中筛选得到各保险产品的特征因子集合;

建立步骤:获取多个第一预设时间区间内各保险产品的赔付支出观测值及所述各特征因子的特征因子观测值,利用所述赔付支出观测值及特征因子观测值,按照预设建立规则逐一建立各保险产品对应的赔付支出预测方程;

预测步骤:在接收到预测指令时,获取第二预设时间区间内各保险产品的赔付支出观测值及特征因子观测值,并根据所述各保险产品的赔付支出预测方程、第二预设时间区间内各保险产品的赔付支出观测值及特征因子观测值,对第三预设时间区间内各保险产品的赔付支出进行预测,得到第三预设时间区间内各保险产品的赔付支出的预测值。

优选地,所述筛选步骤包括:

第一筛选步骤:利用预设的模型对各保险产品的产品数据进行初步筛选,将与赔付支出不相关的产品数据过滤掉。

第二筛选步骤:利用预先确定的筛选规则,从初步筛选后各保险产品的剩余产品数据中筛选得到各保险产品的所述特征因子集合。

优选地,所述各保险产品的产品数据包括各保险产品的保险单的保单年度、保费、保额、保单所属地理区域、保单赔付责任、投保人群年龄及身体状况等。

优选地,所述某保险产品的特征因子包括该保险产品的保单在各地理区域的分布数据、该保险产品的投保人群年龄分布数据。

优选地,该保险产品的保单在各地理区域的分布数据的获取方法包括:

a1、在第一预设时间区间中设置统计时点,获取统计时点时该保险产品的保单信息,所述保单信息包括各保单所属保险机构;

a2、确定该保单所属保险机构对应的地理区域;

a3、对该保险产品在各个地理区域的保单数量进行统计,得到各个地理区域的保单数量总和,即为该保险产品的保单在各地理区域的分布数。

优选地,该保险产品的投保人群年龄分布数据的获取方法包括:

b1、在第一预设时间区间中设置统计时点,获取该保险产品在该统计时点时的投保用户信息,所述投保用户信息包括各投保用户的年龄信息;

b2、根据该保险产品的各个投保用户的年龄信息,统计各个预设年龄区间的投保用户数量,即为该保险产品的投保人群年龄分布数据。

优选地,所述预设建立规则包括:

c1、获取某保险产品在n个连续的第一预设时间区间中的赔付支出观测值及特征因子的观测值。

c2、通过预设公式确定该保险产品分别在第一个至第n-1个第一预设时间区间中的赔付支出变动系数。

所述预设公式如下:

其中,上述yt代表该保险产品在第t个第一预设时间区间中的赔付支出变动系数,ct+1代表保险产品在第t+1个第一预设时间区间中的赔付支出观测值,ct代表保险产品在第t个第一预设时间区间中的赔付支出观测值,dt+1代表第t+1个第一预设时间区间的时长,dt代表第t个第一预设时间区间的时长。其中,t∈[1,n-1],t为正整数。

c3、将所述n-1个第一预设时间区间对应的各特征因子的观测值作为回归方程的自变量,且将所述n-1个第一预设时间区间对应的赔付支出变动系数作为因变量y进行回归分析,得到回归方程:

y代表赔付支出变动系数,xk代表第k个特征因子的观测值,a0代表常数,ak代表第k个特征因子的系数,其中,k∈[1,n],n代表该保险产品的特征因子总数量,n、k为正整数。

c4、根据回归方程,确定预测方程:

其中,ci+1代表第三预设时间区间(例如,下一个月)内该保险产品的赔付支出预测值,ci代表第二预设时间区间(例如,本月)内该保险产品的赔付支出观测值,di+1代表第三预设时间区间的时长,di代表第二预设时间区间的时长,xik代表该保险产品的第k个特征因子在第二预设时间区间的观测值,a0代表常数,ak代表第k个特征因子的系数,其中,k∈[1,n],n代表该保险产品的特征因子总数量,n、k为正整数。

优选地,在预测步骤之后,该方法还可以包括:

第二预测步骤:根据第三预设时间区间内各保险产品的赔付支出的预测值、赔付支出预测方程及第二预设时间区间内各保险产品的特征因子观测值,对第四预设时间区间内各保险产品的赔付支出进行预测,得到第四预设时间区间内各保险产品的赔付支出的预测值。

此外,为实现上述目的,本发明还提供一种存储介质,所述存储介质上存储有保险赔付支出预测程序,所述保险赔付支出预测程序可被一个或者多个处理器执行,以实现如上所述的保险赔付支出的预测方法的步骤。

本发明提出了一种保险赔付支出的预测方法、电子装置及存储介质。通过获取各保险产品的产品数据,并对各保险产品的产品数据进行筛选,得到各保险产品的特征因子集合;然后获取多个第一预设时间区间内各保险产品的赔付支出观测值及特征因子的观测值,并利用获取的各保险产品的赔付支出观测值及特征因子的观测值,按照预设建立规则,逐一建立各保险产品对应的赔付支出预测方程;最后接收到预测指令,获取第二预设时间区间内各保险产品的赔付支出观测值及特征因子的观测值,并根据各保险产品的赔付支出预测方程、第二预设时间区间内各保险产品的赔付支出观测值及特征因子的观测值,对第三预设时间区间内各保险产品的赔付支出进行预测,得到第三预设时间区间内各保险产品的赔付支出的预测值。利用本发明,可以实现对保险赔付支出的预测,进而帮助保险产品定价以及指导保险产品销售。

附图说明

图1为本发明一实施例提供的保险赔付支出的预测方法的流程示意图;

图2为本发明一实施例提供的电子装置的内部结构示意图;

图3为本发明一实施例提供的电子装置中保险赔付支出预测程序的模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明提供一种保险赔付支出的预测方法。参照图1所示,为本发明一实施例提供的保险赔付支出的预测方法的流程示意图。该方法可以由一个电子装置执行,该电子装置可以由软件和/或硬件实现。

在本实施例中,保险赔付支出的预测方法包括:

步骤s10,获取各保险产品的产品数据,并在所述产品数据中筛选得到各保险产品的特征因子集合。具体地,所述筛选步骤包括以下两个步骤:

第一筛选步骤:利用预设的模型对各保险产品的产品数据进行初步筛选,将与赔付支出不相关的产品数据过滤掉。例如,通过线性模型(如逻辑回归模型等)或非线性模型(如梯度提升决策树模型等)对各保险产品的产品数据进行初步筛选,将与赔付支出不相关的产品数据过滤掉。此外,所述各保险产品的产品数据包括各保险产品保险单的保单年度、保费、保额、保单所属地理区域、保单赔付责任、投保人群年龄及身体状况等。

第二筛选步骤:利用预先确定的筛选规则,从初步筛选后各保险产品的剩余产品数据中筛选得到各保险产品的所述特征因子集合。一保险产品的风险保险影响参数集合中包括影响该保险产品的赔付支出的若干个特征因子。此外,所述筛选规则包括最优子集选择法、向前选择法、向后剔除法及逐步选择法中的一种。

步骤s20,获取多个第一预设时间区间内各保险产品的赔付支出观测值及所述各特征因子的特征因子观测值,利用所述赔付支出观测值及特征因子观测值,按照预设建立规则逐一建立各保险产品对应的赔付支出预测方程。所述赔付支出亦称“纯保费”,是指在保险期限内完全满足赔款支出需要的预期现值。在财产保险中,指保险人根据保险标的损失率或或然率计算而得的保费,专门用以赔偿保险责任范围内保险标的的实际损失。在人寿保险中,则指为满足给付需要而计收的保费。赔付支出正好用以支付对保单所有人的赔款,没有任何剩余。

在本实施例中,某保险产品的特征因子包括该保险产品的保单在各地理区域的分布数据、该保险产品的投保人群年龄分布数据。其中,该保险产品的保单在各地理区域的分布数据的获取方法包括:

a1、在第一预设时间区间中设置统计时点,获取统计时点时该保险产品的保单信息,所述保单信息包括各保单所属保险机构;

a2、确定该保单所属保险机构对应的地理区域;

a3、对该保险产品在各个地理区域的保单数量进行统计,得到各个地理区域的保单数量总和,即为该保险产品的保单在各地理区域的分布数据。

该保险产品的投保人群年龄分布数据的获取方法包括:

b1、在第一预设时间区间中设置统计时点,获取该保险产品在该统计时点时的投保用户信息,所述投保用户信息包括各投保用户的年龄信息;

b2、根据该保险产品的各个投保用户的年龄信息,统计各个预设年龄区间的投保用户数量,即为该保险产品的投保人群年龄分布数据。

在本实施例中,所述预设建立规则包括:

c1、获取某保险产品在n个连续的第一预设时间区间中的赔付支出观测值及特征因子的观测值。

c2、通过预设公式确定该保险产品分别在第一个至第n-1个第一预设时间区间中的赔付支出变动系数。

所述预设公式如下:

其中,上述yt代表该保险产品在第t个第一预设时间区间中的赔付支出变动系数,ct+1代表保险产品在第t+1个第一预设时间区间中的赔付支出观测值,ct代表保险产品在第t个第一预设时间区间中的赔付支出观测值,dt+1代表第t+1个第一预设时间区间的时长,dt代表第t个第一预设时间区间的时长。其中,t∈[1,n-1],t为正整数。

c3、将所述n-1个第一预设时间区间对应的各特征因子的观测值作为回归方程的自变量,且将所述n-1个第一预设时间区间对应的赔付支出变动系数作为因变量y进行回归分析,得到回归方程:

y代表赔付支出变动系数,xk代表第k个特征因子的观测值,a0代表常数,ak代表第k个特征因子的系数,其中,k∈[1,n],n代表该保险产品的特征因子总数量,n、k为正整数。

c4、根据回归方程,确定预测方程:

其中,ci+1代表第三预设时间区间(例如,下一个月)内该保险产品的赔付支出预测值,ci代表第二预设时间区间(例如,本月)内该保险产品的赔付支出观测值,di+1代表第三预设时间区间的时长,di代表第二预设时间区间的时长,xik代表该保险产品的第k个特征因子在第二预设时间区间的观测值,a0代表常数,ak代表第k个特征因子的系数,其中,k∈[1,n],n代表该保险产品的特征因子总数量,n、k为正整数。

步骤s30,在接收到预测指令时,获取第二预设时间区间内各保险产品的赔付支出观测值及特征因子的观测值,并根据各保险产品的赔付支出预测方程、第二预设时间区间内各保险产品的赔付支出观测值及特征因子的观测值,对第三预设时间区间内各保险产品的赔付支出进行预测,得到第三预设时间区间内各保险产品的赔付支出的预测值。

在本实施例中,在步骤s30之后,该方法还可以包括:

第二预测步骤:根据第三预设时间区间内各保险产品的赔付支出的预测值、赔付支出预测方程及第二预设时间区间内各保险产品的特征因子观测值,对第四预设时间区间内各保险产品的赔付支出进行预测,得到第四预设时间区间(例如,未来一年)内各保险产品的赔付支出的预测值。

在另一实施例中,在步骤s30之后,该方法还可以包括:

分摊步骤:按照预设分摊规则,将第三预设时间区间内各保险产品的赔付支出的预测值进行分摊至所述各个地理区域和所述各个赔付责任。例如,一保险产品的预设分摊规则包括如下两种方案:

方案一:获取该保险产品的各笔赔付支出对应的赔付机构,确定各笔赔付支出对应的赔付机构所属的地理区域,再对各个地理区域的赔付支出进行统计,得到各个地理区域对应的赔付支出总和。接着,根据各个地理区域对应的赔付支出总和,设置分摊比例。最后,根据分摊比例,将第三预设时间区间内该保险产品的赔付支出的预测值分摊至各个地理区域。

方案二:获取该保险产品的各笔赔付支出的支出明细,所述支出明细包括该保险产品的各个赔付责任的支出值。将同属于一个赔付责任的支出值进行加和,以统计该保险产品的各个赔付责任对应的支出总和。接着,根据各个赔付责任对应的支出总和,设置分摊比例。最后,根据分摊比例,将第三预设时间区间内该保险产品的赔付支出的预测值分摊至各个赔付责任。

本发明还提出一种电子装置。参照图2所示,为本发明一实施例提供的电子装置的内部结构示意图。

在本实施例中,电子装置1可以是pc(personalcomputer,个人电脑),也可以是智能手机、平板电脑、便携计算机等终端设备。该电子装置1至少包括存储器11、处理器12,网络接口13,以及通信总线。

其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是电子装置1的内部存储单元,例如该电子装置1的硬盘。存储器11在另一些实施例中也可以是电子装置1的外部存储设备,例如电子装置1上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,存储器11还可以既包括电子装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于电子装置1的应用软件及各类数据,例如保险赔付支出预测程序10的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行保险赔付支出预测程序10等。

网络接口13可选的可以包括标准的有线接口、无线接口(如wi-fi接口),通常用于在该电子装置1与其他电子设备之间建立通信连接。

通信总线用于实现这些组件之间的连接通信。

可选地,该电子装置1还可以包括用户接口,用户接口可以包括显示器(display)、输入单元比如键盘(keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organiclight-emittingdiode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。

图2仅示出了具有组件11-13以及保险赔付支出预测程序10的电子装置1,本领域技术人员可以理解的是,图1示出的结构并不构成对电子装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

在图2所示的电子装置1实施例中,存储器11中存储有保险赔付支出预测程序10;处理器12执行存储器11中存储的保险赔付支出预测程序10时实现如下步骤:

筛选步骤:获取各保险产品的产品数据,并在所述产品数据中筛选得到各保险产品的特征因子集合。具体地,所述筛选步骤包括以下两个步骤:

第一筛选步骤:利用预设的模型对各保险产品的产品数据进行初步筛选,将与赔付支出不相关的产品数据过滤掉。例如,通过线性模型(如逻辑回归模型等)或非线性模型(如梯度提升决策树模型等)对各保险产品的产品数据进行初步筛选,将与赔付支出不相关的产品数据过滤掉。此外,所述各保险产品的产品数据包括各保险产品保险单的保单年度、保费、保额、保单所属地理区域、保单赔付责任、投保人群年龄及身体状况等。

第二筛选步骤:利用预先确定的筛选规则,从初步筛选后各保险产品的剩余产品数据中筛选得到各保险产品的所述特征因子集合。一保险产品的风险保险影响参数集合中包括影响该保险产品的赔付支出的若干个特征因子。此外,所述筛选规则包括最优子集选择法、向前选择法、向后剔除法及逐步选择法中的一种。

建立步骤:获取多个第一预设时间区间内各保险产品的赔付支出观测值及所述各特征因子的特征因子观测值,利用所述赔付支出观测值及特征因子观测值,按照预设建立规则逐一建立各保险产品对应的赔付支出预测方程。所述赔付支出亦称“纯保费”,是指在保险期限内完全满足赔款支出需要的预期现值。在财产保险中,指保险人根据保险标的损失率或或然率计算而得的保费,专门用以赔偿保险责任范围内保险标的的实际损失。在人寿保险中,则指为满足给付需要而计收的保费。赔付支出正好用以支付对保单所有人的赔款,没有任何剩余。

在本实施例中,某保险产品的特征因子包括该保险产品的保单在各地理区域的分布数据、该保险产品的投保人群年龄分布数据。其中,该保险产品的保单在各地理区域的分布数据的获取方法包括:

a1、在第一预设时间区间中设置统计时点,获取统计时点时该保险产品的保单信息,所述保单信息包括各保单所属保险机构;

a2、确定该保单所属保险机构对应的地理区域;

a3、对该保险产品在各个地理区域的保单数量进行统计,得到各个地理区域的保单数量总和,即为该保险产品的保单在各地理区域的分布数据。

该保险产品的投保人群年龄分布数据的获取方法包括:

b1、在第一预设时间区间中设置统计时点,获取该保险产品在该统计时点时的投保用户信息,所述投保用户信息包括各投保用户的年龄信息;

b2、根据该保险产品的各个投保用户的年龄信息,统计各个预设年龄区间的投保用户数量,即为该保险产品的投保人群年龄分布数据。

在本实施例中,所述预设建立规则包括:

c1、获取某保险产品在n个连续的第一预设时间区间中的赔付支出观测值及特征因子的观测值。

c2、通过预设公式确定该保险产品分别在第一个至第n-1个第一预设时间区间中的赔付支出变动系数。

所述预设公式如下:

其中,上述yt代表该保险产品在第t个第一预设时间区间中的赔付支出变动系数,ct+1代表保险产品在第t+1个第一预设时间区间中的赔付支出观测值,ct代表保险产品在第t个第一预设时间区间中的赔付支出观测值,dt+1代表第t+1个第一预设时间区间的时长,dt代表第t个第一预设时间区间的时长。其中,t∈[1,n-1],t为正整数。

c3、将所述n-1个第一预设时间区间对应的各特征因子的观测值作为回归方程的自变量,且将所述n-1个第一预设时间区间对应的赔付支出变动系数作为因变量y进行回归分析,得到回归方程:

y代表赔付支出变动系数,xk代表第k个特征因子的观测值,a0代表常数,ak代表第k个特征因子的系数,其中,k∈[1,n],n代表该保险产品的特征因子总数量,n、k为正整数。

c4、根据回归方程,确定预测方程:

其中,ci+1代表第三预设时间区间(例如,下一个月)内该保险产品的赔付支出预测值,ci代表第二预设时间区间(例如,本月)内该保险产品的赔付支出观测值,di+1代表第三预设时间区间的时长,di代表第二预设时间区间的时长,xik代表该保险产品的第k个特征因子在第二预设时间区间的观测值,a0代表常数,ak代表第k个特征因子的系数,其中,k∈[1,n],n代表该保险产品的特征因子总数量,n、k为正整数。

第一预测步骤:在接收到预测指令时,获取第二预设时间区间内各保险产品的赔付支出观测值及特征因子的观测值,并根据各保险产品的赔付支出预测方程、第二预设时间区间内各保险产品的赔付支出观测值及特征因子的观测值,对第三预设时间区间内各保险产品的赔付支出进行预测,得到第三预设时间区间内各保险产品的赔付支出的预测值。

在本实施例中,在预测步骤之后,该方法还可以包括:

第二预测步骤:根据第三预设时间区间内各保险产品的赔付支出的预测值、赔付支出预测方程及第二预设时间区间内各保险产品的特征因子观测值,对第四预设时间区间内各保险产品的赔付支出进行预测,得到第四预设时间区间(例如,未来一年)内各保险产品的赔付支出的预测值。

在另一实施例中,在第一预测步骤之后,该方法还可以包括:

分摊步骤:按照预设分摊规则,将第三预设时间区间内各保险产品的赔付支出的预测值进行分摊至所述各个地理区域和所述各个赔付责任。例如,一保险产品的预设分摊规则包括如下两种方案:

方案一:获取该保险产品的各笔赔付支出对应的赔付机构,确定各笔赔付支出对应的赔付机构所属的地理区域,再对各个地理区域的赔付支出进行统计,得到各个地理区域对应的赔付支出总和。接着,根据各个地理区域对应的赔付支出总和,设置分摊比例。最后,根据分摊比例,将第三预设时间区间内该保险产品的赔付支出的预测值分摊至各个地理区域。

方案二:获取该保险产品的各笔赔付支出的支出明细,所述支出明细包括该保险产品的各个赔付责任的支出值。将同属于一个赔付责任的支出值进行加和,以统计该保险产品的各个赔付责任对应的支出总和。接着,根据各个赔付责任对应的支出总和,设置分摊比例。最后,根据分摊比例,将第三预设时间区间内该保险产品的赔付支出的预测值分摊至各个赔付责任。

可选地,在其他的实施例中,保险赔付支出的预测程序还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述保险赔付支出预测程序在电子装置中的执行过程。

例如,参照图3所示,为本发明提供的电子装置1一实施例中的保险赔付支出预测程序的程序模块示意图,该实施例中,保险赔付支出预测程序可以被分割为数据获取模块110、数据筛选模块120、建立模块130、预测模块140,示例性地:

获取模块110用于:获取各保险产品的产品数据,该产品数据包括各保险产品保险单的保单年度、保费、保额、保单所属地理区域、保单赔付责任、投保人群年龄及身体状况等。

筛选模块120用于:对所述各保险产品的产品数据进行筛选,得到各保险产品的特征因子集合。具体地,分以下两个步骤:

第一筛选步骤:利用预设的模型对各保险产品的产品数据进行初步筛选,将与赔付支出不相关的产品数据过滤掉。例如,通过线性模型(如逻辑回归模型等)或非线性模型(如梯度提升决策树模型等)对各保险产品的产品数据进行初步筛选,将与赔付支出不相关的产品数据过滤掉。

第二筛选步骤:利用预先确定的筛选规则,从初步筛选后各保险产品的剩余产品数据中筛选得到各保险产品的所述特征因子集合。一保险产品的风险保险影响参数集合中包括影响该保险产品的赔付支出的若干个特征因子。

此外,所述筛选规则包括最优子集选择法、向前选择法、向后剔除法及逐步选择法中的一种。

建立模块130用于:获取多个第一预设时间区间内各保险产品的赔付支出观测值及所述各特征因子的特征因子观测值,利用所述赔付支出观测值及特征因子观测值,按照预设建立规则逐一建立各保险产品对应的赔付支出预测方程。

在本实施例中,某保险产品的特征因子包括该保险产品的保单在各地理区域的分布数据、该保险产品的投保人群年龄分布数据。其中,该保险产品的保单在各地理区域的分布数据的获取方法包括:

a1、在第一预设时间区间中设置统计时点,获取统计时点时该保险产品的保单信息,所述保单信息包括各保单所属保险机构;

a2、确定该保单所属保险机构对应的地理区域;

a3、对该保险产品在各个地理区域的保单数量进行统计,得到各个地理区域的保单数量总和,即为该保险产品的保单在各地理区域的分布数据。

该保险产品的投保人群年龄分布数据的获取方法包括:

b1、在第一预设时间区间中设置统计时点,获取该保险产品在该统计时点时的投保用户信息,所述投保用户信息包括各投保用户的年龄信息;

b2、根据该保险产品的各个投保用户的年龄信息,统计各个预设年龄区间的投保用户数量,即为该保险产品的投保人群年龄分布数据。

在本实施例中,所述预设建立规则包括:

c1、获取某保险产品在n个连续的第一预设时间区间中的赔付支出观测值及特征因子的观测值。

c2、通过预设公式确定该保险产品分别在第一个至第n-1个第一预设时间区间中的赔付支出变动系数。

所述预设公式如下:

其中,上述yt代表该保险产品在第t个第一预设时间区间中的赔付支出变动系数,ct+1代表保险产品在第t+1个第一预设时间区间中的赔付支出观测值,ct代表保险产品在第t个第一预设时间区间中的赔付支出观测值,dt+1代表第t+1个第一预设时间区间的时长,dt代表第t个第一预设时间区间的时长。其中,t∈[1,n-1],t为正整数。

c3、将所述n-1个第一预设时间区间对应的各特征因子的观测值作为回归方程的自变量,且将所述n-1个第一预设时间区间对应的赔付支出变动系数作为因变量y进行回归分析,得到回归方程:

y代表赔付支出变动系数,xk代表第k个特征因子的观测值,a0代表常数,ak代表第k个特征因子的系数,其中,k∈[1,n],n代表该保险产品的特征因子总数量,n、k为正整数。

c4、根据回归方程,确定预测方程:

其中,ci+1代表第三预设时间区间(例如,下一个月)内该保险产品的赔付支出预测值,ci代表第二预设时间区间(例如,本月)内该保险产品的赔付支出观测值,di+1代表第三预设时间区间的时长,di代表第二预设时间区间的时长,xik代表该保险产品的第k个特征因子在第二预设时间区间的观测值,a0代表常数,ak代表第k个特征因子的系数,其中,k∈[1,n],n代表该保险产品的特征因子总数量,n、k为正整数。

预测模块140用于:在接收到预测指令时,获取第二预设时间区间内各保险产品的赔付支出观测值及特征因子的观测值,并根据各保险产品的赔付支出预测方程、第二预设时间区间内各保险产品的赔付支出观测值及特征因子的观测值,对第三预设时间区间内各保险产品的赔付支出进行预测,得到第三预设时间区间内各保险产品的赔付支出的预测值。

此外,本发明实施例还提出一种存储介质,所述存储介质上存储有保险赔付支出预测程序,所述保险赔付支出预测程序可被一个或多个处理器执行,以实现如下步骤:

筛选步骤:获取各保险产品的产品数据,并在所述产品数据中筛选得到各保险产品的特征因子集合;

建立步骤:获取多个第一预设时间区间内各保险产品的赔付支出观测值及所述各特征因子的特征因子观测值,利用所述赔付支出观测值及特征因子观测值,按照预设建立规则逐一建立各保险产品对应的赔付支出预测方程;

预测步骤:在接收到预测指令时,获取第二预设时间区间内各保险产品的赔付支出观测值及特征因子观测值,并根据所述各保险产品的赔付支出预测方程、第二预设时间区间内各保险产品的赔付支出观测值及特征因子观测值,对第三预设时间区间内各保险产品的赔付支出进行预测,得到第三预设时间区间内各保险产品的赔付支出的预测值。

本发明存储介质具体实施方式与上述电子装置和方法各实施例基本相同,在此不作累述。

需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1