医疗保险保费定价方法、装置、计算机设备和存储介质与流程

文档序号:16472783发布日期:2019-01-02 23:16阅读:340来源:国知局
医疗保险保费定价方法、装置、计算机设备和存储介质与流程

本申请涉及计算机技术领域,特别是涉及一种医疗保险保费定价方法、装置、计算机设备和存储介质。



背景技术:

医疗保险一般指基本医疗保险,是为了补偿劳动者因疾病风险造成的经济损失而建立的一项社会保险制度。参保人员患病就诊发生医疗费用后,由医疗保险机构对其给予一定的经济补偿。目前,医疗保险机构对于医疗保险保费的确定一般是通过人工进行。然而,现在医疗保险的业务种类越来越多,情况越来越复杂,通过人工进行保费的确定,效率和准确性都比较低下。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够提高保费确定效率和准确性的医疗保险保费定价方法、装置、计算机设备和存储介质。

一种医疗保险保费定价方法,所述方法包括:

获取医保数据,将医保数据经过特征工程提取得到医保特征向量;

将医保特征向量输入到已训练好的医保报销异常检测模型中,得到异常检测结果,将医保特征向量输入到已训练好的医保理赔费用检测模型中,得到可控理赔费用,根据异常检测结果和可控理赔费用得到医保理赔可控空间比例;

获取医保数据中的理赔值、医保成本数、医保利润数和医保风险走廊数,根据医保成本数、医保利润数、医保风险走廊数和医保理赔可控空间比例计算得到保费定价。

在其中一个实施例中,将医保数据经过特征工程提取得到医保特征向量,包括:

将医保数据进行数据清洗,得到清洗后的医保数据;

根据清洗后的医保数据得到预设特征类型对应的特征集;

根据预设特征类型对应的特征集使用特征选择算法进行特征选择,得到医保输入特征,根据医保输入特征和清洗后的医保数据得到医保特征向量。

在其中一个实施例中,已训练的医保报销异常检测模型的生成步骤包括:

获取历史医保数据和对应的历史异常检测结果数据,根据历史医保数据得到历史医保特征向量,根据对应的历史异常检测结果得到历史医保输出向量;

将历史医保特征向量作为输入,将对应的历史医保输出向量作为标签,使用随机森林算法进行训练,当达到目标条件时,得到已训练的医保报销异常检测模型。

在其中一个实施例中,已训练的医保报销异常检测模型的生成步骤包括:

获取历史医保数据,将历史医保数据作为初始样本数据;

随机从初始样本数据中选择目标样本数据,将目标样本数据作为目标树当前节点;

随机选择目标特征,在目标树当前节点中随机选择目标特征对应的特征值;

根据特征值对目标树当前节点二叉划分,得到目标树当前节点的叶子节点,将叶子节点作为目标树当前节点;

返回随机选择目标特征,在目标树当前节点中随机选择目标特征对应的特征值的步骤,当达到预设条件时,得到目标树;

返回随机从初始样本数据中选择目标样本数据,将目标样本数据作为目标树当前节点的步骤,当达到预设数目的目标树时,形成隔离森林,得到已训练的医保报销异常检测模型。

在其中一个实施例中,已训练的医保理赔费用检测模型的生成步骤包括:

获取历史医保数据和对应的可控理赔费用,根据历史医保数据提取医保理赔特征;

计算医保理赔特征对应的医保特征向量和可控理赔费用对应的向量;

将医保特征向量作为前馈神经网络的输入,将可控理赔费用对应的向量作为标签进行训练,当达到预设条件时,得到已训练的医保理赔费用检测模型。

在其中一个实施例中,已训练的医保理赔费用检测模型的生成步骤包括:

获取历史医保数据,将历史医保数据输入聚类模型中,得到多个候选医保簇群;

计算各个候选医保簇群的理赔对标值,并获取各个候选医保簇群中历史医保数据中的理赔值,根据理赔对标值和理赔值计算各个候选医保簇群的理赔差异值,得到已训练的医保理赔费用检测模型。

在其中一个实施例中,所述方法还包括:

获取带有不同影响因子的医保数据,根据带有不同影响因子的医保数据分别计算得到对应的保费定价;

将保费定价进行排序,根据排序结果得到影响因子的重要程度。

一种医疗保险保费定价装置,所述装置包括:

特征向量得到模块,用于获取医保数据,将医保数据经过特征工程提取得到医保特征向量;

可控比例得到模块,用于将医保特征向量输入到已训练好的医保报销异常检测模型中,得到异常检测结果,将医保特征向量输入到已训练好的医保理赔费用检测模型中,得到可控理赔费用,根据异常检测结果和可控理赔费用得到医保理赔可控空间比例;

保费计算模块,用于获取医保数据中的理赔值、医保成本数、医保利润数和医保风险走廊数,根据医保成本数、医保利润数、医保风险走廊数和医保理赔可控空间比例计算得到保费定价。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

获取医保数据,将医保数据经过特征工程提取得到医保特征向量;

将医保特征向量输入到已训练好的医保报销异常检测模型中,得到异常检测结果,将医保特征向量输入到已训练好的医保理赔费用检测模型中,得到可控理赔费用,根据异常检测结果和可控理赔费用得到医保理赔可控空间比例;

获取医保数据中的理赔值、医保成本数、医保利润数和医保风险走廊数,根据医保成本数、医保利润数、医保风险走廊数和医保理赔可控空间比例计算得到保费定价。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

获取医保数据,将医保数据经过特征工程提取得到医保特征向量;

将医保特征向量输入到已训练好的医保报销异常检测模型中,得到异常检测结果,将医保特征向量输入到已训练好的医保理赔费用检测模型中,得到可控理赔费用,根据异常检测结果和可控理赔费用得到医保理赔可控空间比例;

获取医保数据中的理赔值、医保成本数、医保利润数和医保风险走廊数,根据医保成本数、医保利润数、医保风险走廊数和医保理赔可控空间比例计算得到保费定价。

上述医疗保险保费定价方法、装置、计算机设备和存储介质,通过获取医保数据,将医保数据经过特征工程提取得到医保特征向量;将医保特征向量输入到已训练好的医保报销异常检测模型中,得到异常检测结果,将医保特征向量输入到已训练好的医保理赔费用检测模型中,得到可控理赔费用,根据异常检测结果和可控理赔费用得到医保理赔可控空间比例;获取医保数据中的理赔值、医保成本数、医保利润数和医保风险走廊数,根据医保成本数、医保利润数、医保风险走廊数和医保理赔可控空间比例计算得到保费定价。通过医保数据计算得到医保理赔可控空间比例,然后结合医保成本数、医保利润数和医保风险走廊数得到保费定价,能够提高保费确定的效率和准确性。

附图说明

图1为一个实施例中医疗保险保费定价方法的应用场景图;

图2为一个实施例中医疗保险保费定价方法的流程示意图;

图3为一个实施例中得到医保特征向量的流程示意图;

图4为一个实施例中得到已训练的医保报销异常检测模型的流程示意图;

图5为另一个实施例中得到已训练的医保报销异常检测模型的流程示意图;

图6为一个实施例中得到已训练的医保理赔费用检测模型的流程示意图;

图7为另一个实施例中得到已训练的医保理赔费用检测模型的流程示意图;

图8为一个实施例中得到影响因子重要程度的流程示意图;

图9为一个实施例中医疗保险保费定价装置的结构框图;

图10为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的医疗保险保费定价方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。服务器104获取终端102发送的医保数据,将医保数据经过特征工程提取得到医保特征向量;将医保特征向量输入到已训练好的医保报销异常检测模型中,得到异常检测结果,将医保特征向量输入到已训练好的医保理赔费用检测模型中,得到可控理赔费用,根据异常检测结果和可控理赔费用得到医保理赔可控空间比例;服务器102获取医保数据中的理赔值、医保成本数、医保利润数和医保风险走廊数,根据医保成本数、医保利润数、医保风险走廊数和医保理赔可控空间比例计算得到保费定价。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种医疗保险保费定价方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:

s202,获取医保数据,将医保数据经过特征工程提取得到医保特征向量。

其中,医保数据是指患者在医院进行治疗过程中产生的可进行医保报销的相关数据,医保数据包括医疗相关数据、就诊行为数据、费用支出数据和患者数据等。特征工程是指从原始数据中选择出一些最优特征以降低数据集维度的过程。

具体地,服务器获取到医院终端发送的医保数据,也可以从全国医疗数据库中获取到医保数据,根据得到的该医保数据通过特征工程得到需要的医保特征,然后根据医保数据建立医保特征向量。

s204,将医保特征向量输入到已训练好的医保报销异常检测模型中,得到异常检测结果,将医保特征向量输入到已训练好的医保理赔费用检测模型中,得到可控理赔费用,根据异常检测结果和可控理赔费用得到医保理赔可控空间比例。

其中,医保报销异常检测模型用于检测医保数据中存在医保报销异常的数据,该医保报销异常检测模型是根据历史医保数据使用机器学习算法建立。医保理赔费用检测模型是用于检测医保理赔费用是否需要进行控制,该医保理赔费用检测模型是也是根据历史医保数据使用机器学习算法建立。

具体地,服务器将医保特征向量输入到已训练好的医保报销异常检测模型中得到医保报销异常检测模型的输出,根据该输出得到医保数据的异常检测结果,此时,再将该医保特征向量重新输入到已训练好的医保理赔费用检测模型中,得到医保理赔费用检测模型的输出,根据该输出得到可控理赔费用,根据异常检测结果和可控理赔费用得到保费可控空间比例。

s206,获取医保数据中的理赔值、医保成本数、医保利润数和医保风险走廊数,根据医保成本数、医保利润数、医保风险走廊数和医保理赔可控空间比例计算得到保费定价。

其中,医保风险走廊数是指保险公司最大可承受的医保赔付风险值。

具体地,保险公司首先要确定好医保成本数、预期要获取的医保利润数和设置好的医保风险走廊数,服务器获取到医保数据中的理赔值,医保成本数、医保利润数和医保风险走廊数,根据医保数据中的理赔值和医保理赔可控空间比例计算得到可控理赔值,计算可控理赔值、医保成本数、医保利润数和医保风险走廊数进行计算得到保费定价,比如,若医保数据中的理赔值为100、医保成本数为2、医保利润数为5,医保风险走廊数为20,医保理赔可控空间比例为1%,可控理赔值为100*1%=90,则计算得到保费定价为90+2+5+20=117。

上述医疗保险保费定价方法中,通过获取医保数据,将医保数据经过特征工程提取得到医保特征向量;将医保特征向量输入到已训练好的医保报销异常检测模型中,得到异常检测结果,将医保特征向量输入到已训练好的医保理赔费用检测模型中,得到可控理赔费用,根据异常检测结果和可控理赔费用得到医保理赔可控空间比例;获取医保数据中的理赔值、医保成本数、医保利润数和医保风险走廊数,根据医保成本数、医保利润数、医保风险走廊数和医保理赔可控空间比例计算得到保费定价,能够提高保费确定的效率和准确性。

在一个实施例中,如图3所示,步骤s202,即将医保数据经过特征工程提取得到医保特征向量,包括步骤:

s302,将医保数据进行数据清洗,得到清洗后的医保数据。

s304,根据清洗后的医保数据得到预设特征类型对应的特征集。

其中,预设特征类型包括就诊行为类型、费用支出类型、医疗项目类型和患者信息类型等。就诊行为类型用于反映患者的就诊行为的特征,包括就诊次数特征、就诊频率特征、就诊地点集中度特征和就诊行为自洽性等。费用支出类型用于反映患者的费用相关信息,包括支出额度、细项分布和速率等。医疗项目用于反映社保三目录相关信息的特征,包括手术、药品和检查等。患者信息用于反映患者的社会人口学信息和其他非诊疗直接相关信息特征,包括年龄、性别和是否公务员等。

具体地,服务器首先将获取得到的医保数据进行数据清洗,即检查数据一致性,处理无效值和缺失值等,得到清洗后的医保数据。将清洗后的数据通过excelvba(vba是visualbasicforapplications的缩写,是visualbasic的一种宏语言,是微软开发出来在其桌面应用程序中执行通用的自动化(ole)任务的编程语言)进行可视化的展示。然后根据预设特征类型和清洗后的医保数据建立特征集。该特征集中就包括的所有预设特征类型对应的所有特征。

s306,根据预设特征类型对应的特征集使用特征选择算法进行特征选择,得到医保输入特征,根据医保输入特征和清洗后的医保数据得到医保特征向量。

其中,特征选择算法的一般过程包括特征子集产生过程、评价函数、停止准则和验证过程4个过程。

具体地,在预设特征类型对应的特征集中进行特征子集选择,为评价函数提供特征子集,使用评价函数评价选择的特征子集,当评价函数值达到某个阈值后,就得到了医保输入特征。然后从医保数据中得到医保输入特征对应的医保输入特征值。根据医保输入特征对应的医保输入特征值建立对应的医保特征向量,比如,得到的医保输入特征为就诊次数特征、就诊地点集中度和性别特征,则在待测试的医保数据中得到的医保输入特征值为就诊次数4次、就诊地点集中度为80%为深圳市和性别为男,则得到的医保特征向量为[4,0.8,1]。通过特征选择提取得到医保特征向量,降低了医保数据维度,能够提高得到保费定价的效率和准确性。

在一个实施例中,如图4所述,已训练的医保报销异常检测模型的生成步骤包括:

s402,获取历史医保数据和对应的历史异常检测结果数据,根据历史医保数据得到历史医保特征向量,根据对应的历史异常检测结果得到历史医保输出向量。

s404,将历史医保特征向量作为输入,将对应的历史医保输出向量作为标签,使用随机森林算法进行训练,当达到目标条件时,得到已训练的医保报销异常检测模型。

其中,随机森林指的是利用多棵树对样本进行训练并预测的一种分类器。随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。目标条件是指预先设置好随机森林中决策树的数目。

具体地,服务器获取到历史医保数据和对应的历史异常检测结果数据,根据历史医保数据得到历史医保特征向量,当历史医保特征对应的数据为数值时,可以直接为历史医保特征向量中的值,当历史医保特征对应的数据为文本时,可以预先设置好文字与数值的对应关系,将文本对应的数值作为历史医保特征向量中的值。根据对应的历史异常检测结果得到历史医保输出向量,该检测结果特征对应的数据就为文本,包括正常和异常两种检测结果。可以预先设置好检测结果与向量中的值的对应关系,然后根据该对应关系就可以得到历史异常检测结果对应的历史医保输出向量。比如,若预先设置好检测结果为正常对应的向量中的值为1,若检测结果为异常对应的向量中的值为0。则历史异常检测结果为正常对应的历史医保输出向量为[1]。当为异常时对应的历史医保输出向量为[0]。在上述实施例中,通过根据历史医保数据和对应的历史异常检测结果数据预先训练好医保报销异常检测模型,可以在进行保费定价时直接使用该训练好的医保报销异常检测模型,提高了得到保费定价的效率。

在一个实施例中,如图5所示,已训练的医保报销异常检测模型的生成步骤包括:

s502,获取历史医保数据,将历史医保数据作为初始样本数据。

s504,随机从初始样本数据中选择目标样本数据,将目标样本数据作为目标树当前节点。

具体地,服务器获取到历史医保数据,该历史医保数据中包括了异常报销的医保数据和正常报销的医保数据,将该历史医保数据作为初始样本数据。服务器随机从初始样本数据中随机选择部分样本数据作为目标样本数据,将目标验证数据作为目标树当前节点,其中,该目标数是指隔离森林中的一颗隔离树。若目标树当前节点为初始节点,则该当前节点为目标树的根节点。

s506,随机选择目标特征,在目标树当前节点中随机选择目标特征对应的特征值。

s508,根据特征值对目标树当前节点二叉划分,得到目标树当前节点的叶子节点,将叶子节点作为目标树当前节点。

具体地,随机从历史医保数据对应的的属性中随机选择一个属性作为目标特征,并在目标树当前节点中随机选择一个目标特征对应的特征值。根据该特征值将目标树当前节点进行二叉划分,即根据特征值将目标数当前节点中目标特征对应的值大于该特征值的样本数据放入左叶子节点中,小于等于该特征值的样本数据放入右叶子节点中,则将该左叶子节点和右叶子节点分别作为目标数当前节点。比如:历史医保数据对应的的属性包括就诊次数、就诊地点集中度和性别等,随机选择的目标特征为就诊次数特征,而目标数当前节点中就诊次数包括5、10、12和13等,随机选择就诊次数对应的特征值可以是10。则进行二叉划分之后得到的左叶子节点中就包括就诊次数为12和13的样本数据,得到的右叶子节点中就包括就诊次数为5和10的样本数据。

s510,返回随机选择目标特征,在目标树当前节点中随机选择目标特征对应的特征值的步骤,当达到预设条件时,得到目标树。

其中,预设条件是指对目标数当前节点停止进行二叉划分的条件,包括目标数的深度达到预设的最大值和目标数当前节点不可再分,目标数当前节点不可再分包括目标数当前节点中只有一个样本数据和目标数当前节点中所有的样本数据相同。

具体地,返回步骤s506继续进行执行,直到达到预设条件时,即目标树当前节点中的医保样本数据不可再分或者目标数的深度达到了预设的最大值,就得到目标树。

s512,返回随机从初始样本数据中选择目标样本数据,将目标样本数据作为目标树当前节点的步骤,当达到预设数目的目标树时,形成隔离森林,得到已训练的医保报销异常检测模型。

具体地,当得到了目标树时,判断目标树的个数是否达到了预设数目,当目标树的个数没有达到预设数目时,就返回步骤504继续进行执行,当目标树的个数达到预设数目时,就将所有的目标数集成为隔离森林,得到了已训练的医保报销异常检测模型。

在上述实施例中,根据历史医保数据使用隔离森林算法进行训练,得到医保报销异常检测模型,在进行保费定价时,可以直接使用该训练完成的医保报销异常检测模型,提高了得到保费定价的效率。

在一个实施例中,如图6所示,已训练的医保理赔费用检测模型的生成步骤包括:

s602,获取历史医保数据和对应的可控理赔费用,根据历史医保数据提取医保理赔特征。

s604,计算医保理赔特征对应的医保特征向量和可控理赔费用对应的向量。

具体地,服务器获取到历史医保数据和对应的可控理赔费用,根据历史医保数据进行特征提取得到医保理赔特征。然后根据得到的医保理赔特征和历史医保数据计算对应的医保特征向量,根据可控理赔费用计算得到对应的向量。比如,得到的历史医保数据中的患者信息为男,28岁,报销费用为1000,正常缴保费,医院信息中医院等级为三级,则计算得到的医保特征向量可以是[1,28,1000,1,3]。在一个实施例中,可以对历史医保数据使用特征选择算法得到医保理赔特征。

s606,将医保特征向量作为前馈神经网络的输入,将可控理赔费用对应的向量作为标签进行训练,当达到预设条件时,得到已训练的医保理赔费用检测模型。

其中,预设条件是是激活函数达到预设阈值。激活函数可以使用s形函数前馈神经网络可以是bp(backpropagation)神经网络,是一种按照误差逆向传播算法训练的多层前馈神经网络.

具体地,服务器将医保特征向量作为bp神经网络的输入,将可控理赔费用对应的向量作为标签进行训练,当激活函数达到预设阈值时,训练完成,得到已训练的医保控费模型。当激活函数没有达到预设阈值时,继续进行训练。

在上述实施例中,根据历史医保数据和对应的可控理赔费用使用bp神经网络算法进行训练得到医保理赔费用检测模型,在进行保费定价时,可以直接使用该已训练的医保理赔费用检测模型,提高了得到保费定价的效率。

在一个实施例中,如图7所示,已训练的医保理赔费用检测模型的生成步骤包括:

s702,获取历史医保数据,将历史医保数据输入聚类模型中,得到多个候选医保簇群。

其中,聚类模型是根据聚类算法建立的模型,用于将历史医保数据聚类成不同的医保簇群,其中聚类算法可以是k均值聚类和基于高斯混合模型的最大期望聚类等。

具体地,服务器获取历史医保数据,将获取到的历史医保数据输入聚类模型中进行聚类,得到多个候选医保簇群,

s704,计算各个候选医保簇群的理赔对标值,并获取各个候选医保簇群中历史医保数据中的理赔值,根据理赔对标值和理赔值计算各个候选医保簇群的理赔差异值,得到已训练的医保理赔费用检测模型。

其中,理赔对标值是指用来和历史医保数据中的理赔值进行对比的值,可以是医保簇群中理赔的平均值,也可以是医保簇群中理赔的分位点,还可以是医保簇群中理赔的异常程度点。理赔差异值是指理赔值和理赔对标值之间的差值。

具体地,服务器分别计算各个候选医保簇群的理赔对标值,并获取到各个候选医保簇群中历史医保数据的理赔值,计算出每个医保簇群中理赔对标值和对应的理赔值之间的理赔差异值,此时就得到了已训练的医保理赔费用检测模型。在上述实施例中,通过将历史医保数据进行聚类,得到多个候选医保簇群,分别计算出每个候选医保簇群的理赔差异值,就得到了医保理赔费用检测模型,当需要进行保费定价时,通过计算医保数据对应的候选医保簇群,然后得到理赔差异值,然后根据医保数据中的理赔值和得到的理赔差异值计算得到可控理赔费用,可以提高得到保费定价的效率。

在一个实施例中,如图8所示,该方法还包括步骤:

s802,获取带有不同影响因子的医保数据,根据带有不同影响因子的医保数据分别计算得到对应的保费定价。

其中,影响因子是指影响保费定价的各种因素,影响因子越重要对保费定价的影响越大,影响因子包括医保计划调整、参保人行为、医保相关政策、医疗供给和参保人群数量等。

具体地,服务器获取到不同影响因子的医保数据,其中,医保数据可以只携带有一个影响因子,则该医保数据中不会携带除该影响因子以外的影响因子的数据。服务器也可以获取到不同影响因子组合之后的医保数据,比如,服务器获取到带有两个或者两个以上的影响因子的医保数据。例如,服务器可以获取到带医疗供给和参保人群数量的医保数据。然后计算出对应的保费定价。

s804,将保费定价进行排序,根据排序结果得到影响因子的重要程度。

具体地,服务器可以获取到多种医保数据,每种医保数据都带有不同的影响因子,然后分别计算出对应的保费定价,将保费定价由大到小依次进行排序,得到排序结果,根据排序结果得到保费定价对应的影响因子的重要程度,保费定价越大则对应的影响因子越重要。也可得到影响因子组合之后的医保数据,得到保费定价,得到组合之后的影响因子的重要程度。

上述实施例中,通过获取带有不同影响因子的医保数据,根据带有不同影响因子的医保数据分别计算得到对应的保费定价,将保费定价进行排序,根据排序结果得到影响因子的重要程度,能够得到影响保费定价的影响因子的重要程度,在进行保费定价时可以获取重要程度越高影响因子的医保数据,可以提高保费定价的准确性。

应该理解的是,虽然图2-8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-8中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图9所示,提供了一种医疗保险保费定价装置900,包括:特征向量得到模块902、可控比例得到模块904和保费计算模块906,其中:

特征向量得到模块902,用于获取医保数据,将所述医保数据经过特征工程提取得到医保特征向量;

可控比例得到模块904,用于将所述医保特征向量输入到已训练好的医保报销异常检测模型中,得到异常检测结果,将所述医保特征向量输入到已训练好的医保理赔费用检测模型中,得到可控理赔费用,根据所述异常检测结果和所述可控理赔费用得到医保理赔可控空间比例;

保费计算模块906,用于获取医保数据中的理赔值、医保成本数、医保利润数和医保风险走廊数,根据所述医保成本数、所述医保利润数、所述医保风险走廊数和所述医保理赔可控空间比例计算得到保费定价。

在一个实施例中,特征向量得到模块902,包括:

数据清洗模块,用于将医保数据进行数据清洗,得到清洗后的医保数据;

特征集得到模块,用于根据清洗后的医保数据得到预设特征类型对应的特征集;

向量得到模块,用于根据预设特征类型对应的特征集使用特征选择算法进行特征选择,得到医保输入特征,根据医保输入特征和清洗后的医保数据得到医保特征向量。

在一个实施例中,医疗保险保费定价装置900,还包括:

历史向量得到模块,用于获取历史医保数据和对应的历史异常检测结果数据,根据历史医保数据得到历史医保特征向量,根据对应的历史异常检测结果得到历史医保输出向量;

异常检测模型训练模块,用于将历史医保特征向量作为输入,将对应的历史医保输出向量作为标签,使用随机森林算法进行训练,当达到目标条件时,得到已训练的医保报销异常检测模型。

在一个实施例中,医疗保险保费定价装置900,还包括:

当前节点得到模块,用于获取历史医保数据,将历史医保数据作为初始样本数据;随机从初始样本数据中选择目标样本数据,将目标样本数据作为目标树当前节点;

特征值选择模块,用于随机选择目标特征,在目标树当前节点中随机选择目标特征对应的特征值;

划分模块,用于根据特征值对目标树当前节点二叉划分,得到目标树当前节点的叶子节点,将叶子节点作为目标树当前节点;

目标树得到模块,用于返回随机选择目标特征,在目标树当前节点中随机选择目标特征对应的特征值的步骤,当达到预设条件时,得到目标树;

隔离森林得到模块,用于返回随机从初始样本数据中选择目标样本数据,将目标样本数据作为目标树当前节点的步骤,当达到预设数目的目标树时,形成隔离森林,得到已训练的医保报销异常检测模型。

在一个实施例中,医疗保险保费定价装置900,还包括:

特征提取模块,用于获取历史医保数据和对应的可控理赔费用,根据历史医保数据提取医保理赔特征;

向量计算模块,用于计算医保理赔特征对应的医保特征向量和可控理赔费用对应的向量;

费用检测模型训练模块,用于将医保特征向量作为前馈神经网络的输入,将可控理赔费用对应的向量作为标签进行训练,当达到预设条件时,得到已训练的医保理赔费用检测模型。

在一个实施例中,医疗保险保费定价装置900,还包括:

聚类模块,用于获取历史医保数据,将历史医保数据输入聚类模型中,得到多个候选医保簇群;

差异值计算模块,用于计算各个候选医保簇群的理赔对标值,并获取各个候选医保簇群中历史医保数据中的理赔值,根据理赔对标值和理赔值计算各个候选医保簇群的理赔差异值,得到已训练的医保理赔费用检测模型。

在一个实施例中,医疗保险保费定价装置900,还包括:

保费定价计算模块,用于获取带有不同影响因子的医保数据,根据带有不同影响因子的医保数据分别计算得到对应的保费定价;

保费定价排序模块,用于将保费定价进行排序,根据排序结果得到影响因子的重要程度

关于医疗保险保费定价装置的具体限定可以参见上文中对于医疗保险保费定价方法的限定,在此不再赘述。上述医疗保险保费定价装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储医保数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种医疗保险保费定价方法。

本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取医保数据,将医保数据经过特征工程提取得到医保特征向量;将医保特征向量输入到已训练好的医保报销异常检测模型中,得到异常检测结果,将医保特征向量输入到已训练好的医保理赔费用检测模型中,得到可控理赔费用,根据异常检测结果和可控理赔费用得到医保理赔可控空间比例;获取医保数据中的理赔值、医保成本数、医保利润数和医保风险走廊数,根据医保成本数、医保利润数、医保风险走廊数和医保理赔可控空间比例计算得到保费定价。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:将医保数据进行数据清洗,得到清洗后的医保数据;根据清洗后的医保数据得到预设特征类型对应的特征集;根据预设特征类型对应的特征集使用特征选择算法进行特征选择,得到医保输入特征,根据医保输入特征和清洗后的医保数据得到医保特征向量。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取历史医保数据和对应的历史异常检测结果数据,根据历史医保数据得到历史医保特征向量,根据对应的历史异常检测结果得到历史医保输出向量;将历史医保特征向量作为输入,将对应的历史医保输出向量作为标签,使用随机森林算法进行训练,当达到目标条件时,得到已训练的医保报销异常检测模型。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取历史医保数据,将历史医保数据作为初始样本数据;随机从初始样本数据中选择目标样本数据,将目标样本数据作为目标树当前节点;随机选择目标特征,在目标树当前节点中随机选择目标特征对应的特征值;根据特征值对目标树当前节点二叉划分,得到目标树当前节点的叶子节点,将叶子节点作为目标树当前节点;返回随机选择目标特征,在目标树当前节点中随机选择目标特征对应的特征值的步骤,当达到预设条件时,得到目标树;返回随机从初始样本数据中选择目标样本数据,将目标样本数据作为目标树当前节点的步骤,当达到预设数目的目标树时,形成隔离森林,得到已训练的医保报销异常检测模型。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取历史医保数据和对应的可控理赔费用,根据历史医保数据提取医保理赔特征;计算医保理赔特征对应的医保特征向量和可控理赔费用对应的向量;将医保特征向量作为前馈神经网络的输入,将可控理赔费用对应的向量作为标签进行训练,当达到预设条件时,得到已训练的医保理赔费用检测模型。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取历史医保数据,将历史医保数据输入聚类模型中,得到多个候选医保簇群;计算各个候选医保簇群的理赔对标值,并获取各个候选医保簇群中历史医保数据中的理赔值,根据理赔对标值和理赔值计算各个候选医保簇群的理赔差异值,得到已训练的医保理赔费用检测模型。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取带有不同影响因子的医保数据,根据带有不同影响因子的医保数据分别计算得到对应的保费定价;将保费定价进行排序,根据排序结果得到影响因子的重要程度。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取医保数据,将医保数据经过特征工程提取得到医保特征向量;将医保特征向量输入到已训练好的医保报销异常检测模型中,得到异常检测结果,将医保特征向量输入到已训练好的医保理赔费用检测模型中,得到可控理赔费用,根据异常检测结果和可控理赔费用得到医保理赔可控空间比例;获取医保数据中的理赔值、医保成本数、医保利润数和医保风险走廊数,根据医保成本数、医保利润数、医保风险走廊数和医保理赔可控空间比例计算得到保费定价。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将医保数据进行数据清洗,得到清洗后的医保数据;根据清洗后的医保数据得到预设特征类型对应的特征集;根据预设特征类型对应的特征集使用特征选择算法进行特征选择,得到医保输入特征,根据医保输入特征和清洗后的医保数据得到医保特征向量。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取历史医保数据和对应的历史异常检测结果数据,根据历史医保数据得到历史医保特征向量,根据对应的历史异常检测结果得到历史医保输出向量;将历史医保特征向量作为输入,将对应的历史医保输出向量作为标签,使用随机森林算法进行训练,当达到目标条件时,得到已训练的医保报销异常检测模型。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取历史医保数据,将历史医保数据作为初始样本数据;随机从初始样本数据中选择目标样本数据,将目标样本数据作为目标树当前节点;随机选择目标特征,在目标树当前节点中随机选择目标特征对应的特征值;根据特征值对目标树当前节点二叉划分,得到目标树当前节点的叶子节点,将叶子节点作为目标树当前节点;返回随机选择目标特征,在目标树当前节点中随机选择目标特征对应的特征值的步骤,当达到预设条件时,得到目标树;返回随机从初始样本数据中选择目标样本数据,将目标样本数据作为目标树当前节点的步骤,当达到预设数目的目标树时,形成隔离森林,得到已训练的医保报销异常检测模型。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取历史医保数据和对应的可控理赔费用,根据历史医保数据提取医保理赔特征;计算医保理赔特征对应的医保特征向量和可控理赔费用对应的向量;将医保特征向量作为前馈神经网络的输入,将可控理赔费用对应的向量作为标签进行训练,当达到预设条件时,得到已训练的医保理赔费用检测模型。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取历史医保数据,将历史医保数据输入聚类模型中,得到多个候选医保簇群;计算各个候选医保簇群的理赔对标值,并获取各个候选医保簇群中历史医保数据中的理赔值,根据理赔对标值和理赔值计算各个候选医保簇群的理赔差异值,得到已训练的医保理赔费用检测模型。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取带有不同影响因子的医保数据,根据带有不同影响因子的医保数据分别计算得到对应的保费定价;将保费定价进行排序,根据排序结果得到影响因子的重要程度。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1