一种医保欺诈行为识别方法、装置及设备与流程

文档序号:18001280发布日期:2019-06-25 22:52阅读:243来源:国知局
一种医保欺诈行为识别方法、装置及设备与流程

本申请涉及数据处理领域,具体涉及一种医保欺诈行为识别方法、装置及设备。



背景技术:

对于医疗机构违规组织参保人员,批量入院虚假就医套取大量医保基金的医保欺诈行为,医保监管部门普遍采用有举报才监管的机制,这种监管机制无疑存在着大量漏洞,致使医保基金蒙受损失。

所以,目前亟需一种能够及时发现并处理上述医保欺诈行为的方法,减少医保基金的损失。



技术实现要素:

为此,本申请提供了一种医保欺诈行为识别方法、装置及设备,能够智能化的及时识别医保欺诈行为,以便对其进行有效处理,从而避免医保基金的损失。

第一方面,本申请提供了一种医保欺诈行为识别方法,所述方法包括:

获取符合预设条件的患者的病历信息,其中,所述患者包括待识别患者,所述病历信息包括入院时间和出院时间;

基于所述入院时间和所述出院时间,确定所述待识别患者与其他患者的结伴入院次数;

基于所述待识别患者的病历信息和所述结伴入院次数,提取所述待识别患者对应的特征向量;

将所述特征向量作为经过训练的支持向量机模型的输入参数,经过所述支持向量机模型的识别后,输出对所述待识别患者的识别结果,其中,所述识别结果用于反映所述待识别患者是否发生医保欺诈行为。

一种可选的实施方式中,所述将所述特征向量作为经过训练的支持向量机模型的输入参数,经过所述支持向量机模型的识别后,输出对所述待识别患者的识别结果之前,还包括:

基于所述入院时间和所述出院时间,分别确定各个患者与其他患者的结伴入院次数;

基于各个患者的病历信息和所述结伴入院次数,提取各个患者对应的特征向量;

将所述结伴入院次数小于预设值的患者对应的特征向量标记为正常类别,以及将所述结伴入院次数不小于所述预设值的患者对应的特征向量标记为异常类别;

利用各个患者对应的特征向量,对预先构建的支持向量机模型进行训练,得到经过训练的支持向量机模型。

一种可选的实施方式中,所述方法还包括:

如果所述待识别患者为发生医保欺诈行为的患者,则确定与所述待识别患者的结伴入院次数不小于所述预设值的患者,将所述患者也识别为发生医保欺诈行为的患者。

一种可选的实施方式中,所述基于各个患者的病历信息和所述结伴入院次数,提取各个患者对应的特征向量,包括:

预先确定所述病历信息中的基础特征信息;

利用相关性算法,计算所述病历信息中的各个特征信息分别与所述基础特征信息之间的相关系数;

将大于预设系数阈值的相关系数对应的特征信息作为关键特征信息;

对各个患者的病历信息中的所述关键特征信息和所述结伴入院次数进行特征化处理,得到各个患者对应的特征向量。

一种可选的实施方式中,所述基于所述待识别患者的病历信息和所述结伴入院次数,提取所述待识别患者对应的特征向量,包括:

获取所述待识别患者的病历信息中的所述关键特征信息;

对所述待识别患者的病历信息中的所述关键特征信息和所述待识别患者的结伴入院次数进行特征化处理,得到所述待识别患者对应的特征向量。

一种可选的实施方式中,所述利用各个患者对应的特征向量,对预先构建的支持向量机模型进行训练,得到经过训练的支持向量机模型之前,还包括:

分别为各个患者对应的特征向量设置权重值;

相应的,所述利用各个患者对应的特征向量,对预先构建的支持向量机模型进行训练,得到经过训练的支持向量机模型,包括:

利用具有权重值的各个患者对应的特征向量,对预先构建的支持向量机模型进行训练,得到经过训练的支持向量机模型。

第二方面,本申请还提供了一种医保欺诈行为识别装置,所述装置包括:

获取模块,用于获取符合预设条件的患者的病历信息,其中,所述患者包括待识别患者,所述病历信息包括入院时间和出院时间;

第一确定模块,用于基于所述入院时间和所述出院时间,确定所述待识别患者与其他患者的结伴入院次数;

第一提取模块,用于基于所述待识别患者的病历信息和所述结伴入院次数,提取所述待识别患者对应的特征向量;

识别模块,用于将所述特征向量作为经过训练的支持向量机模型的输入参数,经过所述支持向量机模型的识别后,输出对所述待识别患者的识别结果,其中,所述识别结果用于反映所述待识别患者是否发生医保欺诈行为。

一种可选的实施方式中,所述装置还包括:

第二确定模块,用于基于所述入院时间和所述出院时间,分别确定各个患者与其他患者的结伴入院次数;

第二提取模块,用于基于各个患者的病历信息和所述结伴入院次数,提取各个患者对应的特征向量;

标记模块,用于将所述结伴入院次数小于预设值的患者对应的特征向量标记为正常类别,以及将所述结伴入院次数不小于所述预设值的患者对应的特征向量标记为异常类别;

训练模块,用于利用各个患者对应的特征向量,对预先构建的支持向量机模型进行训练,得到经过训练的支持向量机模型。

一种可选的实施方式中,所述装置还包括:

第三确定模块,用于在所述待识别患者为发生医保欺诈行为的患者时,确定与所述待识别患者的结伴入院次数不小于所述预设值的患者,将所述患者也识别为发生医保欺诈行为的患者。

一种可选的实施方式中,所述第二提取模块,包括:

第一确定子模块,用于预先确定所述病历信息中的基础特征信息;

计算子模块,用于利用相关性算法,计算所述病历信息中的各个特征信息分别与所述基础特征信息之间的相关系数;

第二确定子模块,用于将大于预设系数阈值的相关系数对应的特征信息确定为关键特征信息;

第一特征化子模块,用于对各个患者的病历信息中的所述关键特征信息和所述结伴入院次数进行特征化处理,得到各个患者对应的特征向量。

一种可选的实施方式中,所述第一提取模块,包括:

获取子模块,用于获取所述待识别患者的病历信息中的所述关键特征信息;

第二特征化子模块,用于对所述待识别患者的病历信息中的所述关键特征信息和所述待识别患者的结伴入院次数进行特征化处理,得到所述待识别患者对应的特征向量。

一种可选的实施方式中,所述装置还包括:

设置模块,用于分别为各个患者对应的特征向量设置权重值;

相应的,所述训练模块,具体用于:

利用具有权重值的各个患者对应的特征向量,对预先构建的支持向量机模型进行训练,得到经过训练的支持向量机模型。

第三方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述任一项所述的医保欺诈行为识别方法。

第四方面,本申请还提供了一种医保欺诈行为识别设备,其特征在于,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述任一项所述的医保欺诈行为识别方法。

本申请提供的医保欺诈行为识别方法中,基于入院时间和出院时间确定待识别患者与其他患者的结伴入院次数,并将结伴入院次数作为待识别患者的特征向量的一个维度,由于结伴入院次数属于医保欺诈行为的一种特点,因此本申请能够更准确的对医保欺诈行为进行识别。另外,本申请利用经过训练的支持向量机模型更智能化的及时对待识别患者进行医保欺诈行为的识别,以便对其进行有效处理,从而避免医保基金的损失。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种医保欺诈行为识别方法的流程图;

图2为本申请实施例提供的另一种医保欺诈行为识别方法的流程图;

图3为本申请实施例提供的一种医保欺诈行为识别装置的结构示意图;

图4为本申请实施例提供的一种医保欺诈行为识别设备的结构示意图。

具体实施方式

对于医疗机构违规组织参保人员,批量入院虚假就医套取大量医保基金的医保欺诈行为,本申请提供了一种医保欺诈行为识别方法,首先获取符合预设条件的患者的病历信息,其中,所述患者包括待识别患者,所述病历信息包括入院时间和出院时间;其次,基于所述入院时间和所述出院时间,确定所述待识别患者与其他患者的结伴入院次数,并基于所述待识别患者的病历信息和所述结伴入院次数,提取所述待识别患者对应的特征向量;最后,将所述特征向量作为经过训练的支持向量机模型的输入参数,经过所述支持向量机模型的识别后,输出对所述待识别患者的识别结果,其中,所述识别结果用于反映所述待识别患者是否发生医保欺诈行为。本申请提供的医保欺诈行为识别方法能够对上述医保欺诈行为进行及时识别,以便对其进行有效处理,从而避免医保基金的损失。

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

方法实施例

参见图1,为本申请实施例提供的一种医保欺诈行为识别方法的流程图,该方法包括:

s101:获取符合预设条件的患者的病历信息,其中,所述患者包括待识别患者,所述病历信息包括入院时间和出院时间。

本申请实施例提供的医保欺诈行为识别方法是基于患者的病历信息进行识别,为此,本申请实施例首先获取患者的病历信息,具体的,可以通过医保接口获取患者的病历信息。其中,预设条件用于确定获取的患者病历信息的范围,例如,预设条件可以为某一或某些特定医院,也就是说,本申请实施例可以获取某一或某些特定医院的患者的病历信息。

s102:基于所述入院时间和所述出院时间,确定所述待识别患者与其他患者的结伴入院次数。

本申请实施例中,病历信息包括患者的入院时间和出院时间,通过病历信息中的入院时间和出院时间可以判断各个患者是否存在结伴入院的行为,而结伴入院行为属于本申请需要识别的医保欺诈行为的其中一个特点。

实际应用中,可以将相同时间段内入院且相同时间段内出院的患者确定为结伴入院的患者,例如同一天入院且同一天出院的患者确定为结伴入院的患者。通过上述方式,确定待识别患者与获取到病历信息的患者中的其他患者结伴入院次数。

具体的,可以使用apriori算法确定待识别患者与其他患者的结伴入院次数,也可以使用其他算法,本申请实施例对此不做限定。

s103:基于所述待识别患者的病历信息和所述结伴入院次数,提取所述待识别患者对应的特征向量。

本申请实施例中,在确定待识别患者的结伴入院次数后,基于该结伴入院次数和病历信息中的其他信息,提取待识别患者对应的特征向量。

一种可选的实现方式中,上述病历信息中的其他信息可以包括患者年龄,参保单位,医院级别,患者性别,主要诊断,处方数量,药费和/或统筹报销比。具体的,对待识别患者的病历信息中的患者年龄,参保单位,医院级别,患者性别,主要诊断,处方数量,药费和/或统筹报销比,以及结伴住院次数进行特征化处理,得到待识别患者对应的特征向量。可以理解的是,结伴入院次数也作为描述待识别患者的特征向量的一个维度。

s104:将所述特征向量作为经过训练的支持向量机模型的输入参数,经过所述支持向量机模型的识别后,输出对所述待识别患者的识别结果,其中,所述识别结果用于反映所述待识别患者是否发生医保欺诈行为。

本申请实施例中,预先对构建的支持向量机模型进行训练,具体训练内容在后续进行介绍。

在提取到待识别患者的特征向量后,将该特征向量输入经过训练的支持向量机模型,经过该支持向量机模型的识别后,得到对该待识别患者的识别结果,通过该识别结果能够获知待识别患者是否发生医保欺诈行为。

由于本申请实施例中的医保欺诈行为属于团伙欺诈行为,所以,在确定待识别患者发生医保欺诈行为后,本申请实施例进一步的确定团伙欺诈行为中的协同违规人员,具体的,基于获取的患者的病历信息,确定与待识别患者的结伴入院次数不小于预设值的患者,将这些患者也识别为发生医保欺诈行为的患者。通过上述处理,本申请实施例能够对团伙欺诈行为中的各个团伙成员进行更完整的识别。

本申请实施例提供的医保欺诈行为识别方法中,基于入院时间和出院时间确定待识别患者与其他患者的结伴入院次数,并将结伴入院次数作为待识别患者的特征向量的一个维度,由于结伴入院次数属于医保欺诈行为的一种特点,因此本申请能够更准确的对医保欺诈行为进行识别。另外,本申请利用经过训练的支持向量机模型更智能化的及时对待识别患者进行医保欺诈行为的识别,以便对其进行有效处理,从而避免医保基金的损失。

在利用支持向量机模型对待识别患者的医保欺诈行为进行识别之前,本申请实施例首先对支持向量机模型进行训练,在图1的基础上,参考图2,为本申请实施例提供的另一种医保欺诈行为识别方法的流程图;其中,具体的训练过程包括:

s201:基于所述入院时间和所述出院时间,分别确定各个患者与其他患者的结伴入院次数。

本申请实施例中,基于获取到的患者的病历信息中的入院时间和出院时间,分别确定各个患者与其他患者的结伴入院次数。

与上述医保欺诈行为识别方法相似,可以将相同时间段内入院且相同时间段内出院的患者确定为结伴入院的患者,在此不再赘述。

s202:基于各个患者的病历信息和所述结伴入院次数,提取各个患者对应的特征向量。

同样的,在确定用于训练支持向量机模型的患者的病历信息后,基于各个患者的病历信息和各个患者的结伴入院次数,提取各个患者对应的特征向量。

本申请实施例中,由于病历信息中的某些特征信息不能作为描述该患者的特征,例如病历编号等,所以,本申请实施例需要从病历信息中确定出用于提取患者对应的特征向量的特征信息。

一种可选的实施方式中,预先确定所述病历信息中的基础特征信息。其中,基础特征信息可以为“药费”,也可以为“处方数量”、“统筹报销比”等能够明显描述患者特征的特征信息。然后,利用相关性算法,计算所述病历信息中的各个特征信息分别与所述基础特征信息之间的相关系数。其次,将大于预设系数阈值的相关系数对应的特征信息作为关键特征信息。其中,预设系数阈值可以设置为0.6,不做具体限定。另外,实际应用场景中,关键特征信息通常为患者年龄,参保单位,医院级别,患者性别,主要诊断,处方数量,药费和/或统筹报销比。最终,对各个患者的病历信息中的所述关键特征信息和所述结伴入院次数进行特征化处理,得到各个患者对应的特征向量。

值得注意的是,在确定关键特征信息后,提取待识别患者对应的特征向量也是基于该关键特征信息和待识别患者的结伴入院次数。

一种具体的实现方式中,用于提取特征向量的病历信息,即关键特征信息,可以包括患者年龄,参保单位,医院级别,患者性别,主要诊断,处方数量,药费和/或统筹报销比,基于患者年龄,参保单位,医院级别,患者性别,主要诊断,处方数量,药费和/或统筹报销比,以及结伴入院次数,计算各个患者对应的特征向量。值得注意的是,如果特征向量的各个维度的数值较小,可以将该特征向量乘以一个常数k,以提高区分度和准确性。同样的,待识别患者的特征向量也需要乘以该常数k。其中,根据经验k的最优值大约为50,但是本申请对k的具体取值不做限定。

s203:将所述结伴入院次数小于预设值的患者对应的特征向量标记为正常类别,以及将所述结伴入院次数不小于所述预设值的患者对应的特征向量标记为异常类别。

本申请实施例中,预先设置预设值,并将所述结伴入院次数小于预设值的患者对应的特征向量标记为正常类别,以及将所述结伴入院次数不小于所述预设值的患者对应的特征向量标记为异常类别。后续可以基于具有标记的患者的特征向量对支持向量机模型进行训练。

例如,预设值为2,则将结伴入院次数小于2的患者的特征向量标记为正常类别,即表示未发生医保欺诈行为的患者;将结伴入院次数不小于2的患者的特征向量标记为异常类别,即表示发生医保欺诈行为的患者。利用标记为正常类别的患者的特征向量和标记为异常类别的患者的特征向量,共同对支持向量机模型进行训练,使得经过训练的支持向量机模型能够识别发生医保欺诈行为的患者和未发生医保欺诈行为的患者。s204:利用各个患者对应的特征向量,对预先构建的支持向量机模型进行训练,得到经过训练的支持向量机模型。

为了更准确的对支持向量机模型进行训练,本申请实施例还可以分别为各个患者对应的特征向量设置权重值,并利用具有权重值的各个患者对应的特征向量,对预先构建的支持向量机模型进行训练,得到经过训练的支持向量机模型。

一种可选的实施方式中,经过训练的支持向量机模型可以作为校验引擎前置到医生工作站前端,用于对医保欺诈行为进行实时识别并进行预警提示。

具体的,可以基于医院等级的不同,分别为各个患者对应的特征向量设置权重值。通常,医院等级越高,患者发生医保欺诈行为的几率越小,所以,可以将医院等级越高的患者对应的特征向量的权重值设置的越低,相反的,将医院等级越低的患者对应的特征向量的权重值设置的越高。

一种可选的实施方式中,预先将用于对支持向量机模型进行训练的患者的病历信息划分为测试集和训练集,通常随机的选取大约20%作为测试集,其他作为训练集。具体的,利用训练集中的病历信息对预先构建的支持向量机模型进行训练后,利用测试集中的病历信息对经过训练的支持向量机模型进行测试,通过回判观察支持向量机模型的训练效果。

本申请实施例利用上述方式对支持向量机模型进行训练,经过训练的支持向量机模型能够智能化的及时对待识别患者进行医保欺诈行为的识别,以便对其进行有效处理,从而避免医保基金的损失。

装置实施例

参见图3,为本实施例提供的一种医保欺诈行为识别装置的结构示意图,该装置包括:

获取模块301,用于获取符合预设条件的患者的病历信息,其中,所述患者包括待识别患者,所述病历信息包括入院时间和出院时间;

第一确定模块302,用于基于所述入院时间和所述出院时间,确定所述待识别患者与其他患者的结伴入院次数;

第一提取模块303,用于基于所述待识别患者的病历信息和所述结伴入院次数,提取所述待识别患者对应的特征向量;

识别模块304,用于将所述特征向量作为经过训练的支持向量机模型的输入参数,经过所述支持向量机模型的识别后,输出对所述待识别患者的识别结果,其中,所述识别结果用于反映所述待识别患者是否发生医保欺诈行为。

为了实现对支持向量机模型的训练功能,所述装置还包括:

第二确定模块,用于基于所述入院时间和所述出院时间,分别确定各个患者与其他患者的结伴入院次数;

第二提取模块,用于基于各个患者的病历信息和所述结伴入院次数,提取各个患者对应的特征向量;

标记模块,用于将所述结伴入院次数小于预设值的患者对应的特征向量标记为正常类别,以及将所述结伴入院次数不小于所述预设值的患者对应的特征向量标记为异常类别;

训练模块,用于利用各个患者对应的特征向量,对预先构建的支持向量机模型进行训练,得到经过训练的支持向量机模型。

为了识别出医保欺诈行为的同伙成员,所述装置还包括:

第三确定模块,用于在所述待识别患者为发生医保欺诈行为的患者时,确定与所述待识别患者的结伴入院次数不小于所述预设值的患者,将所述患者也识别为发生医保欺诈行为的患者。

一种可选的实施方式中,所述第二提取模块,包括:

第一确定子模块,用于预先确定所述病历信息中的基础特征信息;

计算子模块,用于利用相关性算法,计算所述病历信息中的各个特征信息分别与所述基础特征信息之间的相关系数;

第二确定子模块,用于将大于预设系数阈值的相关系数对应的特征信息确定为关键特征信息;

第一特征化子模块,用于对各个患者的病历信息中的所述关键特征信息和所述结伴入院次数进行特征化处理,得到各个患者对应的特征向量。

具体的,所述第一提取模块,包括:

获取子模块,用于获取所述待识别患者的病历信息中的所述关键特征信息;

第二特征化子模块,用于对所述待识别患者的病历信息中的所述关键特征信息和所述待识别患者的结伴入院次数进行特征化处理,得到所述待识别患者对应的特征向量。

一种可选的实施方式中,所述装置还包括:

设置模块,用于分别为各个患者对应的特征向量设置权重值;

相应的,所述训练模块,具体用于:

利用具有权重值的各个患者对应的特征向量,对预先构建的支持向量机模型进行训练,得到经过训练的支持向量机模型。

本申请实施例提供的医保欺诈行为识别装置,基于入院时间和出院时间确定待识别患者与其他患者的结伴入院次数,并将结伴入院次数作为待识别患者的特征向量的一个维度,由于结伴入院次数属于医保欺诈行为的一种特点,因此本申请能够更准确的对医保欺诈行为进行识别。另外,本申请利用经过训练的支持向量机模型更智能化的及时对待识别患者进行医保欺诈行为的识别,以便对其进行有效处理,从而避免医保基金的损失。

相应的,本发明实施例还提供一种医保欺诈行为识别设备,参见图4所示,可以包括:

处理器401、存储器402、输入装置403和输出装置404。医保欺诈行为识别设备中的处理器401的数量可以一个或多个,图4中以一个处理器为例。在本发明的一些实施例中,处理器401、存储器402、输入装置403和输出装置404可通过总线或其它方式连接,其中,图4中以通过总线连接为例。

存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行医保欺诈行为识别设备的各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。输入装置403可用于接收输入的数字或字符信息,以及产生与医保欺诈行为识别设备的用户设置以及功能控制有关的信号输入。

具体在本实施例中,处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现上述医保欺诈行为识别方法中的各种功能。

另外,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述任一项所述的医保欺诈行为识别方法。

对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本申请实施例所提供的一种医保欺诈行为识别方法、装置及设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1