一种基于数据处理的风险检测方法和装置与流程

文档序号:17187662发布日期:2019-03-22 21:31阅读:122来源:国知局
一种基于数据处理的风险检测方法和装置与流程
本发明涉及数据处理领域,具体涉及一种基于数据处理的风险检测方法和装置。
背景技术
:医保指社会医疗保险。社会医疗保险是国家和社会根据一定的法律法规,为向保障范围内的劳动者提供患病时基本医疗需求保障而建立的社会保险制度。在现有的住院费用报销过程中,患者的疾病通过审核后即可进行报销。但是在患者的疾病通过审核后,可能存在医院或个人通过虚假开具住院结算单,空刷卡骗取医保基金、挂床住院报销或者将非报销药品篡改为报销药品进行报销的情况,这种违规行为间接造成了社会不公平,应该予以杜绝。现有的住院医保报销核查过程中,医疗保险管理局仅能够对单张住院结算单进行审核,审核效率和准确率都十分低下,不利于医保报销的稽查。技术实现要素:本发明实施例提供一种基于数据处理的风险检测方法和装置,能够通过对多张住院结算单的相似度计算,确定住院计算单的风险值,进而提升发现违规住院结算单的效率和准确率,减少对违规住院结算单的通过率,对医保报销过程的规范化发挥积极作用。本发明实施例的第一方面提供了一种基于数据处理的风险检测方法,所述基于数据处理的风险检测方法包括:根据医疗机构的唯一识别编码获取所述医疗机构中需要报销的多张住院结算单;检测所述多张住院结算单的相似度,并根据所述多张住院结算单的相似度获取所述住院结算单的风险值;当确定所述住院结算单的风险值大于预设风险阈值时,设置所述住院结算单为风险结算单,不通过对所述风险结算单的报销。在可选的情况下,所述多张住院结算单的相似度包括药品服务相似度,所述检测所述多张住院结算单的相似度具体包括:获取所述多张住院结算单的药品信息和器材服务信息;将按照时间先后顺序对所述药品信息和所述器材服务信息进行特征提取,获取特征向量,并根据所述特征向量对所述住院结算单进行聚类,获得多个药品服务相似度类簇;确定所述多个药品服务相似度类簇中的每一个药品服务相似度类簇中包含的住院结算单之间的相似度;根据所述每一个所述药品服务相似度类簇中包含的住院结算单之间的相似度确定所述药品服务相似度类簇对应的药品服务相似度中位数,并将所述药品服务相似度中位数设置为所述药品服务相似度类簇中住院结算单的相似度。在可选的情况下,所述多张住院结算单的相似度包括单据相似度,所述检测所述多张住院结算单的相似度具体包括:获取所述多张住院结算单的医疗机构相关信息,包括科室或开单医生;获取所述多张住院结算单的病人相关信息,包括病人姓名、患病名称或费用报销信息;将所述医疗机构相关信息和所述病人相关信息作为所述住院结算单的特征向量对所述住院结算单进行聚类,获得多个单据相似度类簇;确定所述多个单据相似度类簇中的每一个单据相似度类簇中包含的住院结算单之间的相似度;根据所述每一个单据相似度类簇中包含的住院结算单之间的相似度确定所述单据相似度类簇对应的单据相似度中位数,并将所述单据相似度中位数设置为所述单据相似度类簇中住院结算单的相似度。在可选的情况下,所述根据所述多张住院结算单的相似度获取所述住院结算单的风险值包括:若所述药品服务相似度类簇和/或所述单据相似度类簇中的住院结算单数量大于第一预设阈值,则将所述药品服务相似度类簇和/或所述单据相似度类簇设置为目标类簇;根据所述住院结算单的相似度,确定所述目标类簇中的住院结算单的相似度权值;根据所述相似度权值结合预设规则获取所述住院结算单的风险值。在可选情况下,在根据所述结算单的相似度获得相似度权值之后,所述方法还包括:将根据所述相似度权值获取的所述住院结算单的风险值设置为第一风险值;获取所述多张住院结算单的住院号和住院床位号,并将所述住院床位号相同的住院结算单按照住院号先后顺序进行排序;获取所述住院床位号相同的住院结算单的出入院时间信息,并根据所述出入院时间信息和所述住院号判定所述住院结算单是否满足时间合理性判断规则;若所述住院结算单不满足时间合理性判断规则,则为所述住院结算单设置合理性权值,并根据所述合理性权值确定所述住院结算单的第二风险值;对所述第一风险值和所述第二风险值求和,得到所述住院结算单的风险值。在可选的情况下,在检测所述多张住院结算单的相似度之前,所述方法还包括:从药品与服务数据库中获取所述住院结算单中药品与服务的适用症状;获取所述住院结算单中患者的诊断症状;将所述适用症状与所述诊断症状进行匹配并获得匹配率,确定所述匹配率大于预设匹配率阈值后,触发对所述住院结算单的检测。在可选情况下,所述方法还包括:获取所述风险结算单的信息;获取另一批需要报销的住院结算单的据面信息,并将所述据面信息与所述风险结算单的据面信息进行匹配,获得结算单相似度,其中,所述据面信息包括所述药品信息、器材服务信息、医疗机构相关信息和病人相关信息;当所述结算单相似度大于预设阈值时,确定所述另一批需要报销的住院结算单为风险结算单。本发明实施例的第二方面提供了一种风险检测装置,所述风险检测装置包括:获取单元,用于根据医疗机构的唯一识别编码获取所述医疗机构中需要报销的多张住院结算单;检测单元,用于检测所述多张住院结算单的相似度,并根据所述多张住院结算单的相似度获取所述住院结算单的风险值;确定单元,用于当确定所述住院结算单的风险值大于预设风险阈值时,设置所述住院结算单为风险结算单,不通过对所述风险结算单的报销。本发明实施例第三方面提供了一种电子装置,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行第一方面任一方法中的步骤的指令。本发明实施例第四方面提供了一种计算机可读存储介质,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行第一方面任一方法所述的步骤的指令。在本发明实施例中,基于数据处理的风险检测方法首先根据医疗机构的唯一识别编码获取医疗机构中需要报销的多张住院结算单,然后检测多张住院结算单的相似度,并根据多张住院结算单的相似度获取住院结算单的风险值,最后当确定住院结算单的风险值大于预设风险阈值时,设置住院结算单为风险结算单,不通过对风险结算单的报销。在这个过程中,通过对同一家医疗机构的多张住院结算单相似度的计算,确定住院结算单之间的聚集程度,进而根据住院结算单相似度确定住院结算单的风险值,而当住院结算单的风险值大于预设阈值时,确定住院结算单为风险结算单并不予以报销。这个过程能够对住院结算单进行快速筛查,提升发现违规住院结算单的效率和准确率,减少对虚假住院结算单的通过率,对医保报销过程的规范化发挥积极作用。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1a是本发明实施例提供的一种基于数据处理的风险检测方法流程示意图;图1b是本发明实施例提供的一种住院结算清单的示意图;图2是本发明实施例提供的另一种基于数据处理的风险检测方法的流程示意图;图3是本发明实施例提供的另一种基于数据处理的风险检测方法的流程示意图;图4是本发明实施例提供的另一种基于数据处理的风险检测方法的流程示意图;图5是本发明实施例提供的一种电子装置的结构示意图;图6是本发明实施例提供的一种风险检测装置的结构框图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置展示该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。下面对本发明实施例进行详细介绍。请参阅图1a,图1a为本发明实施例中一种基于数据处理的风险检测方法流程示意图,如图1a所示,所述基于数据处理的风险检测方法包括:101、根据医疗机构的唯一识别编码获取所述医疗机构中需要报销的多张住院结算单。医疗机构是指依法定程序设立的从事疾病诊断、治疗活动的卫生机构的总称,包括医院、卫生院、门诊部和疗养所等,其中具有住院功能的包括医院和疗养所等。因为医疗机构的数量非常庞大,而不同的医疗机构之间进行合作医保造假的可能性比较低,所以在本方案实施例中,以每一个医疗机构为单位,核查住院结算单的风险性。医疗机构的唯一识别编码用于唯一标识该医疗机构,可以是医疗机构的名称或自然数编号,也可以是自然数和医师医疗机构的组合、自然数和医师姓名的组合形成的编号,或者是其他字符的组合成的编号等。请参阅图1b,图1b为本发明实施例提供的一种住院结算清单的示意图,如图1b所示,在住院结算单上,包括住院单号、住院床位号、出入院时间、医院名称、开单医生姓名、病人姓名、性别、年龄、诊断症状、开具药品名称、药品数量、药品价格和药品使用方法等,用于报销的住院结算单还包括药品编号,缴费项目和报销档次等信息。获取多张住院结算单,包括根据时间信息获取的一个时间段内该医疗机构的所有住院结算单,时间段可以是一个月、三个月或者一年,或者一个科室的所有住院结算单,例如妇产科、儿科、外科或者内科等。获得多张住院结算单后,执行s102。102、检测所述多张住院结算单的相似度,并根据所述多张住院结算单的相似度获取所述住院结算单的风险值。在检测医院的多张住院结算单时,如果它们之间的相似度非常高,包括医生信息、病人信息、或药品信息和器材服务信息都非常相似,说明医疗机构的住院结算单可能存在造假,将自费药品修改为报销药品,为患者开具不必要的器材服务,或者挂床住院等以达到骗取医保的作用。这种做法将使得不应该报销的药品获得了报销,或者对不必要的项目甚至伪造项目进行虚假报销,造成医保局负担,同时也造成了社会上不公平现象的加大。因此需要对这类住院结算单予以发现和处理。可选的,多张住院结算单的相似度包括药品服务相似度,检测多张住院结算单的相似度具体包括:获取多张住院结算单的药品信息和器材服务信息;将按照时间先后顺序对药品信息和器材服务信息进行特征提取,获取特征向量,并根据特征向量对住院结算单进行聚类,获得多个药品服务相似度类簇;确定多个药品服务相似度类簇中的每一个药品服务相似度类簇中包含的住院结算单之间的相似度;根据每一个药品服务相似度类簇中包含的住院结算单之间的相似度确定药品服务相似度类簇对应的药品服务相似度中位数,并将药品服务相似度中位数设置为药品服务相似度类簇中住院结算单的相似度。具体地,住院结算单的相似度可以根据住院结算单上的药品信息和器材服务信息来获取。住院结算单上有多种药品,并有每一种药品的名称和数量,还有器材服务信息,包括床位信息,用床天数,医护人员提供的护理服务或医院复建器材等。但是因为患者住院时,是根据患者的病症治疗反馈情况对其进行继续用药的,所以其药品和器材呈现在住院结算单上的时间先后顺序也十分重要,所以将获取到的药品信息和所述器材服务信息按照时间先后顺序生成特征向量,然后根据这些特征向量对住院结算单进行聚类。可采用的聚类算法包括基于划分的聚类算法、基于密度的聚类算法、基于层次的聚类算法、基于模型的聚类算法或基于网格的聚类算法等,典型的基于密度的聚类算法可以是基于密度的噪声应用空间聚类(density-basedspatialclusteringofapplicationswithnoise,dbscan),基于划分的聚类算法可以是k均值(k-means)聚类算法等。对于基于划分的聚类算法,是基于距离的,而距离与相似度可以相互转化,距离越近,相似度越高,距离越远,相似度越低。在聚类过程中,例如,第一特征向量为[镇痛剂,10,麻醉剂,2,消炎药,1],第二特征向量为[消炎药,1,镇痛剂,10,麻醉剂,2],虽然第一特征向量和第二特征向量中包含的特征值相同,但是其顺序不同,所以两个特征向量之间的相似度为0。对住院结算单进行聚类后,会获得多个类簇,不同的类簇之间相似度低,同一类簇中的住院结算单之间相似度高。那么,将住院结算单进行聚类后,获得多个类簇,然后计算同一个类簇中的住院结算单之间的药品服务相似度,最后根据住院结算单之间的药品服务相似度获得该类簇所有住院结算单相似度的中位数。因为中位数可以将住院结算单的相似度划分为相等数量的上下两部分,且中位数为住院结算单之间存在的一个实际的相似度值,因此可以将药品服务相似度中位数设置为药品服务相似度类簇中住院结算单的相似度。其中,住院结算之间的相似度可以根据余弦相似度或pearson相似系数来获得。可选的,多张住院结算单的相似度还包括单据相似度,具体包括:获取多张住院结算单的医疗机构相关信息,包括科室或开单医生;获取多张住院结算单的病人相关信息,包括病人姓名、出入院时间以及患病名称;将医院相关信息和病人相关信息作为住院结算单的特征值,并对住院结算单进行聚类,并确定同一类簇中住院结算单之间的单据相似度中位数;获取单据相似度中位数作为同一类簇中住院结算单的相似度。具体地,住院结算单的相似度也可以根据单据信息来获取,包括医疗机构相关信息和病人相关信息。医疗机构相关信息包括科室名称、开单医生姓名和开单时间等,病人相关信息包括病人姓名、年龄、性别、诊断症状或有无病史等。这些信息越相似,说明单据相似度越高。住院结算单的单据相似度聚类过程与药品服务相似度聚类过程相同,区别只在于采用住院结算单上的医疗机构相关信息和病人相关信息作为特征值,获得特征向量然后进行聚类。获得住院结算单的相似度后,需要计算住院结算单的风险值。对于风险值的计算,可以单独根据住院结算单的药品服务相似度计算风险值,也可以单独根据住院结算单的单据相似度计算风险值,还可以结合住院结算单的药品服务相似度和单据相似度计算风险值。可选的,根据多张住院结算单的相似度确定住院结算单的风险值,包括:若药品服务相似度类簇和/或单据相似度类簇中的住院结算单数量大于第一预设阈值,则将药品服务相似度类簇和/或单据相似度类簇设置为目标类簇;根据住院结算单的相似度获得相似度权值;根据相似度权值获取住院结算单的风险值。具体地,住院单根据药品服务相似度或单据相似度聚类,可分别获得多个药品服务相似度类簇或单据相似度类簇,但是,同一个类簇中的住院结算单数量越多,说明这一批住院结算单的聚集程度越高,即住院结算单之间的相似程度越高。而如果同一类簇中的住院结算单数量越少,说明这一批住院结算单的分散程度越高,即住院结算单之间的相似程度越低。那么首先需要根据同一类簇中的住院结算单数量判定这一批住院结算单的聚集程度。例如总共包含100张住院结算单,对其进行聚类后,获得3个类簇,每一个类簇中对应的住院结算单数量分别为:60,30,10,第一预设阈值可以是一个数值,例如50,也可以是一个百分比,例如50%,那么这三个类簇中,只有第一个类簇中的住院结算单数量大于第一预设阈值,设置为目标类簇,并对目标类簇中的住院结算单计算风险值。对于目标类簇中的住院结算单,已经根据余弦相似度或pearson相似系数获得住院结算单之间的药品服务相似度值和/或单据相似度值,对于一个住院结算单,可以根据单据相似度类簇中的住院结算单的相似度确定其相似度权值;也可以根据药品服务相似度类簇中的住院结算单相似度确定其相似度权值;还可以根据单据相似度类簇和药品服务相似度类簇中的住院结算单相似度之和确定其相似度权值。如表1所示:表1住院结算单权值设置对于根据药品服务相似度类簇获得的目标类簇1,其住院结算单的相似度为α,根据单据相似度类簇获得的目标类簇2,其住院结算单的相似度为β,如果一个住院结算单仅存在于一个目标类簇中,其相似度即为它所存在的目标类簇的住院结算单的相似度。如果一个住院结算单同时存在于多个目标类簇中,其相似度即为它所存在的多个目标类簇的住院结算单的相似度之和。获得住院结算单的相似度后,还需要获得其对应的相似度权值。因为相似度可以是一个0~1之间的小数,例如0.465,或者百分比,例如46.5%,相似度的小数位数可能很长,不利于计算,那么可以对相似度值进行标准化处理,获得标准化数值作为相似度权值。例如采用函数对相似度进行保留2位小数的处理,包括四舍五入法和直接去除小数位法;或者采用乘以固定倍数再去除小数的方法等。获得相似度权值后,根据相似度权值,结合预设规则,计算住院结算单的风险值,预设规则可以是:风险值等于相似度权值;或者由权值乘以一个风险常数,获得风险值。风险常数为大于0的数值,例如10,100等,使得风险值不存在小数。或者通过其他方法,例如四舍五入省略小数位,使风险值成为容易计算的数值。用公式表示如下:f=[α*s1+β*s2]*t其中,住院结算单包含在药品服务相似度类簇形成的目标类簇1中时,s1=1,否者s1=0;住院结算单包含在单据相似度类簇形成的目标类簇2中时,s2=1,否者s2=0;t为风险常数。另外,对于住院结算单来说,住院床位是非常重要的一个指标,因为一个床位在同一时间只能住一个患者,如果住院结算单存在造假,则可能在床位安排上存在不合理。那么,床位的合理性也可以用于发现住院结算单的风险性。可选的,在根据结算单的相似度获得相似度权值之后,方法还包括:将根据相似度权值获取的住院结算单的风险值设置为第一风险值;获取住院结算单的住院号和住院床位号,并将住院床位号相同的住院结算单按照住院号先后顺序进行排序;获取住院床位号相同的住院结算单的出入院时间信息,并根据出入院时间信息和住院号判定住院结算单是否满足时间合理性判断规则;若住院结算单不满足时间合理性判断规则,则为住院结算单设置合理性权值,并根据合理性权值确定住院结算单的第二风险值;对第一风险值和第二风险值求和,得到住院结算单的风险值。具体地,在根据住院结算单的相似度权值确定第一风险值后,再对所有住院结算单上的住院床位号时间合理性进行检测。检测住院结算单是否满足时间合理性判断规则,包括:检测同一时间段是否存在同一床位重复分配给不同患者,如果是,则判断被重复分配同一床位的患者对应的住院结算单都不满足时间合理性判断规则。具体检测过程如表1所示:表2住院结算单时间合理性检测表住院号住院床位号出入院时间0000000x90s142018.5.16-2018.5.180000000x94s142018.5.18-2018.5.190000000x95s142018.5.18-2018.5.20对于住院号为0000000x94和住院号为0000000x95的住院结算单,前者的住院时间和后者的住院时间存在重合,则这两张住院结算单都不满足时间合理性判断规则,为这两张住院结算单设置合理性权值。合理性权值的设置可以直接设置为某个数值,例如0.5或4等,也可以根据住院时间的重合天数进行设置,例如合理性权值=重合天数*n÷[患者1住院天数+…+患者n住院天数],其中n为住院时间重合的患者数。因为直接根据重合天数和患者人数计算出的值很大概率上是一个多位小数,可对其进行标准化处理后获得合理性权值,例如采用函数对相似度进行保留2位小数的处理,包括四舍五入法和直接去除小数位法;或者采用乘以固定倍数再去除小数的方法等。可见,在本发明实施例中,通过住院结算单的药品服务相似度或单据信息相似度确定住院结算单的相似度,然后根据住院结算单的相似度确定其对应的风险值,可以全面考虑住院结算单的相关内容的相似度,并深层次挖掘出住院结算单存在造假的内容。另外,还可以通过将相似度权值获得的风险值与住院结算单上住院床号的时间合理性问题获得的风险值相结合,确定住院结算单的风险值,发现住院结算单的床位造假行为,进一步提高住院结算单的风险检测准确率。103、当确定所述住院结算单的风险值大于预设风险阈值时,设置所述住院结算单为风险结算单,不通过对所述风险结算单的报销。获得相似度大于预设阈值的住院结算单的风险值后,如果该风险值超过了预设风险阈值,说明该住院结算单为风险结算单,不通过对该风险结算单的报销。后续可以对该风险结算单进行继续调查和核实。可选的,在检测多张住院结算单的相似度之前,该方法还包括:从药品与服务数据库中获取住院结算单中药品与服务的适用症状;获取住院结算单中患者的诊断症状;将适用症状与诊断症状进行匹配并获得匹配率,确定匹配率大于预设匹配率阈值后,触发对住院结算单的检测。具体地,对于住院结算单的风险检测,除了结算单造假之外,还有可能存在住院结算单上的药品与服务和患者的症状不匹配的情况。因此,可以在检测住院结算单是否造假之前,对其药品与服务对应的症状和患者诊断症状进行匹配,并确定药品与服务的适用症状和患者的诊断症状之间的匹配率大于预设匹配率阈值。对于不大于匹配率阈值的住院结算单,可直接设置为风险结算单。可选的,该方法还包括:获取风险结算单的信息;获取另一批需要报销的住院结算单的据面信息,并将据面信息与风险结算单进行匹配,获得结算单相似度,其中,据面信息包括药品信息、器材服务信息、医疗机构相关信息和病人相关信息;当结算单相似度大于预设阈值时,确定另一批需要报销的住院结算单为风险结算单。具体地,在已经确定了一些住院结算单为风险结算单后,对于未检测的另一批需要报销的住院结算单,可以将其直接与风险结算单进行匹配并判定是否为风险结算单。能够很大程度上提高风险结算单的检测效率。可见,在本发明实施例中,首先根据医疗机构的唯一识别编码获取医疗机构中需要报销的多张住院结算单,然后检测多张住院结算单的相似度,并根据多张住院结算单的相似度获取住院结算单的风险值,最后当确定住院结算单的风险值大于预设风险阈值时,设置住院结算单为风险结算单,不通过对风险结算单的报销。在这个过程中,通过对同一家医疗机构的多张住院结算单相似度的计算,确定住院结算单之间的聚集程度,进而根据住院结算单相似度确定住院结算单的风险值,而当住院结算单的风险值大于预设阈值时,确定住院结算单为风险结算单并不予以报销。这个过程能够对住院结算单进行快速筛查,提升发现违规住院结算单的效率和准确率,减少对虚假住院结算单的通过率,对医保报销过程的规范化发挥积极作用。请参阅图2,图2是本发明实施例提供的另一种基于数据处理的风险检测方法的流程示意图,如图所示,本实施例中的基于数据处理的风险检测方法包括:201、根据医疗机构的唯一识别编码获取所述医疗机构中需要报销的多张住院结算单;202、获取所述多张住院结算单的药品信息和器材服务信息;203、按照时间先后顺序对所述药品信息和所述器材服务信息进行特征提取,获取特征向量,并根据所述特征向量对所述住院结算单进行聚类,获得多个药品服务相似度类簇;204、确定所述多个药品服务相似度类簇中的每一个药品服务相似度类簇中包含的住院结算单之间的相似度;205、根据所述每一个所述药品服务相似度类簇中包含的住院结算单之间的相似度确定所述药品服务相似度类簇对应的药品服务相似度中位数,并将所述药品服务相似度中位数设置为所述药品服务相似度类簇中住院结算单的相似度;206、获取所述多张住院结算单的医疗机构相关信息,包括科室或开单医生;207、获取所述多张住院结算单的病人相关信息,包括病人姓名、患病名称或费用报销信息;208、将所述医疗机构相关信息和所述病人相关信息作为所述住院结算单的特征向量对所述住院结算单进行聚类,获得多个单据相似度类簇;209、确定所述多个单据相似度类簇中的每一个单据相似度类簇中包含的住院结算单之间的相似度;210、根据所述每一个单据相似度类簇中包含的住院结算单之间的相似度确定所述单据相似度类簇对应的单据相似度中位数,并将所述单据相似度中位数设置为所述单据相似度类簇中住院结算单的相似度;211、若所述药品服务相似度类簇和/或所述单据相似度类簇中的住院结算单数量大于第一预设阈值,则将所述药品服务相似度类簇和/或所述单据相似度类簇设置为目标类簇;212、根据所述住院结算单的相似度,确定所述目标类簇中的住院结算单的相似度权值;213、根据所述相似度权值结合预设规则获取所述住院结算单的风险值;214、当确定所述住院结算单的风险值大于预设风险阈值时,设置所述住院结算单为风险结算单,不通过对所述风险结算单的报销。其中,步骤202~步骤205和步骤206~步骤210为并列的两种确定住院结算单相似度权值的方法,不存在先后顺序。在本发明实施例中,通过住院结算单的药品服务相似度和/或单据相似度,确定住院结算单的相似度,并根据住院结算单的相似度确定其对应的风险值,当住院结算单的风险值大于风险预设风险阈值时,设置该住院结算单为风险结算单,且不通过对该风险结算单的报销。这个过程提升了获取住院结算单的准确率,进一步提高了获取的住院结算单风险值的准确率,使得对于风险结算单的判断更加准确,减少对违规住院结算单的通过率,对医保报销过程的规范化发挥积极作用。请参阅图3,图3是本发明实施例提供的另一种基于数据处理的风险检测方法的流程示意图,如图所示,本实施例中的基于数据处理的风险检测方法包括:301、根据医疗机构的唯一识别编码获取所述医疗机构中需要报销的多张住院结算单;302、检测所述多张住院结算单的相似度,并根据所述多张住院结算单的相似度获取所述住院结算单的风险值;303、将根据所述相似度权值获取的所述住院结算单的风险值设置为第一风险值;304、获取所述多张住院结算单的住院号和住院床位号,并将所述住院床位号相同的住院结算单按照住院号先后顺序进行排序;305、获取所述住院床位号相同的住院结算单的出入院时间信息,并根据所述出入院时间信息和所述住院号判定所述住院结算单是否满足时间合理性判断规则;306、若所述住院结算单不满足时间合理性判断规则,则为所述住院结算单设置合理性权值,并根据所述合理性权值确定所述住院结算单的第二风险值;307、对所述第一风险值和所述第二风险值求和,得到所述住院结算单的风险值;308、当确定所述住院结算单的风险值大于预设风险阈值时,设置所述住院结算单为风险结算单,不通过对所述风险结算单的报销。在本发明实施例中,通过将住院结算单的相似度获得的风险值设置为第二风险值,结合通过住院床位号时间合理性获得的第二风险值,确定住院结算单的风险值,当确定当住院结算单的风险值大于风险预设风险阈值时,设置该住院结算单为风险结算单,且不通过对该风险结算单的报销。这个过程进一步从住院床位号的时间合理性方面挖掘住院结算单的造假可能性,提升了获取住院结算单风险值的准确率,使得对于风险结算单的判断更加准确,减少对违规住院结算单的通过率,对医保报销过程的规范化发挥积极作用。请参阅图4,图4是本发明实施例提供的另一种基于数据处理的风险检测方法的流程示意图,如图所示,本实施例中的基于数据处理的风险检测方法包括:401、根据医疗机构的唯一识别编码获取所述医疗机构中需要报销的多张住院结算单;402、从药品与服务数据库中获取所述住院结算单中药品与服务的适用症状;403、获取所述住院结算单中患者的诊断症状;404、将所述适用症状与所述诊断症状进行匹配并获得匹配率,确定所述匹配率大于预设匹配率阈值后,触发对所述住院结算单的检测;405、检测所述多张住院结算单的相似度,并根据所述多张住院结算单的相似度获取所述住院结算单的风险值;406、当确定所述住院结算单的风险值大于预设风险阈值时,设置所述住院结算单为风险结算单,不通过对所述风险结算单的报销;407、获取所述风险结算单的据面信息,所述据面信息包括所述药品信息、器材服务信息、医疗机构相关信息和病人相关信息;408、获取另一批需要报销的住院结算单的据面信息,并将所述另一批需要报销的住院结算单的据面信息与所述风险结算单的据面信息进行匹配,获得结算单相似度;409、当所述结算单相似度大于预设阈值时,确定所述另一批需要报销的住院结算单为风险结算单,不通过对所述风险结算单的报销。可见,在本发明实施例中,在根据住院结算单相似度获取住院结算单的风险值之前,可以先确定住院结算单上的药品与服务对应的适用症状与患者的诊断症状是否匹配,如果不匹配,可以直接将住院结算单设置为风险结算单。当确定一些住院结算单为风险结算单后,其他住院结算单可以根据于风险结算单的相似度确定是否也为风险结算单。这种方法能够快速确定住院结算单是否为风险结算单,提升判断效率,减少对违规住院结算单的通过率,对医保报销过程的规范化发挥积极作用。图5是本发明实施例提供的一种电子装置的结构示意图,如图5所示,该电子装置包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行以下步骤的指令:根据医疗机构的唯一识别编码获取所述医疗机构中需要报销的多张住院结算单;检测所述多张住院结算单的相似度,并根据所述多张住院结算单的相似度获取所述住院结算单的风险值;当确定所述住院结算单的风险值大于预设风险阈值时,设置所述住院结算单为风险结算单,不通过对所述风险结算单的报销。可以看出,在本发明实施例中,电子设备首先根据医疗机构的唯一识别编码获取医疗机构中需要报销的多张住院结算单,然后检测多张住院结算单的相似度,并根据多张住院结算单的相似度获取住院结算单的风险值,最后当确定住院结算单的风险值大于预设风险阈值时,设置住院结算单为风险结算单,不通过对风险结算单的报销。在这个过程中,通过对同一家医疗机构的多张住院结算单相似度的计算,确定住院结算单之间的聚集程度,进而根据住院结算单相似度确定住院结算单的风险值,而当住院结算单的风险值大于预设阈值时,确定住院结算单为风险结算单并不予以报销。这个过程能够对住院结算单进行快速筛查,提升发现违规住院结算单的效率和准确率,减少对虚假住院结算单的通过率,对医保报销过程的规范化发挥积极作用。在一个可能的示例中,所述多张住院结算单的相似度包括药品服务相似度,在检测所述多张住院结算单的相似度方面,所述程序包括用于执行以下步骤的指令:获取所述多张住院结算单的药品信息和器材服务信息;将按照时间先后顺序对所述药品信息和所述器材服务信息进行特征提取,获取特征向量,并根据所述特征向量对所述住院结算单进行聚类,获得多个药品服务相似度类簇;确定所述多个药品服务相似度类簇中的每一个药品服务相似度类簇中包含的住院结算单之间的相似度;根据所述每一个所述药品服务相似度类簇中包含的住院结算单之间的相似度确定所述药品服务相似度类簇对应的药品服务相似度中位数,并将所述药品服务相似度中位数设置为所述药品服务相似度类簇中住院结算单的相似度。在一个可能的示例中,所述多张住院结算单的相似度包括单据相似度,在检测所述多张住院结算单的相似度方面,所述程序包括用于执行以下步骤的指令:获取所述多张住院结算单的医疗机构相关信息,包括科室或开单医生;获取所述多张住院结算单的病人相关信息,包括病人姓名、患病名称或费用报销信息;将所述医疗机构相关信息和所述病人相关信息作为所述住院结算单的特征向量对所述住院结算单进行聚类,获得多个单据相似度类簇;确定所述多个单据相似度类簇中的每一个单据相似度类簇中包含的住院结算单之间的相似度;根据所述每一个单据相似度类簇中包含的住院结算单之间的相似度确定所述单据相似度类簇对应的单据相似度中位数,并将所述单据相似度中位数设置为所述单据相似度类簇中住院结算单的相似度。在一个可能的示例中,在根据所述多张住院结算单的相似度获取所述住院结算单的风险值方面,所述程序包括用于执行以下步骤的指令:若所述药品服务相似度类簇和/或所述单据相似度类簇中的住院结算单数量大于第一预设阈值,则将所述药品服务相似度类簇和/或所述单据相似度类簇设置为目标类簇;根据所述住院结算单的相似度,确定所述目标类簇中的住院结算单的相似度权值;根据所述相似度权值结合预设规则获取所述住院结算单的风险值。在一个可能的示例中,在根据所述结算单的相似度获得相似度权值之后,所述程序包括用于执行以下步骤的指令:将根据所述相似度权值获取的所述住院结算单的风险值设置为第一风险值;获取所述多张住院结算单的住院号和住院床位号,并将所述住院床位号相同的住院结算单按照住院号先后顺序进行排序;获取所述住院床位号相同的住院结算单的出入院时间信息,并根据所述出入院时间信息和所述住院号判定所述住院结算单是否满足时间合理性判断规则;若所述住院结算单不满足时间合理性判断规则,则为所述住院结算单设置合理性权值,并根据所述合理性权值确定所述住院结算单的第二风险值;对所述第一风险值和所述第二风险值求和,得到所述住院结算单的风险值。在一个可能的示例中,在检测所述多张住院结算单的相似度之前,所述程序包括用于执行以下步骤的指令:从药品与服务数据库中获取所述住院结算单中药品与服务的适用症状;获取所述住院结算单中患者的诊断症状;将所述适用症状与所述诊断症状进行匹配并获得匹配率,确定所述匹配率大于预设匹配率阈值后,触发对所述住院结算单的检测。在一个可能的示例中,所述程序包还括用于执行以下步骤的指令:获取所述风险结算单的据面信息,所述据面信息包括所述药品信息、器材服务信息、医疗机构相关信息和病人相关信息;获取另一批需要报销的住院结算单的据面信息,并将所述另一批需要报销的住院结算单的据面信息与所述风险结算单的据面信息进行匹配,获得结算单相似度;当所述结算单相似度大于预设阈值时,确定所述另一批需要报销的住院结算单为风险结算单,不通过对所述风险结算单的报销。图6是本发明实施例中所涉及的风险检测装置600的功能单元组成框图。该风险检测装置600应用于电子装置,所述风险检测装置包括:获取单元601,用于根据医疗机构的唯一识别编码获取所述医疗机构中需要报销的多张住院结算单;检测单元602,用于检测所述多张住院结算单的相似度,并根据所述多张住院结算单的相似度获取所述住院结算单的风险值;确定单元603,用于当确定所述住院结算单的风险值大于预设风险阈值时,设置所述住院结算单为风险结算单,不通过对所述风险结算单的报销。在此,需要说明的是,上述获取单元601、检测单元602和确定单元603的具体工作过程参见上述步骤101-103的相关描述。在此不再赘述。可以看出,在本发明实施例中,电子设备首先根据医疗机构的唯一识别编码获取医疗机构中需要报销的多张住院结算单,然后检测多张住院结算单的相似度,并根据多张住院结算单的相似度获取住院结算单的风险值,最后当确定住院结算单的风险值大于预设风险阈值时,设置住院结算单为风险结算单,不通过对风险结算单的报销。在这个过程中,通过对同一家医疗机构的多张住院结算单相似度的计算,确定住院结算单之间的聚集程度,进而根据住院结算单相似度确定住院结算单的风险值,而当住院结算单的风险值大于预设阈值时,确定住院结算单为风险结算单并不予以报销。这个过程能够对住院结算单进行快速筛查,提升发现违规住院结算单的效率和准确率,减少对虚假住院结算单的通过率,对医保报销过程的规范化发挥积极作用。在可选情况下,所述多张住院结算单的相似度包括药品服务相似度,在检测所述多张住院结算单的相似度方面,所述检测单元602具体用于:获取所述多张住院结算单的药品信息和器材服务信息;将按照时间先后顺序对所述药品信息和所述器材服务信息进行特征提取,获取特征向量,并根据所述特征向量对所述住院结算单进行聚类,获得多个药品服务相似度类簇;确定所述多个药品服务相似度类簇中的每一个药品服务相似度类簇中包含的住院结算单之间的相似度;根据所述每一个所述药品服务相似度类簇中包含的住院结算单之间的相似度确定所述药品服务相似度类簇对应的药品服务相似度中位数,并将所述药品服务相似度中位数设置为所述药品服务相似度类簇中住院结算单的相似度。在可选情况下,所述多张住院结算单的相似度包括单据相似度,在检测所述多张住院结算单的相似度方面,所述检测单元602具体用于:获取所述多张住院结算单的医疗机构相关信息,包括科室或开单医生;获取所述多张住院结算单的病人相关信息,包括病人姓名、患病名称或费用报销信息;将所述医疗机构相关信息和所述病人相关信息作为所述住院结算单的特征向量对所述住院结算单进行聚类,获得多个单据相似度类簇;确定所述多个单据相似度类簇中的每一个单据相似度类簇中包含的住院结算单之间的相似度;根据所述每一个单据相似度类簇中包含的住院结算单之间的相似度确定所述单据相似度类簇对应的单据相似度中位数,并将所述单据相似度中位数设置为所述单据相似度类簇中住院结算单的相似度。在可选情况下,在根据所述多张住院结算单的相似度获取所述住院结算单的风险值方面,所述检测单元602具体用于:若所述药品服务相似度类簇和/或所述单据相似度类簇中的住院结算单数量大于第一预设阈值,则将所述药品服务相似度类簇和/或所述单据相似度类簇设置为目标类簇;根据所述住院结算单的相似度,确定所述目标类簇中的住院结算单的相似度权值;根据所述相似度权值结合预设规则获取所述住院结算单的风险值。在可选情况下,在根据所述结算单的相似度获得相似度权值之后,所述检测单元602还具体用于:将根据所述相似度权值获取的所述住院结算单的风险值设置为第一风险值;获取所述多张住院结算单的住院号和住院床位号,并将所述住院床位号相同的住院结算单按照住院号先后顺序进行排序;获取所述住院床位号相同的住院结算单的出入院时间信息,并根据所述出入院时间信息和所述住院号判定所述住院结算单是否满足时间合理性判断规则;若所述住院结算单不满足时间合理性判断规则,则为所述住院结算单设置合理性权值,并根据所述合理性权值确定所述住院结算单的第二风险值;对所述第一风险值和所述第二风险值求和,得到所述住院结算单的风险值。在可选情况下,在检测所述多张住院结算单的相似度之前,所述检测单元602还具体用于:从药品与服务数据库中获取所述住院结算单中药品与服务的适用症状;获取所述住院结算单中患者的诊断症状;将所述适用症状与所述诊断症状进行匹配并获得匹配率,确定所述匹配率大于预设匹配率阈值后,触发对所述住院结算单的检测。在可选情况下,所述风险检测装置还包括匹配单元604,所述匹配单元604具体用于:获取所述风险结算单的据面信息,所述据面信息包括所述药品信息、器材服务信息、医疗机构相关信息和病人相关信息;获取另一批需要报销的住院结算单的据面信息,并将所述另一批需要报销的住院结算单的据面信息与所述风险结算单的据面信息进行匹配,获得结算单相似度;当所述结算单相似度大于预设阈值时,确定所述另一批需要报销的住院结算单为风险结算单,不通过对所述风险结算单的报销。本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括移动终端。本发明实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括移动终端。在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、rom、ram、磁盘或光盘等。以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1