住院数据异常检测方法、装置、设备及可读存储介质与流程

文档序号:17442426发布日期:2019-04-17 04:56阅读:331来源:国知局
住院数据异常检测方法、装置、设备及可读存储介质与流程

本发明涉及大数据技术领域,尤其涉及一种住院数据异常检测方法、装置、设备及可读存储介质。



背景技术:

医疗保险一般指基本医疗保险,是为了补偿劳动者因疾病风险造成的经济损失而建立的一项社会保险制度。通过用人单位与个人缴费,建立医疗保险基金,参保人员患病就诊发生医疗费用后,由医疗保险机构对其给予一定的经济补偿。现有技术中都是配备监管人员对参保人员的社保行为进行监控,以及对医保结算单据进行核算,以便管理门诊统筹基金的支出。但是,由于医保参保人员基数大,仅依靠监管人员对参保数据进行监管,力度不够,例如,在参保医疗数据中可能会出现短住院做检查的情况,对门诊统筹基金造成极大的浪费。



技术实现要素:

本发明的主要目的在于提供一种住院数据异常检测方法、装置、设备及可读存储介质,旨在解决现有技术中仅依靠监管人员对参保数据进行监管,力度不够,造成门诊统筹基金管理存在缺陷的技术问题。

为实现上述目的,本发明提供一种住院数据异常检测方法,所述住院数据异常检测方法包括:

获取参保人员的就诊住院数据;

基于预设模型判断所述就诊住院数据中是否存在短住院做检查的异常数据;

若是,则基于所述异常数据中的短住院做检查明细确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构发送扣费通知。

可选地,所述获取参保人员的就诊住院数据的步骤包括:

获取定点医疗机构上传的参保人员的就诊住院数据,其中,所述就诊住院数据至少包括住院的定点医疗机构、参保人信息、住院原因、入院天数、手术跟进、转院记录及住院检查费用。

可选地,所述基于预设模型判断所述就诊住院数据中是否存在短住院做检查的异常数据的步骤包括:

将所述就诊住院数据中的文本数据转化为标准数据;

基于聚类算法对所述标准数据进行聚类分析,并基于所述聚类分析的结果判断所述标准数据中是否存在短住院做检查的异常数据。

可选地,所述将所述就诊住院数据中的文本数据转化为标准数据的步骤包括:

对所述就诊住院数据进行清洗,以得到清洗后的规范数据;

基于所述规范数据构造文本特征,以得到对应的词向量;

基于双向循环神经网络rnn模型将所述词向量编码为向量矩阵,以便基于所述向量矩阵确定对应的标准数据。

可选地,所述将所述就诊住院数据中的文本数据转化为标准数据的步骤之后,还包括:

判断所述标准数据是否需要进行降维处理;

若是,则基于线性方法对所述标准数据进行降维处理,并执行所述基于聚类算法对所述标准数据进行聚类分析,并基于所述聚类分析的结果判断所述标准数据中是否存在短住院做检查的异常数据的步骤。

可选地,所述基于聚类算法对所述标准数据进行聚类分析,并基于所述聚类分析的结果判断所述标准数据中是否存在短住院做检查的异常数据的步骤包括:

基于聚类算法对所述标准数据进行聚类分析,将所述标准数据分为不同的类,其中,所述标准数据至少包括入院天数、住院检查费用;

判断所述不同的类中是否存在入院天数小于预设天数阈值的标准数据;

若是,则判断所述入院天数小于预设天数阈值的标准数据对应的住院检查费用是否大于预设费用阈值。

可选地,所述基于所述异常数据中的短住院做检查明细确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构发送扣费通知的步骤包括:

获取预设扣费规则,并基于所述预设扣费规则,和所述异常数据中的所述入院天数与预设天数阈值的天数差值,和所述住院检查费用与预设费用阈值的费用差值确定扣费依据;

基于所述扣费依据生成扣费通知,并将所述扣费通知发送至对应的定点医疗机构。

此外,为实现上述目的,本发明还提供一种住院数据异常检测装置,所述住院数据异常检测装置包括:

住院数据获取模块,用于获取参保人员的就诊住院数据;

异常数据判断模块,用于基于预设模型判断所述就诊住院数据中是否存在短住院做检查的异常数据;

扣费依据确定模块,用于若是,则基于所述异常数据中的短住院做检查明细确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构发送扣费通知。

此外,为实现上述目的,本发明还提供一种住院数据异常检测设备,所述住院数据异常检测设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的住院数据异常检测程序,所述住院数据异常检测程序被所述处理器执行时实现如上所述的住院数据异常检测方法的步骤。

此外,为实现上述目的,本发明还提供一种可读存储介质,所述可读存储介质上存储有住院数据异常检测程序,所述住院数据异常检测程序被处理器执行时实现如上所述的住院数据异常检测方法的步骤。

本发明提出的一种住院数据异常检测方法,首先获取参保人员的就诊住院数据,并基于预设模型判断就诊住院数据中是否存在短住院做检查的异常数据,如果存在,则基于异常数据中的短住院做检查明细确定扣费依据,以便基于扣费依据向对应的定点医疗机构发送扣费通知。通过本发明提出的住院数据异常检测方法,对参保人员的住院检查情况进行检测,判断其中是否存在短住院做检查的异常数据,并对出现短住院做检查异常数据的定点医疗机构发送扣费通知,以防止有不合理的门诊费用支出,有效管理门诊统筹基金的支出,避免对门诊统筹基金造成浪费。

附图说明

图1为本发明实施例方案中涉及的住院数据异常检测设备的硬件结构示意图;

图2为本发明住院数据异常检测方法第一实施例的流程示意图;

图3为图2中的步骤s20的细化流程示意图;

图4为本发明住院数据异常检测方法第二实施例的流程示意图;

图5为本发明住院数据异常检测装置第一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例的主要解决方案是:获取参保人员的就诊住院数据;基于预设模型判断所述就诊住院数据中是否存在短住院做检查的异常数据;若是,则基于所述异常数据中的短住院做检查明细确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构发送扣费通知。通过本发明实施例的技术方案,解决了现有技术中仅依靠监管人员对参保数据进行监管,力度不够,造成门诊统筹基金管理存在缺陷的技术问题。

如图1所示,图1为本发明实施例方案中涉及的住院数据异常检测设备的硬件结构示意图。

本发明实施例涉及的住院数据异常检测方法主要应用于住院数据异常检测设备,该住院数据异常检测设备可以是pc、便携计算机、移动终端等具有显示和处理功能的设备。

如图1所示,该住院数据异常检测设备可以包括:处理器1001,例如cpu,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地,住院数据异常检测设备还可以包括摄像头、rf(radiofrequency,射频)电路,传感器、音频电路、wi-fi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。当然,住院数据异常检测设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。

本领域技术人员可以理解,图1中示出的住院数据异常检测设备结构并不构成对住院数据异常检测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及住院数据异常检测程序。在图1中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001、存储器1005可以设置在住院数据异常检测装置中,所述住院数据异常检测装置通过处理器1001调用存储器1005中存储的住院数据异常检测程序,并执行本发明实施例提供的住院数据异常检测方法。

本实施例提供的方案,首先获取参保人员的就诊住院数据,并基于预设模型判断就诊住院数据中是否存在短住院做检查的异常数据,如果存在,则基于异常数据中的短住院做检查明细确定扣费依据,以便基于扣费依据向对应的定点医疗机构发送扣费通知。通过本发明提出的住院数据异常检测方法,对参保人员的住院检查情况进行检测,判断其中是否存在短住院做检查的异常数据,并对出现短住院做检查异常数据的定点医疗机构出具扣费通知,以防止有不合理的门诊费用支出,有效管理门诊统筹基金的支出,避免对门诊统筹基金造成浪费。

基于上述硬件结构,提出本发明住院数据异常检测方法实施例。

参照图2,图2为本发明住院数据异常检测方法第一实施例的流程示意图,在该实施例中,所述方法包括:

步骤s10,获取参保人员的就诊住院数据;

现有技术中,参保人员在定点医疗机构,例如医院、药店等地方使用医保卡进行就诊费用结算时,定点医疗机构的收费终端设备即可将对应的就诊数据上传至人社核心系统,以便人社核心系统对参保人员相应的医疗数据进行核对,以此管理门诊统筹基金的支出。在本实施例中,是通过对参保人员的住院检查情况进行检测,因此,本实施例中的就诊数据具体指的是就诊住院数据。

具体地,就诊住院数据中至少包括住院的定点医疗机构、参保人信息、入院天数、手术跟进、转院记录及住院检查费用等,其中,参保人信息具体可以包括参保人的姓名、年龄以及参保人医保卡信息等。

步骤s20,基于预设模型判断所述就诊住院数据中是否存在短住院做检查的异常数据;若是,则执行步骤s30;

在本实施例中,是通过将就诊住院数据放入预设模型中运行,来判断参保人员的就诊住院数据中是否存在短住院做检查的异常数据,具体地,本实施例中所使用的预设模型主要是偏差检测模型,偏差具体指分类样本中的反常实例、不满足规则的特例,或者观测结果与模型预测值不一致且观测结果随时间变化而变化等,偏差检测的基本目标是寻找观测结果与参照值之间有意义的差别。

具体地,如图3所示,所述步骤s20具体包括:

步骤s21,将所述就诊住院数据中的文本数据转化为标准数据;

对于上传至人社核心系统的就诊住院数据中,存在一些不必要的信息,不利于模型对数据的处理,因此,首先通过nlp自然语言处理流程对原始的就诊住院数据进行处理,将其转化为标准数据。

具体地,将就诊住院数据输入偏差检测模型中,并对就诊住院数据进行清洗。就诊住院数据中存在一些不必要的数据或者不规范的数据,数据清洗主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,并筛选掉与模型检测主题无关的数据,以及处理缺失值、异常值等,例如,就诊住院数据中包含的与住院检查无关的信息,如辅助用药信息等。通过数据清洗,得到原始的就诊住院数据对应的规范数据。

进一步地,基于得到的规范数据构造文本特征,以得到对应的词向量。首先,利用rnn(recurrentneuralnetwork,循环神经网络)模型对清洗后的就诊住院数据进行分词处理及去除无用词。对于中文文本数据,比如一个包含中文的句子,词与词之间是连续的,而数据分析的最小单位粒度是词语,因此,需要对就诊住院数据进行分词处理。进一步地,对分词处理后的数据进行无用词的去除,无用词是指对文本特征没有任何贡献作用的词语,比如:啊、的、是的、你、我,当然,还有一些标点符号,这些无用词并不能反应出文本的意思,因此,需要进行无用词的去除处理。经过分词处理及去除无用词后,即可得到就诊住院数据对应的文本数据,以便根据该文本数据进行文本特征的构造,以进一步得到其对应的词向量。

基于处理后的就诊住院数据对应的文本数据构造文本特征,将文本用一个向量的序列表示,将词语用词向量表示,通过正向计算及逆向计算拼接得到完整的词向量,以便进一步确定词向量的序列,然后使用双向rnn模型将词向量编码为一个句子向量矩阵,以便从该句子向量矩阵中得到最终的标准数据。在本实施例中,标准数据中可以包括入院天数、住院原因、住院检查费用、跟进手术、转院记录等。例如,某一参保人员因肺炎入院诊疗,则其就诊住院的标准数据中可以包括有入院天数若干天,住院原因肺炎,住院检查费用若干元。

步骤s22,基于聚类算法对所述标准数据进行聚类分析,并基于所述聚类分析的结果判断所述标准数据中是否存在短住院做检查的异常数据。

根据聚类算法对上述获得的标准进行聚类分析,具体地,可以利用k-means算法实现数据的聚类,以便使所获得的聚类满足:同一聚类中的对象相似度较高,而不同聚类中的对象相似度较小,并将聚类结果可视化,以便从中判断是否存在短住院做检查的异常数据。

步骤s30,基于所述异常数据中的短住院做检查明细确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构发送扣费通知。

在本实施例中,若检测到就诊住院数据中存在短住院做检查的异常数据,则获取预设扣费规则,并根据该预设扣费规则以及异常数据确定扣费依据,可以理解的是,对于不同的异常数据可以对应有不同的预设扣费规则。

进一步地,依据扣费依据生成扣费通知,该扣费通知中可以包括进行扣费处罚的定点医疗机构、扣费原因、扣费措施及时间等,并将该扣费通知发送至对应的定点医疗机构,以便对其进行处罚。

在本实施例中,首先获取参保人员的就诊住院数据,并基于预设模型判断就诊住院数据中是否存在短住院做检查的异常数据,如果存在,则基于异常数据中的短住院做检查明细确定扣费依据,以便基于扣费依据向对应的定点医疗机构发送扣费通知。通过本发明提出的住院数据异常检测方法,对参保人员的住院检查情况进行检测,判断其中是否存在短住院做检查的异常数据,并对出现短住院做检查异常数据的定点医疗机构出具扣费通知,以防止有不合理的门诊费用支出,有效管理门诊统筹基金的支出,避免对门诊统筹基金造成浪费。

进一步的,参照图4,基于上述实施例,提出本发明住院数据异常检测方法第二实施例,在本实施例中,所述步骤s21之后还包括:

步骤s23,判断所述标准数据是否需要进行降维处理;若是,则执行步骤s24;

对标准数据进行降维处理是为了进一步地进行有效信息的提取综合及无用信息的摈弃,首先,对标准数据是否需要进行降维处理进行判断,具体地,将规范数据对应的文本特征转换为向量矩阵形式表示的数值特征时,该向量矩阵所对应的维度即为就诊住院的标准数据所对应的维度,若该维度过高,则需要进行降维处理。

步骤s24,基于线性方法对所述标准数据进行降维处理,并执行所述步骤s22。

在本实施例中,主要是利用线性方法对多维数据进行降维处理,现有技术中,常用的多维度数据处理的降维方法主要包括以下几种:缺失值比率、低方差滤波、高相关滤波、随机森林/组合树、主成分分析、反向特征消除和前向特征构造。通过对多维数据进行降维处理,即可实现对就诊住院的标准数据的降维。

进一步地,根据聚类算法对降维处理后的标准数据进行聚类分析,具体地,可以利用k-means算法实现数据的聚类,方法如下:

k-means算法接受输入量k,然后将n个数据对象划分为k个聚类,以便使得所获得的聚类满足:同一聚类中的对象相似度较高,而不同聚类中的对象相似度较小。在本实施例中,输入量k即是指就诊住院的标准数据中的入院天数、住院检查费用、跟进手术、转院记录等,n个数据对象即是指待分类的所有标准数据。具体过程如下:首先从n个数据对象中任意选择k个对象作为初始聚类中心,而对于所剩下的其它对象,则根据它们与这些初始聚类中心的相似度,分别将它们分配给与其最相似的聚类中心所代表的聚类,然后再计算每个所获新聚类的聚类中心,即该聚类中所有对象的均值,不断重复这一过程直到标准测度函数开始收敛为止,一般都采用均方差作为标准测度函数。k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。

通过上述聚类算法,将标准数据基于入院天数、住院检查费用、跟进手术、转院记录等,分为若干个不同的类。并将该聚类结果可视化,以便从中判断就诊住院数据中是否存在短住院做检查的异常数据。

将标准数据分为不同的类,并判断不同的类中是否存在有包含异常数据的类。具体地,包含异常数据的类,是指某一聚类中入院天数小于预设天数阈值,但是住院检查费用却大于常规的预设费用阈值的数据。例如上述所说的因肺炎入院诊疗的参保人员,若其就诊住院的标准数据中入院天数小于预设天数阈值3天但是住院检查费用却大于预设费用阈值,即可判定该参保人员的当次就诊住院数据中存在短住院做检查的异常情况。进一步地,如果出现入院天数小于预设天数阈值,且住院检查费用小于预设费用阈值的情况,还可以通过判断该参保人员入院后预设时间段内是否存在跟进手术或转院记录,来判定该数据是否存在异常,若该参保人员入院后预设时间段内不存在跟进手术或转院记录,则同样判定该就诊住院数据中存在短住院做检查的异常情况。

进一步地,如果存在短住院做检查的异常数据,则基于该异常数据中的短住院做检查明细确定扣费依据,可以理解的是,对于入院天数小于预设天数阈值且后续预设时间段内无跟进手术或转院记录、住院检查费用大于常规的住院检查费用的情况,可以对应有不同的扣费细则,并将违规的短住院做检查明细确定到每一个违规人员,以便向违规医疗机构出具扣费通知。

在本实施例中,对标准数据是否需要进行降维处理进行判断,并在确定需要降维处理后,利用线性方法对标准数据进行降维处理,以便基于聚类算法对降维后的标准数据进行聚类分析,从中确定出包含短住院做检查的异常数据,并发送对应的扣费通知至具体的定点医疗机构,对门诊统筹基金的支付进行管理,防止不合理的短住院做检查支出。

此外,本发明实施例还提供一种住院数据异常检测装置。

参照图5,图5为本发明住院数据异常检测装置第一实施例的功能模块示意图。

本实施例中,所述住院数据异常检测装置包括:

住院数据获取模块10,用于获取参保人员的就诊住院数据;

异常数据判断模块20,用于基于预设模型判断所述就诊住院数据中是否存在短住院做检查的异常数据;

扣费依据确定模块30,用于若是,则基于所述异常数据中的短住院做检查明细确定扣费依据,以便基于所述扣费依据向对应的定点医疗机构发送扣费通知。

进一步地,所述住院数据获取模块10具体包括:

数据获取单元,用于获取定点医疗机构上传的参保人员的就诊住院数据,其中,所述就诊住院数据至少包括住院的定点医疗机构、参保人信息、住院原因、入院天数、手术跟进、转院记录及住院检查费用。

进一步地,所述异常数据判断模块20具体包括:

数据转化单元,用于将所述就诊住院数据中的文本数据转化为标准数据;

聚类分析单元,用于基于聚类算法对所述标准数据进行聚类分析,并基于所述聚类分析的结果判断所述标准数据中是否存在短住院做检查的异常数据。

进一步地,所述数据转化单元具体包括:

数据清洗子单元,用于对所述就诊住院数据进行清洗,以得到清洗后的规范数据;

文本特征构造子单元,用于基于所述规范数据构造文本特征,以得到对应的词向量;

标准数据确定子单元,用于基于双向循环神经网络rnn模型将所述词向量编码为向量矩阵,以便基于所述向量矩阵确定对应的标准数据。

进一步地,所述住院数据异常检测装置还包括:

降维判断单元,用于判断所述标准数据是否需要进行降维处理;

降维处理单元,用于若是,则基于线性方法对所述标准数据进行降维处理,并执行所述基于聚类算法对所述标准数据进行聚类分析,并基于所述聚类分析的结果判断所述标准数据中是否存在短住院做检查的异常数据的步骤。

进一步地,所述聚类分析单元具体包括:

聚类分析子单元,用于基于聚类算法对所述标准数据进行聚类分析,将所述标准数据分为不同的类,其中,所述标准数据至少包括入院天数、住院检查费用;

异常时间判断子单元,用于判断所述不同的类中是否存在入院天数小于预设天数阈值的标准数据;

异常费用判断子单元,用于若是,则判断所述入院天数小于预设天数阈值的标准数据对应的住院检查费用是否大于预设费用阈值。

进一步地,所述扣费依据确定模块30具体包括:

扣费单元,用于获取预设扣费规则,并基于所述预设扣费规则,和所述异常数据中的所述入院天数与预设天数阈值的天数差值,和所述住院检查费用与预设费用阈值的费用差值确定扣费依据;

扣费通知单元,用于基于所述扣费依据生成扣费通知,并将所述扣费通知发送至对应的定点医疗机构。

其中,上述住院数据异常检测装置中各个模块与上述住院数据异常检测方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。

此外,本发明实施例还提出一种可读存储介质,所述可读存储介质上存储有住院数据异常检测程序,所述住院数据异常检测程序被处理器执行时实现如上所述的住院数据异常检测方法的步骤。

其中,住院数据异常检测程序被执行时所实现的方法可参照本发明住院数据异常检测方法的各个实施例,此处不再赘述。

本实施例提供的方案,首先获取参保人员的就诊住院数据,并基于预设模型判断就诊住院数据中是否存在短住院做检查的异常数据,如果存在,则基于异常数据中的短住院做检查明细确定扣费依据,以便基于扣费依据向对应的定点医疗机构发送扣费通知。通过本发明提出的住院数据异常检测方法,对参保人员的住院检查情况进行检测,判断其中是否存在短住院做检查的异常数据,并对出现短住院做检查异常数据的定点医疗机构出具扣费通知,以防止有不合理的门诊费用支出,有效管理门诊统筹基金的支出,避免对门诊统筹基金造成浪费。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1