医保监管方法、设备、装置及计算机可读存储介质与流程

文档序号：17445581发布日期：2019-04-17 05:32阅读：222来源：国知局

本发明涉及医保技术领域，尤其涉及一种医保监管方法、设备、装置及计算机可读存储介质。

背景技术：

随着社会和经济的发展，国家的医保政策逐渐优化，越来越多医疗过程中所产生的费用可以得到报销。然而，部分被保险人为了获得更多的报销，存在伪造病情、拆分费用、过度治疗等违规行为，造成了医保经费的流失。目前，医保监管主要依赖于人工审核的方式，然而由于被保险人众多、就诊数据庞大且专业化强等因素，导致人工监管的难度很大，不仅需要大量的专业化的人力资源，而且监管的准确性也较低，还很容易产生监管漏洞。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

技术实现要素：

本发明的主要目的在于提供一种医保监管方法，旨在解决上述医保监管难度大、准确性低、容易产生监管漏洞的技术问题，以降低医保监管的难度，改善医保监管的准确性和严密性。

为实现上述目的，本发明提供一种医保监管方法，包括以下步骤：

获取被保险人的就诊数据；

根据预设模型，提取所述就诊数据中的预设字段，其中，所述就诊数据包括被保险人信息、病情记录和诊疗路径；

基于所述预设模型分析所述预设字段，并根据分析结果提取疑似异常案例。

优选地，在基于所述预设模型分析所述预设字段，并根据分析结果提取疑似异常案例的步骤之后，所述医保监管方法还包括以下步骤：

输出所述疑似异常案例；

接收与所述疑似异常案例对应的确认信息；

当所述确认信息确认所述疑似异常案例异常时，修正医保费用。

优选地，在接收与所述疑似异常案例对应的确认信息的步骤之后，还包括以下步骤：

当所述确认信息否认所述疑似异常案例异常时，根据所述疑似异常案例优化所述预设模型，其中，所述预设模型的优化基于机器学习实现。

优选地，根据预设模型，提取所述就诊数据中的预设字段的步骤包括：

清洗所述就诊数据；

分别获取清洗后的就诊数据中的规范文本和非规范文本；

根据预设模型，提取所述规范文本中的预设字段；

基于循环神经网络分析所述非规范文本，并根据所述预设模型和所述非规范文本的分析结果，提取所述非规范文本中的预设字段。

优选地，基于循环神经网络分析所述非规范文本，并根据所述预设模型和所述非规范文本的分析结果，提取所述非规范文本中的预设字段的步骤包括：

将所述非规范文本表示为向量序列；

根据向量序列的语义内容和语义距离，基于双向循环神经网络将所述向量序列编码为句子向量矩阵；

根据所述预设模型，采用注意力机制压缩所述句子向量矩阵为句子向量，并提取所述句子向量中的预设字段。

优选地，基于所述预设模型分析所述预设字段，并根据分析结果提取疑似异常案例的步骤包括：

计算各被保险人对应的案例中预设字段的距离度量；

计算被保险人的预设字段的距离度量相对其它被保险人的预设字段的距离度量的离群程度；

比对所述离群程度和预设离群程度；

当所述离群程度大于所述预设离群程度时，标记所述被保险人对应的案例为疑似异常案例。

优选地，所述预设字段包括病情症状、检查项目、药物方案、住院时长和住院间隔时长中的至少一种。

为实现上述目的，本发明进一步提出一种医保监管设备，所述医保监管设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现医保监管方法的步骤，所述医保监管方法包括以下步骤：获取被保险人的就诊数据，其中，所述就诊数据包括被保险人信息、病情记录和诊疗路径；根据预设模型，提取所述就诊数据中的预设字段；基于所述预设模型分析所述预设字段，并根据分析结果提取疑似异常案例。

为实现上述目的，本发明还提出一种医保监管装置，所述医保监管装置包括数据获取模块、字段提取模块和异常分析模块，其中，所述数据获取模块用以获取被保险人的就诊数据，其中，所述就诊数据包括被保险人信息、病情记录和诊疗路径；所述字段提取模块用以根据预设模型，提取所述就诊数据中的预设字段；所述异常分析模块用以基于所述预设模型分析所述预设字段，并根据分析结果提取疑似异常案例。

为实现上述目的，本发明进一步提出一种计算机可读存储介质，所述计算机可读存储介质上存储有医保监管程序，所述医保监管程序被处理器执行时实现医保监管方法的步骤，所述医保监管方法包括以下步骤：获取被保险人的就诊数据，其中，所述就诊数据包括被保险人信息、病情记录和诊疗路径；根据预设模型，提取所述就诊数据中的预设字段；基于所述预设模型分析所述预设字段，并根据分析结果提取疑似异常案例。

在本发明技术方案中，医保监管方法包括以下步骤：获取被保险人的就诊数据；根据预设模型，提取就诊数据中的预设字段，其中，所述就诊数据包括被保险人信息、病情记录和诊疗路径；基于预设模型分析预设字段，并根据分析结果提取疑似异常案例。通过在被保险人的就诊数据中提取出预设字段，从而剔除就诊数据中的冗余信息，保留关键信息，降低后续预设模型的分析难度。进一步的，基于预设模型对预设字段进行分析，通常，疑似异常案例相对正常案例具有较大的差别，根据分析结果，能够自动从众多案例中提取出疑似异常案例，以待进一步的处理。通过设置不同的预设模型，可以实现相应的监管要求，从而实现了医保的自动监管，而无需人工监管，降低了监管难度，大大节约了人力资源，同时提高了医保监管的准确性和严密性，有效避免了监管漏洞的产生。

附图说明

图1为本发明医保监管方法第一实施例的流程示意图；

图2为本发明医保监管方法第二实施例的流程示意图；

图3为本发明医保监管方法第三实施例的流程示意图；

图4为本发明医保监管方法第四实施例中步骤s200的细化流程示意图；

图5为本发明医保监管方法第五实施例中步骤s240的细化流程示意图；

图6为本发明医保监管方法第六实施例中步骤s300的细化流程示意图；

图7是本发明实施例方案涉及的硬件运行环境的医保监管设备的结构示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明实施例的主要解决方案是：基于预设模型对被保险人的就诊数据进行分析，提取出其中的疑似异常案例。

由于现有技术中通常采用人工方式实现医保监管，监管难度大，需要大量的专业化的人力资源，且人工监管的准确性低，还很容易产生监管漏洞。

本发明提供一种解决方案，基于预设模型对被保险人的就诊数据进行分析，提取出其中的疑似异常案例，以实现医保费用的自动监管，降低了监管难度，同时改善了监管的准确性和严密性。

本发明第一实施例提供一种医保监管方法，如图1所示，医保监管方法包括以下步骤：

步骤s100、获取被保险人的就诊数据，其中，就诊数据包括被保险人信息、病情记录和诊疗路径；

通常，医保费用是在就诊的过程中，当被保险人刷卡付费时直接结算的，以方便一般被保险人的就医，提高医院等医疗机构的流转效率。医保费用全部或部分覆盖被保险人的医疗费，为了对医保费用进行监管，有必要获取被保险人的就诊数据，进一步根据就诊数据确定是否存在违规报销的异常情况。其中，就诊数据具体包括被保险人信息、病情记录和诊疗路径等，病情记录有助于监测被保险人的病情发展，并根据其病情发展确定所采用的诊疗路径是否合理和有效，其中，诊疗路径具体可以包括被保险人的检查项目和药物方案等。被保险人的就诊数据可以在本次治疗(包括门诊治疗和住院治疗)结束后上传到用户(例如人社局等)的系统中，也可以在本次治疗的过程中定时上传到用户的系统中，以便及时发现可能存在违规报销或医保费用的流失因素，避免医保费用最终的流失。

步骤s200、根据预设模型，提取就诊数据中的预设字段；

就诊数据中通常包括被保险人的姓名、年龄等基本信息，被保险人所作各种检查对应的检查信息，以及医生所记录的病情症状、治疗方案等病历信息。其中，基本信息中包含的预设字段往往可以采用相对简单的方式直接从表单中提取出来，而检查信息和病历信息的形式变化较为多样，往往需要基于自然语言处理等方式提取出其中的预设字段，以待进一步的分析，后文中还将对预设字段的提取进一步详细阐述。预设字段是根据预设模型确定的，而预设模型是根据所要监管的具体项目所确定的。例如，当需要对是否存在分解住院、虚假住院等违规住院的项目进行监管时，则有必要提取出与被保险人的住院情况相关的预设字段。根据预设模型，提取就诊数据中的预设字段，以待进一步的分析。

步骤s300、基于预设模型分析预设字段，并根据分析结果提取疑似异常案例。

在提取出预设字段之后，基于预设模型对预设字段进行分析，并根据分析结果提取出疑似异常案例。通常，对预设字段的分析主要为偏差分析，偏差是指待分析案例中反常的、不合常规的案例，或者观测结果与预设模型所预测的结果之间一致性较差的案例。偏差分析的目标是寻找出与参照对象之间存在有意义的差别的异常案例，具体的偏差分析方法包括聚类法、序列异常法、最近邻法、多维数据分析法等，后文中还将详细阐述。根据预设字段，分析一特定被保险人相对其它被保险人的偏差，若该被保险人相对其它被保险人的偏差很大，则提取该案例为疑似异常案例，以待执行进一步的确认异常案例、重新计算医保费用等处理。

在本实施例中，医保监管方法包括以下步骤：获取被保险人的就诊数据，其中，就诊数据包括被保险人信息、病情记录和诊疗路径；根据预设模型，提取就诊数据中的预设字段；基于预设模型分析预设字段，并根据分析结果提取疑似异常案例。通过在被保险人的就诊数据中提取出预设字段，从而剔除就诊数据中的冗余信息，保留关键信息，降低后续预设模型的分析难度。进一步的，基于预设模型对预设字段进行分析，通常，疑似异常案例相对正常案例具有较大的偏差，根据分析结果，能够自动从众多案例中提取出疑似异常案例，以待进一步的处理。通过设置不同的预设模型，可以实现相应的监管要求，从而实现了医保的自动监管，而无需人工监管，降低了监管难度，大大节约了人力资源，同时提高了医保监管的准确性和严密性，有效避免了监管漏洞的产生。

基于上述第一实施例，如图2所示，在本发明的第二实施例中，在基于预设模型分析预设字段，并根据分析结果提取疑似异常案例的步骤之后，医保监管方法还包括以下步骤：

步骤s400、输出疑似异常案例；

步骤s500、接收与疑似异常案例对应的确认信息；

步骤s610、当确认信息确认疑似异常案例异常时，修正医保费用。

在本实施例中，当提取到疑似异常案例时，通过输出疑似异常案例，进一步确认该案例是否为异常案例，以提高监管的准确性。进一步的确认可以是自动确认或者人工确认，也可以是自动确认和人工确认的结合。例如，对于明显异常的疑似异常案例，可以通过设置对应于明显异常的预设字段的范围，由监管程序直接确认该案例为异常案例，并产生相应的确认信息。对于其它案例，则由相关人员进行人工确认，并给出相应的确认信息。当接收到与疑似异常案例对应的确认信息时，若确认信息确认该疑似异常案例异常，则修正医保费用。具体的，可以对相关责任单位或责任人出具扣费依据和扣费通知，并直接进行医保费用的扣除，以提高处理效率。为了加强监管，还可以定时出具一定时段内的异常案例的统计结果，包括异常案例对应的相关责任单位或责任人，以便进一步对违规严重的责任单位或责任人进行处理。

基于上述第二实施例，如图3所示，在本发明的第三实施例中，在接收与疑似异常案例对应的确认信息的步骤之后，还包括以下步骤：

步骤s620、当确认信息否认疑似异常案例异常时，根据疑似异常案例优化预设模型，其中，预设模型的优化基于机器学习实现。

对于相对复杂的疑似异常案例，通过自动或人工的进一步确认后，若该疑似异常案例并非异常，则表明预设模型存在一定的缺陷。根据该疑似异常案例，或者在积累到一定数目的初步判断错误的疑似异常案例之后，基于机器学习的方法优化预设模型，以改善医保监管的准确性和可靠性。当然，也可以基于预设模型，对医保方案进行适当的改革，以满足被保险人实际的保险需求。

基于上述各实施例，如图4所示，在本发明的第四实施例中，根据预设模型，提取就诊数据中的预设字段的步骤包括：

步骤s210、清洗就诊数据；

步骤s220、分别获取清洗后的就诊数据中的规范文本和非规范文本；

步骤s230、根据预设模型，提取规范文本中的预设字段；

步骤s240、基于循环神经网络分析非规范文本，并根据预设模型和非规范文本的分析结果，提取非规范文本中的预设字段。

其中，数据清洗是指对数据中可识别的错误进行检查并纠正，包括检查数据的一致性、剔除重复数据、纠正无效和错误数据等，以提高后续步骤的执行效率。对于清洗后的就诊数据，分别获取其中的规范文本和非规范文本，具体的，规范文本是指记录在例如表格、表单等具体条目中的被保险人的姓名、年龄等相对固定的信息，而非规范文本是指检查信息、病历信息等由医生等人员手写的相对复杂的信息。对于规范文本，可以根据预设模型所需，直接提取出其中的预设字段，而对于非规范文本，则往往基于自然语言处理的方法，基于循环神经网络分析，对其中的预设字段进行提取。

基于上述第四实施例，如图5所示，在本发明的第五实施例中，基于循环神经网络分析非规范文本，并根据预设模型和非规范文本的分析结果，提取非规范文本中的预设字段的步骤包括：

步骤s241、将非规范文本表示为向量序列；

步骤s242、根据向量序列的语义内容和语义距离，基于双向循环神经网络将向量序列编码为句子向量矩阵；

步骤s243、根据预设模型，采用注意力机制压缩句子向量矩阵为句子向量，并提取句子向量中的预设字段。

具体的，将待提取的非规范文本用一个向量序列表示，结合向量序列的语义内容和语义距离，基于双向循环神经网络模型将向量序列编码为句子向量矩阵。语义内容反映了文本本身的意思，而语义距离则反映了文本之间的关联性，可以通过相关函数或相关系数来表示。对于该句子向量矩阵，其中每一行可以理解为词向量，词向量对于句子的上下文敏感。进一步的，根据预设模型，采用注意力机制将句子向量矩阵压缩为句子向量，从中提取出所需的预设字段，从而将就诊数据匹配到相应的标准化的预设字段中，以待后续分析。其中，注意力机制使得神经网络具备专注于其输入(或特征)子集的能力：选择特定的输入。注意力可以应用于任何类型的输入而不管其形状如何。在计算能力有限情况下，注意力机制是解决信息超载问题的主要手段的一种资源分配方案，从而将计算资源分配给更重要的任务。

基于上述各实施例，如图6所示，在本发明的第六实施例中，基于预设模型分析预设字段，并根据分析结果提取疑似异常案例的步骤包括：

步骤s310、计算各被保险人对应的案例中预设字段的距离度量；

步骤s320、计算被保险人的预设字段的距离度量相对其它被保险人的预设字段的距离度量的离群程度；

步骤s330、比对离群程度和预设离群程度；

步骤s340、当离群程度大于预设离群程度时，标记被保险人对应的案例为疑似异常案例。

采用统计分布的方式对被保险人的就诊数据进行分析，其中，每个被保险人的就诊数据可以视为统计分布图中的一个点，根据点的分布位置确定是否存在疑似异常案例。

进一步的，对应于不同的监管需求，预设字段可以包括病情症状、检查项目、药物方案、住院时长和住院间隔时长中的至少一种。后文中将以几种具体的监管需求为例，分别采用不同的偏差分析或离群分析方法，进行详细阐述。

在一具体示例中，对可能存在的分解住院情况进行监管。其中，分解住院是指被保险人为了获得更多的报销费用，故意将一次住院拆分成多次住院，以分别报销，从而造成医保经费的流失。在监管分解住院这一异常情形时，可以根据分解住院的特点，对相应的预设字段进行偏差分析或离群分析。距离度量具体可以根据预设字段的绝对距离(曼哈顿距离)、欧式距离和马氏距离等得到。预设字段可以选取为被保险人两次连续住院之间的间隔天数的极差、四分位间距、八分位间距、均差、标准差等，从而初步筛选出疑似分解住院的案例。其中，数据变异指标的值越大，则表示数据变异越大，散布越广。间隔天数的阈值可设为10～15天，对于连续两次住院之间的间隔天数小于阈值的被保险人，可列为疑似异常案例。进一步的，通过分析疑似异常案例的就诊数据中的病情情况和包括检查项目、用药方案等的诊疗路径等，进一步确认疑似异常案例。如果同一参保人在很短的时间内因同一疾病住院，或者两次住院的诊疗路径疾病一致或属于延续关系，则判定其为疑似分解住院的案例。

在另一具体示例中，对可能存在的虚假住院情况进行监管。其中，虚假住院是指被保险人为了获得更多的报销费用，没有住院而制造住院记录，以骗取报销费用。例如，当存在内科住院15天以上或外科住院30天以上的情况，却没有任何治疗方案时，则对应于虚假住院。预设模型在识别疑似异常案例时所采用的异常检测算法为基于索引的算法，即给定一个数据集合，基于索引的算法采用多维索引结构来查找每个待分析案例在一定半径范围内的相邻案例。假设m为待分析案例的一定半径范围内的最大对象数目。如果待分析案例的第m+l个相邻案例被发现，则该待分析案例就不是疑似异常案例。考虑到基于索引的算法的复杂度，其具有良好的扩展性。

在又一具体示例中，对被保险人病情未达到入院治疗指征时即收入院治疗的情况进行监管。具体的，通过嵌套循环算法，即嵌套一循环算法和基于索引的算法进行分析。由于循环算法和嵌套算法有相同的复杂度，同时避免了索引结构的构建，以最小化数据输入输出的次数，把内存的缓冲空间分为两半，把数据集合分为若干个逻辑块。通过精心选择逻辑块装入每个缓冲区域的顺序，有效提高了输入输出的效率。

在再一具体示例中，对一个项目的收费进行拆分的情况进行监管。具体的，基于单元的算法对被保险人的就诊数据进行分析。通过将数据空间划分为边长等于d/(2*k1/2)的单元。每个单元有两个层围绕着它。第一层的厚度是一个单元，而第二层的厚度是(2*k1/2-1)。该算法逐个单元对异常点计数，而不是逐个对象进行计数。对于一给定的单元，累计三个计数：单元中对象的数目、单元和第一层中对象的数目以及单元和两个层次中的对象的数目。该算法将对数据集的每一个元素进行异常点数据的检测改为对每一个单元进行异常点数据的检测，从而提高了算法的效率，降低了算法复杂度。它是这样进行异常检测的：若单元和第一层中对象的数目大于一预设数目，单元中的所有对象都不是异常；若单元和两个层次中的对象的数目小于等于上述预设数目，单元中的所有对象都是异常；否则，单元中的某一些数据可能是异常。为了检测这些异常点，需要逐个对象加入处理。

如图7所示，图7是本发明实施例方案涉及的硬件运行环境的终端，即医保监管设备的结构示意图。

本发明实施例终端可以是服务器、pc，也可以是智能手机、平板电脑、电子书阅读器、mp3(movingpictureexpertsgroupaudiolayeriii，动态影像专家压缩标准音频层面3)播放器、mp4(movingpictureexpertsgroupaudiolayeriv，动态影像专家压缩标准音频层面3)播放器、便携计算机等具有显示功能的可移动式终端设备。

如图7所示，该终端可以包括：处理器1001，例如cpu，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器，也可以是稳定的存储器(non-volatilememory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，终端还可以包括摄像头、rf(radiofrequency，射频)电路，传感器、音频电路、wifi模块等等。其中，传感器比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示屏的亮度，接近传感器可在移动终端移动到耳边时，关闭显示屏和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；当然，移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

本领域技术人员可以理解，图7中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图7所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及医保监管程序。

在图7所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的医保监管程序，并执行以下操作：

获取被保险人的就诊数据，其中，就诊数据包括被保险人信息、病情记录和诊疗路径；

根据预设模型，提取就诊数据中的预设字段；

基于预设模型分析预设字段，并根据分析结果提取疑似异常案例。

进一步的，处理器1001可以用于调用存储器1005中存储的医保监管程序，在基于预设模型分析预设字段，并根据分析结果提取疑似异常案例的操作之后，还执行以下操作：

输出疑似异常案例；

接收与疑似异常案例对应的确认信息；

当确认信息确认疑似异常案例异常时，修正医保费用。

进一步的，处理器1001可以用于调用存储器1005中存储的医保监管程序，在接收与疑似异常案例对应的确认信息的操作之后，还执行以下操作：

当确认信息否认疑似异常案例异常时，根据疑似异常案例优化预设模型，其中，预设模型的优化基于机器学习实现。

进一步的，处理器1001可以用于调用存储器1005中存储的医保监管程序，根据预设模型，提取就诊数据中的预设字段的操作包括：

清洗就诊数据；

分别获取清洗后的就诊数据中的规范文本和非规范文本；

根据预设模型，提取规范文本中的预设字段；

基于循环神经网络分析非规范文本，并根据预设模型和非规范文本的分析结果，提取非规范文本中的预设字段。

进一步的，处理器1001可以用于调用存储器1005中存储的医保监管程序，基于循环神经网络分析非规范文本，并根据预设模型和非规范文本的分析结果，提取非规范文本中的预设字段的操作包括：

将非规范文本表示为向量序列；

根据向量序列的语义内容和语义距离，基于双向循环神经网络将向量序列编码为句子向量矩阵；

根据预设模型，采用注意力机制压缩句子向量矩阵为句子向量，并提取句子向量中的预设字段。

进一步的，处理器1001可以用于调用存储器1005中存储的医保监管程序，基于预设模型分析预设字段，并根据分析结果提取疑似异常案例的操作包括：

计算各被保险人对应的案例中预设字段的距离度量；

计算被保险人的预设字段的距离度量相对其它被保险人的预设字段的距离度量的离群程度；

比对离群程度和预设离群程度；

当离群程度大于预设离群程度时，标记被保险人对应的案例为疑似异常案例。

进一步的，处理器1001可以用于调用存储器1005中存储的医保监管程序，预设字段包括病情症状、检查项目、药物方案、住院时长和住院间隔时长中的至少一种。

此外，本发明实施例还提出一种医保监管装置，医保监管装置包括：

数据获取模块，用以获取被保险人的就诊数据，其中，就诊数据包括被保险人信息、病情记录和诊疗路径；

字段提取模块，用以根据预设模型，提取就诊数据中的预设字段；

异常分析模块，用以基于预设模型分析预设字段，并根据分析结果提取疑似异常案例。

进一步的，医保监管装置还包括：

案例输出模块，用以输出疑似异常案例；

信息接收模块，用以接收与疑似异常案例对应的确认信息；

费用修正模块，用以当确认信息确认疑似异常案例异常时，修正医保费用。

进一步的，医保监管装置还包括：

模型优化模块，用以当确认信息否认疑似异常案例异常时，根据疑似异常案例优化预设模型，其中，预设模型的优化基于机器学习实现。

进一步的，字段提取模块包括：

数据清洗单元，用以清洗就诊数据；

文本分类单元，用以分别获取清洗后的就诊数据中的规范文本和非规范文本；

字段提取单元，用以根据预设模型，提取规范文本中的预设字段；

字段提取单元还用以基于循环神经网络分析非规范文本，并根据预设模型和非规范文本的分析结果，提取非规范文本中的预设字段。

进一步的，字段提取单元包括：

向量序列子单元，用以将非规范文本表示为向量序列；

向量矩阵子单元，用以根据向量序列的语义内容和语义距离，基于双向循环神经网络将向量序列编码为句子向量矩阵；

向量压缩子单元，用以根据预设模型，采用注意力机制压缩句子向量矩阵为句子向量，并提取句子向量中的预设字段。

进一步的，异常分析模块包括：

距离度量单元，用以计算各被保险人对应的案例中预设字段的距离度量；

离群程度单元，用以计算被保险人的预设字段的距离度量相对其它被保险人的预设字段的距离度量的离群程度；

比对单元，用以比对离群程度和预设离群程度；

标记单元，用以当离群程度大于预设离群程度时，标记被保险人对应的案例为疑似异常案例。

进一步的，预设字段包括病情症状、检查项目、药物方案、住院时长和住院间隔时长中的至少一种。

此外，本发明实施例还提出一种计算机可读存储介质，计算机可读存储介质上存储有医保监管程序，医保监管程序被处理器执行时实现如下操作：

获取被保险人的就诊数据，其中，就诊数据包括被保险人信息、病情记录和诊疗路径；

根据预设模型，提取就诊数据中的预设字段；

基于预设模型分析预设字段，并根据分析结果提取疑似异常案例。

进一步的，医保监管程序被处理器执行时，在基于预设模型分析预设字段，并根据分析结果提取疑似异常案例的操作之后，还执行以下操作：

输出疑似异常案例；

接收与疑似异常案例对应的确认信息；

当确认信息确认疑似异常案例异常时，修正医保费用。

进一步的，医保监管程序被处理器执行时，在接收与疑似异常案例对应的确认信息的操作之后，还执行以下操作：

当确认信息否认疑似异常案例异常时，根据疑似异常案例优化预设模型，其中，预设模型的优化基于机器学习实现。

进一步的，医保监管程序被处理器执行时，根据预设模型，提取就诊数据中的预设字段的操作包括：

清洗就诊数据；

分别获取清洗后的就诊数据中的规范文本和非规范文本；

根据预设模型，提取规范文本中的预设字段；

基于循环神经网络分析非规范文本，并根据预设模型和非规范文本的分析结果，提取非规范文本中的预设字段。

进一步的，医保监管程序被处理器执行时，基于循环神经网络分析非规范文本，并根据预设模型和非规范文本的分析结果，提取非规范文本中的预设字段的操作包括：

将非规范文本表示为向量序列；

根据向量序列的语义内容和语义距离，基于双向循环神经网络将向量序列编码为句子向量矩阵；

根据预设模型，采用注意力机制压缩句子向量矩阵为句子向量，并提取句子向量中的预设字段。

进一步的，医保监管程序被处理器执行时，基于预设模型分析预设字段，并根据分析结果提取疑似异常案例的操作包括：

计算各被保险人对应的案例中预设字段的距离度量；

计算被保险人的预设字段的距离度量相对其它被保险人的预设字段的距离度量的离群程度；

比对离群程度和预设离群程度；

当离群程度大于预设离群程度时，标记被保险人对应的案例为疑似异常案例。

进一步的，医保监管程序被处理器执行时，预设字段包括病情症状、检查项目、药物方案、住院时长和住院间隔时长中的至少一种。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈明东;黄越;胥畅
技术所有人：平安医疗健康管理股份有限公司
我是此专利的发明人

上一篇：一种渗滤液处理剂及渗滤液处理方法与流程
上一篇：一种工业废水处理药剂及其制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。