医保数据处理方法、装置、计算机设备和存储介质与流程

文档序号：21032101发布日期：2020-06-09 20:14阅读：545来源：国知局

本申请涉及数据清洗技术领域，特别是涉及一种医保数据处理方法、装置、计算机设备和存储介质。

背景技术：

通过医疗保险，参保人员可以以低廉的价格购买各种医保药品。出于利益，医药贩子会与参保人合作，提前收集一批参保人的医保卡，利用医保卡批次低价购药，这种行为损害了其他参保人的医保利益，需要及时进行标识，再将被标识的异常数据从大量的医保结算数据中排除。但是，当医保结算数据对应的参保人数量以万为单位时，对应的医保结算数据量成几何增加，有时可以达到数g，超出了计算机系统的运行内存。因而，如何在保证计算机运行的情况下，对大批量医保结算数据顺利进行排查，降低系统崩溃的概率是医保数据处理的难点。

技术实现要素：

基于此，有必要针对上述技术问题，提供一种能够对大批量医保结算数据顺利进行排查，降低系统崩溃的概率的医保数据处理方法、装置、计算机设备和存储介质。

一种医保数据处理方法，所述方法包括：

接收医保终端发送的预设周期内的医保结算数据，所述医保结算数据携带有参保标识和购药信息；

根据所述医保结算数据的数据内存以及实时获取的运算内存确定运算数据量；

根据所述参保标识和所述购药信息生成数据透视表，并根据所述运算数据量按照预设顺序从所述数据透视表中提取所述参保标识的透视参数，构建与所述参保标识对应的透视矩阵；

采用矩阵乘法对所述透视矩阵进行处理得到共现矩阵，所述共现矩阵用于表示预设顺序的参保标识与所有参保标识的相遇次数；

根据所述相遇次数对所述参保标识进行筛选得到违规集合，所述违规集合的所述参保标识对应的相遇次数大于预设阈值，并将所述违规集合中的参保标识发送给所述医保终端。

在其中一个实施例中，所述根据所述参保标识和所述购药信息生成数据透视表，包括：

对所述医保结算数据进行解析抽取，得到结算明细表；

排查所述结算明细表中的异常值，并对应删除所述结算明细表中的异常值；

确定所述结算明细表中与缺失值所在变量最相关的医保结算数据参数，并将所述医保结算数据参数代入缺失值所在变量，得到清洗后的医保结算数据；

采用预设统计规则对清洗后的所述医保结算数据进行统计，得到数据透视表。

在其中一个实施例中，所述根据所述医保结算数据的数据内存以及实时获取的运算内存确定运算数据量，包括：

实时获取运算内存，并根据所述运算内存获取与矩阵计算相关的矩阵运算速度；

获取与所述数据内存对应的运算时间；

根据所述矩阵运算速度和所述运算时间确定运算数据量。

在其中一个实施例中，所述采用矩阵乘法对所述透视矩阵进行处理得到共现矩阵，包括：

从所述数据透视表中提取与所述参保标识对应的透视参数，并根据所述透视参数构建参考矩阵；

计算所述透视矩阵对应的转置矩阵；

根据所述转置矩阵和所述参考矩阵得到共现矩阵。

在其中一个实施例中，所述根据所述相遇次数对所述参保标识进行筛选得到违规集合之后，还包括：

从所述数据透视表中删除所述违规集合中所述参保标识对应的透视参数；

根据运算数据量按照预设顺序从删除后的数据透视表提取所述参保标识的所述透视参数构建新的透视矩阵。

一种医保数据处理装置，所述装置包括：

数据接收模块，用于接收医保终端发送的预设周期内的医保结算数据，所述医保结算数据携带有参保标识和购药信息；

数据量计算模块，用于根据所述医保结算数据的数据内存以及实时获取的运算内存确定运算数据量；

透视矩阵生成模块，用于根据所述参保标识和所述购药信息生成数据透视表，并根据所述运算数据量按照预设顺序从所述数据透视表中提取所述参保标识的透视参数，构建与所述参保标识对应的透视矩阵；

共现矩阵生成模块，用于对所述透视矩阵进行处理得到共现矩阵，所述共现矩阵用于表示预设顺序的参保标识与所有参保标识的相遇次数；

违规筛选模块，用于根据所述相遇次数对所述参保标识进行筛选得到违规集合，所述违规集合的所述参保标识对应的相遇次数大于预设阈值，并将所述违规集合中的参保标识发送给所述医保终端。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述方法的步骤。

上述医保数据处理方法、装置、计算机设备和存储介质，通过运算内存以及医保结算数据的数据内存确定运算数据量，根据参保标识和购药信息生成数据透视表，并采用共现矩阵对数据透视表中的参保标识和购药信息进行分析，通过共现矩阵识别出违规的参保标识，实现对医保结算数据的快速排查，迅速识别违规数据，提高了排查的准确率；而且通过共现矩阵还降低了数据处理的复杂度，提升了计算机的处理效率，缩短了数据分析时间；通过运算数据量防止了内存数据溢出，保证了排查的顺利执行。

附图说明

图1为一个实施例中医保数据处理方法的应用场景图；

图2为一个实施例中医保数据处理方法的流程示意图；

图3为一个实施例中医保结算数据清洗步骤的流程示意图；

图4为另一个实施例中共现矩阵生成的流程示意图；

图5为一个实施例中医保数据处理装置的结构框图；

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的医保数据处理方法，可以应用于如图1所示的应用环境中。其中，医保终端102通过网络与服务器104进行通信。服务器104接收医保终端102发送的预设周期内的医保结算数据，医保结算数据携带有参保标识和购药信息。服务器104获取运算内存以及医保结算数据的数据内存，根据数据内存和运算内存确定运算数据量。服务器104根据参保标识和购药信息生成数据透视表，并根据运算数据量按照预设顺序从数据透视表中提取参保标识的透视参数，构建与参保标识对应的透视矩阵。服务器对透视矩阵进行处理得到共现矩阵，共现矩阵用于表示预设顺序的参保标识与所有参保标识的相遇次数。服务器104根据相遇次数对参保标识进行筛选得到违规集合，违规集合的参保标识对应的相遇次数大于预设阈值，并将违规集合中的参保标识发送给医保终端102。其中，医保终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式智能设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种医保数据处理方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤：

步骤202，接收医保终端发送的预设周期内的医保结算数据，医保结算数据携带有参保标识和购药信息。

医保结算数据是与参保标识对应的参保人的医保信息，可以携带有参保人的参保标识和购药信息等。例如，医保结算数据可以包含个人编号、就诊时间、就诊类别、药品名称、药品单价和药品总价等。预设周期是预先设定的验证周期，可以是1个月或1年等。服务器接收医保终端发送的预设周期内的医保结算数据。

步骤204，根据医保结算数据的数据内存以及实时获取的运算内存确定运算数据量。

运算内存用于表征服务器可用于运行处理运算的内存。服务器可以周期性不间断获取服务器的运算内存。数据内存用于表征服务器存储医保结算数据的内存。服务器根据医保结算数据的数据内存以及实时获取的运算内存确定运算数据量。服务器可以根据变动的运算内存实时调整运算数据量，从而在维持系统正常运行的同时，提高服务器cpu内核处理速度。服务器根据运算内存和数据内存的商值确定运算数据量。服务器可以根据数据内存确定总运算数据，而后根据总运算数据和运算内存的商值确定运算数据量。总运算数据可以是数据内存的n次方，其中，n为大于1的实数。服务器也可以直接根据运算内存和数据内存之间的商值确定运算数据量。例如，当运算内存为2g，数据内存为5g时，数据内存和运算内存的商值为2.5，服务器对商值取整，因而运算数据量为5/3g。

步骤206，根据参保标识和购药信息生成数据透视表，并根据运算数据量按照预设顺序从数据透视表中依次提取参保标识的透视参数，构建与参保标识对应的透视矩阵。

预设顺序可以是根据数据透视表的序号依次获取数据透视表中与运算数据量对应的透视参数。数据透视表是根据参保标识和购药信息生成的，用于表征参保人购药行为的数据表格。数据透视表可以以参保标识为纵轴，购药信息中的购药日期和购药地址为横轴，表格对应位置处填入参保人在当天是否购药作为透视参数，如果病人在当天开过药，则透视参数为1，否则透视参数为0；数据透视表也可以以购药信息中的购药日期和购药地址为纵轴，参保标识为横轴，表格对应位置处填入参保人在当天购药的次数。服务器根据参保标识和购药信息生成数据透视表。

服务器可以根据运算数据量按照预设顺序从数据透视表中依次提取参保标识的透视参数，构建与参保标识对应的透视矩阵；也可以先构建与所有参保标识对应的总透视矩阵，而后根据运算数据量按照预设顺序从总透视矩阵中依次提取与参保标识对应的透视矩阵。透视矩阵中以购药信息中的购药日期和购药地址为横轴，参保标识为纵轴。例如，当数据透视表中存在的参保标识为5万人，运算数据量为每次统计1000人的参保标识时，服务器可以根据数据透视表的序号依次获取数据透视表中与1000人的参保标识对应的透视参数。服务器根据获取的透视参数构成m×1000阶的透视矩阵，m与归纳的购药日期和购药地址对应，即、m为与参保标识对应的记录数量。

步骤208，采用矩阵乘法对透视矩阵进行处理得到共现矩阵，共现矩阵用于表示预设顺序的参保标识与所有参保标识的相遇次数。

共现矩阵用于表示预设顺序的参保标识与所有参保标识的相遇次数。服务器对透视矩阵进行处理得到共现矩阵。服务器可以对多个透视矩阵进行并发处理，也可以进行并行处理。服务器可以计算透视矩阵的正交矩阵，该正交矩阵是透视矩阵和透视矩阵的转置矩阵的乘积，该正交矩阵即为共现矩阵。服务器可以从数据透视表中提取与参保标识对应的透视参数，并根据透视参数构建参考矩阵；服务器将透视矩阵和参考矩阵进行比对得到共现矩阵。参考矩阵是根据数据透视表中的所有参保标识及其对应的透视参数生成数据矩阵。参考矩阵的布局以购药信息中的购药日期和购药地址为横轴，参保标识为纵轴，表格对应位置处填入参保人对应的透视参数。当数据透视表中存在的参保标识为5万人时，参考矩阵为m×50000阶的矩阵。服务器可以对参考矩阵和透视矩阵进行比对，确定参保标识之间的相遇次数，并得到共现矩阵。

步骤210，根据相遇次数对参保标识进行筛选得到违规集合，违规集合的参保标识对应的相遇次数大于预设阈值，并将违规集合中的参保标识发送给医保终端。

预设阈值用于表征违规参保人同时出现的最低次数。服务器根据相遇次数对参保标识进行筛选得到违规集合，违规集合的参保标识对应的相遇次数大于预设阈值，并将违规集合中的参保标识发送给医保终端。服务器可以将将医保结算数据均分为若干组，同时计算每组参保人和所有参保人的相遇次数，而后得到违规参保人的子集合；服务器也可以将医保结算数据均分为若干组，计算第一组参保人与所有参保人的相遇次数，得到第一组违规参保人的子集合，将第一组子集合中的参保人从医保结算数据中删除，再计算第二组参保人与删除第一组子集合的医保结算数据的相遇次数，得到第二组违规参保人的子集合，服务器循环以上步骤直至医保结算数据中的所有参保人的相遇次数均被求出，服务器将所有违规集合发送给医保终端。

上述医保数据处理方法中，通过运算内存以及医保结算数据的数据内存确定运算数据量，根据参保标识和购药信息生成数据透视表，并采用共现矩阵对数据透视表中的参保标识和购药信息进行分析，通过共现矩阵识别出违规的参保标识，实现对医保结算数据的快速排查，迅速识别违规数据，提高了排查的准确率；而且通过共现矩阵还降低了数据处理的复杂度，直观地表示了参保人标识对应的参保人的违规次数，提升了计算机的处理效率，缩短了数据分析时间；通过运算数据量防止了内存数据溢出，保证了排查的顺利执行。

在一个实施例中，如图3所示，根据参保标识和购药信息生成数据透视表，包括以下步骤：

步骤302，对医保结算数据进行解析抽取，得到结算明细表。

服务器对医保结算数据进行解析抽取，并根据解析后的数据生成结算明细表。服务器可以获取预设的解析词，根据解析词提取对应的解析数据。解析词可以是医保结算数据中的某一变量。例如，解析词可以是参保标识、购药日期、购药地址、购药费用等。服务器根据解析词提取对应的解析数据，并根据参保标识等对应生成结算明细表。结算明细表可以包括参保人进行医保结算的详细数据，包括参保标识和每次就诊记录中的结算内容，例如结算明细表可以包括参保人标识、结算时间、结算地址、结算药品名称、药品数量、药品金额、金额总值等。

步骤304，排查结算明细表中的异常值，并对应删除结算明细表中的异常值。

服务器排查结算明细表中的异常值，并对应删除结算明细表中的异常值。当解析词对应的数据为数值时，服务器可以根据标准差的3σ原则排查结算明细表中的异常值。例如，当解析词是购药费用时，服务器可以计算结算费用的均值μ和标准差σ，而后判定数值分布在(μ-σ,μ+σ)中的结算费用为正常值，判定数值未分布在(μ-σ,μ+σ)中的结算费用为异常值。服务器也可以判定数值分布在(μ-2σ,μ+2σ)中的结算费用为正常值，判定数值未分布在(μ-2σ,μ+2σ)中的结算费用为异常值。当解析词对应的数据为汉字或字符时，服务器可以对数据进行分类得到不同分组，并计算各分组在数据中的含量，将含量小于预设含量的分组设定为异常值。

步骤306，确定结算明细表中与缺失值所在变量最相关的医保结算数据参数，并将医保结算数据参数代入缺失值所在变量，得到清洗后的医保结算数据。

服务器确定结算明细表中与缺失值所在变量最相关的医保结算数据参数，并将医保结算数据参数代入缺失值所在变量，得到清洗后的医保结算数据。例如，缺失值所在变量为结算费用时，服务器可以先确定与缺失值对应的参保标识最相关的其他变量，然后根据其他变量的医保结算数据参数代入缺失值所在变量，得到清洗后的医保结算数据。服务器可以用相关系数矩阵来确定哪个变量(如变量y)与缺失值所在变量(如变量x)最相关，然后把所有变量按y的取值大小进行排序。那么变量x的缺失值就可以用排在缺失值前的那个参保标识的参数来代替了。服务器也可以采用最近距离决定填补法、回归填补法、多重填补方法、k-最近邻法、有序最近邻法、基于贝叶斯的方法等对缺失值进行补充。

步骤308，采用预设统计规则对清洗后的医保结算数据进行统计，得到数据透视表。

预设统计规则可以是服务器提取出医保结算数据中的购药地址和购药日期，并根据购药日期和购药地址生成数据透视表中的横轴，统计参保人在当天是否购药作为透视参数。服务器采用预设统计规则对清洗后的医保结算数据进行统计，得到数据透视表。

在上述医保数据处理方法中，通过对医保结算数据进行清洗，删除了医保结算数据中的异常值、并对缺失值进行补充，保证了数据的一致性。而且服务器还对医保结算数据进行统计，生成了用于表征参保人购药行为的数据透视表。

在一个实施例中，根据医保结算数据的数据内存以及实时获取的运算内存确定运算数据量，包括以下步骤：实时获取运算内存，并根据运算内存获取与矩阵计算相关的矩阵运算速度；获取与数据内存对应的运算时间；根据矩阵运算速度和运算时间实时确定运算数据量。

服务器实时获取运算内存，并根据运算内存获取与矩阵计算相关的矩阵运算速度。服务器可以周期性获取运算内存，运算内存的获取周期的单元可以是ms、s、min等。矩阵运算速度随着运算内存的变化，也对应发生正比变化。服务器通过实时获取的运算内存对被提取并运算的医保结算数据进行限制。对于a×b阶矩阵，当a或b值发生变化时，矩阵运算速度也随之发生变化，矩阵运算速度随着a或b值的增加而递减，其中，a和b值可以相同也可以不同。服务器可以获取与不同阶矩阵对应的矩阵运算速度。服务器获取与数据内存对应的运算时间。运算时间是从服务器接收到医保结算数据到筛选出违规参保标识，并将违规集合中的参保标识发送给医保终端的时间。运算时间的单位可以为分钟、小时、天等。服务器根据矩阵运算速度和运算时间实时确定运算数据量。服务器根据矩阵运算速度和运算时间实时确定被计算的a×b阶矩阵中a和b值的大小，从而根据a和b值确定透视矩阵的行列。当服务器确定的a和b存在多个值时，服务器可以采用贪心算法、粒子群算法或者二分图算法等最优解选择算法筛选出透视矩阵的行列值。

上述医保数据处理方法中，服务器实时获取运算内存，并根据与运算内存对应的矩阵运算速度和与数据内存对应的运算时间确定运算数据量，在保证数据处理效率的同时，最大限度地利用运算内存，避免发生内存溢出。

在一个实施例中，如图4所示，采用矩阵乘法对透视矩阵进行处理得到共现矩阵，包括以下步骤：

步骤402，从数据透视表中提取与参保标识对应的透视参数，并根据透视参数构建参考矩阵。

参考矩阵是根据数据透视表中的所有参保标识及其对应的透视参数生成数据矩阵。参考矩阵的布局可以以参保标识为纵轴，购药信息中的购药日期和购药地址为横轴，表格对应位置处填入参保人对应的透视参数。当数据透视表中存在的参保标识为5万人时，参考矩阵为m×50000阶的矩阵。服务器从数据透视表中提取与参保标识对应的透视参数，并根据透视参数构建参考矩阵。

步骤404，计算透视矩阵对应的转置矩阵。

服务器计算透视矩阵对应的转置矩阵。例如，当透视矩阵为m×1000阶的由透视参数构成的矩阵时，服务器计算该透视矩阵的转置矩阵，得到1000×m阶的矩阵。

步骤406，根据转置矩阵和参考矩阵的乘积得到共现矩阵。

服务器根据转置矩阵和参考矩阵得到共现矩阵。服务器计算转置矩阵和参考矩阵的乘积，例如，转置矩阵为1000×m阶的矩阵，参考矩阵为m×50000阶的矩阵，共现矩阵为1000×50000阶的矩阵，共现矩阵中横轴代表预设顺序的参保标识，纵轴代表所有参保标识，矩阵中的值代表横轴参保标识与纵轴参保标识相遇的次数。

上述医保数据处理方法中，通过数据透视表中的所有参保人标识的透视参数构建的参考矩阵对透视矩阵进行处理，得到由预设顺序的参保人与所有参保人的相遇次数生成的共现矩阵，不仅直观地表示了参保人标识对应的参保人的违规批次，而且还进一步降低了系统崩溃的概率。

在一个实施例中，从数据透视表中提取透视参数，并根据提取的透视参数构建参考矩阵，包括以下步骤：根据运算数据量从数据透视表依次获取预设顺序的参保标识的透视参数，并根据提取的透视参数依次构建并列的参考矩阵。

服务器根据运算数据量从数据透视表依次获取预设顺序的参保标识的透视参数，并根据提取的透视参数依次构建并列的参考矩阵。例如，医保结算数据中包含5万人，运算数据量为每次统计1000人的参保标识，每人有m条结算记录，服务器可以根据透视表中参保标识依次获取1000人的透视参数构成了m×1000的参考矩阵，参考矩阵的总数量为50。服务器可以计算50组透视矩阵对应的转置矩阵和不同参考矩阵的乘积，得到500个共现矩阵。

上述医保数据处理方法中，服务器每次仅计算部分参保人的参保标识之间的相遇次数，进一步减少了每次运算数据量，再次优化了数据处理的过程，缩短了系统运行的时间。

在另一个实施例中，根据相遇次数对参保标识进行筛选得到违规集合之后，还包括以下步骤：从数据透视表中删除违规集合中参保标识对应的透视参数；根据运算数据量按照预设顺序从删除后的数据透视表提取参保标识的透视参数构建新的透视矩阵。

服务器从数据透视表中删除违规集合中参保标识对应的透视参数。服务器根据运算数据量按照预设顺序从删除后的数据透视表提取参保标识的透视参数构建新的透视矩阵。例如，医保结算数据中包含5万人，运算数量确定为每组1000人，每人有m条结算记录，服务器根据透视表中病人id依次获取1000人的透视参数构成了m×1000的第一透视矩阵，服务器根据该第一透视矩阵与所有参保标识对应的参考矩阵m×50000阶得到第一共现矩阵，根据该第一共现矩阵得到违规参保人的违规集合。服务器将违规集合中参保标识对应的透视参数从数据透视表中删除。服务器再从删除子违规集合的数据透视表再根据数据透视表的序号获取预设顺序参保人的透视参数循环构建第二透视矩阵，因而根据透视表中参保标识依次获取1000人的透视参数构成的第二透视矩阵均不大于m×1000，第二透视矩阵可能m×999、m×900等的矩阵。每个循环周期得到的透视矩阵均不大于第一个循环周期的透视矩阵。

上述医保数据处理方法中，服务器将每次确定的参保标识从数据透视表中删除，进一步减少了每次运算数据量，再次优化了数据处理的过程，缩短了系统运行的时间。

应该理解的是，虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图5所示，提供了一种医保数据处理装置，包括：数据接收模块502、数据量计算模块504、透视矩阵生成模块506、共现矩阵生成模块508和违规筛选模块510，其中：

数据接收模块502，用于接收医保终端发送的预设周期内的医保结算数据，医保结算数据携带有参保标识和购药信息。

数据量计算模块504，用于根据医保结算数据的数据内存以及实时获取的运算内存确定运算数据量。

透视矩阵生成模块506，用于根据参保标识和购药信息生成数据透视表，并根据运算数据量按照预设顺序从数据透视表中提取参保标识的透视参数，构建与参保标识对应的透视矩阵。

共现矩阵生成模块508，用于采用矩阵乘法对透视矩阵进行处理得到共现矩阵，共现矩阵用于表示预设顺序的参保标识与所有参保标识的相遇次数。

违规筛选模块510，用于根据相遇次数对参保标识进行筛选得到违规集合，违规集合的参保标识对应的相遇次数大于预设阈值，并将违规集合中的参保标识发送给医保终端。

在一个实施例中，透视矩阵生成模块包括数据抽取单元、异常排查单元、缺失补充单元和透视表生成单元，其中：

数据抽取单元，用于对医保结算数据进行解析抽取，得到结算明细表。

异常排查单元，用于排查结算明细表中的异常值，并对应删除结算明细表中的异常值。

缺失补充单元，用于确定结算明细表中与缺失值所在变量最相关的医保结算数据参数，并将医保结算数据参数代入缺失值所在变量，得到清洗后的医保结算数据。

透视表生成单元，用于采用预设统计规则对清洗后的医保结算数据进行统计，得到数据透视表。

在一个实施例中，数据量计算模块包括运算速度获取单元、运算时间获取单元和运算数据量确定单元，其中：

运算速度获取单元，用于实时获取运算内存，并根据运算内存获取与矩阵计算相关的矩阵运算速度。

运算时间获取单元，用于获取与数据内存对应的运算时间。

运算数据量确定单元，用于根据矩阵运算速度和运算时间确定运算数据量。

在一个实施例中，共现矩阵生成模块包括参考矩阵生成单元、转置矩阵计算单元和共现矩阵生成单元，其中：

参考矩阵生成单元，用于从数据透视表中提取与参保标识对应的透视参数，并根据透视参数构建参考矩阵。

转置矩阵计算单元，用于计算透视矩阵对应的转置矩阵。

共现矩阵生成单元，用于根据转置矩阵和参考矩阵得到共现矩阵。

在一些实施例中，共现矩阵生成模块包括参考矩阵拆分单元，其中：

参考矩阵拆分单元，用于根据运算数据量从数据透视表依次获取预设顺序的参保标识的透视参数，并根据提取的透视参数依次构建并列的参考矩阵。

在一些实施例中，医保数据处理装置还包括，其中：

透视参数删除模块，用于从数据透视表中删除违规集合中参保标识对应的透视参数。

透视矩阵提取模块，用于根据运算数据量按照预设顺序从删除后的数据透视表提取参保标识的透视参数构建新的透视矩阵。

关于医保数据处理装置的具体限定可以参见上文中对于医保数据处理方法的限定，在此不再赘述。上述医保数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储医保数据处理数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种医保数据处理方法。

本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，该存储器存储有计算机程序，该处理器执行计算机程序时实现以下步骤：接收医保终端发送的预设周期内的医保结算数据，医保结算数据携带有参保标识和购药信息；根据医保结算数据的数据内存以及实时获取的运算内存确定运算数据量；根据参保标识和购药信息生成数据透视表，并根据运算数据量按照预设顺序从数据透视表中提取参保标识的透视参数，构建与参保标识对应的透视矩阵；采用矩阵算法对透视矩阵进行处理得到共现矩阵，共现矩阵用于表示预设顺序的参保标识与所有参保标识的相遇次数；根据相遇次数对参保标识进行筛选得到违规集合，违规集合的参保标识对应的相遇次数大于预设阈值，并将违规集合中的参保标识发送给医保终端。

在一个实施例中，处理器执行计算机程序时实现的根据参保标识和购药信息生成数据透视表，包括：对医保结算数据进行解析抽取，得到结算明细表；排查结算明细表中的异常值，并对应删除结算明细表中的异常值；确定结算明细表中与缺失值所在变量最相关的医保结算数据参数，并将医保结算数据参数代入缺失值所在变量，得到清洗后的医保结算数据；采用预设统计规则对清洗后的医保结算数据进行统计，得到数据透视表。

在一个实施例中，处理器执行计算机程序时实现的根据医保结算数据的数据内存以及实时获取的运算内存确定运算数据量，包括：实时获取运算内存，并根据运算内存获取与矩阵计算相关的矩阵运算速度；获取与数据内存对应的运算时间；根据矩阵运算速度和运算时间确定运算数据量。

在一个实施例中，处理器执行计算机程序时实现的采用矩阵算法对透视矩阵进行处理得到共现矩阵，包括：从数据透视表中提取与参保标识对应的透视参数，并根据透视参数构建参考矩阵；计算透视矩阵对应的转置矩阵；根据转置矩阵和参考矩阵的乘积得到共现矩阵。

在一个实施例中，处理器执行计算机程序时实现的从数据透视表中提取透视参数，并根据提取的透视参数构建参考矩阵，包括：根据运算数据量从数据透视表依次获取预设顺序的参保标识的透视参数，并根据提取的透视参数依次构建并列的参考矩阵。

在一个实施例中，处理器执行计算机程序时实现的根据相遇次数对参保标识进行筛选得到违规集合之后，还包括：从数据透视表中删除违规集合中参保标识对应的透视参数；根据运算数据量按照预设顺序从删除后的数据透视表提取参保标识的透视参数构建新的透视矩阵。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：接收医保终端发送的预设周期内的医保结算数据，医保结算数据携带有参保标识和购药信息；根据医保结算数据的数据内存以及实时获取的运算内存确定运算数据量；根据参保标识和购药信息生成数据透视表，并根据运算数据量按照预设顺序从数据透视表中提取参保标识的透视参数，构建与参保标识对应的透视矩阵；采用矩阵算法对透视矩阵进行处理得到共现矩阵，共现矩阵用于表示预设顺序的参保标识与所有参保标识的相遇次数；根据相遇次数对参保标识进行筛选得到违规集合，违规集合的参保标识对应的相遇次数大于预设阈值，并将违规集合中的参保标识发送给医保终端。

在一个实施例中，计算机程序被处理器执行时实现的根据参保标识和购药信息生成数据透视表，包括：对医保结算数据进行解析抽取，得到结算明细表；排查结算明细表中的异常值，并对应删除结算明细表中的异常值；确定结算明细表中与缺失值所在变量最相关的医保结算数据参数，并将医保结算数据参数代入缺失值所在变量，得到清洗后的医保结算数据；采用预设统计规则对清洗后的医保结算数据进行统计，得到数据透视表。

在一个实施例中，计算机程序被处理器执行时实现的根据医保结算数据的数据内存以及实时获取的运算内存确定运算数据量，包括：实时获取运算内存，并根据运算内存获取与矩阵计算相关的矩阵运算速度；获取与数据内存对应的运算时间；根据矩阵运算速度和运算时间确定运算数据量。

在一个实施例中，计算机程序被处理器执行时实现的采用矩阵算法对透视矩阵进行处理得到共现矩阵，包括：从数据透视表中提取与参保标识对应的透视参数，并根据透视参数构建参考矩阵；计算透视矩阵对应的转置矩阵；根据转置矩阵和参考矩阵的乘积得到共现矩阵。

在一个实施例中，计算机程序被处理器执行时实现的从数据透视表中提取透视参数，并根据提取的透视参数构建参考矩阵，包括：根据运算数据量从数据透视表依次获取预设顺序的参保标识的透视参数，并根据提取的透视参数依次构建并列的参考矩阵。

在一个实施例中，计算机程序被处理器执行时实现的根据相遇次数对参保标识进行筛选得到违规集合之后，还包括：从数据透视表中删除违规集合中参保标识对应的透视参数；根据运算数据量按照预设顺序从删除后的数据透视表提取参保标识的透视参数构建新的透视矩阵。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限，ram以多种形式可得，诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张旭
技术所有人：平安医疗健康管理股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。