医院指标异常模式自动检测方法与流程

文档序号：12786706阅读：441来源：国知局

本发明涉及指标异常检测技术领域，特别涉及一种医院指标异常模式自动检测方法。

背景技术：

伴随着医院信息化建立的不断健全和完善，医院产生了大量的数据，该数据具有价值高，维度大等特点。正是由于数据的复杂性高，当医院某些指标发生异常时，难以发现，并且某些重要指标的异常检测对医院管理决策有着重要影响。因此如何及时有效地检测医院服务量指标的异常模式，保证医院正常运行具有重要的意义。医院服务量指标异常是指医院服务量指标偏离其正常模式的情形。随着医院信息系统的不断完善，数据量不断增加，医院重要服务量指标异常对医院正常运行的影响越来越大。因而如何准确、快速地检测出指标异常，并做出合理的响应，是保证医院正常运行的前提条件之一。

医院服务量指标主要有两个方面，宏观和微观，以下简称服务量指标。医院宏观服务量包括门诊急诊人次、急诊抢救人次、病人住院实际占用床位日、出院人数等，宏观服务量通常由社会需求所决定的。微观服务量是指各部门，科室各内部的服务量，如医院订购的药品、卫生材料、检验的标本量，放射科的摄片量，合理安排人员、设备床位等。医院服务量指标(门诊量，住院量，手术量等)的异常模式检测技术有助于医院管理者及时发现医院相关指标的异常情况，及时查找问题发生的原因，解决问题，保证医院各项工作正常运转。

目前，医院现有的检测异常模式的方式，主要是医院管理者根据经验判断指标是否异常，这种异常检测方法存在很多问题：(1)不能及时发现异常，往往是经过一段时间的数据汇总(如月报汇报时)管理者才发现异常，导致不能及时解决问题，时间滞后；(2)需要管理者具有一定的管理经验，对管理者的要求较高，可复制性差；(3)由于管理者的经验的不同，导致检测出的异常模式更具有经验性、个人主观性，缺乏科学性、合理性。

技术实现要素：

本发明提供了一种医院指标异常模式自动检测方法，以解决现有技术在判断指标体系异常时，需要较高的管理经验，且无法及时发现问题，时间滞后性大的问题。

为解决上述问题，作为本发明的一个方面，提供了一种医院指标异常模式自动检测方法，包括：步骤1，获取指标体系的历史数据；步骤2，将所述历史数据进行分割，以得到分段指标数据；步骤3，提取所述分段指标数据的特征值；步骤4，将所述特征值标准化；步骤5，根据标准化后的所述特征值计算所述分段指标数据的异常值；步骤6，历史数据根据所述历史数据得到异常值阈值；步骤7，根据所述异常值和异常值阈值确定异常模式。

优选地，所述步骤2包括：从所述历史数据的第二点开始遍历，如果该点同时比其前后两点大或同时比其前后两点小，那么将该点作为所述历史数据的一个极值点；以所述极值点为分界点将所述历史数据分成多段以得到分段指标数据。

优选地，所述步骤3包括：所述特征值包括高度、长度、均值、标准差，其中高度为该段数据的最后一个数与第一个数的差值，长度为该段数据包含多少个数据点，均值段数据中的算术平均值，标准差为该段数据的标准差。

优选地，所述步骤4包括：设c₁＝<c₁₁,c₁₂, ,c_1p>为一组特征值，则用下式将该组特征值中的每个特征值标准化到0至1之间：

其中，c_max和c_min分别为c₁＝<c₁₁,c₁₂, ,c1_p>中的最大值和最小值。

优选地，所述步骤5包括：

步骤51，定义在四维特征空间中任意两点的距离计算公式，其中，四维特征空间就是特征值空间，四维特征空间中的每一个点都包含四个维度，即上面定义的四个特征值，设点p(x_p,y_p,z_p,k_p)，q(x_q,y_q,z_q,k_q)为四维特征空间中的任意两点，那么，对象p，q的距离为：

步骤52，定义四维特征空间中任意一点p的k^th距离k-dist(p)，其中，该距离就是四维特征空间中的距离p的距离从小到大排序，第k大的距离对应的点；其中，四维特征空间中的点均为四个特征值确定的点，该处的k是四维特征空间中的距离p的距离从小到大排序，第k大的距离对应的点，dist表示距离；

步骤53，根据步骤52的k^th距离定义p的k平均距离，其中，所述p的k平均距离是指p的1-dist(p)，2-dist(p),….,k-dist(p)距离的算数平均值，记为k-MD(P)；

步骤54，根据p的k平均距离定义k-变异系数，包括以下步骤：

步骤54a，计算四维特征空间的每一个特征值的特征子空间，共四个特征子空间；

步骤54b，分别计算p在四个特征子空间中的k平均距离k-MD1(p)，k-MD2(p)，k-MD3(p)，k-MD4(p)；

步骤54c，将k-MD(p)、k-MD1(p)、k-MD2(p)、k-MD3(p)、k-MD4(p)标准化后，得到k-MDO(p)、k-MDO1(p)、k-MDO2(p)、k-MDO3(p)、k-MDO4(p)；

步骤54d，根据下式计算k-变异系数：

k-变异系数＝k-MDO(p)+max{k-MD1(p)，k-MD2(p)，k-MD3(p)，k-MD4(p)}。

本发明可帮助医院等用户在管理时自动检测指标体系的异常模式，降低了对管理者管理经验的要求，检测出更加科学的异常模式，且具有即时性，随时检测异常。

附图说明

图1示意性地示出了本发明的流程图。

具体实施方式

以下结合附图对本发明的实施例进行详细说明，但是本发明可以由权利要求限定和覆盖的多种不同方式实施。

针对医院检测异常模式的现状，本发明提出了一种自动的基于医院服务量的异常检测技术，由于医院各指标为时间序列数据，即时间序列的自动异常检测技术，该技术科学的定义了异常模式，并提出了自动检测异常模式的方法，实现了自动检测异常模式的功能。

本发明提供了一种医院指标异常模式自动检测方法，例如，是一种医院服务量指标异常模块自动检测方法，包括以下步骤：

步骤1，获取指标体系(如医院服务量指标体系中的门诊量、住院量等)的历史数据；

步骤2，将所述历史数据进行分割，以得到分段指标数据。

步骤3，提取所述分段指标数据的特征值。优选地，所述特征值包括高度、长度、均值、标准差。其中，高度为该段数据的最后一个数与第一个数的差值，长度为该段数据包含多少个数据点，均值段数据中的算术平均值，标准差为该段数据的标准差。

具体地说，设分段指标数据为X₁＝<x_i1,x_i2, ,x_ip>，服务量指标数据为X＝<x₁,x₂, ,x_n>，则可通过下述各式计算上述四个特征值：

高度sph＝x(i_p)-x(i₁)；长度spl＝i_p-i₁+1；均值标准差

步骤4，将所述特征值标准化；具体地说，可通过下述方式进行标准化：

设c₁＝<c₁₁,c₁₂, ,c_1p>为一组特征值，则用下式将该组特征值中的每个特征值标准化到0至1之间：

其中，c_max和c_min分别为c₁＝<c₁₁,c₁₂, ,c_1p>中的最大值和最小值。

步骤5，根据标准化后的所述特征值计算所述分段指标数据的异常值；

步骤6，历史数据根据所述历史数据得到异常值阈值。此时，需要在历史数据中标记出哪些点是异常点，根据已知的异常点的特征值和正常点的特征值比较得出异常值的阈值，其中上，确定阈值的原则为能尽量将正常点和异常点区分开来。

步骤7，根据所述异常值和异常值阈值确定异常模式，输出的异常值大于异常值阈值的点，即为异常点。例如，如果特征值中标准差的异常阈值为10，大于该阈值则认为该模式的标准差异常。在一个实施例中，首先，每一个分段指标数据都会计算出一个异常值，而异常模式是分段指标数据的异常值大于异常值阈值的分段指标数据，完成了每一分段指标数据与异常值阈值的比较，大于异常值阈值的分段指标数据段为异常模块。

由于采用了上述技术方案，本发明可帮助医院等用户在管理时自动检测指标体系的异常模式，降低了对管理者管理经验的要求，检测出更加科学的异常模式，且具有即时性，随时检测异常。

更特点地，本发明还可以采用除上述四个特征值以外的其他特征空间，如可以定义模式的峰度、模式的偏度等，并识别相应的异常模式；此外，本发明中也可以采用其他的异常值计算方法，还可将该异常模式检测技术应用到其他领域。

优选地，所述步骤2包括：从所述历史数据的第二点开始遍历，如果该点同时比其前后两点大或同时比其前后两点小，那么将该点作为所述历史数据的一个极值点；以所述极值点为分界点将所述历史数据分成多段以得到分段指标数据。例如，一段数据中给出n个极值点，以这n个极值点为端点将该段数据分为n+1段。

优选地，所述步骤5包括：

步骤51，定义在四维特征空间中任意两点的距离计算公式；其中，四维特征空间就是特征值空间，四维特征空间中的每一个点都包含四个维度，即上面定义的四个特征值，设点p(x_p,y_p,z_p,k_p)，q(x_q,y_q,z_q,k_q)为四维特征空间中的任意两点，那么，对象p，q的距离为：