一种基于决策树算法的疾病诊断分组的实现方法与流程

文档序号:12669348阅读:1972来源:国知局
一种基于决策树算法的疾病诊断分组的实现方法与流程

本发明涉及计算机应用技术领域,特别涉及一种基于决策树算法的疾病诊断分组的实现方法。



背景技术:

医疗保险费用支付计算是医疗保障体系的重要环节,关系到医疗保险各方利益。当前医疗费用的增长速度快,为了防止医疗保险入不敷出的情况,需要做医保控费。

传统的医保控费的方式有总额预付和按项目付费等方法。“按项目付费”根据患者在医院接受服务所花费的费用按收费单据报销。缺陷是无法约束医院的医疗行为,容易造成服务过度,且医院缺乏成本控制意识,倾向引入尖端诊疗设备和推销高价格药物,导致费用大幅度上升。“总额预付制”是由医保部门以前期医院总支出为依据计算人均医疗费用,按此费用标准按年度拨付医院费用总额,如发生费用超支,则由医院承担。虽然在总体上控制了医疗开支的过快增长,缺陷是容易造成了医院的医疗浪费和小病大治,导致医疗成本控制很难落实。

如何根据已知的疾病基础数据,运用相关算法实现对疾病诊断的分类,从而为后期的医保控费等应用打下基础,是当前需要解决的技术问题。



技术实现要素:

本发明的目的旨在至少解决所述技术缺陷之一。

为此,本发明的目的在于提出一种基于决策树算法的疾病诊断分组的实现方法。

为了实现上述目的,本发明的实施例提供一种基于决策树算法的疾病诊断分组的实现方法,包括:

步骤S1,获取疾病种类的基础数据,将所述疾病种类的基础数据按照人体解剖系统分为多个疾病诊断分组解剖大类;

步骤S2,根据预设的手术类型及操作的难易程度数据,将每个疾病诊断分组解剖大类进一步划分为多个疾病诊断操作子类;

步骤S3,针对每个所述疾病诊断操作子类,设置因变量和自变量,运用决策树算法选取符合预设条件的因素,将病例样本细分为诊断相关组,包括:利用所述决策树算法对每个所述疾病诊断操作子类的变量值进行切分,并分别计算切分前误差平方和SSE1以及切分后误差平方和SSE2,选取SSE2与SSE1差值的最大值对应的变量属性作为最佳切分选择,重复上述步骤,直至按针对该变量特征划分后节点各数值相同或达到规定的切分层数,则停止算法迭代;

步骤S4,在决策树选取的切分特征变量中,将切分后节点费用均值低于预设阈值的并发症确定为一般并发症,将切分后节点均值费用高于预设阈值的并发症确定为重要并发症,以此划分诊断相关组。

进一步,所述多个疾病诊断分组解剖大类,包括:神经系统疾病组、消化系统疾病组、骨科系统疾病组。

进一步,在所述步骤S3中,所述因变量为该疾病诊断操作子类对应的治疗总费用,自变量为并发症、患者年龄以及是否死亡,所述预设条件为影响治疗费用的因素。

进一步,在所述步骤S3中,所述决策树算法采用分类回归决策树算法。

进一步,

其中,vi是变量Xi切分前的具体值,vi'是变量Xi切分后的具体值,i=1,2,…n。

进一步,在所述步骤S4之后,还包括如下步骤:根据划分的诊断相关组,进行保险支付、保险欺诈异常识别、医保控费和医疗绩效评价操作。

根据本发明实施例的基于决策树算法的疾病诊断分组的实现方法,以临床病案数据为基础,通过划分出疾病诊断分组解剖大类,进而细分出疾病诊断操作子类,运用医学诊断与决策树算法,将临床过程相近、资源消耗相近的病例归为一类,实现病例自动化分组,为医疗保险支付、医疗服务绩效考核等提供支持,可以提高医疗资源管理的科学性、稳定性和准确性。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1为根据本发明实施例的基于决策树算法的疾病诊断分组的实现方法的流程图;

图2为根据本发明实施例的形成诊断相关组的示意图。

具体实施方式

下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

如图1所示,本发明实施例的基于决策树算法的疾病诊断分组的实现方法,包括如下步骤:

步骤S1,获取疾病种类的基础数据,将疾病种类的基础数据按照人体解剖系统分为多个疾病诊断分组解剖大类。其中,疾病种类的基础数据包括对疾病的诊断数据,即根据疾病的主要诊断结果,将疾病按照人体的解剖系统分为26个大类。

在本发明的一个实施例中,多个疾病诊断分组解剖大类,包括:神经系统疾病组、消化系统疾病组、骨科系统疾病组。需要说明的是,疾病诊断分组解剖大类是根据人体解剖系统进行划分,除上述举例外还包括其他类别,在此不再赘述。

步骤S2,根据预设的手术类型及操作的难易程度数据,将每个疾病诊断分组解剖大类进一步划分为多个疾病诊断操作子类。

举例来说,根据手术类型及操作的难易程度对骨科系统疾病进行归类,将大关节置换术、大关节翻修术、大关节除置换翻修以外手术、小关节置换翻修术、小关节除置换翻修以外术、脊柱融合手术、脊柱非融合手术、骨盆髋臼术、上肢长骨术、下肢长骨术、肌肉肌腱术、周围神经术、清创手术及其他骨及肌肉手术等划分进同一‘疾病诊断操作子类’中,以确保疾病分组符合医学和临床实践。

步骤S3,针对每个疾病诊断操作子类,设置因变量和自变量,运用决策树算法选取符合预设条件的因素,将病例样本细分为诊断相关组。

在本发明的一个实施例中,因变量为该疾病诊断操作子类对应的治疗总费用,自变量为并发症、患者年龄以及是否死亡,预设条件为影响治疗费用的因素。即,以治疗总费用作为因变量,并发症、患者年龄以及是否死亡等作为自变量,运用决策树算法,遴选影响费用的重要因素,将病例样本进一步细分为诊断相关组。

具体地,利用决策树算法对每个疾病诊断操作子类的变量值进行切分,对变量值的切分采用计算数值型因变量的平方误差和(每条数据的值到均值的差值的平方的总和),分别计算切分前误差平方和SSE1(Sum of Square Error)以及切分后误差平方和SSE2,选取SSE2与SSE1差值的最大值对应的变量属性作为最佳切分选择,重复上述步骤,直至按针对该变量特征划分后节点各数值相同或达到规定的切分层数,则停止算法迭代。

其中,vi是变量Xi切分前的具体值,vi'是变量Xi切分后的具体值,i=1,2,…n。

优选的,根据变量数据类型,决策树算法可以采用分类回归决策树算法(CART,Classification And Regression Trees)算法进行特征提取。

步骤S4,在决策树选取的切分特征变量中,将切分后节点费用均值低于预设阈值的并发症确定为一般并发症,将切分后节点均值费用高于预设阈值的并发症确定为重要并发症,以此划分诊断相关组。

此外,在步骤S4之后,还包括如下步骤:根据划分的诊断相关组,进行保险支付、保险欺诈异常识别、医保控费和医疗绩效评价操作。

具体来说,疾病诊断分组结果可应用于以下领域:

1.保险支付:将住院患者数据按照诊断划分不同疾病诊断组,对每个组分别定价,医疗保险机构在诊疗全过程中一次性向医院支付医疗费用。

2.保险欺诈异常识别:通过分析相似病案消耗医疗资源情况,排查异常病例,识别高风险医保欺诈行为。

3.医保控费:政府医保部门根据疾病诊断组费用,研究确定各地区基本医疗保险总额预付。

4.医疗绩效评价:通过病案数据实现病例分类,从产能、效率、安全性等维度对医疗行为进行绩效评估,提高医疗服务效率。

下面结合具体实施例对本发明的基于决策树算法的疾病诊断分组进行说明。表1示出了疾病诊断的基础数据。

表1

(1)解剖系统分类:依据主要诊断,以下病例样本解剖系统类别为循环系统疾病。设置分组代码为B。

(2)操作分类:依据病例主要诊断和手术操作,将样本细分为两个疾病诊断操作类:经皮心血管操作及冠状动脉药物洗脱支架植入组(病案号:1、2、3),设置分组代码为BB1;经皮心血管操作及冠状动脉非药物洗脱支架植入组(病案号:4、5),设置分组代码为BB2。

(3)利用决策树算法划分诊断相关组

(3.1)选择切分变量和特征值

对BB1组切分过程中,计算每个变量的每个特征值切分前、后总误差平方和,选取“年龄17岁”作为最佳切分特征值,切分后,小于等于17岁的病例组成左侧树,大于17岁的病例组成右侧树。

(3.2)算法迭代

对左侧树建立决策树模型,选取并发症作为最佳切分变量,费用均值较低的一组为一般并发症,费用均值较高的一组为重要并发症。

(3.3)算法停止条件

如某个节点所有费用值相等、节点数据集很小,或误差减少不大,则算法在该节点停止迭代。

(3.4)形成“诊断相关组”

参考图2,根据决策树模型将病例数据集划分为3组:BB14(年龄小于17岁,伴有一般并发症)、BB12(年龄小于17岁,伴有重要并发症)、BB19(年龄大于17岁)。计算各组病例平均费用,BB14组平均费用为124567.9元,BB12组平均费用为174448.6元,BB19平均费用为280663.4元,可作为预测医疗服务费用参考值。

所有可能的分组结果如表2所示:

表2

根据本发明实施例的基于决策树算法的疾病诊断分组的实现方法,以临床病案数据为基础,通过划分出疾病诊断分组解剖大类,进而细分出疾病诊断操作子类,运用医学诊断与决策树算法,将临床过程相近、资源消耗相近的病例归为一类,实现病例自动化分组,为医疗保险支付、医疗服务绩效考核等提供支持,可以提高医疗资源管理的科学性、稳定性和准确性。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。本发明的范围由所附权利要求及其等同限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1