基于K均值聚类实现高危手术预测的方法、装置、处理器及其存储介质与流程

文档序号：24410584发布日期：2021-03-26 19:11阅读：102来源：国知局

基于k均值聚类实现高危手术预测的方法、装置、处理器及其存储介质
技术领域
1.本发明涉及临床实践领域，尤其涉及手术风险评估领域，具体是指一种基于k均值聚类实现高危手术预测的方法、装置、处理器及其计算机可读存储介质。

背景技术：

2.手术风险评估在临床实践中具有重要意义，一般是根据手术患者病史、体格检查、影像学与实验室检查检验结果、临床诊断等进行人工综合判断。在医院管理领域，对手术难度/风险指标也有定义。例如rbrvs指标是1992年美国的医疗保险(medicare)用于支付医师劳务费的支付体系。其特点是对每个由医生完成的项目，都依据技术含量、医生需要付出的直接劳动时间(工作强度)、技术风险三个因素给出一个相对分值(点数)。rbrvs较精确地评价了每一项手术操作的直接劳动时间、技术含量和风险，并给出了一个静态的分值，与每个地区、国家的医疗服务项目价格本身没有关系。这使得按照rbrvs点数计算工作量或服务量的医院之间具备横向比较的可能性。但是由于这个分值没有考虑到产生rbrvs总点数的资源付出，包括医生人数、床位数等因素，所以直接评比医院之间、同一家医院不同年度的手术项目绩效水平是有失偏颇的。它既不能用于客观地定量评价a医院和b医院的手术技术水平差异，也不能用于客观地评价同一个科室在近两、三个年度内的手术水平是否有提升，是否为患者提供了更有技术难度的服务项目。目前国内仅把它用于医生绩效静态评价，依据科室取得的rbrvs点数给医生发放绩效工资。
3.然而，rbrvs及其衍生的一些基于支付的指标尚未充分考量患者术前发生的事件和术中风险之间的因果关系。例如rbrvs会提供诊疗项目的保险责任点数(professional liabilityinsurance，pli)表示诊疗项目导致高危情况的风险；drgs会提供诊断组的风险等级，并计算出死亡率。而另一种类型的指标cd型率是依据病人的年龄、基本生命体征、疾病诊断和处置等因素，按轻、重、缓、急分成a、b、c、d四种类型。作为评价疾病严重程度的方法之一，cd型率是一种介于定性评价和定量分析之间的疾病严重程度综合评价和分析方法，由于较强地依赖定性评价的结果，也无法通过完全自动化的量化分析得出相对独立客观的分析结果。
4.此外，还有一些基于大数据的疾病预测系统，采用支持向量机，也可以对一些严重病症进行预测。由于本发明解决的问题是预测术中风险。从本发明的采样数据来看，术中风险的发生率约等于0.3％。采用有监督学习算法，比如：支持向量机，极难通过数据采样验证其预测的准确性。

技术实现要素：

5.本发明的目的是克服了上述现有技术的缺点，提供了一种满足准确性、风险低、适用范围较为广泛的基于k均值聚类实现高危手术预测的方法、装置、处理器及其计算机可读存储介质。
6.为了实现上述目的，本发明的基于k均值聚类实现高危手术预测的方法、装置、处理器及其计算机可读存储介质如下：
7.该基于k均值聚类实现高危手术预测的方法，其主要特点是，所述的方法包括以下步骤：
8.(1)采集手术患者历史病例，将数据进行预处理及标准化；
9.(2)对数据提取特征，进行特征筛选；
10.(3)分析并存储k均值聚类；
11.(4)改进k均值聚类；
12.(5)根据聚类中心评估手术风险，预测高危手术。
13.较佳地，所述的步骤(2)中筛选的特征包括术前检验覆盖率、患者年龄、有无手术史、是否抢救、bmi值、术前检验阳性率、术前检查覆盖率、术前检验危机值、麻醉评级指数、患者年龄指数、手术rvu指数和医生rvu指数。
14.较佳地，所述的步骤(3)具体包括以下步骤：
15.(3.1)根据样本间相似度，将训练样本分到k个聚类分组；
16.(3.2)对每个聚类分组计算并发症发生率，对每个聚类分组计算聚类中心，存储得到的聚类中心、聚类分组的并发症发生率及各项特征的均值和标准差，其中将聚类结果中的a类患者作为高风险患者。
17.较佳地，所述的步骤(4)通过k
‑
means++、k
‑
means、canopy算法、mini
‑
batch k
‑
means算法、isodata算法和kernel k
‑
means算法。
18.较佳地，所述的步骤(5)具体包括以下步骤：
19.(5.1)查询患者流水号，采集样本的数据，并进行标准化；
20.(5.2)比较数据点和聚类中心的距离，并将其划分到距离最小的一个聚类中心所在的分组；
21.(5.3)若划分结果为并发症发生率排名第一的组，则进行预警，提示医生对该样本重点关注；否则，继续评估。
22.该基于k均值聚类实现高危手术预测的装置，其主要特点是，所述的装置包括：
23.处理器，被配置成执行计算机可执行指令；
24.存储器，存储一个或多个计算机可执行指令，所述的计算机可执行指令被所述的处理器执行时，实现上述的基于k均值聚类实现高危手术预测的方法的步骤。
25.该基于k均值聚类实现高危手术预测的处理器，其主要特点是，所述的处理器被配置成执行计算机可执行指令，所述的计算机可执行指令被所述的处理器执行时，实现上述的基于k均值聚类实现高危手术预测的方法的步骤。
26.该计算机可读存储介质，其主要特点是，其上存储有计算机程序，所述的计算机程序可被处理器执行以实现上述的基于k均值聚类实现高危手术预测的方法的各个步骤。
27.采用了本发明的基于k均值聚类实现高危手术预测的方法、装置、处理器及其计算机可读存储介质，能够有效预测高危手术，提升经验化医院管理的流程效率。此外，将高危患者的信息在术前提供给主刀医生，可以使医生充分结合计算机的客观评价和自己的主观判断，得到一个综合性的手术患者术中风险评估。
附图说明
28.图1为本发明的基于k均值聚类实现高危手术预测的方法的模型生成流程图。
29.图2为本发明的基于k均值聚类实现高危手术预测的方法的模型使用流程图。
30.图3a为本发明的基于k均值聚类实现高危手术预测的方法的k取3时的聚类结果中每个类别的患者手术风险指数的概率分布曲线。
31.图3b为本发明的基于k均值聚类实现高危手术预测的方法的k取4时的聚类结果中每个类别的患者手术风险指数的概率分布曲线。
32.图3c为本发明的基于k均值聚类实现高危手术预测的方法的k取5时的聚类结果中每个类别的患者手术风险指数的概率分布曲线。
33.图3d为本发明的基于k均值聚类实现高危手术预测的方法的k取6时的聚类结果中每个类别的患者手术风险指数的概率分布曲线。
具体实施方式
34.为了能够更清楚地描述本发明的技术内容，下面结合具体实施例来进行进一步的描述。
35.本发明的该基于k均值聚类实现高危手术预测的方法，其中包括以下步骤：
36.(1)采集手术患者历史病例，将数据进行预处理及标准化；
37.(2)对数据提取特征，进行特征筛选；
38.(3)分析并存储k均值聚类；
39.(4)改进k均值聚类；
40.(5)根据聚类中心评估手术风险，预测高危手术。
41.作为本发明的优选实施方式，所述的步骤(2)中筛选的特征包括术前检验覆盖率、患者年龄、有无手术史、是否抢救、bmi值、术前检验阳性率、术前检查覆盖率、术前检验危机值、麻醉评级指数、患者年龄指数、手术rvu指数和医生rvu指数。
42.作为本发明的优选实施方式，所述的步骤(3)具体包括以下步骤：
43.(3.1)根据样本间相似度，将训练样本分到k个聚类分组；
44.(3.2)对每个聚类分组计算并发症发生率，对每个聚类分组计算聚类中心，存储得到的聚类中心、聚类分组的并发症发生率及各项特征的均值和标准差，其中将聚类结果中的a类患者作为高风险患者。
45.作为本发明的优选实施方式，所述的步骤(4)通过k
‑
means++、k
‑
means、canopy算法、mini
‑
batch k
‑
means算法、isodata算法和kernel k
‑
means算法。
46.作为本发明的优选实施方式，所述的步骤(5)具体包括以下步骤：
47.(5.1)查询患者流水号，采集样本的数据，并进行标准化；
48.(5.2)比较数据点和聚类中心的距离，并将其划分到距离最小的一个聚类中心所在的分组；
49.(5.3)若划分结果为并发症发生率排名第一的组，则进行预警，提示医生对该样本重点关注；否则，继续评估。
50.作为本发明的优选实施方式，该基于k均值聚类实现高危手术预测的装置，其中包括：
51.处理器，被配置成执行计算机可执行指令；
52.存储器，存储一个或多个计算机可执行指令，所述的计算机可执行指令被所述的处理器执行时，实现上述的基于k均值聚类实现高危手术预测的方法的步骤。
53.作为本发明的优选实施方式，该基于k均值聚类实现高危手术预测的处理器，其被配置成执行计算机可执行指令，所述的计算机可执行指令被所述的处理器执行时，实现上述的基于k均值聚类实现高危手术预测的方法的步骤。
54.作为本发明的优选实施方式，该计算机可读存储介质，其上存储有计算机程序，所述的计算机程序可被处理器执行以实现上述的基于k均值聚类实现高危手术预测的方法的各个步骤。
55.本发明的具体实施方式中，为了克服手术患者无法得到术前快速有效风险评估的问题，提供一种基于k均值聚类分析的术中风险预警，在术前就可以通过精准高效的数据分析暴露潜在的高危患者手术信息，从而使得医生有充足的时间能够通过会诊等方式评估和规避潜在的风险。
56.本发明的基于k均值聚类的预测高危手术的方法，所述的方法包括以下步骤：
57.s1.分析阶段
58.s1.1数据采集与准备、数据的预处理及标准化
59.采集手术患者历史病例，将数据进行预处理及标准化。
60.s1.2特征提取
61.对数据进行特征工程，特征筛选。选取的特征维度可以包括但不限于：术前检验覆盖率、患者年龄、有无手术史、是否抢救、bmi值、术前检验阳性率、术前检查覆盖率、术前检验危机值、麻醉评级指数、患者年龄指数、手术rvu指数、医生rvu指数等。
62.s1.3 k均值聚类分析并存储
63.根据样本间相似度，将训练样本分到k个聚类分组，其中相似度可以由欧式距离函数定义。每个聚类分组都计算一个并发症发生率，每个聚类分组都计算一个聚类中心。存储得到的聚类中心、聚类分组的并发症发生率及各项特征的均值和标准差。聚类结果中的a类患者作为高风险患者。
64.s1.4 k均值聚类的改进
65.s1.4.1 k
‑
means++、k
‑
means||及canopy算法
66.k均值聚类算法对初始聚类中心比较敏感，可以采用k
‑
means++算法改进初始质点的选择，也可以进一步采用k
‑
means||算法，优化初始条件。另外，可以采用canopy+k
‑
means算法混合形式进行模型构建。
67.s1.4.2 mini
‑
batch k
‑
means算法
68.可以采用mini
‑
batch k
‑
means算法降低收敛时间，提升运算效率。
69.s1.4.3 isodata算法
70.数据量级大且提取的特征维度高时，可以采用isodata算法选取合适的k值。
71.s1.4.4 kernel k
‑
means算法
72.可以采用kernel k
‑
means算法将样本映射到高维特征空间中再进行聚类，进一步改善聚类效果。
73.s2.预测阶段
74.s2.1根据聚类中心评估手术风险，预测高危手术
75.查询患者流水号，采集样本的数据，本实施例中的数据维度为8维，并进行标准化。比较数据点和5个聚类中心的距离，并将其划分到距离最小的一个聚类中心所在的分组。当划分结果为并发症发生率排名第一的组时，进行预警，提示医生对该样本重点关注。
76.本实施例公开了一种基于k均值聚类的预测高危手术的方法，流程示意图如图1和图2所示，包括以下步骤：
77.s1.分析阶段
78.s1.1数据采集与准备、数据的预处理及标准化
79.采集手术患者历史病例，本实施例采用的病例数据大约为11万条，将数据进行预处理及标准化。
80.s1.2特征提取
81.对数据进行特征工程，特征筛选。本实施例使用的特征维度为8维，分别是：
82.术前检验覆盖率、术前检验阳性率、术前检查覆盖率、术前检验危机值、麻醉评级指数、患者年龄指数、手术rvu指数、医生rvu指数。
83.s1.3 k均值聚类分析并存储
84.本实施例选取k＝5。根据样本间相似度，将训练样本分到5个聚类分组，其中相似度由欧式距离函数定义。每个聚类分组都计算一个并发症发生率，每个聚类分组都计算一个聚类中心。存储得到的聚类中心、聚类分组的并发症发生率(表1)及各项特征的均值和标准差(表2)。
85.本实施例产生的聚类结果中的a类患者作为高风险患者。本实施例选取k＝5的原因为分5或6组时，a类患者的术中风险指数接近所有患者的术中风险指数最大值。而且，由于其聚类中心的位置远离其他所有聚类中心，因此a类患者的特征从分5或6组更体现相较于其他类患者的差异性。另一方面，分5组时的a类患者概率分布和分6组时的a类患者概率分布都符合正态分布(如图3a～图3d所示)，而分5组时的a类患者的正态分布峰度高于分6组时的a类患者的正态分布峰度。峰度越高说明该聚类内部的患者训练样本，越接近聚类中心，训练样本的相似特征越明显。所以从a类患者内部的相对高内聚性以及和其他类患者之间的相对低耦合性方面考虑，选择分5组时的a类患者作为高风险患者。
86.s2.预测阶段
87.s2.1根据聚类中心评估手术风险，预测高危手术
88.查询患者流水号，采集样本的数据，本实施例中的数据维度为8维，并进行标准化。比较数据点和5个聚类中心的距离，并将其划分到距离最小的一个聚类中心所在的分组。当划分结果为并发症发生率排名第一的组时，进行预警，提示医生对该样本重点关注。
89.由所述技术解决方案所得到的聚类结果，能够预测相应的高危手术可能性。图3a～图3d分别展示了k取不同值时的聚类结果中每个类别的患者手术风险指数的概率分布曲线，其中k＝3，4，5，6。图中由标记
“×”
标识的曲线a表示高风险患者。术中风险指数是指患者的八维数据的标准化值的线性加权和，标准化方式采用均值归一化，权重为各维度数据的标准化值的标准差。
90.本实施例的具体实现方案可以参见上述实施例中的相关说明，此处不再赘述。
91.可以理解的是，上述各实施例中相同或相似部分可以相互参考，在一些实施例中
未详细说明的内容可以参见其他实施例中相同或相似的内容。
92.需要说明的是，在本发明的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是指至少两个。
93.流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。
94.应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行装置执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。
95.本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。
96.此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。
97.上述提到的存储介质可以是只读存储器，磁盘或光盘等。
98.在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
99.采用了本发明的基于k均值聚类实现高危手术预测的方法、装置、处理器及其计算机可读存储介质，能够有效预测高危手术，提升经验化医院管理的流程效率。此外，将高危患者的信息在术前提供给主刀医生，可以使医生充分结合计算机的客观评价和自己的主观判断，得到一个综合性的手术患者术中风险评估。
100.在此说明书中，本发明已参照其特定的实施例作了描述。但是，很显然仍可以作出各种修改和变换而不背离本发明的精神和范围。因此，说明书和附图应被认为是说明性的而非限制性的。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：肖可君;王志刚;邓铭涛
技术所有人：上海蓬海涞讯数据技术有限公司
我是此专利的发明人

上一篇：一种水利工程用河道护坡砖铺设施工装置的制作方法
上一篇：业务承载拥塞控制的方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。