医疗项目分类方法、装置、设备及介质与流程

文档序号：30382945发布日期：2022-06-11 05:13阅读：132来源：国知局

1.本技术涉及信息处理技术领域，尤其涉及一种医疗项目分类方法、装置、电子设备及计算机可读存储介质。

背景技术：

2.医保支付的审核离不开对数亿患者的就诊明细数据进行分析。但是明细数据中的医学项目往往涵盖了检查、手术、化学药、中成药等大类下的数十万类项目代码，想要对类别如此庞大的项目进行后续分析有必要先对其进行分类。
3.然而，医学项目的分类并非简单地划分和打标签。在医学诊疗中，一种项目往往适用于多种疾病，一种项目与不同项目的组合也往往有不同的治疗目的和效果，因此，常见的分类体系从治疗用途出发，将两两之间相关的项目定义为一类。
4.目前业内主要依赖于医学专家提供的分类体系。但专家分类法存在一定局限性：专家分类依赖于很强的医学背景和先验知识，建立和维护的成本都很高；专家体系很难覆盖全部的项目，对于未被专家分类的明细数据则无法进行后续分析，造成大量病案信息的损失。因此，如何提供一种医学项目分类方法，能够拓展项目分类的结果，自动补全未分类项目的标签，成为了亟待解决的技术问题。

技术实现要素：

5.本技术实施例的主要目的在于提出一种医疗项目分类方法、装置、电子设备及计算机可读存储介质，能够基于专家医疗项目分类结果，补全未分类医疗项目的标签。
6.为实现上述目的，本技术实施例的第一方面提出了一种医疗项目分类方法，所述方法包括：
7.获取就诊数据集，所述就诊数据集包括多个病患的就诊数据，每个所述就诊数据包括所述病患就诊的至少一个待分类医疗项目；
8.基于所述就诊数据集，确定两两所述待分类医疗项目之间的相似度值；
9.以所述待分类医疗项目为顶点，根据两两所述待分类医疗项目之间的相似度值构造带权边，构建所述待分类医疗项目之间的第一完全图；
10.基于不同的相似度阈值，对所述第一完全图进行剪裁处理，得到多个第二完全图；
11.根据所述多个第二完全图与预设的医疗项目分类图之间的相似性度量，确定所述待分类医疗项目的分类标签。
12.根据本发明一些实施例提供的医疗项目分类方法，所述根据所述多个第二完全图与预设的医疗项目分类图之间的相似性度量，确定所述待分类医疗项目的分类标签，包括：
13.确定所述多个第二完全图与所述医疗项目分类图之间的编辑距离；
14.根据所述编辑距离，确定所述多个第二完全图与所述医疗项目分类图之间的相似性度量；
15.基于所述相似性度量，确定所述待分类医疗项目的分类标签。
16.根据本发明一些实施例提供的医疗项目分类方法，所述基于所述相似性度量，确定所述待分类医疗项目的分类标签，包括：
17.将所述相似性度量中的最大数值作为目标相似性度量，确定所述目标相似性度量对应的第二完全图中的完全子图；
18.根据所述完全子图，确定所述待分类医疗项目的分类标签。
19.根据本发明一些实施例提供的医疗项目分类方法，所述基于所述就诊数据集，确定两两所述待分类医疗项目之间的相似度值，包括：
20.基于所述就诊数据集，统计使用过所述待分类医疗项目的病患人数；
21.根据所述病患人数，确定两两所述待分类医疗项目之间的相似度值。
22.根据本发明一些实施例提供的医疗项目分类方法，所述相似度值由以下公式确定：
[0023][0024]
其中，所述d
ab
表示所述待分类医疗项目a和b之间的相似度值，所述|n(a)|表示使用过所述待分类医疗项目a的病患人数，所述|n(b)|表示使用过所述待分类医疗项目b的病患人数，所述|n(a)∩n(b)|表示使用过所述待分类医疗项目a和b的病患人数。
[0025]
根据本发明一些实施例提供的医疗项目分类方法，所述基于不同的相似度阈值，对所述第一完全图进行剪裁处理，得到多个第二完全图，包括：
[0026]
基于不同的相似度阈值，删除所述第一完全图中权值小于所述相似度阈值的带权边，得到多个第二完全图。
[0027]
根据本发明一些实施例提供的医疗项目分类方法，在所述基于不同的相似度阈值，对所述第一完全图进行剪裁处理，得到多个第二完全图之后，在所述根据所述多个第二完全图与预设的医疗项目分类图之间的相似性度量，确定所述待分类医疗项目的分类标签之前，所述方法还包括：
[0028]
根据所述第二完全图，获取专家分类数据集，所述专家分类数据集包括带有分类标签的已分类医疗项目；
[0029]
以所述已分类医疗项目为顶点，根据所述已分类医疗项目的分类标签确定所述顶点之间的连接关系，构建所述已分类医疗项目之间的医疗项目分类图。
[0030]
为实现上述目的，本技术实施例的第二方面提出了一种医疗项目分类装置，所述装置包括：
[0031]
获取模块，用于获取就诊数据集，所述就诊数据集包括多个病患的就诊数据，每个所述就诊数据包括所述病患就诊的至少一个待分类医疗项目；
[0032]
处理模块，用于基于所述就诊数据集，确定两两所述待分类医疗项目之间的相似度值；
[0033]
构建模块，用于以所述待分类医疗项目为顶点，根据两两所述待分类医疗项目之间的相似度值构造带权边，构建所述待分类医疗项目之间的第一完全图；
[0034]
剪裁模块，用于基于不同的相似度阈值，对所述第一完全图进行剪裁处理，得到多个第二完全图；
[0035]
分类模块，用于根据所述多个第二完全图与预设的医疗项目分类图之间的相似性度量，确定所述待分类医疗项目的分类标签。
[0036]
为实现上述目的，本技术实施例的第三方面提出了一种电子设备，所述电子设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现上述第一方面所述的方法。
[0037]
为实现上述目的，本技术实施例的第四方面提出了一种存储介质，所述存储介质为计算机可读存储介质，用于计算机可读存储，所述存储介质存储有一个或者多个计算机程序，所述一个或者多个计算机程序可被一个或者多个处理器执行，以实现上述第一方面所述的方法。
[0038]
本技术提出一种医疗项目分类方法、装置、设备及介质，所述医疗项目分类方法通过获取包括有多个病患就诊数据的就诊数据集，每个就诊数据包括病患就诊的至少一个待分类医疗项目，基于就诊数据集，确定两两待分类医疗项目之间的相似度值，并以待分类医疗项目为顶点，以相似度值构造带权边，构建待分类医疗项目之间的第一完全图，之后基于不同的相似度阈值，对第一完全图进行剪裁处理，得到多个第二完全图，根据多个第二完全图与预设的医疗项目分类图之间的相似性度量，确定待分类医疗项目的分类标签。本技术实施例基于相似度量并利用预设的医疗项目分类图，补全就诊数据集中未分类医疗项目的标签。
附图说明
[0039]
图1是本技术实施例提供的一种医疗项目分类方法的流程示意图；
[0040]
图2是本技术实施例提供的一种医疗项目分类方法的流程示意图；
[0041]
图3是本技术实施例提供的一种医疗项目分类方法的流程示意图；
[0042]
图4是本技术实施例提供的一种医疗项目分类方法的流程示意图；
[0043]
图5是本技术实施例提供的一种医疗项目分类方法的流程示意图；
[0044]
图6是本技术实施例提供的第一完全图的示意图；
[0045]
图7是本技术实施例提供的第二完全图的示意图；
[0046]
图8是本技术实施例提供的医疗项目分类图的示意图；
[0047]
图9是本技术另一个实施例提供的第二完全图的示意图；
[0048]
图10是本技术另一个实施例提供的医疗项目分类图的示意图；
[0049]
图11是本技术实施例提供的一种医疗项目分类装置的结构示意图；
[0050]
图12是本技术实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
[0051]
为了使本技术的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本技术进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本技术，并不用于限定本技术。
[0052]
需要说明的是，除非另有定义，本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本技术实施例的目的，不是旨在限制本技术。
[0053]
医保支付的审核离不开对数亿患者的就医明细数据进行分析。但是明细数据中的医学项目往往涵盖了检查、手术、化学药、中成药等大类下的数十万类项目代码，想要对类别如此庞大的项目进行后续分析有必要先对其进行分类。
[0054]
然而，医学项目的分类并非简单地划分和打标签。在医学诊疗中，一种项目往往适用于多种疾病，一种项目与不同项目的组合也往往有不同的治疗目的和效果，因此，常见的分类体系从治疗用途出发，将两两之间相关的项目定义为一类。
[0055]
目前业内主要依赖于医学专家提供的分类体系。但专家分类法存在一定局限性：专家分类依赖于很强的医学背景和先验知识，建立和维护的成本都很高；专家体系很难覆盖全部的项目，对于未被专家分类的明细数据则无法进行后续分析，造成大量病案信息的损失；因此，如何提供一种医学项目分类方法，能够对专家分类结果进行学习，拓展项目分类的结果，自动补全未分类项目的标签，成为了亟待解决的技术问题。
[0056]
基于此，本技术实施例提供了一种医疗项目分类方法、装置、电子设备及存储介质，能够基于专家医疗项目分类结果，补全未分类医疗项目的标签。
[0057]
本技术实施例提供的一种医疗项目分类方法、装置、电子设备及存储介质，具体通过如下实施例进行说明，首先描述本技术实施例中的医疗项目分类方法。
[0058]
请参见图1，图1示出了本技术实施例提供的一种医疗项目分类方法的流程示意图。如图1所示，该医疗项目分类方法包括但不限于步骤s110至s150。
[0059]
步骤s110，获取就诊数据集，所述就诊数据集包括多个病患的就诊数据，每个所述就诊数据包括所述病患就诊的至少一个待分类医疗项目。
[0060]
示例性的，通过获取包括有至少一个待分类医疗项目的多个病患就诊数据，形成就诊数据集。
[0061]
步骤s120，基于所述就诊数据集，确定两两所述待分类医疗项目之间的相似度值。
[0062]
可以理解的是，根据就诊数据集中每个病患的就诊数据，可以确定就诊数据中包括的所有待分类医疗项目，获取就诊数据集中关于待分类医疗项目的数据信息，进而确定两两待分类医疗项目之间的相似度值。
[0063]
示例性的，可以通过统计使用过同一个待分类医疗项目的病患人数，或者统计在同个诊断结果下出现每个待分类医疗项目的概率，进而确定两两待分类医疗项目之间的相似度值。
[0064]
需要说明的是，两两待分类医疗项目之间的相似度值，表示从治疗用途的角度出发，两个待分类医疗项目属于一类相关的医疗项目定义的概率值。示例性的，基于就诊数据集确定两两待分类医疗项目之间的相似度值为0至100，其中，相似度值越大表征从治疗用途的角度出发，两个待分类医疗项目属于一类相关的医疗项目定义的概率越大，也就是两个待分类医疗项目在治疗用途上越相似。
[0065]
参见图4，图4示出了本技术实施例提供的一种医疗项目分类方法的流程示意图，如图4所示，在一些实施例中，本技术实施例提供的医疗项目分类方法中步骤s120包括：
[0066]
步骤s410，基于所述就诊数据集，统计使用过所述待分类医疗项目的病患人数。
[0067]
可以理解的是，就诊数据集包括多个病患的就诊数据，每个就诊数据包括所述病患就诊的至少一个待分类医疗项目，基于该就诊数据集可以统计就诊数据中所有待分类医疗项目对应的病患人数。
[0068]
示例性的，就诊数据集包括待分类医疗项目{a,b,c,d,e}，统计使用过待分类医疗项目a、待分类医疗项目b、待分类医疗项目c、待分类医疗项目d和待分类医疗项目e的病患人数，再统计使用过两个待分类医疗项目的病患人数，如使用过待分类医疗项目a和b的病患人数。
[0069]
步骤s420，根据所述病患人数，确定两两所述待分类医疗项目之间的相似度值。
[0070]
可以理解的是，病患人数可以是包括使用过一个待分类医疗项目的病患人数、使用过两个待分类项目的病患人数等，如使用过待分类医疗项目a的病患人数，使用过待分类医疗项目a和b的病患人数。根据两两待分类医疗项目之间的相似度值的定义，也就是相似度值表征两个待分类医疗项目在治疗用途上的相似程度，从而利用病患人数确定两两待分类医疗项目之间的相似度值。
[0071]
在一些实施例中，所述相似度值由以下公式确定：
[0072][0073]
其中，所述d
ab
表示所述待分类医疗项目a和b之间的相似度值，所述|n(a)|表示使用过所述待分类医疗项目a的病患人数，所述|n(b)|表示使用过所述待分类医疗项目b的病患人数，所述|n(a)∩n(b)|表示使用过所述待分类医疗项目a和b的病患人数。
[0074]
示例性的，使用过待分类医疗项目a的病患人数|n(a)|为200，使用过待分类医疗项目b的病患人数|n(b)|为200，使用过待分类医疗项目a和b的病患人数|n(a)∩n(b)|为50，根据上述公式，可以确定待分类医疗项目a和b之间的相似度值d
ab
为0.25。
[0075]
可以理解的是，在上述示例中，若使用过待分类医疗项目a和b的病患人数|n(a)∩n(b)|为100，则待分类医疗项目a和b之间的相似度值d
ab
为0.5。由相似度值的定义可知，在使用过待分类医疗项目a的病患人数和使用过待分类医疗项目b的病患人数不变的情况下，使用过待分类医疗项目a和b的病患人数越多，由上述公式确定的相似度值越大，表示待分类医疗项目a和b在治疗用途上越相似。此外，使用过待分类医疗项目a和b的病患人数不会超过使用过待分类医疗项目a或使用过待分类医疗项目b的病患人数，也就是说，上述公式确定的相似度值的取值范围为0至1。
[0076]
需要说明的是，根据病患人数确定两两待分类医疗项目之间的相似度值，还可以通过其他公式进行计算，如：
[0077][0078]
本技术实施例对此不进行限定。
[0079]
步骤s130，以所述待分类医疗项目为顶点，根据两两所述待分类医疗项目之间的相似度值构造带权边，构建所述待分类医疗项目之间的第一完全图。
[0080]
示例性的，参照图6，图6示出了本技术实施例提供的第一完全图的示意图，如图6所示，第一完全图以待分类医疗项目{a,b,c,d,e}为顶点，根据两两待分类医疗项目之间的相似度值{d
ab
,d
ac
,d
ad
,d
ae
,d
bc
,d
bd
,d
be
,d
cd
,d
ce
,d
de
}构造带权边，构建待分类医疗项目{a,b,c,d,e}之间的第一完全图。
[0081]
在一个具体实施例中，所述医疗项目分类方法获取两两待分类医疗项目之间的相
似度值，构建所有待分类医疗项目之间的相似度矩阵，并根据相似度矩阵，构建待分类医疗项目之间的第一完全图。其中，相似度矩阵中的元素表征两两待分类医疗项目之间的相似度值。
[0082]
示例性的，待分类医疗项目为{a,b,c,d,e}，根据待分类医疗项目之间的相似度值，构建所有待分类医疗项目之间的相似度矩阵a：
[0083][0084]
其中，相似度矩阵中的元素表征两两待分类医疗项目之间的相似度值，如d
cd
表示待分类医疗项目c和d之间的相似度值。
[0085]
需要说明的是，在上述实施例中，通过构建所有待分类医疗项目之间的相似度矩阵，并以此映射出所有待分类医疗项目之间的第一完全图，可以理解的是，相似度矩阵是用于存储第一完全图的数据结构，亦可通过其他数据结构实现，本技术实施例不作限制。
[0086]
步骤s140，基于不同的相似度阈值，对所述第一完全图进行剪裁处理，得到多个第二完全图。
[0087]
可以理解的是，通过定义不同的相似度阈值，对第一完全图进行剪裁处理，得到基于不同相似度阈值进行剪裁处理的多个第二完全图。
[0088]
在一些实施例中，本技术实施例提供的医疗项目分类方法中步骤s140包括：
[0089]
基于不同的相似度阈值，删除所述第一完全图中权值小于所述相似度阈值的带权边，得到多个第二完全图。
[0090]
示例性的，定义相似度阈值d
*
，且相似度值越大表征两个待分类医疗项目在治疗用途的角度上相似，则相似度值d
ab
》d
*
时，确定待分类医疗项目a和b高度相似，按照相似度阈值d
*
对第一完全图进行剪裁，仅保留第一完全图中权值大于相似度阈值d
*
的带权边，也即是删除第一完全图中权值小于相似度阈值d
*
的带权边。
[0091]
参照图7，图7示出了本技术实施例提供的第二完全图的示意图，通过删除如图6所示的第一完全图中权值小于相似度阈值的带权边{d
ac
,d
ad
,d
bd
},得到如图7所示的第二完全图。
[0092]
在一个具体实施例中，当第一完全图通过相似度矩阵映射得到，也就是通过相似度矩阵存储第一完全图，则基于不同的相似度阈值，删除所述第一完全图中权值小于所述相似度阈值的带权边，得到多个第二完全图，包括：
[0093]
基于不同相似度阈值，删除相似度矩阵中小于相似度阈值的元素，得到多个相似度矩阵。
[0094]
可以理解的是，根据不同取值的相似度阈值，删除第一完全图中权值小于所述相似度阈值的带权边，分别得到多个第二完全图。
[0095]
示例性的，待分类医疗项目为{a,b,c,d,e}，两两待分类医疗项目之间的相似度值为{d
ab
,d
ac
,d
ad
,d
ae
,d
bc
,d
bd
,d
be
,d
cd
,d
ce
,d
de
}，构建第一完全图g。基于相似度阈值删除第
一完全图g中权值小于所述相似度阈值的带权边{d
ad
,d
ce
}，得到第二完全图g
′1；基于相似度阈值删除第一完全图g中权值小于所述相似度阈值的带权边{d
ae
,d
bc
}，得到第二完全图g
′2。
[0096]
在一个具体实施例中，所述基于不同的相似度阈值，删除所述第一完全图中权值小于所述相似度阈值的带权边包括：
[0097]
若删除带权边后，存在孤立的顶点，则删除该孤立顶点。
[0098]
可以理解的是，由相似度阈值的定义可知，若一个待分类医疗项目与其他待分类医疗项目高度不相似时，在删除第一完全图中权值小于相似度阈值的带权边后，该待分类医疗项目对应的顶点成为孤立的顶点。
[0099]
示例性的，删除如图6所示的第一完全图中权值小于相似度阈值d
*
的带权边{d
ab
,d
ac
,d
ad
,d
ae
,d
bd
}后，待分类医疗项目a，也就是顶点a成为孤立的顶点，将顶点a删除，得到如图9所示的第二完全图，该第二完全图中包括待分类医疗项目为{b,c,d,e}。
[0100]
步骤s150，根据所述多个第二完全图与预设的医疗项目分类图之间的相似性度量，确定所述待分类医疗项目的分类标签。
[0101]
可以理解的是，根据多个第二完全图与预设的医疗项目分类图之间的相似性度量，将与预设的医疗项目分类图最相似的第二完全图，确定为待分类医疗项目的最终分类结果,从而得到待分类医疗项目的分类标签。
[0102]
需要说明的是，预设的医疗项目分类图基于医疗项目的专家分类结果构建。
[0103]
参见图5，图5示出了本技术实施例提供的一种医疗项目分类方法的流程示意图，如图5所示，在一些实施例中，本技术实施例提供的医疗项目分类方法在步骤s140之后，在步骤s150之前，所述方法还包括：
[0104]
步骤s510，根据所述第二完全图，获取专家分类数据集，所述专家分类数据集包括带有分类标签的已分类医疗项目。
[0105]
需要说明的是，根据第二完全图，也即是根据第二完全图中的待分类医疗项目，获取包括带有分类标签的已分类医疗项目的专家分类数据集。
[0106]
示例性的，如图7所示，第二完全图中的未分类医疗项目为{a,b,c,d,e}，获取得到专家分类数据集中的已分类医疗项目为{a,b,c,d,e}与未分类医疗项目一一对应。
[0107]
示例性的，如图7所示，第二完全图中的未分类医疗项目为{a,b,c,d,e}，获取得到专家分类数据集中的已分类医疗项目{b,c,d,e}，已分类医疗项目{b,c,d,e}是未分类医疗项目为{a,b,c,d,e}的子集。
[0108]
步骤s520，以所述已分类医疗项目为顶点，根据所述已分类医疗项目的分类标签确定所述顶点之间的连接关系，构建所述已分类医疗项目之间的医疗项目分类图。
[0109]
示例性的，如图7所示，第二完全图中的待分类医疗项目为{a,b,c,d,e}，获取得到专家分类数据集中的已分类医疗项目为{a,b,c,d,e}，以已分类医疗项目{a,b,c,d,e}为顶点，根据已分类医疗项目的分类标签确定顶点{a,b,c,d,e}之间的连接关系，构建如图8所示的已分类医疗项目之间的医疗项目分类图
[0110]
示例性的，如图7所示，第二完全图中的待分类医疗项目为{a,b,c,d,e}，获取得到专家分类数据集中的已分类医疗项目{b,c,d,e}，以已分类医疗项目{b,c,d,e}为顶点，根
据已分类医疗项目的分类标签确定顶点{b,c,d,e}之间的连接关系，根据已分类医疗项目的分类标签确定顶点{b,c,d,e}之间的连接关系，构建如图10所示的已分类医疗项目之间的医疗项目分类图
[0111]
可以理解的是，专家分类体系从治疗用途出发，将两两之间相关的医疗项目定义为一类。因此，基于医疗项目属于同一组则两两连通的原理，也就是根据已分类医疗项目的分类标签，可以构造医疗项目分类图。
[0112]
参见图2，图2示出了本技术实施例提供的一种医疗项目分类方法的流程示意图，如图2所示，在一些实施例中，本技术实施例提供的医疗项目分类方法中步骤s150包括：
[0113]
步骤s210，确定所述多个第二完全图与所述医疗项目分类图之间的编辑距离。
[0114]
可以理解的是，当第二完全图中的待分类医疗项目与医疗项目分类图中的的已分类医疗项目相同时，确定该第二完全图与医疗项目分类图之间的编辑距离。
[0115]
示例性的，如图7和图8所示，第二完全图g
′
中的待分类医疗项目为{a,b,c,d,e}，疗项目分类图g
*
中的已分类医疗项目为{a,b,c,d,e}，确定第二完全图g
′
与医疗项目分类图g
*
之间的编辑距离d(g
′
,g
*
)。
[0116]
在一个具体实施例中，当第二完全图中的待分类医疗项目与医疗项目分类图中的已分类医疗项目不相同，根据医疗项目分类图中的已分类医疗项目，对第二完全图进行剪裁，确定剪裁后的第二完全图与医疗项目分类图之间的编辑距离。
[0117]
示例性的，如图7和图10所示，第二完全图g
′
中的待分类医疗项目为{a,b,c,d,e}，医疗项目分类图g
*
中的已分类医疗项目为{b,c,d,e}，则根据已分类医疗项目为{b,c,d,e}，对第二完全图g1’
进行剪裁，得到如图9所示的剪裁后的第二完全图g
″
，第二完全图g
″
中的待分类医疗项目为{b,c,d,e}，确定剪裁后的第二完全图g
″
与医疗项目分类图g
*
之间的编辑距离d(g
″
,g
*
)。
[0118]
需要说明的是，计算两图之间的编辑距离为本领域技术人员所知，在此不作赘述。
[0119]
步骤s220，根据所述编辑距离，确定所述多个第二完全图与所述医疗项目分类图之间的相似性度量。
[0120]
可以理解的是，基于多个第二完全图，得到与医疗项目分类图之间的多个编辑距离。根据多个编辑距离，确定多个第二完全图与医疗项目分类图之间的相似性度量。
[0121]
示例性的，第二完全图g
′
与医疗项目分类图g
*
之间的编辑距离为d(g
′
,g
*
)，则相似性度量s(g
′
,g
*
)＝1/d(g
′
,g
*
)。
[0122]
步骤s230，基于所述相似性度量，确定所述待分类医疗项目的分类标签。
[0123]
参见图3，图3示出了本技术实施例提供的一种医疗项目分类方法的流程示意图，如图3所示，在一些实施例中，本技术实施例提供的医疗项目分类方法中步骤s230包括：
[0124]
步骤s310，将所述相似性度量中的最大数值作为目标相似性度量，确定所述目标相似性度量对应的第二完全图中的完全子图。
[0125]
可以理解的是，根据编辑距离的定义和相似性度量和编辑距离的关系，当第二完全图与医疗项目分类图之间的相似性度量越大时，表征该第二完全图与医疗项目分类图越相似，也就是该第二完全图表征的待分类医疗项目的分类结果与专家分类结果越相似。
[0126]
示例性的，如图7所示的第二完全图g
′
中包括有完全子图g
′
11
、g
′
12
和g
′
13
，其中完全子图g
′
11
包括待分类医疗项目{a,b,e}，完全子图g
′
12
包括待分类医疗项目{b,c,e}，完全
子图g
′
13
包括待分类医疗项目{c,d,e}。
[0127]
需要说明的是，第二完全图经过剪裁，其完全子图中待分类医疗项目满足两两高度相似，可以作为医疗项目分类结果。
[0128]
步骤s320，根据所述完全子图，确定所述待分类医疗项目的分类标签。
[0129]
可以理解的是，将完全子图中的待分类医疗项目视为同一组的医疗项目，也就是完全子图中的待分类医疗项目携带同一分类标签。
[0130]
示例性的，完全子图g
′
11
包括待分类医疗项目{a,b,e}，则待分类医疗项目{a,b,e}为同一组医疗项目，携带同一个分类标签。
[0131]
基于目标相似性度量对应的第二完全图，得到该第二完全图中的完全子图，将完全子图中的待分类医疗项目视为同一组医疗项目，得到第二完全图中待分类医疗项目的分类结果。
[0132]
下面以一个具体实施例描述本技术提供的医疗项目分类方法：
[0133]
获取就诊数据集，就诊数据集包括多个病患的就诊数据，其中，就诊数据包括病患就诊的待分类医疗项目{a,b,c,d,e}，基于就诊数据集，统计使用过待分类医疗项目的病患人数，根据公式：
[0134][0135]
确定两两待分类医疗项目之间的相似度值d，根据待分类医疗项目之间的相似度值d，构建所有待分类医疗项目之间的相似度矩阵a：
[0136][0137]
基于相似度矩阵a构造第一完全图，即以待分类医疗项目{a,b,c,d,e}为顶点，根据相似度值{d
ab
,d
ac
,d
ad
,d
ae
,d
bc
,d
bd
,d
be
,d
cd
,d
ce
,d
de
}构造带权边，构建如图6所示的第一完全图g。定义相似度阈值d
*
，删除第一完全图g中权值小于相似度阈值d
*
的带权边，得到如图7所示的第二完全图g
′
。
[0138]
根据第二完全图g
′
，获取包括带有分类标签的已分类医疗项目的专家分类数据集，以已分类医疗项目为顶点，根据已分类医疗项目的分类标签确定顶点之间的连接关系，构建如图10所示的医疗项目分类图g
*
，根据医疗项目分类图中的已分类医疗项目，对第二完全图g
′
进行剪裁，得到如图9所示的第二完全图g
″
。
[0139]
确定剪裁后的第二完全图g
″
与医疗项目分类图g
*
之间的编辑距离d(g
″
,g
*
)，根据编辑距离d(g
″
,g
*
)，确定第二完全图g
″
与医疗项目分类图g
*
之间的相似性度量s(g
′
,g
*
)＝1/d(g
′
,g
*
)，调整相似度阈值d
*
，裁剪第二完全图得到不同的第二完全图，即基于不同的相似度阈值，对第一完全图进行剪裁处理，得到多个第二完全图。
[0140]
获取基于不同第二完全图的相似性度量，并将相似性度量中的最大数值作为目标相似性度量，确定目标相似性度量对应的第二完全图中的完全子图，将完全子图中的待分
类医疗项目视为同一组医疗项目，得到第二完全图中待分类医疗项目的分类结果，确定待分类医疗项目的分类标签。
[0141]
本技术提出一种医疗项目分类方法，医疗项目分类方法通过获取包括有多个病患就诊数据的就诊数据集，每个就诊数据包括病患就诊的至少一个待分类医疗项目，基于就诊数据集，确定两两待分类医疗项目之间的相似度值，并以待分类医疗项目为顶点，以相似度值构造带权边，构建待分类医疗项目之间的第一完全图，之后基于不同的相似度阈值，对第一完全图进行剪裁处理，得到多个第二完全图，根据多个第二完全图与预设的医疗项目分类图之间的相似性度量，确定待分类医疗项目的分类标签。本技术实施例基于相似度量并利用预设的医疗项目分类图，补全就诊数据集中未分类的医疗项目的标签。
[0142]
进一步可以理解的是，本技术实施例中尽管在附图中以特定的顺序描述操作，但是不应将其理解为要求按照所示的特定顺序或是串行顺序来执行这些操作，或是要求执行全部所示的操作以得到期望的结果。在特定环境中，多任务和并行处理可能是有利的。
[0143]
请参见图11，本技术实施例还提供了一种医疗项目分类装置100，所述医疗项目分类装置100包括：
[0144]
获取模块110，用于获取就诊数据集，所述就诊数据集包括多个病患的就诊数据，每个所述就诊数据包括所述病患就诊的至少一个待分类医疗项目。
[0145]
处理模块120，用于基于所述就诊数据集，确定两两所述待分类医疗项目之间的相似度值。
[0146]
构建模块130，用于以所述待分类医疗项目为顶点，根据两两所述待分类医疗项目之间的相似度值构造带权边，构建所述待分类医疗项目之间的第一完全图。
[0147]
剪裁模块140，用于基于不同的相似度阈值，对所述第一完全图进行剪裁处理，得到多个第二完全图。
[0148]
分类模块150，用于根据所述多个第二完全图与预设的医疗项目分类图之间的相似性度量，确定所述待分类医疗项目的分类标签。
[0149]
本技术提出一种医疗项目分类装置，医疗项目分类装置通过获取模块获取包括有多个病患就诊数据的就诊数据集，每个就诊数据包括病患就诊的至少一个待分类医疗项目，通过处理模块基于就诊数据集，确定两两待分类医疗项目之间的相似度值，并通过构建模块以待分类医疗项目为顶点，以相似度值构造带权边，构建待分类医疗项目之间的第一完全图，之后剪裁模块基于不同的相似度阈值，对第一完全图进行剪裁处理，得到多个第二完全图，最后，分类模块根据多个第二完全图与预设的医疗项目分类图之间的相似性度量，确定待分类医疗项目的分类标签。本技术实施例基于相似度量并利用预设的医疗项目分类图，补全就诊数据集中未分类的医疗项目的标签。
[0150]
需要说明的是，上述装置的模块之间的信息交互、执行过程等内容，由于与本技术方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。
[0151]
请参见图12，图12示出本技术实施例提供的一种电子设备的硬件结构，电子设备包括：
[0152]
处理器210，可以采用通用的cpu(central processing unit，中央处理器)、微处理器、应用专用集合成电路(application specific integrated circuit，asic)、或者一
个或多个集合成电路等方式实现，用于执行相关计算机程序，以实现本技术实施例所提供的技术方案；
[0153]
存储器220，可以采用只读存储器(read only memory，rom)、静态存储设备、动态存储设备或者随机存取存储器(random access memory，ram)等形式实现。存储器220可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器220中，并由处理器210来调用执行本技术实施例的医疗项目分类方法；
[0154]
输入/输出接口230，用于实现信息输入及输出；
[0155]
通信接口240，用于实现本设备与其他设备的通信交互，可以通过有线方式(例如usb、网线等)实现通信，也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信；和总线250，在设备的每个组件(例如处理器210、存储器220、输入/输出接口230和通信接口240)之间传输信息；
[0156]
其中处理器210、存储器220、输入/输出接口230和通信接口240通过总线250实现彼此之间在设备内部的通信连接。
[0157]
本技术实施例还提供了一种存储介质，存储介质为计算机可读存储介质，用于计算机可读存储，存储介质存储有一个或者多个计算机程序，一个或者多个计算机程序可被一个或者多个处理器执行，以实现上述医疗项目分类方法。
[0158]
存储器作为一种计算机可读存储介质，可用于存储软件程序以及计算机可执行程序。此外，存储器可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中，存储器可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0159]
本技术实施例描述的实施例是为了更加清楚的说明本技术实施例的技术方案，并不构成对于本技术实施例提供的技术方案的限定，本领域技术人员可知，随着技术的演变和新应用场景的出现，本技术实施例提供的技术方案对于类似的技术问题，同样适用。
[0160]
以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0161]
本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
[0162]
在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。
[0163]
本技术的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0164]
应当理解，在本技术中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“a和/或b”可以表示：只存在a，只存在b以及同时存在a和b三种情况，其中a，b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。
[0165]
在本技术所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，上述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集合成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
[0166]
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0167]
另外，在本技术每个实施例中的各功能单元可以集合成在一个处理单元中，也可以是每个单元单独物理存在，也可以两个或两个以上单元集合成在一个单元中。上述集合成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
[0168]
集合成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括多指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本技术每个实施例的方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read-only memory，简称rom)、随机存取存储器(random access memory，简称ram)、磁碟或者光盘等各种可以存储程序的介质。
[0169]
以上参照附图说明了本技术实施例的优选实施例，并非因此局限本技术实施例的权利范围。本领域技术人员不脱离本技术实施例的范围和实质内所作的任何修改、等同替换和改进，均应在本技术实施例的权利范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李同巴堃庄伯金
技术所有人：平安科技（深圳）有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。