医疗知识图谱创建方法及相关装置与流程

文档序号:17442576发布日期:2019-04-17 04:58阅读:182来源:国知局
医疗知识图谱创建方法及相关装置与流程

本申请涉及数据处理技术领域,具体涉及一种医疗知识图谱创建方法及相关装置。



背景技术:

随着医疗系统与互联网的逐步结合,医疗系统依靠互联网得到了大力的发展。但是在医疗系统与互联网相结合的同时,也存在着一些需要改进的地方。由于医疗数据比较庞大,现有方案中对数据进行处理时效率较低,从而导致数据管理的难度增加,在医疗数据使用时的便捷性较低。



技术实现要素:

本申请实施例提供一种医疗知识图谱创建方法及相关装置,能够降低医疗数据的管理难度,从而提升医疗数据使用时的便捷性。

本申请实施例的第一方面提供了一种医疗知识图谱创建方法,所述方法包括:

获取目标地域的至少一个医院的医院系统中的医疗数据;

从所述医疗数据中提取多个医疗实体;

通过预设的医疗实体之间的关联关系建立方法,建立所述多个医疗实体之间的关联关系;

根据所述多个医疗实体之间的关联关系,按照预设的知识图谱创建方法创建医疗知识图谱。

本申请实施例的第二方面提供了一种医疗知识图谱创建装置,所述装置包括:

获取单元,用于获取目标地域的至少一个医院的医院系统中的医疗数据;

提取单元,用于从所述医疗数据中提取多个医疗实体;

第一创建单元,用于通过预设的医疗实体之间的关联关系建立方法,建立所述多个医疗实体之间的关联关系;

第二创建单元,用于根据所述多个医疗实体之间的关联关系,按照预设的知识图谱创建方法创建医疗知识图谱。

本申请实施例的第三方面提供一种终端,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如本申请实施例第一方面中的步骤指令。

本申请实施例的第四方面提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。

本申请实施例的第五方面提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

实施本申请实施例,至少具有如下有益效果:

通过本申请实施例,获取目标地域的至少一个医院的医院系统中的医疗数据,从所述医疗数据中提取多个医疗实体,通过预设的医疗实体之间的关联关系建立方法,建立所述多个医疗实体之间的关联关系,根据所述多个医疗实体之间的关联关系,按照预设的知识图谱创建方法创建医疗知识图谱,因此,在对目标地域的至少一个医院中的医疗数据进行提取,得到多个医疗实体,并根医疗实体建立医疗实体之间的关联关系,并依次创建医疗知识图谱,通过医疗知识图谱来管理医疗数据,从而在使用医疗数据时,可通过医疗知识图谱来提取医疗数据,进而能够在一定程度上提升在使用医疗数据时的便捷性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供了一种医疗知识图谱创建方法的应用场景示意图;

图2为本申请实施例提供了一种医疗知识图谱创建方法的流程示意图;

图3为本申请实施例提供了另一种知识图谱创建方法的流程示意图;

图4为本申请实施例提供了另一种知识图谱创建方法的流程示意图;

图5为本申请实施例提供了另一种知识图谱创建方法的流程示意图;

图6为本申请实施例提供了另一种知识图谱创建方法的流程示意图;

图7为本申请实施例提供了另一种知识图谱创建方法的流程示意图;

图8为本申请实施例提供的一种终端的结构示意图;

图9为本申请实施例提供了一种医疗知识图谱创建装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。

本申请实施例所涉及到的电子装置可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(userequipment,ue),移动台(mobilestation,ms),终端设备(terminaldevice)等等。为方便描述,上面提到的设备统称为电子装置。

为了更好的理解本申请实施例提供的医疗知识图谱创建方法,下面首先对医疗知识图谱创建方法进行简要介绍。请参阅图1,图1为本申请实施例提供了一种医疗知识图谱创建方法的应用场景示意图。如图1所示,数据平台101获取目标地域的至少一个医院的医院系统102中的医疗数据,数据平台101在获取医疗数据后,从医疗数据中提取多个医疗实体,医疗实体可包括药品、疾病、症状、检查、电子计算机断层扫描(computedtomography,ct)图片等,数据平台101建立上述多个医疗实体之间的关联关系,例如,疾病与药品之间的关联关系、疾病与症状之间的关联关系等,数据平台101在建立多个医疗实体之间的关联关系后,根据上述多个医疗实体之间的关联关系创建医疗知识图谱,因此,通过医疗知识图谱来管理医疗数据,从而在使用医疗数据时,可通过医疗知识图谱来提取医疗数据,进而能够在一定程度上提升在使用医疗数据时的便捷性。

请参阅图2,图2为本申请实施例提供了一种医疗知识图谱创建方法的流程示意图。如图2所示,医疗知识图谱创建方法包括步骤201-204,具体如下:

201、获取目标地域的至少一个医院的医院系统中的医疗数据。

其中,目标地域中可能只存在一个医院或多个医院,则在获取目标地域的医院的医疗数据时,需要获取该地域中至少一个医院的医疗数据,或者,获取目标地域中具有代表性的一个或多个医院的医疗数据,或者目标地域中所有医院的医疗数据。

可选的,医疗数据可包括:医疗数据信息,医疗数据信息可包括:住院信息、护理信息、药品使用信息、疾病信息、疾病的症状信息、疾病的检查信息、疾病的手术名称信息等,此处仅为举例说明,不作具体限定。

202、从所述医疗数据中提取多个医疗实体。

可选的,医疗实体可包括药品、疾病、症状、检查、手术名称、ct图片等。其中,药品可以从药品使用信息中提取得到,疾病可以从疾病信息中提取得到,症状可以从疾病的症状中提取得到,检查可以从疾病的检查信息中提取得到、手术名称可以从疾病的手术名称信息中提取得到、ct图片可以从疾病的检查信息中提取得到。

可选的,在进行医疗实体提取时,可以对医疗数据进行并行提取,即同时对医疗数据中的多个实体进行提取,例如,可以同时对医疗数据中的药品、疾病、症状等进行提取。

203、通过预设的医疗实体之间的关联关系建立方法,建立所述多个医疗实体之间的关联关系。

可选的,医疗实体包括疾病与ct图片,ct图片中包括ct图片标识,ct图片标识用于标识ct图片所拍摄的部位,一种可能的建立医疗实体之间的关联关系的方法包括步骤a1-a4,具体如下:

a1、对所述ct图片进行特征提取,得到所述ct图片的多个特征值;

其中,对ct图片进行特征提取时,可以是对ct图片进行灰度值提取,得到ct图片的多个灰度值。对ct图片进行灰度值提取时的方法可包括步骤a11-a12,具体如下:

a11、将ct图片按照n*n的矩阵进行区域划分,得到多个区域;

其中,n为正整数,按照n*n的矩阵进行划分后,得到n*n个区域,按照矩阵的形式进行划分时,划分后得到的区域的面积可以是相同的也可以是不同的。一种可能的划分方式为:在对矩阵的第一行进行划分后,识别第一行中每个区域中的灰度值的均值,当第一行的第一个区域或最后一个区域的灰度值的均值大于预设的均值,则将剩余的区域进行非等面积划分。其中预设灰度值为系统中存储的灰度值,可由系统自行设定也可以由用户进行设定。

a12、获取所述多个区域中的每个区域中的像素点的灰度值。

可选的,ct图片中的像素点可以在图片输入后,根据输入的分辨率进行确定,分辨率确定后,则可以由分辨率与像素点之间的关系,得到图像的像素点的个数。

a2、根据所述多个特征值确定出与所述ct图片相对应的疾病信息;

其中,根据多个特征值确定出与ct图片相对应的疾病信息的方法可包括步骤a21-a23,具体如下:

a21、根据每个区域的灰度值,确定出该区域中灰度值区间;

可选的,每个区域中的像素点的灰度值中,存在最大的灰度值和最小的灰度值,则可将灰度最小值和灰度最大值构成的灰度值区间作为该区域的灰度值区间。当然,还可以在确定区间的上限值和下限值时,去掉灰度值中的最大值和最小值,将次大值和次小值作为区间的上限值和下限值。通过上述方法确定灰度值区间,可一定程度上减少在区间确定时的干扰,提升区间确定时的准确性。

可选的,每个区域具有其区域身份信息(identification,id),其区域id可以为其在矩阵中相对应的坐标,坐标例如可以是(1,1)等。

a22、根据所述ct图片标识得到所述ct图片所拍摄的部位;

其中,ct图片标识与ct图片所拍摄的部位之间的映射关系由医院系统在拍摄ct图片时建立。拍摄部位可以为用户身体的任意部位,例如,头部、手部、肺部、心脏等。不同的拍摄部位具有不同的ct图片标识。

a23、提取拍摄部位的预设标准ct图片中每个区域所对应的灰度值区间,根据ct图片中每个区域的灰度值区间与标准ct图片中每个区域所对应的灰度值区间来确定出与ct图片相对应的疾病信息。

其中,预设标准ct图片的区域划分方式与上述ct图片的区域划分方式一致,同时也具有相同的区域id设置方法。

可选的,根据区域id进行灰度值区间比对,即,具有相同的区域id进行灰度值比对,当某个区域中的ct图片的灰度值区间不属于与其对应的标准灰度值区间,则确定出与该区域相对应的疾病信息,将与该区域相对应的疾病信息作为ct图片相对应的疾病信息,因此,一张ct图片可对应多个疾病信息。

其中,每个区域可对应不同的疾病信息,也可以对应相同的疾病信息,例如相邻的区域可对应相同的疾病信息,当然在不同的区域对应疾病信息时,以实际医疗中验证的疾病信息为准,即,在某个区域与标准ct图片中与该区域对应的区域出现异常时,可判定出的疾病信息为准。例如,ct图片对应的部位为鼻部,在ct图片中,鼻窦部位的灰度值区间出现异常,则与其相对应的疾病信息可以为鼻窦发炎、鼻窦溃脓、鼻窦感染等。

a3、根据所述疾病信息,确定出与所述疾病信息相对应的疾病;

其中,以疾病信息为鼻窦发炎、鼻窦溃脓、鼻窦感染为例进行说明,与鼻窦发炎、鼻窦溃脓、鼻窦感染相对应的疾病为鼻窦炎。

a4、确定所述与所述疾病信息相对应的疾病和所述ct图片相关联。

可选的,另一种可能的建立医疗实体之间的关联关系的方法为:将所述多个医疗实体输入到医疗实体关联模型中,通过所述医疗实体关联模型得到所述多个医疗实体之间的关联关系,所述医疗实体关联模型为通过有监督学习模型训练预存的医疗实体之间的关联关系得到。其中,医疗实体关联模型采用机器学习对样本数据进行学习后得到,其中,机器学习模型为有监督学习模型,有监督学习模型例如可以是人工神经网络法中权重模型等,医疗实体关联模型的一种建立方法为:首先将样本进行特征提取,得到特征集,然后将特征集输入训练模型中,训练模型根据训练模型中的算法进行学习,该算法例如可以是梯度下降法、牛顿算法、共轭梯度算法等,最后得到医疗实体关联模型,以此方法,通过对大量的样本的学习,最终得到医疗实体关联模型。通过机器学习模型,对大量的样本进行学习,能够较为准确的确定出医疗实体关联模型,从而提升了在关联关系获取时的准确性。样本数据例如可以是,人为输入的医疗实体之间的关联关系,也可以是采用用爬虫软件在网络中爬取医疗实体之间的关联关系,具体的,爬取工具从百度百科、维基百科等中爬取医疗实体之间的关联关系。其中,预存的医疗实体之间的关联关系也可以为通过人工的方式输入医疗实体之间的关联关系,还可以从药物的说书,医疗器械的说明书及用途中得到的医疗实体之间的关联关系。

204、根据所述多个医疗实体之间的关联关系,按照预设的知识图谱创建方法创建医疗知识图谱。

可选的,一种可能的根据多个医疗实体之间的关联关系创建医疗知识图谱的方法包括步骤b1-b5,具体如下:

b1、对所述多个医疗实体进行特征提取,得到所述多个医疗实体中每个医疗实体的特征数据,所述特征数据包括关键词,所述关键词包括药物名称、疾病名称和/或症状名称;

可选的,多个类别包括:药物类别、疾病类别、症状类别等。对医疗实体进行分类,得到多个类别的方法可以为:提取医疗实体的特征数据,然后根据该特征数据对医疗实体进行分类。其中,特征数据可以为包括关键字的数据,关键字例如可以是疾病名称、药物名称、症状名称等。

b2、按照所述多个医疗实体的特征数据对所述多个医疗实体进行分类,得到多个医疗实体类别;

可选的,根据名称对医疗实体进行分类可以为:若医疗实体名称属于药物类,则将医疗实体作为药物类别,若医疗实体名称属于疾病类,则将医疗实体作为疾病类,若医疗实体名称属于医疗症状,则将医疗实体作为症状类。当然还可以包括其它分类方法,此处仅为举例说明,不做具体限定。

可选的,由于医疗实体具有多样性,则在对医疗实体进行分类时的另一种方法为:以药物名称为例进行说明,可将药物划分为如下第一类别:抗生素类药品、心脑血管用药、消化系统用药、呼吸系统用药、泌尿系统用药、血液系统用药、五官科用药、抗风湿类药品、注射剂类药品、糖尿病用药、激素类药品、皮肤科用药、妇科用药、抗肿瘤用药、抗精神病药品、清热解毒药品、受体激动\阻断药和抗过敏药、滋补类药品、维生素、矿物质药品等。其中在每个类别中,还可以进行进一步分类,以抗生素类药品为例进行说明,抗生素药物可分为如下子类别:头孢菌素类、氨基糖苷类、大环内酯类、四环素类、林可霉素类等。

b3、对所述多个医疗实体类别进行类别标识构建,得到所述多个医疗实体类别的类别标识;

可选的,以第一类别为例,可将类别标识设置为一级类别标识、二级类别标识、三级类别标识等,一级类别标识可以为0001、0002等四位数字的标识,二级类别标识可以为六位数字的标识,例如000001、000002、010000等,三级类别标识可以为为八位数字的标识,例如00000001、00000003、00000005等,如果有后续架构,则均以三级类别标识设置方式进行设定。

b4、通过所述多个医疗实体的类别标识,构建医疗知识图谱架构;

可选的,在构建标识时,可以预先构建医疗知识图谱架构,根据第一类别的个数,构建医疗知识图谱的一级架构,根据第一类别中的每个类别的子类别,构建医疗知识图谱的二级架构,若每个子类别还包括其自身的子类别,则可构建医疗知识图谱的三级架构,以此类推,完成医疗知识图谱架构的建立。

其中,一级架构与一级类别相对应,二级架构与二级类别相对应,三级架构与三级类别相对应,以此一一对应。

b5、将所述多个医疗实体之间的关联关系存储于所述医疗知识图谱架构中,得到医疗知识图谱。

可选的,以实体为索引将多个医疗实体之间的关联关系存储到医疗知识图谱架构中,其中,一种可能的存储方式为,将关联关系与实体存储于图谱中相同的位置。

医疗实体之间的关联关系的存储形式例如可以是“实体—关系—实体”,例如:“药品-关系-疾病”,“药品组—关系—疾病”,“症状—关系—疾病”,“检查—关系—疾病”,“检查—关系—病症”,“疾病—关系—疾病”等,其中,关系可以为改善或恶化、疾病导致某症状(或者某些症状)、检查发现了某症状(或者某些症状),某疾病导致另外某疾病的发生(或者某些疾病),具体可以为:药品与疾病之间关系可以理解为,药品能够对该疾病进行改善或者治愈该疾病,则该药物与疾病之间的关系为改善,反之,药品对该疾病具有恶化作用,则该药物与疾病之间的关系为恶化,当然还有药品对该疾病不产生任何作用,则不列入药品与疾病之间的关系;药品组即,不同的药物的组合,其与疾病之间的关系,可参照药品与疾病之间的关系;症状与疾病的关系可以理解为:与该疾病相对应的症状;检查与疾病之间的关系可以理解为:某种疾病与该疾病相对应的医疗检查,例如,结石,则需要进行ct检查等;疾病与疾病之间的关系可以理解为:一种疾病的发生,会导致另一种疾病的发生。

可选的,另一种可能的根据多个医疗实体之间的关联关系创建医疗知识图谱的方法包括步骤c1-c6,具体如下:

c1、对所述多个医疗实体之间的关联关系进行数据变换处理,得到所述多个医疗实体之间的关联关系的关系标识;

其中,数据变化处理时,以及将关联关系变换为关联关系标识,上述标识具有唯一性,即关联关系具有唯一的关联关系标识。关联关系标识可以按照设的标识进行设定,预设的标识例如可以是a0001、a0002、a0003至a9999之间的任意标识。

c2、对所述多个医疗实体采用预设的分类方法进行分类,得到多个医疗实体类别;

可选的,预设的分类方法可参照步骤b1至b2的分类方法进行分类,当然还可以参照医院系统中预设的分类方法进行分类,得到医疗实体类别。例如,医院肿瘤类、内科类、外科类等。

c3、对所述多个医疗实体类别进行数据变换处理,得到所述多个医疗实体类别的类别标识;

可选的,对医疗实体类别数据进行变换处理,可以按照预设的类别标识设置进行变换处理,预设的类别标识例如可以是001、002至999,不同的类别设置不同的类别标识。

c4、将所述多个医疗实体类别的类别标识进行哈希变换,得到所述多个医疗实体类别的类别标识的哈希值;

c5、将所述多个医疗实体类别的类别标识的哈希值作为医疗知识数据链表的索引,创建医疗知识数据链表;

可选的,医疗知识数据链表为hash散列表,为以散列值排列的双向链表数组。hash散列表包括多个链表,每个链表具有一个节点,每个链表的节点与分类标识相对应。hash散列表包括多个入口,在查询hash值对应的关联关系标识时,需要遍历hash值对应的hash散列表入口指向的链表,其中,hash散列表入口指向的链表可以具有多个链表,链表为关联关系标识。

c6、将所述多个医疗实体之间的关联关系,存储于所述医疗知识数据链表中,得到医疗知识图谱。

在一个可能的示例中,所述医疗实体包括多个疾病,医疗实体之间的关联关系包括多个疾病中的每个疾病之间的关联关系,知识图谱创建方法还可包括步骤d1-d3,具体如下:

d1、接收输入的第一疾病,以及与所述第一疾病相关联的参考关联疾病;

其中,输入的第一疾病可以为用户输入,也可以为系统管理者进行输入,当然也可以具有其它的输入方式。

d2、根据所述医疗知识图谱,得到与所述第一疾病相关联的目标关联疾病;

d3、若所述参考关联疾病与所述目标关联疾病不一致,则将所述参考关联疾病添加到所述第一疾病的关联关系中。

通过上述方法可实现对关联关系进行更新,从而能够一定程度上的提升知识图谱创建后的稳定性,进而能够一定程度上提升知识图谱的实用性。

在一个可能的示例中,所述医疗实体包括药品和疾病,在用户需要自行的根据疾病来获取与该疾病相关的药品时,可采用如下方法获取与该疾病相关联的药品信息,具体可包括步骤e1-e3,如下所示:

e1、接收目标用户输入的第二疾病;

e2、根据所述医疗知识图谱得到与所述第二疾病相关联的药品的药品信息;

其中,根据知识图谱得到与第二疾病相关联的药品的药品信息时,可以将第二疾病直接在知识图谱中进行查找,并提取出与第二疾病相对应的第二疾病与药品之间的关联关系,从第二疾病与药品之间的关联关系中提取“改善”的关联关系的药品,从而得到与第二疾病相关联的药品的药品信息。

e3、将所述与第二疾病相关联的药品的药品信息发送给所述目标用户。

通过知识图谱来获取与疾病相关的药品信息,能够使得用户自行的获取疾病的一些治疗方法,比如一些简单的疾病,一些比较紧急的疾病,则提升用户对疾病进行应急处理的效率,从而能够一定程度上提升用户体验。

请参阅图3,图3为本申请实施例提供了另一种知识图谱创建方法的流程示意图。如图3所示,知识图谱创建方法包括步骤301-306,具体如下:

301、获取目标地域的至少一个医院的医院系统中的医疗数据;

302、从所述医疗数据中提取多个医疗实体;

303、通过预设的医疗实体之间的关联关系建立方法,建立所述多个医疗实体之间的关联关系;

304、对所述多个医疗实体进行特征提取,得到所述多个医疗实体中每个医疗实体的特征数据,所述特征数据包括关键词,所述关键词包括药物名称、疾病名称和/或症状名称;

305、按照所述多个医疗实体的特征数据对所述多个医疗实体进行分类,得到多个医疗实体类别;

306、对所述多个医疗实体类别进行类别标识构建,得到所述多个医疗实体类别的类别标识;

307、通过所述多个医疗实体的类别标识,构建医疗知识图谱架构;

308、将所述多个医疗实体之间的关联关系存储于所述医疗知识图谱架构中,得到医疗知识图谱。

本示例中,通过对医疗实体进行分类,得到多个类别,并通过多个类别来构建医疗知识图谱架构,根据类别来构建医疗知识图谱架构,能够较为清晰的反映出医疗数据的结构,从而能够在使用医疗数据时,更快速的提取医疗数据,提升了医疗数据使用时的便捷性,以及医疗数据分类清晰,一定程度上提升了医疗数据使用时的效率。

请参阅图4,图4为本申请实施例提供了另一种知识图谱创建方法的流程示意图。如图4所示,知识图谱创建方法包括步骤401-405,具体如下:

401、获取目标地域的至少一个医院的医院系统中的医疗数据;

402、从所述医疗数据中提取多个医疗实体;

403、通过预设的医疗实体之间的关联关系建立方法,建立所述多个医疗实体之间的关联关系;

404、对所述多个医疗实体之间的关联关系进行数据变换处理,得到所述多个医疗实体之间的关联关系的关系标识;

405、对所述多个医疗实体采用预设的分类方法进行分类,得到多个医疗实体类别;

406、对所述多个医疗实体类别进行数据变换处理,得到所述多个医疗实体类别的类别标识;

407、将所述多个医疗实体类别的类别标识进行哈希变换,得到所述多个医疗实体类别的类别标识的哈希值;

408、将所述多个医疗实体类别的类别标识的哈希值作为医疗知识数据链表的索引,创建医疗知识数据链表;

409、将所述多个医疗实体之间的关联关系,存储于所述医疗知识数据链表中,得到医疗知识图谱。

本示例中,通过构建医疗知识数据链表,将医疗实体之间的关联关系,存储到该医疗知识数据链表中,得到医疗知识图谱,通过链表的形式来构建医疗知识图谱,在使用医疗数据时,能够提供快捷的医疗数据查询,从而能够一定程度上提升医疗数据使用时的便捷性。

请参阅图5,图5为本申请实施例提供了另一种知识图谱创建方法的流程示意图。如图5所示,知识图谱创建方法包括步骤501-507,具体如下:

501、获取目标地域的至少一个医院的医院系统中的医疗数据;

502、从所述医疗数据中提取多个医疗实体,所述多个医疗实体包括疾病与ct图片;

503、对所述ct图片进行特征提取,得到所述ct图片的多个特征值;

504、根据所述多个特征值确定出与所述ct图片相对应的疾病信息;

505、根据所述疾病信息,确定出与所述疾病信息相对应的疾病;

506、确定所述与所述疾病信息相对应的疾病和所述ct图片相关联;

507、根据所述多个医疗实体之间的关联关系,按照预设的知识图谱创建方法创建医疗知识图谱。

本示例中,医疗实体包括疾病与ct图片,通过ct图片来确定出与该ct图片对应的疾病,并根据确定出的对应关系,来创建医疗知识图谱,通过自动的提取ct图片的特征并确定与ct图片相对应的疾病,能够一定程度上提升关联关系确定时的准确性,同时也能简化了关联关系的获取流程,提升了关联关系获取的准确性,进而提升了医疗知识图谱的准确性。

请参阅图6,图6为本申请实施例提供了另一种知识图谱创建方法的流程示意图。如图6所示,知识图谱创建方法包括步骤601-607,具体如下:

601、获取目标地域的至少一个医院的医院系统中的医疗数据;

602、从所述医疗数据中提取多个医疗实体,所述多个医疗实体包括多个疾病;

603、通过预设的医疗实体之间的关联关系建立方法,建立所述多个医疗实体之间的关联关系,所述医疗实体之间的关联关系包括所述多个疾病中的每个疾病之间的关联关系;

604、根据所述多个医疗实体之间的关联关系,按照预设的知识图谱创建方法创建医疗知识图谱;

605、接收输入的第一疾病,以及与所述第一疾病相关联的参考关联疾病;

606、根据所述医疗知识图谱,得到与所述第一疾病相关联的目标关联疾病;

607、若所述参考关联疾病与所述目标关联疾病不一致,则将所述参考关联疾病添加到所述第一疾病的关联关系中。

本示例中,通过接收输入的第一疾病以及与第一相关联的参考关联疾病,通过将第一疾病输入到医疗知识图谱中,得到与第一疾病相对应的目标关联疾病,通过比对参考关联疾病与目标关联疾病是否一致,来对第一疾病的关联关系进行更新,以此,通过上述更新机制,能够一定程度上提升医疗知识图谱的可靠性。

请参阅图7,图7为本申请实施例提供了另一种知识图谱创建方法的流程示意图。如图7所示,知识图谱创建方法包括步骤701-707,具体如下:

701、获取目标地域的至少一个医院的医院系统中的医疗数据;

702、从所述医疗数据中提取多个医疗实体,所述多个医疗实体包括药品和疾病;

703、通过预设的医疗实体之间的关联关系建立方法,建立所述多个医疗实体之间的关联关系,所述多个医疗实体之间的关联关系包括疾病和药品之间的关联关系;

704、根据所述多个医疗实体之间的关联关系,按照预设的知识图谱创建方法创建医疗知识图谱;

705、接收目标用户输入的第二疾病;

706、根据所述医疗知识图谱得到与所述第二疾病相关联的药品的药品信息;

707、将所述与第二疾病相关联的药品的药品信息发送给所述目标用户。

本示例中,在医疗知识图谱构建完成后,接收目标用户输入的第二疾病,通过医疗知识图谱得到与第二疾病相关联的药品的药品信息,并将该药品信息发送给目标用户,能够使得用户自行的获取疾病的一些治疗方法,比如一些简单的疾病,一些比较紧急的疾病,则提升用户对疾病进行应急处理的效率,从而能够一定程度上提升用户体验。

与上述实施例一致的,请参阅图8,图8为本申请实施例提供的一种终端的结构示意图,如图所示,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,上述程序包括用于执行以下步骤的指令;

获取目标地域的至少一个医院的医院系统中的医疗数据;

从所述医疗数据中提取多个医疗实体;

通过预设的医疗实体之间的关联关系建立方法,建立所述多个医疗实体之间的关联关系;

根据所述多个医疗实体之间的关联关系,按照预设的知识图谱创建方法创建医疗知识图谱。

通过本申请实施例,获取目标地域的至少一个医院的医院系统中的医疗数据,从所述医疗数据中提取多个医疗实体,通过预设的医疗实体之间的关联关系建立方法,建立所述多个医疗实体之间的关联关系,根据所述多个医疗实体之间的关联关系,按照预设的知识图谱创建方法创建医疗知识图谱,因此,在对目标地域的至少一个医院中的医疗数据进行提取,得到多个医疗实体,并根医疗实体建立医疗实体之间的关联关系,并依次创建医疗知识图谱,通过医疗知识图谱来管理医疗数据,从而在使用医疗数据时,可通过医疗知识图谱来提取医疗数据,进而能够在一定程度上提升在使用医疗数据时的便捷性。

上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,终端为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法示例对终端进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

与上述一致的,请参阅图9,图9为本申请实施例提供了一种医疗知识图谱创建装置的结构示意图。如图9所示,所述装置包括获取单元901、提取单元902、第一创建单元903和第二创建单元904,其中,

获取单元901,用于获取目标地域的至少一个医院的医院系统中的医疗数据;

提取单元901,用于从所述医疗数据中提取多个医疗实体;

第一创建单元903,用于通过预设的医疗实体之间的关联关系建立方法,建立所述多个医疗实体之间的关联关系;

第二创建单元904,用于根据所述多个医疗实体之间的关联关系,按照预设的知识图谱创建方法创建医疗知识图谱。

通过本申请实施例,获取目标地域的至少一个医院的医院系统中的医疗数据,从所述医疗数据中提取多个医疗实体,通过预设的医疗实体之间的关联关系建立方法,建立所述多个医疗实体之间的关联关系,根据所述多个医疗实体之间的关联关系,按照预设的知识图谱创建方法创建医疗知识图谱,因此,在对目标地域的至少一个医院中的医疗数据进行提取,得到多个医疗实体,并根医疗实体建立医疗实体之间的关联关系,并依次创建医疗知识图谱,通过医疗知识图谱来管理医疗数据,从而在使用医疗数据时,可通过医疗知识图谱来提取医疗数据,进而能够在一定程度上提升在使用医疗数据时的便捷性。

可选的,在所述根据所述多个医疗实体之间的关联关系,按照预设的知识图谱创建方法创建医疗知识图谱方面,所述第二创建单元904具体用于:

对所述多个医疗实体进行特征提取,得到所述多个医疗实体中每个医疗实体的特征数据,所述特征数据包括关键词,所述关键词包括药物名称、疾病名称和/或症状名称;

按照所述多个医疗实体的特征数据对所述多个医疗实体进行分类,得到多个医疗实体类别;

对所述多个医疗实体类别进行类别标识构建,得到所述多个医疗实体类别的类别标识;

通过所述多个医疗实体的类别标识,构建医疗知识图谱架构;

将所述多个医疗实体之间的关联关系存储于所述医疗知识图谱架构中,得到医疗知识图谱

可选的,在所述根据所述多个医疗实体之间的关联关系,按照预设的知识图谱创建方法创建医疗知识图谱方面,所述第二创建单元904还具体用于:

对所述多个医疗实体之间的关联关系进行数据变换处理,得到所述多个医疗实体之间的关联关系的关系标识;

对所述多个医疗实体采用预设的分类方法进行分类,得到多个医疗实体类别;

对所述多个医疗实体类别进行数据变换处理,得到所述多个医疗实体类别的类别标识;

将所述多个医疗实体类别的类别标识进行哈希变换,得到所述多个医疗实体类别的类别标识的哈希值;

将所述多个医疗实体类别的类别标识的哈希值作为医疗知识数据链表的索引,创建医疗知识数据链表;

将所述多个医疗实体之间的关联关系,存储于所述医疗知识数据链表中,得到医疗知识图谱。

可选的,所述多个医疗实体包括疾病与ct图片,在所述通过预设的医疗实体之间的关联关系建立方法,建立所述多个医疗实体之间的关联关系方面,所述第一创建单元903具体用于:

对所述ct图片进行特征提取,得到所述ct图片的多个特征值;

根据所述多个特征值确定出与所述ct图片相对应的疾病信息;

根据所述疾病信息,确定出与所述疾病信息相对应的疾病;

确定所述与所述疾病信息相对应的疾病和所述ct图片相关联。

可选的,在所述通过预设的医疗实体之间的关联关系建立方法,建立所述多个医疗实体之间的关联关系方面,所述第一创建单元903还具体用于:

将所述多个医疗实体输入到医疗实体关联模型中,通过所述医疗实体关联模型得到所述多个医疗实体之间的关联关系,所述医疗实体关联模型为通过有监督学习模型训练预存的医疗实体之间的关联关系得到。

可选的,所述多个医疗实体包括多个疾病,所述多个医疗实体之间的关联关系包括所述多个疾病中的每个疾病之间的关联关系,所述医疗知识图谱创建装置还具体用于:

接收输入的第一疾病,以及与所述第一疾病相关联的参考关联疾病;

根据所述医疗知识图谱,得到与所述第一疾病相关联的目标关联疾病;

若所述参考关联疾病与所述目标关联疾病不一致,则将所述参考关联疾病添加到所述第一疾病的关联关系中。

可选的,所述多个医疗实体包括药品和疾病,所述多个医疗实体之间的关联关系包括疾病和药品之间的关联关系,所述医疗知识图谱创建装置还具体用于:接收目标用户输入的第二疾病;

根据所述医疗知识图谱得到与所述第二疾病相关联的药品的药品信息;

将所述与第二疾病相关联的药品的药品信息发送给所述目标用户。

本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种医疗知识图谱创建方法的部分或全部步骤。

本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种医疗知识图谱创建方法的部分或全部步骤。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在申请明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。

所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器、随机存取器、磁盘或光盘等。

以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1