糖尿病足知识图谱生成方法、装置及可读存储介质与流程

文档序号:21280097发布日期:2020-06-26 23:32阅读:183来源:国知局
糖尿病足知识图谱生成方法、装置及可读存储介质与流程

本申请涉及数据处理技术领域,具体而言,涉及一种糖尿病足知识图谱生成方法、装置及可读存储介质。



背景技术:

随着医疗系统与互联网的逐步结合,医疗系统依靠互联网得到了大力的发展。由于医疗数据越来越庞大,蕴含着许多有价值的信息资源,于是可以通过分析医疗数据来挖掘这些有价值的信息。

医疗数据具有模式多态性、不完整性、时间性、冗余性和隐私性等特点,对数据挖掘工作构成了挑战,尤其其中的非结构化数据更是难以分析,所以针对结构化的医疗数据做数据挖掘,是医疗数据挖掘的一个突破口。

知识图谱是一种结构化数据,利用知识图谱,可以方便地进行搜索、预测等操作。知识图谱与数据挖掘相结合,越来越受到人们的重视,在医学领域,主要依靠医生手动构建医疗知识图谱,但是,人工构建知识图谱的工作量非常大,需要耗费大量的人力资源。



技术实现要素:

本申请实施例的目的在于提供一种糖尿病足知识图谱生成方法、装置及可读存储介质,用以改善现有技术中构建知识图谱工作量大的问题。

第一方面,本申请实施例提供了一种糖尿病足知识图谱生成方法,所述方法包括:

获取糖尿病足相关领域的疾病语料数据;

从所述疾病语料数据中提取多个疾病实体;

获取每个疾病实体的属性信息,所述属性信息用于表征每个疾病实体的特征信息;

利用所述属性信息构建所述多个疾病实体之间的关联关系;

基于所述关联关系创建所述糖尿病足的知识库;

将所述糖尿病足的知识库与预先创建的知识图谱架构进行关联,生成所述糖尿病足的知识图谱。

在上述实现过程中,通过构建糖尿病足的知识库,然后将知识库与预先创建的知识图谱架构进行关联,从而生成知识图谱,这样在构建各种疾病的知识图谱时,可直接基于知识图谱架构进行构建即可,如此可更加快速、更加方便地构建知识图谱。

可选地,所述将所述糖尿病足的知识库与预先创建的知识图谱架构进行关联,生成所述糖尿病足的知识图谱,包括:

将所述糖尿病足的知识库中的各个知识点添加到所述知识图谱架构中的相应节点中,生成所述糖尿病足的知识图谱。

在上述实现过程中,直接将各个知识点添加到知识图谱架构中,可无需在创建知识图谱架构,从而可以快速生成糖尿病足的知识图谱。

可选地,所述从所述疾病语料数据中提取多个疾病实体,包括:

从所述疾病语料数据中提取多个初始疾病实体;

对所述多个初始疾病实体进行筛选,获得筛选后的所述多个疾病实体。

在上述实现过程中,对多个初始疾病实体进行筛选,以筛选掉不满足要求的实体,使得后续参与构建知识库的无用数据较少,构建的知识库更加准确。

可选地,所述对所述多个初始疾病实体进行筛选,获得剩余的多个疾病实体,包括:

统计每个初始疾病实体在所述疾病语料数据中出现的次数;

将出现的次数小于预设次数的初始疾病实体从所述多个初始疾病实体中删除,将获得的剩余的初始疾病实体作为筛选后的所述多个疾病实体。

在上述实现过程中,将出现次数小于预设次数的初始疾病实体删除,如此可剔除一些无用的疾病实体,使得剩余的疾病实体为有用的疾病实体。

可选地,所述从所述疾病语料数据中提取多个疾病实体,包括:

采用双向长短期记忆网络-条件随机场bilstm-crf模型识别所述疾病语料数据中的多个疾病实体。

在上述实现过程中,采用bilstm-crf模型可准确且快速识别出疾病语料数据中的多个疾病实体。

可选地,所述生成所述糖尿病足的知识图谱之后,还包括:

利用同义词词林以及word2vec算法获取各个疾病实体以及属性信息的同义词;

将所述同义词添加到所述糖尿病足的知识库中。

在上述实现过程中,通过获取同义词,可对糖尿病足的知识库进行扩充,使得知识库的知识点更加丰富。

可选地,所述生成所述糖尿病足的知识图谱之后,还包括:

利用neo4j以及mongodb数据库存储所述糖尿病足的知识图谱,可便于对数据的搜索。

可选地,所述生成所述糖尿病足的知识图谱之后,还包括:

获取用户输入的有关所述糖尿病足的查询信息;

基于所述查询信息从所述糖尿病足的知识图谱中查找与所述查询信息相关的疾病知识信息;

将所述疾病知识信息输出给所述用户。

在上述实现过程中,利用知识图谱进行信息搜索,可便于用户自助进行快速地疾病知识查询。

第二方面,本申请实施例提供了一种糖尿病足知识图谱生成装置,所述装置包括:

数据获取模块,用于获取糖尿病足相关领域的疾病语料数据;

实体提取模块,用于从所述疾病语料数据中提取多个疾病实体;

属性获取模块,用于获取每个疾病实体的属性信息,所述属性信息用于表征每个疾病实体的特征信息;

关系构建模块,用于利用所述属性信息构建所述多个疾病实体之间的关联关系;

知识库获取模块,用于基于所述关联关系创建所述糖尿病足的知识库;

知识图谱生成模块,用于将所述糖尿病足的知识库与预先创建的知识图谱架构进行关联,生成所述糖尿病足的知识图谱。

可选地,所述知识图谱生成模块,用于将所述糖尿病足的知识库中的各个知识点添加到所述知识图谱架构中的相应节点中,生成所述糖尿病足的知识图谱。

可选地,所述实体提取模块,用于从所述疾病语料数据中提取多个初始疾病实体;对所述多个初始疾病实体进行筛选,获得筛选后的所述多个疾病实体。

可选地,所述实体提取模块,用于统计每个初始疾病实体在所述疾病语料数据中出现的次数;将出现的次数小于预设次数的初始疾病实体从所述多个初始疾病实体中删除,将获得的剩余的初始疾病实体作为筛选后的所述多个疾病实体。

可选地,所述实体提取模块,用于采用双向长短期记忆网络-条件随机场bilstm-crf模型识别所述疾病语料数据中的多个疾病实体。

可选地,所述装置,还包括:

知识库扩充模块,用于利用同义词词林以及word2vec算法获取各个疾病实体以及属性信息的同义词;将所述同义词添加到所述糖尿病足的知识库中。

可选地,所述装置,还包括:

存储模块,用于利用neo4j以及mongodb数据库存储所述糖尿病足的知识图谱。

可选地,所述装置,还包括:

信息查询模块,用于获取用户输入的有关所述糖尿病足的查询信息;基于所述查询信息从所述糖尿病足的知识图谱中查找与所述查询信息相关的疾病知识信息;将所述疾病知识信息输出给所述用户。

第三方面,本申请实施例提供一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的所述方法中的步骤。

第四方面,本申请实施例提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。

本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的一种用于执行上述糖尿病足知识图谱生成方法的电子设备的结构示意图;

图2为本申请实施例提供的一种糖尿病足知识图谱生成方法的流程图;

图3为本申请实施例提供的一种知识图谱架构的示意图;

图4为本申请实施例提供的一种糖尿病足知识图谱的第一示意图;

图5为本申请实施例提供的一种糖尿病足知识图谱的第二示意图;

图6为本申请实施例提供的一种糖尿病足知识图谱的第三示意图;

图7为本申请实施例提供的一种糖尿病足知识图谱的第四示意图;

图8为本申请实施例提供的一种糖尿病足知识图谱的第五示意图;

图9为本申请实施例提供的一种糖尿病足知识图谱的第六示意图;

图10为本申请实施例提供的一种糖尿病足知识图谱的第七示意图;

图11为本申请实施例提供的一种糖尿病足知识图谱的第八示意图;

图12为本申请实施例提供的一种糖尿病足知识图谱的完整示意图;

图13为本申请实施例提供的一种糖尿病足知识图谱生成装置的结构框图。

具体实施方式

下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述。

本申请实施例提供一种糖尿病足知识图谱生成方法,通过构建针对糖尿病足的知识库,然后将糖尿病足的知识库与预先创建的知识图谱架构进行关联,以生成糖尿病足的知识图谱,这样在构建糖尿病足的知识图谱时,可无需每次都需获取知识图谱架构中的相关内容,从而可更加快速、更加方便构建糖尿病足的知识图谱,节省知识图谱的构建时间。

请参照图1,图1为本申请实施例提供的一种用于执行上述糖尿病足知识图谱生成方法的电子设备的结构示意图,所述电子设备可以包括:至少一个处理器110,例如cpu,至少一个通信接口120,至少一个存储器130和至少一个通信总线140。其中,通信总线140用于实现这些组件直接的连接通信。其中,本申请实施例中设备的通信接口120用于与其他节点设备进行信令或数据的通信。存储器130可以是高速ram存储器,也可以是非易失性的存储器(non-volatilememory),例如至少一个磁盘存储器。存储器130可选的还可以是至少一个位于远离前述处理器的存储装置。存储器130中存储有计算机可读取指令,当所述计算机可读取指令由所述处理器110执行时,电子设备执行下述图2所示方法过程,例如,存储器130可用于存储糖尿病足的疾病语料数据、知识图谱架构以及生成的知识图谱等信息,处理器110可用于从存储器中获取疾病语料数据,然后从中提取疾病实体,生成知识图谱等。

可以理解,图1所示的结构仅为示意,所述电子设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。

请参照图2,图2为本申请实施例提供的一种糖尿病足知识图谱生成方法的流程图,该方法包括如下步骤:

步骤s110:获取糖尿病足相关领域的疾病语料数据。

其中,疾病语料数据是指与糖尿病足相关的领域的一些数据,可以理解地,其相关领域的疾病语料数据可以是指糖尿病足所在的疾病领域的数据、糖尿病足对应的饮食领域的饮食数据、各个医院针对糖尿病足的医疗数据以及对糖尿病足的相关研究数据等等,如糖尿病足为糖尿病时,其疾病语料数据可以包括糖尿病的症状数据、治疗药物数据以及饮食数据等。

另外,疾病语料数据可以通过爬虫工具从网络中爬取获得,或者可以从医疗数据库中获取,或者还可以通过其他方式获取,本申请实施例中不做特别限制。

步骤s120:从所述疾病语料数据中提取多个疾病实体。

实体是指具有可区别性且独立存在的某种事物,是对客观个体的抽象,实体是知识图谱中的最基本元素,不同的实体间存在不同的关系。疾病实体是从疾病语料库中提取的实体,其可以包括药品、疾病、症状、图片、治疗效果、饮食等等。所以,可从疾病语料数据中识别出这些疾病实体名称,以从中提取出各个疾病实体。

步骤s130:获取每个疾病实体的属性信息,所述属性信息用于表征每个疾病实体的特征信息。

属性信息可用于表征每个实体的特征信息,例如,对于某个实体为“胰岛素”,其属性信息可以是“白色的结晶粉末”以及“降低血糖的激素”等信息,所以,针对每个实体,均可获得其每个实体的属性信息。

其中,可以基于百科类网站的半结构化数据,通过自动抽取生成训练语料,用于训练实体属性标注模型,如神经网络模型等,然后将其应用于对非结构化数据的实体的属性信息的抽取,如此可获得每个实体的属性信息。

属性信息可以包括属性以及属性值,如上述的属性为降低血糖的激素,属性值即可为能降血糖的具体数值,属性值用于对属性进行具体的数学描述。将属性和属性值均作为实体之间的关联关系的构建基础,使得可以更加丰富各个实体之间的关系。

步骤s140:利用所述属性信息构建所述多个疾病实体之间的关联关系。

属性可以用于对实体与实体之间的关系进行抽象描述,如可以将具有相同或相似属性信息的实体进行关联,或者可将多个疾病实体基于属性信息进行关联,从而可构建多个疾病实体之间的关联关系。

步骤s150:基于所述关联关系创建所述糖尿病足的知识库。

通过关联关系可以将各个疾病实体关联起来,如此可形成网状的知识结构,这个知识结构即可作为糖尿病足的知识库。

步骤s160:将所述糖尿病足的知识库与预先创建的知识图谱架构进行关联,生成所述糖尿病足的知识图谱。

知识库中存储有多个知识点,这些知识点包括各个实体以及各个实体对应的属性信息,知识图谱架构用于构建知识图谱,其是对知识图谱的结构描述,所以,可以按照关联关系将知识库与知识图谱架构进行关联,如此可生成糖尿病足的知识图谱。

在上述实现过程中,通过构建糖尿病足的知识库,然后将知识库与预先创建的知识图谱架构进行关联,从而生成知识图谱,这样在构建糖尿病足的知识图谱时,可直接基于知识图谱架构进行构建即可,如此可更加快速、更加方便地构建知识图谱。

下面先对知识图谱架构进行介绍。

本申请实施例中提供的知识图谱架构可以是基于知网的知识库架构进行构建的,在知网的知识库架构中,实体通过节点体现,利用实体之间的关联关系可以将各个具有关联关系的实体通过连线进行连接。本申请实施例中将属性从知网的知识库架构中独立出来作为单独的节点,这样便能通过属性对实体进行关联。同时将属性和属性值进行分离,从而一个属性可以关联多个属性值,一个属性值也可以对应多个属性,形成多对多的关系,在操作属性和属性值的关系时只需要更改连线即可。通过删繁就简最终将知网的知识库架构整合为事件、实体、属性和属性值四大结构,其中,根节点为虚拟节点,整个知识图谱架构如图3所示。

在构建上述的知识图谱架构后,为了生成糖尿病足的知识图谱,可以将糖尿病足的知识库中的各个知识点与知识图谱架构中的相应节点进行关联,生成所述糖尿病足的知识图谱。

可以理解地,所述知识图谱架构中包括多个用于描述实体以及属性信息的节点,如图3中事件节点包括静态和行动两大类别,其中静态包括状态和关系两大子类,糖尿病足的疼等特征作为疾病的状态位于状态类的子类病态类的节点下,所以,可以从糖尿病足的知识库中获取疼等实体,将其添加到知识图谱架构中的相应节点下,以实现和知识图谱架构的关联,如图4所示。

在将知识点添加到知识图谱架构中后,可生成新的节点,如节点疼,节点疼包括了属性疼的程度,所以可以跟属性中程度属性进行关联,从而将事件和属性关联起来,如图5所示。

糖尿病足相关的所有实体均在病态节点之下添加,后续可通过word2vec算法对其进行扩充,也可以对病态节点下的节点进行归类,如分为糖尿病足病态、皮肤病病态等。

行动类包括实动和泛动两大类别,行动类是造成关系和状态变化的动力,即行动类节点的改变可造成实体节点之间关联关系的改变,其中关于糖尿病足的治疗措施“截骨术”可添加到实动类别下的医治节点下,如图6所述,后续所有的关于糖尿病足或是其他疾病的医治手段都可以在此节点下进行添加。

实体节点是对客观世界的描述,它可包括万物、时间和空间三个子类,其中糖尿病足位于万物的子节点疾病的类别下,如图7所示,后续所有关于疾病类的信息都可填充到疾病节点下。

若糖尿病足的相关信息过多,为了防止糖尿病的下属节点过于臃肿,可以将糖尿病足作为单独的业务数据库进行分离,分离后糖尿病足库作为糖尿病足节点的值域进行关联,如图8所示。

作为治疗糖尿病足的药物胰岛素位于物质节点下的药物节点下,可将糖尿病足库中治疗节点的属性治疗手段和治疗药物分别与事件中的截骨术节点和实体节点内的胰岛素节点进行关联,如图9所示。

任何事物都包含有多种属性,事物之间的异或同时由属性决定的,没有了属性就没有了事物,其包括外观、量度、特性、关系和状态,糖尿病足的症状疼的程度属性关联到属性节点的子节点程度节点中,如图10所示,后续其他属性可在相应的节点进行增加即可。

属性由属性值体现,属性值节点和属性节点类别一一对应包括外观值、亮度值、特性值、关系值和状态值,属性值作为属性的值域关系存在,糖尿病足的程度属性关联到属性值中对应的程度值节点,如图11所示,后续属性对应的属性值在属性值对应的节点进行添加即可。

如此,可按照上述的方式将糖尿病足的知识库中的各个知识点添加到知识图谱架构中的相应节点中,然后按照各个疾病实体之间的关联关系将相应节点通过值域进行关联,可生成糖尿病足的知识图谱,如图12所示。

由于糖尿病足的知识库是基于实体之间的关联关系创建的,则知识库中包括各个实体之间的关联关系,所以,在生成糖尿病足的知识图谱时,可以通过关联关系将知识图谱架构中的相关节点进行关联,进而可快速生成糖尿病足的知识图谱。

需要说明的是,针对不同的疾病,均可以按照上述方式生成疾病的知识图谱,其基本的知识图谱架构不变,这种知识图谱架构可以更直观体现出各个疾病实体之间的关联关系,使得在进行信息搜索时,可以快速获得想要查询的信息。

作为一种实施方式,由于疾病语料数据中的数据较多,其提取的疾病实体数量较大,而有的疾病实体可能并没有实际作用,所以还可以对疾病实体进行筛选,以减少参与知识图谱构建的数据量,提高构建效率。如可以先从疾病语料数据中提取多个初始疾病实体,然后对多个初始疾病实体进行筛选,获得筛选后的多个疾病实体。

例如,可以将多个初始疾病实体中不符合要求的疾病实体删除,或者将一些不是关于疾病的实体删除,或者还可以将在疾病语料数据中出现次数较少的疾病实体删除。

在将出现次数较少的疾病实体进行删除的实现过程中,可以先统计每个初始疾病实体在疾病语料数据中出现的次数,然后将出现的次数小于预设次数的初始疾病实体从多个初始疾病实体中删除,将获得的剩余的初始疾病实体作为筛选后的多个疾病实体。

其中,预设次数可以根据实际需求灵活设置,即将出现次数大于或等于预设次数的多个初始疾病实体作为筛选后的多个疾病实体,表明这些疾病实体在疾病语料数据中出现的次数较多,其可能是该疾病领域出现较频繁的实体,这样使得参与构建知识库的无用数据减少,提高了知识库创建的效率。

作为一种实施方式,为了便于快速从疾病语料数据中提取多个疾病实体,作为一种实施方式,可以采用双向长短期记忆网络-条件随机场(bidirectionallongshorttermmemory-conditionalrandomfield,bilstm-crf)模型识别疾病语料数据中的多个疾病实体。

其中,bilstm-crf模型一般包括三个部分:词表示、上下文单词表示和解码,其中,词表示是使用紧密向量表示每个词,记载预先训练好的词向量,上下文单词表示是对上下文中的每一个词,需要有一个有意义的向量表示,使用bilstm模型来获取上下文中词的向量表示,解码是用于进行实体标签的预测。

词向量表示:对每一个词,需要构建一个向量来获取这个词的意思以及对实体识别有用的一些特征,这个向量由glove训练的词向量和从文本中提取出特征的向量堆叠而成,一个选择是使用手动提取的特征,例如特征词典等,另一种更好的选择是使用某种神经网络来自动提取特征,在本申请实施例中,使用bilstm,当然,也可以使用其他循环神经网络等。

组成一个词的每个字都由一个向量表示,对每个字使用bilstm,并将最后状态堆叠起来获得一个固定长度的向量,然后将词向量和字向量合并,获得这个词最终的向量表示。

在获得每个词最终的向量表示后,对词向量的序列进行bilstm,其中可使用每一个时间点的隐藏状态,而不仅仅是最终状态,输入m个词向量,获得m个隐藏状态的向量,词向量只是包含词级别的信息,而隐藏状态的向量考虑了上下文,从而可获得词的上下文表示。

在解码阶段使用每个词对应的隐藏状态向量来做最后预测,可以使用一个全连接神经网络来获得每个实体的得分,然后找到得分最高的序列。

另外,可预先对bilstm-crf模型进行训练,利用训练好的模型来识别疾病语料数据中的多个疾病实体,从而可快速从疾病语料数据中获取多个疾病实体。

作为一种实施方式,在上述生成糖尿病足的知识库之后,为了在对知识库进行扩充,还可以利用同义词词林以及word2vec算法获取各个疾病实体以及属性信息的同义词,然后将同义词添加到糖尿病足的知识库中。

其中,同义词词林是对词进行了同义词归类,获得糖尿病足的知识库中各个知识点的同义词后,可将同义词添加到知识图谱架构中的相应节点中,如症状疼在同义词词林中有“痛、疼痛、火辣辣、生疼、触痛、作痛、隐隐作痛”,从而可利用cypher语法将它们作为“疼”的同义词属性的属性值进行存储。

word2vec算法是指词向量算法,是一个将单词转换为成向量形式的工具,其可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度,通过word2vec算法可以计算出知识图谱中各个节点的相关词,因而可以将节点的相关词添加到知识库中,从而填充知识库。

例如,可以利用现有的维基百科训练的词向量,也可基于医疗领域的语料利用word2vec工具进行训练得到词向量。遍历知识库中的节点,利用word2vec统计出与节点之间相似度大于阈值的词,并将该词作为节点的属性值进行存储从而扩展知识库。如节点“疼”,利用word2vec计算与它相似度大于0.8的词有“疼痛、痛”,则可利用cypher语法将这两个词作为节点“疼”的同义词属性的属性值存储到知识库中。

在上述实现过程中,通过获取同义词,可对糖尿病足的知识库进行扩充,使得知识库的知识点更加丰富。

另外,为了便于对知识图谱进行存储,还可以利用neo4j以及mongodb数据库存储所述糖尿病足的知识图谱。

neo4j是一种图像数据库,neo4j是一个原生图计算引擎,其存储和使用的数据自始至终都是使用原生的图结构数据进行处理的,所以,使用基于neo4j图像数据库进行知识图谱存储可以提高知识图谱的性能,能快速存储数据,实现实时响应,从而提高在知识图谱上进行异常检测的效率,此外,还由于糖尿病足的知识图谱是基于糖尿病足的知识库以及知识图谱架构生成的,所以其还包括有丰富的医疗常识知识,预设在该医疗大数据的基础上建立的知识图谱更加真实可靠和丰富。

但是,若知识图谱中的节点下属性过多或搜索neo4j不支撑的数据类型时会影响其性能,所以还可以使用neo4j结合mongodb来存储知识图谱。mongodb作为文档型数据库可容纳许多无模式的数据,轻松将数据存储为树形结构,但树只能表达从上到下的从属关系,而且树状存储结构中总会出现多次被嵌入的冗余数据,不仅增加了更新数据的困难而且也难以确保数据的一致性,如果将冗余数据去掉,然后用图结构将存在相互关系的数据相关联,数据冗余问题就解决了,并且数据之间的关联关系变得更直观,因而可以将涉及关系部分交由neo4j保存,而实例化的节点信息由mongodb保存,不仅形式上更简洁同时还避免了数据冗余和一致性问题,而且能提高数据搜索的效率。

另外,上述糖尿病足的知识图谱可以应用在多个方面,如语义搜索、个性化推荐、智能问答以及智能导诊,下面对知识图谱在智能导诊场景下的应用进行简单介绍。

作为一种实施方式,获取用户输入的有关糖尿病足的查询信息,基于所述查询信息从糖尿病足的知识图谱中查找与查询信息相关的疾病知识信息,然后将疾病知识信息输出给用户。

可以理解地,用户可以在终端界面输入想要查询糖尿病足的查询信息,电子设备获取到该查询信息后,对其进行语义理解或分析,然后从知识图谱中查找与查询信息相关的疾病知识信息,输出给用户,如此用户可以咨询的获取糖尿病足的一些相关知识,比如一些简单的疾病或紧急的疾病,用户可基于输出的疾病知识信息对疾病进行应急处理。

在上述实现过程中,利用知识图谱进行信息搜索,可便于用户自助进行快速地疾病知识查询。

请参照图13,图13为本申请实施例提供的一种糖尿病足知识图谱生成装置200的结构框图,该装置200可以是电子设备上的模块、程序段或代码。应理解,该装置200与上述图2方法实施例对应,能够执行图2方法实施例涉及的各个步骤,该装置200具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。

可选地,所述装置200包括:

数据获取模块210,用于获取糖尿病足相关领域的疾病语料数据;

实体提取模块220,用于从所述疾病语料数据中提取多个疾病实体;

属性获取模块230,用于获取每个疾病实体的属性信息,所述属性信息用于表征每个疾病实体的特征信息;

关系构建模块240,用于利用所述属性信息构建所述多个疾病实体之间的关联关系;

知识库获取模块250,用于基于所述关联关系创建所述糖尿病足的知识库;

知识图谱生成模块260,用于将所述糖尿病足的知识库与预先创建的知识图谱架构进行关联,生成所述糖尿病足的知识图谱。

可选地,所述知识图谱生成模块260,用于将所述糖尿病足的知识库中的各个知识点添加到所述知识图谱架构中的相应节点中,生成所述糖尿病足的知识图谱。

可选地,所述实体提取模块220,用于从所述疾病语料数据中提取多个初始疾病实体;对所述多个初始疾病实体进行筛选,获得筛选后的所述多个疾病实体。

可选地,所述实体提取模块220,用于统计每个初始疾病实体在所述疾病语料数据中出现的次数;将出现的次数小于预设次数的初始疾病实体从所述多个初始疾病实体中删除,将获得的剩余的初始疾病实体作为筛选后的所述多个疾病实体。

可选地,所述实体提取模块220,用于采用双向长短期记忆网络-条件随机场bilstm-crf模型识别所述疾病语料数据中的多个疾病实体。

可选地,所述装置200,还包括:

知识库扩充模块,用于利用同义词词林以及word2vec算法获取各个疾病实体以及属性信息的同义词;将所述同义词添加到所述糖尿病足的知识库中。

可选地,所述装置200,还包括:

存储模块,用于利用neo4j以及mongodb数据库存储所述糖尿病足的知识图谱。

可选地,所述装置200,还包括:

信息查询模块,用于获取用户输入的有关所述糖尿病足的查询信息;基于所述查询信息从所述糖尿病足的知识图谱中查找与所述查询信息相关的疾病知识信息;将所述疾病知识信息输出给所述用户。

本申请实施例提供一种可读存储介质,所述计算机程序被处理器执行时,执行如图2所示方法实施例中电子设备所执行的方法过程。

本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如,包括:获取糖尿病足相关领域的疾病语料数据;从所述疾病语料数据中提取多个疾病实体;获取每个疾病实体的属性信息,所述属性信息用于表征每个疾病实体的特征信息;利用所述属性信息构建所述多个疾病实体之间的关联关系;基于所述关联关系创建所述糖尿病足的知识库;将所述糖尿病足的知识库与预先创建的知识图谱架构进行关联,生成所述糖尿病足的知识图谱。

综上所述,本申请实施例提供一种糖尿病足知识图谱生成方法、装置及可读存储介质,通过构建糖尿病足的知识库,然后将知识库与预先创建的知识图谱架构进行关联,从而生成知识图谱,这样在构建糖尿病足的知识图谱时,可直接基于知识图谱架构进行构建即可,如此可更加快速、更加方便地构建知识图谱。

在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1