关于中医经验数据的知识图谱的构建方法及装置与流程

文档序号:18325782发布日期:2019-08-03 11:01阅读:328来源:国知局
关于中医经验数据的知识图谱的构建方法及装置与流程

本发明实施例涉及大数据分析技术领域,更具体地,涉及关于中医经验数据的知识图谱的构建。



背景技术:

在中医诊疗领域,名老中医是将中医药学基本理论、前人经验与当今实践相结合,解决临床疑难问题的典范,代表着当前中医学术和临床发展的最高水平,是当代中医药学术发展的杰出代表。他们的学术思想和临证经验是中医药学术特点、理论特质的集中体现,开展名老中医学术思想、经验传承研究具有十分重要的意义。

辨证施治是中医的核心,“辨证施治”就是对四诊(望、闻、问、切)所得资料进行综合分析。概括、判断出反映疾病本质特征的证候,从而对病人进行具体施治的思想和方法,其本质在于强调病人的个体差异以及致病因素的综合分析。因此中医强调全局最优,相比之下西医则是强调局部最优。辨证施治最终反映的是症状到证候的关系,这是最具中医思想的体现。

随着数据挖掘与分析技术的不断发展,如何以更专业、更准确的形式对名老中医的诊疗经验进行总结是当前中医领域研究的难题。



技术实现要素:

本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的关于中医经验数据的知识图谱的构建。

第一个方面,本发明实施例提供一种关于中医经验数据的知识图谱的构建方法,包括:

根据与中医相关的经验数据创建初始的知识图谱;

利用贝叶斯网络对所述初始的知识图谱进行挖掘,获得疾病-症状-症候的直接和间接的关系以及用药规律,以作为挖掘结果;

将所述挖掘结果映射到所述初始的知识图谱中,获得优化后的知识图谱。

第二个方面,本发明实施例提供一种关于中医经验数据的知识图谱的构建装置,包括:

初始知识图谱创建模块,用于根据与中医相关的经验数据创建初始的知识图谱;

贝叶斯挖掘模块,用于利用贝叶斯网络对所述初始的知识图谱进行挖掘,获得疾病-症状-症候的直接和间接的关系以及用药规律,以作为挖掘结果;

映射模块,用于将所述挖掘结果映射到所述初始的知识图谱中,获得优化后的知识图谱。

第三个方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。

第四个方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。

本发明实施例提供的关于中医经验数据的知识图谱的构建方法及装置,通过对海量的与中医相关的经验数据进行分析,创建初始的知识图谱,再利用贝叶斯网络在已构建好的知识图谱上对医案数据进行该名老中医诊疗过程中“疾病-症状-证侯”之间直接和间接关系以及用药规律的挖掘。将挖掘结果映射到知识图谱中,最终得到的中医知识图谱就是在已公认的中医知识体系下对该名老中医经验进行的计算机可理解的描述。本发明实施例能够以可视化的形式反映名老中医的诊疗思路,从而为名老中医的思想的传承奠定基础。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的数据同步方法的流程示意图;

图2为本发明实施例的中医体系中各要素的关系图;

图3为本发明实施例的知识图谱的组成结构图;

图4为本发明实施例的知识图谱的结构示意图;

图5为本发明实施例提供的关于中医经验数据的知识图谱的构建装置的结构示意图;

图6为本发明实施例提供的电子设备的实体结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在中医诊疗领域中做医案数据的挖掘需要有大量的先验知识作为指导。因此需要将与中医诊疗有关知识以计算机能够理解的形式收集起来,供算法使用。知识图谱(knowledgegraph,kg)是一种以图结构描述知识的方式,能够被计算机理解,并且提供的丰富语义语法能够描述复杂的领域知识。由于知识图谱的众多优点,它已被用于医疗、法律等专业性很强的领域。

知识图谱的不足之处在于无法包含不确定性信息,从而不能进行数据挖掘过程中的不确定性推理。在中医诊疗思路的挖掘中,从大量数据中建立不确定性的推理方式是重要的环节。概率图模型(probabilisticgraphicalmodels,pgm)是概率模型和图模型的结合,以图的形式描述变量之间的不确定性关系,其中贝叶斯网(bayesiannetworks,bn)是一种有向的概率图模型。本发明实施例采用知识图谱与贝叶斯网结合的技术方案,进行中医经验数据的挖掘以及中医诊疗系统的实现

图1为本发明实施例提供的关于中医经验数据的知识图谱的构建方法的流程示意图,如图1所示,该方法包括:

s101、根据与中医相关的经验数据创建初始的知识图谱。

需要说明的是,中医体系具有诊断和治疗两个主题,目前在中医领域提倡中西合璧的思想,诊断是辩证与辨病相结合,其中辩证是指通过症状总结归纳出证侯,证侯(也简称做证)是指反应疾病当前的情况,再由证侯确定治疗方法和具体的方药;而辨病是指由症状推出病(病是指疾病全过程的特点与规律所作出病理性概括,是疾病全过程的本质),后续再由疾病推出相关证侯,最后由证侯确定治疗方法和具体的方药。

图2为本发明实施例的中医体系中各要素的关系图。中医诊疗过程中,“诊”是第一步,主要包括“疾病-证候-症状”三者之间的关系。医生是通过证侯以及证侯要素来决定治疗方案的,因此需要进行辨证,另外中医学者提倡中西合璧,辨证为本,辨证辨病相结合。所以在中医诊疗过程中“疾病”也是重要一环。因此在“诊”的环节中,从症状(图中的症)出发,分出两条线:辨证以及辨病。辨病之后在进行地分析疾病对应的证侯,从而与辨证的结果汇总形成证侯要素,进一步地将证侯要素总结为若干证侯,至此“诊”环节结束。另外,在“诊”环节中,病人的个人情况是影响诊断结果准确性的重要因素,个人情况会影响到辨证和辨病。

在“治”环节,医生结合诊断的证侯结果和病人的个人情况来确定合适的用药方案,形成最终的方药。

在本发明实施例中,知识图谱用于描述中医的诊疗知识,知识图谱的构建过程就是名中医经验挖掘的过程,知识图谱通过半自动化方式来创建,创建所需要的专业知识包括相关的数据库和已存在的知识图谱(结构化数据,通过算法转为图谱内容)以及书籍文献(非结构化数据,通过人工手动提取信息加入图谱中)。这种方式建立起的知识图谱主要描述了中医知识体系架构以及公认的知识。

需要说明的是,本发明实施例构建的知识图谱即存储中医知识的数据库。图3为本发明实施例的知识图谱的组成结构图。

结合图2对中医诊疗过程的梳理,本发明实施例中的知识图谱需要存储图2所展示的过程中所涉及到的所有关系知识,因此该图谱主要存储所图三所示的5大类别,将图2的关系提炼出来就是这五大类别之间的关系。从图中可以看到,症状与疾病之间的主要关系是辨病;症状与证侯之间的主要关系是辨证;个人情况会影响到诊疗的整个过程——疾病、证侯以及方药。另外疾病会影响到最终的证侯结果,而方药的确定则主要取决于证侯。

s102、利用贝叶斯网络对所述初始的知识图谱进行挖掘,获得疾病-症状-症候的直接和间接的关系以及用药规律,以作为挖掘结果。

贝叶斯网络能够将多元知识图解可视化的一种概率知识表达与推理模型,更为贴切地蕴含了网络节点变量之间的因果关系及条件相关关系。贝叶斯网络用条件概率表达各个信息要素之间的相关关系,能在有限的、不完整的、不确定的信息条件下进行学习和推理。在本发明实施例中,贝叶斯网络用于对初始的知识图谱进行挖掘,获得疾病-症状-症候的直接和间接的关系以及用药规律,以作为挖掘结果

疾病是致病邪气作用于人体,人体正气与之抗争而引起的机体阴阳失调、脏腑组织损伤、生理功能失常或心理活动障碍的一个完整的异常生命过程,如感冒等等;证候是疾病过程中某一阶段或某一类型的病理概括,如风寒感冒、暑湿感冒等。症状是疾病过程中表现出的个别、孤立的现象。可以是病人异常的主观感觉或行为表现,如恶寒发热、恶心、烦躁易怒等,也可以是医生检查病人时发现的异常征象,如舌苔、脉象等。病的重点是全过程,而证的重点在于现阶段。症状是病和证的基本要素,是判断疾病、辨识证的主要依据。一种疾病可以有不同的证候,而同一种证候又可以见于不同的疾病当中。

s103、将所述挖掘结果手工完善到所述初始的知识图谱中,获得优化后的知识图谱。

在上述各实施例的基础上,作为一种可选实施例,知识图谱包括模式图和数据图,其中所述模式图用于描述类之间的关系,而数据图用于描述类的实例之间的关系。

需要说明的是,模式图相对于数据图类似与“类-对象”的关系,其中模式图用于描述知识图谱的框架,而数据图用于知识图谱的细节。

图4为本发明实施例的知识图谱的结构示意图。

如图模式层所示,在中医药领域包括症状、证候、中药、治法四个子概念,且它们之间存在着证候的相关症状,中药用于治疗症状、证候,证候的对应治法这样的相关关系。如图数据层所示,对症状、证候、中药、治法四大类,都举出了对应的实例。肝阳上亢证的相关症状是颜面潮红,枸杞子、菊花用于治疗肝阳上亢、颜面潮红,肝阳上亢证的对应治法是平肝潜阳。

在上述各实施例的基础上,作为一种可选实施例,根据与中医相关的经验数据库创建初始的知识图谱,具体为:

s201、获取与中医相关的经验数据,对所述经验数据中的疾病、症状、证候以及中医药出现的频次进行统计,并计算疾病、症状、证候以及中医药之间的关联规则;

步骤如下:

电子化录入现有的医案数据。医案数据中包含疾病、症状、证候、中医药等要素。

将医案数据进行二值化表示。具体存储形式为“独热”形式,即医案hi={x1,x2,x3,…,x244},x1=0或1,0表示医案中没有出现该对应的症状,1表示该医案中出现了对应的症状。

将二值化的医案数据,送入复杂系统熵方法中进行计算。设计多个实验组,例如“中医药之间”,“证候与症状之间”等,寻找其相应的关联规则。

s202、根据现有的根据中医经验构建的已知知识图谱构建所述初始的知识图谱的模式图。

需要说明的是,本发明实施例根据已知的知识体系构建初始的知识图谱的模式图,在中医药领域包括症状、证候、中药、治法四个子概念,且它们之间存在着证候的相关症状,中药用于治疗症状、证候,证候的对应治法这样的相关关系。

s203、将所述已知知识图谱中的结构化数据和非结构化数据转换成疾病-症状-证候的三元组,将所述三元组通过知识融合的方式整合到知识图谱中,获得所述初始的知识图谱的数据图以及调整后的模式图。

需要说明的是,本发明实施例中的结构化数据包括数据库以及已知知识图谱,而非结构化数据包括数据文献等。通过对结构化数据和非结构化数据进行三元组转化,能够总结出由疾病、症状和证候组成的三元组。

三元组是知识图谱中一种常用的表示形式,主要包括两种形式:

{实体1,关系,实体2}和{概念,属性,属性值}。

实体是知识图谱中的最基本元素,不同的实体间存在不同的关系。

概念指集合、对象类型、事物的种类,例如“清热泻火药”、“气虚证”等;属性主要指对象可能具有的属性、特征、特点及参数,例如“药性”、“药味”、“药归经”等;属性值主要指代概念属性的值,例如对应属性“药性”的属性值为“大寒”“小毒”等。

举例:

第一种三元组形式:{柴胡,常用于治疗,少阳证}

第二种三元组形式:{柴胡,味,辛、苦},{柴胡,性,微寒}

整合进知识图谱具体是指把三元组整合进数据图。

现有的知识图谱构建数据来源大多源于结构化数据,其收录的关于中医理论、疾病、中药等来自不同数据资源的中医“事实”,存在数据量庞大、数据精度低等问题,导致其很难直接运用在特定疾病的医疗诊断问题中。而本方案针对名老中医对中老年疾病诊断多年,其医案数据具有组方简单、记录规范、治疗疾病范围小等特点,利用这些数据能够很好地探索出名老中医的诊疗思维、诊疗要点,并将这些信息迁移到知识图谱中,知识图谱系统化、结构化地将这些知识以图的形式表示出来,实现其经验的再现与分享。

s204、根据知识图谱的推理功能对所述初始的知识图谱进行逻辑检查,获得检查后的初始的知识图谱。

例如,可查询某类证包含的具体证候。肝系证类包含什么证?知识图谱将推理得到肝阳上亢、肝气郁滞、肝阳扰神、肝火上攻。还可根据症状信息推理出所有可能的证候。感到胁痛、头晕是什么证候?知识图谱将推理得到肝气郁滞、阴血不足。

在上述各实施例的基础上,将所述挖掘结果映射到所述初始的知识图谱中,获得优化后的知识图谱,具体为:将所述挖掘结果完善到所述初始的知识图谱中,获得优化后的知识图谱。

图5为本发明实施例提供的关于中医经验数据的知识图谱的构建装置的结构示意图,如图5所示,该装置包括:初始知识图谱创建模块501、贝叶斯挖掘模块502和映射模块503,其中:

初始知识图谱创建模块501,用于根据与中医相关的经验数据创建初始的知识图谱。

贝叶斯挖掘模块502,用于利用贝叶斯网络对所述初始的知识图谱进行挖掘,获得疾病-症状-症候的直接和间接的关系以及用药规律,以作为挖掘结果。

映射模块503,用于将所述挖掘结果映射到所述初始的知识图谱中,获得优化后的知识图谱。

本发明实施例提供的关于中医经验数据的知识图谱的构建装置,具体执行上述各关于中医经验数据的知识图谱的构建方法的实施例流程,具体请详见上述各构建方法实施例的内容,在此不再赘述。本发明实施例提供的关于中医经验数据的知识图谱的构建装置,通过对海量的与中医相关的经验数据进行分析,创建初始的知识图谱,再利用贝叶斯网络在已构建好的知识图谱上对医案数据进行该名老中医诊疗过程中“疾病-症状-证侯”之间直接和间接关系以及用药规律的挖掘。将挖掘结果映射到知识图谱中,最终得到的中医知识图谱就是在已公认的中医知识体系下对该名老中医经验进行的计算机可理解的描述。本发明实施例能够以可视化的形式反映名老中医的诊疗思路,从而为名老中医的思想的传承奠定基础。

图6为本发明实施例提供的电子设备的实体结构示意图,如图6所示,该电子设备可以包括:处理器(processor)610、通信接口(communicationsinterface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储在存储器630上并可在处理器610上运行的计算机程序,以执行上述各实施例提供的关于中医经验数据的知识图谱的构建方法,例如包括:根据与中医相关的经验数据创建初始的知识图谱;利用贝叶斯网络对所述初始的知识图谱进行挖掘,获得疾病-症状-症候的直接和间接的关系以及用药规律,以作为挖掘结果;将所述挖掘结果映射到所述初始的知识图谱中,获得优化后的知识图谱。

此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的关于中医经验数据的知识图谱的构建方法,例如包括:根据与中医相关的经验数据创建初始的知识图谱;利用贝叶斯网络对所述初始的知识图谱进行挖掘,获得疾病-症状-症候的直接和间接的关系以及用药规律,以作为挖掘结果;将所述挖掘结果映射到所述初始的知识图谱中,获得优化后的知识图谱。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1