一种核心方的分析发现方法与流程

文档序号:12825008阅读:538来源:国知局
一种核心方的分析发现方法与流程

本发明涉及中医专科专病、医家以及文献核心方大数据关联性研究技术领域,尤其涉及一种核心方的分析发现方法。



背景技术:

在中医药学领域中,药物的药对配伍规律中具有高水平支持度,即出现频次较高的药物组合即为核心方。而在中药知识图谱的构建中,需要对中药核心方进行挖掘以发现相互之间的关联性。知识图谱融合所有学科,将不同来源、不同类型、不同结构的知识单元通过链接关联成图,基于各学科的元数据,为用户提供更广度、更深度的知识体系并不断扩充。其本质上是将领域知识数据体系化、关系化,并以图的方式将知识可视化。简单来说,知识图谱是基于信息系统建立的知识体系,通过数据采集、数据挖掘、信息处理、知识计量和图形绘制等技术把复杂的知识领域系统地显示出来,揭示知识领域的动态发展规律。作为中药知识图谱构建过程中的重要数据源,中药核心方的关联显得尤其重要。

现有技术主要应用关联规则和复杂网络对中药核心方进行挖掘,上述方法均多以频数分析作为统计推断基础,虽应用广泛但仍存在局限,如参数的设置水平不统一,结果评价标准不一致,时常得出冗余结论或用传统配伍理论无法解释的结论等。基于关联规则的分析方法对于药物之间“关联”的定义较为模糊;基于聚类的核心方发现的各个研究在特征值提取和相似度度量方法上存在较大差异;复杂网络分析方法划分应用于核心方发现目前还停留在节点度分析的阶段,缺乏理论与分析角度上的深层结合。



技术实现要素:

本发明的目的是为了解决现有技术中存在的缺点,而提出的一种核心方的分析发现方法。

为了实现上述目的,本发明采用了如下技术方案:

一种核心方的分析发现方法,其特征在于,包括步骤:

s1、构建可视化的中药知识图谱;

s2、基于中药知识图谱挖掘核心方;

s3、通过深度学习器将中药知识图谱中的核心方及其配伍构建对应的坐标映射,并建立核心方之间的语义距离信息,建立核心方之间体现相互之间关联度的有向网络。

进一步地,在上述的一种核心方的分析发现方法中,在步骤s1中,所述中药知识图谱的创建包括以下步骤:

s101、从元文本数据中抽取单味药及方剂数据;

s102、对s101中所抽取数据进行清洗,根据相应中医药本体标准确定单味药知识元、方剂知识元;

s103、建立单味药知识元节点集与方剂知识元节点集,根据各节点在数据集中的频数分布确立其权重。

进一步地,在上述的一种核心方的分析发现方法中,在步骤s2的实施过程中还包括以下步骤:

s201、根据文本数据中相应知识元节点出现的关系先后进行有向关系抽取,形成有向边集合;

s202、根据方剂知识元和单味药知识元、方剂知识元与方剂知识元、单味药知识元与单味药知识元三类节点两两语义距离为其有向关系赋权;

s203、根据单味药与方剂节点集合以及边集合建立有向加权复杂网络,输出方药知识元关联网络。

进一步地,在上述的一种核心方的分析发现方法中,在步骤s3的实施过程中又包括以下步骤:

s301、确立坐标原点,根据所选各知识元节点属性特征计算地图坐标以定位各节点,输出症状与病机的知识地图;

s302、通过设定聚类个数对已有节点进行样品聚类,根据聚类结果进行区块划分,以不同的背景色区别不同聚类;

s303、根据步骤s1中确定的节点类别分组结果为节点着色,根据步骤s2中的节点赋权结果调整节点大小。

优选地,在上述的一种核心方的分析发现方法中,对所述知识图谱模型进行可视化地输出形式之一包括:知识地图。

优选地,在上述的一种核心方的分析发现方法中,生成所述知识地图的参数至少包括:区块数量、图谱尺寸以及知识元范围。

进一步地,在上述的一种核心方的分析发现方法中,对所述知识图谱模型进行可视化地输出形式之一包括:知识推理网络。

进一步地,在上述的一种核心方的分析发现方法中,所述知识推理网络由所述知识图谱模型自动生成,用以生成知识元构成的有向加权网络,所述知识元构成的有向加权网络中的各样本关系、节点均具有权重,并可自动/手动定义聚类数量。

本发明的有益效果:本发明的核心方的分析发现方法在基于知识图谱的基础上利用深度学习技术赋予每个知识单元个体坐标映射,充分利用距离信息,体现他们之间的关联,可综合关联规则、样品聚类和复杂网络社团发现的优势,并达到上述传统方法不具备的优势,即多尺度知识图谱呈现和知识推理。用户可以自由设定社群数量,在常用药对语义检索、可视化中药社团发现,单味药、基础方关联性研究上有显著的优越性。

附图说明

图1为本发明实施例中核心方的分析发现方法的流程示意图;

图2为本发明基于深度学习的中药核心方构建原理图;

图3为本发明的核心中药组合知识地图的局部呈现图;

图4为本发明的全局用药知识推理网络关系的局部呈现图;

图5为本发明的单个医家经验用药核心方推理网络局部呈现图;

图6为本发明的肾病专题方剂关联推理的局部呈现图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。

本发明提供了一种核心方的分析发现方法,具体如图1所示,其包括如下步骤:

s1、构建可视化的中药知识图谱;

s2、基于中药知识图谱挖掘核心方;

s3、通过深度学习器将中药知识图谱中的核心方及其配伍构建对应的坐标映射,并建立核心方之间的语义距离信息,建立核心方之间体现相互之间关联度的有向网络。

具体的,在步骤s1中又包括以下步骤:

s101、从元文本数据中抽取单味药及方剂数据;

s102、对s101中所抽取数据进行清洗,根据相应中医药本体标准确定单味药知识元、方剂知识元;

s103、建立单味药知识元节点集与方剂知识元节点集,根据各节点在数据集中的频数分布确立其权重。

具体的,在步骤s2的实施过程中有包括以下步骤:

s201、根据文本数据中相应知识元节点出现的关系先后进行有向关系抽取,形成有向边集合;

s202、根据方剂知识元和单味药知识元、方剂知识元与方剂知识元、单味药知识元与单味药知识元三类节点两两语义距离为其有向关系赋权;

s203、根据单味药与方剂节点集合以及边集合建立有向加权复杂网络,输出方药知识元关联网络。

具体的,在步骤s3的实施过程中又包括以下步骤:

s301、确立坐标原点,根据所选各知识元节点属性特征计算地图坐标以定位各节点,输出症状与病机的知识地图;

s302、通过设定聚类个数对已有节点进行样品聚类,根据聚类结果进行区块划分,以不同的背景色区别不同聚类;

s303、根据步骤s1中确定的节点类别分组结果为节点着色,根据步骤s2中的节点赋权结果调整节点大小。

如图2所示,建立案例\文献的中医方、药二模网络和基于案例的单味药、方剂的二模关系网络,在案例\文献的中医方、药二模网络中,案例\文献构成原象,方剂和单味药构成象。在基于案例的单味药、方剂的二模关系网络中,方剂构成原象,各处方分别与不同的多种单味药进行关联,建立二模关系网络。最后各二模关系网络进行初始化建模任务,建模后经过计算机进行分类和加权,构建有向加权网络。对知识图谱模型进行可视化地输出形式之一包括:知识地图。用以生成知识地图的参数至少包括:区块数量、图谱尺寸以及知识元范围,知识地图以不同色块进行划分。对知识图谱模型进行可视化地输出形式之一还包括:知识推理网络。知识推理网络由知识图谱模型自动生成,用以生成知识元构成的有向加权网络,知识元构成的有向加权网络中的各样本关系、节点均具有权重,并可自动/手动定义聚类数量。在基于中药知识图谱挖掘核心方的方法包括:基于复杂网络的核心方挖掘,或,基于关联规则模型的核心方挖掘,或,基于聚类算法的核心方挖掘,或,上述三种核心方挖掘方法的任意两种组合或三种的组合。基于复杂网络的核心方挖掘方法以处方为基础,单味中药为节点,中药间配伍联系为边构建无标度网络,通过分析形成的拓扑结构图中的节点度和边权值,提取强关联药物或利用社区划分发现核心处方。基于关联规则模型的核心方挖掘方法通过设置不同水平的支持度发现药对配伍规律,高水平支持度用来发现出现频次较高的药物组合,低水平支持度用来发现随证加减的用药规律。基于聚类算法的核心方挖掘方法通过提取药物性味归经和功效为特征值,通过计算相似度进行药物配伍组合划分。

下面采用具体的实施方式对本发明的核心方关联方法进行描述,如图3所示,示出了核心中药组合知识地图的局部呈现图,其采用不同色块将具有相似功能属性的方剂单元进行归纳在一起,不同色块的颜色代表自动聚类标签,将用药分布规律和核心方分析实现了可视化呈现,便于辅助医生的诊断分析。如图4所示,示出了全局用药知识推理网络关系的局部呈现图,其中,颜色代表自动聚类标签,同核心中药组合知识地图,因传统关联规则、复杂网络方法仅仅考虑药物组成关系,无法充分利用中医医案承载的有效信息。因此,通过利用深度神经网络实现最大程度的特征抽取和自学习,能更客观有效的挖掘潜在用药规律。如图5所示,示出了单个医家经验用药核心方推理网络局部示意图,各用药核心方的之间按照药的属性以及配伍药效构成网络集合,比如冬瓜仁、桃仁、芦根和薏苡仁之间互为关联,构建关联子网络,其余的各用药核心方之间也彼此关联,共同构建成一个庞大的网络集合。如图6所示,示出了肾病专题方剂关联推理的局部呈现图,各方剂单元之间也以子关联网络组成一个庞大的网络集合。在近1万5千条中药处方中,通过区域放大,我们可以进一步的观察中药社团情况,同时我们也可以通过输入关注的药物,比如半枝莲或参术苓草——四君子汤基础方,查看关注区域的用药情况。我们检索的例子中输入的是党参、而计算机提示我们名医使用的更多的是太子参,而党参可能在和消食药(鸡内金、麦芽常常配伍使用)。半枝莲作为核心药物,我们发现它处于四君子汤及相关用药的中心,我们认为名老中医的核心方可能和这些药物有关。本发明的结合深度学习可综合两者的优势,即分析结果融合了有向网络、语义距离、坐标定位、基于层次化聚类的社群分析等特性,大大增强了药对核心方、症候对、症候群、中医病机演变规律、以及上述知识元间相互关联关系的发现能力。

本发明的核心方的分析发现方法在基于知识图谱的基础上利用深度学习技术赋予每个知识单元个体坐标映射,充分利用距离信息,体现他们之间的关联,可综合关联规则、样品聚类和复杂网络社团发现的优势,并达到上述传统方法不具备的优势,即多尺度知识图谱呈现和知识推理。用户可以自由设定社群数量,在常用药对语义检索、可视化中药社团发现,单味药、基础方关联性研究上有显著的优越性。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1