一种异质图嵌入方法、系统及装置

文档序号:37759964发布日期:2024-04-25 10:46阅读:6来源:国知局
一种异质图嵌入方法、系统及装置

本发明涉及中医药异质图分析,具体而言,涉及一种异质图嵌入方法、系统及装置。


背景技术:

1、草药配伍规律分析是中医配药研究方面的热门问题,目前研究人员已经开始尝试使用计算机领域的深度学习算法解决,展开来说,中药处方数据通常以图网络形式呈现,具体包括草药节点、处方节点和疾病节点,三者之间的关系用边来表示,由于上述节点不是单一种类的,依靠传统的图表示学习方法对由这些节点形成的异质图进行嵌入分析将不再适用,与异质图嵌入相关的方法将更加适合。元路径是异质图中一个常见的概念,它不仅依赖于节点间的直接相连关系,更基于节点间的高阶关系且通常是具有特定语义的,例如,在中医场景下,处方-疾病-处方这条元路径就反映了治疗功效相近的处方,而草药-处方-草药这条元路径则反映了草药之间搭配使用的情况。通过定义不同的元路径,异质图能够被抽象出多个视角下的结构信息,以便更好地进行知识挖掘和表征学习。

2、草药被广泛应用在多种不同功效的处方中,实际应用中存在这样的情况,即某一草药在某一处方中仅用来辅佐主药,调和药性,其本身处于非关键地位而并非主要成分,此时若由异质图嵌入相关的图注意力网络直接处理,该草药的注意力权重会被限制在低区间内,难以获取到它的个性化特征,也即得到的嵌入向量并不准确,不利于后续的下游任务,如草药配伍分析;更形象的来说,如果将处方视为社群,草药视为成员,则上述草药节点会在相关性很低的社群间产生混淆的连接,使得社群边缘相互重叠的范围增大,增加表征学习的难度。

3、因此,如何设计一种新的异质图嵌入方案以将各节点对应的嵌入向量准确表示,是当前亟待解决的问题。


技术实现思路

1、本发明解决的问题是:提供了一种异质图嵌入方法、系统及装置,有利于将更多的特征聚合至真实草药节点的嵌入向量中,而嵌入向量质量的提高便于后续进行中医异质图节点分类任务,能够更有效地进行草药配伍分析。

2、为解决上述问题,本发明了提供一种异质图嵌入方法,包括:

3、获取包括真实草药节点、处方节点和疾病节点的第一异质图;

4、确定各所述真实草药节点、各所述处方节点及各所述疾病节点所属的类别标签;

5、基于各所述类别标签及预设节点分身策略对所述第一异质图进行处理以生成第二异质图,所述第二异质图中包括所述真实草药节点及其分身草药节点,且所述真实草药节点和与其所属同一类别标签的处方节点连接,与所述真实草药节点分属不同类别标签的任一类处方节点与任一个分身草药节点连接;

6、根据所述第一异质图、所述第二异质图在预设图注意力神经网络中训练,进而聚合得到各目标节点对应的嵌入向量,以便基于所述嵌入向量执行目标任务,所述目标节点包括所述真实草药节点、所述处方节点及所述疾病节点。

7、本方案中,考虑到草药在不同类型处方中的功效差异,针对真实草药节点设置分身草药节点,通过在预设图注意力神经网络中的训练,统一聚合得到各目标节点对应的嵌入向量,可见,上述分身草药节点的设置有利于将更多的特征聚合至真实草药节点的嵌入向量中,而节点嵌入向量质量的提高便于后续进行中医异质图节点分类任务,能够更有效地进行草药配伍分析。

8、进一步的,基于各所述类别标签及预设节点分身策略对所述第一异质图进行处理以生成第二异质图,包括:

9、确定所述第一异质图中真实草药节点的分身草药节点,且所述分身草药节点与所述真实草药节点所属的类别标签不同;

10、确定与所述真实草药节点所属的类别标签相同的处方节点为固定处方节点,以在第二异质图中保留所述真实草药节点与所述固定处方节点间的连接;

11、将与所述真实草药节点所属的类别标签不同的处方节点作为待继承处方节点,进而在所述第二异质图中目标分身草药节点与任一类同属一类别标签的待继承处方节点连接;其中,当b小于a时所述目标分身草药节点为a个分身草药节点中的任意b个分身草药节点,b为所述待继承处方节点的类别数目,a为所述分身草药节点的总个数。

12、本方案中,在第二异质图中保留与真实草药节点所属类别标签相同的固定处方节点与其的连接方式,并设置分身草药节点实现与待继承处方节点之间的连接以完成连接关系继承,实现了对真实草药节点的分身处理。

13、进一步的,所述第一异质图中各所述真实草药节点的分身草药节点的总个数a均相同,且所述a=n-1,n为所述类别标签的类别总数。

14、本方案中,针对有分身草药节点的各真实草药节点,设置其分身草药节点的总个数a均相同,更利于预设图注意力神经网络中注意力权重的训练,便于加快预设图注意力神经网络的训练速度。

15、进一步的,根据所述第一异质图、所述第二异质图在预设图注意力神经网络中训练,进而聚合得到各目标节点对应的嵌入向量,包括:

16、根据元路径理论对所述第一异质图及所述第二异质图进行转换以生成多个同质图;

17、确定所述第一异质图、所述第二异质图及所述同质图各自对应的、用于描述图片基本信息的邻接矩阵;

18、确定所述第一异质图、所述第二异质图及所述同质图中的节点对应的、用于描述所述节点的特征信息的特征矩阵;

19、将所述邻接矩阵、所述特征矩阵及预设比例的节点对应的类别标签作为输入项输入预设图注意力神经网络中训练,进而聚合得到各目标节点对应的嵌入向量。

20、本方案中,邻接矩阵将各个图转换成预设图注意力神经网络可识别的形式,特征矩阵增加了对节点的特征信息的描述,从而实现了贴合于中医药背景下的图网络的输入,预设比例的节点对应的类别标签的输入有利于提高嵌入向量的训练质量。

21、进一步的,确定所述第一异质图、所述第二异质图及所述同质图中的节点对应的、用于描述所述节点的特征信息的特征矩阵,包括:

22、基于nlp文本处理算法对所述第一异质图、所述第二异质图及所述同质图中的节点对应的描述性文本进行处理,以得到用于描述所述节点的特征信息的特征矩阵。

23、本方案中,通过nlp文本处理算法对描述文本进行处理以生成特征矩阵,精简了非必要信息,利于提高训练速度。

24、进一步的,所述预设图注意力神经网络通过训练进而聚合得到各所述目标节点对应的嵌入向量的过程,包括:

25、基于节点级别注意力聚合策略确定各所述目标节点在所述邻接矩阵对应的各条元路径下的表征向量,以聚合各所述目标节点的邻居节点的特征;

26、基于所述表征向量及语义级别注意力聚合策略确定各所述目标节点的单一表征向量,以聚合各所述目标节点在各条所述元路径下的特征,且当所述目标节点为所述处方节点或者所述疾病节点时将所述单一表征向量作为其对应的嵌入向量;

27、根据功能级别注意力聚合策略,将所述分身草药节点的单一表征向量与所述真实草药节点的单一表征向量聚合,以得到所述真实草药节点的嵌入向量。

28、本方案中,通过三种不同级别的聚合策略的设置,统一聚合得到了各个目标节点的嵌入向量。

29、进一步的,根据功能级别注意力聚合策略,将所述分身草药节点的单一表征向量与所述真实草药节点的单一表征向量聚合,包括:

30、针对第i个真实草药节点,1≤i≤所述真实草药节点的总个数且i为整数,执行如下步骤:

31、基于预设权重拟合策略,确定第i个真实草药节点对应的节点集合中各待聚合节点的功能级注意力权重,所述待聚合节点为第i个真实草药节点或者其分身草药节点;

32、根据所述功能性注意力权重及第一预设关系式,确定第i个真实草药节点的唯一嵌入向量;

33、所述第一预设关系式为:

34、

35、其中,hi表示第i个真实草药节点的唯一嵌入向量,n为所述待聚合节点的总个数,t表示第t个待聚合节点,为第t个待聚合节点对应的功能级注意力权重,为第t个待聚合节点对应的单一表征向量。

36、本方案中,考虑到不同的待聚合节点对应的重要性不同,设置了功能级注意力权重协助唯一嵌入向量的确定。

37、进一步的,基于预设权重拟合策略,确定第i个真实草药节点对应的节点集合中各待聚合节点的功能级注意力权重,包括:

38、基于第二预设关系式确定各所述待聚合节点的重要性得分;

39、所述第二预设关系式为:

40、

41、其中,fit表示第t个待聚合节点的重要性得分,pt为预设功能级别的注意力向量,wfunc为功能级别的权重矩阵参数,bfunc为功能级别的偏置参数,为第t个待聚合节点对应的单一表征向量;

42、根据第三预设关系式对各所述待聚合节点的重要性得分做归一化处理,以得到各所述待聚合节点的功能级注意力权重;

43、所述第三预设关系式为:

44、

45、其中,表示第t个待聚合节点对应的功能级注意力权重。

46、本方案中,通过上述方式简单可靠地给出了各个待聚合节点的功能级注意力权重,利于后续对唯一嵌入向量的确定。

47、本发明还提供了一种异质图嵌入系统,包括:

48、获取单元,用于获取包括真实草药节点、处方节点和疾病节点的第一异质图;

49、类别标签确定单元,用于确定各所述真实草药节点、各所述处方节点及各所述疾病节点所属的类别标签;

50、分身处理单元,用于基于各所述类别标签及预设节点分身策略对所述第一异质图进行处理以生成第二异质图,所述第二异质图中包括所述真实草药节点及其分身草药节点,且所述真实草药节点和与其所属同一类别标签的处方节点连接,与所述真实草药节点分属不同类别标签的任一类处方节点与任一个分身草药节点连接;

51、训练聚合单元,用于根据所述第一异质图、所述第二异质图在预设图注意力神经网络中训练,进而聚合得到各目标节点对应的嵌入向量,以便基于所述嵌入向量执行目标任务,所述目标节点包括所述真实草药节点、所述处方节点及所述疾病节点。

52、本发明还提供了一种异质图嵌入装置,包括:

53、存储器,用于存储计算机程序;

54、处理器,用于执行所述计算机程序时实现如上述所述的异质图嵌入方法的步骤。

55、本技术中通过分身草药节点的设置有利于将更多的特征聚合至真实草药节点的嵌入向量中,而节点嵌入向量质量的提高便于后续进行中医异质图节点分类任务,能够更有效地进行草药配伍分析。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1