结合图神经网络和对比学习的药物-靶点预测方法及系统

文档序号:37170760发布日期:2024-03-01 12:16阅读:25来源:国知局
结合图神经网络和对比学习的药物-靶点预测方法及系统

本发明涉及药物研发与人工智能结合的,特别是涉及结合图神经网络和对比学习的药物-靶点预测方法及系统。


背景技术:

1、药物靶点相互作用的鉴定(dti)在药物开发的各种应用中起着至关重要的作用。然而,传统的dti检测生物实验通常是昂贵和耗时的。目前,最新的解决方法是基于机器学习、深度学习和网络开发了一些dti预测模型,进一步拓展了dti研究的领域和方向。这类方法不仅考虑了药物之间的关联,还考虑了靶点之间的关联,往往能获得理想的预测结果。

2、然而,在药物靶点预测的方法中,现有的基于图神经网络的方法只能从药物相关或靶点相关网络中直接连接的节点中聚集信息,这就会产生很大的局限性。一方面,无法从中捕获生物异构图中的远程依赖关系;另一方面,无法明确地建模和学习药物与靶点之间的局部相互作用。而且大多数现有的图神经网络都是以监督的方式训练的,这种方式严重依赖于大量标注的良好标签,然而在实际应用中,收集大量标记的图数据通常是资源昂贵且耗时的。


技术实现思路

1、有鉴于此,本发明提供了结合图神经网络和对比学习的药物-靶点预测方法及系统,以克服现有技术的局限性,捕获生物异构图中的远程依赖关系,明确地建模和学习药物与靶点之间的局部相互作用。

2、为此,本发明采用以下技术方案:

3、本发明公开了一种结合图神经网络和对比学习的药物-靶点预测方法,包括:

4、收集有关药物、蛋白质、疾病和副作用的信息,对药物、蛋白质、疾病和副作用四个实体构建用于药物蛋白质预测的异构网络;

5、通过元路径的方式结合图神经网络gcn对异构网络中药物和蛋白质宏观信息上的特征进行提取;

6、获取药物的smiles字符串和蛋白质序列,并使用图神经网络gcn分别从药物的smiles字符串和蛋白质序列中提取各自的微观信息;

7、将药物和蛋白质各自的宏观特征、微观特征进行拼接融合,并将每个药物和蛋白质的特征通过串联的方式形成一个药物蛋白质对;

8、基于学习表征的语义相似度构建相应的药物蛋白质对的语义图;

9、通过对比学习得到节点与节点之间的邻居对比损失,并获得最终的特征表示;

10、基于最终的特征标识,预测关联概率值,得到药物-靶点预测结果。

11、进一步地,收集有关药物、蛋白质、疾病和副作用的信息,包括:从公共数据集中收集有关药物、蛋白质、疾病和副作用的信息。

12、进一步地,获取药物的smiles字符串和蛋白质序列,包括:

13、从drugbank数据库中下载药物的smiles字符串和蛋白质序列。

14、进一步地,异构网络,包括:

15、药物-药物关系网络、药物-疾病关系网络、药物-副作用关系网络和药物-化学结构相似网络;

16、蛋白质-疾病关系网络、蛋白质-蛋白质关系网络和蛋白质-序列相似性网络;以及,药物-蛋白质相互作用网络。

17、进一步地,通过元路径的方式对异构网络中药物和蛋白质宏观信息上的特征进行提取,包括:

18、从异构网络中选取药物之间的元路径和蛋白质之间的元路径;

19、使用多层图神经网络gcn学习药物的每个元路径,生成药物的表示;

20、引入基于元路径的注意力机制,为元路径分配不同的权重,融合不同元路径下的药物表示,得到最终的药物表示;

21、使用多层图神经网络gcn学习蛋白质的每个元路径,生成蛋白质的表示;

22、引入基于元路径的注意力机制,为元路径分配不同的权重,融合不同元路径下的蛋白质表示,得到最终的蛋白质表示。

23、进一步地,分别从药物的smiles字符串和蛋白质序列中提取各自的微观信息,包括:

24、根据每个药物的化学性质初始化每个原子节点,使用三层图神经网络gcn学习药物化合物的图形表示,在二维分子图中表示节点信息;

25、其中,使用三层图神经网络gcn学习药物化合物的图形表示,包括:通过聚合药物的化学键连接的相邻原子的相应集合来更新原子特征向量,这种传播机制自动捕获分子的子结构信息;保留节点级别的药物表示,以便随后明确学习与蛋白质片段的局部相互作用。

26、进一步地,基于学习表征的语义相似度构建相应的药物蛋白质对的语义图,包括:

27、对于每个药物蛋白质对,计算它与其他药物蛋白质对之间的语义相似度,选择最接近的前预设个药物蛋白质对节点作为其相邻节点构建语义图。

28、进一步地,通过对比学习得到节点与节点之间的邻居对比损失,并获得最终的特征表示,包括:

29、选择了多头图注意力机制对构建的语义图生成4个具有自适应拓扑的可学习图增强视图;把不同视图中相同的节点视为正节点,把这一节点在视图内和不同视图之间的邻居节点也视为额外的正节点,其他视图内和不同视图之间的非邻居节点视为负节点,具体来说,选择其中一个视图中的一个节点作为锚点,正对节点来自三个方面,锚点在其他视图中的同一节点、锚点在视图内的邻居节点以及锚点在其他视图中的邻居节点,此外其他节点都为负对节点;

30、通过最小化对比学习的损失来最大化正对节点之间的一致性,最小化负对样本之间的一致性,每个节点的嵌入特征将被迫与另一个视图中的自身以及视图内和视图间的相邻节点的嵌入特征一致,相反,每个节点的嵌入特征与视图内和跨视图的非相邻节点的嵌入特征区分开来;

31、将生成的4个图增强视图的嵌入特征拼接起来,作为药物蛋白质对输出向量,然后将它们输入到一个多层感知机中进行预测,获得计算预测结果;

32、通过交叉熵损失、对比学习得到的损失和l2正则化项计算真实值和预测值之间的损失,进一步优化模型内部的参数。

33、本发明还公开了一种结合图神经网络和对比学习的药物-靶点预测系统,包括:

34、异构网络构建模块,用于收集有关药物、蛋白质、疾病和副作用的信息,对药物、蛋白质、疾病和副作用四个实体构建用于药物蛋白质预测的异构网络;

35、宏观特征提取模块,用于通过元路径的方式结合图神经网络gcn对异构网络中药物和蛋白质宏观信息上的特征进行提取;

36、微观信息获取模块,用于获取药物的smiles字符串和蛋白质序列,并使用图神经网络gcn分别从药物的smiles字符串和蛋白质序列中提取各自的微观信息;

37、特征融合模块,用于将药物和蛋白质各自的宏观特征、微观特征进行拼接融合,并将每个药物和蛋白质的特征通过串联的方式形成一个药物蛋白质对;

38、语义图构建模块,用于基于学习表征的语义相似度构建相应的药物蛋白质对的语义图;

39、对比学习模块,用于通过对比学习得到节点与节点之间的邻居对比损失,并获得最终的特征表示;

40、预测模块,用于基于最终的特征标识,预测关联概率值,得到药物-靶点预测结果。

41、本发明的优点和积极效果:

42、本发明中,首先通过对药物、蛋白质、疾病和副作用四个实体构建了异构网络,然后为了捕获异构网络中丰富的信息,通过元路径的方式来进行对药物和蛋白质宏观信息上的特征提取;其次分别从药物的smiles字符串和蛋白质序列中提取它们各自的微观信息;接下来把从上面得到的药物和蛋白质各自的宏观特征、微观特征进行拼接融合,并将每个药物和蛋白质的特征通过串联的方式形成一个药物蛋白质对,然后基于学习表征的语义相似度构建了相应的药物蛋白质对的语义图;最后,通过对比学习来得到节点与节点之间的邻居对比损失,并获得最终的特征表示以预测关联得分。本发明不仅考虑了药物蛋白质的宏观信息和微观信息,还通过构建药物蛋白质对的语义图来捕获药物和蛋白质之间全面而深刻的关系,最后通过一种对比学习方法来进行邻居对比损失的学习,因为对比学习作为一种优秀的判别式模型,着重于学习同类实例之间的共同特征,区分非同类实例之间的不同之处。与生成式学习比较,对比式学习不需要关注实例上繁琐的细节,只需要在抽象语义级别的特征空间上学会对数据的区分即可,因此模型以及其优化变得更加简单,且泛化能力更强。

43、本发明提出的预测模型对识别药物和蛋白质之间的相互作用是十分有意义的,对于药物再利用和潜在药物副作用的识别以及后续新药的研发存在一定的价值。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1