基于异构注意力网络的中药成分靶点相互作用预测方法

文档序号:37426248发布日期:2024-03-25 19:13阅读:18来源:国知局
基于异构注意力网络的中药成分靶点相互作用预测方法

本发明涉及药物作用预测,具体为基于异构注意力网络的中药成分靶点相互作用预测方法。


背景技术:

1、鉴别中药活性成分和疾病相关靶点的相互作用是挖掘中药药理学机制、促进中药临床应用的关键。质谱法、结构生物学技术、以及高通量的蛋白质芯片技术等生物实验被广泛用于识别成分与靶点的结合模式、位点、及亲和力。然而,实验成本昂贵且中药成分构成复杂,这促使提出新的方法预测中药成分与靶点的相互作用。

2、一种广泛采用的预测方法是网络药理学。其具体实现为,从多个公开数据库收集中药成分和疾病靶点的相关数据并构建“中药—成分—靶点—疾病”网络,然后采取网络分析方法找到中药治疗疾病的关键成分和核心靶点,最后通过go和kegg富集分析挖掘中药的作用机制。另一类方法则是将成分和靶点表征为特征向量,例如申请号为“202211079616.3”的申请,而他们的相互作用表示为类标签,然后采用机器学习算法将中药成分和疾病靶点相互作用的预测问题转化为成分-靶点对是否存在关联的二分类任务。

3、然而,现有的成分-靶点相互作用预测方法未能充分利用成分和靶点丰富的生物学特征,以及多种成分和靶点之间综合的复杂网络效应,因而预测效果不佳。

4、针对上述问题,所以需要基于异构注意力网络的中药成分靶点相互作用预测方法。


技术实现思路

1、本发明的目的在于提供基于异构注意力网络的中药成分靶点相互作用预测方法。本发明通过利用在大规模药物和蛋白质上进行训练的大生物模型构建成分和靶点的深层预训练嵌入,从而捕获其丰富的生物学特征。然后构建一个包含多种成分和靶点的异构网络,并采用异构注意力网络模型学习鲁棒的成分—靶点相互作用,同时避免噪声关联的影响,提升对成分—靶点相互作用的预测性能。

2、本发明是这样实现的,本发明提供基于异构注意力网络的中药成分靶点相互作用预测方法,具体按以下步骤执行:

3、s101:首先进行数据收集,具体从公开数据库平台收集中药成分和靶点数据,包括成分-靶点相互作用、成分smiles序列、靶点蛋白质序列、成分smiles序列的成分相似性、以及靶点蛋白质序列的靶点相似性数据;

4、其中公开数据库平台具体从hit2.0、pubchem以及uniprot平台进行数据收集,具体按以下步骤执行:

5、s201:从公开数据库hit2.0收集成分—靶点相互作用数据,该数据分为三类,包括成分-靶点直接作用数据、成分-靶点间接作用数据和成分-靶点调节作用数据;

6、s202:根据成分的标准英文名,从公开数据库pubchem收集成分smiles序列数据;

7、s203:根据靶点的uniprot id,从公开数据库uniprot收集靶点蛋白质序列;

8、其中,计算成分相似性和靶点相似性具体按以下步骤执行:

9、s204:计算成分smiles序列的成分相似性数据,首先使用rdkit工具从成分smiles序列数据中生成morgan指纹,然后基于morgan指纹计算成分对之间的谷本相似性,并为相似性大于0.5的成分对构建关联,谷本相似性计算如式(1);

10、

11、其中,fi和fj分别为两个成分的morgan指纹;

12、s205:计算靶点蛋白质序列的靶点相似性数据,首先使用smith-waterman算法计算靶点蛋白质序列之间的序列比对得分,并将其归一化到0-1之间;然后再选择得分大于0.3的靶点对构建关联;其中计算靶点蛋白质序列之间的序列比对得分如式(2);

13、

14、其中,si和sj为两个靶点蛋白质序列,sw(·)为两个序列的sw得分。

15、进一步,s102:进行数据预训练嵌入,具体从预训练大生物模型构建成分和靶点的深层预训练嵌入;具体按以下步骤执行:

16、s301:通过分子性质预测框架kpgt构建成分预训练嵌入,具体通过馈送smiles序列数据至kpgt进行构建成分预训练嵌入;

17、s302:通过蛋白质语言模型esm-2构建靶点预训练嵌入,具体通过馈送靶点蛋白质序列至esm-2进行构建靶点预训练嵌入。

18、进一步,s103:进行整合双层异构网络,具体根据成分smiles序列的谷本相似性构建成分相似性网络,根据靶点蛋白质序列的序列比对得分构建靶点相似性网络;然后将成分与靶点的相互作用网络、成分相似性网络、以及靶点相似性网络整合到一个双层异构网络中,形成成分-靶点双层异构网络;

19、其中,双层异构网络由邻接矩阵定义;具体如式(3);

20、

21、其中,si∈ri×i代表成分相似性矩阵,st∈rt×t代表靶点相似性矩阵,y∈ri×t代表成分—靶点相互作用矩阵。

22、进一步,s104:进行整合异构注意力网络,具体通过图卷积网络学习异构网络中成分与靶点的交互,进行整合构建异构注意力网络,形成中药成分-靶点相互作用预测模型,将多种成分和靶点的信息输入模型即可得出成分-靶点相互作用数据。

23、其中异构注意力网络具体包括特征映射层、负采样、异构图注意力层、评分函数和损失函数;具体按以下步骤执行

24、s501:使用特征映射层将预训练嵌入映射至图卷积网络输入层内;

25、s502:从异构网络中采样负样本;

26、s503:基于异构注意力网络聚合邻域信息并更新节点嵌入;

27、s504:计算成分-靶点对得分;

28、s505:计算模型训练损失,并跳转到步骤s501进行循环训练;

29、其中特征映射层由单层感知机构成,将成分预训练和靶点预训练嵌入纳入图卷积网络模型,特征映射层如式(4);

30、ein=w·ep+b    式(4)

31、其中,ep表示预训练嵌入,w为将预训练嵌入投影到异构注意力网络输入空间的权重矩阵,b为偏置向量,ein是输入层的节点嵌入。

32、进一步,其中负采样层采用全局均匀采样策略对异构网络中所有未观察到的成分-靶点对进行负采样,确保随机选择每个负样本的概率相等,概率p计算如式(5);

33、

34、其中,|i|和|t|为成分和靶点节点的总数,yij代表已知的成分—靶点交互。

35、进一步,在异构图注意力层,通过引入多头注意力机制进行动态评估邻居节点的重要性学习成分-靶点异构网络上的复杂关系,从而捕捉鲁棒的交互,并减轻噪声连接的影响,融合来自具有不同影响的相邻节点的信息,并细化节点嵌入。

36、其中,首先通过多头注意力机制分配多个注意力头学习节点之间多个潜在模式下的注意力系数,如公式(6)-式(7);

37、

38、

39、其中,是异构注意力网络l-层第k个注意力头的节点嵌入,w(l,k)是变换节点嵌入的权重矩阵,a(l,k)是一个可学习的参数向量,用于计算节点之间的原始注意力得分,σ(·)是激活函数leakyrelu,是注意力系数。

40、再执行异构图卷积操作聚合节点的邻域信息,并更新节点嵌入,如式(8)-式(9);

41、

42、

43、其中,是卷积计算后的(l+1)-层第k个注意力头的节点嵌入,为聚合多个注意力头后输出的节点嵌入;

44、进一步,评分函数层使用内积计算输出层的成分嵌入ei和靶点嵌入et之间的相互作用得分,如式(10);

45、ei·ej=|ei|×|ej|×cos(θ)     式(10)

46、其中,(·)代表内积操作,θ是两个嵌入之间的夹角;

47、损失函数层,具体通过引入间隔损失的一种变体来处理用于训练的正负样本中“一对多”的情况,确保正负样本在潜在向量空间之间的距离始终保持为1;如式(11);

48、

49、其中,nns代表每个正样本所对应的负样本数,代表负样本得分,s+代表正样本得分。

50、进一步,本发明提供一种计算机可读存储介质,存储介质存储有计算机程序,所述计算机程序被主控制器执行时实现如上述中的任一项所述的方法。

51、与现有技术相比,本发明的有益效果是:

52、1、本发明基于预训练大生物模型构建成分和靶点的深层预训练嵌入,为模型训练和预测提供丰富的生物学特征。将多种成分和靶点的信息整合到一个综合的成分—靶点双层异构网络中,充分利用复杂网络效应,以更全面地挖掘成分—靶点相互作用的底层机制。进一步利用异构注意力网络学习成分与靶点在网络上的复杂交互,提升对成分—靶点相互作用的预测性能。

53、2、本发明综合运用预训练策略和异构注意力网络,通过引入成分和靶点丰富的生物学特征并学习网络上的复杂交互,在性能评估中表现最佳。即使在不使用预训练的条件下,得益于多头注意力机制和精心策划的训练策略,所述方法也优于表现最优的基线模型imchgan。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1