一种使用图转换器进行药物反应预测的多模态方法

文档序号:36739267发布日期:2024-01-16 12:55阅读:53来源:国知局
一种使用图转换器进行药物反应预测的多模态方法

本发明涉及药物反应预测,尤其是涉及一种使用图转换器进行药物反应预测的多模态方法。


背景技术:

1、癌症治疗中,耐药性问题是需要关注的重要问题,因为治疗的耐药性仍然是导致癌症治疗失败和相关死亡的主要原因。因此,药物反应预测(drp)在癌症治疗中至关重要,并已成为个性化医学研究的重要课。准确预测治疗反应有助于为患者设计更有效的治疗方案,并为开发新的抑制疾病药物提供重要见解。

2、目前,虽然drp研究取得了重大进展,但仍有一些问题值得考虑。例如,现有研究常将药物表示为字符串形式,这不是表示分子的自然方式,可能会导致结构信息的丢失。另外,大多数的药物反应预测研究通过使用单个基因水平的特征预测药物反应,如基因突变或基因表达水平,而忽视了它们的通路组合(或基因集)含义。


技术实现思路

1、本发明的目的是提供一种使用图转换器进行药物反应预测的多模态方法,该方法具有优越的性能,在对未知药物细胞系对和异种移植物的预测具有很强的泛化能力和适用性。

2、为实现上述目的,本发明提供了一种使用图转换器进行药物反应预测的多模态方法(gpdrp),包括以下步骤:

3、s1、获取细胞系数据和药物反应信息,计算基因通路活性评分;

4、s2、获取化合物的药物数据并构建药物分子图;

5、s3、通过结合图转换器的图同构网络提取药物特征;

6、s4、将步骤s1中计算的基因通路活性评分作为深度神经网络的输入,通过深度神经网络提取细胞系特征;

7、s5、将提取的药物特征和提取的细胞系特征经过全连接层进行药物反应预测。

8、优选的,步骤s1中,获取细胞系数据和药物反应信息,计算基因通路活性评分具体为:

9、从公开的细胞系基因表达数据库中获取细胞系基因表达数据,对细胞系基因表达数据进行量化,将量化后的细胞系基因表达数据转换为官方基因符号;

10、从公开的药物反应信息数据库获取细胞系基因表达数据相对应的药物反应信息;

11、基因通路活性评分通过r语言软件包计算。

12、优选的,步骤s2中,获取化合物的药物数据并构建药物分子图,具体操作为:从步骤s1中公开的药物反应信息数据库中获取药物信息,使用python中的pubchempy库检索药物的唯一的标准简化分子线性输入规范结构smiles字符串,使用开源的化学信息学软件包rdkit将smiles字符串转换为其相应的分子图g=(v,e)并提取原子特征;

13、其中,v是n个节点的集合,每个节点由f维的特征向量表示,e表示为邻接矩阵a的边集合,以特征矩阵x和邻接矩阵a的形式进行存储,x∈rn×f由图中的n个节点组成,每个节点由f维的特征向量表示;a∈rn×n代表节点之间的连接边。

14、优选的,原子被表示为药物分子图g=(v,e)图中的节点,每个节点表达了一组原子特征,包含五条信息:原子符号、相邻原子的数量、相邻氢原子的数量、原子的隐含价及原子是否在芳香结构中。

15、优选的,步骤s3中,通过结合图转换器的图同构网络提取药物特征,包括以下步骤:

16、s31、药物分子图g=(v,e)经过图同构网络进行第一次卷积操作,通过邻接矩阵a将节点自身特征与相邻节点的特征进行聚合,具体操作为:假设药物分子图g=(v,e)中有n个节点,每个节点的初始特征表示为则聚合后的特征表示为:

17、

18、其中,为聚合后的特征,n(i)表示节点i的相邻节点的集合,μ是可学习的参数或固定的标量;为节点i的相邻节点j的初始特征;j为节点i的相邻节点;

19、s32、通过权重矩阵w和偏置项b对聚合后的特征进行线性变换,并使用激活函数relu进行非线性激活:

20、

21、

22、其中,w(1)和b(1)是可学习的参数;

23、s33、将步骤s32学习到的特征通过图转换器层,图转换器的原理如下:药物分子图g=(v,e)有一组节点tv和一组边te,邻接矩阵a∈rn×n×k,其中k=|te|,特征矩阵x∈rn×f,预测节点之间新连接的元路径定义为:

24、ap=at1…atp   (3)

25、其中,ats是元路径第s个边的邻接矩阵,对于每个邻接矩阵,选择使用1×1卷积的软邻接矩阵q为:

26、q=f(a,wφ)=φ(a,soft max(wφ))   (4)

27、其中,φ是卷积层,wφ∈r1×1×k是卷积层φ的权重张量,f(a,wφ)结合图卷积网络,节点表示形式为:

28、

29、其中,z是邻域连通函数;c为卷积层输出通道的数量;σ为卷积层的激活函数,用于非线性变换;是第l个卷积层的第m个通道的邻接矩阵加上单位阵,i为单位阵;是的度矩阵;

30、图转换器使用拉普拉斯特征向量来克服节点的确定问题:

31、δ=i-d-1/2ad-1/2=utλu   (6)

32、其中,u和λ分别是特征向量和特征值,t为矩阵的转置;

33、同时,在图转换器层使用多头注意力机制得到节点特征接着采用线性变化和非线性激活函数relu,得到新的节点特征:

34、

35、

36、其中,为新的节点特征;w(2)和b(2)为可学习的参数;

37、s34、再次通过与步骤s31中相同的图同构网络层对新的节点特征进行第二次卷积操作,采用相同的线性变换和激活函数,卷积操作后应用批量标准化来规范化特征,得到节点特征矩阵,从而更深层次的进行特征提取;

38、s35、对所有节点的特征通过全局最大池化层,获得图表示向量hglobal,这是在步骤s35得到的节点特征矩阵的每个特征维度上取最大值,包含了整个图的表示,最后通过全连接层获得128维的药物特征向量。

39、优选的,步骤s4中,深度神经网络架构由一个输入层和三个密集层组成,神经网络的神经元数量分别为512、1024和128,激活函数relu激活函数;

40、在第二个密集层之后添加了dropout层;然后输出被展平为细胞系表示的128维的细胞系特征向量;

41、其中,dropout率设置为0.2。

42、优选的,步骤s5中,将提取的药物特征和提取的细胞系特征经过全连接层进行药物反应预测,具体操作为:将128维的药物特征向量和128维的细胞系特征向量连接在一起,形成融合的256维特征向量,256维特征向量经过两个全连接层,输出每个药物-细胞系组合的ln ic50值,来预测药物反应;

43、其中,两个全连接层的节点数分别为1024和128,每一层包括线性变换、relu激活函数和dropout操作。

44、因此,本发明采用上述一种使用图转换器进行药物反应预测的多模态方法,其技术效果如下:

45、(1)本方法将药物分子图与基因通路活性评分相结合,利用两种类型数据的优势来增强模型的预测能力。

46、(2)该方法结合图转换器(graph transformer),使用图同构网络和深度神经网络进行预测,其性能由ccle/gdsc数据集证明,优于最新研究提出的precily模型。

47、(3)gpdrp展示了预测未知药物-细胞系组合的潜力,被用来预测gdsc中缺失的药物反应值,现有研究证明了gpdrp预测的准确性。

48、(4)gpdrp具有良好的适用性,被应用于lncap异种移植数据集的反应预测,并通过基因活性通路评分提供解释。

49、下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1