小分子属性预测模型构建方法、装置、设备及存储介质与流程

文档序号:35662122发布日期:2023-10-06 17:04阅读:43来源:国知局
小分子属性预测模型构建方法、装置、设备及存储介质与流程

本技术涉及计算机,尤其涉及一种小分子属性预测模型构建方法、装置、设备及存储介质。


背景技术:

1、药物研发是一个复杂、漫长且昂贵的过程,通常需要10-15年的研究和8-15亿美元的资金,才能将一个药物从抽象的概念变成可以上市的产品。每年有90%的药物在食品药品监督管理局(food and drug administration,fda)的评估中失败,使其无法用于实际治疗。2018年11月,一项研究对fda批准的新型药物的试验总成本进行了估算,研究表明,2015至2016年期间fda批准的59种新药的平均试验成本为1900万美元。所以,开发以最小错误率识别潜在的药物-靶标(靶点)相互作用的计算方法越来越受到人们的追捧。迄今为止开发的大多数方法都是利用二元分类来预测药物与其靶点之间是否存在相互作用。

2、然而,预测药物-靶标相互作用通常采用传统的机器学习方法,传统的机器学习模型是在特定目的的内部建立的数据集上训练的,其准确性有限,从而导致预测药物-靶标相互作用的效果较差、准确度较低。


技术实现思路

1、本技术提供一种小分子属性预测模型构建方法、装置、设备及存储介质,用于提高预测药物-靶标相互作用的效果和准确度。

2、为达到上述目的,本技术采用如下技术方案:

3、第一方面,提供了一种小分子属性预测模型构建方法,该方法包括:基于预训练模型中包括的三层gcn网络对应的参数,构建目标模型,目标模型包括多个平行的二层全连接层;获取多个化合物对应的参数信息,并依次将多个化合物对应的参数信息输入至目标模型中,得到每个化合物对应的多个目标结果,多个平行的二层全连接层中的一个平行的二层全连接层对应一个目标结果,参数信息包括以下至少一个参数:p53转录活性水平、hif-1转录活性水平、wnt信号转导通路、pparγ转录活性水平、stat3/nf-κb转录活性水平,多个平行的二层全连接层的数量与参数信息包括的参数的数量相同;基于多个化合物中的每个化合物对应的参数信息和每个化合物对应的多个目标结果,调整目标模型中包括的三层gcn网络的第三层gcn网络的参数,得到小分子属性预测模型。

4、在一种可能的实现方式中,方法还包括:从预设数据库中获取多个预设训练数据,多个预设训练数据中的每个预设训练数据包括:分子式、预设logp值;将多个预设训练数据中的每个预设训练数据依次输入至预设的基础模型中,得到每个预设训练数据对应的目标logp值;基于每个预设训练数据对应的目标logp值和预设logp值,调整基础模型中包括的三层gcn网络的参数,得到预训练模型。

5、在一种可能的实现方式中,将多个预设训练数据中的每个预设训练数据依次输入至预设的基础模型中,得到每个预设训练数据对应的目标logp值,包括:将多个预设训练数据中的每个预设训练数据依次输入至预设的基础模型中,基于基础模型中包括的三层gcn网络获得每个预设训练数据对应的特征向量;基于每个预设训练数据对应的特征向量和基础模型中包括的一个二层全连接神经网络层,得到每个预设训练数据对应的目标logp值。

6、在一种可能的实现方式中,基于预训练模型中包括的三层gcn网络对应的参数,构建目标模型,包括:将预训练模型中包括的一个二层全连接神经网络层替换为多个平行的二层全连接神经网络层,并锁定预训练模型中包括的三层gcn网络的前两层gcn网络的参数,得到目标模型。

7、第二方面,提供了一种小分子属性预测模型构建装置,该小分子属性预测模型构建装置包括:处理单元和获取单元;处理单元,用于基于预训练模型中包括的三层gcn网络对应的参数,构建目标模型,目标模型包括多个平行的二层全连接层;获取单元,用于获取多个化合物对应的参数信息;处理单元,用于依次将多个化合物对应的参数信息输入至目标模型中,得到每个化合物对应的多个目标结果,多个平行的二层全连接层中的一个平行的二层全连接层对应一个目标结果,参数信息包括以下至少一个参数:p53转录活性水平、hif-1转录活性水平、wnt信号转导通路、pparγ转录活性水平、stat3/nf-κb转录活性水平,多个平行的二层全连接层的数量与参数信息包括的参数的数量相同;处理单元,用于基于多个化合物中的每个化合物对应的参数信息和每个化合物对应的多个目标结果,调整目标模型中包括的三层gcn网络的第三层gcn网络的参数,得到小分子属性预测模型。

8、在一种可能的实现方式中,获取单元,用于从预设数据库中获取多个预设训练数据,多个预设训练数据中的每个预设训练数据包括:分子式、预设logp值;处理单元,用于将多个预设训练数据中的每个预设训练数据依次输入至预设的基础模型中,得到每个预设训练数据对应的目标logp值;处理单元,用于基于每个预设训练数据对应的目标logp值和预设logp值,调整基础模型中包括的三层gcn网络的参数,得到预训练模型。

9、在一种可能的实现方式中,处理单元,用于将多个预设训练数据中的每个预设训练数据依次输入至预设的基础模型中,基于基础模型中包括的三层gcn网络获得每个预设训练数据对应的特征向量;处理单元,用于基于每个预设训练数据对应的特征向量和基础模型中包括的一个二层全连接神经网络层,得到每个预设训练数据对应的目标logp值。

10、在一种可能的实现方式中,处理单元,用于将预训练模型中包括的一个二层全连接神经网络层替换为多个平行的二层全连接神经网络层,并锁定预训练模型中包括的三层gcn网络的前两层gcn网络的参数,得到目标模型。

11、第三方面,一种电子设备,包括:处理器以及存储器;其中,存储器用于存储一个或多个程序,一个或多个程序包括计算机执行指令,当电子设备运行时,处理器执行存储器存储的计算机执行指令,以使电子设备执行如第一方面的一种小分子属性预测模型构建方法。

12、第四方面,提供了一种存储一个或多个程序的计算机可读存储介质,该一个或多个程序包括指令,上述指令当被计算机执行时使计算机执行如第一方面的一种小分子属性预测模型构建方法。

13、本技术提供了一种小分子属性预测模型构建方法、装置、设备及存储介质,应用于预测药物-靶标相互作用的场景中。首先基于预训练模型中包括的三层gcn网络对应的参数,构建包括多个平行的二层全连接层的目标模型。然后进一步的获取多个化合物对应的参数信息,并依次将多个化合物对应的参数信息输入至目标模型中,从而得到每个化合物对应的多个目标结果。从而,基于多个化合物中的每个化合物对应的参数信息和每个化合物对应的多个目标结果,调整目标模型中包括的三层gcn网络的第三层gcn网络的参数,既可以得到小分子属性预测模型。通过上述方法,基于获取的多个化合物对应的参数信息,对基于预先训练好的预训练模型中包括的三层gcn网络对应的参数构建的目标模型进行训练,从而基于训练结果,调整目标模型中包括的三层gcn网络的第三层gcn网络的参数,即可得到小分子属性预测模型。从而通过得到的小分子属性预测模型,即可提高预测药物-靶标相互作用的效果和准确度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1