基于决策模板预测药物‑靶蛋白相互作用关系的方法和系统与流程

文档序号:12064120阅读:来源:国知局

技术特征:

1.基于决策模板预测药物-靶蛋白相互作用关系的方法,其特征在于,包括如下步骤:

步骤1)收集药物-靶蛋白作用数据集,构建二部图描述药物和靶蛋白对的相互作用;

步骤2)收集药物和靶蛋白的多种不同特征描述数据,并采用有效的数学方法将其转换为特征向量形式,其中,药物描述数据包括:药物的化合物分子结构,药物的ATC注释;靶蛋白的描述数据包括:靶蛋白的序列信息,靶蛋白的FC功能注释,靶蛋白参与的代谢通路信息,靶蛋白的GO功能注释;

步骤3)计算药物-药物相似性和靶蛋白-靶蛋白相似性

根据步骤2)中得到的药物和靶蛋白的不同描述信息,分别构建相应的相似矩阵,其中,药物的相似性通过其共同拥有的化合物分子结构,ATC注释得到,分别为靶蛋白对的相似性通过计算序列相似性,共同拥有的FC功能注释项数目,共同拥有的GO功能注释项及参与的代谢通路数目得到,分别为

步骤4)基于K近邻(KNN)分类算法预测药物与靶蛋白相互作用

对步骤3)中得到的2种药物相似性和4种靶蛋白相似性度量方法进行两两组合,形成8个分类特征组合,在不同的相似性特征组合下采用K近邻(KNN)分类算法预测药物与靶蛋白相互作用关系的得分,即:

药物的相似性:

靶蛋白的相似性:

组合形式:

当用于对新药物的靶蛋白预测(di,tj)时,采用靶蛋白特异的分类器,分两个阶段进行,第一阶段预测该新药di与一组相似靶蛋白组(包含候选靶蛋白tj)作用的可能性,第二阶段直接预测该新药di与该候选靶蛋白tj之间作用的可能性,并对两阶段的预测结果进行组合,得到在本组特征组合下药物和靶蛋白对(di,tj)的预测得分,对8个不同的特征相似性组合,样本集中的每个药物-靶蛋白作用关系对(di,tj)均会得到8个预测结果;

或者,当用于对新靶蛋白的药物预测(tj,di)时,采用药物特异的分类器,分两个阶段进行,第一阶段预测该新靶蛋白与一组相似药物组(包含候选药物di)作用的可能性,第二阶段直接预测该新靶蛋白tj与该候选药物di之间作用的可能性,并对两阶段的预测结果进行组合,得到在本组特征组合下药物和靶蛋白对(tj,di)的预测得分,对8个不同的特征相似性组合,样本集中的每个药物-靶蛋白作用关系对(tj,di)(即训练样本)均会得到8个预测结果;

步骤5)对步骤4)中得到的8个预测结果,采用决策模板进行决策级融合,其中训练样本的8个预测结果用于构建决策模板,由此得到药物与靶蛋白作用关系的预测模型;

步骤6)对新药物和候选靶蛋白对逐个进行独立集测试,预测该新药可能存在的相互作用靶蛋白;同样地,对新靶蛋白和候选药物逐个进行独立集测试,预测该新靶蛋白可能存在的相互作用药物。

2.根据权利要求1所述的基于决策模板预测药物-靶蛋白相互作用关系的方法,其特征在于,步骤4)中,新药物指在当前数据库中没有任何靶蛋白与该药物存在已知的作用关系,新靶蛋白指在当前数据库中没有任何药物与该靶蛋白存在已知的作用关系。

3.根据权利要求1所述的基于决策模板预测药物-靶蛋白相互作用关系的方法,其特征在于,步骤4)中,包含候选靶蛋白tj的相似靶蛋白组是由靶蛋白相似性矩阵(或网络),经过凝聚聚类算法得到,以药物相似性作为分类特征,采用K近邻(KNN)分类算法预测新药与候选靶蛋白tj所在的靶蛋白组以及候选靶蛋白tj之间的作用关系得分;

步骤4)中,构建包含候选药物di的相似药物组时,是由药物相似性网络,经过凝聚聚类算法得到的,以靶蛋白相似性为分类特征,采用K近邻(KNN)分类算法预测新靶蛋白与候选药物di所在组以及候选药物di之间的作用关系得分。

4.根据权利要求1所述的基于决策模板预测药物-靶蛋白相互作用关系的方法,其特征在于,所述步骤5)中,根据训练样本中每个药物-靶蛋白作用关系对(即样本)在8种相似性组合下得到的8个预测结果,组成决策谱DP(xi,yi)={dp1(xi),dp2(xi),…,dpL(xi)},i=1,...,N

其中,N为训练样本数目,L为分类器数目,L=8;

根据样本的标签值将所有训练样本的DP决策谱分成两组,并计算决策模板

<mrow> <msub> <mi>DT</mi> <mo>+</mo> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>N</mi> <mo>+</mo> </msub> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>N</mi> <mo>+</mo> </mrow> </munderover> <mi>D</mi> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>=</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>,</mo> <msub> <mi>DT</mi> <mo>-</mo> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>N</mi> <mo>-</mo> </msub> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>N</mi> <mo>-</mo> </mrow> </munderover> <mi>D</mi> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>,</mo> <msub> <mi>y</mi> <mi>j</mi> </msub> <mo>=</mo> <mn>0</mn> <mo>)</mo> </mrow> </mrow>

其中,N+和N-为训练样本中的正、负样本数目;

所述步骤6)中独立集测试方法如下,对测试集中的样本(x,y),其决策谱为DP(x,y)={p1(x),p2(x),…,pL(x)},判断该样本为正样本的得分为其中,μΔ(x)(Δ∈{+,-})是DP(x,y)和DTΔ之间的相似性得分,

5.根据权利要求1所述的基于决策模板预测药物-靶蛋白相互作用关系的方法,其特征在于,还包括如下步骤,步骤7)通过数据库和文献检索对预测结果进行验证,即通过最新的药物靶蛋白作用关系数据库和文献检索验证预测得到的新作用对,为进一步的生物实验提供有力的依据。

6.基于决策模板预测药物-靶蛋白相互作用关系的系统,其特征在于,包括:

构建数据集模块,用于收集及整理已知的药物和靶蛋白相关作用关系数据集

获取数据模块,用于获取描述药物和靶蛋白特征的数据;

数学建模模块,用于利用药物和靶蛋白的多种特征描述信息,分别构建多个药物相似性和靶蛋白相似性矩阵;由药物相似性矩阵构建相似药物组,由靶蛋白相似性矩阵构建相似靶蛋白组,对新药物的靶蛋白预测或新靶蛋白的药物预测均采用K近邻(KNN)分类算法,分两个阶段进行预测,并对两个阶段的预测结果进行组合,得到该药物和靶蛋白对在当前相似性特征组合下分类器的预测结果;多个分类器的预测结果采用决策模型进行决策级融合,建立药物-靶蛋白相互作用预测的模型;

模型测试模块,用于对新药物和靶蛋白之间相互作用进行独立集测试,预测该新药可能存在的相互作用靶蛋白,或用于对新靶蛋白和药物之间相互作用进行独立集测试,预测该新靶蛋白可能存在的相互作用药物,对模型新预测出的作用关系对,通过最新数据库和文献资料检索进行验证。

7.根据权利要求6所述的基于决策模板预测药物-靶蛋白相互作用关系的系统,其特征在于,预测新药物的相互作用靶蛋白,如预测(di,tj)的相互作用得分,可分两个阶段进行,第一阶段预测该新药di与一组相似靶蛋白组(包含候选靶蛋白tj)作用的可能性,由此得到新的药物-靶蛋白作用关系矩阵,并以此新矩阵为标签,药物相似性为分类特征,采用K近邻(KNN)分类算法预测该新药与候选靶蛋白tj的作用关系得分,实质为预测该新药与靶蛋白组的作用关系得分;

第二阶段直接预测该新药di与该候选靶蛋白tj之间作用的可能性,即以原始药物-靶蛋白作用关系矩阵为标签,药物di与所有药物的相似性为分类特征,采用K近邻分类算法预测di与候选靶蛋白tj之间的作用关系。

8.根据权利要求7所述的基于决策模板预测药物-靶蛋白相互作用关系的系统,其特征在于,靶蛋白组是由靶蛋白相似性矩阵(或网络),经过凝聚聚类算法得到。

9.根据权利要求6所述的基于决策模板预测药物-靶蛋白相互作用关系的系统,其特征在于,新靶蛋白的药物预测,如预测(tj,di)的相互作用得分,分两个阶段进行,第一阶段预测该新靶蛋白与一组相似药物组(包含候选药物di)作用的可能性,第二阶段直接预测该新靶蛋白tj与该候选药物di之间作用的可能性。

10.根据权利要求9所述的基于决策模板预测药物-靶蛋白相互作用关系的系统,其特征在于,构建包含候选药物di的相似药物组时,是由药物相似性网络,经过凝聚聚类算法得到的。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1