一种筛选和/或设计针对多靶标的药物的方法

文档序号:6558309阅读:172来源:国知局
专利名称:一种筛选和/或设计针对多靶标的药物的方法
技术领域
本发明涉及一种筛选和/或设计针对多靶标的药物的方法。
背景技术
目前,已有许多计算方法用于针对单一靶点的药物分子设计,一些已经广泛应用于单靶点药物先导化合物的发现。其中,最常见的计算方法包括分子对接,药效团方法, 构效关系(SAR),定量构效关系OiSAR),相似性搜索,机器学习以及以上几种方法的联合应用。最近,主要在基于片段拼接方式和组合方法方式的基础上,以上一些计算方法被发展用于多靶点先导化合物的发现。基于片段拼接的方式是把分别靶向于不同靶点的两个分子的骨架键连起来,组成一个单一分子,但仍保留对原有各自靶点的活性。而组合方法方式则是通过平行应用某一计算方法筛选作用于单靶标的分子,从中选出那些能同时靶向于多靶点的活性先导物。不过,以上几个方法所采用的参数或训练集都不是专门用于筛选多靶点分子的, 它们主要是针对单一靶点的计算机虚拟筛选方法。例如,分子对接的方法主要基于单分子对单分子之间的力场、统计得出的单分子对单分子之间相互作用以及分子间的结合函数。 分子对接可以测试分子对单一靶点的活性而不能确定它们对多个靶点可能存在的活性。同样,定量构效关系模型,药效团模型,机器学习回归分析以及分类模型等方法,则是通过把对单一靶点具有活性的分子分成训练集和测试集,虽已被证实对单一靶点有效果,但依然不能确定对多个靶点是否具有活性。对选定的多个靶点均具有活性的多靶点分子数量不足单一靶点活性分子数量的十分之一。因此,在训练集和测试集中单一靶点活性分子占据着绝对的多数。那些用于建立虚拟筛选模型的参数与特征以及模型的预测能力都被证实对训练集的分子组成相当敏感。因此,有必要利用已知多靶点分子对选定靶点的一些特征来开发用于筛选和发现多靶活性分子虚拟筛选的模型,可以显著提高多靶点药物发现的成功率。

发明内容
本发明的一个目的是提供一种筛选同时靶向作用于若干个靶标的药物先导物的方法。本发明所提供的筛选同时靶向作用于若干个靶标的药物先导物的方法,包括如下步骤1)构建训练集针对k个靶标,分别记作靶标1、靶标2、…、靶标K,搜寻阳性训练集和阴性训练集,K至少为2,具体如下在现有技术中的数据中搜寻能同时作用于所述k个靶标的物质,将这一类物质归为阳性训练集,记作训练集A ;在现有技术中的数据中,分别搜寻只作用于靶标1、靶标2、…或靶标K的物质,将针对靶标1、靶标2、…或靶标K的物质分别归为阴性训练集,阴性训练集Bl对应靶标1,阴性训练集B2对应靶标2,…阴性训练集他对应靶标k ;在现有技术中的数据中,搜寻不能作用于靶标1的物质,这一类物质记作训练集 Cl ;在现有技术中的数据中,分别搜寻不能作用于靶标1、靶标2、…或靶标K的物质, 将针对靶标1、靶标2、…或靶标K的物质分别归为训练集Cl、训练集C2、……或训练集 CK ;2)选择特征群1、特征群2........特征群k、特征群1-kI、选择特征群1第一步建立训练集寻找训练集A针对训练集Bl的多靶点特征,训练集A和Bl表述为Ixi, yj e RpX {-1,+1},其中Xi表示训练集A或Bl中的样本的特征矢量,Yi表示类标,Yi = 1 表示训练集A中的样本,y, = -1表示训练集Bl中的样本,ρ表示特征矢量的维数,Rp表示位数为P的实数空间。第二步建立SVM模型SVM首先通过核函数Φ (χ)将训练样本投影到一个高维空间,并计算决策函数 f(x) = <w, Φ (X) >+b。W是超平面的标准向量。对于线性可分的样本集,采用线性核函数,并使得yi[(wXi)+b]-l彡0,i = 1,...,N,·/= IlHI2在约束条件下最下化目标泛涵。第三步建立RFE-SVM特征群选择数学模型考虑第i个特征对目标函数J的影响,由泰勒展开可得
权利要求
1. 一种筛选同时靶向作用于若干个靶标的药物先导物的方法,包括如下步骤1)构建训练集针对k个靶标,分别记作靶标1、靶标2、…、靶标K,搜寻阳性训练集和阴性训练集,K 至少为2,具体如下在现有技术中的数据中搜寻能同时作用于所述k个靶标的物质,将这一类物质归为阳性训练集,记作训练集A ;在现有技术中的数据中,分别搜寻只作用于靶标1、靶标2、…或靶标K的物质,将针对靶标1、靶标2、…或靶标K的物质分别归为阴性训练集,阴性训练集Bl对应靶标1,阴性训练集B2对应靶标2,…阴性训练集Bk对应靶标k ;在现有技术中的数据中,搜寻不能作用于靶标1的物质,这一类物质记作训练集Cl ; 在现有技术中的数据中,分别搜寻不能作用于靶标1、靶标2、…或靶标K的物质,将针对靶标1、靶标2、…或靶标K的物质分别归为训练集Cl、训练集C2、……或训练集CK ;2)选择特征群1、特征群2........特征群k、特征群1-kI、选择特征群1 第一步建立训练集寻找训练集A针对训练集Bl的多靶点特征,训练集A和Bl表述为{Xi,yi} e RpX {-1, +1},其中Xi表示训练集A或Bl中的样本的特征矢量,Yi表示类标,Yi = 1表示训练集A中的样本,Yi = -1表示训练集Bl中的样本,ρ表示特征矢量的维数,Rp表示位数为P的实数空间。第二步建立SVM模型SVM首先通过核函数Φ (χ)将训练样本投影到一个高维空间,并计算决策函数f (χ)= <w, 0(X)>+b。w是超平面的标准向量。对于线性可分的样本集,采用线性核函数,并使得yi[(w · Xi)+b]-l彡0,i = 1,...,N,·/=IlHI2在约束条件下最下化目标泛涵。第三步建立RFE-SVM特征群选择数学模型考虑第i个特征对目标函数J的影响,由泰勒展开可得Δ/ ⑴=)2 + …OWiOWi在目标函数J的最优点上,一阶项为零,因此只考虑二阶项,同时假设样本集线性可分,可得Δ J(i) = (Awi)2当移除第i个特征时,Awi = Wi,因此第i个特征对目标函数的影响大小为Ci = (Wi)20根据ci权值计算特征矢量Xi中的所有特征量的排列准则,去除影响最小的特征量.重复以上步骤,通过循环运算得到余下的特征量即为适用于筛选与靶标1有关的、同时作用于K个靶标的特征群,记作特征群1 ;特征群1包括最终选出的排在前-10%的对区别训练集A和训练集Bl有最大贡献的特征量;所述影响最小的特征量为排在最后10%的特征量;II、选择特征群2将训练集Bl替换成训练集B2,其余方法与步骤I中所述相同;得到特征群2 ;用于筛选与靶标2有关的、同时作用于K个靶标的特征群,记作特征群2 ;K、选择特征群K将训练集Bl替换成训练集他,其余方法与步骤I中所述相同;得到特征群业;用于筛选与靶标K有关的、同时作用于K个靶标的特征群,记作特征群K ;K+1、选择特征群l_k特征群1、特征群2、……和特征群K共有的特征即为特征群Ι-k ;3)建立筛选模型第一步训练集A和Bl合为训练集AB1,作为阳性训练集;训练集Cl作为阴性训练集;以所述特征群1来建立训练集ABl和Cl中的样本的特征矢量,训练集ABl和Cl可表述为Ixi, yj e RpX {-1,+1},其中Xi表示训练集ABl或Cl中的样本的特征群1所组成的特征矢量, Yi表示类标,标类Yi = 1表示表示训练集ABl中的样本,Yi = -1表示表示训练集Cl中的样本;建立作用于靶标1的SVM筛选模型,记作SVM筛选模型1 ;第二至第K步用第一步中的方法以此类推建立作用于靶标2、靶标3.....靶标K的SVM筛选模型,依次记作SVM筛选模型2、SVM筛选模型3、…、SVM筛选模型K ;第K+1步训练集A作为阳性训练集,训练集Bi,B2,B3,...和Bk合为训练集B1-K, 作为阴性训练集,以特征群l_k来建立训练集A和Bl-K中的样本的特征矢量,训练集A和 Bl-K可表述为Ixi, yj e RPX{-1,+1},其中Xi表示训练集A或Bl-K中的样本的特征群 Ι-k所组成的特征矢量,Yi表示类标,标类yi = 1表示表示训练集A中的样本,yi = -1表示表示训练集Bl-K中的样本;建立同时作用于所述K个靶标的SVM筛选模型,记作SVM筛选模型K+1 ;4)用所述目的筛选模型判断待筛选物质是否为同时靶向作用于若干个靶标的药物先导物第一步对于每一个待筛选的分子,特征群1,特征群2,...,特征群K,特征群Ι-k作为其特征矢量,将所述待筛选的分子的特征群1代入SVM筛选模型1,进行计算;若结果符合如下条件 i,则确认该待筛选分子为靶向作用于靶标1的药物先导物;若结果符合如下条件ii,则确认该待筛选分子不是靶向作用于靶标1的药物先导物;
2. 一种筛选和/或设计同时靶向作用于若干个靶标的药物的方法,包括如下步骤1)按照权利要求1所述方法筛选得到同时靶向作用于若干个靶标的药物先导物的集合,记作药物先导物群I;2)利用分子对接方法、药效团模型方法、定量构效模型方法和/或机器学习方法从所述药物先导物群I中筛选和/或设计出同时靶向作用于所述若干个靶标的药物先导物;3)制备得到步骤2、中所述药物先导物;4)将步骤幻所述药物先导物进行生物学检测,通过生物学检测的药物先导物即为目的同时靶向作用于所述若干个靶标的药物。全文摘要
本发明公开了一种筛选和/或设计针对多靶标的药物的方法。本发明方法包括如下步骤针对k个靶标,分别记作靶标1、靶标2、…、靶标K,搜寻阳性训练集和阴性训练集;分别基于阳性训练集和阴性训练集,得到多靶标特征;基于所述多靶标特征,用SVM法构建目的筛选模型;用所述目的筛选模型判断待筛选物质是否为同时靶向作用于若干个靶标的药物先导物。本发明方法筛选效率高,在药物的开发设计领域具有广阔的应用前景。
文档编号G06F19/24GK102222178SQ201110174760
公开日2011年10月19日 申请日期2011年6月27日 优先权日2011年3月31日
发明者蒋宇扬, 陈宇综, 马晓华 申请人:清华大学深圳研究生院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1