基于药效团模型的全新药物分子构建方法

文档序号:6459848阅读:1195来源:国知局
专利名称:基于药效团模型的全新药物分子构建方法
技术领域
本发明涉及计算机辅助药物分子设计领域,特别涉及一种使用药效团模型作为初始信 息进行药物分子构建的全新方法。
背景技术
按照传统的药物开发流程,研发一个新药至少需要io年时间,而且费用昂贵,不仅如此,其成功率也非常低。近年来,计算机技术已被应用于药物研发,被认为是縮短新药研 发周期,降低研发费用和提高成功率的有效手段。计算机应用于药物研发的主要途径是计算机辅助药物分子设计,而其中以基于耙蛋白 分子三维结构的设计方法最受青睐。基于靶蛋白分子三维结构的设计方法主要包括分子对 接和从头设计方法。分子对接方法简单,但通过该方法找到的化合物均为已知,不具有新 颖性或已经受到专利保护。而从头设计方法生成的化合物一般为全新的化合物,具有新颖 性。因此,从头设计方法被认为是未来的发展方向。但从头设计方法存在的问题是该方法 的使用必须在耙蛋白分子的三维结构已知的情况下才能进行,对于靶蛋白分子三维结构不 确定的情况下,则无能为力。另外,从头设计方法的另一个缺陷是设计获得的化合物往往 合成难度大甚至不能合成。因此,发展一种有效方法,充分发挥从头设计方法在产生全新 化合物方面的优势,克服其使用中受到必须已知靶蛋白分子三维结构的限制,同时使新设 计的化合物尽可能易于合成,将大大促进创新药物的研发。发明内容本发明的目的,是解决药物分子从头设计必须依赖于靶蛋白分子三维结构结构信息完 全已知,否则无法进行的不足,同时克服新设计的化合物的不易合成的缺陷。借助基于该 耙蛋白分子的配体构建的药效团模型,发展基于药效团模型的全新药物分子构建方法,从 而在耙蛋白分子三维结构信息未知的情况下,实现药物分子从头设计,达到构建的药物分子既能完全满足药效团模型的要求,同时又具有新颖性和可合成性。 本发明的基本思路是在靶蛋白分子三维结构信息未知的情况下,利用从大量已知活性的化合物中抽提出对 化合物活性起重要作用的药效特征元素即药效团模型进行药物分子的从头设计。本发明首 先建立药效特征片段和连接子数据库,将药效特征片段叠放于药效团模型的适当位置,通 过遗传算法控制药效特征片段的连接过程,从而产生完全满足药效团模型的新分子。对新 产生的化合物,通过经验规则和逆合成规则,进行可合成性评价,使最后获得的化合物在 保证新颖性的前提下,具有可合成性。这种思路的基本理论是基于(1)由于药效团模型 的药效特征元素常常是一个抽象的特征,如疏水基团、氢键受体、氢键供体、芳香性基团 等,选择不同的药效特征片段,通过从头设计方法中的片断连接法法可以设计出完全满足 药效团模型要求的全新化合物分子;(2)药效团模型方法与药物分子从头设计方法相结合, 发挥从头设计方法在设计全新化合物方面的优势,克服从头设计方法的不能处理未知靶点 问题的缺陷,由于生成的化合物可以完全满足药效团模型,这样可以进一步提高从头设计 的化合物的命中率;(3)关于新化合物的可合成性评价问题,研究已经表明可根据经验规 则和逆向合成原理进行预测。本发明的目的是这样达到的-一种基于药效团模型的全新药物分子构建方法,其特征在于在靶蛋白分子三维结构未知的情况下,借助基于该靶蛋白分子的配体构建的药效团模型,选择药效特征片段,将 药效特征片段叠放于药效团模型的适当位置,使用遗传算法控制药效特征片段的连接,构 建完全满足药效团模型的新分子,同时,对新生成的化合物进行可合成性评价。实现本方法的基本步骤有以下8步(1)准备并输入药效团模型利用其它常规药效团建模软件生成基于小分子活性化合物的药效团模型,并保存为 药效团模型文件;读取该药效团模型的相关信息,包括药效特征元素的个数、权重、类型、三维坐标和范围,排斥球的个数、三维坐标和范围,对于氢键供体HBD、氢键受体HBA、 一般芳环AR0这三类药效特征元素,还要计算配体-受体间的向量方向; (2)建立药效特征片段和连接子数据库 将常见药物分子拆分成较小的片段,根据其化学功能决定其所属药效特征,并建立药 效特征片段数据库,分子量小于200道尔顿的则构成连接子数据库。每个数据库都有一个 索引文件,通过索引文件读取数据库中的骨架信息,读取片段中的原子数目、键数目、原 子类型、原子三维坐标、键类型、成键原子,同时,通过这些基本信息,计算一些扩展信 息,包括环数目、邻近原子数、邻近非氢原子数等;(3) 在药效团模型的框架中合理放置药效特征片段,初始化种群-从药效特征片段数据库中按权重随机读取一个符合药效特征的片段并计算该片段的药效中心和平移矩阵,将药效特征片段的几何中心平移至药效团模型中药效特征元素的几 何中心进行叠合。对于氢键供体HBD、氢键受体HBA和一般芳环ARO三类药效特征,计算 片段的旋转矩阵,通过旋转操作将方向旋转至符合药效特征方向。对每个药效特征元素, 都进行放置药效团模型的操作,得到多个独立的符合药效特征元素的片段,即产生一个初 始种群。在中心和方向不变的情况下,设置一个随机选择矩阵,进行随机旋转,使其不发 生碰撞,再进行分子量检测,如果分子量超出界限,则将大分子量的片段替换,直到分子 量满足条件,即初始化种群成功。(4) 根据药效特征片段上的连接位点间空间位置,计算连接位点间的距离和角度, 判断是否直连药效特征片段还是加入连接子(5) 对生成的分子进行药效团特征、空间位阻限制和药效性质的判断;(6) 计算个体适应度即计算每个得到的分子的Fit值;(7) 使用遗传算法,根据适应度进行杂交操作,并按一定概率进行适当的突变操作, 产生新的种群,并继续进行药效团特征和空间位阻限制的判断;在设定的遗传代数下,循 环操作,得到最优的适应度;(8)对产生的新化合物进行可合成性评价,最后产生易于合成的新化合物清单供进 一步的化学合成。所述建立药效特征片段数据库和连接子数据库,是按照药效特征和分子量划分为药效 特征片段数据库和连接子数据库,其药效特征片段数据库为8个,连接子数据库为l个, 8个药效特征片段数据库分别是氢键供体、氢键受体、 一般芳环、疏水芳环、疏水脂肪、 一般疏水、正电基团和负电基团,连接子数据库是剔除了基本数据库中分子量大于200的 分子后保留所得。所述对生成的分子进行药效团特征、空间位阻限制和药效性质的判断,其药效性质的 各项判断是a) 判断各片段是否己经连成一个分子;b) 判断分子是否满足生物利用度规则;c) 判断分子是否有违规的化学结构;d) 判断分子是否符合药效团特征;e) 判断分子间原子是否发生碰撞。所述检査药效特征片段的连接位点间的空间位置,包括检查两个连接点间的距离、两 个连接点分别在平面内的角度和两个平面的二面角。若这些参数与直连的条件符合,则使 用直连药效特征片段方式;若这些参数与某个连接子的条件符合,则使用那一个连接子。所述对产生的新化合物进行可合成性评价,是通过经验规则和逆合成规则进行可合成 性评价,具体是将可合成性放在隐氢图中考虑,分别对环连接度c/^fcc-^xa + Z,原子 类型c^c& = C/7;c^: + A:,逆合成方法进行评价,得到最后的cpxtx值。i是环连接度对可 合成型的贡献值,k是原子类型对可合成型的贡献值。本发明的积极效果是本发明充分利用了计算机处理外部巨大数据的独特优势,将现有的药效团模型用作本发明中的基础数据。 一方面在靶蛋白分子三维结构未知或其结构尚不确定的情况也能使用从头设计方法构建全新的药物分子;另一方面对新设计的全新化合物进行可合成性评价,使获得的化合物在完全满足药效特征元素要求和具有新颖性的条件 下,同时具有可合成性。


图1本发明的构建方法程序流程图。 图2读取药效团模型流程图。图3药效特征片段叠放于药效团模型的适当位置的流程图。
具体实施方式
附图给出了发明的具体实施过程示例。 本发明的方法在药物分子的构建过程中实现。(1) 准备并输入药效团模型-本实施示例使用的药效团模型是软件Catalyst产生的CHM文件,这是目前最流行的记 录药效特征信息的文件格式。除了基本的药效特征之外,还支持含有排斥球的CHM文件, 可以读取这类文件中的排斥球信息。CHM文件中,记录药效特征的信息位于文件的最后, 以标识"FIT"定位。定位到"FIT"位置后,程序依次读入药效特征信息有药效团个数、 每个药效特征的权重和类型、排斥球的个数、排斥球的中心三维坐标和范围、药效特征的 中心三维坐标和范围。对于氢键供体、氢键受体、 一般芳环这三类药效特征还计算配体-受体间的向量方向。这些信息,会用于下面的药物设计过程以及结果评价过程。(2) 建立药效特征片段和连接子数据库-药效特征片段数据库的基础数据来源于MayBridge数据库,同时补充了一些常见的复 杂度较小的片段,组成基本数据库。接下来,对这个基本数据库按药效特征进行划分,包 括8个药效特征片段数据库和一个连接子数据库。8个药效特征数据库是氢键供体、氢键 受体、 一般芳环、疏水芳环、疏水脂肪、 一般疏水、正电基团和负电基团。这些数据库中 可能存在重合的片段,因为一个片段可能含有几个药效特征。而连接子数据库,是剔除了 基本数据库中分子量大于200的那部分后保留所得。每个数据库中都有一个索引文件,用于下面的读取。通过索引文件,程序读取每个数据库中的每个药效特征片段,主要读取原 子数目、键数目、原子类型、原子三维坐标、键类型、成键原子。同时,通过这些基本信 息计算扩展信息,包括环数目、邻近原子数、邻近非氢原子数等,用于后面的药物设计。 (3)在药效团模型的框架中合理放置药效特征片段,初始化种群在其他从头设计程序中都需要自己预先通过靶点或其他信息,放置初始片段,然后通过 生长连接等方法进行分子构建。本发明可以通过已知的药效团三维信息和排斥球信息,实现 初始片段的自动放置,并在放置中实现初始化种群。a) .根据药效特征元素,从片段数据库中按权重随机读取一个满足药效特征要求的片段。b) .计算该片段的药效中心。c) .计算平移矩阵,将该分子平移至药效特征元素中心。设平移矩阵为Mat,变换前的向量为p,变换后的新向量//为// = /7*71/^其中p的 齐次坐标为O,;;,z,l) , ; '的齐次坐标为(x',/,z',1)<formula>formula see original document page 9</formula>其中 Z^ = x'—x = Z)z = z'—zd) 对于氢键供体HBA、氢键受体HBD和一般芳环ARO三类药效特征,还有方向的限制。因 此,需要通过旋转操作进行调整。构造旋转矩阵,将方向旋转至符合药效特征方向。设旋 转矩阵为Mat,变换前的向量为p,变换后的新向量/Z为; '-;^iW^其中p的齐次坐标为 (;c,y,z,l) , 的齐次坐标为<formula>formula see original document page 9</formula>其中 c = cosP, s = sin^,l一c, 旋转的角度。e) .对每个药效特征元素,都进行以上操作,得到多个独立的符合药效特征元素的片段。 这些片段,可能相互之间发生碰撞,可能会与排斥球发生碰撞,因此在中心和方向不变的 情况下,设置一个随机选择矩阵进行随机旋转,使其不发生碰撞。f) .进行分子量检测,如果分子量超出界限,则对大分子量的片段进行替换,直到分子量 满足条件。(4)根据药效特征片段上的连接位点间空间位置,计算连接位点间的距离和角度,判断 是否直连药效特征片段还是加入连接子。检査药效特征片段的连接位点间的空间位置,包括检查两个连接点间的距离、两个连 接点分别在平面内的角度和两个平面的二面角。若这些参数与直连的条件符合,则使用直 连药效特征片段方式;若这些参数与某个连接子的条件符合,则使用这个连接子。 (5)对生成的分子进行药效团特征、空间位阻限制和药效性质的判断。a) .判断各片段是否已经连成一个分子。b) .判断分子是否满足生物利用度规则,本例使用Lipinski规则,S卩分子量不能大于500, 1ogP不能大于5,氢键供体数目不能大于5,氢键受体数目不能大于IO。c ).判断分子是否有违规的化学结构。用子图匹配算法,来判断分子中是否含有违规的化 学结构。违规结构主要是指两个重原子(N, 0等)以单键形式连接在同一个C上,如0"C-0, N-C-N,N-C-0。同时,还包含一些不稳定容易发生异变的结构,如烯醇结构,含杂原子的 三元环等。d).判断分子间原子是否发生碰撞。若原子间距离c/〉n + n-w/w—ra"ge,则无碰撞;若小 于,但原子间是1-2直连,1-3直连,1-4直连,则也无碰撞;若不是,则原子间碰撞。 n和n分别为两个原子的半径,w^—m"ge是分子力场的经验常数。 (6)计算个体适应度计算个体适应度,即计算Fit值。F" = Zv^/g&*{^rt[l —(i//02〗},其中,weight是 每个药效特征元素的权重,d是片段中心到药效中心的距离,t是药效特征元素的范围。若^>"则片段已经偏离出药效范围,返回异常值。若^^"则可以定量计算偏离的范围,确定分子活性。接着,对于含有排斥球的药效团,判断分子是否与排斥球碰撞。T是 排斥球的范围,r是原子半径,d是原子到排斥球的距离。对每个原子进行判断,若d^^ + r , 则无碰撞。若d〉, + r,则发生碰撞。(7) 使用遗传算法得到最优种群使用遗传算法,根据适应度进行杂交操作,并按设定的突变概率进行突变操作,通过 对父代和子代的个体比较,选出优胜个体,产生一个新的种群。同时,使用分子力学方法, 对个体进行优化,得到能量较低的构象。在设定的遗传代数下,循环操作,得到最优的适 应度。(8) 对产生的新化合物通过基于经验规则和逆向合成原理的方法进行可合成性评价, 最后产生易于合成的新化合物清单供进一步的化学合成。可合成性是在隐氢图中评价,分数cpxtx为a) .环cpx&二c戸fic + w'ze(/"A: 。 Size为每个环的成环重原子数,k是经验常数,本例k=6。b) .连接度C/wfcc = Cjpx" + /, i随不同连接度而不同。连接度是指分子中每个原子相连的 重原子数目。若以双键相连,则为2。若是三键,则为3。如果连接度cnt (i) =4,则i=24; 如果连接度cnt (i) =3,则1=12; 如果连接度cnt (i) =2,则i:6; 如果连接度cnt (i) =1,则i=3;c) .原子类型c/^& = cP;c" + yt。如果原子类型是C,则k=3;如果是其他原子,则k=6;d) .逆合成方法如能通过逆合成拆分到简单的化合物,则对cpxtx进行一定罚分。e) .得到一个最后的cpxtx值,该数值越高,则越难合成。
权利要求
1、一种基于药效团模型的全新药物分子构建方法,其特征在于在靶蛋白分子三维结构未知的情况下,选择药效特征片段,将药效特征片段叠放于药效团模型的适当位置,使用遗传算法控制药效特征片段的连接,构建完全满足药效团模型的新分子,同时,对新生成的化合物进行可合成性评价,实现本方法的基本步骤有以下8步(1)准备并输入药效团模型利用其它常规药效团模型建模软件生成基于小分子活性化合物的药效团模型,并保存为药效团模型文件;读取该药效团模型的相关信息,包括药效特征元素的个数、权重、类型、三维坐标和范围,排斥球的个数、三维坐标和范围,对于氢键供体HBD、氢键受体HBA、一般芳环ARO这三类药效特征元素,还要计算配体-受体间的向量方向;(2)建立药效特征片段和连接子数据库将常见药物分子拆分成较小的片段,根据其化学功能决定其所属药效特征,并建立药效特征片段数据库,分子量小于200道尔顿的则构成连接子数据库。每个数据库都有一个索引文件,通过索引文件读取数据库中的骨架信息,读取片段中的原子数目、键数目、原子类型、原子三维坐标、键类型、成键原子,同时,通过这些基本信息,计算一些扩展信息,包括环数目、邻近原子数、邻近非氢原子数等;(3)在药效团模型的框架中合理放置药效特征片段,初始化种群从药效特征片段数据库中按权重随机读取一个符合药效特征的片段并计算该片段的药效中心和平移矩阵,将药效特征片段的几何中心平移至药效团模型中药效特征元素的几何中心进行叠合,对于氢键供体HBD、氢键受体HBA和一般芳环ARO三类药效特征,计算片段的旋转矩阵,通过旋转操作将方向旋转至符合药效特征方向;对每个药效特征元素,都进行放置药效团模型的操作,得到多个独立的符合药效特征元素的片段,即产生一个初始种群;在中心和方向不变的情况下,设置一个随机选择矩阵,进行随机旋转,使其不发生碰撞;再进行分子量检测,如果分子量超出界限,则将大分子量的片段替换,直到分子量满足条件,即初始化种群成功。(4)根据药效特征片段上的连接位点间空间位置,计算连接位点间的距离和角度,判断是否直连药效特征片段还是加入连接子(5)对生成的分子进行药效团特征、空间位阻限制和药效性质的判断;(6)计算个体适应度即计算每个得到的分子的Fit值;(7)使用遗传算法,根据适应度进行杂交操作,并按一定概率进行适当的突变操作,产生新的种群,并继续进行药效团特征和空间位阻限制的判断;在设定的遗传代数下,循环操作,得到最优的适应度;(8)对产生的新化合物进行可合成性评价,最后产生易于合成的新化合物清单供进一步的化学合成。
2、如权利要求l所述的基于药效团模型的全新药物分子构建方法,其特征在于所 述建立药效特征片段数据库和连接子数据库,是按照药效特征划分为药效特征片段数据 库和连接子数据库,其药效特征片段数据库为8个,连接子数据库为l个,8个药效特 征片段数据库分别是氢键供体、氢键受体、 一般芳环、疏水芳环、疏水脂肪、 一般疏水、 正电基团和负电基团,连接子数据库,是剔除了基本数据库中分子量大于200的分子后 保留所得。
3、如权利要求1所述的基于药效团模型的全新药物分子构建方法,其特征在于 所述对生成的分子进行药效团特征、空间位阻限制和药效性质的判断,其药效性质的各 项判断是a) 判断各片段是否己经连成一个分子;b) 判断分子是否满足生物利用度规则;c) 判断分子是否有违规的化学结构;d) 判断分子是否符合药效团特征;e) 判断分子间原子是否发生碰撞。
4、 如权利要求1所述的基于药效团模型的全新药物分子构建方法,其特征在于 所述根据药效特征片段上的连接位点间空间位置,计算连接位点间的距离和角度,判断 是否直连药效特征片段还是加入连接子是检査两个连接点间的距离、两个连接点分别在 平面内的角度和两个平面的二面角;若这些参数与直连药效特征片段的条件符合,则使 用直连药效特征片段的方式;若这些参数与某个连接子的条件符合,则使用这个连接子。
5、 如权利要求1所述的基于药效团模型的全新药物分子构建方法,其特征在于 所述对产生的新化合物进行可合成性评价,是通过经验规则和逆合成规则进行可合成性评价,具体是将可合成性放在隐氢图中分别对环连接度C/7;CftC = q7X" + /,原子类型@jc/jc = Cjpjc/x + yt,逆合成方法进行评价,得到最后的cpxtx值,其中i是环连接度对可 合成型的贡献值,k是原子类型对可合成型的贡献值。
全文摘要
基于药效团模型的全新药物分子构建方法涉及计算机辅助药物开发。选择药效特征片段,将药效特征片段叠放于药效团模型的适当位置,使用遗传算法控制药效特征片段的连接,构建完全满足药效团模型的新分子。步骤是输入药效团模型;建立药效特征片段和连接子数据库;在药效团模型框架中合理放置药效特征片段,初始化种群;判断是直连药效特征片段还是加入连接子;对生成的分子进行药效团特征、空间位阻限制和药效性质的判断;计算个体适应度;进行杂交、突变操作,产生新的种群;对产生的新化合物进行可合成性评价。本发明在蛋靶白三维结构未知的情况下实现了分子的从头设计,构建的药物分子完全满足药效特征要求又具新颖性,意义十分重大。
文档编号G06F17/50GK101329698SQ20081004570
公开日2008年12月24日 申请日期2008年7月31日 优先权日2008年7月31日
发明者会 张, 杨胜勇, 马长英, 魏于全, 奇 黄 申请人:四川大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1