采用多维矩阵参照基本结构单元进行药物构架化合物设计的方法及其应用的制作方法

文档序号:6367777阅读:528来源:国知局
专利名称:采用多维矩阵参照基本结构单元进行药物构架化合物设计的方法及其应用的制作方法
技术领域
本发明属于药物构架化合物分子设计方法领域,涉及采用多维矩阵參照化合物基本结构单元进行药物构架化合物分子设计的方法及其应用。
背景技术
近100年来,药物研发经历了下述阶段,I)标靶发现;2)标靶验证;3)高通量筛选(High Throughput Screening) ;4) Hit-to-Lead ;5)先导化合物;6)临床研究等,其中,革巴标验证阶段和药物分子设计被公认为药物研发的瓶颈。上世纪末和本世纪初,基因工程和蛋白质工程取得了长足进歩。其中,基因工程发现了大约12000-15000种新型的靶标蛋白质类型,但使用这些新型靶标开发出来的新型药 物的预期效果与其实际疗效之间的偏差非常大,导致世界制药和药物研发行业遭遇巨大的损失并深感困惑。目前,世界药物研发行业主要运用的还是被广泛验证过的300-500个生物靶标类型,并有多种药物筛选合成方法被广泛地加以应用。高通量筛选(HTS)是当前药物研发中广泛应用的药物筛选手段。研究大型数据库的结果表明,用于药物研发过程的高通量筛选化合物种类有1500-2000万。尽管高通量筛选可通过自动化设备每天筛选出12万个以上的化合物,但其又受到诸多技术限制1)生物靶标的精确性,需要在微量下具备精确度的可用于自动化过程的生物靶标;2)检测手段的提高,需要高分辨度的检测设备,如高质量基因芯片;3)高质量的化合物收藏,一般包括300-500万种精选的化合物,如具有像药型特性的高质量化合物,药物研发项目相关的化合物等,不仅需要考虑化合物的质量与纯度,还要考虑化合物结构类型可代表的化学空间化合物数量,包括化合物的多样性(Diversity)与像药性(Drug Likeness)等。“像药”型化合物的分子设计和开发将成为世界制药行业的研发重点之一。像药型化合物的可能药物分子数目为1063,该方法所面临的主要困难是如何从中有效寻找具备特定生物功效的化合物结构类型?如何使“像药”型化合物代表的化学空间有效的与蛋白靶标所代表的生物空间紧密地结合,増加新型化合物结构种类和数目?其开发的局限性在于,分子设计的有效性和可利用的药物构架化合物(Building Block)种类的多祥性,并成为药物研发的另ー个重要瓶颈。Hit-to-Lead成为药物研发的主要手段,并在近几年正式引入药物研发产业链。该方法先通过高通量筛选“像药型”化合物,以确认ー组活性化合物(“Hit”),再评估和优化活性化合物以获得先导化合物(“Lead”),并经多次筛选和优化先导化合物结构类型,以有效和准确地在高通量筛选的结果中优化出针对于特定生物靶标具备可成药性的化合物结构。通常,从化合物的合成、筛选、药效药理学、完成化合物的结构优化需要耗费4-6年,并需要开展大量的分子设计和分子结构对比工作,故存在系统性较差,需与分子设计理念相结合等缺陷。目前,先导性化合物的优化又成为药物研发的关键,将优化后的先导性化合物进行分子设计和分子结构对比,以获得核心的化合物结构,再通过结构修饰以实现下述效果I)最大程度増加对于特定靶标的生物活性;2)在保持对特定靶标生物活性的同时,具有选择性;3)增加对特定细胞的功能和活性;4)优化化合物的体内试验效果;5)调节化合物的吸收、分布、代谢、排泄、毒性(ADME/T)等特性;6)配合和满足化合物在制剂、给药方式、输送系统、生物利用度等方面的需求。然而,已有的先导化合物的优化过程比较机械和繁琐,涉及调整先导化合物的取代基、杂原子成分、分子形状等方面的结构修饰,使其具备“像药”性。通常,需针对1-3个具有核心结构的化合物进行结构改造,再研究化合物结构与其生物活性之间的关系(SAR),并结合化合物的药代药理毒副作用等性质来优化化合物结构,多需要合成5000个以上的化合物,化合物分子的设计效率较低,并存在没有有效地利用现有的药物研究数据与药物研究手段等缺陷。
“针对”性小型化合物收藏(Focused Library)也是目前用来提高药物筛选效率的方法之一,该方法约包含500-2,000个化合物,主要针对特定的化合物靶标并以靶标(Target Orientated)、多样性(Diversity Orientated)、天然产物(Natural ProductOrientated)、化合物基本结构单元(Fragment Orientated)等为基础进行化合物的设计。但这些设计均以药物生物活性相关的单一因素为基础,很少考虑因素之间的关联性,也没有考虑与其它影响化合物像药性的结构进行相对量化的综合对比和评估,更没有充分利用已有的经验数据。因此,该收藏中的化合物分子设计趋于单一,严重影响化合物结构的设计效率。尽管世界药物研发领域投入大量的人力物力开发了很多新技木,g在提高药物的研发效率,但是,如何提高药物设计的有效性、针对性与设计效率,使之更加有效、实用与便利,如何合理地进行化合物结构对比,如何在分子设计时综合利用和考虑影响药物分子生物活性和理化性质的多种因素及其关联性等,如何将影响化合物结构与特性的诸多因素进行综合分析与评估,显著提高药物分子的设计效率,仍是药物研发领域急待解决的技术问题。

发明内容
为了加快药物研发的进程,尤其是加速国内药物研发和世界接轨的进程,显著提高候选药物的设计效率,发明人研究获得了多维矩阵用于像药型化合物分子设计的方法和技术平台。该平台首次将数学的矩阵优化理念使用在药物及其相关的分子设计领域,并通过将药物研发过程中需要考虑的大量因素按照一定的特性进行归类和对比,从而使用少量的变数来代表数量巨大的变数,以提高像药型化合物分子的设计效率及其合成效益。多维矩阵分子设计的理念在于,任何药物分子都是由所谓的化合物基本结构单元组合而成的,通过对300万种高价值的“像药’型化合物按照28000种化合物基本结构单元进行化合物结构分类,然后进行结构分析,结果表明化合物基本结构单元组成药物分子的方式呈现矩阵和多维矩阵的排列、组合方式。同时,天然产物和中药有效成分単体化合物的结构分析结果表明,合成化合物与天然产物的基本结构单元及其组合方式极具相似性。因此,在药物分子设计时,将新型候选药物分子结构与已知化合物结构的各种经验型数据进行结构对比,可以大大提高药物分子设计的针对性和有效性。多维矩阵分子设计平台为药物及其相关的分子设计提供了一个系统化的矩阵模式的结构对比和结构优化的方法。该方法采用多维矩阵排列、组合和聚类分析化合物的结构因素的相应变量和可变因素的相应变量,再參照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型,以显著地減少需要合成的化合物数量,并快速获得所需的具有生物学活性或特定药物活性的候选药物,从而显著提高化合物分子的设计效率和效益。本发明的目的在于提供ー种药物构架化合物结构的设计方法,其特征在于,所述方法包括如下步骤(I)选定化合物基本结构单元类型,主要是以环状化合物为设定目标,优选为杂环或非杂环的饱和或不饱和的环状化合物; (2)将选定的化合物基本结构单元结构类型定义为固定因素,分别以大写字母A,B,C,D. ..Y或Z加以表示;(3)參照经验型数据,选择影响化合物的可变因素及其变量,所述的可变因素分别以小写字母a, b, c, d. . . y或z加以表示,所述a的变量选自al、a2、a3. . . an,所述b的变量选自bl、b2、b3. ..bn,所述c的变量选自Cl、c2、c3. . . cn,所述d的变量选自dl,d2,d3. . . dn,所述y的变量选自yl、y2、y3. . . yn,所述z的变量选自zl、z2、z3. . . ζη,其中η为自然数,优选所述化合物选自“像药型”化合物、候选药物、药物的任ー种或其组合;(4)采用多维矩阵排列对比分析固定因素的相应变量与可变因素的相应变量,获得优化的化合物结构类型,完成药物构架化合物结构的结构设计与优化。根据本发明的优选技术方案,所述方法还包括(5)结合市场信息,对优化出的代表性新型药物构架化合物类型进行对比和评估,确定具备价值的新型药物构架化合物结构。本发明的更优选技术方案,所述方法还进一歩包括如下任一或全部步骤(6)在确定固定因素后,分别选择Α,B, C,D··· Y或Z的变量,所述A的变量选自Al、Α2、A3. . .An,所述 B 的变量选自 BI、B2、B3. · · Bn,所述 C 的变量选自 Cl、C2、C3. · · Cn,所述D的变量选自D1,D2,D3. . .Dn,所述Y的变量选自Y1、Y2、Y3. . . Υη,所述Z的变量选自Zl、Ζ2、Ζ3. .. Zn,其中η为自然数;和/或(7)采用多维矩阵排列分析步骤(6)中所述的固定因素Α,B,C,D. . Y或Z的相应变量与可变因素a,b,c,d. . . y或ζ的相应变量,再參照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A’、B’、C’、D’ ...Y’或Z’ ;和/或(8)对步骤(7)优选出的具有代表性的化合物结构类型A’、B’、C’、D’ · · · Y’或V进行结构分析与结构确认,确定其可选择的变量,其中,代表性的化合物结构类型A’的变量选自A’ 1、A’2、A’3. ..A’n,代表性的化合物结构类型B’的变量选自B’ 1、B’2、B’3. . . B’n,代表性的化合物结构类型C’的变量选自C’ 1、C’ 2、C’ 3. . . C’ n,代表性的化合物结构类型D’的变量选自D’ 1,D’ 2,D’ 3. ..D’ η……,代表性的化合物结构类型Y’的变量选自Y’ I、Y’ 2、Y’ 3. ..Y’ η,代表性的化合物结构类型Ζ’的变量选自Z’ 1、Z’ 2、Z’ 3. ..Ζ’ η,η为自然数;和/或(9)參照经验型数据,选择代表性化合物结构类型的可变因素及其变量,所述的可变因素分别以小写字母a’,b’,c’,d’ ...y’或ζ’加以表示,其中,可变因素a’的变量选自a’ l、a’ 2、a’ 3. . . a’ n,可变因素b’的变量选自b’ l、b’ 2、b’ 3...b’ n,可变因素c’的变量选自c’ l、c’ 2、c’ 3...C’ n,可变因素d’的变量选自d’ l,d’ 2,d’ 3. · · d’ n……,可变因素y’的变量选自I,l、y’ 2、y’ 3...y’ n,可变因素z’的变量选自ζ’ 1、ζ’ 2、ζ’ 3· · · ζ’ η,η为自然数;(10)采用多维矩阵排列、组合和聚类分析步骤⑶中所述的代表性化合物结构类型A’、B’、C’、D’ ...Y’或Z’的相应变量与步骤(9)中所述的可变因素&’,13’,(3’,(1’...デ或ζ’的相应变量,再參照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A’ B’、B’ C’、C’ D’ . . . Y’ V ;和/或(11)根据需要,參照步骤(8)-(10)所述的方法,采用多维矩阵排列、组合和聚类分析优选出的具有代表性的化合物结构类型A’ B’、B’ C’、C’ D’ . . . Y’ V的相应变量与可变因素a’ b’、b’ c’、c’ d’ ...y’ ζ’的相应变量,再參照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型Α” B” C”、B” C” D” . . . X” Y” Ζ” ;和/或 (12)根据药物构架化合物的设计需要,采用多维矩阵重复进行上述步骤中的部分或全部步骤来进行结构组合、结构分析和结构确认,直至获得所需性能的药物构架化合物结构类型的结构设计与优化。本发明的优选技术方案,所述代表性的结构类型Α’、B’、C’ . . . Ζ’以AlalBlbl,
AlalBlb2, AlalBlbn, A2alBlbl......AnanBnbn, BlblClcl, BlblClc2,......BnbnCncn,
ClclDldl, ClclDld2,......CncnDndn......为代表。本发明的优选技术方案,所述代表性的结构类型A’ B’、B’ C’、C’ D’ ...Y’ V
以 AlalBlblClcl, AlalBlblClc2, AlalBlblClcn, A2alBlblClcl......AnanBnbnCncn,
BlblClclDldl, BlblClcl Dldn,......BnbnCncnDndn......为代表。本发明的优选技术方案,所述代表性的结构类型A”B”C”、B”C”D”. . .X”Y”Z”以
AlalBlblClclDldl, AlalBlblClclDld2, AlalBlblClclDldn,A2alBlblClclDldl......Anan
BnbnCncnDndn 为代表。本发明的目的在于提供另ー种药物构架化合物结构的设计方法,其特征在于,包括如下步骤(I)选定化合物基本结构单元类型,主要是以环状化合物为设定目标,优选为杂环或非杂环的饱和或不饱和的环状化合物; (2)将选定的化合物基本结构单元结构类型定义为固定因素,分别以大写字母A,B,C,D. ..Y或Z加以表示;(3)參照经验型数据,选择影响化合物的可变因素及其变量,所述的可变因素分别以小写字母a, b, c, d. . . y或ζ加以表示,所述a的变量选自al、a2、a3. . . an,所述b的变量选自bl、b2、b3. ..bn,所述c的变量选自cl、c2、c3. ..cn,所述d的变量选自dl,d2,d3. . . dn,所述y的变量选自yl、y2、y3. . . yn,所述ζ的变量选自zl、z2、z3. . . ζη,其中η为自然数,优选所述化合物选自“像药型”化合物、候选药物、药物的任ー种或其组合;(4)采用多维矩阵排列比对分析固定因素的相应变量与可变因素的相应
变量,优化出新型的化合物结构类型=Alal,Ala2,Ala3......Anan, Blbl,Blb2,
Blb3, Blb4......Bnbn, Clcl, Clc2, Clc3, Clc4......Cncn, Dldl, Dld2, Dld3,
Dld4......Dndn,......Ylyl, Yly2, Yly3, Yly4......Ynyn, Zlzl, Zlz2, Zlz3,
Zlz4......Znzn,其中,n为自然数,各个下标可相同或不同,完成药物构架化合物结构类型的结构设计与优化。根据本发明的优选技术方案,所述方法还包括(5)结合市场信息,对优化出的代表性新型药物构架化合物类型进行对比和评估,确定具备价值的新型药物构架化合物结构类型。本发明更优选的技术方案,所述方法还进一歩包括如下任一或全部步骤(6)引入常见的官能团、取代基、化合物基本结构单元的任ー种或其组合;(7)将优化出的新型化合物结构类型和常见的官能团、取代基、化合物基本结构单元的任一种或其组合进行合理的连接,产生出带有官能团、取代基或化合物基本结构单元的新型药物构架化合物结构类型AlalBlbl,AlalBlb2, AlalBlbn,A2alBlbl......AnanBnbn, BlblClcl, BlblClc2,......BnbnCncn, ClclDldl, ClclDld2, · · · · · CncnDndn,......YlylZlzl, YlylZlz2, ......YnynZnzn,其中,n 为自然数,且各下标可
相同或不同;(8)将进ー步优化出的新型化合物结构类型和常见的官能团或取代基、化合物基本结构单元的任一种或其组合进行合理的连接,产生出带有官能团、者取代基或化合物基本结构单元的新型药物构架化合物结构类型AlalBlblClcl,AlalBlblClc2,
AlalBlblClcn, A2alBlblClcl......AnanBnbnCncn, BlblClclDldl, BlblClclDldn,......B
nbnCncnDndn,......XlxlYlylZlzl,XlxlYlylZlz2,......XlxlYnynZnzn,其中 n为自然数;(9)将进ー步优化出的新型化合物结构类型和常见的官能团或取代基、化合物基本结构单元的任一种或其组合进行合理的连接,产生出带有官能团、者取代基或化合物基本结构单元的新型药物构架化合物结构类型AlalBlblClclDldl,AlalBlblClclDld2,
AlalBlblClclDldn, A2alBlblClclDldl......AnanBnbnCncnDndn,......WlwlXlxlYlylZl
zl, WlwlXlxlYlylZlz2, ...... WlwlXlxlYnynZnzn ;其中 n 为自然数;其中,引入常见官能团、取代基或化合物基本结构单元的任ー种或其组合的步骤在任意步骤之前或之后引入。根据本发明更优选的技术方案,该方法还包括如下任一或全部步骤(10)在确定固定因素后,分别选择A,B,C,D... Y或Z的变量,所述A的变量选自Al、A2、A3. . .An,所述 B 的变量选自 BI、B2、B3. · · Bn,所述 C 的变量选自 Cl、C2、C3. · · Cn,所述D的变量选自D1,D2,D3. . .Dn,所述Y的变量选自Y1、Y2、Y3. . . Υη,所述Z的变量选自Ζ1、Ζ2、Ζ3. ..Zn,其中η为自然数;和/或(11)采用多维矩阵排列分析步骤(10)中所述的固定因素ム,8,(,0...¥或2的相应变量与可变因素a,b,c,d. . . y或ζ的相应变量,再參照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A’、B’、C’、D’ ...Y’或Z’ ;和/或(12)对步骤(11)优选出的具有代表性的化合物结构类型A’、B’、C’、D’ ...Y’或Z’进行结构分析与结构确认,确定其可选择的变量,其中,代表性的化合物结构类型A’的变量选自A’ I、A’ 2、A’ 3. ..A’ n,代表性的化合物结构类型B’的变量选自B’ I、B’ 2、B’ 3. . . B’ n,代表性的化合物结构类型C’的变量选自C’ I、C’ 2、C’ 3. . . C’ n,代表性的化合物结构类型D’的变量选自D’ 1,D’ 2,D’ 3. ..D’ η……,η为自然数;和/或(13)參照经验型数据,选择代表性化合物结构类型的可变因素及其变量,所述的可变因素分别以小写字母a’,b’,c’,d’ ...y’或ζ’加以表示,其中,可变因素a’的变量选自a’ l、a’ 2、a’ 3. . . a’ n,可变因素b’的变量选自b’ l、b’ 2、b’ 3. ..b’ n,可变因素c’的变量选自c,l、c,2、c,3...C,n,可变因素d’的变量选自d,l,d,2,d,3. . . d’ n……,可变因素I,的变量选自y’ l、y’ 2、r 3· · · y’ η,可变因素ζ’的变量选自ζ’ 1、ζ’ 2、ζ’ 3· · · ζ’ η,η为自然数;(14)采用多维矩阵排列分析步骤(12)中所述的代表性化合物结构类型Α’、B’、C’、D’ ...Y’或Z’的相应变量与步骤(13)中所述的可变因素&’,13’,(3’,(1’...デ或ζ’的相应变量,再參照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型 A’ B’、B’ C’、C’ D’ . . . Y’ Z’ ;和/或(15)根据需要,參照步骤(12)-(14)所述的方法,采用多维矩阵排列、组合和聚类分析优选出的具有代表性的化合物结构类型A’ B’、B’ C’、C’ D’ . . . Y’ V的相应变量与可变因素a’ b’、b’ c’、c’ d’ ...y’ ζ’的相应变量,再參照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型Α” B” C”、B” C” D” . . . X” Y” Ζ” ;和/或
(16)根据药物构架化合物的设计需要,采用多维矩阵重复进行上述步骤中的部分或全部步骤来进行结构组合、结构分析和结构确认,直至获得所需性能的药物构架化合物结构类型的结构设计与优化。本发明的目的在于提供另ー种药物构架化合物结构的设计方法,其特征在于,包括如下步骤(I)从商业可以购买的数据库中选定化合物基本结构类型,主要是以环状化合物为主,优选包含环状化合物的母核结构(包括杂环或非杂环的饱和或不饱和环状化合物);(2)将选定的化合物基本结构类型定义为固定因素,分别以大写字母Α,B, C,D. . . Y或Z加以表示;(3)參照经验型数据,选择影响化合物的可变因素及其变量,所述的可变因素分别以小写字母a, b, c, d. . . y或ζ加以表示,所述a的变量选自al、a2、a3. . . an,所述b的变量选自bl、b2、b3. ..bn,所述c的变量选自cl、c2、c3. ..cn,所述d的变量选自dl,d2,d3. . . dn,所述y的变量选自yl、y2、y3. . . yn,所述ζ的变量选自zl、ζ2、ζ3. . . ζη其中η为自然数,优选所述化合物选自“像药型”化合物、候选药物、药物的任ー种或其组合;(4)采用多维矩阵排列、组合、聚类和比对分析固定因素的相应变量与可变因素的相应变量,优化出新型的药物构架化合物结构类型。根据本发明的优选技术方案,所述方法还包括(5)结合市场信息,对优化出的代表性新型药物构架化合物类型进行对比和评估,确定具备价值的新型药物构架化合物结构类型。本发明更优选的技术方案,所述方法还进一歩包括如下任一或全部步骤(6)在确定固定因素后,分别选择Α,B, C,D... Y或Z的变量,所述A的变量选自Al、Α2、A3. · · An,所述 B 的变量选自 BI、B2、B3. · · Bn,所述 C 的变量选自 Cl、C2、C3. · · Cn,所述D的变量选自D1,D2,D3. . .Dn,所述Y的变量选自Y1、Y2、Y3. . . Υη,所述Z的变量选自Zl、Ζ2、Ζ3. .. Zn,其中η为自然数;和/或(7)采用多维矩阵排列、组合和聚类分析步骤(6)中所述的固定因素ム,8,(,0...¥或Z的相应变量与可变因素a,b,c,d. . . y或ζ的相应变量,再參照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A’、B’、C’、D’ ...Y’或Z’ ;和/或
(8)引入常见的官能团或取代基及其化合物基本结构单元;和/或(9)将优化出的新型化合物结构类型和常见的官能团或取代基、化合物基本结构単元的任一种或其组合进行合理的连接,产生出带有官能团、取代基或化合物基本结构单元的新型药物构架化合物结构类型;和/或(10) 将优化出的新型化合物结构类型和常见的官能团或取代基、化合物基本结构単元的任一种或其组合进行合理的连接,产生出带有官能团、取代基或化合物基本结构单元的新型药物构架化合物结构类型;和/或(11)将优化出的新型化合物结构类型和常见的官能团或取代基、化合物基本结构単元的任一种或其组合进行合理的连接,产生出带有官能团、取代基或化合物基本结构单元的新型药物构架化合物结构类型;和/或(12)将优化出的新型化合物结构类型和常见的官能团或取代基、化合物基本结构単元的任一种或其组合进行合理的连接,产生出带有官能团、取代基或化合物基本结构单元的新型药物构架化合物结构类型;和/或(13)结合市场信息,对优化出的代表性新型药物构架化合物类型进行对比和评估,确定具备价值的新型药物构架化合物结构类型,其中,所述引入常见官能团、取代基、化合物基本结构单元的任ー种或其组合的步骤可以在任意步骤之前或之后引入。根据本发明更优选的技术方案,该方法还进一歩包括如下任一或全部步骤(13)在确定固定因素后,分别选择A,B,C,D... Y或Z的变量,所述A的变量选自Al、A2、A3. . .An,所述 B 的变量选自 BI、B2、B3. · · Bn,所述 C 的变量选自 Cl、C2、C3. · · Cn,所述D的变量选自D1,D2,D3. . .Dn,所述Y的变量选自Y1、Y2、Y3. . . Υη,所述Z的变量选自Ζ1、Ζ2、Ζ3. ..Zn,其中η为自然数;和/或(14)采用多维矩阵排列、组合和聚类分析步骤(10)中所述的固定因素Α,B, C,D. . . Y或Z的相应变量与可变因素a, b, c, d. . . y或ζ的相应变量,再參照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A’、B’、C’、D’ . . . Y’或Z’ ;和/或(15)对步骤(13)优选出的具有代表性的化合物结构类型4’3’、(’、0’. . . Y’或Z’进行结构分析与结构确认,确定其可选择的变量,其中,代表性的化合物结构类型A’的变量选自A’ 1、A’2、A’3. ..A’n,代表性的化合物结构类型B’的变量选自B’ 1、B’2、B’3. . . B’n,代表性的化合物结构类型C’的变量选自C’ 1、C’ 2、C’ 3. . . C’ n,代表性的化合物结构类型D’的变量选自D’ 1,D’ 2,D’ 3. ..D’ η……,代表性的化合物结构类型Y’的变量选自Y’ I、Y’ 2、Y’ 3. ..Y’ η,代表性的化合物结构类型Ζ’的变量选自V 1、Ζ’ 2、Ζ’ 3. . . Ζ’ η,η为自然数;和/或(16)參照经验型数据,选择代表性化合物结构类型的可变因素及其变量,所述的可变因素分别以小写字母a’,b’,c’,d’ ...y’或ζ’加以表示,其中,可变因素a’的变量选自a’ l、a’ 2、a’ 3. . . a’ n,可变因素b’的变量选自b’ l、b’ 2、b’ 3. ..b’ n,可变因素c’的变量选自c,l、c,2、c,3...C,n,可变因素d’的变量选自d,l,d,2,d,3. . . d’ n……,可变因素y’的变量选自I,1、7’2、デ3...デ11,可变因素2’的变量选自ζ’ 1、ζ’2、ζ’3···ζ’η,η为自然数;
(17)采用多维矩阵排列、组合和聚类分析步骤(15)中所述的代表性化合物结构类型A’、B’、C’、D’ . . . Y’或Z’的相应变量与步骤(16)中所述的可变因素a’,b’,c’,d’ ...y’或ζ’的相应变量,再參照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型Α’ B’、B’ C’、C’ D’ . . . Y’ Ζ’ ;和/或(18)根据需要,參照步骤(15)-(17)所述的方法,采用多维矩阵排列、组合和聚类分析优选出的具有代表性的化合物结构类型A’ B’、B’ C’、C’ D’ . . . Y’ V的相应变量与可变因素a’ b’、b’ c’、c’ d’ ...y’ ζ’的相应变量,再參照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型Α” B” C”、B” C” D” . . . X” Y” Ζ” ;和/或(19)根据药物构架化合物的设计需要,采用多维矩阵重复进行上述步骤中的部分或全部步骤来进行结构组合、结构分析和结构确认,直至获得所需性能的药物构架化合物结构类型的结构设计与优化。本发明的优选技术方案中,可根据候选药物的设计需要,采用多维矩阵重复进行本发明所述的药物构架化合物设计的部分或全部步骤来进行药物构架化合物的结构分析、 结构确认、结构优化,直至获得具有所需生物学活性或药理活性的药物构架化合物结构类型。目前,药物研发领域拥有的基本结构单元、官能团和元素有30000多种。本发明通过多维矩阵可将这些基本结构类型确定为约500种,将常用官能团确定为30-50种。在本发明的优选技术方案中,所述基本结构单元选自饱和或不饱和的单环结构单元、双环结构単元、多环结构単元的任ー种或其组合。在本发明的优选技术方案中,所述的单环结构单元选自芳香单环、非芳香单环、取代的芳香单环、取代的非芳香单环的任ー种或其组合。在本发明的优选技术方案中,所述的双环结构単元选自芳香双环、非芳香双环、取代的芳香双环、取代的非芳香双环的任ー种或其组合。在本发明的优选技术方案中,所述的多环结构単元选自芳香多环、非芳香多环、取代的芳香多环、取代的非芳多单环的任ー种或其组合,其中,所述多环结构单元的环数不少于3。本发明所述的取代基是指任何化合物的结构残基,选自烷基、烯基、炔基、羟基、醚基、酷基、芳基、杂芳基、环烷基、杂环基的任ー种或其组合。所述官能团选自酮、醛、脂、胺、酰胺、单键、双键、三键、卤素、酸、醇、硫醇、磺酸、酚、硫酚的任ー种或其组合。在本发明的优选技术方案中,所述的经验数据选自靶标生物活性、靶标生物选择性、细胞活性、毒副作用、ADME性质、像药性、可合成性的任ー种或其组合。在本发明的优选技术方案中,所述的经验型数据选自如下数据库任ー种或其组合I)世界药物研发领域常用蛋白质靶标数据库及其对应的化合物结构类型数据库;或2)世界药物研发常用蛋白质靶标相对应的化合物结构类型数据库;或3)药物研发核心结构数据库;或4)药物分子构架化合物类型数据库;或
5)被验证的具有生物活性的化合物结构类型数据库;或6)可查询上市药物数据库;或7)生物等效型数据库;或8)新陈代谢化合物类型数据库;或9)毒性化合物结构类型数据库;或10)中药有效成分化合物类型数据库;或11)天然产物单体化合物结构数据库;或12)药物治疗数据库;或13)医疗关键词数据库。本发明的另一目的在于提供多维矩阵在药物构架化合物结构类型设计中的应用,其特征在于,通过目标化合物的结构区域与经验型数据确定多维矩阵。本发明的优选技术方案中,采用多维矩阵排列、组合和聚类分析化合物的结构因素的相应变量和可变因素的相应变量,再參照结构区域和经验性数据的结构对比结果,优选出具有代表性的药物构架化合物结构类型。为了清楚表述本发明的保护范围,本发明对下述术语进行解释和说明。本发明所述的“ADME/T”是指化合物在吸收、分布、代谢、排泄、毒性等方面所具有的性质。本发明所述的靶标是指对一定适应症具备功效的生物蛋自质,可以按照其生物功效、适应症(如抗癌,心脏病,中枢神经疾病等)、靶标类型(如GPCR、离子通道等)分类。同吋,任何生物靶标或者蛋自质都具有一些靶点,相同的靶标对应不同的靶点也对应不同的生物活性或适应症而起到不同的作用,而同一靶点仅对ー个生物靶标或适应症具备特别有效的活性。本发明所述的“目标化合物”又称“參考化合物”、“药物设计目标”或“參照物”,包括已知的对于特定生物靶标和靶点具备一定的生物活性的化合物结构类型,即已知的化合物结构类型。本发明所述的“已知化合物结构类型”是指已被专利文献或科技文献公开的针对特定生物靶标具有生物活性的化合物结构类型,包括上市药物、处于政府部门申报阶段或临床阶段的候选药物、处于临床前研究阶段的化合物等。本发明的优选技术方案中,选择目标化合物的途径包括适应症、适应症对应的靶标、被验证的靶标或被广泛接受的靶标或机理明确的靶标、靶标类型或蛋白组(如GPCR、离子通道等)、靶标蛋白质的结构类型、专利文献或科技文献所公开的化合物结构类型。在本发明的优选技术方案中,所述的目标化合物选自已知的具有特定生物活性的化合物结构、按照靶标代码数据库查询到的化合物结构或对特定靶标有效的化合物结构类型、已知药物或者候选药物等化合物结构类型,包括上市药物、处于临床阶段的候选药物、处于临床前研究的候选药物、先导化合物、具备生物活性的天然产物、中药单体化合物、中药有效成分、被验证的具备生物活性的像药性化合物、计算机辅助药物分子设计(CADD设计化合物)、高通量筛选化合物、已知靶标蛋白质空间立体结构及其靶点区域的空间立体结构的任ー种或其组合。 參照目标化合物进行药物分子设计是新型药物的主要研发方向,即将针对靶标设计的化合物结构类型进行化合物结构分子的分析、设计、改造和优化,以得到新的化合物结构类型或先导型化合物结构类型,还可用于验证生物靶标,以及寻找或设计药物化合物新结构(如Me-Too类药物)等。本发明所述的化合物结构类型是指对于特定生物靶标具备生物活性和结构相似性的系列化合物。本发明所述的候选药物是指有可能成为上市药物的新化合物结构(new chemicalentity, NCE)。本发明所述的“化合物结构类型的分析、确定和优化”是指采用多维矩阵来排列、组合和聚类分析影响候选药物可成药性因素的任ー种或其组合,实现以最少数目的考虑因素来有效地设计药物分子,得到优化的先导型化合物或者候选药物化合物结构的目的。本发明所述的靶标生物活性是指化合物对特定生物靶标所具有的生物活性或细胞活性。 本发明所述的靶标生物选择性是指化合物对生物靶标不同靶点的生物活性所具有的选择性。本发明所述的细胞活性是指化合物对特定细胞的生物活性。本发明所述的毒副作用是指化合物所具有的毒性和/或副作用。本发明所述的可合成性是指化合物具备可被合成出来的可行性。本发明所述的“先导型化合物优化”是指将ー个具有特定生物活性的化合物进行结构和性质的优化,以获得具备所需生物活性或细胞活性的候选药物。目前,化学信息学用于判断化合物的“像药”性,并利用一些总结的物理化学參数来确定化合物的“像药性”,以提高活性化合物(Hit)和先导化合物(Lead)的设计速率。其中,用于确定化合物“像药性”的參数多源自己知药物、处于临床试验阶段候选药物、天然产物等的分析和鉴定結果。本发明所述的“像药型”(drug like)化合物的含义来自Walters和Murcko(Walters WP, Stahl MT, and Murcko MA. Virtual Screening :An overview.Drug Discovery Todayl998 ;3 160-78 ;ffalters WP, Murcko A, Murcko MA. RecognizingMolecules with drug-like properties. Curr Opin Chem Biol 1999 ;3 :384-7),他们通过对美国药典中所列成药的研究,认为“像药型”化合物的分子结构应与大多数已知药物(成药)的官能团和物理化学性质相一致,现有的“像药”型化合物的性质大多来自于已知药物的研究和总结,但已知药物的结构种类仅涵盖了 “像药”型化合物的很少一部分,并不能代表所有的“像药”型化合物的种类和特点。Lipinski (C. A. Lipinski ;R Lombardo ;B. ff. Dominy and P. J. Feeney (1997). Experimental and computational approachesto estimate soluoility and permeability in drug discovery and developmentsettings " . Adv Drug Del Rev 23 :3-25. ;Lipinski CA, Lombardo F, Dominy Bff,Feeney PJ. Experimental and computational approaches to estimate solubility andpermeability in drug discovery and development settings. Adv Drug Deliv Rev2001 ;46 :3-26)认为“像药”型化合物应具有充足的,可接受的ADME/T(吸收,分布,新陈代谢,排除和毒性)性质,并要通过I期临床试验,且分布在一个极其广泛的化学空间,大约包含1040-10100个“像药”型化合物,相对于可能的生物靶标,发现ー个活性化合物的几率小于1/1014。“像药”化合物的物理性质将在很大程度上决定化合物能否成为活性化合物。Lipinski不仅发明了著名的“5规则”来帮助鉴别和分析“像药”型化合物,并认为在高效筛选时就应考虑药物的ADME/T性质,与传统意义上的化合物优化后期才予以考虑ADME/T性质有所不同。现有的商业化合物数据库包括下述几种I)综合药物化学数据库---Comprehensive Medicinal Chemistry (CMC);2)世界药物数据库---World Drug Index (WDI);3) MDDR 数据库;4)调查类药物数据库---Investigational Drug Database (IDDB);5)商业化合物数据库---Available Compound Databse (ACD/SCD); 6)化学导向数据库---ChemNavigator7)生物活性天然产物数据库---Biologically Active Natural Products (BDNP)因此,本领域技术人员检索可从上述数据库获得本发明所述的目标化合物。在本发明的优选技术方案中,所述的目标化合物为已知药物结构,优选为市场上广泛使用的已知药物,如抗糖尿病药物、心血管药物等。本发明采用在临床上被广泛验证过的药物化合物结构,针对新型的靶标进行结构优化和改造,设计出新颖的针对特定适应症具有功效的药物化合物结构类型,包括先导型化合物类型等。本发明所述的“经验型数据”又称“经验型參数”或“实验型參数”,是指在药物研发历史上积累下来的实验验证过的数据,所述经验数据选自靶标生物活性、靶标生物选择性、细胞活性、毒副作用、ADME性质、像药性、可合成性或药代药理參数等,这些经验型数据与化合物的结构密切关联,包括化合物的构效关系,因此,经验型数据的对比过程包含化合物的结构对比和化合物的结构优化等方面。本发明的优选技术方案中,所述的经验型数据选自下述数据库的任ー种或其组合I)世界药物研发领域常用蛋白质靶标数据库及其对应的化合物结构类型数据库;或2)世界药物研发常用蛋白质靶标相对应的化合物结构类型数据库;或3)药物研发核心结构数据库;或4)药物分子构架化合物类型数据库;或5)被验证的具有生物活性的化合物结构类型数据库;或6)可查询上市药物数据库;或7)生物等效型数据库;或8)新陈代谢化合物类型数据库;或9)毒性化合物结构类型数据库;或10)中药有效成分化合物类型数据库;或11)天然产物单体化合物结构数据库;或12)药物治疗数据库;或13)医疗关键词数据库等。
上述数据库均是本领域已知的数据库,现例举如下处于临床阶段的化合物数据库用于寻求处于临床阶段的化合物相关的信息,以及与结构相关的蛋白质靶标信息,包括靶标的发现,被验证的靶标,蛋白质结构及其与其相关的化合物结构类型,其代表型的数据库包括http://thomsonscientific. jp/products/iddb/index, shtml http://www. cancer, gov / cancertopics /factsheet/Therapy/investigational~drug-access ;http://science, thomsonreuters. com/support/faq/sddb/ ;
http://www. centerwatch. com/drug-information/pipeline/ http://www. pharmaproiects. com/research development analysis/tools,htm ;http://www.pipelinereview.com/store/product info, php products id =2741 ;http: //www. bioportfolio, com/ store/product/7781/R-d~Drug-Pipe Iine-Database-2—months-Subsc ription. html ;http://thomsonreuters. com/products services/science/scienceproducts/a~z/pipeline data integ rator/ :http://www. ovid. com/site/catalog/DataBase/1244, isp ;http://www. imshealth. com/portal/site/imshealth :http://www.pibpubs.com/ ;http://www. fda. gov/。ADME数据库用于研究、总结与化合物的吸收、分布、代谢与排泄等性质相关的结构信息,其代表型数据库包括http://www.pharmainformatic.com/html/adme tox predictions, html ;http://www. aureus-sciences. com/aureus/web/Ruest/adme-overview ;http://ip. fujitsu. com/group/kyushu/services/1ifescience/english/asp/admedb/ ;https ://www.cloeRateway. com/services/cloe knowledRe/paRes/servicefrontpage, php ;http://www. siritech. com/Cheminformatics. htm ;http://modem.ucsd. edu/adme/ databases/databases extend, htm ;http://www.pubpk.org/index.php title = Main Page ;http://www.pubpk.org/index.php title = Main Page ;http://www. hmdb.
ca/ ;http://www. nuRo. org/metabolomics/36124 :http://www. genome. jp/keRR/pathway, html ;http://kanaya. naist. jp/KNApSAcK/ ;http://accelrys. com/products/databases/bioactivity/metabolite, html 和http://metlin. scripps. edu/。蛋白质靶标数据库用于寻求和疾病相关的蛋白质靶标的信息,包括靶标的发现,被验证的靶标,蛋白质结构及其与 其相关的化合物结构类型,具有代表型的数据库如下http: //targetdb. pdb. org/http://www. ddac. ac. cn/pdtd/http: / /www. rcsb. org/pdb/home/home. dohttp: //bidd. nus. edu. Sg/group/CJTTD/TTD. asphttp://www. sciclips. com/sciciips/drug-targets-main.dohttp://www. ncbi. nlm. nih. gov/genbank/http://www. ebi. ac. uk/Databases/structure, html化合物合成方法数据库用于寻求化合物的合成方法及其可行性,具有代表性的数据库如下;https:/ /scifinder. cas. org http://accelrys. com/products/databases/synthesis/ 和 http://www. thieme-chemistry. com/en/products/iournals/synfacts.html o天然产物与中药数据库用于寻求天然产物及其中药化合物的结构数据,具有代表性的数据库如下http: //naturaldatabase. therapeuticresearch. com/home, aspx cs=&s = ND ;http://www. ponderfodder, com/node/113 http://www. ncbi. nlm. nih. gov/pmc/articles/PMC1347494/ ;http://dnp.chemnetbase.com/intro/index. isp isessionid = 80C9568C977F47200197BE48213AC51A http://www.heterocycles, ip/structure/structure, php ;http://www. chemnetbase. com/ ;http://www. Rfmer. ch/TMCAM/TNCAM database system, htm ;http: //www. rmhiherbal, org/ai/pharintro, html ;http: //tcm. emu, edu. tw/aboutOl.php menuid = I ;和 http://tcm. cz3. nus. edu. sr/Rroup/TCMsite/Default.aspx“像药”型化合物、具有生物活性化合物数据库用于寻求“像药”型化合物和具有生物活性的化合物的信息,具有代表性的数据库如下http://accelrys. com/products/databases/bioactivity/mddr. html ;http://accelrys. com/products/databases/bioactivity/comprehensive-medicinal—chemistry. html ;http://www. chemnaviRator. com/ 和http : / / accelrys. com/products / databases / sourcing/screeninR-compounds-directory. html。药物毒副作用数据库用于寻求化合物的毒性、副作用等特性的数据库,其代表性数据阵包括http: //databases, biomedcentral. com/browsesub iect/ sub id = 1013 ;http://www. drugs, com/ ;http: / / si deeffect s. embl.de/ ;http: //www. pdrhealth. com/drugs/druRS~index. aspx ;http://www. drugs, com/drug interactions, html ;http://www. pdrhealth. com/home/home, aspx ;http://www. rphworld. com/link-350. html ;http://toxnet. nlm. nih. rov/ ;
http: //bioinf. xmu. edu. cn/databases/ADR/index, html http: //ctd. mdibl.orR/ 和http://accelrys. com/products/databases/bioactivity/toxicity, html。已知药物数据库可以提供相关药物的基本信息,包括蛋白质靶标机理、药物分子结构、药代药理性质、毒副作用、药物相互作用等信息,其代表性数据库包括http : //www. drugbank. ca/ http : //www. nlm. nih. gov/medlineplus/druginformation. html ;http: //chrom. tutms. tut, ac. jp/.TINNO/DRUGDATA/OOdatabase. html http://www. rxlist. com/script/main/hp. asp ; http://www. accessdata. fda. gov/scripts/cder/drugsatfda/ http://www. fda. gov/Drugs/Information0nDrugs/ucml42438. htm ;http: //www. ncbi. nlm. nih. gov/pubmed/ http: //www. webmd. com/ ;http: //www. 3dchem. com/atoz. asp http: //www. drugs, com/ 和http://www. pdrhealth. com/home/home, aspx。本发明所述的已知数据库提供了本领域大量的目标化合物及其可供參考的经验型数据。本发明的优选技术方案中,采用多维矩阵法设计候选药物时首先进行目标化合物的结构确认,即按照分子结构基本单元拆分化合物的分子结构,再參照经验数据的结构比对分析和结构优化结果,以寻求数量最少的可改变区域或可修饰区域。作用于生物靶标的化合物结构类型多具备特定的结构母核,该结构母核体现了化合物针对特定靶标的生物活性,其中,化合物结构母核的空间结构应与靶标蛋白质的立体结构相匹配,二者的匹配程度也是决定化合物生物活性的主要因素;结构母核上的杂原子分布与化合物的生物选择性相关;结构母核的官能团分布与其生物活性和选择性相关,而任何杂原子和官能团在化合物结构的分布均有可能影响化合物的药代、药理和毒副作用等性能。另外,不同的母核结构类型对某ー特定生物靶标具有生物活性,其决定因素是化合物的空间立体分子结构和蛋白质空间立体结构。因此,化合物的结构设计过程需进行分子结构对比,可參照化学基因工程的技术扩大化合物结构对比的范围,并增加考虑因素,以进ー步验证生物IE标,并寻■找新的先导型化合物结构类型。在设计药物分子时,需要考虑众多因素,所述考虑因素包括适应症、生物活性、可合成性、理化性质、稳定性、新陈代谢、药代、药理、毒副反应的任ー种或其组合。如何有效地评价和分析相关影响因素是药物设计的主要工作,并且,设计不同的參照物需要考虑的影响因素或其顺序存在不同,有时需反复考虑一些影响因素。当以目标化合物为基础设计候选药物时,应尽量不改变甚至增加其生物活性和选择性,并通过合理的结构修饰以改善甚至提高其药代药理性质,降低其毒副作用,其中,设 计需要考虑因素包括A.蛋白质靶标(又称“生物靶标”);或B.靶标的验证状态;或C.作用于特定靶标的化合物结构类型;或
D.被验证的具备生物活性的“像药“型化合物结构类型;或E.已知药物的化合物结构类型;或F.处于临床研究阶段的候选药物的化合物结构类型;或G.处于临床前研究阶段的候选药物的化合物结构类型;或H.天然产物的化合物结构类型;或I.中药有效成分的化合物结构类型;或 J.生物等效性化合物结构类型;或K.新陈代谢物结构类型;或L.药代药理分子结构类型;或M.毒性化合物结构类型;或N.基本化合物结构单元类型;或O.基本化合物官能团结构类型;或P.合成方式的任ー种或其组合。在本发明的优选技术方案中,当需要保持甚至改善化合物的生物活性和选择性时,需要考虑的因素选自A、B、C、D、E、F、G、H、I、K、P的任ー种或其组合。在本发明的优选技术方案中,当需要保持甚至改善化合物的空间结构时,需要考虑的因素选自A、D、E、H、I、N、O、P的任ー种或其组合。在本发明的优选技术方案中,当需要保持甚至改善化合物的新陈代谢时,考虑的因素选自E、F、H、I、K、N、O、P的任ー种或其组合。在本发明的优选技术方案中,当需要保持甚至改善化合物的药代药理性质时,考虑的因素选自D、E、F、G、H、I、L、P的任ー种或其组合。在本发明的优选技术方案中,当需要降低化合物的毒副作用时,考虑的因素选自E、F、G、H、I、L、Μ、P的任ー种或其组合。采用多维矩阵设计化合物的分子结构时,可単独考虑因素A-P的任ー种或其组合,其目的是有效地组合不同的因素,从而确定目标化合物的结构类型,并可采用多维矩阵法来分析化合物结构。在本发明的优选技术方案中,所述靶标为12000-15000种,其源自Genebank,TargetDB, Threapuetic Target DB, DART, PDTD, TRMP、其他相关数据库等,包括被验证的革巴标、被广泛使用的靶标等,以确定靶标对应的化合物结构,并设计出新颖的药物化合物结构类型、新颖的先导型化合物类型等。在本发明的优选技术方案中,所述目标化合物选自来自天然产物或中药有效成分的化合物结构类型,可以结合其传统药物的特性,将其与靶标蛋白质结构进行结构对比和结构优化,寻找出有效的新化合物结构类型或先导型化合物结构类型,其中,所述的天然广物源自 The Directory of Natural Product, Tradional Chinese Medicine Databas,Natural Product Database 等数据库。本发明的优选技术方案中,将有效的化合物结构类型与生物靶标进行结构分析和对比,以寻求对该生物靶标具备活性的新化合物结构类型,其中,所述有效的化合物为经过验证的具备一定生物活性的化合物结构类型,并在化学空间内代表最大数目的化合物结构,包括天然产物,以及已知的、可查询到的、来源于文献和相关数据库(包括PubMed,CMC,MDDR, IDDB, Scifinder, Chemnivagator 等)的化合物结构等。本发明所述的药物构架化合物的设计方法g在解决合成“像药型”化合物、候选药物化合物、药物化合物所需要的药物构架化合物分子结构的设计问题,使得在药物研发分子设计方面,在影响化合物分子生物性质,物化性质,ADME性质,毒副作用性质等方面具备较强的针对性,从而提高药物研发分子设计的效益。本发明所述的药物构架化合物结构类型的设计方法,创造性地采用多维矩阵并结合经验型数据进行结构分析、结构确认、结构设计和结构优化,且全面系统地研究了药物构架结构类型与经验型数据之间的相关性,显著提高了药物构架化合物结构类型设计的针对性、有效性、全面性、系统性、合理性和效率,极大地丰富了药物合成所需的中间体或试剂,且显著缩短了药物研发的时间,从而显著降低药物研发费用。



图I、本发明采用多维矩阵并以化合物基本结构类型开始的药物构架分子设计方法该流程图将本发明优选的设计方法以化合物基本结构类型起始进行了详细说明,具体内容如下(I)选定化合物基本结构单元类型;(2)将选定的化合物基本结构单元结构类型定义为固定因素,分别以大写字母A,B,C,D. ..Y或Z加以表示;(3)參照经验型数据,选择影响化合物的可变因素及其变量,所述的可变因素分别以小写字母a, b, c, d. . . y或z加以表示,所述a的变量选自al、a2、a3. . . an,所述b的变量选自bl、b2、b3. ..bn,所述c的变量选自cl、c2、c3. ..cn,所述d的变量选自dl,d2,d3. . . dn,其中η为自然数,优选所述化合物选自“像药型”化合物、候选药物、药物的任ー种或其组合;(4)采用多维矩阵排列、组合、聚类和比对分析固定因素的相应变量与可变因素的
相应变量,获得优化的化合物结构类型Alal, Ala2,Ala3......Anan, Blbl,Blb2,Blb3,
Blb4......Bnbn, Clcl, Clc2, Clc3, Clc4......Cncn, Dldl, Dld2, Dld3, Dld4......Dndn,
其中n为自然数,且各下标可相同或不同;(5)将优化出的新型化合物结构类型和常见的官能团、取代基、化合物基本结构单元的任一种或其组合进行合理的连接,产生出带有官能团、取代基或化合物基本结构单元的新型药物构架化合物结构类型AlalBlbl,AlalBlb2, AlalBlbn,
A2alBlbl......AnanBnbn, BlblClcl, BlblClc2,......BnbnCncn, ClclDldl,
ClclDld2,......CncnDndn,其中,η为自然数,各下标可相同或不同;(6)将优化出的新型化合物结构类型和常见的官能团、取代基、化合物基本结构单元的任一种或其组合进行合理的连接,产生出带有官能团、取代基或化合物基本结构单元的新型药物构架化合物结构类型AlalBlblClcl, AlalBlblClc2, AlalBlblClcn,
A2alBlblClcl......AnanBnbnCncn, BlblClclDldl,BlblClcl Dldn,......BnbnCncnDndn,
其中,n为自然数,各下标可相同或不同;(7)结合市场信息,对优化出的代表性新型药物构架化合物类型进行对比和评估,确定具备价值的新型药物构架化合物结构类型。
具体实施例方式以下结合实施例对本发明做进ー步描述。需要说明的是,下述实施例不能作为对本发明保护范围的限制,任何在本发明基础上作出的改进都不违背本发明的精神。需要说明的是,下述所有化合物中,化学键不满足8电子或6电子的的基团均表示与氢相连。实施例I以吡啶为化合物基本结构单元的药物构架化合物分子设计方法
权利要求
1.一种药物构架化合物结构的设计方法,其特征在于,所述方法包括如下步骤 (1)选定化合物基本结构单元类型,主要是以环状化合物为设定目标,优选为杂环或非杂环的饱和或不饱和的环状化合物; (2)将选定的化合物基本结构单元结构类型定义为固定因素,分别以大写字母A,B,C,D. . . Y或Z加以表示; (3)参照经验型数据,选择影响化合物的可变因素及其变量,所述的可变因素分别以小写字母a,b,c,d. . . y或z加以表示,所述a的变量选自al、a2、a3. . . an,所述b的变量选自bl、b2、b3. . . bn,所述c的变量选自cl、c2、c3. . . cn,所述d的变量选自dl, d2, d3. dn,所述I的变量选自yl、y2、y3... yn,所述z的变量选自zl、z2、z3... zn,其中n为自然数,优选所述化合物选自“像药型”化合物、候选药物、药物的任一种或其组合; (4)采用多维矩阵排列对比分析固定因素的相应变量与可变因素的相应变量,获得优化的化合物结构类型,完成药物构架化合物结构的结构设计与优化。
2.根据权利要求I所述的设计方法,其特征在于,所述方法还包括 (5)结合市场信息,对优化出的代表性新型药物构架化合物类型进行对比和评估,确定具备价值的新型药物构架化合物结构。
3.根据权利要求I或2所述的设计方法,所述方法还进一步包括如下任一或全部步骤 (6)在确定固定因素后,分别选择A,B,C,D.. . Y或Z的变量,所述A的变量选自A1、A2、A3. . .An,所述B的变量选自B1、B2、B3. . . Bn,所述C的变量选自C1、C2、C3. . .Cn,所述D的变量选自Dl, D2,D3. . .Dn,所述Y的变量选自Yl、Y2、Y3. . . Yn,所述Z的变量选自Zl、Z2、Z3. ..Zn,其中n为自然数;和/或 (7)采用多维矩阵排列、组合和聚类分析步骤(6)中所述的固定因素A,B,C,D...Y或Z的相应变量与可变因素a,b,c,d. . . y或z的相应变量,再参照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A’、B’、C’、D’ ...Y’或Z’ ;和/或 (8)对步骤(7)优选出的具有代表性的化合物结构类型八’、8’、(’、0’..1’或2’进行结构分析与结构确认,确定其可选择的变量,其中,代表性的化合物结构类型A’的变量选自A’ I、A’ 2、A’ 3. . .A’ n,代表性的化合物结构类型B’的变量选自B’ I、B’ 2、B’ 3. . . B’ n,代表性的化合物结构类型C’的变量选自C’ 1、C’ 2、C’ 3. . . C’ n,代表性的化合物结构类型D’的变量选自D’ 1,D’ 2,D’ 3. ..D’ n……,代表性的化合物结构类型Y’的变量选自V I、V 2、Y’ 3. ..Y’ n,代表性的化合物结构类型Z’的变量选自Z’ I、Z’ 2、Z’ 3. . . Z’ n,n为自然数;和/或 (9)参照经验型数据,选择代表性化合物结构类型的可变因素及其变量,所述的可变因素分别以小写字母&’,13’,(3’,(1’...7’或2’加以表示,其中,可变因素&’的变量选自a’ I、a’ 2、a’ 3. ..a’ n,可变因素b’的变量选自b’ I、b’ 2、b’ 3. ..b’ n,可变因素c’的变量选自c’ I、c’ 2、c’ 3…c’ n,可变因素d’的变量选自d’ 1,d’ 2,d’ 3…d’ n……,可变因素I,的变量选自I,l、y’ 2、y’ 3. ..y’ n,可变因素z’的变量选自z’ I、z’ 2、z’ 3. . . z’ n, n为自然数; (10)采用多维矩阵排列、组合和聚类分析步骤(8)中所述的代表性化合物结构类型A’、B’、C’、D’ . . . Y’或Z’的相应变量与步骤(9)中所述的可变因素a’,b’,c’,d’ . . . y’或Z’的相应变量,再参照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A’ B’、B’ C’、C’ D’ . . . Y’ Z’ ;和/或 (11)根据需要,参照步骤(8)-(10)所述的方法,采用多维矩阵排列、组合和聚类分析优选出的具有代表性的化合物结构类型A’ B’、B’ C’、C’ D’ . . . V V的相应变量与可变因素a’ b’、b’ c’、c’d’ . . . y’ z’的相应变量,再参照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A”B” C”、B” C”D” . . . X” Y” Z” ;和/或 (12)根据药物构架化合物的设计需要,采用多维矩阵重复进行上述步骤中的部分或全部步骤来进行结构组合、结构分析和结构确认,直至获得所需性能的药物构架化合物结构类型的结构设计与优化。
4.一种药物构架化合物结构的设计方法,其特征在于,包括如下步骤 (1)选定化合物基本结构单元类型,主要是以环状化合物为设定目标,优选为杂环或非杂环的饱和或不饱和的环状化合物; (2)将选定的化合物基本结构单元结构类型定义为固定因素,分别以大写字母A,B,C,D. . . Y或Z加以表示; (3)参照经验型数据,选择影响化合物的可变因素及其变量,所述的可变因素分别以小写字母a,b,c,d. . . y或z加以表示,所述a的变量选自al、a2、a3. . . an,所述b的变量选自bl、b2、b3. . . bn,所述c的变量选自cl、c2、c3. . . cn,所述d的变量选自dl, d2, d3. dn,所述I的变量选自yl、y2、y3... yn,所述z的变量选自zl、z2、z3... zn,其中n为自然数,优选所述化合物选自“像药型”化合物、候选药物、药物的任一种或其组合; (4)采用多维矩阵排列、组合、聚类和比对分析固定因素的相应变量与可变因素的相应变量,优化出新型的化合物结构类型Alal,Ala2,Ala3......Anan, Blbl,Blb2, Blb3, Blb4......Bnbn, Clcl, Clc2, Clc3, Clc4......Cncn, Dldl, Dld2, Dld3,Dld4......Dndn,......Ylyl, Yly2, Yly3, Yly4......Ynyn, Zlzl, Zlz2, Zlz3,Zlz4......Znzn,其中,n为自然数,各个下标可相同或不同,完成药物构架化合物结构类型的结构设计与优化。
5.根据权利要求4所述的设计方法,其特征在于,还包括如下步骤 (5)结合市场信息,对优化出的代表性新型药物构架化合物类型进行对比和评估,确定具备价值的新型药物构架化合物结构类型。
6.根据权利要求4或5所述的设计方法,其特征在于,所述方法还进一步包括如下任一或全部步骤 (6)引入常见的官能团、取代基、化合物基本结构单元的任一种或其组合; (7)将优化出的新型化合物结构类型和常见的官能团、取代基、化合物基本结构单元的任一种或其组合进行合理的连接,产生出带有官能团、取代基或化合物基本结构单元的新型药物构架化合物结构类型AlalBlbl, AlalBlb2, AlalBlbn, A2alBlbl......AnanBnbn,BlblClcl,BlblClc2,......BnbnCncn, ClclDldl, ClclDld2,......CncnDndn,......YlylZlzl, YlylZlz2, ......YnynZnzn,其中,n为自然数,且各下标可相同或不同; (8)将进一步优化出的新型化合物结构类型和常见的官能团或取代基、化合物基本结构单元的任一种或其组合进行合理的连接,产生出带有官能团、者取代基或化合物基本结构单元的新型药物构架化合物结构类型AlalBlblClcl, AlalBlblClc2, AlalBlblClcn,A2alBlblClcl......AnanBnbnCncn, BlblClclDldl,BlblClclDldn,......BnbnCncnDndn,......XlxlYlylZlzl, XlxlYlylZlz2 ......XlxlYnynZnzn ; (9)将进一步优化出的新型化合物结构类型和常见的官能团或取代基、化合物基本结构单元的任一种或其组合进行合理的连接,产生出带有官能团、者取代基或化合物基本结构单元的新型药物构架化合物结构类型AlalBlblClclDldl,AlalBlblClclDld2,AlalBlblClclDldn, A2alBlblClclDldl......AnanBnbnCncnDndn,......WlwlXlxlYlylZlzl, WlwlXlxlYlylZlz2, ......WlwlXlxlYnynZnzn ; 其中,引入常见官能团、取代基或化合物基本结构单元的任一种或其组合的步骤在任意步骤之前或之后引入。
7.根据权利要求4-6任一项所述的方法,所述方法还进一步包括如下任一或全部步骤 (10)在确定固定因素后,分别选择A,B,C,D...Y或Z的变量,所述A的变量选自Al、A2、A3. .An,所述B的变量选自B1、B2、B3. Bn,所述C的变量选自C1、C2、C3. . . Cn,所述D的变量选自Dl,D2,D3. .Dn,所述Y的变量选自Yl、Y2、Y3. Yn,所述Z的变量选自Zl、Z2、Z3. . . Zn,其中n为自然数;和/或 (11)采用多维矩阵排列、组合和聚类分析步骤(10)中所述的固定因素A,B,C,D...Y或Z的相应变量与可变因素a,b,c,d. . . y或z的相应变量,再参照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A’、B’、C’、D’ ...Y’或Z’ ;和/或 (12)对步骤(11)优选出的具有代表性的化合物结构类型A’、B’、C’、D’...Y’或Z’进行结构分析与结构确认,确定其可选择的变量,其中,代表性的化合物结构类型A’的变量选自A’ 1、A’ 2、A’ 3. . .A’ n,代表性的化合物结构类型B’的变量选自B’ 1、B’ 2、B’ 3. . . B’ n,代表性的化合物结构类型C’的变量选自C’ 1、C’ 2、C’ 3. . . C’ n,代表性的化合物结构类型D’的变量选自D’ 1,D’ 2,D’ 3. ..D’ n……,代表性的化合物结构类型Y’的变量选自V I、V2、Y’ 3. ..Y’ n,代表性的化合物结构类型Z’的变量选自Z’ I、Z’ 2、Z’ 3. . . Z’ n,n为自然数;和/或 (13)参照经验型数据,选择代表性化合物结构类型的可变因素及其变量,所述的可变因素分别以小写字母a’,b’,c’,d’ ...y’或z’加以表示,其中,可变因素a’的变量选自a’ l、a’ 2、a’ 3. . . a’ n,可变因素b’的变量选自b’ l、b’ 2、b’ 3...b’ n,可变因素c’的变量选自c’ l、c’ 2、c’ 3...C’ n,可变因素d’的变量选自d’ l,d’ 2,d’ 3. d’ n……,可变因素y’的变量选自I,l、y’ 2、y’ 3...y’ n,可变因素z’的变量选自z’ l、z’ 2、z’ 3. . . z’ n,n为自然数; (14)采用多维矩阵排列、组合和聚类分析步骤(12)中所述的代表性化合物结构类型A’、B’、C’、D’ ...Y’或Z’的相应变量与步骤(13)中所述的可变因素a’,b’,c’,d’ . . y’或z’的相应变量,再参照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A’ B’、B’ C’、C’ D’ . . . Y’ Z’ ;和/或 (15)根据需要,参照步骤(12)-(14)所述的方法,采用多维矩阵排列、组合和聚类分析优选出的具有代表性的化合物结构类型A’ B’、B’ C’、C’ D’ . . . V V的相应变量与可变因素a’ b’、b’ c’、c’d’ . . . y’ z’的相应变量,再参照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A” B” C”、B” C” D” . . . X” Y” Z” ;和/或(16)根据药物构架化合物的设计需要,采用多维矩阵重复进行上述步骤中的部分或全部步骤来进行结构组合、结构分析和结构确认,直至获得所需性能的药物构架化合物结构类型的结构设计与优化。
8.—种药物构架化合物结构的设计方法,其特征在于,包括如下步骤 (1)从商业可以购买的数据库中选定化合物基本结构类型,主要是以环状化合物为主,优选包含环状化合物的母核结构(包括杂环或非杂环的饱和或不饱和环状化合物); (2)将选定的化合物基本结构类型定义为固定因素,分别以大写字母A,B,C,D.. . Y或Z加以表不; (3)参照经验型数据,选择影响化合物的可变因素及其变量,所述的可变因素分别以小写字母a,b,c,d. . . y或z加以表示,所述a的变量选自al、a2、a3. . . an,所述b的变量选自bl、b2、b3. . . bn,所述c的变量选自cl、c2、c3. . . cn,所述d的变量选自dl, d2, d3. dn,所述I的变量选自yl、y2、y3... yn,所述z的变量选自zl、z2、z3... zn,其中n为自然数,优选所述化合物选自“像药型”化合物、候选药物、药物的任一种或其组合; (4)采用多维矩阵排列、组合、聚类和比对分析固定因素的相应变量与可变因素的相应变量,优化出新型的药物构架化合物结构类型。
优选地,还包括如下步骤 (5)结合市场信息,对优化出的代表性新型药物构架化合物类型进行对比和评估,确定具备价值的新型药物构架化合物结构类型。
9.根据权利要求8所述的设计方法,所述方法还进一步包括如下任一或全部步骤 (6)在确定固定因素后,分别选择A,B,C,D.. . Y或Z的变量,所述A的变量选自A1、A2、A3. . .An,所述B的变量选自B1、B2、B3. . . Bn,所述C的变量选自C1、C2、C3. . .Cn,所述D的变量选自Dl, D2,D3. . .Dn,所述Y的变量选自Yl、Y2、Y3. . . Yn,所述Z的变量选自Zl、Z2、Z3. ..Zn,其中n为自然数;和/或 (7)采用多维矩阵排列、组合和聚类分析步骤(6)中所述的固定因素A,B,C,D.. . Y或Z的相应变量与可变因素a,b,c,d. . . y或z的相应变量,再参照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A’、B’、C’、D’ ...Y’或Z’ ;和/或 (8)引入常见的官能团或取代基及其化合物基本结构单元;和/或 (9)将优化出的新型化合物结构类型和常见的官能团或取代基、化合物基本结构单元的任一种或其组合进行合理的连接,产生出带有官能团、取代基或化合物基本结构单元的新型药物构架化合物结构类型;和/或 (10)将优化出的新型化合物结构类型和常见的官能团或取代基、化合物基本结构单元的任一种或其组合进行合理的连接,产生出带有官能团、取代基或化合物基本结构单元的新型药物构架化合物结构类型;和/或 (11)将优化出的新型化合物结构类型和常见的官能团或取代基、化合物基本结构单元的任一种或其组合进行合理的连接,产生出带有官能团、取代基或化合物基本结构单元的新型药物构架化合物结构类型;和/或 (12)将优化出的新型化合物结构类型和常见的官能团或取代基、化合物基本结构单元的任一种或其组合进行合理的连接,产生出带有官能团、取代基或化合物基本结构单元的新型药物构架化合物结构类型;和/或(13)结合市场信息,对优化出的代表性新型药物构架化合物类型进行对比和评估,确定具备价值的新型药物构架化合物结构类型, 其中,所述引入常见官能团、取代基、化合物基本结构单元的任一种或其组合的步骤可以在任意步骤之前或之后引入。
更优选地,所述方法还进一步包括如下任一或全部步骤 (14)在确定固定因素后,分别选择A,B,C,D...Y或Z的变量,所述A的变量选自Al、A2、A3. .An,所述B的变量选自BI、B2、B3. Bn,所述C的变量选自Cl、C2、C3. Cn,所述D的变量选自Dl,D2,D3. .Dn,所述Y的变量选自Yl、Y2、Y3. Yn,所述Z的变量选自Zl、Z2、Z3. . . Zn,其中n为自然数;和/或 (15)采用多维矩阵排列、组合和聚类分析步骤(10)中所述的固定因素A,B,C,D...Y或Z的相应变量与可变因素a,b,c,d. . . y或z的相应变量,再参照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A’、B’、C’、D’ ...Y’或Z’ ;和/或 (16)对步骤(13)优选出的具有代表性的化合物结构类型A’、B’、C’、D’...Y’或Z’进行结构分析与结构确认,确定其可选择的变量,其中,代表性的化合物结构类型A’的变量选自A’ 1、A’ 2、A’ 3. . .A’ n,代表性的化合物结构类型B’的变量选自B’ 1、B’ 2、B’ 3. . . B’ n,代表性的化合物结构类型C’的变量选自C’ 1、C’ 2、C’ 3. . . C’ n,代表性的化合物结构类型D’的变量选自D’ 1,D’ 2,D’ 3. ..D’ n……,代表性的化合物结构类型Y’的变量选自V I、V2、Y’ 3. ..Y’ n,代表性的化合物结构类型Z’的变量选自Z’ I、Z’ 2、Z’ 3. . . Z’ n,n为自然数;和/或 (17)参照经验型数据,选择代表性化合物结构类型的可变因素及其变量,所述的可变因素分别以小写字母a’,b’,c’,d’ ...y’或z’加以表示,其中,可变因素a’的变量选自a’ l、a’ 2、a’ 3. . . a’ n,可变因素b’的变量选自b’ l、b’ 2、b’ 3...b’ n,可变因素c’的变量选自c’ l、c’ 2、c’ 3...C’ n,可变因素d’的变量选自d’ l,d’ 2,d’ 3. d’ n……,可变因素y’的变量选自I,l、y’ 2、y’ 3...y’ n,可变因素z’的变量选自z’ l、z’ 2、z’ 3. . . z’ n,n为自然数; (18)采用多维矩阵排列、组合和聚类分析步骤(15)中所述的代表性化合物结构类型A’、B’、C’、D’ ...Y’或Z’的相应变量与步骤(16)中所述的可变因素&’,13’,(3’,(1’...7’或z’的相应变量,再参照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A’ B’、B’ C’、C’ D’ . . . Y’ Z’ ;和/或 (198)根据需要,参照步骤(15)-(17)所述的方法,采用多维矩阵排列、组合和聚类分析优选出的具有代表性的化合物结构类型A’ B’、B’ C’、C’ D’ . . . V V的相应变量与可变因素a’ b’、b’ c’、c’ d’ ...y’ z’的相应变量,再参照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A” B” C”、B” C” D” . . . X” Y” Z” ;和/或 (20)根据药物构架化合物的设计需要,采用多维矩阵重复进行上述步骤中的部分或全部步骤来进行结构组合、结构分析和结构确认,直至获得所需性能的药物构架化合物结构类型的结构设计与优化。
10.多维矩阵在药物构架化合物分子设计中的应用,其特征在于,通过目标化合物的结构区域与经验型数据确定多维矩阵。
全文摘要
本发明涉及多维矩阵用于药物构架化合物结构类型的应用及药物构架化合物结构类型设计方法,该方法首次将数学的矩阵优化理念应用于药物构架化合物结构类型及其相关的分子设计领域,采用多维矩阵排列、组合和聚类分析目标化合物的核心结构与可变因素及其变量,生成具备所需性能的药物构架化合物结构类型,并创造性地采用多维矩阵并结合经验型数据进行结构分析、结构确认、结构设计和结构优化,且全面地和系统地研究了药物构架结构类型与经验型数据之间的相关性,显著提高了药物构架化合物结构类型设计的针对性、有效性、全面性、系统性、合理性和效率,极大地丰富了药物合成所需的中间体或试剂,且显著缩短了药物研发的时间,从而显著降低药物研发费用。
文档编号G06F19/00GK102663250SQ201210100889
公开日2012年9月12日 申请日期2012年4月9日 优先权日2011年4月11日
发明者张志强, 闫京波 申请人:张志强, 闫京波
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1