定向药物开发的方法和组合物的制作方法

文档序号:1220270阅读:359来源:国知局

专利名称::定向药物开发的方法和组合物的制作方法
技术领域
:本发明总地涉及用于疾病治疗的新化学个体的开发,更具体地涉及确定用在准推理性药物设计中的先导分子的方法。
背景技术
:在当今药物领域中的典型的药物开发依赖于靶向生化功能的模型或试验的开发。然后将这些试验暴露于不同的小分子下,其中有一些小分子从自然界中收集,或者所述小分子可以在实验室中被全合成。无需进一步的知识,在可行的候选先导分子4支确定之前确实能够进行几乎数千次或数百万次的单独化学暴露。这一方法完全是随机的,并且其实际上被称为随机筛选。由于显而易见的原因,不存在与这一方法有关的推理性分子设计,因此,针对试验进行测试的分子的千分之十不比最初经历测试的分子具有更高的有效性概率。因为这种形式的筛选方法是随机的,达到成功的平均时间仅通过使待测试的不同化学物质可被集聚并暴露于试验下的速率被加速而得以缩短,所述加速通过例如已经开发的高通量筛选和组合化学实现。这类操作法的原则缺陷,除了其固有的随机性以外,还在于可能的类药物化学结构的数目已被估计大于10-80次方。因此,即使使用高通量筛选和组合化学的组合功能,也未必能在10-70次方内合成一种化学个体,更谈不上进行筛选。组合化学的概念仍旧是有价值的,因为其将平行处理等级引入到筛选的另外系列类别。然而,可量测性的限制性使得即使筛选几百个个别的化学个体也要求回复到部分系列试验过程,这是因为在单盘上的空间的物理限制所导致。药物制造商继续开发新药而不必进行筛选的一个方法是使用已被批准的药物作为先导药物,用于向该类别中进行进一步的附加。也就是说,使用FDA批准的物质来发现是否可对其进行用于增强其功效,降低其副作用,或使得其更易被摄取的目的的修饰。为此,处在一类中的许多药物非常类似。这就是顺理成章的事实--大部分小分子药物仅仅具有用于有效相互作用的特异性靶标区域(例如蛋白质),并且只要保留了与该耙标锲合的部分,其它分子也可具有类似活性。例如,目前上市有超过6种不同的(3-阻断剂。这类最广泛的处方药物类别中的六种的化学结构如图l所示。图2表示通常被称作药效基团的化学脚手架,其实质上是这类中的所有成员所共有的。围绕相似脚手架对药物进行的一种分类是常见的,也是推理性的;然而,甚至在开发这些改进型(follow-on)药物期间对最初(或"新型(first-in-class)")药物试图进行的修饰通常也是随机的。正是靶蛋白或其它生化结构通常具有一个可被药物锲入的表面区域以产生预期效果的这一事实,产生了各种不同的推推理性药物设计技术。推理性药物开发是一种开发先导分子的方法,其不通过盲目地期望发现一种具有预期活性的药物而随机筛选数千种分子,而是通过推论耙标的活性部位并i殳计以适当方式与该部分相互作用的化学个体来进4亍。该策略已经获得了一定的成功,然而,潜在的化学相互作用的复杂性使得其成为格外困难的方法。然而,当成功时,其通常获得新型药物,其通常经历较长的市场主导期,因为竟争药物制造商在该药物结构问世之前不能开始仿制过程。通过推理性药物设计已经产生的药物的例子是曱磺酸伊马替尼,其是酪氨酸激酶抑制剂。酪氨酸激酶是使特定蛋白质中的氨基酸酪氨酸磷酸化的一类分子结构。磷酸化作用是信号蛋白(包括当未经调节时可在癌细胞增殖(特别是在某些类型的白血病)中起作用的那些蛋白质)所需的关键性修饰。通过确定和表征ABL-BCR(—种编码酪氨酸激酶的嵌合基因,其使得细胞不受细胞因子的调控而增殖,而这又使得细胞变成癌性细胞)中的酪氨酸激酶活性区域,设计可能具有所需的抑制活性的小分子。尽管推理性药物开发是非常有前途的一种技术,因为当成功时其可得到新型药物,其是一种非常的知识密集型策略。目前可用的计算机模拟软件现在仅仅变得足以预测小分子与蛋白质的互相作用,有足够的准确度使得这种方法是可行的。还存在的事实是推理性药物开发通常延迟了对分子的基本预期活性的简单筛选,直到投入大量的时间和成本之后。这可获得在计算机上显示的以所需方式锲入耙标的分子,但是表现出即使有也没多少的体外应用前途。为了避免这种情况,许多推理性药物开发的团体提倡者已经退回到使用虚拟(insilico)筛选技术,凭借该技术,在计算机中针对建立模型的耙标对已知化学个体(包括已经获得的药物)进行建模型和筛选。当然,这消除了该技术的主要优点之一,但是其避免了偏向于已知分子。这些缺陷已经促使一些在很大程度上投入于推理性药物开发的公司回到过去的随机筛选技术。实际上,许多公司甚至严重到不采取推理性药物设计,并且将其留给大学和国家实^^室来为他们实施技术开发。出于同样原因,高通量筛选和组合化学方法组合的缺陷无疑首先是技术的资源密集,其次是法人实体推动大部分的开发远离新型药物开发乂人而重复改进对相同病况的治疗的事实。本领域将受益于将高通量筛选和组合化学的优点相结合来鉴定和开发先导药物,即,能够试验成千上万个化学个体以发现作用强的候选物,并具有推理性药物设计的优点(即可能以低成本开发新型药物)的方法。发明概述本发明的许多方面之一是提供一种方法,该方法可以在有生命的宿主中几乎试验大量化学结构以发现与靶标(例如蛋白质或其它大分子)结供所需的活性;和/或使用l知的关于结合化学结构的事实来引导构建:分子先导化合物。活性的分子结构的方法。该方法包括以下步骤提供与靶标生物分子特异性结合的至少一种免疫系统蛋白质;确定免疫系统蛋白质的至少一部分原子的同一性和空间定向,其中免疫系统蛋白质的至少一部分原子与粑标生物分子的结合部位的互相作用导致与粑标生物分子的结合部位结合;和构建药效基团,其中药效基团包括至少一种药效基团特征的模型,所述至少一种药效基团特征近似于与免疫系统蛋白质特异性结合的免疫系统蛋白质的原子的同一性和空间定向的至少一部分,使得该药效基团结构特征与靶标生物分子的结合部位是互补的。在上述方面的不同实施方案中,该方法可进一步包括以下步骤使用具有加注解的配体分子的数据库的药效基团假设查询确定候选分子,其中被确定的候选化合物具有实质上与至少一种药效基团特征对准的结构。在上述方面的不同实施方案中,该方法可进一步包括以下步骤确定候选分子与粑标生物分子的结合部位的对接(docking)亲合性;其中对接亲合性通过候选分子与粑标生物分子在互相作用时获得的能量、实现相对于最低能量构象的对接构象所需的能量、或它们的组合进行定量表示。在不同的实施方案中,免疫系统蛋白质具有改变靶标生物分子的活性的能力。例如,免疫系统蛋白质可以具有抑制靶标生物分子的活性的能力。在不同的实施方案中,提供与靶标生物分子特异性结合并能够改变草巴标生物分子的活性的免疫系统蛋白质的步骤包括以下步骤提供其中靶标生物分子显示模拟体内活性的活性的试验;在该试验中将对靶标生物分子具有结合亲合性的多个免疫系统蛋白质暴露于靶标生物分子下;和在该试验中选择至少一种能够改变靶标生物分子的活性的免疫系统蛋白质。在不同的实施方案中,与靶标生物分子特异性结合的免疫系统蛋白质还与至少一种在其部分中不同于靶标生物分子的相关生物分子结合,但是其中靶分子的结构和活性的相似的或相同的部分被相关生物分子所保持。在不同的实施方案中,免疫系统蛋白质是主要组织相容性复合体,T细胞受体,p细胞受体,或抗体,优选单克隆抗体。在不同的实施方案中,确定单克隆抗体的至少一部分原子的同一性和空间定向包括确定单克隆抗体的结合末梢的至少一部分原子(优选是至少一种单克隆抗体的结合末梢的实质部分的原子)的同一性和空间定向。在不同的实施方案中,药效基团特征包括选自以下的至少一种特征疏水性,芳香性,氬键受体,氬键供体,阳离子,和阴离子特征。在不同的实施方案中,靶标生物分子是蛋白质,优选酶,信号蛋白或受体蛋白。在不同的实施方案中,靶标生物分子选自足口病的病原体,血管紧张素II;ErbB2;Flu凝集素;Flu血细胞凝集素;Flu神经氨酸酶;Y干护G素;HER2;脑膜炎奈瑟氏球菌;HIV1蛋白酶;HIV-1逆转录酶;鼻病毒;血小板纤维蛋白原受体;沙门氏菌低聚糖;TGF-a;血小板生成素;组织因子;冯维勒布因子;VEGF;冠状病毒(SARS);莱姆病的病原体,HIVGP120;HIVGP41;西尼罗病毒;二氲叶酸还原酶;和EGFR。优选地,把标生物分子是EGFR,VEGF,HER2,和ErbB2,最优选是EGFR。在不同的实施方案中,确定至少一种免疫系统蛋白质的至少一部分原子的同一性和空间定向包括分析来自至少一种免疫系统蛋白质的结晶形式(优选与靶标生物分子结合的至少一种免疫系统蛋白质的结晶形式)的X射线晶体学数据。在不同的实施方案中,确定至少一种免疫系统蛋白质的至少一部分原子的同一性和空间定向包括确定至少一种免疫系统蛋白质的肽序列;产生免疫系统蛋白质的三维结构的虚拟模型;和分析免疫系统蛋白质的三维结构的虛拟模型以便确定与靶标生物分子的结合部位相互作用导致与靶标生物分子的结合部位结合的至少一种免疫系统蛋白质的至少一部分原子的同一性和空间定向。在一个实施方案中,产生相对于靶标生物分子具有所需的药物活性的分子个体的方法包括如下步骤(i)提供至少一种单克隆抗体;其中至活性;其中至少一种单克隆抗体包括结合末梢;并且其中结合末梢包括多个与靶标生物分子的结合部位相互作用导致与靼标生物分子的结合部位结合的原子;(ii)确定与靶标生物分子的结合部位相互作用的实质部分的结合末梢原子的同一性和空间定向;其中这种确定同一性和空间定向包括分析来自与靶标生物分子结合的至少一种单克隆抗体的结晶形式的X射线晶体学数据;(iii)构建药效基团;其中药效基团包括多个药效基团特征近似于至少约75%的与靶标生物分子的结合部位相互作用的至少一种单克隆抗体结合末梢原子的同一性和空间定向;其中多个药效基团特征与耙标生物分子的结合部位是互补的;并且其中多个药效基团特征包括选自以下的至少一种特征疏水性,芳香性,氢键受体,氢键供体,阳离子,和阴离子;和(iv)使用加注解的配体分子的数据库的药效基团假设查询确定候选分子;其中确定的候选化合物具有与药效基团的至少一种特征实质上对准的结构;其中候选分子抑制靶标生物分子的活性;并且其中靶标生物分子是酶,信号蛋白,或受体蛋白。本发明的另一个方面涉及抑制EGFR的药物组合物。这种药物组合物包括至少一种选自以下的EGFR抑制剂以及可药用载体或稀释剂式(1),式(7),式(14),式(19),式(25),包括其立体异构体或多晶型物。各式如下所示其中Sl-S8独立地选自卣素,羟基,巯基,羧基,烷基,环烷基,芳基,和烷氧基(-OR);X选自H2,O,S,N-R,N-OH,和N-NR2;Het是在任何环位置处的一个或多个N原子;Z选自-COOH,-P03H2,S03H,四唑环,磺酰胺,酰基磺酰胺,-CONH2,和-CONR2;和R是C1画C6直链或支链烷基,任选地被卣素,羟基,巯基,羧基,芳基,杂芳基,氨基,取代的氨基,或在5或6元环中含1、2或3个N原子的环氨基取代。本发明的另一个方面涉及治疗EGFR相关疾病或病症的方法,包括:对有需要的哺乳动物给用包括治疗有效量的本发明的药物组合物的组合物的步骤。这种组合物包括选自以下的EGFR抑制剂式(6);式(13);式(18);式(24);式(30),或其立体异构体或多晶型物。结构如下所示<formula>formulaseeoriginaldocumentpage14</formula>式(6)<formula>formulaseeoriginaldocumentpage14</formula>式(13)<formula>formulaseeoriginaldocumentpage14</formula>式(18)<formula>formulaseeoriginaldocumentpage14</formula>式(24)<formula>formulaseeoriginaldocumentpage15</formula>其它目的和特征在下文中将部分地显而易见并部分地;波指出本领域技术人员可理解的是以下的附图仅仅用于说明性目的。附图不意在以任何方式限制本发明的教导范围。图1A-F分别地表示阿替洛尔,比索洛尔,美托洛尔,拉贝洛尔,普萘洛尔,和卡维地洛的化学结构。图2表示实质上^^皮阿替洛尔,比索洛尔,美托洛尔,拉贝洛尔,普萘洛尔,和卡维地洛中的每一个所包含的共同化学主链。图3表示IgG分子。图4是与两个Fab抗体片段结合的二聚VEGF蛋白质的Jmol表示,其中框内的结合区域被放大。图5是VEGF二聚体条带模型。图6A和6B是具有潜在的针对VEGF的活性的先导分子的化学结构,其中所述先导分子已经根据本发明方法所考虑的那样基于对VEGF具有高亲合性的抗体的结合部分进行设计。图7A和7B是具有潜在的针对血细胞凝集素的活性的先导分子的化学结构,其中所述先导分子已经根据本发明方法所考虑的那样基于对血细胞凝集素具有高亲合性的抗体的结合部分进行设计。图8是Fab片段的Jmol图像,所述Fab片段对血管生成素具有高亲合性并结合于血管生成素分子,其中在血管生成素分子与Fab片段的结合区域之间的界面处的框内区域一皮放大。图9A和9B是两个具有潜在的针对血管生成素的活性的先导分子的血管生成素具有高亲合性的抗体的两个密切相关的结合部分进行设计。图10A和10B分别是图9A和9B的先导分子的球型模型和棍形才莫型。图11描绘了得自结晶lYY9.pdb,叠加在抗体西妥昔单抗的gly54—asp58区域上的药效基团I_gly54_asp58。图12描绘了得自结晶lYY9.pdb,叠加在抗体西妥昔单抗的gly54—asp58区域上的药-爻基团11—gly54—asp58。图13描绘了得自结晶lYY9.pdb,叠加在抗体西妥昔单抗的gly54—asp58区域上的药-丈基团21—gly54—asp58。图14描绘了得自结晶lYY9.pdb,叠加在抗体西妥昔单抗的gly54—asp58区域上的药效基团22—gly54—asp58。图15描绘了得自结晶lYY9.pdb,叠加在抗体西妥昔单抗的gly54_asp58区域上的药步支基团23—gly54_asp58。图16描绘了得自结晶lYY9.pdb,叠加在抗体西妥昔单抗的gly54—asp58区域上的药#支基团24—gly54一asp58。图17描绘了得自结晶lYY9.pdb,叠加在抗体西妥昔单抗的thr100—glul05区域上的药效基团1—thr100—glul05。图18描绘了得自结晶lYY9.pdb,叠加在抗体西妥昔单抗的thr100—glul05区域上的药效基团2—thr100—glul05。图19描绘了得自结晶lYY9.pdb,叠加在抗体西妥昔单抗的thr100—glul05区域上的药效基团3—thr100—glul05。图20描绘了得自结晶lYY9.pdb,叠加在抗体西妥昔单抗的thr100—glul05区域上的药效基团10—thr100—glul05。图21描绘了得自结晶lYY9.pdb,叠加在抗体西妥昔单抗的thr100—glul05区域上的药效基团21—thr100—glul05。图22描绘了得自结晶lYY9.pdb,叠加在抗体西妥昔单抗的thr100—glul05区域上的药效基团22—thrlOO—glul05。图23描绘了得自结晶lCZ8.pdb,叠加在抗体西妥昔单抗的tyrl01—serl06区域上的药效基团ln。图24描绘了得自结晶lCZ8.pdb,叠加在抗体西妥昔单抗的tyrl01—serl06区域上的药效基团2n。图25描绘了得自结晶lCZ8.pdbtyrl01一ser106区域上的药效基团3n。图26描绘了得自结晶lCZ8.pdbtyrl01—serl06区域上的药效基团4n。图27描绘了得自结晶lCZ8.pdb:tyrl01—serl06区域上的药效基团6n。图28描绘了得自结晶lCZ8.pdb:tyrl01—serl06区域上的药效基团7n。图29描绘了得自结晶lCZ8.pdb:tyrl01—serl06区域上的药效基团10b。图30描绘了得自结晶lN8Z.pdb,tyr92-thr94,glyl03上的药效基团lb。图31描绘了得自结晶lN8Z.pdb,tyr92-thr94,glyl03上的药-爻基团2b。图32描绘了得自结晶lN8Z.pdb,tyr92-thr94,glyl03上的药岁支基团2n。图33描绘了得自结晶lN8Z.pdb,叠加在抗体西妥昔单抗的叠加在抗体西妥昔单抗的叠加在抗体西妥昔单抗的叠加在抗体西妥昔单抗的叠加在抗体西妥昔单抗的叠加在抗体的区域arg50,叠加在抗体的区域arg50,叠加在抗体的区域arg50,叠加在抗体的区域arg50,tyr92-thr94,glyl03上的药岁文基团3n。图34描绘了得自结晶1S78.pdb,叠加在抗体的区域asp31—tyr32,asn—52—pro52a—asn53上的药J爻基团5n。图35描绘了得自结晶1S78.pdb,叠加在抗体的区域asp31_tyr32,asn—52—pro52a—asn53上的药步支基团6b。图36描绘了得自结晶2EXQ.pdb,叠加在抗体的重链tyr50—thr57区域上的药效基团3h。图37描绘了得自结晶2EXQ.pdb,叠加在抗体的重链tyr50—thr57区域上的药效基团4h。图38描绘了得自结晶2EXQ.pdb,叠加在抗体的重链tyr50jhr57区域上的药效基团5h。图39描绘了得自结晶2EXQ.pdb,叠加在抗体的重链tyr50—thr57区域上的药效基团6h。图40描绘了得自结晶2EXQ.pdb,叠加在抗体的重链tyr50—thr57区域上的药效基团7h。图41描绘了得自结晶2EXQ.pdb,叠加在抗体的重链tyr50—thr57区域上的药效基团8h。图42描绘了得自结晶2EXQ.pdb,叠加在抗体的重链tyr50—thr57区域上的药效基团9h。图43描绘了得自结晶2EXQ.pdb,叠加在抗体的轻链Asn32—Ile33—Gly34,Tyr49—His50—Gly51,Tyr91,Phe94,和Trp96区域上的药效基团1L和2L(相同)。图44描绘了得自结晶2EXQ.pdb,叠加在抗体的轻链Asn32—Ile33—Gly34,Tyr49—His50—Gly51,Tyr91,Phe94,和Trp96区域上的药效基团3L。图45描绘了用得自西妥昔单抗的蛋白质晶体结构(lYY9.pdb)的残基GLY-54到ASP-58叠加的药效基团1—gly54—asp58。体积约束用于排除被EGFR靼蛋白(SEQIDNO:1)占据的空间,布置了一组"假,,球体(暗灰色)以在药效基团查询期间占据粑蛋白的原子位置。这些表达用于近似于EGFR靶蛋白的表面拓朴学。图46是表示与EGFR对接的化合物AD4-1025的图,是带有加注解的EGFR的氨基酸残基的2D模型。图47是表示与EGFR对接的化合物AD4-1038的图,是3D棍形模型视图(A)或3D接触表面视图(B)。图48是表示与EGFR对接的化合物AD4-1010的图,是带有加注解的EGFR的氨基酸残基的2D模型。图49是表示与EGFR对接的化合物AD4-1009的图,是带有加注解的EGFR的氨基酸残基的2D模型。图50是表示与EGFR对接的化合物AD4-1016的图,是带有加注解的EGFR的氨基酸残基的2D模型。图51是表示与EGFR对接的化合物AD4-1017的图,是带有加注解的EGFR的氨基酸残基的2D模型。图52是表示与EGFR对接的化合物AD4-1018的图,是带有加注解的EGFR的氨基酸残基的2D模型。图53是表示与EGFR对接的化合物AD4-1020的图,是带有加注解的EGFR的氨基酸残基的2D模型。图54是表示与EGFR对接的化合物AD4-1021的图,是带有加注解的EGFR的氨基酸残基的2D才莫型。图55是表示与EGFR对接的化合物AD4-1022的图,是带有加注解的EGFR的氨基酸残基的2D模型。图56是表示与EGFR对接的化合物AD4-1027的图,是带有加注解的EGFR的氨基酸残基的2D模型。图57是表示与EGFR对接的化合物AD4-1030的图,是带有加注解的EGFR的氨基酸残基的2D模型。图58是表示与EGFR对接的化合物AD4-1132的图,是3D棍形才莫型视图(A)或3D接触表面视图(B)。图59是表示与EGFR对接的化合物AD4-1132的图,是带有加注解的EGFR的氨基酸残基的2D模型。图60是表示与EGFR对接的化合物AD4-1142的图,是3D棍形才莫型视图(A)或3D接触表面视图(B)。图61是表示与EGFR对接的化合物AD4-1142的图,是带有加注解的EGFR的氨基酸残基的2D模型。发明详述本发明涉及用于开发一种或多种针对一个或多个靶向治疗的方法和装置。根据本发明的一个方面,通过替之以使用抗原应答的自然机理以实现大规模地平行筛选针对抗原的天然存在的分子,避免了使用用于筌定小分子亲合性和活性互相作用的组合化学技术与高通量筛选技术的组合。类似地,根据本发明的另一个方面,基于模仿生物学合成分子诸如免疫球蛋白(已知其对靶标结构具有高亲合性)的分子亚结构,推理性药物设计技术可被引导以创造用于药物开发的先导分子。简言之,所述开发用于一种或多种耙向治疗的药物的方法的优选方案如下所述。提供了针对靶标生物分子,优选蛋白质,更优选酶的免疫系统蛋白质(例如抗体,优选单克隆抗体)。靶分子和免疫系统蛋白质之间的结合互相作用通过例如结晶学数据进行表征。从结合表征,定义蛋白质结合结构域。蛋白质结合结构域可用一个或多个药效基团特征来表示和/或汇集在包括一个或多个药效基团特征的药放基团模型中。药效基团特征通常来自与靶标生物分子形成复合物的免疫系统蛋白质的相应部分。药效基团的产生可根据设计用于这种任务的软件进行。从那些与药效基团模型对准的分子中选择候选分子(例如得自一个或多个化学文库)。优选地,以虚拟方式对接和评分候选分子与耙标免疫系统蛋白质的相互作用。另外,根据设计用于这种任务的软件进行对接和评分。在选择了对准一个或多个药效基团模型的分子之后,其中这种分子任选地进行虚拟对接和评分,通过例如化学合成或商业来源获得所选的分子。可以测量所选分子对靶标生物分子的亲合性和/或对靶标生物分子的功能的影响。这种评价通常根据生物试验进行。被测试的分子可以进一步根据所需的测量参数进行选择。所选的分子和/或进一步所选的分子可任选地进行进一步的优化。^參为、f乾恭遂脊标可包括以下的一种或多种核苷酸,寡核苷酸(及其化学衍生物),DNA(双链或单链),总RNA,信使RNA,cRNA,线粒体RNA,人造RNA,适体PNA(肽核酸),多克隆的、单克隆的、重组的、工程化的抗体,抗原,半抗原,抗体FAB亚单位(如有必要进行改性)蛋白质,改性蛋白质,酶,酶辅助因子或抑制剂,蛋白质复合物,凝集素,组氨酸标记蛋白,用于组氨酸标志组分(HIS-tag)的螯合剂,标记蛋白质,人造抗体,分子印记,plastibodies膜受体,全细胞,细胞片段和细胞亚结构,突触,激动剂/拮抗剂,细胞,细胞器例如微粒体小分子诸如苯并二氮杂萆,前列腺素,抗生素,药物,代谢物,药物代谢物天然产物碳水化物和衍生物天然和人造配体类固醇,激素肽,自然或人造的聚合物分子探针自然和人造的受体及其化学衍生物螯合试剂,冠醚,配体,超分子装配指示(pH,电位,膜电位,氧化还原电位),和组织样品(组织微阵列)。靶标生物分子优选生是蛋白质,更优选酶。所需的靶标酶包括那些存在蛋白质-抗体结晶学数据的那些酶。可使用本发明的不同的方法来产生用于各种蛋白质靶标(与配体形成结晶)的药效基团模型,包括但不限于足口病(lQGC.pdb);血管紧张素II(lCKO.pdb,3CK0.pdb,2CK0.pdb);与培妥珠单抗抗体复合的ErbB2(lL7I.pdb,1S78.pdb,2GJJ.pdb);Flu凝集素(lDNO.pdb,lOSP.pdb);Flu血细胞凝集素(lE08.pdb,lQFU.pdb,2VIR.pdb,2VIS.pdb,2VIT.pdb,lKEN.pdb,lFRG.pdb,lHIM.pdb,lHIN.pdb,lIFH.pdb);Flu神经氨酸酶(NC10.pdb,lAI4.pdb,lNMB.pdb,lNMC.pdb,lNMA.pdb,lNCA.pdb,lNCD.pdb,2AEQ.pdb,lNCB.pdb,lNCC.pdb,2AEP.pdb);y干扰素(HuZAF.pdb,lT3F.pdb,lB2W.pdb,lB4J.pdb,1T04.pdb);与赫赛汀复合的HER2(lN8Z.pdb,lFVC.pdb);脑膜炎奈瑟氏球菌(lMNU.pdb,lMPA.pdb,2MPA.pdb,lUWX.pdb);HIV1蛋白酶(lJP5.pdb,lCL7.pdb,lMF2.pdb,2HRP.pdb,lSVZ.pdb);HIV-1逆转录酶(2HMI.pdb,1J50.pdb,lN5Y.pdb,lN6Q.pdb,lHYS.pdb,lC9R.pdb,lHYS.pdb,1R08.pdb,1T04pdb,2HRP.pdb);鼻病毒(lFOR.pdb,lRVF.pdb,lBBD.pdb,lA3R.pdb,lA6T.pdb);血小板纤维蛋白原受体(lTXV.pdb,lTY3.pdb,lTY5.pdb,lTY6.pdb,lTY7.pdb);沙门氏菌低聚糖(lMFB.pdb,lMFC.pdb,lMFE.pdb);TGF-a(lE4W.pdb,lE4X.pdb);与TN1复合的血小板生成素(lV7M.pdb,lV7N.pdb);与5G9复合的组织因子(lFGN.pdb,lAHW.pdb,1JPS.pdb,lUJ3.pdb);与NMC-4复合的冯维勒布因子(lOAK.pdb,2ADF.pdb,lFE8.pdb,lFNS.pdb,2ADF.pdb);与B20-4复合的VEGF(2FJH.pdb,2FJF.pdb,2FJG.pdb,lTZH.pdb,lTZI.pdb,lCZ8.pdb,lBJl.pdb);冠状病毒-SARS(2DD8.pdb,2G75.pdb);莱姆病(lP4P.pdb,lRJL.pdb);HIVGP120(lACY.pdb,1F58.pdb,lG9M.pdb,lG9N.pdb,lGCl.pdb,lQlJ.pdb,lQNZ.pdb,lRZ7.pdb,lRZ8.pdb,lRZF.pdb,lRZG.pdb,1RZI,lRZJ.pdb,lRZK.pdb,lYYL.pdb,lYYM.pdb,2B4C.pdb,2F58.pdb,2F5A.pdb);HIVGP41(lTJG.pdb,lTJH.pdb,lTJI.pdb,1U92.pdb:1U93.pdb,1U95.pdb,lU8H.pdb,lU8I.pdb,lU8J.pdb,lU8K.pdb,lU8P.pdb,lU8Q.pdb,1U91.pdb,lU8L.pdb,lU8M.pdb,lU8N.pdb,1U80.pdb,2F5B);西尼罗病毒(如美国专利申请公开No.2006/0115837中所述);痴疾(二氬叶酸还原酶)(定义参见ActaCrystallographia(2004),D60(U),2054-2057);和EGFR(lI8I.pdb,118K.pdb,lYY8.pdb,lYY9.pdb,2EXP.pdb,2EXQ.pdb)。^i€系鍵f冷,潜y々与#*被确定结合于靶标生物分子的免疫系统蛋白质用作模板,来直接选择和/或构建靶标生物分子的有机小分子抑制剂或其药效基团。通常,免疫系统蛋白质是结合于非自身蛋白质的蛋白质。在不同的实施方案中,提供针对靶标生物分子的免疫系统蛋白质。可以理解的是免疫系统中产生的多种结构对相应的分子结构选择性地表达高的亲合性。这些包括例如主要组织相容性复合物,不同的T-细胞和P-细胞受体,以及抗体。这些结构中的任一种可用在本发明的步骤中;然而,对于描述本发明的优选方案而言,应当是指抗体。本领域技术人员可以理解以下讨论也适用于其它的免疫系统蛋白质。优选地,免疫系统蛋白质结合非自身蛋白质而有很少的或没有由例如诱导的装配导致的结构畸变。正是不同的免疫系统蛋白质的这种性质至少部分地使得这类分子在本文所述的方法中是合适的。在不同的实施方案中,免疫系统蛋白质在结合前后其结构为至少约95%恒定,更优选至少约98%恒定。换句话说,优选地,免疫系统蛋白质在结合于非自身蛋白质靶标时经历低于约5%或低于约2%的构象变化,这通过原子的空间位置测得。例如,不同的实施方案中的免疫系统蛋白质在结合于生物分子粑标之后经历低于约3A或低于约2A的平均原子空间运动。关于免疫球蛋白,其是本发明的优选方法的一个方面,每一个健康的哺乳动物可以产生超过IO个到10次方个不同的和独特的抗体,每个抗体应答不同的抗原。在整个物种,甚至在整个动物界,物种内部遗传密码的变异性(对抗体的互补决定区(CDR)是特异性的)和抗体的形式(整体结构是单节显性的,如骆驼,双节显性的如人和小鼠)提供了可能的抗体应答的数目到大于10个到20次方个。并且每种单独的具有健康的免疫系统的动物能够提供针对几乎任何抗原的多种抗体。当外来分子如为其它物种所固有的酶被注射进入具有健康免疫系统的动物体内时,该系统将提供针对这种结构的应答。在该应答期间,数百万个单独的新生(3-细胞遭遇该分子,每个卩-细胞表达独特的与卩-细胞最终产生的相同抗体成镜像的受体。这些表达与外来分子紧紧结合的受体的P-细胞被诱导增殖,从而提供细胞群,其各自产生相同的对靶标具有特异性的抗体。这些p-细胞中的一些被释放进入体内以抗击外来物质,而其它P-细胞被限制在淋巴结、脾和丘脑内,为如果将来外来分子出现在免疫系统面前时用大批抗体作出反应作准备。这种埋伏以待将来外来分子的递呈的能力被称为"获得性免疫",因为在可以获得在将来应答的能力之前需要最初递呈外来物质。如果特定的分子结构例如蛋白质,或更具体地是酶,是疾病的发病机理的起作用因素,则以高特异性结合于该分子和/或抑制该分子的活性的药物试剂是发现该疾病的有意义的治疗(如果不是治愈)的一个途径。有许多这种酶的例子,包括HIV的逆转录酶,某些类型的白血病的ABL-BCR酪氨酸激酶,和其中有一些与癌血管产生有关的血管内皮细胞生长因子(VEGFs)。如本发明的
背景技术
一节所述的,常常选择的鉴定准确地表现出这种活性的先导小分子的方法是随机筛选成千上万个针对靶分子的小分子(合成的或以其它方式用于这一目的),希望这些小分子之一表现出所需的作用。一个或多个具有适当特性的小分子被称为先导化合物,并且继续进行进一步的精修直到发现药物。这种筛选和随后优化的方法是费力的,并且不通过使用任何的对耙分子或可能与其结合的是什么结构的认识的作用而开始。相比之下,本发明利用了免疫系统蛋白质的结合亲合性从而提供了高通量的亲合性筛选方法。向免疫系统最初递呈靶分子导致免疫系统产生抗体,其中许多不同的和独特的免疫球蛋白结构的产生担当大规;f莫平行高通量亲合性篩选方法。仅仅选择表达与靶标结合的受体的细胞用于增殖。这被称作克隆选择并且是免疫系统产生靶标特异性分子能力的核心,正如筛选是药物先导化合物发现方法的真正核心一样。递呈/克隆选择和高通量筛选之间的类似性走得更远,因为一旦能产生与耙标结合的抗体的p-细胞被驱动增殖,则触发了敏锐地促进突变(亲和力成熟)的才几制。该方法允许进一步产生p-细胞以壽文锐地产生不同的抗体;其中有一些将更紧密地结合于靶标,而其它一些将不太紧密地结合。结合更紧密的那些被驱动进一步增殖,结合不太紧密的那些增殖更缓慢。这种向着更高的结合亲合性的緩慢进展通过先导化合物优化循环被反映在药物的药物开发中。本发明范围内的抗体包括例如多克隆抗体,单克隆抗体,和抗体片段。提供的针对靶标蛋白质/酶的抗体的生产,纯化和/或裂殖的多种方法是本领域公知为(一I參JSCarter(2006)NatRevImmunol.6(5),343-357;Teillaud(2005)ExpertOpinBiolTher.5(Supp.1)SI5-27;Subramanian编,(2004)Antibodies:Volume1:ProductionandPurification,Springer,ISBN0306482452;Lo编,(2003)AntibodyEngineeringMethodsandProtocols,HumanaPress,ISBN1588290921;Ausubel等编,(2002)ShortProtocolsinMolecularBiology5thEd"CurrentProtocols,ISBN0471250929;Brent等编,(2003)CurrentProtocolsinMolecularBiology,JohnWiley&SonsInc,ISBN047150338X;Coligan(2005)ShortProtocolsinImmunology,JohnWiley&Sons,ISBN0471715786;Sidhu(2005)PhageDisplayInBiotechnologyandDrugDiscovery,CRC,ISBN-10:0824754662)。多克隆抗体是从被免疫动物中获得的,通常是从免疫血清中获得的异源抗体分子群。多克隆抗体可由本领域普通技术人员从各种恒温动物中容易地产生,这是本领域公知的并且在上述的多篇引用文献中描述。另外,多克隆抗体可以得自各种商业来源。单克隆抗体是对特定抗原的同源抗体群。与对抗原的若干表位具有特异性的多克隆抗体相反,单克隆抗体通常对单个表位具有特异性。通常,通过从被抗原(其中抗原包括本文所述的蛋白质)攻击的动物的脾中取出J3-细胞,然后将这些P-细胞与可在培养基中无限生长的骨髓瘤肺瘤细胞融合而产生单克隆抗体。融合的杂种细胞或杂交瘤迅速地和无限地倍增,并可产生大量抗体。杂交瘤可充分地稀释和生长,从而获得许多不同的集落,各自仅仅产生一种类型的抗体。然后可试验得自不同集落的抗体与抗原结合的能力,然后选择最有效的抗体。特别地,单克隆抗体可以通过任何技术获得,所述技术通过在培养基中的传代细胞系诸如上述引用文献中所述的那些产生抗体分子。优选地,使用已经丧失它们产生自身抗体的能力的骨髓瘤细胞系,使得不稀释耙标抗体。优选地,-使用那些已经丧失特定酶(例如次黄噤呤-鸟噤呤转磷酸核糖基酶,HGPRT)并因此在一定条件下(即在HAT培养基存在的条件下)不能生长的骨髓瘤细胞。在这种的优选实施方案中,可以检测到在健康的p-细胞和骨髓瘤细胞之间发生的成功融合,其中健康伴侣提供所需的酶并且融合细胞可以存活在HAT培养基中。单克隆抗体还可通过其它诸如噬菌体展示的方法产生(參X辨如,Sidhu(2005)PhageDisplayInBiotechnologyandDrugDiscovery,CRC,ISBN-10:0824754662)。这种抗体可以是任何的免疫球蛋白类,包括IgG,IgM,IgE,IgA,IgD,和其4壬何亚类。本发明的产生mAb的杂交瘤可进4亍体外或体内培养。体内产生高滴度单克隆抗体的能力使得其是特别有用的生产方法。单克隆抗体通常比许多抗体片段具有更长的极限半衰期,表现为更大的吸收,这对于不同的应用是合适的。优选地,抗体属于IgG免疫球蛋白类。以下说明涉及优选的IgG类,但是本领域技术人员可以理解这些讨论也适用于其它类实施方案。每个IgG分子由两个不同类型的多肽链(重链和轻链)组成。这些重链和轻链被进一步分为恒定区和可变区。IgG分子100的整个结构呈"Y"型,如图3所示,"Y"的基部102由两对重链恒定区104,106(两个区,CH2-CH3,并排)组成。该基部结构的每个上部片段与"Y"的两个分支108,110之一连接,并且每个特异性地与另一个重链恒定区CH1109连接。这两个重链区CH1的每一个与轻链恒定区CL1112配对。重链和轻链的恒定区的远端末梢与重链和轻链的可变区VH1114和VL1116(每个支链的一对可变区)连接。这些成对的可变区形成"Y"结构的远端末梢,并且包括形成具有这种高的抗原特异性的结合末梢。抗体结合部位的局部解剖的综述参见例如Lee等,(2006)JOrgChem71,5082-5092。尽管恒定区结构中的可变性存在于整个物种中,甚至已经报导在物种内的一些变异,但是哺乳动物中的重链恒定区CHI,CH2和CH3通常由非常高度保守的110-120个氨基酸序列组成。类似地,轻链恒定区通常由非常高度保守的100-110个氨基酸序列组成。如果不是长度为约5到15个氨基酸的三个小的肽段,则轻链和重链的可变区VH1和VL1包括与恒定区非常相似的肽序列段。这些短的序列段高度可变,并且通常被称作高变区或互补决定区(CDRs)118。这种高变性是在免疫球蛋白产生细胞成熟期间发生的遗传剪接和改组的结果。每个成熟的免疫球蛋白产生细胞将仅仅产生一种类型的抗体(如果其是抗体产生细胞),但是不同的细胞将产生不同的免疫球蛋白。因此这种遗传过程导致在单个动物内产生品种繁多的抗体。每个可变区的三个短的高变肽序列形成六个氨基酸基团的复合物,其在抗体的每个远端末梢捆束在一起(两个远端末梢彼此相同)。因此,抗体分子自身可以被认为包括大型结构,该大型结构致力于筒单地保持和呈递一小群氨基酸(CDRs)为稳定排列使得它们可以非常高的亲合性结合于完全特异性靶标结构。因为链的可变区的其余区域相对于高变肽序列段是高度保守的,因此形成CDRs的特定氨基酸可通过测序方法筌别。轻链可变区的高变区在例如肽序列,爻24-34,50-56和89-97处(根据Kabat和Wu釆用的编号系统)#1发现。类似地,重链可变区的高变区在例如31-35,50-65和95-102处被发现。可以理解,特定的CDRs可比否则被允许仅仅基于可变数字包括更大量的肽,即,CDRH3通常大于仅仅8个肽,并且在这些位置中4吏用了数字字母,例如100A,100B等,以专门地描述序列组分。名^€系鍵蛋^#^^#免疫系统蛋白质通常根据它们与生物分子靶标结合的能力被选择。优选地,免疫系统蛋白质以比较高的亲合性与生物分子粑标结合。例如,优选的免疫系统蛋白质可与生物分子靶标结合的Ko为至少约1mM,更通常至少约300|uM,典型地至少约10)LiM,更典型地至少约30)uM,优选至少约10jaM,更优选至少约3iliM或更好的。优选i也,高亲合性免疫系统蛋白质是高亲合性单克隆抗体。本领域技术人员可理解,尽管以下的讨论部分涉及的是抗体,并且更具体地涉及单克隆抗体,但是该讨论也适用于上面讨论的其它类型的免疫系统蛋白质。通常,假定在活性部位处、内或附近的结合很可能抑制靶标生物分子的活性,则这种结合是优选方案。但是还考虑了其它的实施方案,其合(例如非活性构象的稳定化)导致活性的抑制。基于结合部位的定义和位置鉴定免疫系统蛋白质结合类别的算法是本领域已知的(參^Lee等,(2006)JOrgChem71,5082-5092)。根据Lee等的描述,在不同的实施方案中,免疫系统蛋白质可以具有洞穴,孑L洞,峡谷,凹陷,或平原形式的结合拓朴图。优选地,免疫系统蛋白质具有峡谷,凹陷或平原形式的结合拓朴图,更优选具有峡谷或平原形式的结合拓朴图。一旦已经鉴定了高亲合性抗体结构并且为它们创造了单克隆抗体生成细胞系,在本发明实施方案的方法中的随后步骤就是从多个抗体(例如单克隆抗体)中选择在活性部位处、内或附近结合的高亲合性结合抗体。单克隆抗体可以基于例如它们的特异性,高结合亲合性,同种型,和/或稳定性进行选择。单克隆抗体可以使用各种标准技术包括蛋白质印迹法(Koren,E.等,Biochim.Biophys.Acta876:91-100(1986))和酶联免疫吸附测定法(ELISA)(Koren等,Biochim.Biophys.Acta876:91-100(1986))进行筛选或试验其特异性。当存在分子家族的其它成员并且共享其激活区的相同亚结构时,可以采用选择活性部位高亲合性结合抗体的方法。本发明的一个方面包括鉴定高亲合性抗体是否也是活性部位高亲合性抗体的方法,通过确定其是否也结合于保留它们的激活区的相似的蛋白质家族的其它成员进行。如果提供的针对靶分子的高亲合性抗体(例如VEGF-A)不能充分结合于该家族的其它成员,则更可能其不结合于激活区。或者,如果通过接种培养针对靼分子的高亲合性抗体(例如VEGF-A)针对该家族的若干其它成员(例如VEGF-B,VEGF-C等)进行筛选并且同样表现了对它们具有高亲合性,则非常可能的是该高亲合性抗体也是活性部位高亲合性抗体。在没有相似的家族分子的分子情况下,可以使用可供选择的测定结合部位的性质的手段。如何进行这种测定的一个例子是提供靶标的功能试验,并将抗体暴露于该试-验下以测定该抗体是否抑制该试-验的功能。从一组高亲合性抗体中选择活性部位高亲合性抗体的另一个示例性的方法(其完全是虚拟的)是对每个抗体测序,构建结合表面的结构的模型,并将其与靶标的活性表面的模型匹配以观察两个是否匹配。该方法可要求对特异性靶标的认识,和利用若干个可有效估算抗体的表面活性部位高亲合性抗体:可供选>#的方法将愈加有效,因为更多的i标单独的序列信息构建抗体才莫型的准确度。已知抗体的CDRs沿着抗体中的轻肽链和重肽链存在于特别计数的序列段处的事实为该方法提供了另外的可靠性。这种虛拟技术也同样地牵涉本发明方法的其它步骤(例如确定抗体结合部分的原子的具体空间位置)。4定_##々^7《在_£选择了免疫系统蛋白质(例如活性部位高亲合性单克隆抗体)之后,定义3D蛋白质结合结构域。蛋白质结合结构域的定义通常包括确定与靶标生物分子相互作用的免疫系统蛋白质的结合部分的原子的特定空间位置。确定结合部分的空间位置可以借助于不同的虚拟技术来完成。例如,可使用构建结合表面的结构的模型并将其与靶标的活性表面的模型匹配以评价匹配水平的软件包。这种软件包括CAMAL。另外,用来筌定免疫系统蛋白质结合类别的算法基于结合部位的定义和位置(參XZee爭,(2006)JOrgChem71,5082-5092)。或者,通过使分子结晶形成长列的相似结构然后将该结晶暴露于X射线衍射下可以测定粑分子(特别是大分子如抗体)内的原子的三维位置。X射线衍射技术通常从分子的结晶开始,因为被一个电子衍射的一个光子不能被可靠地检测到。然而,由于正方晶体结构,在许多对称排列的分子内,光子通过相应电子^t衍射。由于峰匹配的相同频率的波彼此加强,因此信号变得可被检测。X-射线晶体学可以提供低至2A或更小的分辨率。使用x-射线晶体学来测定结构的技术是本领域已知的(^I辨如,Messerschmidt(2007)X-RayCrystallographyofBiomacromolecules:APracticalGuide,JohnWiley&Sons,ISBN-10:3527313966;Woolfson(2003;)AnIntroductiontoX-rayCrystallography,2dEd"CambridgeUniversityPress,ISBN-10:0521423597)。X-射线晶体学可用来测定已知以高亲合性与靶标生物分子的活性部位结合的结构内的原子的结构,然后使用这一结构信息构建保持与抗体相同的亲合性和/或活性的合成分子。通过X-射线晶体学进行结构测定需要感兴趣的分子的结晶。若干种用于制备免疫系统蛋白质的这种晶体的技术是本领域已知的,并且包括在Wall的美国专利6,931,325和Segelke的美国专利6,916,455中,其说明书,教导和参考文献作为参考被全文并入。为了克服在抗体结晶和结合末梢的可能畸变方面的困难,抗体可与靶标生物分子一起结晶以确保捕获适当的结合结构(参见例如,RCSB蛋白质数据库(ProteinDataBank)中的条目1CZ8,其是在与成熟亲合性抗体复合体中的血管内皮生长因子)。一旦制备后,可以收获晶体,并且任选地使用气体或液氮进行低温冷却。低温冷却晶体可以减少在数据收集期间的辐射伤害和/或降低结晶内的热运动。将晶体置于与发射X射线束的机器联合的衍射仪上。X射线衍射出结晶内的电子,并且在膜态或固态检测器上记录衍射图形并将其扫描到电脑中。这些衍射图象被合并,和用于构建结晶的分子的电子密度图。然后将原子装配到电子密度图和不同的参数(诸如位置),进行推敲,以最佳调整观察到的衍射数据。来自x-射线晶体学观察到的衍射数据的参数包括但不限于氢键键合剂,非极性疏水性接触,盐桥互相作用,结构域的极性表面积,结构域的非极性表面积,抗体-靶标复合物的形状互补评分,和位置明确的水分子。表征原子之间的键也是有用的。通过单键连接的两个原子之间的距离为约1.45A到约1.55A。通过双键连接在一起的原子之间的距离通常是约1.2A到约1.25A。在单、双键之间共振的键通常具有约1.30A到约1.35A的距离。例如,与亲合性成熟抗体(其Fab片l殳)结合的VEGF(SEQIDNO:2)分子在前已进行结晶并由Chen等作为1CZ8公开在RCSB数据库中。更具体地,它们的结晶数据包括V和W区,其是VEGF二聚体的成员,以及L,H,X和Y区,其表示Fab分子的抗体轻链和重链。(更具体地,L和H区包括Fab分子的分支之一,包括每个链的可变区和恒定区。类似地,X和Y是Fab分子的另一个分支的轻链和重链。)通过对晶体结构的超过八千个非氢原子的空间排列进行几何学分析,可以鉴定一个结构的那些处在另一结构的原子的特定距离内的原子。通过在全部可能的组合上进行直接的几何学比较,这种过滤测定了与两个分子跨接相连的肽。^使用最大距离(例如4A),可以测定处在VEGF二聚体的W组分的原子的这种短距离内的可变重链(H)的这些原子,并且这些原子4艮可能是Fab片段的CDRs中的那些原子。(#^辨咖,实施例1)。秀放羞,#建可使用免疫系统蛋白质结构信息(包括原子位置的定义)来构建用于鉴定在相似位置具有相似原子的小分子的药效基团模型。与免疫系统蛋白质具有相似特征的小分子可能显示出与草巴蛋白的相似的分子间相互作用并因此具有相似的生物活性,用于相似的治疗用途。一旦免疫系统蛋白质的结合区域(例如活性部偉高亲合性单克隆抗体的结合末梢)内的原子的空间定向,优选实质上所有的原子的空间定向,更优选所有的原子的空间定向的识别完成后,本发明的不同的实施方案的随后步骤是产生药效基团,其具有的结构近似于,优选实质上近似于,至少部分地负责与生物分子靶标结合的免疫系统蛋白质的至少一合的免疫系统蛋白质的原子的至少约25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,99Q/o,或100%。这种从无到有的化学结构的合成可以使用推理性药物设计软件和技术%成。然而,若干实施方案的一个关键特征是先导分子的构建不单独地通过将新的化学结构匹配到耙标表面来进行,而是采用以产生预期效果的方式与生物分子靶标结合的已知结构(即免疫系统蛋白质)作为指导。免疫系统蛋白质特别适合作为指导,因为它们的CDR区由相对简单的生物结构建造,所述生物结构可相对容易地用少量的有机分子重新构建。在不同的实施方案中,对于使用片段的从无到有的结构设计,基于采用接触统计学,3D表面模型,和对接配体作为模板的手段,可使用虚拟手段。从空间位置信息和/或从上述的其它参数可以获得3D配体-受体模型(例如互相作用图形,药效基团设计),表面图(拓朴学/形状,静电特征,疏水性,蛋白质柔性),和对接模型(例如用于配体结合的评分系统,最低能量计算)。药效基团模型或设计通常是配体内的一组结构特征,其与在受体部位处的配体识别及其生物活性相关,优选直接相关。药效基团特征可来自与其受体复合的、取自晶体结构的相应的免疫系统蛋白质的相应的供体,受体,芳香性,疏水性,和/或酸性或碱性部分。可理解的是,在药效基团设计中使用的关于免疫系统蛋白质中的原子(例如活性部位高亲合性单克隆抗体的结合末梢内的原子)的性质的其他信息,而不只是原子的空间位置信息,可以帮助这一新的化学先导实体的建模过程。这些特征包括但不限于原子的pKa值,保持原子就位的键的旋转刚性,键自身的性质(单键,双键,共振,或以其它方式成键),氢键供体和受体的投影方向性,等等。可用于产生药效基团设计的典型的特征要素包括但不限于原子位置;原子半径;氢键供体特征;氢键受体特征;芳香性特征;供体特征;受体特征;阴离子特征;阳离子特征;受体和阴离子特征;供体和阳离子特征;供体和受体特征;酸和阴离子特征;疏水性特征;氩键方向性;和金属配体。(參i辨如,实施例4)。这些特征可位于例如单个原子处,原子质心处,或空间投影方向位置处。考虑了可为任何给定的免疫系统蛋白质-靶标生物分子复合物设计众多的药效基团查询。进一步考虑了这些药效基团查询可用于鉴定与耙标生物分子在被免疫系统蛋白质识别部位处相互作用的小分子配体。实现这种才莫型构建和查询的示例性的资源包括但不限于MOE(CGG)(提供药效基团查询和可视化),Glide(Schrodinger)(提供对接和评分),AccordforExcel(Accelrys)(提供包括化学结构和化学式的分子信息的组织),和ZINC数据库(UCSF)(提供商业化合物的文库)。从免疫系统蛋白质-靶标生物分子结构结合表征产生药效基团的一个设计手段是MOE,或称作分子操作环境(MolecularOperatingEnvironment)(ChemicalComputingGroup)。才莫型产生使用几何和电子约束,以确定与免疫系统蛋白质相当的特征的3D位置。这些实施方案的^t型由3D空间的球形特征组成。球的直径可进行调整(例如约0.5A到约3.0A)。这种才莫型允许特征的匹配和/或局部匹配。药效基团结构特征可用标记的空间点表示。每个配体可被加注解,其是一组可对配体的药效基团作出贡献的结构特征(参见例如,实施例4)。在不同的实施方案中,加注解的配体的数据库可以使用表示药效基团假设的查询进行搜索(参见实施例5)。这种搜索结果是一组匹配数据,其将查询的药效基团特征对准在被搜索的数据库的配体中存在的药效基团特征(参见例如实施例5,表23-28)。数据库内的采样数至少部分地倚赖于数据库的大小和药效基团查询的限制(例如部分匹配,特征数,等等)。例如,实施例4的药效基团查询产生约1,000到约3,000个针对ZINC数据库的采样数。搜索数据库中存在的分子的性质和参数用于聚焦查询结果。例如,具有限定的分子量(MW)或亲脂性(logP)的范围的化合物可以存在于化合物的文库数据库的搜索区域。本发明的方法可用于筛选各种不同的候选分子(例如具有可能的治疗作用的候选分子)。如上所述,可使用药效基团查询搜索候选分子。候选分子包括众多的化学类别,尽管通常它们是有机分子,优选是分子量高于50和低于约2,500道尔顿的有机小分子。候选分子包括与蛋白质发生结构相互作用所需的官能团,特别是氢键合,并通常包括至少一个胺,羰基,羟基,或羧基,优选包括所述化学官能团中的至少两个。候选分子通常包括被一个或多个上述官能团取代的环状碳或杂环结构和/或芳香性或多芳香性结构。在优选方案中,候选分子是化合物的文库数据库中的化合物。本领域技术人员通常熟悉例如在市场上可买到化合物的众多的用于筛选的数据库(参X辨如,ZINC数据库,UCSF,有270万个化合物,在12个不同子集的分子;IrwinandShoichet(2005)JChemInfModel45,177-182)。本领域技术人员还熟悉各种搜索引擎以鉴定商业来源或合意的化合物以及用于进一步试验的化合物类别(參jg辨如,ZINC数据库;eMolecules.com;和由例如以下供应商提供的商业化合物的电子文库ChemBridge,PrincetonBioMolecular,AmbinterSARL,Enamine,ASDI,LifeChemicalsetc》用于根据本文所述的方法筛选的候选分子包括先导类化合物和药物类化合物。先导类化合物通常被理解为具有相对较小的脚手架类结构(例如分子量约150到约350kD),具有相对较少的特征(例如低于约3个氲供体和/或低于约6个氬受体;疏水性特性xlogP为约-2到约4)(参见例如,Angewante(1999)ChemieInt.ed.Engl.24,3943-3948)。相比之下,药物类化合物通常被理解为具有相对较大的脚手架(例如分子量约150到约500kD,具有相对更多的特征(例如低于约10个氬受体和/或低于约8个可旋转的键;疏水性特性xlogP低于约5)(参见例如,Lipinski(2000)J.Pharm.Tox.Methods44,235-249)。优选地,使用先导类化合物进行初始筛选。当从空间定向数据设计了先导化合物时,其可用于理解某些分子结构的特征是"药物类"的。这种表征可以基于通过在药典内的已知药物的范围内比较类似物得到的一组凭经验认可的品质。尽管对于药物而言不需要满足所有的或任何的这些表征,但是如果药物候选物是药物类的则其极可能是临床成功的。这些"药物类,,特征的一些已经被总结成四条Lipinski规则(通常称作"五规则",因为在这些规则中数字5占优势)。尽管这些规则通常涉及口服吸收并用于在先导化合物优化期间预测化合物的生物利用度,但是它们在推理性药物设计努力(诸如可通过使用本发明的方法实现的)期间可作为有效的构建先导分子的指导原则。四项"五规则"描述了候选的药物类化合物将具有以下特征中的至少三种(i)重量低于500道尔顿;(ii)logP低于5;(iii)不超过5个氬键供体(以OH和NH基的总数表示);和(iv)不超过10个氢键受体(以N和O原子的总数表示)。另外,药物类分子通常具有约8A到约15A的跨度(幅度)。对于牵涉被足够接近地结合在一起构建成先导分子的原子的亚群的例子参见实施例1的表3。如上解释的,作为药效基团采样数的分子数至少部分地倚赖于数据库的大小和药效基团查询的限制。从药效基团查询采样的分子数可通过进一步构建与靶标生物分子的结合部位配合的模型被减少。这种模型构建可根据如下所述的对接和评分方法进行。被确定的与药效基团模型相比在相似位置具有相似原子和/或在相似位置具有相似特征的候选分子(例如通过如上所述的药效基团查询)施例5)。除了产生数据库查询的药效基团才莫型之外,可以釆用化合物识别和设计的第二顺序和互补方法。药效基团查询可以迅速地滤出化合物,而对接和评分可以更准确地评^介配体-扭标生物分子的结合。在蛋白质或酶靶标生物分子的情况下,粑蛋白或酶的、牵涉与抗体接触的氨基酸残基可用于定义对接部位。在不同的实施方案中,从药效基团查询中选择的化合物与粑蛋白/酶结合部位对接,使用被设计用于这种分析的软件(例如Glide(Schrodinger,NY))进行。对接亲合性可以基于例如以下所述^皮计算成数值(例如"Glide评分")在分子与蛋白质互相作用时获得的能量(例如"g—score")和/或实现相对于最低能量构象的对接构象所需的能量(例如"e—model")(参见例如,实施例5)。对于这些具体例子,评分越负,则对接越好。优选地,g—score低于约-5。优选地,e—model评分低于约-30。考虑了对接的理想数字量化可由于不同的耙标生物分子共同作用的结果而异。在不同的实施方案中,可以选择阈值对接评分(例如g—score和/或e—model评分)以便操纵用于采集和进一步试验的分子数。例如,在本文所述的不同的对接研究中,对于VEGF(Pdb:lcz8),其g—score为-5.0(或在负方向上具有更大幅度),被认为是理想的对接评分,并且因此调节截断;而对于ErbB2(pdb:ls78),g_score为-7.5(或更大幅度M皮i人为是理想的对接评分。在这些研究中,使用g—score的幅度调整采样数到可被采集并用于试验的可操作数。例如,如果从药效基团查询鉴定的化合物的总数为约1,000到约3,000个,则可使用对接评分来对这些化合物分级,从而选择约100到约200个用于进一步的试验。考虑了被选择用于进一步试验的化合物的数目可低于或高于这些估算值。优选地,g—score的幅度用作选择标准,但是还考虑了可类似地使用e—model评分,特别是其中e—model评分属于低幅度的情况下。进一步考虑了选择才示准可以基于g—score和e—model;平分二者,4尤选倾向于g—score。对接和评分可以得到一组具有多种构象异构体的化合物。使用适当的才莫型构建软件(例如MOE),可将3D结构转化成2D结构,并从而除去雷同的化合物。对于使用设计用于这种任务的搜索引擎(例如eMolecules.com)的商业供应商而言常常可搜索得到的优选化学结构的清单。鞋似根据药效基团查询选择的和/或进一步根据对接分析选择的候选分子可祐:检测其对輩巴标生物分子的作用。可通过本领域已知的不同的方法(参见例如实施例6)评价分子对生物分子功能的作用的评价(例如酶活性的抑制)。例如,候选分子对輩巴标酶的催化活性的抑制作用可以通过对靶标酶是特异性的已知活性试^验进行评价(參!**,Reymond编,(2006)EnzymeAssays:High-throughputScreening,GeneticSelectionandFingerprinting,JohnWiley&Sons,386p.,ISBN-10:3527310959;Eisenthall和Danson编,(2002)EnzymeAssays,2dedition,OxfordUniversityPress,384p.,ISBN-10:0199638209)。有几种方法用于进一步精修所选的候选分子。来自生物试验的数据可与对接模型相关联从而进一步精修先导类分子和/或药物类分子。可使用不同的软件包(例如MOE)以使耙标生物分子的结合部位内的活性化合物可视化,从而鉴定适于通过从无到有的设计进行修饰的模板上的部位。使用类似物和亚结构搜索可鉴定活性化合物的类似物(#^辨^,SciFinder;eModel)。可获得的类似物可以才艮据上述的对接和评分过程进行分析。具有理想的对接评分的类似物可以根据上述方法被获得并进一步试验其对耙标生物分子的生物作用。本领域技术人员可理解这些和其它的精修和进一步开发通过本文所述方法被鉴定的候选分子的方法。本发明的另一个方面包括通过本文所述的方法鉴定的,并可用于治疗与革巴标生物分子有关的疾病、病症或病况的化合物(所述化合物通过这些靶标生物分子从此被鉴定)。例如,公知,生长因子蛋白质的抑制在治疗某些肺瘤学疾病中具有益处。还例如AD4-1025被认为是与其受体结合的表皮生长因子的抑制剂(參JS辨如,,滋辨7)。这种化合物在胂瘤学的治疗中具有实用性。预期AD4-1038类似物和衍生物具有相同的抑制作用和实用性。使用用于设计药效基团模型的得自1YY9蛋白质晶体结构的信息设计了药效基团模型Pharml—gly54—asp58(参见例如,实施例4)。使用Pharml—gly54—asp58模型鉴定结合于EGFR(SEQIDNO:l)的小分子。EGFR蛋白质上的部位被抗体西妥昔单抗(SEQIDNO:5和SEQIDN0:6)(爱必妥)的氨基酸残基GLY-54到ASP-58识别。Pharml—gly54asp58仿效残基GLY-54到ASP-58被建构为模型,并被设计作为鉴定具有抗体西妥昔单抗的特征和组分的小分子的工具。具体而言,该区被称为西妥昔单抗的抗体重链的H2CDR区。使用西妥昔单抗的这些氨基酸残基的特征和组分产生药效基团模型。从该药效基团模型得到以下的化合物々Het式(l)其中Sl-S8表示以下类型的独立的取代基卣素(F,Cl,Br,I);羟基(-OH);巯基(-SH);羧基(-COOH);烷基(C1-C4碳,直链、支链、或任选地含有不饱和现象);环烷基(C1-C6,任选地含有不饱和现象);芳基包括苯基,或含1-4个N、O和S原子的杂芳基;或烷氧基(-OR,其中R被定义为是C1-C6直链或支链烷基,任选被卣素,羟基,巯基,羧基,芳基,杂芳基,氨基-NH2,取代的氨基-NR2,或在5或6元环中含l、2或3个N原子的环氨基取代);X被定义为是H2,0,S,N-R,N-OH或N-NR2;Het被定义为是在任何环位置处的一个或多个N原子;和Z被定义为是-COOH,-P03H2;S03H,四唑环,磺酰胺,酰基磺酰胺,-CONH2或-CONR2。另外的类似物包括其中一个或多个氮原子被替换为未取代的碳原子或含一个或两个独立的取代基的碳原子的那些,其中S9-S11的定义如上述对Sl-S8的定义:式(2)式(3)式(4)另外,还料到对映异构体也具有相同的实用性其中S1-S8,X,Het和Z的定义如上所述。在一个实施方案中,表皮生长因子(EGF)与表皮生长因子受体(EGFR)的结合的抑制剂是AD4-1025((N、4-氯苯基)-N、(3-吡咬基甲基)-a-天冬酰胺;式C16H16C1N303;分子量333.78))(參jS辨如,,滋辨7)。AD4-1025与EGFR结合的示例性描述参见图46。AD4-1025的结构如下Cl、在25|LiM浓度的AD4-1025条件下,EGF与EGFR的结合的75.7%被抑制(姜X辨如,,滋辨6)。AD4-1038sAD4-1038被认为是与其受体结合的表皮生长因子的抑制剂(參i辨如,,磁辨8)。该化合物在胂瘤学的治疗中具有实用性。AD4-1038的类似物和衍生物可料到具有相同的抑制作用和实用性。使用用于设计药效基团模型的得自1YY9蛋白质晶体结构的信息设计了药效基团模型Pharml—thrl00—glul05(參jS辨如,,^#/4;表17;图17)。使用Pharml—thrl00—glul05模型鉴定与EGFR结合的小分子。EGFR(SEQIDNO:l)蛋白质上的部位被抗体西妥昔单抗(SEQIDNO:5和SEQIDNO:6)(爱必妥)的氨基酸残基THR-100到GLU-58识另'J。Pharml—thrl00—glu105仿效残基THR-100到GLU-58被建构为才莫型,并被设计作为鉴定具有抗体西妥昔单抗的特征和组分的小分子的工具。使用西妥昔单抗的这些氨基酸残基的特征和组分产生药效基团模型。从该药效基团模型得到以下的化合物其中Sl-S4表示以下类型的独立的取代基卣素(F,CI,Br或I);羟基(-OH);巯基(-SH);羧基(-COOH);烷基(C1-C4碳,直链、支链、或任选地含有不饱和现象);环烷基(C1-C6,任选地含有不饱和现象);芳基包括苯基,或含1-4个N、O和S原子的杂芳基;烷氧基(-OR其中R被定义为是Cl-C6直链或支链烷基,任选地被卣素,羟基,巯基,羧基,芳基,杂芳基,氨基-NH2,取代的氨基-NR2,或在5或6元环中含l、2或3个N原子的环氨基取代);X被定义为是0,S,N-R,N-OH或N-NR2;Het被定义为是位于环的任何位置处的一个或多个N原子;和Z被定义为是-COOH,-P03H2,S03H,四唑环,磺酰胺,酰基磺酰胺基,-CONH2或-CONR2。另外的类似物包括其中中央氮原子被替换为未取代的碳原子或含一个或两个独立的取代基的碳原子的那些,其中S2和S6的定义如上述关于Sl-S4的定义,或者中央碳原子带有如上所述的官能团X:式(7)式(8)式(9)根据需要具有短的连接基部分的化合物也被料到提供相同的EGFR抑制式(IO)其中L被定义为是由含C,N,O和S的1-4个线性连接的原子组成的连接基。在C和S的情况下,原子的氧化状态可通过单键或双键连接有一个或两个氧。在C或N的情况下,原子可具有一个或两个另外的独立地选自如上定义的Sl-S6基团的取代基。另外,具有不同的立体化学组成的化合物,包括外消旋物和对映异构体,也被料到具有作为EGFR抑制剂的实用性外消旋物和对映异构体式(ll)式(12)其中S1-S4,X,Het和Z的定义如上所述。在一个实施方案中,表皮生长因子(EGF)与表皮生长因子受体(EGFR)结合的抑制剂是AD4-1038(((2-[(4-羟基-苯基)-曱基-氨基]-4-氧代-4,5-二氛_噻唑_5-基}-乙酸;式C12H12N2〇4S;分子量280.30)(參i辨如,^<formula>formulaseeoriginaldocumentpage38</formula>磁辦8)。AD4-1038与EGFR结合的示例性描述参见图47。AD4-1038的结构如下所示式(13)在25pM浓度的AD4-1038条件下,EGF与EGFR的结合的70.7%-故抑制(参见例如,实施例6)。AD4-1020AD4-1020被认为是与其受体结合的表皮生长因子的抑制剂(参见例如,实施例10)。这种化合物在肿瘤学的治疗中具有实用性。AD4-1020的类似物和衍生物可料到具有相同的抑制作用和实用性。使用用于设计药效基团模型的得自、1YY9蛋白质晶体结构的信息设计了药效基团模型Pharml—gly54—asp58(参见例如,实施例4)。使用Pharml—gly54—asp58模型鉴定结合于EGFR(SEQIDNO:l)的小分子。EGFR蛋白质上的部位被抗体西妥昔单抗(SEQIDNO:5和SEQIDNO:6)(爱必妥)的氨基酸残基GLY-54到ASP-58识别。Pharml—gly54—asp58仿效残基GLY-54到ASP-58被建构为模型,并被设计作为鉴定具有抗体西妥昔单抗的特征和组分的小分子的工具。具体而言,该区被称为西妥昔单抗的抗体重链的H2CDR区。使用西妥昔单抗的这些氨基酸残基的特征和组分产生药效基团模型。从该药效基团模型得到以下的化合物其中Sl-S6表示以下类型的独立的取代基卣素(F,CI,Br,I);羟基(-OH);巯基(-SH);羧基(-COOH);烷基(C1-C4碳,直链、支链、或任选地含有不饱和现象);环烷基(C1-C6,任选地含有不饱和现象);芳基包括苯基,或含1-4个N、O和S原子的杂芳基;或烷氧基(-OR,其中R被定义为是Cl-C6直链或支链烷基,任选地被卣素,羟基,巯基,羧基,芳基,杂芳基,氨基-NH2,取代的氨基-NR2,或在5或6元环中含l、2或3个N原子的环氨基取代)。另外的类似物包括其中一个或两个苯基环被杂环替代的那些,其中X一皮定义为是O,S,N-R,N-OH或N-NR2;Het:故定义为是4立于环的任何位置处的一个或多个N原子;和Z被定义为是-COOH,-P〇3H2;S03H,四唑环,磺酰胺,酰基磺酰胺,-CONH2或-CONR2。<formula>formulaseeoriginaldocumentpage40</formula>式(15)另外的类似物包括其中根据需要具有短的连接基部分的化合物的那些,它们也被料到提供相同的EGFR抑制,其中L被定义为是由含C,N,O和S的l-4个线性连接的原子组成的连接基。在C和S的情况下,原子的氧化状态可通过单键或双键连接有一个或两个氧。在C或N的情况下,原子可具有一个或两个另外的独立地选自如上定义的Sl-S6基团的取代基。<formula>formulaseeoriginaldocumentpage40</formula>式(16)另外的类似物包括根据需要其中四唑环被替换为选择性的5元杂环的化合物。其中A是独立地选自C,N,O和S的原子。在C和S的情况下,原子的氧化状态可通过单键或双键连接有一个或两个氧。在C或N的情况下,原子可具有一个或两个另外的独立地选自如上定义的Sl-S6基团的取代基。在一个实施方案中,表皮生长因子(EGF)与表皮生长因子受体(EGFR)的结合的抑制剂是AD4-1020(((5-[4-(苄基氧基)苯基]-2H-四唑-2-基〉乙酸);式C16H14N403;分子量310.31)(參!辨如,,滋辨IO)。AD4-1020与EGFR结合的示例性描述参见图53。AD4-1020的结构如下所示在25|iM浓度的AD4-1020条件下,EGF与EGFR的结合的47.8%-故抑制(参见例如,实施例6)。AD4-1132AD4-1132被认为是与其受体结合的表皮生长因子的抑制剂(参见例如,实施例11)。这种4t合物在肿瘤学的治疗中具有实用性。AD4-1132的类似物和衍生物可料到具有相同的抑制作用和实用性。使用用于设计药效基团模型的得自1YY9蛋白质晶体结构的信息设计了药效基团模型Pharm23—gly54—asp58(#i辨如,,滋辨4;表17;图15)。使用Pharm23_gly54_asp58才莫型筌定结合于EGFR(SEQIDNO:l)的小分子。EGFR蛋白质上的部位被抗体西妥昔单抗(SEQIDNO:5和SEQIDNO:6)(爱必妥)的氨基酸残基GLY-54到ASP-58识另'J。Pharm23_gly54_asp58仿效残基GLY-54到ASP-58被建构为才莫型,并被设计作为鉴定具有抗体西妥昔单抗的特征和组分的小分子的工具。使用西妥昔单抗的这些氨基酸残基的特征和组分产生药效基团模型。从该药效基团模型得到以下的化合物其中Sl-S6表示以下类型的独立的取代基卤素(F,CI,Br,I);羟基(-OH);巯基(-SH);羧基(-COOH);烷基(C1-C4碳,直链、支链、或任选地含有不饱和现象);环烷基(C1-C6,任选地含有不饱和现象);芳基包括苯基,或含1-4个N、O和S原子的杂芳基;或烷氧基(-OR,式(18)其中R被定义为是C1-C6直链或支链烷基,任选地被卤素,羟基,巯基,羧基,芳基,杂芳基,氨基-NH2,取代的氨基-NR2,或在5或6元环中含1、2或3个N原子的环氨基取代);和Z被定义为是-COOH,-P03H2;S〇3H,四唑环,石黄酰胺或酰基石黄酰胺基,-CONH2或-CONR2。另外的类似物包括其中朌醚氧一皮Y型原子替代的那些,其中Y被定义为是CH2,O,S,N-R,N-OH或N-NR2。在C和S的情况下,原子的氧化状态可通过单键或双4建连接有一个或两个氧。在C或N的情况下,原子可具有一个或两个另外的独立地选自如上定义的Sl-S6基团的取代基;并且一个或两个苯基环任选地净皮杂环替代;其中Het一皮定义为是一个或多个位于环的任何位置处的N原子另外的类似物包括其中根据需要具有短的连接基部分的化合物的那些,它们也被料到提供相同的EGFR抑制,其中L被定义为是根据需要由含C,N,O和S的l-4个线性连接的原子组成的连接基另外的类似物包括根据需要其中酰胺氮被替换为选择性的A基团,并且酰胺羰基任选地被替换为X基团的化合物<formula>formulaseeoriginaldocumentpage42</formula>式(22)其中A是独立地选自CH2,N,O和S的原子。在C和S的情况下,原子的氧化状态可通过单键或双键连接有一个或两个氧。在C或N的情况下,原子可具有一个或两个另外的独立地选自如上定义的Sl-S6基团的取代基,和X^皮定义为是H2,0,S,N-R,N-OH或N-NR2。另外的类似物包括根据需要在逆酰胺(retro-amide)的情况下(但不限于该情况)基团A和C=X并列的那些式(23)在一个实施方案中,表皮生长因子(EGF)与表皮生长因子受体(EGFR)的结合的抑制剂是^4-1132((2-{[(2,4-二曱基苯氧基)乙酰基]氨基}-5-羟基苯甲酸);式C17H17N05;分子量315.32)(#^*如,,滋Wll)。AD4-1132的结构如下所示在25pM浓度的AD4-1132条件下,EGF与EGFR的结合的59.6%被抑制(參!辨^,,磁辨6)。AD4-1142AD4-1142被认为是与其受体结合的表皮生长因子的抑制剂(参见例如,实施例12)。这种化合物在肿瘤学的治疗中具有实用性。AD4-1142的类似物和衍生物可料到具有相同的抑制作用和实用性。使用用于设计药效基团模型的得自1YY9蛋白质晶体结构的信息设计了药效基团模型Pharm23—gly54—asp58(参见例如,实施例4)。使用Pharm23—gly54_asp58模型鉴定结合于EGFR(SEQIDNO:l)的小分子。EGFR蛋白质上的部位被抗体西妥昔单抗(SEQIDNO:5和SEQIDNO:6)(爱必妥)的氨基酸残基GLY-54到ASP-58识别。Pharm23—gly54—asp58仿效残基GLY-54到ASP-58被建构为模型,并被设计作为鉴定具有抗体西妥昔单抗的特征和组分的小分子的工具。具体而言,该区^^皮称为西妥昔单抗的抗体重链的H2CDR区。使用西妥昔单抗的这些氨基酸残基的特征和组分产生药效基团模型。从该药效基团模型得到以下的化合物其中Sl-S6表示以下类型的独立的取代基氲(-H);卤素(F,Cl,Br,I);羟基(-OH);巯基(-SH);羧基(-COOH);烷基(C1-C4碳,直链、支链、或任选地含有不饱和现象);环烷基(C1-C6,任选地含有不饱和现象);芳基包括苯基环,或含1-4个N、O和S原子的杂芳基环;或烷氧基(-OR,其中R被定义为是Cl-C6直链或支链烷基,任选地被卤素,羟基,巯基,羧基,芳基,杂芳基,氨基-NH2,取代的氨基-NR2,或在5或6元环中含1、2或3个N原子的环氨基取代);和Z一皮定义为是-COOH,-P03H2;S03H,四唑环,石黄酰胺,酰基石黄酰胺,-CONH2或-CONR2。另外的类似物包括其中磺酰胺NH任选地被Y型原子替代的那些,其中Y^皮定义为是CH2,0,S,N-R,N-OH或N-NR2;并且一个或两个苯基环任选地;故杂环替代;其中Het;波定义为是一个或两个位于环的任何位置处的N原子。另外的类似物包括其中根据需要具有短的连接基部分的化合物的那些,它们也被料到提供相同的EGFR抑制,其中L^L定义为是由含C,N,O和S的l-4个线性连接的原子组成的连接基。在C和S的情况下,原子的氧化状态可通过单键或双键连接有一个或两个氧。在C或N的情况下,原子可具有一个或两个另外的独立地选自如上定义的Sl-S6基团的取代基。另外的类似物包括根据需要其中芳香基团通过基团A和Y连接的化合物;包括其中基团A和Y任选地通过单键、双键和三键连接的那些类似物,其中Y的定义如上所述,并且A是独立地选自CH2,N,O和S的原子。在C和S的情况下,原子的氧化状态可通过单键或双键连接有一个或两个氧。在C或N的情况下,原子可具有一个或两个另外的独立地选自如上定义的Sl-S6基团的取代基。另外的类似物包括根据需要其中基团A和Y是邻接的那些;包括其中基团A和Y任选地通过单键、双键和三键连接的那些类似物,<formula>formulaseeoriginaldocumentpage45</formula>在一个实施方案中,表皮生长因子(EGF)与表皮生长因子受体(EGFR)的结合的抑制剂是AD4-1142((5-([(4-乙基苯基)磺酰基]氨基)-2-羟基苯曱酸);式C15H15N05S;分子量321.35)(#^辨如,,滋辨12)。AD4画1142的结构如下在25(iM浓度的AD4-1142条件下,EGF与EGFR的结合的49.8%-故抑制(参见例如,实施例6)。本发明组合物的实施方案包括本文所述的不同化合物的制剂。本文所述的化合物可以通过任何常规的方式使用例如在Remington'sPharmaceuticalSciences(A.R.Gennaro,Ed.),第21版本,ISBN:0781746736(2005)中描述的一种或多种可药用的载体和/或赋形剂进刊-配制。这种制剂将含有治疗有效量的药剂(优选其是纯化的形式)以及适当量的载体,从而提供适合对对象给用的形式。制剂应适合给用方式。本发明的药剂可通过已知方法进行配制,用于使用多种包括但不限于以下的途径对对象给用非肠道,肺,口,局部,皮内,肌内,腹膜内,静脉内,皮下,鼻内,硬膜外,目艮,颊和直肠。单独的药剂还可与本发明的一种或多种另外的药剂组合给用和/或与其它的生物学活性剂或生物学惰性剂组合给用。这种生物学活性剂或惰性剂可以与药剂为流体形式或机械传递,或者通过离子力,共价力,范德华力,疏水力,亲水力或其它物理力与药剂结合。可配制成受控释放(或持续释放)制剂以延长药剂的效能和降低剂量药剂的血液水平,和由此影响副作用的发生。当在本发明的方法中被使用时,治疗有效量的本文所述的药剂之一可以纯形式使用,或者,可以如果存在的可药用盐的形式使用,有或者没有可药用赋形剂。例如,本发明的药剂可以在合理的益处/风险比下,在足够抑制靶标生物分子的足够量下被给用,对于所述靶标生物分子而症或病况。这种化合物及其药物制剂的毒性和治疗效能可通过在细胞培养物和/或实验动物中进行的用于确定LD5o(导致群体50%死亡的剂量)和ED5Q(在群体50%中治疗有效的剂量)的标准药物规程确定。在毒性和治疗作用之间的剂量比是治疗指数,其可用比LDWED5o的表示,其中优选大的治疗指数。可与可药用载体组合以产生单一剂型的本发明化合物的量将根据治疗宿主和具体给药方式而变。本领域技术人员可理解,包含在每个剂型中的单独剂量内的药剂的单位含量本身不必构成治疗有效量,因为必要的治疗有效量可通过给用多个单独剂量实现。药剂给药可作为单次事件发生或在治疗时间期间发生。例如,药剂可每天,每周,每两周,或每月给用。对于某些病况,治疗可延续若干周到若干月,以至一年或更久。用于任何特定对象的具体治疗有效剂量水平根据包括以下的各种因素的不同而异治疗的病况和病况的严重性;使用的具体药剂的活性;使用的具体组合物;患者的年龄,体重,总体健康状况,性别和饮食;给药时间;给药途径;使用的具体药剂的排泄速率;治疗的持续时间;与使用的具体药剂联合使用的或同时给用的药物,以及医学领域公知的类似因素。熟练的从业者可理解本发明中使用的化合物的总日用量将由主治医师在合理的医学判断范围内决定。使用。因此,除了本文所述的疗法之外,还可为对象提供其它的已知可有效用于与靶标生物分子有关的特定病况的疗法。已经详细地描述了本发明,但显而易见的是可能存在实施方案的修改,变体和等价,它们不脱离由权利要求所限定的本发明的范围。另夕卜,实施例提供以下非限制性实施例来进一步说明本发明。本领域技术人员能够认识到在以下实施例中公开的技术表示发明人已经发现的能充分实践本发明的手段,因此可被认为是构成了实践本发明的实施方式。然而,改变,而仍然获得不脱离本发明的精神和范围的类似或相似结果。,滋辨/:A^^发勿J^i长^子以下实施例涉及至少部分地基于针对粑分子(在本实施例中是人血管内皮细胞生长因子(VEGF-A)(SEQIDNO:2))提供的抗体产生一个或多个药效基团。简而言之,对许多动物(例如一组不具有遗传相似性的小鼠)递呈人血管内皮细胞生长因子(VEGF-A)。接种和重复递呈VEGF-A导致在动物中出现各种针对该分子的IgG抗体(多克隆高亲合性抗体)。这些抗体因动物的不同而异,因为各自具有不同的抗体产生的遗传潜力(可能的CDRs不同组合)。抗体中的可变性导致它们在分子的不同表面积结合于VEGF-A分子。可以预期,抗体中的至少一种结合于VEGF-A分子的活跃区。例如,VEGF家》矣目前包4舌7个成员VEGF-A,VEGF-B,VEGF-C,VEGF-D,VEGF-E,VEGF-F和P1GF。所有成员具有共同的VEGF同源结构域,该结构域包括胱氨酸结基元,8个恒定的半胱氨酸残基与在每个单体内的保守的中心四股p折叠的一端的分子间和分子内二硫键有关,所述单体以反向平行、并行定向方式二聚。MAB产生;结晶,X射线衍射;空间位置与亲合性成熟抗体(其Fab片段)结合的VEGF分子在前已进行结晶并由Chen等作为1CZ8公开在RCSB数据库中。更具体地,它们的结晶数据包括V和W区,它们是VEGF二聚体的成员,以及L,H,X和Y区,它们表示Fab分子的抗体轻链和重链。(更具体地,L和H区包括Fab分子的分支之一,包括每个链的可变区和恒定区。类似地,X和Y是Fab分子的另一个分支的轻链和重链。)通过对VEGF-A的晶体结构的超过八千个非氢原子的空间排列进行几何学分析,可以测定一个结构的那些处在另一结构的原子的特定距离内的原子。通过在全部可能的组合上进行直接的几何学比较,这种过滤测定了与两个分子跨接相连的肽。使用最大距离4A,可以测定处在VEGF二聚体的W组分的原子的这种短距离内的可变重链(H)的这些原子,并且这些原子很可能是Fab片段的CDRs中的那些原子。在这种情况下,该分析显示了以下的抗体片段H区和VEGF分子W区的氨基酸包括彼此处在4A间隔范围内的侧链原子(在表中描述了在两个处在该范围内的侧链原子之间的侧链原子的总数)表1<table>tableseeoriginaldocumentpage49</column></row><table>这一分析进一步证实了已经正确地鉴定了结合于靶蛋白的抗体,因为其包括抗体CDRs之间的互相作用,因为可变重链上的CDRs场所包括在30-33,50-55和100-110范围内的肽。更具体地il,如图4所示,其是结合于Fabs204,206的VEGF202的计算机模拟,靶蛋白由二聚的分子W208和V210构建。尽管该抗体是亲合性成熟形式,但是在全分子模型右面的框图中可见,与下方的Fab204之间的互相作用限于重链的可变区216的两个CDRs212,214。图5表示二聚的VEGF分子的条带模型,并证实了与抗体锲合的肽302的范围在80-100范围内,其另外经过上表中概括的分析。根据Chen等的体外细胞基试验表明该亲合性成熟抗体对于VEGF依赖细胞增殖的抑制具有显著功效。本发明的一个方面是认识到有可能使用抗体的结合界面的结构作为指导来产生合成先导分子。这一准确度有助于证实据信参与结合于靶标的肽实际上是CDRS成员,并且所述原子的接近根本不是结晶过程的人为现象。然而,为了分离出参与结合的最重要的原子用来作为合成先导分子的模型,有必要将原子-原子互相作用的原子数目降低到只是那些少数的最密切相关的原子。这可通过将过滤器中的可接受的间隔降低到3A来完成。下表2表示了这种更集中的分析的结果,表2<table>tableseeoriginaldocumentpage50</column></row><table>在这十二个原子,特别是与耙标的原子结合的抗体的六个原子的相对定位处更仔细地观察,可以构建先导分子。下表包括这些原子中的每一个《皮此之间的相对3巨离。表3<table>tableseeoriginaldocumentpage50</column></row><table>如上可见,在靶标和抗体的结合区内最密切结合的原子是氧原子。氮原子在这些高亲合性部位也占较高优势。当氲受体或供体是必要时,氧原子和氮原子通常是可互换的。表3中的星号表示在结合区的被鉴定原子中的距离,代表理想的一小组参与结合的原子,它们彼此足够接近以被构建成先导分子。脯氨酸100,酪氨酸101和102,以及丝氨酸106的4个氧原子足够接近(间隔<13A)使得可以构建具有药物类大小的适当的分子。图6A和6B表示满足这些标准的先导分子结构。下表表示(i)在合理的先导分子构象中的原子的间隔,和(ii)与来自结晶的抗体的X射线衍射分析数据相比,先导分子中的原子的位置之间的差异。表4<table>tableseeoriginaldocumentpage51</column></row><table>表5<table>tableseeoriginaldocumentpage51</column></row><table>正如上表所显示的,由本发明方法生成的推荐的先导分子提供的关键原子的位置与它们在抗体结合末梢中的相对位置的平均偏差为0.18A(不超过0.42A偏差)。如上所述,四条"五规则,,规定了候选的药物类化合物应当具有以下特征中的至少三种:(i)重量低于500道尔顿,(ii)logP大于5;(iii)具有不超过5个氬键供体(由OH和NH基团的总数表示);和(iv)具有不超过10个氬键受体(由N和O原子的总数表示)。目前讨论的先导化合物,C21H2。04,具有以下特征(i)分子量为336;(n)2个氩键供体;和(iii)4个氢键受体。另一个希望的耙标是与病毒感染有关的蛋白质,例如血细胞凝集素。血细胞凝集素是在流感病毒的表面上被发现的抗原糖蛋白,其负责病毒与被感染细胞的结合。尽管由疫苗制造商、医学协会、和致力于公共卫生的政府机构发起的积极的宣传运动,但是在美国每年有数百万人(一些估算范围高达美国居住民的10%到20%)感染流感。大部分患流感的人将在l-2周内恢复,流感;:不过是严重的感冒,但是流感可以是致死的,s别对于虚弱:年老或长期患病个体而言。在美国每年平均有约36,000人死于流感,每年有114,000人因流感住院。根据世界卫生组织的估算,全世界每年有250,000到500,000人死于流感。一些流感传染病杀死无数人,包4舌在1918和1920之间的最大规^莫的致死性流感纟暴发,其杀死了超过5000万人。许多患者对流感疫苗利用的失败可能是在病毒披膜中发现的糖蛋白突变所导致,这要求每年接种疫苗以充分保护个体免受最新形式的病毒的侵害。能阻断病毒与宿主细胞结合的能力的药物疗法,即使仅仅是部分有效的,也将引人注目地增强染病个体的免疫系统在临床显著症状出现之前战胜感染的可能。如果在这些症状开始之后实施药物疗法,同样可能减少感染的严重性和持续时间。Fleury等已经公开了他们的与中和抗体形成复合物的血细胞凝集素的结晶的结果。他们的X射线结晶研究工作的数据被提供在蛋白质数据库中,并且就此由本发明人以上文中关于VEGF(参见实施例l)所公开的类似方式进行了分析。更具体地说,对复合于中和抗体晶体结构的血细胞凝集素的超过八千个非氢原子的空间排列进行几何分析,以确定与靶蛋白足够接近的抗体片段(可变的重链和轻链)的那些原子,这些原子属于与血细胞凝集素结合的部分。使用的过滤器,包括直接几何推算,证实了可变的重链CDR区,以及特别是CDR1和CDR3内的肽(根据Kabat和Wu编号,具体是肽26-32和99-102),是提供抗体与血细胞凝集素蛋白质紧密结合的肽。使用4A的最大间隔,测定了这些CDRs内的那些原子,以及彼此锲合的靶标糖蛋白内的特定原子。这些提供在下表中:表6<table>tableseeoriginaldocumentpage53</column></row><table>在这十八个原子,特别是与靶标的原子结合的抗体的九个原子的相对定位处更仔细地观察,可以构建先导分子。下表包括这些原子中的每一个彼此之间的相对距离。表7<table>tableseeoriginaldocumentpage53</column></row><table>星号代表理想的一小组参与结合的原子,它们彼此足够接近已被构建成先导分子。更具体地说,药物类分子通常具有8-15A的跨度和低于500道尔顿的分子量。酪氨酸32,精氨酸94,色氨酸100和苯丙氨酸100A的5个原子足够接近(间隔<12人)使得可以构建具有药物类大小的适当的分子。图7A和7B表示满足这些标准的先导分子结构。下表表示(i)在合理的先导分子构象中的原子的间隔,和(ii)与来自结晶的抗体的X射线衍射分析数据相比,先导分子中的原子的位置之间的差异。表8<table>tableseeoriginaldocumentpage54</column></row><table>正如上表所显示的,由本发明方法生成的推荐的先导分子提供的关键原子的位置与它们在抗体结合末梢中的相对位置的平均偏差为0.33A(不超过0.66A偏差)。如前所述,四条"五规则"规定了候选的药物类化合物应当具有以下特征中的至少三种(i)重量^f氐于500道尔顿,(ii)logP^氐于5;(iii)具有不超过5个氪键供体(由OH和NH基团的总数表示);和(iv)具有不超过10个氪键受体(由N和O原子的总数表示)。目前所述的先导分子,C22H18N40,具有以下特征(i)分子量为354;(ii)3个氪键供体;和(iii)5个氢键受体。血管生成(新的毛细血管从预存在的维管结构的芽殖)是胎儿和儿童发育的关键方面,因为他们的循环系统在生长期间长大。在成人中,在正常的组织修复中以及用于雌性生殖器官的重塑(排卯和胎盘发育)中要求血管生成。然而,某些病理状况诸如瘤生长和糖尿病性—见网膜病也需要血管生成。牵涉血管生成的已知因子是血管生成素,其是含123个氨基酸的单个多肽链。血管生成素是常见的细胞因子之一,其被癌利用以帮助癌的迅速生长。在这种情况下,肿瘤细胞分泌血管生成素以募集更大血流流向肿瘤。因此,发现可抑制血管生成素的产生或活性的药物将具有重大意义。Chavali等已经公开了他们的与中和抗体复合的血管生成素的结晶的结果。他们的X射线结晶研究工作的数据被提供在蛋白质数据库中,并且已经就此由本发明人以上文中关于VEGF和血细胞凝集素所公开的类似方式进行了分析。更具体地说,对晶体结构的非氢原子的空间排列进行几何分析,以确定与血管生成素分子足够接近的抗体片段(可变的重链和轻链)的那些原子,这些原子属于与血管生成素分子结合的部分。使用过滤器,包括直接几何推算,证实了,如图8所示的,其是可变的轻链和重链,并且特别是在轻链的CDR1内的肽,和重链的CDRs2和3内的肽,是提供抗体与血管生成素强结合的那些肽。使用4A的最大间隔,测定了这些CDRs内的那些原子,以及彼此锲合的靶标糖蛋白内的特定原子。这些提供在下表中表10<table>tableseeoriginaldocumentpage55</column></row><table>在这十八个原子,特别是与靶标的原子结合的抗体的九个原子的相对定位处更仔细地观察,可以筌定血管生成素上的两个分离的可能的耙标^见域。这意P未着(如表11和12所示)可以构建两个分离的先导分子以与血管生成素结合。下表包括每组中的这些原子中的每一个彼此之间的相对距离。表11与<table>tableseeoriginaldocumentpage56</column></row><table>如前所述,药物类分子通常具有8-15A的跨度和低于500道尔顿的分子量。在表ll中,能够看出酪氨酸30B的OH,天冬酰胺30A的氮,酪氨酸98的共振碳CD2,和酪氨酸100B的OH足够接近(间隔〈llA)使得可以构建具有药物类大小的适当的分子。类似地,关于表12,苏氨酸33的氧,酪氨酸58的OH,丝氨酸90和天冬酰胺56的氧足够接近(间隔<14人)使得可以构建另一个适当的分子。图9A和9B分别表示两个先导分子结构,它们满足血管生成素的第一和第二区域的标准。下表表示(i)在合理的第一先导分子的构象中的原子的间隔,和(ii)与来自结晶的抗体的X射线衍射分析数据相比,第一先导分子的原子的位置之间的差异。表13第一先导分子中关键原子的相对位置OHTYRNASNCTYROHTYROHTYR0.003.517.038.06NA$N3.51O.009.4110.75"共振环"C7.039."0,003.95OHTYR8.0610.753,950.00114第一先导分子中关键原子的相对位置OHTYRNASNCTYROHTYROHTYR0.003.517.038.06NASN3.510.009.4110,75"共振环"C7.039.410.003.95OHTYR8.0610.753.950.00类似地,下表表示(l)在合理的第二先导分子的构象中的原子的间隔,和(ii)与来自结晶的抗体的X射线衍射分析数据相比,第二先导分子的原子的位置之间的差异。表15第二先导分子中OOHOo关键原子的相对位置THRTYRSERASN0THR0.007.17".159.23OHTYR7.170.00,9.893.B5OSER11.159.890.0013.47OASN9.233,6513.470.00表16抗体与第二OOHOO先导分子的差异THRTYRSERASN0THRO加0.010.130.15OHTYR0.010.000.070,03OSER0.130,070.00O加oASN0.150.030.000,00正如上表所显示的,由本发明方法生成的推荐的先导分子提供的关键原子的位置与它们在抗体结合末梢中的相对位置的平均偏差为0.05A(不超过0.15A偏差)。如前所述,四条"五规则"规定了候选的药物类化合物应当具有以下特征中的至少三种:(i)重量低于500道尔顿,(ii)logP低于5;(iii)具有不超过5个氲键供体(由OH和NH基团的总数表示);和(iv)具有不超过10个氢键受体(由N和O原子的总数表示)。第一先导候选分子,C22H19N02,具有以下特征(i)分子量为329;(li)4个氲键供体;和(iii)4氲键受体。第二先导候选分子,C22H2Q04,具有以下特征(i)分子量为348;(11)4氢键供体;和(iii)4氢键受体。Z^^于/e标丼教^萄—放差添以下实施例描述了輩巴蛋白-抗体晶体结构复合物的分析以及用于筌定抑制EGFR,HER2,和ErbB2结合的分子的药效基团的产生。与EGFR复合的西妥昔单抗的蛋白质晶体结构由Ferguson等(CancerCell,2005,7,301-311)报导并且该晶体学数据以PDB码1YY9祐:提供在蛋白质数据库中。定义西妥昔单抗(SEQIDNO:5和SEQIDNO:6)的原子位置的结构信息被用来构建药效基团模型,该药效基团模型用于鉴定在相似位置具有相应原子的小分子。与抗体具有相似特征的小分子可以显示相似的生物活性和因此具有相似的治疗实用性。在如下描述的药效基团定义中使用得自ChemicalComputingGroup(CCG)(Montreal,Quebec,Canada)的分子操作环境(MOE)软件的药效基团特征生成和药效基团虚拟筛选组件。MOE药效基团应用使用具有配体中的一组结构特征的药效基团的全面概念,所述特征与在受体部位处的配体识别以及由此与其生物活性直接相关。在MOE中,药效结构特征可用空间标记点表示。每个配体可#皮加注解,其是一組可对配体的药效基团作出贡献的结构特征。加注解的配体的数据库可以使用表示药效基团假设的查询进行搜索。这种搜索结果是一组匹配数据,其将查询的药效基团特征对准在被搜索的数据库的配体中存在的药效基团特征。MOE套装软件提供了人机对话修改(可交互式地调节位置,半径,以及药效基团查询的其它特征);系统匹配(配体及查询的所有可能的匹配被系统地4企验);部分匹配(检索算法能够发现<又4又与查询的一部分匹配的配体);和体积过滤(可以通过对匹配的配体的形状增加一组体积形式的限制而进行集中查询)。本实施例的药效基团特征通过使用MOE中的药效基团查询编辑器生成。所有的氬键供体特征是1.2A半径的球体并且被染成紫色。所有的氪键受体特征是1.2A半径的球体并且被染成青色。所有的芳香基团特征是1.2A半径的球体并且被染成绿色。所有的组合的受体-阴离子药效基团特征是1.2A半径的球体并且被染成灰色。所有的组合的供体-受体特征是1.2A半径的球体并且被染成粉红色。所有的组合的供体-阳离子特征是1.2A半径的球体并且被染成红色。所有的供体,受体,芳香基团,组合的酸-阴离子,和组合的供体-受体方向性特征是1.5A半径的球体并且被分别染色如下对于供体是深灰色,对于受体是暗青色,对于芳香基团是深绿色,对于组合的酸-阴离子是暗青色,和对于组合的供体-受体是深灰色。在药效基团查询中被标定是必要特征的特征必须被包含在配体中以使得该配体被采样。所有的药效基团特征来自从蛋白质数据库(PDB:1YY9)中保藏的晶体结构中取得的相应的与其受体复合的抗体(例如与EGFr复合的西妥昔单抗,pdb登录号1YY9)中的相应的供体,受体,芳香基团和酸部分,有两个例外。有时候,使用由MOE软件提供的两种方法(twomethods)用于找到药效基团特征。这些如下进行解释。使用受体的3D原子坐标,接触统计学计算出疏水性和亲水性配体原子使用统计法的优选位置。使用该方法找到在单独的药效基团定义中所指明的疏水性-芳香性和H键特征。MultiFragment搜索实质上将相对大量的多份片段(例如200份乙烷)放置于受体活性部位内。片段被随机放置在活性部位原子的周围并被假定彼此不相互作用;不用关心片段重叠。然后,使用专门的能量最小化规程精修初始放置;受体原子感受片段的平均力,而每个片段感觉受体的而不是其它片段的全部力。使用这种技术,有可能将疏水性,H键供体,受体和阴离子以及阳离子放置在受体内有利的位置中用作MOE药效基团特征。除了当指出时,否则生成定义如下的药效基团的已占体积。这些来自与抗体结合部位接近的受体原子的位置。已占体积是空间位置,在其中配体原子必须;故隔绝以免撞击受体。它们在MOE中通过选择距抗体在5A内的受体残基并从MOE中的药效基团查询编辑器中选择"连接基(union)"被生成。在如下所述的单独的药效基团定义中,各缩写如下F-药效基团特征;供体二Don,受体二Acc,阴离子^Am,阳离子二Cat,受体和阴离子二Acc&Ani,供体和阳离子二Don&Cat,供体和受体二Don&Acc,芳香基团二Aro,疏水基=Hyd。与抗体西妥昔单抗复合的EGFR(lYY义pdb)根据上述过程分析与抗体西妥昔单抗(SEQIDNO:5和SEQIDNO:6)复合的蛋白质EGFR(SEQIDNO:1)的结晶(lYY9.pdb)。结果表明抗体西妥昔单抗的两组残基与受体接触。它们是Gly54-Asp58和Thrl00-Glu105。因为抗体的这两组残基彼此不非常接近,它们用于产生两组药效基团模型,用于gly54—asp58和thrl00—glu105区域,在下表17中描述,和如图11-22所示。表17<table>tableseeoriginaldocumentpage60</column></row><table><table>tableseeoriginaldocumentpage61</column></row><table><table>tableseeoriginaldocumentpage62</column></row><table><table>tableseeoriginaldocumentpage63</column></row><table><table>tableseeoriginaldocumentpage64</column></row><table><table>tableseeoriginaldocumentpage65</column></row><table><table>tableseeoriginaldocumentpage66</column></row><table><table>tableseeoriginaldocumentpage67</column></row><table><table>tableseeoriginaldocumentpage68</column></row><table><table>tableseeoriginaldocumentpage69</column></row><table><table>tableseeoriginaldocumentpage70</column></row><table><table>tableseeoriginaldocumentpage71</column></row><table><table>tableseeoriginaldocumentpage72</column></row><table>与抗体西妥昔单抗的重链复合的EGFR(2EXQ.pdb)根据上述过程分析与抗体西妥昔单抗(SEQIDNO:5和SEQIDNO:6)的重链复合的蛋白质EGFR(SEQIDNO:l)的结晶(2EXQ.pdb)。结果表明在第一组药效基团模型中,抗体重链的八个残基与受体接触。它们是Tyr50—Thr57。它们用于产生七个药效基团模型,模型如表21和图36-42中所示。表21<table>tableseeoriginaldocumentpage73</column></row><table><table>tableseeoriginaldocumentpage74</column></row><table><table>tableseeoriginaldocumentpage75</column></row><table><table>tableseeoriginaldocumentpage76</column></row><table>与抗体西妥昔单抗的轻链复合的EGFR(2EXQ.pdb)才艮据上述过程分析与抗体西妥昔单抗(SEQIDNO:5和SEQIDNO:6)的轻链复合的蛋白质EGFR(SEQIDNO:l)的结晶(2EXQ.pdb)。结果表明在第一组药效基团模型中,抗体的轻链的九个残基与受体接触。它们是Asn32—Ile33—Gly34,Tyr49—His50—Gly51,Tyr91,Phe94和Trp96。它们用于产生六个药效基团模型,模型如表22和图43-44中所示。表22与抗体西妥昔单抗的轻链复合的蛋白质EGFr的2EXQ.pdb结晶的药效基团<table>tableseeoriginaldocumentpage77</column></row><table><table>tableseeoriginaldocumentpage78</column></row><table><table>tableseeoriginaldocumentpage79</column></row><table>使用上述的操作法,可以产生用于各种包括但不限于以下的蛋白质靶标(与配体一起结晶)的药效基团模型足口病(lQGC.pdb);血管紧张素II(lCKO.pdb,3CK0.pdb,2CK0.pdb);与培妥珠单抗抗体复合的ErbB2(lL7I.pdb,1S78.pdb,2GJJ.pdb);Flu凝集素(lDNO.pdb,lOSP.pdb);Flu血细J包凝集素(1E08.pdb,lQFU.pdb,2VIR.pdb,2VIS.pdb,2VIT.pdb,lKEN.pdb,lFRG.pdb,lHIM.pdb,lHIN.pdb,lIFH.pdb);Flu神经氨酸酶(NC10.pdb,lAI4.pdb,lN謹.pdb,lNMC.pdblNMA.pdb,lNCA.pdb,lNCD.pdb,2AEQ.pdb,lNCB.pdb,lNCC.pdb,2AEP.pdb);y干扰素(HuZAF.pdb,lT3F.pdb,lB2W.pdb,lB4J.pdb,1T04.pdb);与赫赛汀复合的HER2(lN8Z.pdb,lFVC.pdb);脑膜炎奈瑟氏球菌(lMNU.pdb,lMPA.pdb,2MPA.pdb,lUWX.pdb);HIV1蛋白酶(lJP5.pdb,lCL7.pdb,lMF2.pdb,2HRP.pdb,lSVZ.pdb);HIV-1逆转录酶(2HMI.pdb,1J50.pdb,lN5Y.pdb,lN6Q.pdb,lHYS.pdb,lC9R.pdb,lHYS.pdb,1R08.pdb,1T04.pdb,2HRP.pdb);鼻病毒(lFOR.pdb,lRVF.pdb,lBBD.pdb,lA3R.pdb,lA6T.pdb);血小板纤维蛋白原受体(lTXV.pdb,lTY3.pdb,lTY5.pdb,lTY6.pdb,lTY7.pdb);沙门氏菌低聚糖(lMFB.pdb,lMFC.pdb,lMFE.pdb);TGF-Alpha(lE4W.pdb,lE4X.pdb);与TN1复合的血小板生成素(lV7M.pdb,lV7N.pdb);与5G9复合的组织因子(lFGN.pdb,lAHW.pdb,lJPS.pdb,lUJ3.pdb);与NMC-4复合的冯维勒布因子(10AK.pdb,2ADF.pdb,lFE8.pdb,lFNS.pdb,2ADF.pdb);与B20画4复合的VEGF(2FJH.pdb,2FJF.pdb,2FJG.pdb,lTZH.pdb,lTZI.pdb,lCZ8.pdb,lBJl.pdb);冠状病毒-SARS(2DD8.pdb,2G75.pdb);莱姆病(lP4P.pdb,lRJL.pdb);HIVGP120(lACY.pdb,1F58.pdb,lG9M.pdb,lG9N.pdb,lGCl.pdb,lQlJ.pdb,lQNZ.pdb,lRZ7.pdb,lRZ8.pdb,lRZF.pdb,lRZG.pdb,1RZI,lRZJ.pdb,lRZK.pdb,lYYL.pdb,lYYM.pdb,2B4C.pdb,2F58.pdb,2F5A.pdb);HIVGP41(lTJG.pdb,lTJH.pdb,lTJI.pdb,1U92.pdb,1U93.pdb,1U95.pdb,lU8H.pdb,lU8I.pdb,lU8J.pdb,lU8K.pdb,lU8P.pdb,lU8Q.pdb,1U91.pdb,lU8L.pdb,lU8M.pdb,lU8N.pdb,1U80.pdb,2F5B);西尼罗病毒(如美国专利申请7>开No.2006/0115837中定义的);疟疾(二氢叶酸还原酶)(如ActaCrystallographia(2004),D60(ll),2054-2057中定义的);和EGFR(lI8I.pdb,118K.pdb,lYY8.pdb,lYY9.pdb,2EXP.pdb,2EXQ.pdb)。,滋辨5:痴^U,遂弄伊^^被选择用于与耙蛋白对接的化合物是那些被发现与在MOE建模软件中生成的药效基团模型对准的化合物(参见实施例4)。这些化合物从ZINC数据库中以MOE数据库格式获得(參HrwinandShoichet(2005)JChemInfModel45,177-182)。这些化合物的3D原子坐标以结构数据格式(气sdf)文件被书写,使用在MOE数据库窗口中的输出命令,无需添加氢。其次使用Maestro建模软件(SchrodingerLLC,NY,NY)的LigPrep软件模块来制备用于对接的化合物。使用LigPrep将气sdf文件转化为Maestro格式。然后添加氲,并中和任何的带电荷基团。以7.0+/-1.0pH单位生成了配体的离子化状态。之后,必要时生成互变异构体,生成可供选择的手征性和生成低能量环构象体。然后使用MacroModel软件模块除去任何的有问题的结构并使得到的配体进行能量最小化。最后,用Maestro文件(气mae)书写正准备用于对接的配体。所有这些步骤借助由Schrodinger,LLC^是供的pythonscript自动进4亍。下面描述蛋白质制备。首先将蛋白质以PDB格式输入进Maestro。附加氬并修正任何误差诸如不完全残基。检查蛋白质结构,考虑金属离子和辅助因子。根据需要确定金属离子和辅助因子的电荷和原子类型。如有必要调节配体的键序和形式电荷。通过在Maestro(Glide)中挑选配体(对于1YY9,其是抗体的Thrl00-Tyrl01-Tyrl02-Aspl03國Tyrl04-Glu105或Gly54-Gly55-Asn56-Thr57-Asp58碎片)确定结合部位。该程序确定了被挑选的配体的质心并画出20A的框架,其代表在框架中心处的配体质心缺省设定(defaultsetting)。该框架是待对接的配体的结合部位。蛋白质制备手段,其在Glide中是自动进行的,由制备和精修两部分构成。制备部分附加氲和中和的与结合部位不接近的且不参与形成盐桥的侧链。精修部分对重新定向的侧链羟基的共同结晶的复合物进行限制性最小化和减轻潜在的空间碰撞。以下描述受体网4各生成。Glide探求一个或多个配体分子与受体分子通常是蛋白质之间的有利的互相作用。受体的形状和性质由网格上的多个不同的区域组表示,包括氢键合,库仑(即,电荷-电荷)互相作用疏水性相互作用,和配体与蛋白的空间碰撞。在第一步骤中,受体必须-故进行明确表示。这通过挑选配体完成。结构的未挑选部分是受体。配体不被包梧在网格计算中,但是用于明确表示如上所述的结合部位。受起来的框架空间内被计算。其是上述的框架并且所有的配体原子必须被包含在该框架内。没有使用药效基团约束因素,因为Glide的特别的精密评分功能在没有这些约束因素时可以更好地进行。为了使用Glide,每个配体必须是单个的分子,尽管受体可包括超过一个分子,例如蛋白质和辅助因子。Glide可以刚性或柔性对接的方式运行;后者自动地生成关于每个输入配体的构象。配体相对于受体的位置与定向的组合,以及其在柔性对接中的构象,被称为配体位姿。所有的对接行为使用柔性对接方式进行。Glide生成的配体位姿通过一系列的等级过滤器评价配体与受体的相互作用。初始过滤器试验配体与规定活性部位的空间配合,并使用网格基方法检查配体-受体相互作用的互补性。通过这些初始筛选的位姿进入算法的最后阶段,其包括对网格逼近OPLS-AA非结合的配体-受体相互作用能量进行评价和最小化。然后在能量最小化的位姿上进行最终评分。作为默认,使用Schr6dinger专有的GlideScore多配体评分函数对位姿进行评分。如果选择GlideScore作为评分函数,则使用复合Emodel评分对每个配体的位姿分等级和选择要向使用者报导的位姿。Emodel结合GlideScore,非结合的相互作用能,以及对于柔性对接而言生成的配体构象的过量内部能量。构象柔性在Glide中通过广泛的构象搜索进行操作,由迅速消除不适当构象(如具有远距离内部氢键的构象)的启发式筛选加强。在本实施例的对接运行中使用的设置如下。读入网格文件。使用Extraprecision(XP)评分函数。使用构象柔性对接。初始Glide筛选保持了每个配体为5000种位姿(默认)。保持初始位姿的评分窗口是IOO.O(默认)。对于能量最小化最好是保持每个配体800个位姿(默认)。对于能量最小化,使用的距离依赖性介电常数是2.0,共轭梯度步骤(conjugategradientsteps)的最大数目是IOO(默认)。然后装入配体文件。>120个原子和/或〉20个可旋转键的分子不进行对接(默认)。具有局部电荷<0.15的配体原子的范德华半径用0.80的比例进行修正。这样作是模仿受体柔性。未使用约束和类似性。排除库仑+范德华能量>0.0的位姿。为了保证每个分子的位姿在构象方面是不同的,放弃方均根(RMS)偏差〈0.5和/或最大原子位移为1.3A的位姿。以下描述Glide评分。使用模型能量评分(Emodel)结合能量网格评分,通过GlideScore预测的结合亲合力,和(对于柔性对接)可潜在地用于引导构象检索算法的模型的内部应变能量,对每个配体选择最好的对接结构。Glide还计算了特别构建的库仑-范德华相互作用-能量评分(CvdW),其被制订为避免了在损害电荷-偶极和偶极-偶极相互作用的情况下过度地给予电荷-电荷相互作用。这一评分意在比"天然"库仑-范德华相互作用能更适于比较不同配体的结合亲合力。在最后的数据处理中,可以组合使用计算机化的Glide评分和"改进的"库仑-范德华评分值,以获得综合评分,其可在数据库筛选应用中帮助改善富集系数。Glide评分的数学表达式是GScore=0.065*EvdW+0.130*Coul+Lipo+Hbond+Metal+BuryP+RotB+Site其中EvdW是范德华能量(使用在具有形式电荷的基团诸如金属,羧基和胍铩上的减少的净离子电荷计算);Coul是库伦能(使用在具有形式电荷的基团诸如金属,羧基和胍镩上的减少的净离子电荷计算);Lipo是亲脂性接触术语(给予有利的疏水性相互作用);HBond是氩键合术语(根据是否供体和受体是中性的,一个是中性的且另一个是带电荷的,或者二者都带电荷而被分成不同的权重组分);metal是金属键合术语(仅仅包括阴离子受体原子的相互作用;如果在apo蛋白质内的净金属载荷是正的,则优先包括阴离子配体;如果净电荷是零,则优先^^皮抑制);BuryP是嵌入的极性基团的罚分;RotB是冷冻的可旋转键的罚分;和Site是活性部位内的极性相互作用(疏水区域内被给予的极性而非氲结合的原子)。以下描述进行筛选的有效化合物库的生成。从ZINC数据库下载结构数据格式(sdf,MolecularDesignLimited)的得自市售化合物的免费的虛拟数据库的先导类化合物(IrwinandShoichet(2005)J.Chem.Inf.Model.45(1),]77-182)。先导类数据库由大约890,000个化合物组成,其被分成33个部分。这用来生成用于进行MOE筛选的构象异构体的数据库。然后附加氢。对于药效基团搜索,必须生成低能构象异构体的数据库。将构象输入命令施用于上面的sdf才各式。在生成构象体后,实施构象异构体数据库的预处理。该步骤,#:称作特征注解,确定了每个分子构象内的药效基团特征的类型及其几何关系。然后将其与查询比较,并且那些在给出的容许误差范围内与查询匹配的分子/构象#:存储作为采样。EGFR相对于从与抗体西妥昔单抗(SEQIDNO:5和SEQIDNO:6)复合的蛋白质EGFR(SEQIDNO:l)的lYY9.pdb晶体鉴定的药效基团(参见例如,实施例4;表17),对得自ZINC数据库的化合物的分析鉴定了183个相似的化合物。根据上面描述的对接和评分方法对这些化合物进行分析。得自对接和评分试验的示例性结果如表23所示。表23<table>tableseeoriginaldocumentpage84</column></row><table><table>tableseeoriginaldocumentpage85</column></row><table><table>tableseeoriginaldocumentpage86</column></row><table>例如在图49中描述了化合物AD4-1009与EGFR的对接。例如在图48中描述了化合物AD4-1010与EGFR的对接。例如在图50中描述了化合物AD4-1016与EGFR的对接。例如在图51中描述了化合物AD4-1017与EGFR的对接。例如在图52中描述了化合物AD4-1018与EGFR的对接。例如在图46中描述了化合物AD4-1025与EGFR的对接。例如在图47中描述了化合物AD4-1038与EGFR的对接。VEGF根据上面描述的方法,相对于从与抗体帕妥珠单抗复合的蛋白质VEGF(SEQIDNO:2)的lCZ8.pdb晶体筌定的药效基团(参见实施例4;表18),对得自ZINC数据库的化合物的分析鉴定了如表24所示的化合物。从上面描述的药效基团查询,在采样上生成了Glide评分。根据glide评分对所得数据进行排列,并选择了13个AD4化合物来表示使用药效基团6n鉴定的化合物,选择基于g—score为-5.0(或更大数量)+ZINC02338377(AD4-2008)(g—score=-4.9156)。表24<table>tableseeoriginaldocumentpage87</column></row><table>根据上面描述的方法,相对于从与抗体曲妥珠单抗(SEQIDNO:7和SEQIDNO:8)复合的蛋白质HER2(SEQIDNO:3)的lN8Z.pdb晶体鉴定的药效基团(参见实施例4;表19),对得自ZINC数据库的化合物的分析鉴定了如表25所示的化合物。从上面描述的药效基团查询,在采样上生成了Glide评分。根据glide评分对所得数据进行排列,并选择了18个AD4化合物来表示使用药效基团3n筌定的化合物,选择基于g—score为-6.0(或更大数量)+ZINC00177228(AD4-3006)(g—score=-5.8263》表25<table>tableseeoriginaldocumentpage88</column></row><table>ErbB2才艮据上面描述的方法,相对于从与抗体帕妥珠单抗(SEQIDNO:9和SEQIDNO:10)复合的蛋白质(ERBBZ(SEQIDNO:4)的1S78.pdb晶体筌定的药效基团(参见实施例4;表19),对得自ZINC数据库的化合物的分析鉴定了如表26所示的化合物。从上面描述的药效基团查询,在采样上生成了Glide评分。根据glide评分对所得数据进行排列,并选择了17个AD4化合物来表示使用药效基团5n鉴定的化合物,选择基于g一score为-7.5(或更大数量)+ZINC01800927(AD4-3044)(g—score=-7.3143)。表26<table>tableseeoriginaldocumentpage89</column></row><table>,滋辨6:试-發^7于五Gi^#賴^双秀放差敏谬身^被^定^必合參试验了被鉴定的化合物(为多种药效基团模型)在25pM下抑制EGFR的能力。使用药效基团模型(参见实施例4)鉴定了AD4-化合物,然后将其与被西妥昔单抗的规定CDRs识别的EGFR(SEQIDNO:l)的结合部位对接。然后测定AD4-化合物对表皮生长因子结合的抑制(NovaScreenBiosciences,Hanover,MD)。EGF结合的抑制在25|iM浓度下测定。对于抑制剂试验,Ko(结合亲合力)是1.04nM,而Bmax(受体数)是43.0fmol/mg组织(湿重)。受体来源是大鼠肝脏膜。放射性配体是最终配体浓度为0.36nM的[mi]EGF(150-200Ci/|ug)。非特异性决定簇用作EGF-[100nM]。参考化合物和阳性对照是EGF。反应在含0.P/。BSA的10mMHEPES(pH7.4)中在25。C进行60分钟。反应通过在玻璃纤维过滤器上的快速真空过滤被终止。测定被过滤器截留的放射性,并与对照值比较,以确定受试化合物与EGF结合部位的任何相互作用。EGF抑制剂试验是例如以下方法的改进Mukku(1984)J.Biol.Chem.259,6543-6546;Duh等,(1990)WorldJ,Surgery14,410-418;Lokeshwar等,(1989)J.Biol.Chem.264(32),19318-19326。为多种药效基团模型的被鉴定的化合物的EGFR抑制试验结果如表27所示。表27EGFRAD4-编号抑制药效基团模型AD4-102575.74%Pharm"_gly54_asp58AD4-103870.91%Ph3irn1—thr100jlu105结构加AD4-1132AD4-1142AD4-102059.60%49.76%47.84%Pharm23一gly54—asp58Pharm23—gly54_ssp58Pharm11—gly54一asp58丫〕丫ClCOOHAD4-116547-18%Pharm1—thrl00_jglu105eCOOH,人CQOHV1AD4-1171AD4-1141coonAD4"1021AD4-114747.18%43.44%43.35%AD4"114843-18%Pharm1_jgly54—asp5846.74%Pharm22_thr100_gJu105Pharm11jgly54一asp58Ph曰rm21』ly54—ssp58Pharm23_gIy54_asp58AD4-115043.07%Pharm1一gly54一asp一58<formula>formulaseeoriginaldocumentpage92</formula>AD4-110936.45%AD4-101836.22%AD4~117535,07%AD4-10t735.03%35.01%AD4-112t34邻%AD4""7834.61%AD4""233"4%AD4"115334.02%AD4-117633.98%Pharm22—thr100jglu105Pharm"l一gly54一asp5BPharm10,r100一glu105Pharm1—thr1OO一glu105Pharm22jhr100一glu105Pharm23—gly54_鄉58Ph曰rm22一thr100—gu105Pharm23_gJyS4—asp58Ph3rm23—gly54一asp58AD4-"49AD4-1164AD4.1124AD4-1108AD4-1039AD4-1169A04-116633.62%Pharm1_gly54—asp5833.31%Pharml一gly54一asp5833.09%Pharm21—thr100—gtu10533,06%Pharm21—g'y54_asp5832.70%Ph3rm1_thr100—glu10531.69%Phsrm1_gly54_asp5831.41%Pharm1—gJy54_asp583124%Pharm1_thr100—glu10530.55%Pharm1_gty54—asp58AD4-105030,22%Pharm2_thr100_glu1。5AD4"115530.14%Pharm1』ly5'4一asp58AD4-105730.12%Pharm10—Uir100』lii1OS,磁辨7:jz)乒/025必合參AD4-1025(N、(4-氯苯基)-N、(3-吡啶基甲基)-a-天门冬酰胺;式C16H16C1N303;分子量333.78)是表皮生长因子(EGF)与表皮生长因子受体(EGFR(SEQIDNO:l)结合的抑制剂。<formula>formulaseeoriginaldocumentpage95</formula>在25pM的AD4-1025的浓度下,EGF与EGFR(SEQIDNO:l)的结合被75.7%抑制(参见例如,实施例6)。与EGFR复合的西妥昔单抗的蛋白质晶体结构已被Ferguson等((2005)CancerCell7,301-311)报导,并且晶体学数据以pdb编码1YY9("lYY9.pdb")保藏在蛋白质数据库中。使用得自用于设计药效基团模型的1YY9蛋白质晶体结构的信息鉴定AD4-1025(参见例如,实施例4)。使用模型Pharml—gly54—asp^鉴定与EGFR结合的小分子。EGFR蛋白质上的位置^皮抗体西妥昔单抗(SEQIDNO:5和SEQIDNO:6)(爱必妥)的氨基酸残基GLY-54到ASP-58识别。仿照残基GLY-54到ASP-58对Pharml—gly54—asp58沖莫建并一皮-没计作为鉴定具有抗体西妥昔单抗的特征和组分的小分子的工具。具体地说,该区被定义为是西妥昔单抗的抗体重链的H2CDR。西妥昔单抗的这些氨基酸残基的特征和组分用于产生药效基团模型。Pharml—gly54—asp58的药效基团特征(F)和组分包括Fl:Aro-定位于与EGFR的ARG353相互作用的球形半径为1.2A的芳香环中心组分;F2:Aro2-定位于模仿计划的方向性以与EGFR的AGR353相互作用的球形半径为1.5A的芳香环中心组分;F3:Acc&Ani-定位于模仿西妥昔单抗的GLY-54的羰基的球形半径为1.2A的氢键受体和阴离子组分;F4:Acc2-定位于模仿西妥昔单抗的GLY54的羰基的未共电子对的方向性的球形半径为1.5A的氢键受体组分,在蛋白质晶体结构PDB:1YY9中其在与EGFR的ARG353的氢4建中锲合;F5:Acc&Ani-定位于模仿西妥昔单抗的ASP-58的羧基氧原子的球形半径为1.4A的氢键受体和阴离子组分;和F6:Acc-定位于模仿THR57的酰胺羰基的未共电子对的方向性的球形半径为1.2A的氢键受体组分(参见例如,表17;图11)。对于药效基团10,不是所有的组分同时都是必要的。药效基团模型Pharml—gly54—asp58允许局部匹配6个特征和组分中的5个。另外,将称作已占体积约束的特征并入Pharml—gly54—asp58。已占体积约束用于排除被靶蛋白(在该情况下是EGFR)占领的空间。为了在药效基团查询期间约束被筌定的小分子的几何结构,布置一组"假"球体以占据靶蛋白的原子的位置。这些在图45中以暗灰色球体呈现。这种表示用于近似于把蛋白EGFR的表面拓朴学(参见例如,图45)。使用基于搜索850,000个商业化合物的数据库的药效基团鉴定小分子(参见例如,实施例4)。然后将通过Pharml—gly54—asp58鉴定的化合物虛拟对接(参见例如,实施例5)到EGFR结合部位的氨基酸残基(参见例如,图46)以提供一系列的草巴标抑制剂。使用被称作Pharml—glu54—asp58的药效基团才莫仿西妥昔单抗的氨基酸GLY54到ASP58,鉴定了化合物AD4-1025。进一步试验证明了化合物AD4-1025在25juM浓度下以76%抑制EGFR。与EGFR的结合部位的氨基酸残基对接的AD4-1025的示例性描绘如图46所示。使用Pharml—glu54_asp58鉴定的其它的小分子EGFR抑制剂包括AD4-1020(在25浓度下48%抑制);AD4-1021(在25|uM浓度下43%抑制);AD4-1027(在25|uM浓度下39%抑制);AD4-1022(在25]uM浓度下39%抑制);AD4-1030(在25|uM浓度下38%抑制);和AD4-1039(在25|uM浓度下32%抑制)。AC^-/03S必合參八04-1038({2-[(4-羟基-苯基)-曱基-氨基]-4-氧代-4,5-二氬-噻唑-5-基)-乙酸;式C12H12N204S;分子量280.30)是表皮生长因子(EGF)与表皮生长因子受体(EGFR(SEQIDNO:l))结合的抑制剂。在25^M的AD4-1038的浓度下,EGF与EGFR的结合,皮抑制70.7%(参见例如,实施例6)。使用模型Pharml_thrl00_glul05鉴定与EGFR结合的小分子。EGFR蛋白质上的位置净皮抗体西妥昔单抗(SEQIDNO:5和SEQIDNO:6)(爱必妥)的氨基酸残基THR-100到GLU-105识别。仿照西妥昔单抗氨基酸残基THR-100到GLU-105对Pharml一thr100—glul05模建并被设计作为用于鉴定具有抗体西妥昔单抗的特征和组分的小分子的工具。具体地说,该区域被定义为是H3CDR,其位于西妥昔单抗的抗体重链上。西妥昔单抗的这些氨基酸残基的特征和组分用于产生药效基团模型。Pharml—thrl00—glu105的药效基团特征(F)和组分包括Fl-F8(参见例如,表17;图17)。与EGFR的结合部位的氨基酸残基对接的AD4-1038的示例性描绘如图47所示。使用Pharm1—thrlOO—glul05鉴定的另外的小分子EGFR抑制剂是AD4-1009(在25mM浓度下35.01%抑制)。^滋辨9:JD^/WO必合參AD4-1010(4-(4-羟基苯基)-6-甲基-N-(3-甲基苯基)-2-氧代-l,2,3,4-四氢-5嘧啶曱酰胺;式C19H19N3〇3;分子量337.37)是表皮生长因子(EGF)与表皮生长因子受体(EGFR(SEQIDNO:l))结合的抑制剂。式(13)<formula>formulaseeoriginaldocumentpage98</formula>式(31)在25pM的AD4-101浓度下,EGF与EGFR的结合被抑制39.40%(#JS辦如,,滋辨6)。与EGFR复合的西妥昔单抗的蛋白质晶体结构已被Ferguson等((2005)CancerCell7,301-311)报导,并且晶体学数据以PDB编码1YY9("lYY9.pdb")保藏在蛋白质数据库中。使用得自用于设计另外的药效基团模型的1YY9蛋白质晶体结构的信息鉴定了AD4-1010。该模型用于鉴定不同组的EGFR抑制剂。EGFR蛋白质上的位置^皮抗体西妥昔单抗(SEQIDNO:5和SEQIDNO:6)(爱必妥)的氨基酸残基TYR-101到TYR-104识别。仿照残基TYR101到TYR104对Pharm2—thr100—glul05模建并用于筌定具有抗体西妥昔单抗的特征和组分(参见例如,实施例4)的小分子。具体地说,该区域一皮定义为是抗体重链的H3CDR。西妥昔单抗的这些氨基酸残基的特征和组分用来产生药效基团才莫型Pharm2—thr100—glul05(参见例如,实施例4)。药效基团特征(F)和组分包括Fl:Don&Acc-定位于才莫仿西妥昔单抗的TYR-102的羟基的球形半径为0.8A的氢《建供体和氢^fe受体组分;F2:Aro-定位于模仿西妥昔单抗的TYR-102的苯基环的球形半径为1.2A的芳香环组分;F3:Acc-定位于才莫仿TYR-102的羰基氧的球形半径为0.8A的氲键受体组分;F4和F5:Acc&Am-每个定位于模仿西妥昔单抗的ASP-103的羧基氧原子的球形半径为0.8A的氢键受体和阴离子组分;F6:Don&Acc-定位于模仿西妥昔单抗的TYR-104的羟基的球形半径为0.8A的氲键供体和氢键受体组分;和F7:Aro-定位于模仿西妥昔单抗的TYR-104的苯基环的球形半径为1.2A的芳香环组分(参见例如,表17;图18)。对于药效基团,不是所有的组分同时都是必要的。允许局部匹配7个特征和组分中的5个。与得自西妥昔单抗的蛋白质晶体结构的残基TYR-100到TYR-104重叠的Pharm2—thr100—glul05的图示如例如图18所示。使用Pharm2—thrl00_glul05通过搜索商业化合物鉴定了AD4-1010。与EGFR的结合部位的氨基酸残基对接的AD4-1010的示例性描绘如图48所示。AD4-1020({5-[4-(千基氧基)苯基]-2H-四唑-2-基}乙酸;式C16H14N403;分子量310.31)是表皮生长因子(EGF)与其受体(EGFR(SEQIDNO:l))结合的抑制剂。<formula>formulaseeoriginaldocumentpage99</formula>式(28)在25^iM的AD4-1020的浓度下,EGF与EGFR的结合一皮抑制47.8%(參^辨如,,滋辦6)。与EGFR复合的西妥昔单抗的蛋白质晶体结构已被Ferguson等((2005)CancerCell7,301-3ll)报导,并且晶体学数据以PDB编码1YY9("lYY9.pdb")保藏在蛋白质数据库中。使用得自用于设计另外的药效基团模型的1YY9蛋白质晶体结构的信息鉴定了AD4-1020。该模型用于鉴定不同组的EGFR抑制剂。EGFR蛋白质上的位置一皮抗体西妥昔单抗(SEQIDNO:5和SEQIDNO:6)(爱必妥)的氨基酸残基GLY-54到ASP刁8识别。仿照残基GLY-54到ASP-58对Pharml_gly54—asp58模建并被用来鉴定具有抗体西妥昔单抗的特征和组分(参见例如,实施例4)的小分子。具体地说,该区域:故定义为是抗体重链的H2CDR。西妥昔单抗的这些氨基酸残基的特征和组分用来产生药效基团才莫型Pharml—gly54—asp58(参见例如,实施例4)。药效基团特征(F)和组分包括FlAro-得自疏水性接触统计学,与受体的Arg353的胍的有利的电荷相互作用;F2Aro2-相对于Arg353的胍为F1指向;F3Acc&Am-得自抗体西妥昔单抗的Gly54主链羰基,受体从受体Arg353的胍接受H键或阴离子与受体Arg353的胍形成盐桥;F4Acc2-相对于Arg353的胍为F3指向;F5Acc&Ani-得自Asp58侧链羧基,受体从受体的Lys443侧链的NH^接受H键或阴离子与受体的Lys443侧链的NHg+形成盐桥;F6Acc-得自亲水性接触统计学,从受体的Ser448的侧链OH接受H键;Vl-已占体积(为清楚起见未显示)。对于药效基团,不是所有的组分同时都是必要的。允许局部匹配6个特征和组分中的5个。与得自西妥昔单抗的蛋白质晶体结构的残基GLY-54到ASP-58重叠的Pharm1—gly54—asp58的图示如例如图11所示。使用Pharml—gly54—asp58通过搜索商业化合物鉴定了AD4-1020。与EGFR的结合部位的氨基酸残基对接的AD4-1020的示例性描绘如图53所示。AD4-1132((2-{[(2,4-二甲基苯氧基)乙酰基]氨基}-5-羟基苯曱酸);式C17H17N05;分子量315.32)是表皮生长因子(EGF)与其受体(EGFR(SEQIDNO:l))结合的抑制剂。在25pM的AD4-1132浓度下,EGF与EGFR的结合被抑制59.6%(参见例如,实施例6)。与EGFR复合的西妥昔单抗的蛋白质晶体结构已被Ferguson等((2005)CancerCell7,301-311)报导,并且晶体学数据以PDB编码1YY9("lYY9.pdb")保藏在蛋白质数据库中。使用得自用于设计另外的药效基团模型的1YY9蛋白质晶体结构的信息鉴定了AD4-1132。该模型用于鉴定不同组的EGFR抑制剂。EGFR蛋白质上的位置被抗体西妥昔单抗(SEQIDNO:5和SEQIDNO:6)(爱必妥)的氨基酸残基GLY-54到ASP-58识别。仿照残基GLY-54到ASP-58对Pharm23一gly54一asp58才莫建并一皮用来鉴定具有抗体西妥昔单抗的特征和组分(参见例如,实施例4)的小分子。具体地it,该区域;波定义为是抗体重链的H2CDR。西妥昔单抗的这些氨基酸残基的特征和组分用来产生药效基团才莫型Pharm23—gly54—asp58(参见例如,实施例4)。药效基团特征(F)和组分包括F1Don-得自Asn56的抗体侧链NH2,与受体Ser418侧链OH形成H键;F2Acc&Am-得自抗体西妥昔单抗的Gly54主链羰基,受体从受体Arg353的胍接受H键或阴离子与受体Arg353的胍形成盐桥;F3Acc2-相对于Arg353的胍为F3指向;F4Acc&Ani-得自抗体Asp58侧链羧基,从受体Lys443的NHs+接受H键或与受体Lys443的NH3+形成盐桥;F5Don-得自抗体Gly54主链NH,与受体Gln384的侧链羰基形式H键;F6Aro-得自疏水性接触统计学,与受体的Arg353的胍的有利的电荷相互作用,必要的;和F7Aro2-相对于Arg353的胍为F6指向。对于药效基团,不是所有的组分同时都是必要的。允许局部匹配7个特征和组分中的5个。与得自西妥昔单抗的蛋白质晶体结构的残基GLY-54到ASP-58重叠的Pharm23—gly54—asp58的图示如例如图15所示。使用Pharm23—gly54—asp58通过搜索商业化合物鉴定了AD4-1132。与EGFR的结合部位的氨基酸残基对接的AD4-1132的示例性描绘如图58-59所示。AD4-1142(0([(4-乙基苯基)磺酰基]氨基》-2-羟基苯甲酸);式C15H15N〇5S;分子量321.35)是表皮生长因子(EGF)与其受体(EGFR(SEQIDNO:l))结合的抑制剂。AD4-1142的结构如下所示在25pM的AD4-1142的浓度下,EGF与EGFR的结合一皮抑制49.8。/。(参见例如,实施例6)。与EGFR复合的西妥昔单抗的蛋白质晶体结构已被Ferguson等((2005)CancerCell7,301-31l)报导,并且晶体学数据以PDB编码1YY9("lYY9.pdb")保藏在蛋白质数据库中。使用得自用于设计另外的药效基团模型的1YY9蛋白质晶体结构的信息鉴定了AD4-1142。该才莫型用于鉴定不同组的EGFR抑制剂。EGFR蛋白质上的位置被抗体西妥昔单抗(SEQIDNO:5和SEQIDNO:6)(爱必妥)的氨基酸残基GLY-54到ASP-58识别。仿照残基GLY-54到ASP-58对Pharm23—gly54一asp58才莫建并被用来鉴定具有抗体西妥昔单抗的特征和组分的小分子(参见例如,实施例4)。具体地说,该区域纟皮定义为是抗体重链的H2CDR。西妥昔单抗的这些氨基酸残基的特征和组分用来产生药效基团才莫型Pharm23—gly54—asp58(参见例如,实施例4)。药效基团特征(F)和组分包括F1Don-得自Asn56的抗体侧链NH2,与受体Ser418侧链OH形成H键;F2Acc&Am-得自抗体西妥昔单抗的Gly54主链羰基,受体从受体Arg353的胍接受H键或阴离子与受体Arg353的胍形成盐桥;F3Acc2-相对于Arg353的胍为F3指向;F4Acc&Ani-得自抗体Asp58侧链羧基,从受体Lys443的NHs+接受H键或与受体Lys443的NHg+形成盐桥;F5Don-得自抗体Gly54主链NH,与受体Gln384的侧链羰基形式H键;F6Aro-得自疏水性接触统计学,与受体的Arg353的胍的有利的电荷相互作用,必要的;和F7Aro2-相对于Arg353的胍为F6指向。对于药效基团,不是所有的组分同时都是必要的。允许局部匹配7个特征和组分中的5个。与得自西妥昔单抗的蛋白质晶体结构的残基GLY-54到ASP-58重叠的Pharm23—gly54—asp58的图示如例如图15所示。使用Pharm23—gly54—asp58通过搜索商业化合物鉴定了AD4-1142。与EGFR的结合部位的氨基酸残基对接的AD4-1142的示例性描绘如图60-61所示。权利要求1.产生相对于靶标生物分子具有所需的药物活性的分子结构的方法,包括以下步骤提供至少一种特异性结合于靶标生物分子的免疫系统蛋白质;确定至少一种免疫系统蛋白质的至少一部分原子的同一性和空间定向,其中至少一种免疫系统蛋白质的至少一部分原子与靶标生物分子的结合部位的互相作用导致与靶标生物分子的结合部位结合;和构建药效基团,其中药效基团包括至少一种药效基团特征的模型,所述至少一种药效基团特征近似于至少一种免疫系统蛋白质的原子的至少一部分同一性和空间定向,该至少一种免疫系统蛋白质特异性结合于免疫系统蛋白质,使得药效基团结构特征与靶标生物分子的结合部位是互补的。.2.权利要求l的方法,进一步包括以下步骤使用加注解的配体分子的数据库的药效基团假设查询确定候选分子,其中被确定的候选化合物具有实质上与至少一种药效基团特征对准的结构。3.权利要求2的方法,进一步包括以下步骤确定候选分子的对靶标生物分子的结合部位的对接亲合性;其中对接亲合性通过以下所述定量表示当候选分子与靶标生物分子互相作用时获得的能量,为了实现相对于最低能量构象的对接构象所需的能量,或其组合。4.权利要求1的方法,其中至少一种免疫系统蛋白质具有改变靶标生物分子的活性的能力。5.权利要求4的方法,其中至少一种免疫系统蛋白质具有抑制靶标生物分子的活性的能力。6.权利要求4的方法,其中提供至少一种特异性结合于靶标生物分子并具有改变靶标生物分子的活性的能力的免疫系统蛋白质的步骤包括如下步骤提供试验,在该试验中靶标生物分子显示模拟体内活性的活性;白质暴露于耙标生物分子下;和在该试验中选择至少一种具有改变靶标生物分子的活性的能力的免疫系统蛋白质。7.权利要求1的方法,其中至少一种特异性结合于靶标生物分子的免疫系统蛋白质还结合于至少一种在其部分中不同于靶标生物分子的相关生物分子,但是其中靶标分子的结构和活性的相似的或相同的部分-波该至少一种相关生物分子所保持。8.权利要求1的方法,其中至少一种免疫系统蛋白质是至少一种选自以下的成员主要组织相容性复合体,T细胞受体,p-细胞受体,和抗体。9.权利要求8的方法,其中至少一种免疫系统蛋白质是至少一种单克隆抗体。10.;f又利要求9的方法,其中确定至少一种单克隆抗体的至少一部分原子的同一性和空间定向包括确定至少一种单克隆抗体的结合末梢的至少一部分原子的同一性和空间定向。11.权利要求10的方法,其中确定至少一种单克隆抗体的结合末梢的实质部分的原子的同一性和空间定向。12.权利要求1的方法,其中药效基团特征包括至少一种选自以下的特征疏水性,芳香性,氢键受体,氬键供体,阳离子,和阴离子。13.权利要求l的方法,其中靶标生物分子是蛋白质。14.权利要求13的方法,其中靶标生物分子是酶,信号蛋白,或受体蛋白。15.权利要求1的方法,其中靶标生物分子选自足口病,血管紧张素II;ErbB2;Flu凝集素;Flu血细胞凝集素;Flu神经氨酸酶;y干扰素;HER2;脑膜炎奈瑟氏球菌;HIV1蛋白酶;HIV-1逆转录酶;鼻病毒;血小板纤维蛋白原受体;沙门氏菌低聚糖;TGF-ot;血小板生成素;组织因子;冯维勒布因子;VEGF;冠状病毒(SARS);莱姆病;HIVGP120;HIVGP41;西尼罗病毒;二氲叶酸还原酶;和EGFR。16.权利要求15的方法,其中靶标生物分子选自EGFR,VEGF,HER2,和ErbB2。17.权利要求16的方法,其中靶标生物分子是EGFR。18.权利要求1的方法,其中确定至少一种免疫系统蛋白质的至少一部分原子的同一性和空间定向的步骤包括分析来自至少一种免疫系统蛋白质的结晶形式的X射线晶体学数据。19.权利要求18的方法,其中X射线晶体学数据来自与靶标生物分子结合的至少一种免疫系统蛋白质的结晶形式。20.权利要求l的方法,其中确定至少一种免疫系统蛋白质的至少一部分原子的同一性和空间定向的步骤包括如下步骤测定至少一种免疫系统蛋白质的肽序列;产生免疫系统蛋白质的三维结构的虚拟模型;和分析免疫系统蛋白质的三维结构的虚拟模型从而确定与靶标生物分子的结合部位相互作用导致与耙标生物分子的结合部位结合的至少一种免疫系统蛋白质的至少一部分原子的同一性和空间定向。21.产生相对于靶标生物分子具有所需的药物活性的分子个体的方法,包^fe以下步骤(i)提供至少一种单克隆抗体;其中至少一种单克隆抗体特异性结合于靶标生物分子并抑制靶标生物分子的活性;其中至少一种单克隆抗体包括结合末梢;和其中结合末梢包括与靶标生物分子的结合部位相互作用导致与靶标生物分子的结合部位结合的多个原子;(ii)确定与耙标生物分子的结合部位相互作用的实质部分的结合末梢原子的同一性和空间定向;其中这种确定同一性和空间定向包括分析来自与耙标生物分子结合的至少一种单克隆抗体的结晶形式的X射线晶体学数据;(iii)构建药效基团;其中药效基团包括多个药效基团特征;其中多个药效基团特征近似于至少约75%的与耙标生物分子的结合部位相互作用的至少一种单克隆抗体结合末梢原子的同一性和空间定向;其中多个药效基团特征与耙标生物分子的结合部位是互补的;和其中多个药效基团特征包括至少一种选自以下的特征疏水性,芳香性,氲键受体,氪键供体,阳离子,和阴离子;和(iv)使用加注解的配体分子的数据库的药效基团假设查询确定候选分子;其中被确定的候选化合物具有实质上与药效基团的至少一种特征对准的结构;其中候选分子抑制靶标生物分子的活性;和其中靶标生物分子是酶,信号蛋白,或受体蛋白。22.抑制EGFR的药物组合物,该组合物包括至少一种选自以下的EGFR抑制剂以及可药用载体或稀释剂式(l),式(7),式(14),式(19),式(25),包括其立体异构体或多晶型物式(18)<formula>formulaseeoriginaldocumentpage6</formula>Sl-S8独立地选自卣素,羟基,巯基,羧基,烷基,环烷基,芳基和烷氧基(-OR);X选自H2,0,S,N-R,N國OH和N-NR2;Het是在任何环位置处的一个或多个N原子;Z选自-COOH,-P03H2,S03H,四唑环,磺酰胺,酰基磺酰胺,-CONH2和一C0NR2;和R是C1-C6直链或支链烷基,任选地被卣素,鞋基,巯基,羧基,芳基,杂芳基,氨基,取代的氨基,或在5或6元环中含1、2或3个N原子的环氨基取代。23.治疗EGFR相关疾病或病症的方法,包括对有需要的哺乳动物给用包括治疗有效量的权利要求22的至少一种药物组合物的组合物。24.权利要求23的方法,其中至少一种EGFR抑制剂选自以下式(6);式(13);式(18);式(24);和式(30),或其立体异构体或多晶型物式(6)式(13)<image>imageseeoriginaldocumentpage6</image><formula>formulaseeoriginaldocumentpage7</formula>全文摘要本发明涉及开发用于一种或多种靶向治疗的一种或多种药物的方法,及其由该方法获得的组合物。根据本发明的一个方面,通过代之以使用抗原应答的自然机理以实现大规模地平行筛选针对抗原的天然存在的分子,避免了使用用于鉴定小分子亲合性和/或活性互相作用的组合化学技术与高通量筛选技术的组合。本发明的其它方面提供了由此得到的组合物以及使用该化合物的治疗方法。文档编号A61K31/33GK101415415SQ200780010253公开日2009年4月22日申请日期2007年1月23日优先权日2006年1月23日发明者B·B·穆加格,I·J·特奇,约瑟夫·P·埃里科申请人:约瑟夫·P·埃里科
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1