具有改良的抗原结合亲和力的改变的抗体的制作方法

文档序号:6495013阅读:1141来源:国知局
专利名称:具有改良的抗原结合亲和力的改变的抗体的制作方法
技术领域
本发明涉及合理的药物设计,并且更特别地,涉及基于将对溶剂中的配体和其靶向分子之间的连接的静电贡献最小化的配体上电荷分布的预测的合理的药物设计,该预测将对溶剂中的配体和其靶向分子之间的连接的静电贡献最小化。本程序还涉及做出所述预测和增强的连接的配体的方法和工具,以及涉及如此制成的配体的诊断和治疗用途。
背景技术
计算的合理药物设计方法包括两种常规途径筛选整个分子以及探测局部位点并通过结合分子片段或嫁接化学基团到亲代结构以构建分子。DOCK是全分子算法的例子,其使用了查找所给靶位点互补形状的操作(I.D.Kuntz等,J.Mol.Biol.161269(1982)(Kuntz);R.L.DesJarlais等,J.Med.Chem.31722(1988)(DesJarlais))。大大分子化合物数据库可以进行计算“筛选”,其首先去除形状与靶位点不相容的分子(通过计算与互补形状的重叠),然后尝试将余下的分子根据近似能量函数分类排列。该操作成功的识别出大量结合靶位点的配体。不幸的是,X射线晶体研究显示通常配体结合的位点与预测的不同。对于这种预测和事实之间差异的一种可能的解释是虽然形状互补算法有效的去除了非常不相容的实验配体,但近似能量函数在定义更高水平的结合细节上非常不准确。
MCSS(多拷贝同时搜索(Multiple Copy Simultaneous Search))算法是最常用的基于片段的配体设计方法之一(P.J.Goodford,J.Med.Chem.28849(1985);A.Miranker和M.Karplus,ProteinsStrut.,Funct.,Genet.1129(1991);和A.Caflisch等,J.Med.Chem.362142(1993))。基本设想是使用表示功能基团(羰基、氨基、胺、羧酸盐、羟基等)库的探针搜索结合位点的区域,测定具有特别有利的互作用能的位点。当探针成功的置于结合位点后,连接各种小分子团集形成凝聚分子。对于该问题开发了两种途径。一种尝试将数据库中的小分子装配结合到以功能基团(HOOK)(M.B.Eisen等,ProteinsStrut.,Funct.,Genet.19199(1995),另一种使用模拟退火方案以产生片段间的连接体原子和键从而获得具有良好共价几何结构和非键合相互作用的配体候选物(DLD,动态配体设计(dynamic ligand design))(A.Miranker和M.Karplus,ProteinsStrut.,Funct.,Genet.1129-34(1991)和23472(1995)).。
现有的用于合理药物设计的方法可有效的提出新的和诱发令人感兴趣的几何结构,其显示大约粗略互补于位点中的氢键基团。不幸的是,现有方法使用近似值,其可能不准确且会导致难以准确的将候选物分类排列。因此,虽然存在大量的计算算法可用于分析结合位点和结合复合物,以及合理设计配体和其它药物候选物,基于结构的设计依然是不准确和不确定的努力企图。
发明概述现有技术的局限被通过以下步骤克服(i)精确处理靶分子与候选配体的非结合和结合状态中的溶剂化、介电和远距离静电效果,和(ii)将提出的配体分类排列的详细的定量方法。本方法基于以下发现,对溶剂化、远距离静电和介电效果的粗糙处理,以及缺乏对靶分子与候选配体非结合状态的合适处理,限制了合理设计和识别新的用于结合预定靶分子的候选配体。本计算机执行程序通过提供考虑配体/靶分子结合的交换性质的方法克服了这些局限,其中与溶剂的相互作用被交换为配体和其互补靶分子间的相互作用。与现有技术不同,本文所述方法考虑了在溶剂中配体与其靶受体间的结合中的溶剂化、远距离静电和介电效果。
因此,在一方面,提供了方法识别配体在溶剂中结合靶分子(如受体、酶)的性质的方法,其条件是提供了靶分子三维形状的表示法。方法包括选择以三维定义的配体的三维形状,其形状互补于(符合)所选靶分子所选部分的形状;测定配体上电荷分布的表示法,其该电荷分布最小化溶剂中配体和靶分子间结合的静电作用。在一些实施方式中,电荷分布的表示法是一组多极。在其它实施方式中,方法进一步包括识别具有符合电荷分布表示法的点电荷的分子的步骤。
这些方法在设计用于结合具有已知配体的靶分子的结合增强配体中特别有效。如在本文中所使用的,结合增强配体表示的配体,其结构依据靶分子的已知配体,但根据本文所述方法进行了修饰从而具有最小化溶剂中配体和靶分子间结合的静电作用的电荷分布。因此,本计算机执行程序提供提供了合理药物设计的方法,其识别结合具有已知或可预测的三维结构的靶分子的该增强改进的配体。方法包括选择配体的以三维结构定义的形状,其符合该形状与所选靶分子部分的形状相匹配,测定配体上电荷分布的表示法,其该电荷分布最小化溶剂中配体和靶分子间结合的静电作用。
用所要求方法识别的其配体的靶分子是分子三维形状的表示法已知或可以预测的分子。该靶分子包括生物高聚物和非生物高聚物。生物高聚物的例子包括蛋白、核酸、脂类、糖类和前述的混合物(如糖蛋白、脂蛋白等等)。非生物高聚物的例子包括聚酰胺、聚碳酸酯、聚烷撑、聚烷撑二醇、聚烷撑氧化物、polyalkylene terphthalates、聚乙烯醇、聚乙烯醚、聚乙烯酯、聚乙烯卤化物、聚乙烯吡咯烷酮、聚乙醇酸交酯、聚硅氧烷、聚氨基甲酸酯、烷基纤维素、丙烯酸和甲基丙酸烯酸酯的聚合体、聚乙烯、聚丙烯、聚乙二醇、聚乙撑氧、poly(ethylene terphthalate)、聚乙烯醇、多乙酸乙烯酯、聚氯乙烯、聚苯乙烯、聚乙烯吡咯烷酮、乳酸和羟基乙酸的聚合体、聚酐、多正酯类、聚亚安酯、poly(butic acid)、聚戊酸、poly(lactide-cocaprolactone)及其共聚物。
在本文中,术语“蛋白”或“多肽”可互换使用以包含大量由氨基酸组成的生物多聚物,如受体、激素和酶。需要理解的是如本文中所述,涉及“蛋白”、“多肽”或“受体”通常都也可用于类似结构,如脂蛋白、糖蛋白、连接有其它有机或无机基团的蛋白以及多链和多结构域的多肽结构,如大分子酶和病毒,和包括非生物多聚物。在这些例子中,出现关于配体和蛋白分子间结合的静电作用的类似结果问题。
在一些实施方式中,靶分子为蛋白,本计算机执行程序被用于识别新的和/或增强改进的配体以在溶剂中结合具有已知三维结构的蛋白。配体和蛋白的已知结合伴侣包括激素/受体、辅因子或抑制剂/酶、抗原/抗体等等。对于配体以前已经被识别了的蛋白,本方法被用于识别对已知配体结构的合适修饰以获得“增强”“改进”配体上的电荷分布,其与未修饰(天然)配体的电荷分布相比,最小化了增强改进的配体和蛋白间结合的静电作用。实施例中提供了作为示例的配体/蛋白结合伴侣,其被用作根据本方法识别“增强”“改进的”配体的起点。
在另一方面,提供了识别结合蛋白靶分子的新的和/或结合增前强的配体的方法。已知蛋白根据氨基酸序列(蛋白一级结构)和蛋白所处的溶剂折叠为三维结构。蛋白的生物学活性和稳定性依赖于蛋白的三维结构。可以通过多种方法测定和或预测蛋白的三维结构。最常见的用于测定蛋白结构的方法包括使用X射线晶体分析法。蛋白三维结构也可以使用圆形二色性、光散射、或通过测量辐射能的吸收和发散进行估计。蛋白结构也可以通过使用如中子衍射技术、或通过核磁共振(NMR)进行测定。前述的方法均为本领域普通技术人员所公知的,而且记载于标准化学教科书中(如Physical Chemistry,4th Ed.Moore,W.J.,Prentiss-Hall N.J.(1972)和PhysicalBiochemistry,Van Holde,K.E.,Prentiss-Hall,N.J.(1971))。使用上述技术,识别了大量天然存在的蛋白中的循环再发模式(recurring patterns),其中最常见的是α螺旋、并行β折叠片层和非并行β折叠片层,参见如R.Dickerson,等,The Structure and Action of Proteins(1969)。蛋白二级结构的螺旋、折叠片层和旋转转角共同产生了活性分子的三维结构。蛋白的三维结构可以根据经验使用进行物理生化分析进行测定,或可选的,使用模型进行预测,该模型构建了一个或多个已知三维结构的同源蛋白的一个或多个三维结构。
本计算机执行程序在设计增强改进的配体中特别有效,该配体的结构依据靶分子的已知配体的结构,但根据本文所述方法进行了修饰从而具有最小化溶剂中增前改进的配体和靶分子间结合的静电作用的电荷分布。该增强改进的配体在本文中表示为“结合增强的配体”。因此,本方法使用已知构造构型的配体作为起点从而进一步优化和选择配体结构,其降低结合该结构对分子和溶剂的结合具有降低的静电作用。例如,本方法用于产生增强改进的(结合增强的)的辅因子或酶抑制剂(如HIV-1蛋白酶)。
本计算机执行程序也用于设计增强改进的激素或其它配体从而优化结合(最小化结合的静电作用)以符合任何已知的受体位点。该方法对药物设计特别有效,因为其允许更有选择性和更稳定的设计和制造能够更有选择性和更稳定的结合受体位点的药物。设计结合改进与受体的增强结合的配体意味着使用的剂量更低,由此降低了可能与更高剂量相关的副作用和/或毒性的机会。设计结合改进与受体结合的增强配体也可以识别比用作识别具有增强结合性质的增强配体的基础的原始配体更高效的药物,该原始配体用作识别具有改进的结合性质的改进配体的基础。因此,已知的蛋白配体可用作设计增强改进的配体的出发点,其中增强改进是基于改进的配体对蛋白增强的结合性质,这该改进的结合性质是由于选择了具有最小化溶剂中配体与蛋白间结合的静电作用的电荷分布的配体。因此,本方法允许对抗原和表位进行定制,以更选择性和以更高亲和力与抗体结合,并提供新的和/或改进的配体的设计和选择,该配体与其它受体或靶分子结合。
根据本文所述方法识别的配体可以用可识别标记,如放射性标记、酶、发色团等进行标记以实施免疫诊断操作或其它诊断操作。这些标记试剂可以被用于检测各种诊断样本中的靶分子。为了成像操作,在活体外或活体内,本文所识别的配体可以用附加的试剂进行标记,如NMR造影剂或X线造影剂。将可识别试剂连接于多肽或其它含有活性氨基的小分子的方法是本领域所公知的。配体也可以连接于不溶性支持物以便于诊断实验。
本计算机执行程序也可有效的搜索三维数据库,以获得形状与所选蛋白部分的形状相符合匹配,并且具有最小化溶剂中配体与蛋白间结合的静电作用的电荷分布的结构。
可选的,三维结构数据库可以单独基于配体的形状进行筛选(使得其符合所选蛋白所选部分的形状),进一步修饰满足该标准的数据库分子以具有最小化溶剂中修饰配体与蛋白间结合的静电作用的电荷分布。进行三维数据库比较的搜索算法记载于文献中。参见,如V.Balaji等申请的U.S.Pat.No.5,612,895,″Method of Rational Drug Design Based on Ab Initio ComputerSimulation of Conformational Features of Peptides″以及其中公开的参考文献。对于相关的药物设计的计算机方法,也参见Omichinsld等申请的U.S.Pat.No.5,081,584,″Computer-assisted Design of Anti-peptides Based on the Aminoacid Sequence of a Target Peptide″,和Hardman申请的U.S.Pat.No.4,939,666,″Incremental Macromolecule Construction Meth-ods″。
每个使用本方法识别的新的和/或“改进增强的”配体都采用标准的合成或重组步骤进行制备,然后测试生物学活性。显示生物学活性的化合物为候选的拟肽(peptidomimetics);不显示生物学活性的化合物帮助进一步定义配体与靶分子结合所必须的配体部分。在本文中,peptidomimetics拟肽广泛表示模拟肽的化合物。例如,吗啡为内啡肽的peptidomimetics拟肽。
已知化合物的数据库(如the Cambridge Crystal Structure Data Base,Crystallographic Data Center,Lensfield Road,Cambridge,CB2 1EW,England;and Allen,F.H.,et al.,Acta Crystallogr.,B352331(1979))也能够用于搜索含有空间(形状)参数的结构,其该结构被用于互补(符合匹配)所选靶分子所选部分的形状。发现具有预期空间参数的化合物被检索获得,并进一步分析以确定哪个检索获得的化合物也具有预期的电荷分布或能够被修饰为具有预期的电荷分布,以最小化溶剂中配体与靶分子间结合的静电作用。被发现同时具有预期的形状和电荷分布的配体是原始靶肽的peptidomimetics拟肽的附加候选物。
评估根据本计算机执行程序识别的配体的生物学活性和/或对靶分子的结合亲和力。迭代方法被用于识别具有最优选的生物学性质的配体。参见,如PCT WO 19359,″Process formaldng Xanthene or Cubane based compounds,and Protease Inhibitors″,其描述了识别复杂化学组合库中酶抑制剂的生物活性构像的方法。生物活性构像然后被用于设计peptidomimetics拟肽,或被用于搜索有机结构的三维数据库以建议潜在的peptidomimetics拟肽。标准生理学、药理学和生物化学程序可用于测试用本方法识别的“增强的”“改进的”或新的配体。评估生物活性的特殊方案是被测试化合物的函数。这种分析能够被用于结合靶分子(如HIV蛋白酶、MHC II类蛋白)的已知配体从而为这些生物学重要的靶分子设计结合增强的配体。
附图的简要说明在附图中,

图1是描述一个本计算机执行程序的实施方式的框图;图2是可以用于执行本计算机执行程序的计算机系统的框图;图3是表示本发明计算机执行程序所依据的化学原理的图;和图4是表示HIV-1蛋白酶抑制剂的图。
图5是问题几何结构的图形。
具体描述本计算机执行程序可以通过下面的详细描述更完整的被理解,其应该与附图结合阅读,其中相似的参考号表示相似的结构。所有上述和以下说明中引用的参考文献都在此特别作为参考引入。
本计算机执行程序包括确定配体性质的方法,其依次被用于设计配体以结合蛋白或其它分子靶,如HIV靶。方法定义了所给靶位点和几何结构的静电互补。静电互补可以与靶位点的空间互补一起通过清楚的构建和通过组合库的设计或偏向用于发现配体,其是通过清楚的构建和通过组合库的设计或偏向。
静电互补的定义,即复合物中不利的去溶剂化能和有利的相互作用之间的最优交换,被发现在配体设计中是有用的。该方法通过根据物理原理定义优化配体的性质转化了设计问题。这些性质提供了清楚和准确标准,使得实验配体可以被比较以及在已有配体的修饰和新配体的重新构建中用做模板。
所给靶位点的静电互补用电荷分布定义,其最小化所给溶剂中分子上结合位点的结合的静电作用。一种在计算机系统中表示电荷分布的方法是作为一组多极。通过识别具有符合匹配该最优电荷分布的点电荷的分子,确定的电荷分布可以被用于识别配体、设计药物和设计组合库。
现在参考图1,显示了一个本计算机执行程序的实施方式。该实施方式可以使用一种或多种计算机程序在计算机系统上执行,下面描述了它的一个例子。给出要设计配体的分子的定义,在30表示,分子分析工具32提供了如34所示的可能的分子构像或形状。有多个系统可以通过该构像,包括但不限于X射线晶体分析法、同源模型、核磁共振成像或分析技术,如Kuntz和DesJarlais所示的。分子上预期的结合或活性位点,在36所示,和预期的用于在指示的结合位点与分子结合的配体形状,如在38所示,也输入计算机系统。
静电连续分析器40,在下面更加详细的描述,被用于测定最小化所给溶剂中结合位点处结合的静电作用的电荷分布,给出分子形状的三维空间表示法,分子上的结合位点通过在三维空间中的位置定义,预期的配体形状也在三维空间中定义。因此,分析器40的输出是最小化结合的静电作用的电荷分布的表示法,如42所示。
电荷分布42被用于与具有预期配体形状的候选配体结合,入如44所示。候选配体形状和点电荷分析器46测定哪个候选配体具有与最优电荷分布42最接近的电荷分布。分析器46输出如48所示的结合位点的候选配体。类似的,筛选系统50也可以用于筛选接近42所示最优电荷分布的候选配体44,以生成组合库52。该组合库可以被用于开发具有预期特征的更复杂的分子。
现在参考图2,合适的计算机系统60通常包括为用户显示信息的输出设备62。计算机系统包括主要部件单元61,其连接于输出设备62和输入设备64,如键盘。主要部件单元61通常包括处理器66,其通过互连结构70连接于存储系统68。输入设备64也通过互连结构70连接于处理器66和存储系统68,输出设备62也一样。
应该理解一个或多个输出设备可以连接到计算机系统。输出设备的例子包括阴极射线管(CRT)显示器、液晶显示器(LCD)、打印机、通讯设备如调制解调器,和音频输出。也应该理解一个或多个输入设备可以连接到计算机系统。输入设备的例子包括键盘、键区、滚迹球(track ball)、鼠标、手写板、通讯设备、音频输入和扫描仪。可以理解本计算机执行程序不限于特殊的与计算机系统结合使用的特殊输入或输出设备或本文所述的那些。
计算机系统60可以是常规用途的计算机系统,其可以使用高级计算机编程语言,如“C”“Fortran”或“Pascal”进行编程。计算机系统也可以是专门编程的、特殊用途的硬件。在常规用途的计算机系统中,处理器通常是可商购的处理器,例子是可从Intel购得的x86系列处理器和可从Motorola购得的680X0系列微处理器。许多其它处理器也是可以获得的。该微处理器运行称为操作系统的程序,例子是UNIX、DOS和VMS,其控制其它计算机的运行,并提供调度、调试、输入/输出控制、记录、编译、存储分配、数据管理和内存管理,以及通讯控制和相关服务。一个实施方式的执行是通过使用具有aPA-7200(99MHz)芯片的Hewlett-Packard 9000/735计算机。该处理器和操作系统定义了计算机平台以编写高级编程语言的应用程序。
存储系统通常包括计算机可读和可写的固定记录介质,例子是磁盘、闪存和磁带。磁盘可以是可移动的,已知为软盘、或固定的,已知为硬盘。磁盘具有大量的磁道,信号存储于其中,通常是以二进制的形式,即解译为一和零的序列的形式。该信号可以定义通过微处理器运行的应用程序、或存储在磁盘上以被应用程序处理的信息。通常,在运算中,处理器导致大量数据由固定记录介质读入集成电路存储元件,其通常为快速、随机存取存储器,如动态随机存储器(DRAM)或静态存储器(SRAM)。集成电路存储元件允许比磁盘更快的由处理器存取信息。处理器通常在集成电路存储器中操作数据,然后在加工程序完成时拷贝数据到磁盘。已知多种机制可管理磁盘和集成电路存储元件间的数据移动,本程序并无限制。可以理解本程序也不限制为特殊的存储系统。
应该理解本计算机执行程序不限于特殊的计算机平台,特殊的处理器或特殊的高级程序绪言语言。另外,计算机系统60可以为多处理器计算机系统或可以包括多部通过计算机网络连接的计算机。
定义配体性质使用该连续计算定义静电作用的互补配体性质的程序略述于图3。因为静电作用的交换性质,在结合状态中的表面上“强的”静电吸引力经常破坏结合平衡,但是似乎有利于特异性。这是因为隐藏极性和带电基团导致的实质去溶剂化处罚代价,它们的对大分子联合的净静电贡献通常是不利的。在为所给的、固定的在位点具有极性和带电基团的靶设计配体时,重要的是平衡去溶剂化和相互作用能以使得对结合最有利或至少提供最小可能的不稳定。以下方法使用理想的几何和连续静电模型分析的解决了该问题,提供了单独、唯一的被精确解答的最优值。
对于结合球形配体到任意形状的受体以组成球形复合物的例子,结合的自由能根据配体的电荷多极表达。通过最小化多极的结合自由能,(i)存在单个、最优的多极分布,其定义了所给几何的最紧结合配体,(ii)该多极分布对应于ΔGbinding中的最小值,(iii)在该最优值,配体去溶剂化处罚代价的量正好是复合物中有利的分子间静电作用的一半,以及(iv)次优的电荷分布的结合自由能的损失可以通过与最优值进行比较容易的被计算出来。该多极结合自由能的最小值提供了清楚和明确的路线,从连续模型、接受的大分子和配体的接受的能量表示法到最优配体的一组表示符,即多极。为了该方法可更广泛的应用,任何对球形几何的要求都被去除了。因此,大分子和配体可是任意形状的,并同样这样处理。
在球形例子中,优化的可变结合能如下定义ΔGvar=ΔGint,L-R+Ghyd,Lbound-Ghyd,Lunbound(1)其包括三个项,在此分别讨论。第一个是配体受体筛过的作用能,其包括来自每个配体电荷分布的每个多极组分与受体中所有电点电荷的相互作用的值。该值通过被分析计算的系数,αl,m和配体多极(Q′l,m)计算得到,ΔGint,L-R=Σl=0∞Σm=-1lαl,mQl,m′*---(2)]]>第二项是由于配体电荷分布Gboundhyd,L的结合状态反应场能。其具有来自所有具有相同值m的多极组分所有配对的值,因为配体多极分布通常在不是结合状态中球形边界中心的点附近展开,但是根据方位角的对称选择几何,Ghyd,Lbound=Σl=0∞Σm=-1lΣl′=0∞βl,m,l′,mQl,m′*Ql′,m′---(3)]]>第三项是非结合状态溶剂化能,其包括来自每个多极组分的值。因为多极展开是在配体球中心的附近,和由于球面低谐函数的正交性,消去所有交叉项(cross-terms),得出Ghyd,Lunbound=Σl=0∞Σm=-llγl,mQl,m′*Ql,m′---(4)]]>结合上面三个方程,ΔGvar=Σl=0∞Σm=-llαl,mQl,m′*+Σl=0∞Σm=-llΣl′=0∞(βl,m,l′,m-δl,l′γl,m)Ql,m′*Ql′,m′---(5)]]>转换为矩阵符号,完成平方并为Q′optl,m求解得出最优可变结合能。由于从可变结合能中忽略的项对所给几何是恒定的,这描述了最优结合配体的多极。该步骤更详细的解释阐明于文章L.P.Lee和B.Tidor,J.Chem.Phys.,1068681-8690,(1997),其在此特别引用作为参考,并且其部分记载在附录中。
运行计算机程序以实施那种Lee和Tidor,同上和附录中略述的方法可接受,输入值lmax,其确定方程59和61(见附录)的矩阵大小,leur,其截除方程25和46中的最内总和(见附录),得到问题的几何,其表示靶和配体的形状,以及单极的优化值是任意的还是固定为一些值。问题的几何包括半径以及结合状态和配体球的中心的在z轴上的坐标和系统中每个局部原子电荷的大小的坐标值。介电常数∈1和∈2通过特殊的程序问题测定。对αi、Bij和γi值进行估算,其通过随后求解矩阵方程59或61(见附录),例如通过使用LU分解。可以获得B矩阵的本征值以验证该固定值为最小值。所有的实数浮点值可以被表示,例如,使用64位或其它合适的格式。矩阵代数的计算可以使用可行的,或精确度增加版本的合适子程序进行,如Press等,Numerical Recipes in CThe Art of Scientific Computing,CambridgeUniversity Press,Cambridge,1988中定义的。程序运行时的输出是优化电荷分布的表示法(如使用多极)、固定点的性质和记录α、β、γ值的文件。由于直接的方法,即LU分解被用于解矩阵方程,时间测量为(lmax)6和所用存储测量等级为(lmax)4的存储。该程序输出可以通过计算矩阵方程中特殊的稀疏矩阵被改善。也可以通过以迭代法,如共轭梯度法或各种张驰方法求解矩阵方程提供优化。该方法被实施并使用高对称电荷分布和α螺旋的末端作为受体进行测试。
该方法其通过使用迭代数字运算以计算相关的矩阵系数扩展到任意形状的分子,并且为了效率,使用大量散布于配体体积的中心,单独的多极位于其上这些中心上。
当该方法扩展到非球形几何,其具有以下形式,。αl,m保持同样的符号,βl,m,l′,m变为βl,m,l′,m′,因为方位角排列不再被使用,γl,m变为Yl,m,l′,m,因为球面低谐函数不消去非球形表面的交叉项(cross-terms)。因此,出现非常类似的矩阵方程,ΔGvar=Σl=0∞Σm=-llαl,mQl,m′*+Σl=0∞Σm=-llΣl′=0∞Σm′=-l′l′(βl,m,l′,m′-γl,m,l′,m′)Ql,m′*Ql′,m′′---(6)]]>其求解可以通过用于球形例子的同样的矩阵方法或者通过奇异值分解,其使用可行的或增强准确性版本的应用合适子程序,例如定义于Press等,同上中的。然而,数值计算可以用于计算相关的矩阵系数。对于上述球形例子,可以根据闭合形式表达式进行快速计算。当使用迭代数值方法计算时同样的矩阵系数(αl,m,βl,m,l′,m′和γl,m,)使用迭代数值方法进行计算时,计算的需求极大增加。
可选的,配体通过使用更多的中心描述,每个通过少量的多极描述。极端的,每个配体可以被安排在点电荷位置,现在500是可以承受的,即可以在三个星期的计算时间内被计算,其中每个中心的lmax=0。可能最好的解决方式是居中的,其中存在大学大约10个lmax=2的位置(单极、双极或四极项)或在每个中心出现这种情况。低次序多极的分布中心可以是用于描述任意配体电荷分布的有效和准确的方法。该方法被合适的阐述以包含间分离的多极中心间的相互作用,并且使用球形几何的结果显示使用两个多极分布而不是一个可以获得最优电荷分布的等价描述,其使用大约四分之一数量的多极组分以及因此必需的基本上四分之一的时间。
两种可选的方案可以被用于矩阵系数的迭代数值计算。第一种方案是改良的有限差Poisson-Boltzmann(FDPB)求解器,如DELPHI(I.Klapper,R.Hagstrom,R.Fine,K.Sharp.和B.Honig)。关注Cu-Zn过氧化物歧化酶的活性位点中的电场离子强度和氨基酸修饰的影响。蛋白ProteinsStruct.,Funct.,Genet.147-59(1986),M.K.Gilson,K.A.Sharp,和B.H.Honig。计算溶液中分子的静电电位方法和误差估算。J.Comput.Chem.9327-335(1988)和UHBD(B.A.Luty,M.E.Davis,和J.A.McCammon.Solving thefinite-difference non-linear Poisson-Boltzmann equation.J.Comput.Chem.131114-1118(1992),M.Zacharias,B.A.Luty,M.E.Dayis,和J,A.Mcammon.Poisson-Boltzmann analysis of the X repressor-operating interaction.Biophys.J.631280-1285(1992)),第二种方案是改良的边界元素方法(BEM)(R.J.Zauhar和R.S.Morgan.The rigorous computation of the molecu-lar electric potential.J.Comput.Chem.9171-187(1988),R.Bharadwaj,A.Windemuth,S.Sridharan,B.Honig,和A.Nicholls.The fast multipole boundary element method formolecular electrostaticsAn optimal approach for large systems.J.Comput.Chem.16898-913(1995))。这些改良使得点多极,(与仅仅点电荷相对的,)被表示。
因此,更加复杂的方法包括下列。对于在每个中心的每个极组分,进行迭代连续运算以测定其筛过的(screened)与受体点电荷的库仑相互作用(基本上αl,m),其与自身反应场的相互作用和在结合(基本上βl,m,l′,m′)和非结合(基本上γl,m,l′,m′)状态下系统中每个其它极组分的相互作用。估计由99个极组分表示的配体(如在每个中有11个lmax=2的11个中心)需要三周以下的CPU时间。对于许多应用程序,减半中心的数量的一半和减半时间的一半是足够的。单个中心周围的多极分布使用许多全球整体项以准确的描述与中心相当远的复杂电荷分布。通过在空间中分布大量用于展开的中心,同样准确的描述能够根据许多较少数,、稍微更局部的项被获得。
使用分子描述符以发现配体再次参考图1,由上述步骤定义的电荷分布42可以被用于测定哪个候选配体将具有最接近最优值的电荷分布。电荷分布和分子形状的描述可以被用于重新构建配体结构,或它们可以被用于筛选化合物数据库,或者它们可以被用于组合库的设计或偏差。
在发现配体的程序中,详细的点电荷分布被拟合于用上述方法测定的多极分布。接着,分子片段和/或分子被拟合于点电荷分布。最后,点电荷和片段都可以在如下所述的组合库的设计中被使用。
最小二乘拟合步骤被用于定义最拟合于描述最优值所描述的多极分布的点电荷分布。例如,使用粗略具有用于FDPB计算的间距的格点的规则立方格。这能够采用在FDPB编码中使用的同样的三线函数获得,以实现相反方向的绘制,被绘制于带电格点的任意点电荷绘制于带电格点(参见Klapper.)。是否一组点电荷能够充分拟合于多极表示的静电电荷分布,可以通过比较由于使用拟合点电荷分布替换多极本身所导致的结合自由能的降低进行确定。使用具有0.5间距的格点立方格的实验表明由于拟合点电荷导致的计算的结合能的计算的损失低于0.001kcal/mol。此外,获得的给定点电荷在数量上是合理的(几乎所有的都小于0.10e),其似乎可能与分子片段拟合。在该实施方式中,多极,(其为电荷分布的稍微非局部描述,)被根据点电荷描述转换到局部格,从而分子可以被拟合。
在拟合电荷中固定点的效果不仅可以通过最小化结合能损失进行测量,还可以通过如何简单分子或分子片段如何可以简单地从点电荷构建。立方格(cubic lattice)如上所述的被用于拟合功能基团合和分子。更基于分子的格也被使用,且可以包括为针对共植入的相同化合价(spsp2和sp3)的连通性。此外,相同的点电荷密度可以是不利的,更合适的,而具有在配体表面附近更高的点电荷密度可以提供更加有效的拟合。
给出定点电荷分布,其可以以七种方法拟合于分子或分子片段。例如,分子片段几何和点电荷分布的数据库(如来源于片段的PARSE参数组的库(D.Sitkoff,K.Sharp,和B.Honig.Accurate calculation of hydration free ener-gies using macroscopic solvent models.J.Phys.Chem.981978-1988(1994)))可以被用于匹配个体功能基团到点电荷分布上的有利位置。如果每个片段需要在配体体积中的所有位置并以每个方向进行尝试,该匹配过程可以是非常大的扫描搜索。耗时可以通过为点电荷分布使用规则的立方格得到充分的改善。每个片段只需要在格的相对小的部分被扫描以确定为其“诊断”的格点电荷组。该诊断可以被用于所有的库片段,例如,在杂凑表中,且点电荷值的聚类可以被用于查询杂凑表和拟合片段到电荷格。只要保持同样的格间距,杂凑表可以为许多不同的靶和优化被重新使用。
片段被安置后,将它们组合到分子中的问题类似于上述MCSS方法算法所解决的,虽然选择片段位置的理论基础在该方法和在本计算机执行程序中非常不同。其产生的两种解决方法适于在此使用。在上述HOOK方法中,小分子的数据库被用做连接体以组合片段,通常试图同时引入刚度(rigidity)。在上述动态配体方法(DLD)中,大量碳原子与片段重叠,模拟退火过程被使用,其中每个碳的占位性有可以增长大或缩短缩小,且其中键形成和键断裂事件被用于结合新的碳连接体。在每种方法中,每个片段通常允许被略微移动以使得产生相对松弛的配体。可以使用移动的准确的移动处罚代价函数,其是基于移动如何影响计算的结合能。基于DLD的方法由于其适应性是更好的。
可选的,分子可以以连续的方式增长以至充满配体体积和符合点电荷分布。一种直接的方案包括安置单链一片段于其符合点电荷场的位置,进行对能够结合于首个片段的其它片段的搜索,通过连接转矩调整它们的相对方向。该过程能够以树性样方式进行以产生大量配体。优值(merit)或距离值的合适图形被用于确定是否接受或拒绝每个新片段。包括范德瓦尔斯和扭力项的电位以及对定义的优化值的体积和电荷分布的拟合可以被用于该方法中。
又另外可选的是“最低要求”配体的设计。优化的多极分布可以与尽可能少的点电荷拟合。该优化过程包括寻找相对少量的点电荷,其计算结合能在最优kcal/mol的十分之几中。对互补核苷酸碱基的研究表明,比天然使用的更好的互补“碱基”可以使用仅仅三分之一数量的点电荷被重建,即腺嘌呤的互补可以使用仅仅四个点电荷被重建;该互补结合的得比腺嘌呤更紧。这些简化的点电荷配体保留了与伴侣(partner)的Watson-Crick氢键,虽然以稍微不同的方式。含有非常少的必需点电荷的配体的模型可以表示更精细配体应该具有的关键补偿相互作用。它们可以作为有效的支架或种子,基于它更多的计算分子设计可以被实施,或者根据它合成组合策略可以有效的被建立。如果它们结合的足够紧,它们可以是特别有效的疗法,因为病毒难以对靶定于催化侧链的小分子配体产生抗性。
设计组合库在图1中50所示的组合库的设计,现在被更详细的描述。虽然,相当长期以来一直感兴趣的是使用计算分子建模以重新进行合理的配体设计,但该方法还可以通过其它方式用于配体的发现。特别的,该方法可以用于定义相对狭窄的化学空间区域,组合库可以被设计以特别详尽的搜索该限制空间。提供甚至最艰巨的组合化学方案的限定合成能力,该机制可以引导合成差异到更高的可能方向。
另外,有几个可选该计算方法的执行方式。一种执行方式开始于详细的点电荷格拟合至最优多极,隔离该格为对应适合接受一个或多个功能基团的口袋(pockets)的空间区域。形状和点电荷随后被用于确定一般大小和特征,如带正电荷、带负电荷、高极性、中等极性、弱极性或疏水性。这些特征定义可以被用于指导组合合成以产生合适的配体。
已经描述了本计算机执行程序的计算方面,一些生物学模型系统现在被描述。
生物学模型系统实施例1II类主要组织相容性复合物(MHC)蛋白介绍主要组织相容性复合物蛋白(MHC)是细胞表面抗原呈递结构,其作用是向T细胞显示蛋白溶解的细胞内肽的例子。通过T细胞识别肽为“外来的”,诱导免疫应答。该应答包括杀死抗原呈递细胞(通常为MHC类)或分泌淋巴因子,该淋巴因子控制免疫系统各种元件的攻击,包括B细胞激活(通常为II类MHC)。由于每个个体具有有限数量的组织相容性蛋白和实际上无限数量的要呈递的肽,每个MHC分子能够呈递大量的肽。结构研究已经显示了I类MHC和II类MHC分子各自用于获得高亲和力但相当低特异性的机制。(L.J.Stem and D.C.Wiley,Structure 2245(1994))。
与来自流感病毒的肽复合的II类MHC蛋白HLA-DR1的结构已经被解读(L.J.Stem,etal.,Nature(London)368215(1994))。与流感红血球凝聚素残基306-318(PKYVKQNTLKLAT)的复合物中HLA-DR1原始结构说明了大量结合和识别的重要特征,其已经在其它II类MHC复合物中被证实。该蛋白包含细胞表面侧上具有两个免疫球蛋白样结构域的八条β折叠和细胞外侧上的一对α螺旋。肽结合位点是两个螺旋间的裂口,并被β折叠支撑。肽以延展但高扭曲的构象结合,类似于II类聚脯氨酸螺旋构象;N端和C端延伸出该位点。大部分肽和蛋白间的氢键(15个中的12个)位于肽骨干基团,其帮助解释了蛋白如何识别许多不同的肽。观察到的肽构象强制每条肽侧链进入到三个方向中的一个侧链中的5条(Y308,Q311,T313,L314,和L316)被导入MHC分子表面的口袋,且基本被隐藏,侧链中的6条(K307,V309,K310,N312,K315,和T318)被从结合位点导出至T细胞受体,余下的两条侧链(P306和A317)被引导越过位点。因此,产生与MHC广泛接触的残基大部分截然不同于预备与合适T细胞相互作用的那些。5个口袋中,最深的容纳Tyr308,通过结合研究表明酪氨酸、苯丙氨酸或色氨酸都被允许。不同的II类MHC等位基因在接受5个隐藏的侧链的5个口袋处掺入取代。认为相互作用中的改变导致肽特异性中的同种异型差异。由于个体在它们的MHC分子的同种异型补体中不同,个体在它们的免疫应答方面不同。
肽结合到单个II类MHC分子的相对亲和力被认为导致相对肽抗原性。噬菌体展示的筛选和扩增研究定义了每个氨基酸在高亲和力肽的单个位置出现的频率(.Hammer等,J.Exp.Med.1761007(1992)和J.Hammer,等,PNAS U.S.A.914456(1994))。最强的锚定位置测定为位置1的大分子芳香基团,其主要被发现为Tyr(48%),Phe(25%),或Trp(13%)。位置4是长疏水物,为Met(50%)和Leu(28%);位置6是小分子残基,为Ala(32%)和Gly(22%);以及位置9通常被发现为Leu(45%).(J.Hammer,等,J.Exp.Med.1761007(1992))。而且,在任意位置都非常少有负电荷侧链恢复。该数据提供了有效的半定量的系列相对亲和力,其在确证本程序的计算方法方面是有效的。
测试和确证II类MHC HLA-DR1系统被用于测试本文所述的计算方法以分析肽结合位点,和设计增强结合的分子。测试和确证由大量任务组成,开始于使用结合病毒肽的晶体结构(L.J.Stem等.,Nature(London)368215(1994))。这些测试被设计用于证实该方法能够(i)认可观察到的结合肽是良好的结合体,(ii)认可已知的有害肽突变是不利的,(iii)认可已知的增强结合肽突变是有利的,(iv)在个体表面口袋中重新产生已知模式的结合疏水、极性和带电的残基,以及(v)重新建立已知的肽骨架结构和联系。
结合肽复合物的分析使用本文所述的方法分析病毒肽与HLA-DR1的结合。简要的,本文所述的策略被用于重新建立结合肽的电荷分布。可变点电荷被置于每个肽的原子上,且电荷值被计算以优化结合自由能。通过比较这些点电荷与实际的点电荷,计算出与计算的优化值相比肽亲和力的下降。病毒肽的计算得到的和实际点电荷之间点电荷的差异表明存在设计增强结合肽的可能性。以该方式,这组测试被用于确认要求的方法在根据已知配体和其结合伴侣结构设计增强结合配体方面的有待证实的应用。
增强和减弱结合的突变体相对亲和力的测试最初采用等排的或接近等排的替换进行实施。从Hammer等使用噬菌体展示研究的数据中,在位置1上Tyr比Phe优选,在位置4上Met或Leu比Gin优选,其中下划标记的残基对应在结合肽结构中的残基(L.J.Stem等.,Nature(London)368215(1994);J.Hammer,等,J.Exp.Med.1761007(1992);和J.Hammer,等,PNAS U.S.A.914456(1994))。本文所述方法被用于计算由于这些突变导致的亲和力改变。
本文所述的用于配体设计的新策略开始于受体的给定结构(或其它靶分子,如抗体或酶)并找出最优互补于该结构的配体性质。本文所述实施的测试分析是否该方法能够测定由于配体电荷分布差异导致的亲和力差异,这是定义最优配体电荷分布的基本条件。当点电荷量如前面段落所述的被优化,预期Tyr1羟基的极性被保持,Val2极性的增长,Gln4和Thr6的降低,其反映了Hammer等的静电倾向(J.Hammer,等,J.Exp.Med.1761007(1992);和J.Hammer,等,PNAS U.S.A.914456(1994))。
极性和非极性侧链的模式本计算机执行程序的方法被用于探测没有记载于肽原子已知位置的肽结合位点。该探测可以通过两种方式进行。一种方式中,五个主要结合口袋的每个通过只在该位点中的点电荷分布的个体优化进行探测;第二种中,五个主要结合口袋根据在一个计算中优化的整个位点的电荷分布共同进行探测。结果的比较表明位点被连接的程度;实验工作表明该连接将是最小化的(J.Hammer等,J.Exp.Med.1802353(1994))。互补形状区域通过球形包装进行构建,计算优化与位点结合的多级电荷分布。通过多极的直接检测和通过构建互补于该位点的分格的点电荷分布,每个位点根据其接受疏水、极性、正电和负电基团的程度进行分类。检测可以展示混合的特征,其中位点大部分疏水但接受一些局部的极性基团(推测Tyr1位点是该类型)。与已知位点特征进行比较从而评估该结果。差异可以导致是否计算中使用的肽去溶剂化代价(其是由结合构象中的刚性肽导致的)是完全不同于在噬菌体展示研究中通过实际配体经历的。然而,我们不期望该差异被考虑,因为去溶剂化代价主要是由极性和带电基团控制,其在非结合状态暴露于溶剂,并且其应该在观察到的延伸和扭曲构造中。
骨干轮廓(traces)和接触由于骨干轮廓被认为对于基本所有结合的肽是不变的,希望位点强烈知道骨干接触。因此,本计算机执行程序的方法被用于重新构建晶体中观察到的骨干的位置以进一步确证本文所述的方法。使用上述方法,肽骨干结合区域中优化配体的分布多极表示法被识别,转化为分格的点电荷场,肽的氨基基团(N-甲基乙酰胺)作为最小平方拟合被拟合到电场中,虽然也不允许与位点的壁空间上重叠。
设计增强的结合一般而言,设计增强结合配体的策略被用于查找机会,其中已知配体没有充分利用该位点。为此目的,付出的去溶剂化能比其在有利相互作用中恢复的更多的个体化学基团,和现在配体的基团不符合计算优值的位点都被识别。上述实施的计算(测试和确证)在该机会的搜索中被重新分析。
结合肽复合物的分析上述完整的静电分析被用于测定功能基团(在肽和结合位点上的侧链或骨干双极基团),其结合的总静电作用是不利的(即,其向疏水基团的突变被计算出导致更紧的结合)。该静电分析建议了用于修饰为疏水基团以产生更稳定复合物的肽的靶区域(即使它们是骨干的)。使用该策略我们能够在Arc抑制物的变异体中识别三个稳定的突变(Z.S.Hendsch,等.,Biochemistry 357621(1996))。不利于结合的MHC蛋白基团可以通过修饰肽以获得与其改良的结合而被改善。这些机会可以通过大量的并行的研究被证实,包括重新优化病毒肽原子点电荷的计算(见上述)。同样的降低和增加配体极性的位点可以被发现。该平行验证被用于提供进一步的证据,证明提出的位点可以被修饰以增强结合。
极性和非极性侧链的模式预期个体口袋优化和其整个位点可以被用作建议的详细改变的来源以识别与其靶分子增强结合的配体。在选择该优化的位点中,当通过实际和优化电荷分布间的差异进行衡量时,获得最大自由能的区域可以被重新获得,相应的结合能被最初选择。三个该区域包括位置1结合口袋,肽骨干结合区域(见下)和在病毒-肽研究中被溶剂群占据的口袋(L.J.Stem,等,Nature(London)368215(1994))。在病毒-肽复合物中位置1容纳Tyr(L.J.Stem,等.,Nature(London)368215(1994)),但是也经常被发现为Phe或Trp(J.Hammer,等,J.Exp.Med.1761007(1992);和J.Hammer,等,PNASU.S.A.914456(1994)。在最近确定的HLA-DR1与不同肽结合的晶体结构中,Trp占据该位点。Trp侧链的方向是相对Tyr的90°旋转,然而周围蛋白口袋基本是不变的。将大分子疏水侧链放入该口袋实际显示对结合的需求,J.Hammer,等,PNAS U.S.A.914456(1994))。为结合于该口袋的基团产生最优的电荷分布可以被用作对合成增强结合配体的组合合成方案的指导。
骨干轮廓和接触本计算机执行程序可以被用于设计具有非肽骨干的配体以改善连接。通过比较骨干结合区域的最优电荷分布和肽电荷分布,改良的骨干化学(chemistries)可以被合理的设计。例如,该方法可以被用于识别具有α碳等价物(或至少β碳)的配体,因此允许呈递的侧链在任何新平台的T细胞面的连接被设计。
实施例2HIV蛋白酶概述HIV蛋白酶对于病毒的正确组装是必需的。通过突变使蛋白酶失活导致产生无感染性的颗粒。HIV蛋白酶抑制物的设计是过去二十年或更久时间里大量制药公司的主要成就。该研究受益于在表达、纯化和结晶化的合适条件确定之后获得高通量X射线晶体数据的设备。在蛋白数据库中现在已经有超过45个或是单独的或是在与配体的复合物中的HIV-1蛋白酶结构。这些结构提供了丰富的数据集用于测试不同配体与同一个蛋白的作用形式。已经开发了大量非常有希望的抑制物,一些处在临床实验中,少量已经被FDA批准。然而,蛋白酶的“脱逸(escape)”突变体已经被分离获得许多该抑制物。
蛋白酶结构显示了99个残基多肽链的基本对称同型二聚体。活性位点组成于二折叠轴,被一对对称相关环围绕,该环在非结合状态显示高柔性,但是配体结合后遮蔽活性位点,并且邻近能够结合多至七个残基长的底物的缺口。该活性位点包括来自每个亚单位的三个一组的Asp25,Thr26和Gly27,和一对非常接近且几乎共面的Asp25羧酸基团。没有配体时酶外观上精确的二折叠对称通过结合(不对称)肽配体被稍微破坏。在设计研究中一个特别有趣的问题在于是不对称配体(例如在肽底物上模拟的)还是对称配体(其具有机会结合于符合酶二折叠的配体二折叠轴)是更紧结合的。令人惊奇的结果是某些对称配体被发现在活性位点中不对称的结合。本文所述计算方法能够被用于研究产生这种差异的能量作用。
底物特异性研究被用于测定肽的结合选择。这显示了在P2’位置Gln或Glu和P1上大分子疏水侧链(Phe,Leu,Met,Asn,或Tyr)的亲和力。不明确的选择包括P3上的Glu和P2上的疏水物(A.Wlodawer和J.W.Erickson,Annu.Rev.Bio-chem.62543(1993))。
本文所述方法对其所包含的对HIV感染是决定性的分子的结合方式的分析的应用可以被用于为了作为诊断和治疗试剂的促进紧密结合配体分子的设计。总的来说,本计算机-执行的程序的方法主要是连续静电学和第二自由能模拟。程序提供寻找靶向分子的静电学补充体的新的方法初步结果证明了本文所用的用于连续分析的对分子和能量的剖析的计算模型得到与通过使用对通过434抑制物对蛋白-DNA识别的一对研究的更加详细(以及耗时的)的自由能模拟的发现的相一致的结论(见,实施例3)。
测试本方法的基本原理的初步测试在II类MHC分子的研究中执行,并且之后用HIV-1蛋白酶执行。因此,上述方法被使用以设计结合至HIV-1蛋白酶的增强的结合配体。许多配体设计草案中遇到的一个困难是需要预测结合复合物的构像。目前的计算机执行的程序通过选择蛋白的构像和解决一系列的最佳补充配体的分子描述符绕开了这个问题。程序还提供了工具以检验单独的和在含有各种配体的复合物中的HIV-1蛋白酶的已有结构的子集。
环构像两个对称的相关的环在酶的未结合形式中位于开放的构像中,并在结合形式中关闭活性位点。一系列被良好表征并由于其相对刚性而有吸引力的抑制剂是环尿素化合物,其由DuPont Merck Pharmaceuticals开发(P.Y.S.Lam,等,Science 263380(1994)和C.N.Hodge,等,Chem.& Biol.3301(1996))。该化合物家族的成员可以被用于分析结合状态结构。例如与XK263(带有两个萘基、两个苯基和两个羟基取代的对称环尿素)的复合物是在蛋白数据库中,与DMP323和DMP450的复合物显示于图4中(“HIV-1蛋白酶的抑制物”)。该构象改变的影响使用上述方法根据计算的最优配体的性质测定。受体构象改变对互补配体性质的影响通过用占据活性位点上个体亚位点口袋的部分的形状和相对极性描述优化进行测定。预期计算中的差异可以很小,因为底物必须启动与开放构象的环的结合并在环闭合时完成结合。底物或者表现互补于开放或闭合形式之间的一些折中,或者两者间没有实质差异。
质子化状态一个重要的并且目前未解决的对蛋白酶抑制剂的设计很重要的问题是摧化的门冬氨酰残基的质子化状态(Asp 25和25′)。预测侧链的这个对的质子化状态将本质上改变计算的静电补充体的性质。对配体来说承担更多的去溶剂化代价以与带电荷而不是不带电荷的天门冬氨酸反应可能是值得的。预测到计算的优化配体静电学性质和实际的结合配体的比较将允许质子化状态分配至一些这些复合物。DuPont Merck组中的循环尿素的情况在这个研究中是有用的因为NMR证据与每个被质子化的门冬氨酰基团一致(D.A Torchia,等,J.Am.Chem.Soc.1161149(1989))。通过用双-,单-,以及未质子化的催化对从计算结果中比较优化的补充,确定活性位点中的化学自由度的可获得性对其配体特性的影响。该研究还允许比其它对配体结合更敏感的优选的滴定状态的识别。
对称的和不对称的结合许多对称的抑制剂已经基于它们将对对称酶更互补的原则被设计(M.Miller,等,Science 2461149(1989))。尽管这些中的一些已经被观察到在结晶研究中对称地结合(XK 263(P.Y.S.Lam,等,Science 263380(1994),DMP 450(C.N.Hodge,等,Chem.& Biol.3301(1996)),以及A-76928(M.V.Hosur,等,J.Am.Chem.Soc.116847(1994)),但是其它的非对称地结合(A-76889(M.V.Hosur,等,J.Am.Chem.Soc.116847(1994))。对称的抑制剂的非对称的结合可能有两个原因。位点可以使变形以致其真实地互补于对称的配体,或者位点可以保持基本上对称,但配体优先进行非对称反应。这些情况可以通过这些位点携带检验位点的计算的静电互补更加精确地被区别,为二折叠对称而锚定对称和不对称结合配体。如果补充体对不对称的结合配体保持对称,对配体的改善可以用上述方法被定义。例如,增强结合的配体可以通过研究表示不同选择(对称的和不对称的)的图4中的四个化合物使用羟基基团以补偿埋藏的催化天门冬氨酸侧链被设计。
设计设计蛋白酶抑制剂的方法类似于上述关于MHC配体设计的那些描述。几个特定用于HIV蛋白酶的设计点在本文中描述。
每个上述研究解答了关于活性位点的构像和滴定改变如何影响计算互补配体性质的特殊问题。每个研究也能够分析修饰存在的配体(获得“增强的结合配体”)或者设计具有增强的亲和力的全新配体的机会。乙醇和二醇在大量的HIV-1蛋白酶抑制剂中普遍存在;为满足门冬氨酰基团的静电学性质的更有效部分可以被识别以设计增强结合的配体。
对靶向至HIV的所有药物的一个特别重要的问题是“脱逸”突变体的最终演化。本发明对发展补充活性位点残基所需的最小电荷构型是有用的。据信这样的核心分子是有用的,因为其有限的尺寸应当通过脱逸突变体减少潜在可分裂的接触的数量。此外,由于接触将都在催化位点,因此分裂突变体可以是没有活性的。
对其它HIV靶向的设计的研究对其它HIV靶向的设计的研究用上述方法执行。其它HIV靶向包括TAR和RRE的RNA复合物以及HIV包膜蛋白。
实施例3434抑制物DNA-结合区域简介我们已经用连续静电计算分析了434抑制物DNA-结合区域,R1-69,(其结合至OR1算子)的高分辨率的X-射线晶体结构。主要结果在下面大致描述。相互反应被分裂为从每个蛋白主链羰基,CαNH,以及侧链和每个核酸核糖,碱基以及磷酸酯的贡献。对每个组,对结合的去溶剂化的贡献以及使得贯穿界面(定义为“分子间的”)的新反应的贡献和用蛋白或者DNA中的筛选的变化(定义为“分子内反应”)的贡献被计算。
目前仅仅预先适应的蛋白二聚物与预先适应DNA的刚性结合已经被研究。这些方法可以被延展至用于如上文所述的构像柔性。全部的对结合的静电贡献是不利的(45.3kcal/mol)。这是由于仅仅部分由有利分子间项(-96.4kcal/mol)弥补的大量的去溶剂化代价所导致的。分子内项的和是小的而且是不利的(8.8kcal/mol)。在复合物中形成的四个盐桥(两个对称相关的对)通过每个为-1.7kcal/mol的平均稳定复合物形成。这大部分是由于这些组比蛋白侧链在从未折叠状态中承担更小的去溶剂化代界的事实。在这点上,结合似乎与折叠有几分不同,但是我们的进一步结果显示区别似乎更复杂。
对去溶剂化代价最大的贡献来自于系统中的带电荷基团,蛋白侧链(63.5kcal/mol)和DNA主链基团(50.6kcal/mol)。蛋白主链基团(6.9kcal/mol)和DNA碱(11.9kcal/mol)承担小得多的成本。去溶剂化代价对许多在蛋白-DNA界面上埋藏的基团是巨大的。有趣的是,位于附近但是不在界面上的一些侧链也在结合上损失显著的溶剂化。
在复合物中形成的强的、有利的分子间反应几乎全部由DNA主链基团组成。令人惊奇的,相同的量来自与蛋白侧链的相互反应(-42.2kcal/mol),其包括大量的带电荷基团,蛋白主链也是一样(-41.8kcal/mol),其除了带电荷末端以外仅仅是极性的。分析表明在α-螺旋的N-末端和个体磷酸酯基团之间进行的强反应以及一系列磷酸酯与蛋白环中的主链基团之间的强反应。此外,带电荷侧链和DNA主链之间的一些相互反应也是相当疏远的,但是通过低介电蛋白被指导,其中由于通过溶剂的较少的筛选,可以预期静电反应在较长的范围。
与碱基的分子间相互反应是小的蛋白主链为2.2kcal/mol(不利的)以及用蛋白侧链为-14.6kcal/mol(有利的),尽管碱基-例链反应被通常认为是给蛋白-DNA复合物带来大量的特异性。有趣的是,足够近以使得形成氢键的反应导致大约一半有利的分子间反应;相同的贡献来自太远而不能形成氢键的相互反应。特别地,许多这些更疏远的相互反应是对算子的中心区域中的“未接触”碱基的;左侧和右侧半-位点中的Arg43贡献-3.9kcal/mol。
全部分子内反应对静电进入能量仅仅贡献8.8kcal/mol,但是这个作用的起源是非常有趣的。由于它们位于蛋白或者DNA内,这些反应存在于结合和自由态中的相同几何中。它们的值在进入的时候改变,无论如何,由于复合物中的高介电溶剂的移去减少了相互反应的筛选。由于在结合状态中的减少的溶剂筛选导致较低的有效介电,DNA主链内的排斥力(大部分由于磷酸酯-磷酸酯相互反应)的值在结合蛋白上增加了19.2kcal/mol。这部分由-11.9kcal/mol的蛋白侧链之间的有利贡献弥补,其大部分是由于有吸引力的蛋白的盐桥,其强度由于在复合物中减少的筛选而“增加”。
当对每个基团的进行所有的贡献(去溶剂化,分子间,分子内)制表时,大部分基团各自对去溶剂化能量的付出比它们在其它反应中得到的要更多。这对于磷酸酯基团和除了一个碱基之外的所有碱基以及对在结合界面的侧链是特别正确的。所得到的比它们在去溶剂化能量中的付出多的基团倾向于在未进入状态中大部分被埋藏。
总的来说,这个工作证明了得自对结合事件的积极剖析的详细的观察。这些技术对探测结合至HIV靶向的配体是有用的,并且允许增强的结合配体的合理设计。
点突变作用的自由能分析在434抑制物-DNA复合物中碱基对的改变得模拟为了解决识别的特殊问题并且验证我们的连续静电研究的结果,我们用明确的溶剂进行自由能模拟研究。结合状态起始结构是R1-69,结合至OR2的的高分辨率复合物(L.J.W.Shimon和S.C.Harrison,J.Mol.Biol.232826-838(1993))。在位置7L的突变是TA→GC。DNA的多倍未结合构像从300-ps分子动力学轨迹开始产生。轨道的五个框架被作为未结合态自由能计算的起始结构被选择和应用。尽管434抑制物和DNA之间的大部分反应在大沟中,这个操作子突变在抑制物面对DNA小沟一侧的假-二级轴附近发生。总共十个模拟在未结合态中和六个在结合状态中被执行,其带来好的统计学信息。结果在这里简要描述(E.J.Simon,″A Molecular DynamicsStudy of a Mutation in a Bacteriophage 434 Operator/Repressor Complex″,PhDthesis,Harvard Univer-sity(1996))。
结果整体的稳定性变化为+1.4±0.7kcal/mol,其排斥对突变运算子的结合。这与0.8-1.2kcal/mol的实验值非常一致(G.B.Koudelka,等,Nature(London)326886(1987))。进行这个全部稳定性改变(B.Tidor,″MolecularModeling of Contributions to Free Energy ChangesApplications toProteins.PhD thesis,Harvard University(1990);B.Tidor and M.Karplus,Biochemistry 303217(1991);以及B.Tidor ProteinsStrict.,Funct.,Genet.19310(1994))的来源的分析并且显示出Arg43L侧链和突变体鸟嘌呤的N2氨基基团之间的强烈的排斥。这是非常有趣的反应因为它表明这个精氨酸通过在这个位置用鸟嘌呤“干扰”作为特异性的负面因素。在突变位点的富含AT的区域中的小沟中的氢键受体和侧面磷酸酯基团的排列极化了周围的溶剂水以有利地与这个负电位相互反应。Gua N2供体向小沟的引入有效地排斥了这一极化溶剂。在未结合态中的排斥比在结合状态中的强因为在蛋白结合后溶剂从小沟的这个区域被替代。
这些自由能模拟结果和连续静电学研究的比较基本上显示对Arg 43的反应的相同的剖析,包括溶剂极化作用。这个比较证明了相对于明确的模拟,连续方法学的精确性。目前的计算机-执行的程序是围绕着连续方法为基础,其更加节约并且能够被用于立即分析全部结合点,而不是一次一个基团。自由能模拟主要用于检验连续理论和实验之间的不同点。
附件图5举例说明了问题几何。图5a显示了在受体(R)和球形配体(L)之间的严格接合以形成球形结合状态复合物的结合反应。受体、配体和复合物都为由高介电的溶剂(∈2)围绕的低介电的介质(∈3)。图5b显示了解决的边界值问题包括用介电常量为∈2的溶剂包围的介电常量为∈1的半径为R的球形区域的电荷分布。坐标的原点是较大球形区域的中心,但是在多极中电荷分布在沿着z轴距离d的点附近展开。几何要求为配体球不扩展超过受体球,R≥d+a,尽管平等的情况也在图中例证。
静电结合自由能是在结合状态和未结合状态中的静电自由能之间的差,ΔGbinding=Gbound-Gunbound(见图5a)。由于介电模型包括影响熵以及焓的应答,因此静电能被认为是自由能。这里我们表达每个状态的自由能为包括配体(L)、受体(R)、以及它们的相互作用(L-R)的库仑和反应场(水合作用)项的总和。
Gstate=Gcoul,Lstate+Gcoul,Rstate+Gcoul,L-Rstate+Ghyd,Lstate+Ghyd,Rstate+Ghyd,L-Rstate。
(1)下面表达式为结合自由能的结果ΔGbinding=ΔGcoul,L-R+ΔGhyd,L-R+ΔGhyd,L+ΔGhyd,R(2)其中我们应用了在受体和配体中的点电荷几何保持固定的事实以消除配体和受体的库仑自身作用,并且其中两个L-R项仅仅归于结合状态,因为配体和受体被假定不在未结合状态中相互反应。(但是注意,虽然受体的电荷分布在结合和非结合状态不需要相同。如果它们是不同的,这加入一个常数到ΔGbinding,其能够在定义方程(3)中ΔGvar时消去)。因此,方程(2)描述静电结合自由能为配体和受体的去溶剂化作用(其为不利的)和结合状态中溶剂遮蔽的静电作用(其通常是有利的)的总和。由于我们的目标是改变配体电荷分布以优化静电结合自由能并且最后一项仅仅加上一常数,因此我们定义相关的变化结合能,ΔGvar=ΔGint,L-R+ΔGhyd,L(3)其中方程(2)的RHS的前两项已经结合称遮蔽的反应项并且常数项已经被消除。注意ΔGint,L-R=Σj∈RqjVLbound(rj→)=Σj∈Rqj[Vcoul,Lbound(rj→)+Vhyd,Lbound(rj→)]---(4)]]>以及ΔGhyd,L=12Σi∈LqiVhyd,Lbound(ri→)-12Σi∈LqiVhyd,Lunbound(ri→)---(5)]]>其中VLstate为指定态中仅归因于配体电荷分布的总静电电位以及如显示的,Vterm,Lstate为库仑或反应场(水合作用)项。总和为配体(i∈L)或受体(j∈R)中的原子点电荷的和。方程(5)中的 因子是由于配体电荷分布与自身诱导的反应场相互影响的事实。
Vcoul,Lbound,Vhyd,Lbound,和Vhyd,Lunbound,方程(4)和(5)中的三个静电电位,根据通过解决图1b中显示的边界值问题给定的几何和电荷分布进行显示。电荷分布(对应于配体)位于半径R的球中。我们采用球的中心作为坐标的原点(不带撇的)但是多极中的电荷分布展开于第二原点(带撇的)周围,其顺着Z轴转移了距离d,从而r→(r,θ,φ)=d→(d,θd=0,φd=0)r→′(r′,θ′,φ′).---(6)]]>各处的电位满足泊松方程。在球内部,可以被写为Vin(r→)=Σiqi∈1|r→-ri→|+Σl=0∞Σm=-llAl,mrlYl,m(θ,φ)---(7)]]>其中RHS的第一项为库仑并且第二项为反应场(水合作用)电位,并且i的总和与配体点电荷一致。在球的外部,库仑和反应场电荷可以合并并且写作Vout(r→)=Σl=0∞Σm=-llBl,mrl+1Yl,m(θ,φ)---(8)]]>其中Al,m和Bl,m由适当的边界条件确定并且Yl,m(θ,φ)为球谐函数。在球谐函数和球中心周围的电荷分布的多极中展开在方程(7)中的库仑项。这里我们将多极扩展的原点移至 Σiqi∈1|r→-ri→|=Σiqi∈1|(r→-d→)-ri′→=Σiqi∈1|r→-ri′→|---(9)]]>=Σl=0∞Σm=-ll4π2l+1Ql,m′*Yl,m(θ′,φ′)∈1r′l+1---(10)]]>其中Q′l,m是围绕带撇原点 展开的球形多极,Ql,m′*≡Σiqiri′lYl,m*(θi′,φi′).---(11)]]>我们采取Jackson1使用的Yl,m(θ,φ)的定义。方程(10)中的表达式当r′>ri′时(即在配体外部或者,更明确的,在中心在 并且半径是从 至点电荷的最远距离的球体的外部)是有效的。
为了代入方程(7)和合并包括谐低函数的项,我们首先根据Yl,m(θ,φ)/rl+1展开方程(10)的Yl,m(θ′,φ′)/r′l+1。这个可以使用Greengard2的结果轻易获得,其规定为r>d,
Yl,m(θ′,φ′)r′l+1=Σl′=0∞Σm′=-l′l′Kl′,m′,l,m[4π(2l+1)(2l′+1)(2l′+2l+1)]12---(12)]]>dl′Yl′,m′′′(θd,φd)Yl′+l,m′+m(θ,φ)rl′+l+1]]>其中Kl′,m′,l,m=[(l′+l+m′+m)!(l′+l-m′-m)!(l′+m′)!(l′-m′)!(l+m)!(l-m)!]12.---(13)]]>由于我们已经选取了θd=0的几何(图1b),方程(12)中仅仅m’=0的项是非零的,这种情况下方程(10)变为Σiqi∈1|r→-rl→|=Σl=0∞Σm=-ll1∈1(4π2l+1)12---(14)]]>Ql,m′*Σl′=0∞Kl′,0,l,mdl′(4π2l′+2l+1)12Yl′+l,n(θ,φ)rl′+l+1]]>其中多极分布围绕点 进行,但是电位表达为围绕大球中心的球谐函数的总和。上面的方程也可以被写作,Σiqi∈1|r→-ri→|=---(15)]]>Σl=0∞Σm=-ll1∈1(4π2l+1)12Yl,m(θ,φ)rl+1Σl′=|m|lKl-l′,0,l′,mdl-l′(4π2l′+1)12Ql′,m′*]]>其中具有相同的Yl,m(θ,φ)的项可以被集中在一起,从而与方程(14)相反,方程(14)中具有相同的Q′*l,m的被集中。
在将方程(15)代入方程(7)并且匹配r=R的边界条件,Vin|r=R=Vout|r=R(16)∈1∂Vin∂r|r=R=∈2∂Vout∂r|r=R---(17)]]>球内的水合作用(反应场)电位为,Vhyd(r→)=Σl=0∞Σm=-llAl,mr′Yl,m(θ,φ)---(18)]]>=Σl=0∞Σm=-ll(4π2l+1)12r′Yl,m(θ,φ)(ClR2l+1)]]>Σl′=|m|lKl-l′,0,l′,mdl-l′(4π2l′+1)12Ql′,m′*---(19)]]>
其中Cl=(∈1-∈2)∈1[∈2+l∈1/(l+1)].---(20)]]>我们现在可以再写出不同的V′s,明确它们对Q′*l,m的依赖性。V′coul,Lbound通过方程(10)给定,Vhyd,Lbound通过方程(19)给定但是重新改写以使具有相同的Q′*l,m的项被集中,Vhyd,Lunbound通过R=a和d=0时的方程(19)给定,Vcoul,L′bound(r′→)=Σl=0∞Σm=-ll4π2l+1Ql,m′*Yl,m(θ′,φ′)∈1r′l+1---(21)]]>Vhyd,Lbound(r→)=Σl=0∞Σm=-llΣl′=1∞(4π2l+1)12---(22)]]>(4π2l′+1)12Ql,m′*Kl′-l,0,l,mdl′-l(Cl′R2l′+1)rl′Yl′,m(θ,φ)]]>Vhyd,Lunbound(r→)=Σl=0∞Σm=-ll4π2l+1(Clα2l+1)Ql,m′*rlYl,m(θ,φ)---(23)]]>代入方程(4),我们更加清楚ΔGint,L-R对Q′*l,m的依赖,ΔGint,L-R=Σj∈Rqj[Vcoul,L′bound(rj′→)+Vhyd,Lbound(rj→)]---(24)]]>=Σl=0∞Σm=-l1Ql,m′*Σj∈Rqj[(4π2l+1)Yl,m(θ′j,φ′j)∈1rj′l+1+---(25)]]>Σl′=l∞(4π2l+1)12(4π2l′+1)12Kl′-l,0,l,mdl′-l(Cl′R2l′+1)]]>rjl′Yl′,m(θj,φj)]]]>≡Σl=0∞Σm=-llαl,mQl,m′*---(26)]]>其中在最后一行我们已经定义了组分αl,m,其独立于Q′*l,m’,作为方程(25)中乘以Q′*l,m’的因子。每个αl,m表达多极对ΔGint,L-R的贡献并且包含获得ΔGvar所需的关于受体电荷分布的所有信息。
对于ΔGhyd,L,根据Q′*l,m’重新表达方程(5)是有用的,多极描述了配体电荷分布而不是个体电荷,qi。我们围绕着多极扩展的中心 展开 Σi∈LqiV(ri→)=Σi∈LqiV(d→+ri′→)---(27)]]>=Σi∈Lqi[V(d→)+ri′→·▿→V(d→)+...]---(28)]]>已经由Rose表明在球体坐标中扩展变为3,
Σi∈LqiV(d→+ri′→)=Σl=0∞Σm=-ll4π(2l+1)!!Q′l,m*(▿→)V(d→)---(29)]]>其中yl,m(r→)≡rlYl,m(θ,φ)---(30)]]>并且 是通过用 替代 获得的算子。对于正的m并且当 根据拉普拉斯方程的解(即rlYl,m(θ,φ)或Yl,m(θ,φ)/rl+1)进行处理,显示出3,yl,m(▿→)=(2l)!2′l![(2l+14π)2m(l+m)!(l-m)!]12▿1m▿0l-m---(31)]]>双因子被定义为(2l+1)!!=(2l+1)·(2l-1)·(2l-3)...3·1---(32)]]>=(2l+1)!2ll!---(33)]]>并且球形部分衍生物为▿1=-12(▿x+i▿y),▿-1=12(▿x-i▿y),▿0=▿x.---(34)]]>为了计算负数m的 我们应用Yl,-m(θ,φ)=(-1)mY*l,m(θ,φ)]]>的事实以及方程(34)中球形部分衍生物的定义从而获得yl,m(▿→)=(2l)!2ll![(2l+14π)2m(l+m)!(l-m)!]12▿-1m▿0l-m---(35)]]>for m≥0。
结合配体的水合作用能随后为Ghyd,Lbound=12Σi∈LqiVhyd,Lbound(d→+ri′→)=12Σl′ι=0∞Σm′=-l′l′4π(2l′+1)!!Ql′,m′′*yl′,m′(▿→)Vhyd,Lbound(d→)---(36)]]>=12Σl′=0∞Σm′=-l′l′4(2l′+1)!!Ql′,m′′*yl′,m′Σl=0∞Σm=-llΣl′′=l∞(4π2l+1)12(4π2l′′+1)12×---(37)]]>Ql,m′*Kl′′-l,0,l,mdl′′-1(Cl′′R2l′′+1)yl′,m′(▿→)(rl′′Yl′′,m(θ,φ))|r→=d→.]]>为了估算方程(37)中的 我们使用方程(31)和梯度方程4▿→(Φ(r)Yl,m(θ,φ))=-(l+12l+1)12(dΦ(r)dr-lrΦ(r))Tl,l+1,m(θ,φ)+---(38)]]>(l2l+1)12(dΦ(r)dr+l+1rΦ(r))Tl,l-l,m(θ,φ)]]>其中
Tl,l′,m(θ,φ)≡Σm′∈[-1,0,1]C(l′,1,l;m-m′,m′)Yl′,m-m′(θ,φ)ξ^m′---(39)]]>C(l′,1,l;m-m′,m′)为经常在角动量的研究中遇到的向量加法(或Clebsch-Gordon)系数,其在表I中显示4, 为球形单位向量,ξ^1=-12(x^+iy^),ξ^-1=12(x^-iy^),ξ^0=z^.---(40)]]>相应的▿→=x^▿x+y^▿y+z^▿z=-ξ1▿-1-ξ-1▿1+ξ0▿0---(40)]]>从方程(38)至(41),我们有u(rlYl,m(θ,φ)=(-1)u[l(2l+1)]1/2C(l-1,1,l;m+u,-u)rl-1Yl-1,m+u(θ(φ)2)应用表I、方程(31)和方程(37)至(42),我们获得下面的中间结果▿0l′-m′(rl′′Yl′′,m)=---(43)]]>[(2l′′+1)(l′′+m)!(l′′-m)!(2l′′-2l′+2m′+1)(l′′-m-l′+m′)(l′′+m-l′+m′)!]12rl′′-l′+m′Yl′′-l′+m′,m]]>▿1m′(rl′′-l′+m′Yl′′-l′+m′,m)=---(44)]]>(-1)m′[(2l′′-2l′+2m′+1)(l′′-m-l′+m′)!2m′(2l′′-2l′+1)(l′′-m-l′-m′)!]12rl′′-l′Yl′′-l′,m+m′]]>▿-1m′(rl′′-l′+m′Yl′′-l′+m′,m)=---(45)]]>(-1)m′[(2l′′-2l′+2m′+1)(l′′+m-l′+m′)!2m′(2l′′-2l′+1)(l′′+m-l′-m′)!]12rl′′-l′Yl′′-l′,m-m′]]>并且在结合状态下配体的水合作用能的最终表达式,Ghyd,Lbound=12Σi∈LqiVhyd,Lbound(ri′→)=12Σl=0∞Σm=-llΣl′=0∞Ql,m′*Ql′,m′Σl′′=max(l,l′)∞(4π2l+1)12(4π2l′+1)12Cl′′R2l′′+1×---(46)]]>(l′′+m)!(l′′-m)!(l′′-l)!(l′′-l′)![1(l+m)!(l-m)!(l′+m)!(l′-m)!]12d2l′′-l-l′]]>≡Σl=0∞Σm=-llΣl′=0∞Σm′=-l′l′βl,m,l′,m′Ql,m′*Ql′,m′′]]>其中,βl,m,l′,m′由上面两个方程定义;注意m′≠m时βl,m,l′,m′为零。我们通过在方程(46)中设定d=0和R=a获得未结合配体的水合作用能,Ghyd,Lunbound=12Σi∈LqiVhyd,Lunbound(ri′→)=12Σl=0∞Σm=-ll4π2l+1(Cla2l+1)Ql,m′*Ql,m′---(48)]]>≡Σl=0∞Σm=-llγl,mQl,m′*Ql,m′---(49)]]>
其中γl,m通过方程(48)和(49)定义。为了符号表示方便,我们将γl,m写作为l和m的函数,尽管并不与m形式相关。
因此ΔGvar已经被表示为配体电荷分布的多极,Ql,m′(围绕配体球的中心扩展)和不依赖于Ql,m′的组分αl,m,βl,m,l′,m′以及γl,m的函数。结合方程(26)、(47)和(49)可得ΔGvar=Σl=0∞Σm=-llαl,mQl,m′*+---(50)]]>Σl=0∞Σm=-llΣl′=0∞Σm′=-l′l′βl,m,l′,m′Ql,m′*Ql′,m′′-Σl=0∞Σm=-llγl,mQl,m′*Ql,m′.]]>注意仅仅αl,m依赖于受体电荷,而βl,m,l′,m′和γl,m仅仅依赖于结合和未结合状态的几何。虽然ΔGvaropt为实数量,αl,m和Ql,m′为复数且积αl,m,Ql,m′*和Ql,m′*Ql′,m′包括形式γl′,m*(θ′,φ′)Yl,m(θ,φ)的项的总和;注意βl,m,l′,m′和γl,m为实数。
我们用αl,m和Ql,m′的实数和虚数部分重新改写ΔGvaropt,ΔGvar=Σl=0∞[αl,0Ql,0′+2Σm=ll(Reαl,mReQl,m′+Imαl,mImQl,m′)]+---(51)]]>Σl=0∞Σl′=0∞[βl,0,l′,0Ql,0′Ql′,0′+]]>2Σm=llβl,m,l′,m(ReQl,m′ReQl′,m′+ImQl,m′ImQl′,m′)]-]]>Σl=0∞[γl,0Ql,0′2+2Σm=llγl,m(ReQl,m′2+ImQl,m′2)]]]>(其中m的总和不包含l=0)注意Yl,-m(θ,φ)=(-1)mYl,m*(θ,φ)]]>以及Y*l,m(θ′,φ′)Yl,m(θ,φ)+Y*r,-m(θ′,φ′)Yl,-m(θ,φ)=Y*r,m(θ′,φ′)Yl,m(θ,φ)+Yr,m(θ′,φ′)Y*l,m(θ,φ) (52)=2[ReYr,m(θ′,φ′)·ReYl,m(θ,φ)+ImYr,m(θ′,φ′)·ImYl,m(θ,φ)]. (53)新的变量ReQl,m′和ImQl,m′被改变符号和如下重新命名Qi{Q′0,0,Q′1,0,ReQ′1,1,ImQ′1,1,Q′2,0,ReQ′2,1,ImQ′2,1,ReQ′2,2,...)(Q1,Q2,Q3,Q4,Q5,Q6,Q7,Q8,...). (54)并且相似的转换用于创造αi,βij,和γi。方程(51)可以被写作ΔGvar=Σi=1∞αiQi+Σi=1∞Σj=1∞βijQiQj-Σi=1∞γiQi2---(55)]]>=Σi=1∞αiQi+Σi=1∞Σj=1∞(βij-δijγi)QiQj---(56)]]>或者用矩阵符号表示,ΔGvar=Q→TB↔Q→+Q→TA→---(57)]]>=(Q→+12B↔-1A→)TB↔(Q→+12B↔-1A→)-14A→TB↔-1A→---(58)]]>
其中 是由Qi形成的向量, 是由αi形成的向量, 是由(βij-δijγi)形成的对称矩阵,并且平方的完成已经被应用以得到方程(58)。由于方程(57)中的 对应于配体去溶剂化代价,其对于化学合理几何必须大于零,矩阵 是正定的并且ΔGvar的极值为最小值5。从方程(58)中可获得多极的最优值, 和最小变化结合能,ΔGvaropt,Q→opt=-12B↔-1A→---(59)]]>ΔGvaropt=-14A→TB↔-1A→.---(60)]]>由于 也是正定的所以ΔGvaropt总是负的。
为了用固定的单极(全部电荷)(Q1=Q)求解最优多极分布,剩余的最优多极(i≠1)的方程为2Σj≠1(βlj-δijγl)Qjopt+(2βilQ+αi)=0---(61)]]>其与方程(59)相类似。
上述矩阵方程(其具有在lmax=(lmax+1)2舍去的维数)能够通过相对适当的计算资源被数字地求解。在实践中,由于αi和βij包含无数项的总和,第二界限值lcut必须被用于舍去方程(25)和(46)中最内总和。当lmax和lcut足够大,ΔGvaropt收敛并且增加的优点包括更多的多极基本消去。
对任意给定的受体和几何,我们已经如此描述了作为一组多极测定紧密结合配体的电荷分布的方法。任意测试配体的优化中的结合自由能的误差可以通过从方程(58)中减去方程(60)并且使用方程(59)以消除 来计算,TABLE I afrom reference 4参考附录
1J.D.Jackson,Classical Electrodynamics,2nd ed.(JohnWiley and Sons,New York,1975).
2L.Greengard,The Rapid Evaluation of Potential Fields inParticle Systems(MIT Press,Cambridge,Mass.,1988).
3M.E.Rose,J.Math.& Phys.37,215(1958);4M.E.Rose,Elementary Theory of Angular Momentum(John Wiley and Sons,New York,1957).
5G.Strang,Introduction to Applied Mathematics(Wellesley-Cambridge Press,Wellesley,Mass.,1986).
现在已经描述了本计算机-执行的程序的一些实施例,前面所述的仅仅是举例例证而不构成限定作用对本领域的技术人员而言应该是清晰的,仅仅是通过实施例的方式显示。许多修改和其它实施例也在本领域的普通技术人员的范围内并且计划落入由附加的权利要求和与其等同的那些定义的目前程序的范围内。
序列表<160>序列的数量1<210>SEQ ID NO 1<2l1>长度13<212>类型PRT<213>生物体流感A病毒<400>序列1Prc Lys Tyr Val Lye Gln Aen Thr Leu Lye Leu Ala Thr1 5 10
权利要求
1.为识别结合至溶剂中靶向分子的配体的性质的计算机执行的过程,包括步骤接受在三维中定义的选择形状的配体的显示,其互补于在三维中定义的选择的部分靶向分子的形状,测定使溶液中配体和靶分子结合自由能的静电分布最小化的电荷分布的表示法。
2.权利要求1的计算机执行的过程,其中电荷分布的表示法是一系列的多极。
3.权利要求1的计算机执行的过程,进一步包括识别具有与电荷分布的表示法匹配的点电荷配体的步骤。
4.权利要求2的计算机执行的过程,进一步包括识别具有与电荷分布的表示法匹配的点电荷配体的步骤。
5.权利要求1的计算机执行的过程,进一步包含设计含有具有与电荷分布的表示法相匹配的点电荷的配体的组合库的步骤。
6.权利要求2的计算机执行的过程,进一步包含设计含有具有与电荷分布的表示法相匹配的点电荷的配体的组合库的步骤。
静电结合自由能的优化Lee-Peng LeeDepartments of Chemistry and Physics,Massachusetts Institute ofTechnology,Cambridge,Massachusetts 02139-4307Bruce Tidora)Deparnnent of Chemistry,Massacltussetts Institute of Techmology,Cambridge,Massaclaussets 02139-4307(收稿日1996年12月9日;接受日1997年2月24日)获得的分析结果定义了特定受体电荷分布和球形几何的最紧密结合配体的电荷分布。使用连续静电的框架,最优分布表示为通过最小化静电结合自由能确定的一组多极。提供了两个简单受体系统的结果以阐明该理论的应用。1997美国物理协会[S0021-9606(97)50221-2]1.简介一种在许多疾病中运行的机制是蛋白(这里表示为受体)的不良行为,其至少在原则上能够通过分子配体的紧密结合(例如,通过空间屏蔽活性位点或者通过阻止必需的构像改变)被抑制。1为了有效的用作药物,该分子必须具有许多重要的药理学活性,诸如生物可利用率和非毒性。在药物分子的发现过程中的一个步骤是紧密结合配体的识别或设计。配体设计是特别困难的,因为对结合自由能的反作用必须被适当协调。例如,增加配体中的点电荷的大小可以增强其与受体的相互作用(倾向于有利结合),但是它也增强了其在未结合状态中与溶剂的相互作用(倾向于不利结合)。应当选择多少电荷量以平衡这些作用和产生最有利的结合自由能?这个问题可以被推广至配体电荷分布的所有多极项。最佳平衡这些作用的电荷分布将最紧密结合至受体。
在这里,确定最紧密结合至给定受体的配体电荷分布的问题用连续静电理论解决。在第II部分中,根据以下情况给出了解决方法,即对自由配体和结合复合物都是由高介电的水溶性介质围绕的低介电的球形区域,并且系统的行为受泊松方程支配。为了促进分析结果,采用下述假定配体和受体在未结合状态不相互反应,配体电荷分布在结合和未结合状态是一样的,并且配体严格地结合至具有独特定向的受体。最优电荷分布通过表达配体电荷分布为任意系列的多极以及最小化多极的结合自由能而获得。在第三部分中,理论被应用于为了试验目的设计的高度对称的电荷分布以及第二电荷分布,存在于一些蛋白结合位点中的α-螺旋末端。讨论和结论在第四部分显示。
II.理论在结合状态和未结合状态中的静电自由能的差是静电结合自由能,ΔGbinding=Gbound-Gunbound(见图1a)。由于介电模型包括影响熵以及焓的应答,因此静电能被认为是自由能。这里我们表达每个状态的自由能为包括配体(L)、受体(R)、以及它们的相互作用(L-R)的库仑和反应场(水合作用)项的总和。
Gstate=Gcoul,Lstate+Gcoul,Rstate+Gcoul,L-Rstate+Ghyd,Lstate+Ghyd,Rstate]]>+Ghyd,L-Rstate.---(1)]]>下面表达式为结合自由能的结果ΔGbinding=ΔGcoul,L-R+ΔGhyd,L-R+ΔGhyd,L+ΔGhyd,R,(2)其中我们应用了以下事实,即在受体2和配体中的点电荷几何再模型中保持固定以消除配体和受体的库仑自身作用,并且其中两个L-R项仅仅归于结合状态,因为配体和受体被假定不在未结合状态中相互反应。因此,方程(2)描述静电结合自由能为配体和受体的去溶剂化作用(其为不利的)和结合状态中溶剂遮蔽的静电作用(其通常是有利的)的总和。由于我们的目标是改变配体电荷分布以优化静电结合自由能并且最后一项仅简单加上一常数,因此我们定义相关的变化结合能,ΔGvar=ΔGint,L·R+ΔGhyd,L,(3)
图1.问题几何的图解。(a)结合反应被显示于受体(R)和球形配体(L)之间,其严格接合以形成球形结合状态复合物。受体、配体和复合物为由高介电的溶剂(∈2)围绕的低介电的介质(∈1)。(b)这里解决的边界值问题包括用介电常量为∈2的溶剂包围的介电常量为∈1的半径为R的球形区域中的电荷分布。坐标的原点是较大球形区域的中心,但是在多极中电荷分布在沿着z轴距离d的点附近展开。几何要求为配体球不扩展超过受体球,R≥d+a,尽管平等的情况也在图中例证。
其中方程(2)的RHS的前两项已经结合至遮蔽的反应项并且常数项已经被消除。注意
ΔGint,L-R=Σj∈RqjVLbound(rj→).]]>=Σj∈Rqj[Vcoul,Lbound(rj→)+Vhyd,Lbound(rj→)]---(4)]]>以及ΔGhyd,L=12Σi∈LqiVhyd,Lbound(ri→)-12Σi∈LqiVhyd,Lunbound(ri→),---(5)]]>其中VLstate为指定态中仅归因于配体电荷分布的总静电电位以及如显示的,Vterm,Lstate为库仑或反应场(水合作用)项。总和为配体(i∈L)或受体(j∈R)中的原子点电荷的和。方程(5)中的 因子是由于配体电荷分布与自身诱导的反应场相互影响的事实。
我们通过表达方程(4)和(5)中的三个静电电位Vcoul,bound,Vhyd,Lbound,和Vyd,Lunbound,根据通过解决图1b中显示的边界值问题给定的几何和电荷分布向下进行。电荷分布(对应于配体)位于半径R的球中。我们采用球的中心作为坐标的原点(不带撇的)但是使展开多极中的电荷分布于第二原点(带撇的)周围展开,其顺着Z轴转移了距离d,从而r→(r,θ,φ)=d→(d,θd=0,φd=0)+r′→(r′,θ′,φ′).---(6)]]>各处的电位满足泊松方程。在球内部,可以被写为Vin(r→)=Σiqi∈1|r→-ri→|+Σl=0∞Σm=-llAl,mrlYl,m(θ,φ),---(7)]]>其中RHS的第一项为库仑并且第二项为反应场(水合作用)电位,并且i的总和与配体点电荷一致。在球的外部,库仑和反应场电荷可以合并并且写作Vout(r→)=Σl=0∞Σm=-llBl,mrl+1Yl,m(θ,φ),---(8)]]>其中Al,m和Bl,m由适当的边界条件确定并且Yl,m(θ,φ)为球谐函数。继续进行的标准方法是在球谐函数和球中心周围的电荷分布的多极中在方程(7)中展开库仑项。这里我们将多极扩展的原点移至 Σiqi∈1|r→-ri→|=Σiqi∈1|(r→-d→)-ri′→|=Σiqi∈1|r′→-ri′→|---(9)]]>=Σl=0∞Σm=-ll4π2l+1Ql,m′*Yl,m(θ′,φ′)∈1r′l+1,---(10)]]>其中Ql,m′是围绕带撇原点 展开的球形多极,Ql,m′*≡ΣiqirilYl,m*(θi′,φi′).---(11)]]>
需要注意,在这个工作中我们采取Jackson3使用的Yl,m(θ,φ)的定义。方程(10)中的表达式当r′>ri′时(即在配体外部或者,更明确的,在中心在 并且半径是从 至最远点电荷的距离的球体的外部)是有效的。
为了代入方程(7)和合并包括球谐函数的项,我们首先根据Y′l,m(θ,φ)/rl+1展开方程(10)的Yl,m(θ′,φ′)/r′l+1。这个可以使用Greengard4的结果轻易获得,其规定为r>d,Yl,m(θ′,φ′)r′l+1]]>=Σl′=0mΣm′=-l′l′Kl′,m′,l,m[4π(2l+1)(2l′+1)(2l′+2l+1)]1/2]]>×dl′Yl′,m′*(θd,φd)Yl′+l,m′+m(θ,φ)rl′+l+1,]]>其中Kl′,m′,l,m=[(l′+l+m′+m)!(l′+l-m′-m)!(l′+m′)!(l′-m′)!(l+m)!(l-m)!]1/2.---(13)]]>由于我们已经选取了θd=0的几何(图1b),方程(12)中仅仅m’=0的项是非零的,这种情况下方程(10)变为Σiqiϵ1|r→-ri→|=Σl=0mΣm=-lllϵ1(4π2l+1)1/2]]>×Ql,m′*Σl′=0∞Kl′,0,l,mdl′]]>×(4π2l′+2l+1)1/2Yl′+l,m(θ,φ)rl′+l+1,---(14)]]>其中多极分布围绕点 进行,但是电位表达为围绕大球中心的球谐函数的总和。上面的方程也可以被写作,Σiqiϵ1|r→-ri→|=Σl=0∞Σm=-1l1ϵ1(4π2l+1)1/2Yl,m(θ,φ)rl+1]]>×Σl′=|m|Kl-l′,0,l′,mdl-l′(4π2l′+1)1/2Ql′,m′*,---(15)]]>其中具有相同的Yl,m(θ,φ)的项可以被集中在一起,与方程(14)相反,其中具有相同的Ql,m′*的被集中。
在将方程(15)代入方程(7)并且匹配r=R的边界条件,
Vin|r=R=Vout|r=R, (16)∈1∂Vin∂r|r=R=∈2∂Vout∂r|r=R,---(17)]]>我们获得球内的水合作用(反应场)电位,Vhyd(r→)=Σl=0∞Σm=-llAl,mylYl,m(θ,φ)---(18)]]>=Σl=0∞Σm=-ll(4π2l+1)1/2rlYl,m(θ,φ)]]>×(ClR2l+1)Σl′=|m|lKl-l′,0,l′,mdl-l′]]>×(4π2l′+1)1/2Ql′,m′*,---(19)]]>其中Cl=(∈1-∈2)∈1[∈2+l∈1/(l+1)].---(20)]]>我们现在可以写出不同的V′s,明确它们对Ql,m′*的依赖性。V′coul,Lbound通过方程(10)给定,Vhyd,Lbound通过方程(19)给定但是重新改写以使具有相同的Ql,m′*的项被集中,Vhyd,Lunbound通过R=a和d=0时的方程(19)给定,Vcoul,L′bound(r′→)=Σl=0∞Σm=-ll4π2l+1Ql,m′*Yl,m(θ′,φ′)∈1r′l+1,---(21)]]>Vhyd,Lbound(r→)=Σl=0∞Σm=-llΣl′=l∞(42l+1)1/2(4π2l′+1)1/2]]>×Ql,m′*Kl′-l,0,l,mdl′-l(Cl′R2l′+1)rl′Yl′,m(θ,φ)---(22)]]>Vhyd,Lunbound(r→)=Σl=0∞Σm=-ll4π2l+1(Clα2l+1)Ql,m′*rlYl,m(θ,φ).---(23)]]>代入方程(4),我们更加清楚ΔGint,L-R对Ql,m′*的依赖,
ΔGint,L-R=Σj∈Rqj[V′coul,Lbound(rj′→)+Vhyd,Lbound(rj→)]---(24)]]>=Σl=0∞Σm=-1lQl,m′*Σj∈Rqj[(4π2l+1)Yl,m(θj′,φj′)∈1r′jl+1]]>+Σl′=1∞(4π2l+1)1/2(4π2l′+1)1/2]]>×Kl′-1,0,l,mdl′-1(Cl′R2l′+1)rjl′Yl′,m(θj,φj)]---(25)]]>≡Σl=0∞Σm=-1lαl,mQl,m′*,---(26)]]>其中在最后一行我们已经定义了组分αl,m,其独立于Ql,m′*,作为方程(25)中的乘以Ql,m′*的因子。每个αl,m表达多极对ΔGint,L-R的贡献并且包含获得ΔGvar所需的关于受体电荷分布的所有信息。
对于ΔGhyd,L,根据Ql,m′*重新表达方程(5)是有用的,多极描述了配体电荷分布而不是个体电荷,qi。我们围绕着多极扩展的中心 展开 Σi∈LqiV(ri→)=Σi∈LqiV(d→+ri′→)---(27)]]>=Σi∈Lqi[V(d→)+ri′→·▿→V(d→)+···].---(28)]]>已经由Rose表明在球体坐标中扩展变为5, 其中 并且 是通过用 替代 获得的算子。对于正的m并且当 根据拉普拉斯方程的解(即rlYl,m(θ,φ)或Yl,m(θ,φ)/rl+1)进行处理,显示出5, ×▿1m▿0l-mform≥0.---(31)]]>双因子被定义为
(2l+1)!!=(2l+1)·(2l-1)·(2l-3)···3·1---(32)]]>=(2l+1)!2ll!---(33)]]>并且球形部分衍生物为▿1=-12(▿x+i▿y),▿-1=12(▿x-i▿y),---(34)]]>▿0=▿z.]]>为了计算负数m的 我们应用Yl,-m(θ,φ)=(-1)mYl,m*(θ,φ)]]>的事实以及方程(34)中球形部分衍生物的定义从而获得 ×▿-1m▿0l-mform≥0.---(35)]]>结合配体的水合作用能随后为Ghyd,Lbound=12Σi∈LqiVhyd,Lbound(d→+ri′→)]]>=12Σl′=0∞Σm′=-l′l′4π(2l′+1)!!]]> =12Σl′=0∞Σm′=-l′l′4π(2l′+1)!!Ql′,m′′*]]>×Σl=0∞Σm=-1lΣl′′=1∞(4π2l+1)1/2(4π2l′′+1)1/2]]>×Q′l,m*Kl′′-1,0,l,mdl′′-1(Cl′′R2l′′+1)]]> 为了估算方程(37)中的 我们使用方程(31)和梯度公式6▿→(Φ(r)Yl,m(θ,φ))]]>=-(l+12l+1)1/2(dΦ(r)dr-lrΦ(r))Tl,l+1,m(θ,φ)]]>+(l2l+1)1/2(dΦ(r)dr+l+1rΦ(r))Tl,l-l,m(θ,φ),---(38)]]>
其中 ×Yl′,m-m′(θ,φ)ξ^m′,---(39)]]> 为经常在角动量的研究中遇到的向量加法(或Clebsch-Gordon)系数,在表I中显示6, 为球形单位向量,ξ^1=-12(x^+iy^),ξ^-1=12(x^-iy^),ξ^0=z^.---(40)]]>直接显示▿→=x^▿x+y^▿y+z^▿z=-ξ^1▿-1-ξ^-1▿1+ξ^0▿0.---(41)]]>从方程(38)至(41),我们有▿μ(rlYl,m(θ,φ))]]>=(-1)μ[l(2l+1)]1/2]]> 应用表I、方程(31)和方程(37)至(42),我们获得下面的中间结果 aFrom Reference 6.
▿0l′-m′(rl′′Yl′′,m)=[(2l′′+1)(l′′+m)!(l′′-m)!(2l′′-2l′+2m′-1)(l′′-m-l′+m′)!(l′′+m-l′+m′)!]1/2rl′′-l′+m′Yl′′-l′+m′,m,---(43)]]>▿1m′(rl′′-l′+m′Yl′′-l′-m′,m)=(-1)m′[(2l′′+2l′+2m′+1)(l′′-m-l′+m′)!2m′(2l′′-2l′+1)(l′′-m-l′-m′)!]1/2rl′′-l′Yl′′-l′+m+m′,---(44)]]>▿-1m′(rl′′+l′+m′Yl′′-l′+m′,m)=(-1)m′[(2l′′-2l′+2m′+1)(l′′+m-l′+m′)!2m′(2l′′-2l′+1)(l′′+m-l′+m′)!]1/2rl′′-l′Yl′′-l′,m-m′,---(45)]]>并且在结合状态下配体的水合作用能的最终表达式,Ghyd,Lbound=12Σi∈LqiVbyd,Lbound(r1→)=12Σl=0xΣm=-llΣl′=0∞Ql,m′*Ql′,m′Σl′′=max(l,l′)∞(4π2l+1)1/2(4π2l′+1)1/2]]>×Cl′′R2l′′+1(l′′+m)!(l′′-m)!(l′′-1)!(l′′-l′)![1(l+m)!(l-m)!(l′-m)(l′-m)]1/2d2l′′-l-l′---(46)]]>≡Σl=0∞Σm=-1lΣl′=0∞Σm′=-l′l′βl,m,l′,m′Ql,m′*Ql′,m′′,---(47)]]>其中,βl,m,l′,m′由上面两个方程定义;注意m′≠m时βl,m,l′,m′为零。我们通过在方程(46)中设定d=0和R=a获得未结合配体的水合作用能,Ghyd,Lunbound=12Σi∈LqiVhyd,Lunbound(ri→)]]>=12Σl=0∞Σm=-ll4π2l+1(Cla2l+1)Ql,m′*Ql,m′---(48)]]>=Σl=0∞Σm=-llγl,mQl,m′*Ql,m′,---(49)]]>其中γl,m通过方程(48)和(49)定义。为了符号表示方便,我们将γl,m写作为l和m的函数,尽管并不与m形式相关。
因此ΔGvar已经被表示为配体电荷分布的多极,Ql,m′(围绕配体球的中心扩展)和不依赖于Ql,m′的组分αl,m,βl,m,l′,m′以及γl,m的函数。结合方程(26)、(47)和(49)可得ΔGvar=Σl=0∞Σm=-llαl,mQl,m′*]]>+Σl=0∞Σm=-llΣl′=0∞Σm′=-l′l′βl,m,l′,m′Ql,m′*Ql′,m′′]]>-Σl=0∞Σm=-llγl,mQl,m′*Ql,m′.---(50)]]>注意仅仅αl,m依赖于受体电荷,而βl,m,l′,m′和γl,m仅仅依赖于结合和未结合状态的几何。虽然ΔGvaropt为实数量,αl,m和Ql,m′为复数且积αl,mQl,m′*和Ql,m′*Ql′,m′包括形式Yl′,m*(θ′,φ′)Yl,m(θ,φ)的项的总和;注意βl,m,l′m′和γl,m为实数。我们根据αl,m和Ql,m′的实数和虚数部分重新改写ΔGvaropt,ΔGvar=Σl=0∞[αl,0Ql,0′+2Σm=1l(Reαl,mReQl,m′]]>+Imαl,mImQl,m′)+Σl=0∞Σl′=0∞[βl,0,l′,0Ql,0′Ql′,0′]]>+2Σm=1lβl,m,l′,m(ReQl,m′ReQl′,m′]]>+ImQl,m′ImQl′,m′)]]]>-Σl=0∞[γl,0Ql,0′2+2Σm=1lγl,m(ReQl,m′2+ImQl,m′2)]---(51)]]>(其中m的总和不包含l=0)又注意Yl,-m(θ,φ)=(-1)mYl,m*(θ,φ)]]>以及
Yl′,m*(θ′,φ′)Yl,m(θ,φ)+Yl′,-m*(θ′,φ′)Yl,-m(θ,φ)]]>=Yl′,m*(θ′,φ′)Yl,m(θ,φ)+Yl′,m(θ′,φ′)Yl,m*(θ,φ)---(52)]]>=2[ReYl′,m(θ′,φ′)·ReYl,m(θ,φ)+ImYl′,m(θ′,φ′)]]>·ImYl,m(θ,φ)].---(53)]]>新的变量ReQl,m′和ImQl,m′被改变符号和如下重新命名Ql{Q0,0′,Q1,0′,ReQ1,1′,ImQ1,1′,Q2,0′,ReQ2,1′,ImQ2,1′,ReQ2,2′,…}{Q1,Q2,Q3,Q4,Q5,Q6,Q7,Q8,…}, (54)并且相似的转换用于创造αi,βij,和γi。方程(51)可以被写作ΔGvar=Σi=1∞αiQi+Σi=1∞Σj=1∞βijQiQj-Σi=1∞γiQ12---(55)]]>=Σi=1∞αiQi+Σi=1∞Σj=1∞(βij-δijγi)QiQj,---(56)]]>或者用矩阵符号表示,ΔGvar=Q→TB↔Q→+Q→TA→---(57)]]>=(Q→+12B↔-1A→)TB↔(Q→+12B↔-1A→)-14A→TB↔-1A,→---(58)]]>其中 是由Qi形成的向量, 是由αi形成的向量, 是由(βij-δijγi)形成的对称矩阵,并且平方的完成已经被应用以得到方程(58)。由于方程(57)中的 对应于配体去溶剂化代价,其对于化学合理几何必须大于零,矩阵 是正定的并且ΔGvar的极值为最小值7。从方程(58)中可获得多极的最优值, 和最小变化结合能,ΔGvaropt;,Q→opt=-12B↔-1A→,---(59)]]>ΔGvaropt=-14A→TB↔-1A→,---(60)]]>由于 也是正定的所以ΔGvaropt总是负的。
为了用拟合的单极(全部电荷)(Q1=Q)求解最优多极分布,剩余的最优多极(i≠1)的方程为2Σj≠1(βij-δijγi)Qjopt+(2βijQ+αi)=0,---(61)]]>其与方程(59)相类似。
具有在lmax=(lmax+1)2舍去的维数的上述矩阵方程,能够通过相对适当的计算资源被数字地求解。在实践中,由于αi和βij包含无数项的总和,第二界限值lout必须被使用以舍去方程(25)和(46)中最内总和。当lmax和lout足够大,ΔGvaropt收敛并且包括更多的多极的增加的优点基本消去。
对任意给定的受体和几何,我们已经如此描述了测定作为一组多极紧密结合配体的电荷分布的方法。任意测试配体的优化中的结合自由能的误差可以通过从方程(58)中减去方程(60)并且使用方程(59)以消除 来计算,ΔGvar-ΔGvaropt=(Q→-Q→opt)TB↔(Q→-Q→opt).---(62)]]>III.结果A.执行描述的算法在计算机程序中被执行,该计算机程序输入为lmax(其确定方程(59)和(61)中的矩阵的大小),lout(其被用于舍去方程(25)和(46)中的最内总和),问题的几何,以及优化的单极是否是任意的或者固定为一些值的。问题的几何包括半径和结合状态和配体球的中心的坐标(在z轴上)以及系统中的每个部分原子电荷的坐标和大小。分别选择介电常数∈1和∈2为4和80。在用LU分解求出矩阵方程(方程(59)或(61))的解之后,执行α′i,βij,和γi的估算。获得 矩阵的特征值以证明驻点是最小的。所有实数浮点值用64比特表示。矩阵代数用由Press等8给定的适当的子程序的增加精确度的版本完成。程序的输出包括优化电荷分布的多极,ΔGvaropt,驻点的原始值(nature),以及记录αi,βij,和γi的文件。对lmax=lcut=40的受体的典型的CPU用法是在具有PA-7200(99MHz)芯片的Hewlett-Packard 9000/735上进行20分钟,并且使用的最大内存为大约22MB。由于我们已经使用了直接的方法(即,LU分解)来求解矩阵方程,其中矩阵的大小为(lmax+1)2×(lmax+1)2,时间等级为(lmax)6并且存储等级为(lmax)4。在这个点上没有尝试优化编码。例如,矩阵方程包含特殊的可能被用于减少必要的计算工作的稀疏矩阵(由于对该问题选择方位角几何)。优化问题还可以用迭代方法解决,诸如共轭梯度法或者不同的张弛方法。
B.测试问题第一个测试问题由带有四个平行双极基团的受体组成,每个在z=15.50平面含有-0.55e的负电荷以及在z=14.25平面含有+0.55e的正电荷。所有的长度和距离用单位埃(1=0.1nm)给定。电荷的(x,y)坐标为(+1.5,+1.5),(-1.5,+1.5),(-1.5,-1.5),以及(+1.5,-1.5)。结合状态低介电区域被在原点作为中心的半径24.0的球体结合,配体球为半径4.0并且在结合状态中被设定中心在(x,y,z)=(0.0,0.0,20.0)。
第二个测试问题由理想的作为受体的α-螺旋组成。螺旋由分别在N-和C-端具有乙酰基和N-甲基酰胺保护基团的18个丙氨酸残基构成。坐标在用CHARMM PAR9(Ref.9)键长度和角度以及φ=-57°和ψ=-47°表示的极性-氢表示法中生成。部分原子电荷从PARSE参数被改写1。螺旋的轴符合坐标系统的z-轴并且Ala 10的氮原子最接近原点。结合状态低介电区域被原点作为中心的半径24.0的球体结合,配体球为半径4.0并且在结合状态中被设定中心在(x,y,z)=(0.0,0.0,20.0)(接近聚丙氨酸α螺旋的C末端)。
C.结果分析每个测试问题用lmax的不同的值(用固定在40的lout作为这里显示的结果,尽管当值增加至80时获得基本上不能辨别的结果)和或者任意或者固定在0或+le的变量分布的单极多次求解。图2显示了作为所用lmax′的值的函数的计算的ΔGvaropt的收敛(部分a是四极基团问题而部分b是α-螺旋)。在所有情况下,计算的ΔGvaropt仅仅对于增加的lmax而降低,而对lmax的任意值,具有任意的单极值比固定单极值时的ΔGvaropt低(更有利),如变量的优化所期待的。对所有两个测试问题,对浮动的或者固定的单极,超过20的lmax时的ΔGvaropt值似乎变化的非常小。图3显示了作为lmax(含任意单极值)的函数的最优分布的低多极距的量。2l-极的值如|Q→l|≡(4π/(2l+1))Σm(Ql,m/al)2]]>定义,其中a为配体半径。首个六个多极的值通过为10的lmax收敛。图4显示了计算的最优配体导致的库仑电位,仍作为lmax的函数;电位显示几乎收敛在为20的lmax处。优化配体的收敛的库仑电位绘制于恰好在配体之外(在z=16.0)的xy-平面中并且用为40的lmax计算,显示在对四极基团问题的图5a中和对α-螺旋的图5c中。优化配体的电位包含适当的四折叠对称以与四双极基团受体相匹配,显示这样的配体将与所有四个双极同样相互反应。然而,对α-螺旋(其表示在z-方向后退的一圈双极基团)显示出用这种方式计算的优化的配体将仅仅与最接近的双极基团强烈反应。还非常有趣的是注意到由于以这种方式计算的优化的多极分布的库仑电位不是绝缘的受体的库仑电位的简单反应。例如,比较优化的配体(图5a)导致的和四双极基团问题的受体(图5b)导致的库仑电位,两者都在z=16.0平面中计算。配体电位中的峰值位于受体电位的“内部”。这可能是基本不对称的静电优化的结合反应的一般特征,由于当其它是优化的时候一个分布是固定的。
图2ΔGvaropt的收敛作为用于计算中的值lmax的函数。自始至终使用常量值lmax=40。对于(a)四个双极基团和(b)α螺旋,配体总电荷为任意值的优化被绘制为(□),固定为0的用(×)表示,固定为1的用(◇)表示。
图3.当值lmax的函数用于对(a)四个双极基团和(b)α螺旋的计算时最优配体的最低七个2l-极的值的收敛。优化的运行没有对总配体电荷的限制。在(a)中注意1=4和1=5的线在彼此顶点相互接近。
IV.讨论和结论泊松方程的分析结果已经被用于定义产生结合球形配体至不变化受体以形成球形复合物的自由能的最小值的配体的多极分布。算法已经被发展和执行,使用数字计算法以评估分析理论,并且结果已经在两个测试情况中显示。迄今为止验证的所有结果中,二级导数分析已经被证明驻点是最小的。在这种意义上,多极分布被说明是优化的。该理论的一个重要特征是,通过表示优化为多极分布,可以直接求解,而不采取随机的搜索或者优化的其它非确定方法。给定球状配体形状和结合几何的优化电荷分布的多极性质的这个特征可以用于理解分子结合和识别中的互补反应。这样的性质可以证明特别适用于配体设计领域,其或者通过促进构建个体紧密结合配体或者通过提供用于搜索化合物库或帮助设计组合库的描述符。
图4.对(a)四极基团和(b)α-螺旋优化配体导致的库仑电位的收敛,沿线(y=-1.1,z=16.0)在lmax的值的范围内绘制。优化通过不对全部配体电荷约束进行。注意lmax=20和40的曲线几乎是相同的。
观察到优化可以再这里呈现的连续模型种定义以提供配体和受体之间相对于超过不利的配体去溶剂化能量的最大超额的有利相互反应,这表明紧密结合配体的成功的设计可以包括基本上不仅仅是提供在受体结合位点对极性和电荷基团的补充相互反应的互补形状分子的构建。例如,受体中中性的、极性的羟基与中性的、极性的羰基基团的静电互补基本上不同于将其与带正电荷铵基团的互补。此外,由于远距离的静电反应的作用,仅仅按照基团的单独互补对讨论问题可能是不合适的,因为每个基团影响配体的整体多极距(moment)。为了帮助回答这些问题,我们目前研究算法以设计点电荷组以及分子,其具有最相当于这种算法定义的优值的多极距。
图5.对于(a)四个双极基团的最优配体,(b)四个双极基团本身,(c)α螺旋的最优配体,(d)α螺旋本身,在z=16.0平面中的库仑电位的轮廓图。优化的进行没有对总配体电荷的限制。每个图由相同间隔的外形水平组成。每个标记表示最近的外形水平,并对三个小数位是有效的(即在(a)中0.32为0.320,在(b)中-0.8为0.800),除了(d)中的-1.1,其为-1.090但是在图中为了清楚被四舍五入了。
最优多极分布和结合能量的性质对进一步研究很有价值。这里我们注意到ΔGvaropt永远是负的(有利的),但是全部结合自由能ΔGbinding由于受体去溶剂化能量可能是正的或者可能不是正的(不利的)11。此外,证明筛选的配体-受体相互反应自由能的值是在最优值时的配体去溶剂化能量的二倍(ΔGint,L-Ropt=-2ΔGhyd,Lopt,soΔGvaropt=-ΔGhyd,Lopt=12ΔGInt,L-Ropt)]]>是简单异懂的,并且相同的关系控制每个多极组分,Qiopt,的贡献12。最后,优化的电荷分布的库仑电位和受体的库仑电位之间的关系显示出反映如何在与配体去溶剂化相关的结合状态中最好地达到有利反应的微妙的重要特征。对于涉及四双极基团的例子,这显示了补偿每个双极的化学基团应当比相应的受体双极更接近方位角轴。
目前的理论为进一步的研究提供有用的起点。我们目前正在研究延伸(extension)以解线性和非线性泊松方程,其将允许包括水溶性介质的离子强度作用。此外,放松未结合配体和具有球状几何学的结合复合物的限制是可能的,使得配体的电荷分布在结合状态和未结合状态是一样的,而且在固定的质子化状态处理可滴定的基团。应当注意在目前理论中对未结合受体的形状或电荷分布的没有限制,因为它的贡献是在ΔGvar的定义中已被除去的常量。
致谢作者感谢Moungi G.Bawendi,Christopher C.Cummins,Rick L.Danheiser,Robert W.Field,Cristina Jarque,Erik Kangas,Whay C.Lee,Stephen J.Lippard,Irwin Oppenheim,Carl O.Pabo,Robert J.Silbey,并且特别地感谢Sara E.Dempster的帮助讨论。本工作由National Institutes of Health(GM47678)和MIT Science Partnership Fund支持。
1M.Perutz,Protein StructureNew Approaches to Disease and Therapy(Freeman,New York,1992).
2The charge distribution for the receptor need not be the same in the boundand unbound states.If they are different,this adds a constant to#Gbinding thatcan be dropped in defining ΔGvarin Eq.(3).
3J.D.Jackson,Classical Electrodynamics,2nd ed.(Wiley,New York,1975).
4L.Greengard,The Rapid Evaluationof Potential Fields in Particle Sys-tents(Massachusetts Institute of Technology,Cambridge,1988).
5M.E.Rose,J.Math.Phys.37,215(1958).
6M.E.Rose,Elementary Theory of Angular Momentlon(Wiley,New York,1957).
7G.Strang,Lttroduction to Applied Mathematics(Wellesley-Cambridge,Wellesley,1986).
8W.H.Press,B.P.Flannery,S.A.Teukolsky,and W.T.Vetterling,Numerical Recipes in C.The Art of Scientific Computing(CambridgeUniversity Press,Cambridge,1988).
9B.R.Brooks et al.,J.CompuL Chem.4,187(1983).
10D.Sitkoff,K.Sharp,and B.Honig,J.Phys.Chem.98,1978(1994).
11Z.S.Hendsch and B.Tidor(unpublished).
12S.E.Dempster,L.-P.Lee,and B.Tidor(unpublished).
13J.G.Kirkwood,J.Chem.Phys.2,351(1934).
权利要求
1.调节抗体的抗原结合亲和力的方法,包括确定抗体氨基酸的最佳电荷分布的空间表示法以及抗体当在溶剂中结合抗原时结合自由能的相关改变;识别抗体的至少一个候选氨基酸残基位置,当结合抗原时该残基位置将被修饰以改变抗体的结合自由能;并且为所述的氨基酸位置的取代挑选选定的氨基酸残基,从而使得取代后,抗体的抗原结合亲和力被调节。
2.权利要求1的方法,进一步包含在候选的氨基酸残基位置取代选定的氨基酸残基。
3.调节抗体的抗原结合亲和力的方法,包括,确定抗体氨基酸的最佳电荷分布的空间表示法以及抗体当在溶剂中结合抗原时结合自由能的相关改变;识别抗体的至少一个候选氨基酸残基位置,当结合抗原时该残基位置将被修饰以改变抗体的结合自由能;为所述氨基酸位置选择改变,从而使得由于该改变,抗体的抗原结合亲和力被调节。
4.权利要求3的方法,其中改变选自删除、插入,或侧链化学的改变。
5.权利要求1或3的方法,进一步包括计算与未修饰抗体结合至抗原相比,含有修饰的氨基酸或改变的抗体结合至抗原时结合自由能的改变。
6.权利要求5的方法,其中计算步骤首先包括在计算机中构建抗体的调节或改变的模型,并且随后计算结合自由能的改变。
7.权利要求6的方法,其中计算步骤使用至少一种测定,所述测定选自使用基于Poisson-Boltzmann方程的方法的静电结合能的测定,范德瓦耳斯结合能量的测定,或使用基于溶剂可及表面积的方法的结合能量的测定。
8.权利要求1或3的方法,进一步包括表达修饰的或改变的抗体。
9.权利要求1或3的方法,其中调节选自增加抗体/抗原结合亲和力或降低抗体/抗原结合亲和力。
10.权利要求1的方法,其中选定的氨基酸来自具有特定侧链化学的氨基酸子集,所述氨基酸子集选自不带电荷的极性氨基酸残基,非极性氨基酸残基,带正电荷的氨基酸残基,或带负电荷的氨基酸残基。
11.权利要求1的方法,其中选定的氨基酸残基增加当在溶剂中结合时抗体和抗原之间的结合自由能,因此降低抗体-抗原结合亲和力。
12.权利要求1的方法,其中选定的氨基酸残基降低当在溶剂中结合时抗体和抗原之间的结合自由能,因此增加抗体-抗原结合亲和力。
13.调节抗体的抗原结合亲和力的方法,包括,确定抗体氨基酸的最佳电荷分布的空间表示法以及当抗体在溶剂中结合抗原时结合自由能的相关改变;识别抗体的至少一个候选氨基酸残基位置,当结合抗原时该残基位置将被修饰以改变抗体的结合自由能;并且为所述的氨基酸位置的取代挑选选定的氨基酸残基,在计算机中构建用于取代的选定的氨基酸残基的模型,计算当结合至抗原时修饰的抗体结合自由能的改变;并且在候选的氨基酸残基位置取代选定的氨基酸残基使得抗体的抗原结合亲和力被调节。
14.权利要求13的方法,其中计算步骤使用至少一种测定,所述测定选自使用基于Poisson-Boltzmann方程的方法的静电结合能的测定、范德瓦耳斯结合能量的测定,以及使用基于溶剂可及表面积的方法的结合能量的测定。
15.权利要求13的方法,进一步包括表达修饰的抗体。
16.权利要求1、3或13中任一的方法,其中在方法中被重复至少一次。
17.权利要求1或3的任一的方法,其中在方法中在计算机中构建。
18.权利要求1、3或13中的任一的方法,其中至少一个步骤由三维结构数据提供信息。
19.权利要求1、3或13中的任一的方法,其中至少一个步骤由以下数据获得信息,所述数据选自源自溶剂中经表达的抗体与抗原结合的结合数据、抗体的晶体结构数据、结合至抗原的抗体的晶体结构数据、抗体的三维结构数据、抗体的NMR结构数据,或抗体的计算机模拟的结构数据。
20.权利要求8或15的任一的方法,其中表达修饰抗体在表达系统中进行,所述表达系统选自无细胞提取表达系统、噬菌体展示表达系统、原核细胞表达系统或真核细胞表达系统。
21.权利要求1的方法,其中抗体或其抗原结合片段在CDR区域的一个或多个位置被修饰,所述CDR区域选自VHCDR1,VHCDR2,VHCDR3,VLCDR1,VLCDR2,或VLCDR3。
22.权利要求1的方法,其中抗体或其抗原结合片段选自抗体、抗体轻链(VL)、抗体重链(VH)、单链抗体(scFv)、F(ab’)2片段、Fab片段、Fd片段,或单一结构域片段。
23.权利要求1的方法,其中抗体的抗原结合亲和力被预测以约1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9,2,3,5,8,10,50,102,103,104,105,或106,107,或108的因子增加。
24.权利要求1的方法,其中抗体的抗原结合亲和力被预测以约1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9,2,3,5,8,10,50,102,103,104,105,或106,107,或108的因子降低。
25.权利要求1的方法,其中在含有盐的水溶剂的存在下测定抗原结合亲和力。
26.权利要求25的方法,其中溶剂包含生理学浓度的盐。
27.一种抗体或其抗原结合片段,其通过权利要求1、3或13任一的方法制备。
28.一种抗体或其抗原结合片段,其根据权利要求1、3或13中任一的方法亲和力成熟。
29.众多抗体或其抗原结合片段,其通过权利要求1、3或13任一的方法制备。
30.编码权利要求27的抗体或其抗原结合片段的核酸。
31.编码权利要求30的核酸的宿主细胞。
32.一种抗体或其抗原结合片段,其通过在表达所述抗体或其结合片段的条件下培养权利要求31的宿主细胞制备。
33.含有权利要求27的抗体或其抗原结合片段的药物组合物。
34.治疗或预防人类病症或疾病的方法,包含,给予治疗有效量的权利要求33的药物组合物,以实现对人类病症或疾病的所述治疗或预防。
35.权利要求1、3或13任一的方法,其中一个或多个步骤是计算机辅助的。
36.适合用于电子装置的介质,所述装置具有实施权利要求1、3或13任一的方法的一个或多个步骤的指令。
37.实施权利要求1、3或13任一的方法的一个或多个步骤的装置。
全文摘要
本发明涉及通过使用对应溶剂中的抗体和抗原之间的复合物结构的数据测定最小化溶剂中的抗体和抗原间结合自由能的静电作用的抗体CDRs的电荷分布的表示法以调节抗体的抗原结合亲和力的方法。通过这些测定的引导,抗体被相应修饰(改变)以通过修饰至少一个氨基酸残基改良例如,抗体/抗原的结合以降低当在溶剂中结合时抗体和抗原之间的结合自由能。
文档编号G06F19/16GK1894695SQ200480028040
公开日2007年1月10日 申请日期2004年7月26日 优先权日2003年7月26日
发明者赫尔曼·范维里杰曼, 布赖恩·W·H·谢曼, 亚历克西·A·卢戈夫斯科伊 申请人:比奥根艾迪克Ma公司, 马萨诸塞州技术研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1