诱变过程中的“比例调节”的制作方法

文档序号:449025阅读:309来源:国知局
专利名称:诱变过程中的“比例调节”的制作方法
相关申请本专利申请拥有60/373,686号美国临时专利的权益,60/373,656号临时专利申请于2002年4月17日提交,该专利申请的全文在此通过引证被并入本文。
背景技术
在研究蛋白质的结构及功能过程中,诱发突变是一项强有力的工具。在克隆基因的核苷酸序列上可以引发突变,编码所感兴趣的蛋白质,被修饰后的基因可产生蛋白质的突变异种。通过对原型蛋白质的特性和所产生的突变异种的特性进行比较,通常可以识别出氨基酸个体或氨基酸域,而这些氨基酸个体或氨基酸域对于蛋白质结构完整性和/或蛋白质的生化功能而言是必需的;比如对蛋白质的结合和/或催化活性功能而言,这些氨基酸个体或氨基酸域是必需的。然而,单一蛋白质所生成的突变异种数量致使研究人员很难选择出能够提供有用信息或具有所需特性的突变异种,既便所选择的突变完全发生在蛋白质的特异区域,这种选择也是很困难的,其中的特异区域被假定为重要区域(既蛋白蛋的活性点区域或活性点附近的区域)。举例而言,替换、删除蛋白质中某一特定氨基酸或在蛋白质中插入某一特定的氨基酸会对蛋白质的局部或整体产生影响。目前仍然需要一种对蛋白质的诱变效果进行系统分析评价的方法。
发明概述本发明与引入式核酸诱变的方法有关,其中的核酸对研究所感兴趣的多肽进行编码。在这些方法中,原型多肽中的一个或多个所感兴趣的氨基酸目标区域被选定,具有代表性的目标区域例如包括多肽的功能区,比如抗体的超变区域。对于每个目标区域而言,研究人员要选定一个或多个预定的氨基酸,这些预定的氨基酸将取代原型氨基酸而进入到目标区域中。一组低核苷酸混合物被合成,其中低核苷酸含有每个目标区域的核苷酸序列;并在目标区域的每一序列位置上或含有合成多肽原型氨基酸所需的核苷酸(原型核苷酸),或含有合成预定氨基酸所需的核苷酸(预定核苷酸)。在合成过程中,使用到了“比例调节”手段,“比例调节”意思是指在合成过程中原型核苷酸与进入到低核苷酸中预定核苷酸的比例大于1∶1;优选的比例为4∶1或大于4∶1;更合适的比例为7∶1或大于7∶1,更为适合的比例甚至可为9∶1或大于9∶1。在本发明的某一实施方案中,原核苷酸与预定核苷酸的比例通过二项式分布加以确定,该二项式分布考虑到了目标区域的长度以及核苷酸合成的成功度;其中合成产生的核苷酸构成了预定氨基酸的编码。
本发明还与含有这些低核苷酸的核酸的表达库有关,同时本发明也与这些核酸库表达所生成的多肽库有关。
本发明中的方法可产生出突变的多肽,在该突变异种中,预定氨基酸只出现在每个发生突变多肽的一个或两上位置上,而目标区域的其余氨基酸则不发生变化或尽可能保持与原生型序列相同。采用这种方法,可以快速并系统地实现更精确、更具体的化学变化。
图示简介

图1是免疫球蛋白MCPC603的Fv区域示意图,其中诱变发生在该免疫球蛋白的三个CDR区域;这三个CDR区域为重链的CDR1(使用预定氨基酸Asp)、CDR2(使用预定氨基酸His)以及CDR3(使用预定氨基酸Ser)。
图2表明的是CDR1区域上“变性”低核苷酸的结构。
图3表明的是CDR2区域上“变性”低核苷酸的结构。
图4表明的是CDR3区域上“变性”低核苷酸的结构。
图5表明的是CDR1区域中引入式诱变所生成的位于目标区域上的氨基酸序列。
图6表明的是CDR2区域中引入式诱变所生成的位于目标区域上的氨基酸序列。
图7表明的是CDR3区域中引入式诱变所生成的位于目标区域上的氨基酸序列。
图8表明的是突变的分布情况,在引入式诱变过程中所使用的原型核酸/变异(非原型)核酸的比例为1∶1。
图9表明的是突变的分布情况,在引入式诱变过程中所使用的原型核酸/变异(非原型)核酸的比例为4∶1。
图10表明的是突变的分布情况,在引入式诱变过程中所使用的原型核酸/变异(非原型)核酸的比例为9∶1。
图11表明的是引入式突变过程所制备的一组多肽中目标区域的氨基酸序列,在引入式诱变过程中所使用的原型核酸/变异核酸比例为9∶1.
图12表明的是二项式分布情况,其中的成功概率P为0.2。
图13表明的是二项式分布情况,其中的成功概率P为0.1。
本发明的详细说明本发明与引入式诱变的方法相关,其中使用“比例调节”手段来改变多肽产品的浓度比值。在引入式诱变过程中,产生了各种多肽(突变的多肽)的编码核酸库,在这些多肽中,构成目标区域内氨基酸的密码子的原型核苷酸被非原型核苷酸所取代,从而生合成低核苷酸的混合物,其中的低核苷酸被用来产生可预测的密码子变化。核酸库的表达生成一组多肽,其中预先选定的氨基酸被引入到多肽目标区域的每一个位置上。为了生成所要求的多肽混合产物,“比例调节”手段可按特定的比例生成特定的低核苷酸混合物。
“引入式诱变过程”“引入式诱变过程”在5,830,650号美国专利及5,798,208号美国专利中有详细的说明,这两项专利文献在此通过引证被并入本文。引入式诱变过程同样适用于多种蛋白质和多肽,其中包括酶、免疫球蛋白、荷尔蒙、细胞浆液、整合蛋白以及其他蛋白质或多肽。为了便于说明,本文在此使用“多肽”一词。
选定多肽的一个或多个目标区域。目标区域可以是多肽的一个或多个活性区域,比如是酶的结合区或免疫球蛋白的超变环;或者整个多肽是目标区域。多肽中不受诱变影响的区域(既目标区域之外的区域)在本文中被称“恒定”区域。重要的是,多肽中几个不同的目标区域可以同时发生诱变。在每个目标中可引入相同或不同的预定氨基酸。这样可以对结构相关区域中氨基酸的取代结果进行评估,这些结构相关区域通过多肽的叠合形成了功能点,比如形成了酶的催化点或抗体的结合点。
在引入式诱变过程中,一组多肽被生成,其中一个单一的氨基酸在多肽目标区域的每个位置上至少被引入一次。诱变所产生的多肽(在本文中被称为“突变多肽”)与原来的多肽不同,不同之处在于突变多肽中有单独一个预定氨基酸插入到了多肽的一个或多个目标区域中,这一预定的氨基酸取代了位于原来多肽中同一位置的原型氨基酸。这组突变的多肽含有每个目标区域发生变异而生产的多肽,因此,对于目标区域的每个位置(既结合区域或CDR)而言,突变多肽混合物中的多肽既含有原来多肽中的氨基酸,也含有预定的氨基酸,并且,全部突变多肽的混合物含有所有可能的变异种类。突变多肽混合物还可含有既不含预定氨基酸,也不含原来氨基酸的多肽,正如下面将要讨论的,如果对预定氨基酸进行编码的密码子为了自身形成而需要改变一个以上的核苷酸时,某些多肽可含有某些由某一密码子所编码的氨基酸,该密码子在形成过程中所发生的变化少于生成预定氨基酸所需的所有变化。正如下面将要说明的,每种多肽在混合物中所占的比例取决于合成过程中可用核苷酸的浓度之比。
在引入式诱变中,预定的氨基酸被选择用于目标区域。如果多肽含有一个以上的目标区域,则每个目标区域可使用相同的预定氨基酸,也可以使用不同的预定氨基酸。预定的氨基酸可以是天然存在的氨基酸。20种天然存在的氨基酸只是在侧链上有所差别。各个侧链都氨基酸具有独特的性质(见G、E、Schulz和R、M、Schirner1998年著的《蛋白质结构原理》)。典型的极性侧链和中性侧链是Cys、Ser、Thr、Asn、Gln以及Tyr这些氨基酸的侧链。Gly氨基酸被认为是这组氨基酸的边缘成员。Ser和Thr氨基酸在氢键的形成中发挥着重要的作用。Thr在β碳原子上还有非对称性,因此只有一个空间异构体被使用。酰胺Gln和Asn也可形成氢键,氨基基团作用为氢供体,羰基基团作为氢受体。Gln比Asn多一个CH2基团,这使这一极性基团更加活跃,从而降低了该基团与主链的相互作用。Tyr具有一个极性很高的羟基基团(酚基OH),这一羟基基团在高PH值下可以离解。Tyr的行为多少像一个充有电荷的侧链,它的氢键是相当强的。
在蛋白质分子的表面以及内部可以发现中极性酸。作为内部的残基,这些中极性酸通常在相互间形成氢键或同多肽的主链形成氢键。Cyr可形成二硫化物桥键。组氨酸带有PK值为6.0的杂环芳烃侧链。在生理PH值范围内,基咪唑环在从溶液中取得一个氢离子后既可以发生变化,也可以保持不变。由于这两种状态都比较容易得到,所以组氨酸在催化化学反应方面非常有用,许多酶的活性中心中含有组氨酸。
Asp和Glu在生理PH值下带有负电。由于这两种氨基酸的侧链短,所以Asp的羰基基团对主链是相当刚性的,边也是在许多催化点上羰基基团是由Asp而不是由Glu提供的原因。在蛋白质的表面通常会发现带电的酸分子。
赖氨酸和精氨酸通常位于蛋白质的表面。这两种氨基酸具有长而柔性的侧链。由于这两种氨基酸在其周围的溶液中会产生摆动,所以这两种氨基酸提高了蛋白质球体的溶解度。在几种情况下,赖氨酸和精氨酸参与内部盐桥的形成过程,或者有助于催化作用。由于这两种氨基酸位于蛋白质的表面,赖氨酸通常是酶攻击的残基;酶或者改变赖氨酸的侧链,或者截去位于赖氨酸残基羰基端的肽链。
在优选实施方案中,预定的氨基酸是以下氨基酸之一色氨酸、苏氨酸、Asn、甘氨酸、酪氨酸、胱胺酸、组氨酸、谷氨酸、天冬氨酸、赖氨酸和精氨酸。然而,预定氨基酸也可从20种天然存在的氨基酸中选出。
在引入式诱变过程中,会生成低核苷酸(如cDNA)的混合物。低核苷酸对多肽的整体或部分(目标区域)进行编码。然后,使用该低核苷酸可以制备突变的多肽。在本发明某一实施方案中,对非诱变目标区域进行编码的核苷酸序列与对发生引入式诱变的多肽区域进行编码的核苷酸序列结合在一起可以生成对突变多肽进行编码的核酸。举例而言,在本发明的某一实施方案中,对恒定区域进行编码的核苷酸序列与对目标区域进行编码的核苷酸序列结合在一起可以制备出对突变多肽进行编码的核酸。另外,对目标区域进行编码的核苷酸序列(即对预定氨基酸进行编码的核苷酸插入其中的低核苷酸)可单独插入到对原有多肽进行编码的核酸中,这些插入的核苷酸序列取代了对目标区域的氨基酸序列进行编码的核酸序列。如果需要,对目标区域进行编码的核苷酸序列可含有限制性酶的侧翼识别部位(见4,888,286号美国专利),或者可以采用天然存在的限制性酶识别部位,然后通过克隆低核苷酸将它们引入到使用限制性酶部位的相应位置上。
举例而言,可以制备出低核苷酸的混合物,其中每种低核苷酸或者含有对原肽原有目标区域(或原肽目标区域某一部分)进行编码的核苷酸,或者含有一个或多个核苷酸形成密码子,且该密码子对取代目标区域中一个或多个天然氨基酸的预定氨基酸进行编码。在单一合成过程中,通过在低核苷酸内每一位置上或引入合成原型肽的原有氨基酸所需的核苷酸(在本文中被称为“原型核苷酸”),或引入预定氨基酸的密码子所需的适合单一核苷酸(预定核苷酸)可生产出低核苷酸的混合物。低核苷酸混合物的合成可在自动化的DNA合成器中进行,为了使所产生低核苷酸混合物不仅含有对原多肽中目标区域进行编码的低核苷酸,而且含有对变异多肽进行编码的低核苷酸物,DNA合成器或者产生原型核苷酸,或者产生预定的核苷酸,或者产生这两种核苷酸的混合物。
举例而言,可使用总共10个试剂容器来合成引入式诱变过程的任何一种低核苷酸混合物。其中4个容器含有单个的碱基,其余6个容器含有4种碱基中所有可能的两种碱基的混合物。例如,DNA合成可设计成含有下列10个反应室表1自动化DNA合成的合成子
在这种情况下,任何一个序列位置上的任何一种核苷酸都可以被两种核苷酸中的一种所取代。另外,如果有可能在低核苷酸合成器的管线中将各碱基进行混合,则可使合成器从两个或多个纯碱基储罐中抽取碱基,从而生成所需比例的核苷酸。
引入式诱变过程的“比例调节”在前面所述的引入式诱变过程方法中(5,830,650及5,798,208号美国专利),在反应过程中所使用到的两种核苷酸(既原型核苷酸和非原型(预定的)核苷酸)的浓度近似相等,这样这两种核苷酸进入到目标位置的机会是相等的。假定原型核苷酸与非原型核苷酸的比例为50∶50,如果将原型密码子变异到对预定氨基酸进行编码的密码子只需改变一种核苷酸碱基,则变异所生成的核苷酸序列中有50%含有对预定氨基酸进行编码的密码子,有50%含有对原型氨基酸进行编码的密码子。同样,如果生成对预定氨基酸进行编码的密码子这一过程需要改变2种核苷酸碱基,则所生成的核苷酸序列中有25%含有对原型核苷酸进行编码的密码子,另有25%含有对预定核苷酸进行编码的密码子,其余50%(2×25%)含有通过组合核苷酸方式对其他氨基酸进行编码的密码子。
在本发明中,合成过程所用的两种核苷酸的浓度比例可被改变,这样可以提高一种核苷酸或另一种核苷酸进入到低核苷酸中的机率。这一浓度比大于1∶1。具有代表性有浓度比包括大于1∶1的比例;等于或大于4∶1的比例;等于或大于7∶1的比例;等于或大于9∶1的比例。“可用的”核苷酸是指在合成过程中存在并在低核苷酸合成时能结合到低核苷酸中的核苷酸;举例而言,在低核苷酸合成过程中,从自动化低核苷酸合成器中抽取的核苷酸就是“可用的”核苷酸。可用的原型核苷酸与可用的变异核苷酸之比被确定,从而使核苷酸50%以上及100%以下的组成部分为原型核苷酸。在优选情况下,所确定的比例可使原型核苷酸的百分率等于或大于60%,更优选的情况是原型核苷酸的百分率等于或大天70%,甚至等于或大于80%。在特别优选的实施方案中,所确定的比例可使原型核苷酸的百分率等于或大于90%;或者等于或大于95%;或者等于99%。举例而言,原型核苷酸与变异核苷酸比例为9∶1时(即90%为原型核苷酸),所生成的低核苷酸库中每个目标区域基本上没有、或者只有一个或两个目标氨基酸被取代。在某一实施方案中,这一比例是采用二项式分布加以确定的,这其中考虑到了目标区域的长度以及核苷酸结合到合成产物中所需的成功度;所生成的核苷酸对预定氨基酸进行编码。有关比例的确定,下面将结合“比例调节”的数学分析进行说明。
比例调节的数学分析对于采用引入式诱变过程进行变异的且长度为N的原型多肽而言,从随机的观点看,多肽的突变(将整个多肽视为目标区域)可被看作为一组独立的诱变事件,每个氨基酸位置上的变异都是一个事件。现在假定每个位置有两种可能的结果“成功”和“不成功”;“成功”表示预定的氨基酸被引入到了一个位置上;“不成功”表示原型氨基酸仍然保持在该位置;或另一种(不希望的)氨基酸被引入到了该位置上,这另一种氨基酸既不是预定的氨基酸,也不是原型氨基酸。举例而言,当密码子中有2个或3个碱基发生变异时,“不希望的”氨基酸便会出现。成功结果的概率用P(j)表示,其中的j代表序列中的位置(1≤j≤N)。同一位置产生不成功结果的概率为1-P(j)。在这里使用圆括号(替代更常用的下标)是为了强调位置j这一概率从变量。实际上,P(j)是位置j的函数,是得到预定氨基酸所需碱基混合物的函数(1、2或3种核苷酸基本组分被取代)。
X是任意的随机变量,它代表着长度为N的序列中氨基酸变异的总数,X的采样空间为Ω={0、1、2、3......N}。因此,下面的集合可被定义
Sk={j∈(1、2、3......N)V成功的位置}S′N-K={j∈(1、2、3......N)V不成功的位置}SK∩S′N-K=请注意子集的索引代表每个集合的基数。在最一般情况下,描述这种分布情况的方程为PKN=ΣKi=1(N)(ΠjϵiP(j))(ΠjϵsN-K′(1-P(j))),1≤K≤N]]>这一方程代表N个独立事件中有K个成功事件(既预定氨基酸被引入到了目标位置上)的概率。
每次实验中的变种数量也应加以考虑。标准的引入式诱变过程(即不进行比例调节)是在基本组分混合比固定为50∶50下进行的。在这种情况下,根据位置j上预定氨基酸与原型氨基酸的距离d可假定3个P(j)值;其中的距离d是将原型密码子变换成预定密码子(对预定氨基酸进行编码)所需的碱基变异数量。
距离 P(j)引入式诱变后变种/位置的数量d=1 P(j)=0.5 1引入+1目标+0其他=2总数d=2 P(j)=0.25 1引入+1目标+2其他=4总数d=3 P(j)=0.125 1引入+1目标+6其他=8总数在这一假设下,所感兴趣的单一多肽通过引入式诱变(没有进行比例调节)产生含有几个变异多肽(也被称为变种)的库,其中n=2M,M是预定核苷酸碱基的总数。产生每一变种的概率为1/n,这一概率为常数,与位置上氨基酸变异的类型无关。这是因为引入到每个密码子中的预定核苷酸不受前面所示距离的影响,只以恒定的概率(分别为50%、25%、12.5%)生成三组不同的氨基酸,三组氨基酸含有的氨基酸种类分别为2、4、8种。由于这一原因,在引入式诱变所产生的低核苷酸库中找到所有N个位置上氨基酸都发生变异的变异多肽(变种)的概率与在同一库中找到只有一个氨基酸发生变异的变异多肽的概率是完全一样的。出于几种原因的考虑,人们不希望出现这种局面。
首先,在自然界找到带有目标序列(既使较短)的多肽是非常不容易的(如果不是不可能),何况还要求其在演变之后,其所取代的残基大多数或全部被同一(预定)氨基酸取代。其次,变种的数量随ZM成指数增长,其中M是变异基本组分(预定核苷酸)的总数,一般而言,M随序列的长度而增加。此外,如果变异过程的目标是在同一时间使多肽的数个目标区域发生变异(例如使某一抗体的所有6个CDR同时发生变异),则很容易得到一个具有很多种变种的库。在这些情况下,通过限制生成某些所需的变种有助于处理数量较少的变种。
调节比例可生成具有较少变异氨基酸数量的低核苷酸库(即变异的多肽中只有较少数量的预定氨基酸被结合到了多肽中)。通过采用不同的碱基混合比,并对需要进行取代的序列保持恒定的碱基比可以实现核苷酸的比例调节。这意味着,为了与对预定氨基酸进行编码的预定核苷酸相结合,密码子每次需要一种由两种碱基组成的混合物,所使用的碱基混合比例是有利于原型核苷酸存在(通过在原型多肽中插入原型核苷酸)的比例,而不是有利于预定氨基酸存在(通过在原型多肽中插入对预定氨基酸进行编码的预定核苷酸)的比例。
采用这一方法,在位置j上含有预定氨基酸的概率取决于原型氨基酸与目标氨基酸之间的距离。因此,三种不同的情况被加以考虑(d=1、2、3),调节距离值从而滤掉变种数量很多的序列。举例而言,下列信息是在原型核苷酸与预定核苷酸之比为9∶1的条件下获得的距离P(j) 引入式突变过程后变种/位置的数量d=1P(j)=0.1 1WT(90%)+1目标(10%)+0其他=2总数d=2P(j)=0.01 1WT(81%)+1目标(1%)+2其他=4总数d=3P(j)=0.0011WT(72.9%)+1目标(0.1%)+6其他=8总数在这一情况下,每种被取代的氨基酸仍有存在的概率,这一概率取决于将其引入到序列中所需的碱基变异数量。然而,在进行比例调节的情况下,低核苷酸库中的变种并不具有相同的生成概率。
在诱变过程中使用恒定的碱基混合比例可使原型碱基和预定的碱基保持恒定的存在概率。如果每种氨基酸可使每一变种的出现概率只取决于序列中的取代数量,则每种取代发生的概率可固定在所需要的程度,并且可使用不同的碱基混合比例来进行诱变过程,混合比取决于预定氨基酸与原型氨基酸之间的距离,在这种方式下,每一变种的出现将只取决于取代发生的数量。
举例而言,假设P(j)=P=常数,代表上述关系的方程采用被称为标准二项式分布的形式,其特点是目标序列的长度以及所需的成功概率。标准的二项式分布方程为P(X=K)=(KN)PK(1-P)N-K1≤K≤N其中参数n和p分别是目标序列的长度和每个单独事件所需的成功概率。将k值从零变到N,即可得到典型的分布结果,其中平均值和方差为X=npEx2=np(1-p)图12(p=0.2)及图13(p=0.1)表明了这些分布。一旦参数值被固定下来,则可以改变基础组分的比例来达到所需要的p值。根据原型氨基酸与预定氨基酸之间的距离可采用不同的碱基混合比例。
例如p=0.25n=10x=2.5 方差(x)=1.87
p=0.2 n=10x=2.0 方差(x)=1.6
p=0.3 n=10x=3.0 方差(x)=2.1
因此,使用这些公式可以确定出引入式诱变过程中所需的变异多肽水平,在引入式诱变过程中,原型核苷酸与变异核苷酸的比例可据此进行调节。
制备核酸库核酸库含有对原型多肽和变异多肽进行编码的核酸,正如本文前面所述的,核酸库可从低核苷酸制备;多肽库含有原型多肽和变异多肽,采用标准技术可从核酸制备出多肽库。举例而言,对变异免疫球蛋白进行编码的核酸可引入到宿主细胞中进行表达(见Huse W.D.等人在《科学》上的文章,2461275(1989);见Viera J.等人在《Meth.Enzymol.》上的文章,1533(1987))。核酸例如可在大肠杆菌表达系统中进行表达(见Pluckthun A.及Skerra A在《生物技术》上的文章,925-278(1991))。核酸可以在培养基的分泌液和/或细菌的细胞质中进行表达(见BetterM.及Horwitz A.在《Meth.Enzymol.》上的文章,178476(1989));或者核酸可在诸如酵母细胞或哺乳动物细胞(如在骨髓瘤细胞或杂交瘤细胞)中进行表达。
本领域的普通技术人员将会理解,可以使用多种表达方式生成本文所述的库。通过将核酸与其他基因单元相融合,例如与助催化体、终结体以及其他适合的序列相融合,按照pluckthun等人的描述可在试管中完成核酸的表达(核糖体显示)(见Pluckthun A.和Skerra A.在《Meth.Enzymol.》上的文章,178476-515(1989)),其中的助催化体、终结体以及其他适合的序列会促进转移及转录过程。同样,噬菌体表达、细菌表达、杆状病毒感染的昆虫细胞表达、真菌(酵母)表达、植物细胞表达及哺乳动物细胞表达可按所述的方式得到(见R.konterman、S.Dubel的《抗体工程》)。scFV库还可以与其他基因相融合,从而产生具有结合部分以及其他功能的嵌合蛋白质,例如具有催化功能、胞毒等功能的蛋白质。(见R.konterman和S.Dubel的《抗体工程》)。
本发明中的方法还可生成多肽变种,在这些变种中,预定氨基酸只限于引入到每个变异多肽的一处或两处位置,目标区域中的其他氨基酸则保持不变,或者尽可能接近于原型序列。这样,可产生更精确、更具体的化学变化。举例而言,为了改善两种蛋白质之间的结合情况,或改善抗体与抗原之间的结合情况,可逐个位置地对结合区(作为“目标”区域)内其他疏水侧链存在的系统效果进行研究。同样,通过将具有特定化学特性的氨基酸选定为预定的氨基酸可以在整个结合过程中解决电荷(+电荷或-电荷)效应、亲脂性、亲水性等问题。
免疫球蛋白在某一特定实施方案中,所感兴趣的多肽是一种免疫球蛋白。正如本文中所用的,“免疫球蛋白”一词可指整个免疫球蛋白,也可指免疫球蛋白中含有易变区域的部分。作为感兴趣多肽的免疫球蛋白可以是产生抗体的任何种类免疫球蛋白。在优选情况下,免疫球蛋白是哺乳动物的免疫球蛋白,尤其是人类的免疫球蛋白。所感兴趣的免疫球蛋白或者是一种嵌合式抗体或一种“共有的”或正则的结构,这种结构是由氨基酸抗体数据库所生成的结构(见Kabat等人1991年出版的《免疫蛋白的结构》,美国健康及人类服务署出版,第5版)。所感兴趣的免疫球蛋白可以是原型免疫球蛋白(即从生命组织分离出来的免疫球蛋白,或可以从生命组织中分离出来的免疫球蛋白,例如在哺乳动物;尤其是人类的相应生理样品(比如血液、血清等)中可以发现的免疫球蛋白)。另外,所感兴趣的免疫球蛋白也可是改性的免疫球蛋白(既在原型免疫球蛋白中一个或多个易变区域和/或稳定区域发生变化后所形成的免疫球蛋白)。
在本发明的某一实施方案中,所感兴趣的免疫球蛋白是具有催化作用的抗体。按本文所述方法在免疫球蛋白易变区域的结合点上引入适当的氨基酸可使免疫球蛋白具有催化功能,或者可使已有的催化功能得到加强。例如,模仿丝氨酸蛋白酶的催化三元素组可在抗体易变区域的超变段上形成,并可对解蛋白活度进行筛选。具有代表性的催化抗体包括氧化还原酶、转移酶、水解酶、裂解酶、异构以及连接酶;这些种类范畴的酶包括蛋白酶、糖酶、脂肪酶、双加氧酶以及其他的酶。这些酶及其他的酶在健康护理、化妆品、食品、酿造、清洁剂、环境保护(如水处理)、农业、鞣革、纺织品以及其他化学过程中可被用来进行酶催化转化过程,比如用于医疗诊断、治疗过程、脂肪转化、碳水化合物转化、蛋白质转化、有机污物降解以及化学品的合成过程。举例而言,可制造出具有血纤维蛋白溶解活性或具有抗病毒结构活性的蛋白质酶,比如制造出病毒包衣蛋白;这些酶具有治疗效果。这些蛋白酶是有效的抗凝血剂或者是对抗诸如艾滋病病毒、鼻病毒、流感病毒或肝炎病毒的抗病毒剂。另外,在另一实例中,氧酶(比加氧酶)这类在对芳香环及其他双键结构进行氧化时需要辅助因素帮助的酶还可应用于工业过程中,比如用于生物制浆过程、生物材料转化成燃料或其转化成他化学品的过程、废水污染物的转化过程、煤炭生化加工过程以及有机物质的去毒过程。
本发明中的方法对于制备免疫球蛋白的通用库特别有用。有关免疫球蛋白通用库的制备在60/373,558号美国专利申请中有详细的说明,该专利申请的标题为“免疫球蛋白的通用库”,该专利申请与本专利申请是同时提交的,该专利申请的全文在此通过引证被并入本文。
核酸库的应用正如本文所述的,核酸库对变异的多肽进行编码或含有变异的多肽,其中变异的多肽是以某种方式生成的,基于这种方式可对原型多肽的结合区进行系统及精确的分析,尤其可对特定的预定氨基酸对该结合区的影响进行系统和精确的分析。这些核酸库避免了与随机诱变过程中突变性质的控制或预测相关的问题,这些核酸库可产生有关特定突变的具体信息,这些特定突变可改变多肽与其他媒剂(如配体、受体、抗原)之间的相互作用,其中包括多肽不同结合区域中氨基酸的多个相互作用。
使用适当的方法可在这些核酸库中筛选特定的多肽,比如筛选具有专门性质的免疫球蛋白。举例而言,通过对基质转化进行适当的分析可确定多肽的催化活性,通过标准免疫分析和/或亲和力气相色谱可评估多肽的结合活性。这些活性的分析可通过具备所需生长活性的细胞进行。比如在筛选具有降解有毒化合物能力的免疫球蛋白时,在培养基中引入致死量的有毒化合物可以只使那些具备降解这些有毒化合物能力的细胞生长(见Wasserfallen A.和Rekik M.《在物技术》所发表的文章,9296-298(1991))。还可针对其他活性对这些核酸库进行筛选,比如针对瞄准或破坏各种病原的能力进行筛选。还可通过将感兴趣的病原暴露在抗体中来进行这些活性的分析,表现出所需特性(如杀灭病原体)的抗体可被筛选出来。
本文下面提供的实施例是为了对本发明进行说明,这些实施例并不对本发明的范围构成限制。实施例中所引用的所有文献内容在此通过引证被并入本文。
实施例A.材料和方法为了评估比例调节对引入式诱变过程的影响,引入式诱变过程是在单克隆抗体MCPC603的三个超变区域的互补确定区(CDRs)上进行的。MCPC603是一种能与磷酸胆碱相结合的单克隆抗体。这种免疫球蛋白因为具有良好的结构特性而被认为是研究结合性能和催化性能的一种良好模型。抗体MCPC603的CDRs已经得到了识别。在重链中,CDR1包括氨基酸31-35,CDR2包括氨基酸50-69,CDR3包括氨基酸101-111。在轻链中,CDR1包括氨基酸24-40,CDR2包括氨基酸55-62,CDR3包括氨基酸95-103。
重链的CDR1、CDR2和CDR3是所选定的区域。已公布的单克隆抗体MCPC603重链和轻链氨基酸序列可以转化成DNA序列(见Rudikoff S.和Potter M.在《生物化学》上的文章,134033(1974));另外,MCPC603的原型DNA序列也可以被使用(见Pluckthun A.等人在Cold Spring港演讨会论文集《定量生物学》第LII卷中的文章,P105-112,(1987))。为了便于引入变异的低核苷酸,序列中可包括限制点,或者在基因集中引入变异的序列。
引入式诱变过程所选择的预定氨酸是丝氨酸催化三元组的三个残基Asp、His和Ser。Asp被选来用于重链的CDR1、His用于重链的CDR2,Ser用于重链的CDR3。
图1表明了MCPC603中CDRs引入式诱变过程所用基因的结构;图中表明了要发生突变的位置或“窗口”。应该理解的是,为了便于插入到目标结构中去,合成所生成的低核苷酸可以大于图1中所示的窗口。这了使用Asp(图3所示)取代每个原型氨基酸,研究人员设计了与重链CDR1相对应的低核苷酸混合物。两个密码子表明了Asp(GAC和GAT)。CDR1的第一个密码子不需要任何取代。为了转化成Asp的密码子,第二个密码子(TTC、PHE)需要在第一位置(T-G)和第二位置(T-A)发生取代。第三个密码子(TAC、TYR)只需在第一位置(T-G)发生取代。第四个密码子需要三个取代,第一个取代发生在A-G,第二个取代发生在T-A,第三个取代发生在G-T。第五个密码子(GAG、GUL)只需在第三位置(G-T)发生一次取代。图2中表明了所生成的低核苷酸混合物。
从基因编码可推断出取代每个位置上原有氨基酸的所有氨基酸的结构。对该实施例而言,第一种氨基酸永远是Asp(100%),第二种氨基酸将是Phe(25%)、Asp(25%)、Tyr(25%)或Val(25%);第三种氨基酸是Tyr(50%)或Asp(50%);第四种氨基酸是Met(12.5%)、Asp(12.5%)、Val(25%)、Glu(12.5%)、Asn(12.5%)Ile(12.5%)、Lys(12.5%);第五种氨基酸或者是Glu(50%),或者是Asp(50%)。总共可生成对112种不同蛋白质序列进行编码的128种低核苷酸。在所生成的112种不同氨基酸序列中,包括原型序列(在位置31上带有Asp残基)以及与原型序列不同的序列,不同之处在于,在所有可能的替换中,后一种序列在位置32-35上含有1个到4个Asp残基。此外,某些发生Asp取代或未发生Asp取代的序列在位置32或位置34或同时在这两个位置上含有既不是原型也不是Asp的氨基酸。这些氨基酸通过核苷酸的变异而被引入,这些氨基酸对原型氨基酸和预定的氨基酸进行编码。举例而言,在图2中,在位置32上,除原型苯丙氨酸残基以及预选的Asp残基外,还生成了酪氨酸和缬氨酸。
MCPC603重链区的CDR2含有图3所示的14种氨基酸(55-68)。这一低核苷酸混合物中原型序列的每种氨基酸都将被组氨酸所取代。两个密码子(CAT和CAC)指明了组氨酸的结构。在整个原型DNA序列中所需的取代总量为25。因此,所生成的核苷酸混合物含有的低核苷酸可指明3.3×107种不同肽序列的结构(见图3)。
如图4所示,单克隆抗体MCPC603中VH区域的CDR3由11种氨基酸组成。在所生成的低核苷酸混合物中,正如前面针对CDR1所述的,原型序列中的每一个非丝氨酸氨基酸都被丝氨酸所取代。6个基码(TCX、AGC、AGT)指明了丝氨酸的结构。整个原型序列所需的取代总数为12。因此,所产生的低核苷酸混合物含有4096种不同的低核苷酸。在这一情况中,这些低核苷酸将对4096种蛋白质序列进行编码。在这些序列中,某些序列在任何其他位置(101-104、106-111)上含有一个丝氨酸残基(在丝氨酸105之外),以及在任何组合中带有一个以上丝氨酸的变体(见图4)。
采用引入式诱变过程可生成一个Fv序列库,该库中含有几种不同的蛋白质序列,其中包括原型序列和变异序列。这些序列的主要部分将对氨基酸三元组His、Ser、Asp进行编码,该氨基酸三元组是目标超变区域内所需位置上丝氨酸蛋白酶的典型结构。引入式诱变过程是在自动化DNA合成器中通过突变低核苷酸混合物的合成而实现的;其中的DNA合成器既可以将一种核苷酸输送到反应室中,也可以将比例相同的两种核苷酸的混合物输送到反应室中,这两种核苷酸在输送到反应室之前已经混合完毕。
合成所生成的每种低核苷酸混合物被结合到MCPC603各个易变区域中的基因中。这些低核苷酸通过酶催化技术转化成了双股链结构,并随后与含基因的限制性质粒形成配位,其中的基因对要发生突变的蛋白质进行编码。限制点即可以是自然存在的也可以是人为控制的限制点。
通过前面所述的这些及其他适用过程所生成的MCPC603变异基因在简便的大肠杆菌表达系统中进行表达;Pluckthun和Skerra对这一表达系统进行过说明(见Pluckthun A.和Skerra A.在《Meth.Enzymol.》上发表的文章,178476-515(1989);见Skerra.A.等人在《生物技术》上发表的文章,9273-278(1991))。
使用预测变种分布的计算机程序来评估“比例调节”对原型碱基与变异碱基之间比例的影响以及对所生成的氨基酸的影响。该程序被用来评价“比例调节”对VH-CDR2(Asp)突变的影响。图8表明了原型/变异比为1∶1下所得到的结构;图9表明了该比例为4∶1时所得到的结果;图10表明了该比例为9∶1时所得到的结果。可以看出,分布情况会随比例的改变出现很大的变化。
上面所述的方法还被用来生成抗体MOPC603的一组变种,其中所使用的原型/变异比例为9∶1。在变异过程中,有20种新的菌落形成,图11表明了排序数据。这些结果证明,该库主要含有目标区域中未发生氨基酸取代;或目标区域中只有一个或二个目标氨基酸被取代后所产生的变种。
虽然本发明是结合优选实施方案进行具体说明和描述的,但本领域的技术人员应该理解的是,在不脱离本文所附权利要求所限的本发明范围及原理的情况下,可以对本发明的形式及细节进行各种各样的修改。
权利要求
1.一种引入式核酸诱变的方法,其中的核酸编码感兴趣的多肽,该方法包括a)在被这种核酸所编码的多肽中选定一个或多个原型氨基酸目标区域;b)为每个目标区域选择一个或多个预定的氨基酸,这些预定的氨基酸将取代原型氨基酸而结合到目标区域中;c)合成低核苷酸混合物,其中低核苷酸含有每个目标区域的核苷酸序列,其中的每种低核苷酸在目标区域的每个序列位置上或含有合成多肽中原型氨基酸所需的原型核苷酸,或含有合成预定氨基酸所需的预定核苷酸;在合成过程中,可用的原型核苷酸与可用的预定核苷酸之比大于1∶1。
2.权利要求1中的方法,还包括生成核酸表达库,该核酸表达库含有所述的低核苷酸。
3.如权利要求1中的方法,其中的比例等于或大于4∶1。
4.如权利要求1中的方法,其中的比例等于或大于7∶1。
5.如权利要求1中的方法,其中的比例等于或大于9∶1。
6.如权利要求1中的方法,其中目标区域含有多肽的功能区。
7.如权利要求1中的方法,其中目标区域包括免疫球蛋白的催化部位。
8.如权利要求1中的方法,其中目标区域包括抗体的超变区域。
9.如权利要求1中的方法,其中预定的氨基酸是丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、酪氨酸、胱氨酸、组氨酸、谷氨酸、天冬氨酸、赖氨酸或精氨酸。
10.如权利要求1中的方法,其中使用二项式分布来确定可用原型核苷酸与可用预定核苷酸之比,二项式分布中考虑到了目标区域的长度以及与核苷酸结合所需的成功率,其中的核苷酸对预定氨基酸进行编码。
11.使用权利要求1中方法所制备出的核酸库。
12.通过权利要求11中核酸的表达而制备出的多肽库。
全文摘要
本文涉及引入式核酸突变的方法,其中的核酸对研究感兴趣的原多肽进行编码。本文所述的方法包括选择预定的氨基酸以及多肽的一个或多个目标区域;合成低核苷酸的混合物。其中的低核苷酸在目标区域的每个序列位置上或者含有原型核苷酸或者含有预定的核苷酸。原型核苷酸被用来合成预定的氨基酸。在合成过程中,可用的原型核苷酸与可用的预定核苷酸之比大于1∶1。
文档编号C12N15/10GK1653193SQ03811148
公开日2005年8月10日 申请日期2003年4月16日 优先权日2002年4月17日
发明者罗伯特欧·克瑞, 盖德·卡布其力 申请人:罗伯特欧·克瑞, 盖德·卡布其力
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1