识别靶的结合剂的制作方法

文档序号:3554274阅读:726来源:国知局
专利名称:识别靶的结合剂的制作方法
技术领域
本发明总体上涉及抗体样结合剂领域,所述试剂能够特异性地识别并且结合靶。
背景技术
标准抗体是由两个相同的免疫球蛋白重链和两个相同的轻链组成的四聚体结构。抗体的重链和轻链由不同的结构域组成。每一个轻链具有一个可变结构域和一个恒定结构域,而每一个重链具有一个可变结构域和三或四个恒定结构域。Alzari,P.N.,Lascombe,M.-B.& Poljak,R.J.(1988).Three-dimensional structure ofantibodies.Ann.Rev.Immunol.6,555-580。每一个结构域由大约110个氨基酸残基组成。每一个结构域还折叠成特征性的β-夹心结构,它是由两个彼此堆积的β-折叠形成的(免疫球蛋白折叠)。所述可变重结构域和可变轻结构域各自具有三个互补性决定区(CDR1-3),这些区连接位于所述结构域一端的β-链。轻链和重链的可变区通常对抗原特异性有贡献,尽管单个链对特异性的贡献并非总是相同的。因此,抗体分子是大的和复杂的。
抗体分子业已进化成通过使用六个随机化环(CDRs)结合大量的分子。不过,六个不同的环的大小和在独立的多肽上的存在造成了对分子操作的障碍,这些操作可用于改善抗体的结构、稳定性和结合特性。另外,尽管抗体被广泛应用于医学研究、工业方法和诊断,但它们是昂贵的并且难以获得。它们还缺乏长的保存期限的合适的稳定性。
有用的是较小的、更稳定的结合剂,这种结合剂能够通过标准克隆方法容易地进行操作,并且能够在培养的宿主细胞中生产,而不是在动物中生产。这种新型结合剂理想地具有抗体的正特征(例如,结合不同靶的高的特异性和亲和力),但是,少有抗体的负的方面(例如,不稳定性和生产难度)。另外,还需要在培养的细胞中大规模制备所述结合剂的新方法,这种方法避免了使用动物的时间和费用。
发明概述本发明涉及多肽和制备能特异性地识别任何需要的靶分子(蛋白、肽、核酸、小分子等)的结合剂的方法。所述结合剂克服了单克隆抗体或多克隆抗体的很多固有的限制。例如,不需要使用动物制备所述结合剂。相反,所述结合剂可以在包括细菌在内的多种宿主细胞中生产。然后,可以纯化、研究、修饰所述新型结合剂,并且用于测定、商业化诊断装置或用作治疗剂以取代抗体。
因此,本发明涉及包括多肽的分离的结合剂,所述多肽包括SEQID NO2或SEQ ID NO4或SEQ ID NO37。所述多肽可能具有多个结合环(例如五个),其中每一个环包括Xaa氨基酸。所述Xaa氨基酸可以是遗传编码的L-氨基酸,天然存在的非遗传编码的L-氨基酸,合成的L-氨基酸或它们的D-对映体。所述分离的结合剂的每一个Xaa氨基酸能够交换成特定氨基酸,以便所述多肽能够结合选择的靶分子。
本发明还涉及编码包括SEQ ID NO2或SEQ ID NO4的多肽的分离的核酸。所述分离的核酸的例子包括具有SEQ ID NO1或SEQ IDNO3的核酸。所述核酸可存在于可复制的载体或可复制的质粒上。
本发明还涉及包括随机环状序列的寡核苷酸。例如,所述寡核苷酸可以具有SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ IDNO28或SEQ ID NO29。
本发明还涉及表达载体,它包括启动子和编码本发明的结合剂的核酸。例如,所述表达载体可以编码包括SEQ ID NO2或SEQ ID NO4或SEQ ID NO37的结合剂多肽。例如,所述核酸可以包括SEQ IDNO1或SEQ ID NO3。
本发明还涉及结合剂文库,其中,所述文库中的每一种结合剂包括包含SEQ ID NO2或SEQ ID NO37的多肽。
本发明还涉及用于制备所述结合剂的方法。在一种方法中,提供了编码亲代结合剂的核酸和载体,其中,所述亲代结合剂的结合环可以容易地进行修饰,以便生成结合剂文库。然后,可以在所述文库中筛选能够结合特定靶的试剂。在另一种实施方案中,本发明涉及计算机辅助的方法,用于将靶分子的结构坐标依次配合(fit)在不同的结合剂上,并且确定具有良好配合的结合环的序列。
因此,本发明涉及一种制备结合剂核酸文库的方法,包括生成随机寡核苷酸集合,每一种随机寡核苷酸包括大约6-大约30n核苷酸的随机序列,其中,n是A、C、G或T;和将每一种随机寡核苷酸取代到包括SEQ ID NO1的核酸中,以便生成结合剂核酸文库。所述随机寡核苷酸集合中的至少一种可以包括SEQ ID NO25、SEQ IDNO26、SEQ ID NO27、SEQ ID NO28或SEQ ID NO29。所述方法还可以包括将所述结合剂核酸文库放入宿主细胞群体中,以便生成宿主细胞文库。
本发明还涉及一种制备编码结合剂多肽的可复制的载体文库的方法,包括生成随机寡核苷酸集合,每一种随机寡核苷酸包括大约6-大约30n核苷酸的随机序列,其中,n是A、C、G或T;和将每一种随机寡核苷酸取代到包括SEQ ID NO1的可复制的载体中,以便生成编码结合剂多肽的可复制的载体文库。所述随机寡核苷酸集合中的至少一种可以包括SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28或SEQ ID NO29。所述方法还可以包括将所述结合剂载体文库放入宿主细胞群体中,以便生成宿主细胞文库。
本发明还涉及一种制备结合剂多肽文库的方法,包括生成随机寡核苷酸集合,每一种随机寡核苷酸包括大约6-大约30n核苷酸的随机序列,其中,n是A、C、G或T;将每一种随机寡核苷酸取代到包括SEQ ID NO1的表达载体中,以便生成编码结合剂多肽的表达载体文库;以及将所述表达载体文库放入宿主细胞群体中,以便生成表达结合剂多肽文库的宿主细胞文库。所述随机寡核苷酸集合中的至少一种可以包括SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28或SEQ ID NO29。
本发明还涉及一种制备结合剂核酸文库的方法,包括生成随机寡核苷酸集合,每一种随机寡核苷酸包括大约6-大约30n核苷酸的随机序列,其中,n是A、C、G或T;和将每一种随机寡核苷酸取代到包括SEQ ID NO37的核酸中,以便生成结合剂核酸文库。所述随机寡核苷酸集合中的至少一种可以包括SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28或SEQ ID NO29。
本发明还涉及一种制备编码结合剂多肽的可复制的载体文库的方法,包括生成随机寡核苷酸集合,每一种随机寡核苷酸包括大约6-大约30n核苷酸的随机序列,其中,n是A、C、G或T;和将每一种随机寡核苷酸取代到包括SEQ ID NO37的可复制的载体中,以便生成编码结合剂多肽的可复制的载体文库。所述随机寡核苷酸集合中的至少一种可以包括SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28或SEQ ID NO29。所述方法还可以包括将所述结合剂载体文库放入宿主细胞群体中,以便生成宿主细胞文库本发明还涉及一种制备结合剂多肽文库的方法,包括生成随机寡核苷酸集合,每一种随机寡核苷酸包括大约6-大约30n核苷酸的随机序列,其中,n是A、C、G或T;将每一种随机寡核苷酸取代到包括SEQ ID NO37的表达载体中,以便生成编码结合剂多肽的表达载体文库;以及将所述表达载体文库放入宿主细胞群体中,以便制备表达结合剂多肽文库的宿主细胞文库。所述随机寡核苷酸集合中的至少一种可以包括SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28或SEQ ID NO29本发明还涉及一种计算机实施的制备结合剂文库的方法,包括在靶分子上确定包括相互作用位点的搜索区,具有至少一个结合环的结合剂能够与所述搜索区相互作用;确定要搜索的结合环的数目和每一种结合环的大小;确定每一种结合环氨基酸序列的每一个位置上的氨基酸类型;将确定类型的氨基酸成员取代到每一种结合环氨基酸序列的位置上,以便生成多种输出结合环序列;将所述多种输出结合环序列的每一种配合入所述搜索区,并且产生靶分子-结合环序列配合得分;和通过靶分子-结合环序列配合得分对所述多种输出结合环序列进行分级;其中,所述结合剂包括SEQ ID NO2或SEQ ID NO37。所述搜索区可以包括所述靶分子中每一个非氢原子的x-、y-和z-坐标。所述方法还可以包括输入所述包括SEQ ID NO或SEQ ID NO37的结合剂中每一个非氢原子的x-、y-和z-坐标。
所述方法还可以包括接收输入百分比选择,以便将所述输出结合环序列限定在特定百分比上;其中,所述输入百分比选择能够限定输出文库的文件大小和文库的复杂性。一般,具有较高的靶分子-结合环序列配合得分的输出结合环序列能够以较高的亲和力结合所述靶分子。例如,所述靶分子可以是牛胰蛋白酶,并且,例如,所述输出结合环序列之一可以是SEQ ID NO35。
本发明还涉及用于生成肽序列的系统,包括处理器;与所述处理器偶联的存储器;与所述处理器偶联的显示器;制备能够在所述处理器上执行的构造环肽序列成分,以便生成备输出环肽序列;分子停靠(docking)成分,所述成分能够将多种输出环肽序列配合在靶分子上的搜索区,并且生成靶分子-结合环序列配合得分;能够在所述处理器上执行的输出环序列成分,以便显示环肽序列;和能够在所述处理器上执行的输出结合剂序列成分,以便显示结合剂序列。
本发明还涉及机器可存取介质,它具有能够指导所述机器执行如下方法的相关的内容,所述方法包括在靶分子上确定包括相互作用位点的搜索区,具有至少一个结合环的结合剂能够与所述区相互作用;确定要搜索的结合环的数目和每一种结合环的大小;确定每一种结合环氨基酸序列中每一个位置上的氨基酸类型;将特定类型的氨基酸成员取代到每一种结合环氨基酸序列的位置上,以便生成多种输出结合环序列;将所述多种输出结合环序列的每一种配合入所述搜索区,并且产生靶分子-结合环序列配合得分;和通过靶分子-结合环序列配合得分对所述多种输出结合环序列进行分级;其中,所述结合剂包括SEQ ID NO2或SEQ ID NO37。所述机器可存取介质还可以包括所述包括SEQ ID NO2、SEQ ID NO37或SEQ ID NO38的结合剂中每一个非氢原子的x-、y-和z-坐标的文件。例如,SEQ ID NO2、SEQ ID NO37或SEQ ID NO38的x-、y-和z-坐标可以由所述分子停靠程序使用来将每一种结合环序列与靶分子进行比对。


图1A是编码本发明的结合剂的核酸的示意图。通过工程方法引入所述序列的独特的限制位点如下Nd,Nde I;Nh,Nhe I;Fs,FspI;As,Ase I;Sp,Spe I;Mf,Mfe I,Ac,Acl I;Ms,Msc I;Pm,Pml I;Sc,Sca I;Nc,Nco I;和Ec,Eco RV。数字表示限制位点的位置和基因长度,都是用核苷酸表示的。还示出了五个相应的环形区(i至v)的位置。
图1B是本发明结合剂多肽的示意图。五个环形区(i至v)在所述结合剂内的位置是相对于它们的氨基酸位置示出的。环上方的数字表示所述环中氨基酸的数目。
图2提供了本发明结合剂的DNA序列(SEQ ID NO1)。加下划线的序列表示业已整合到所述DNA序列上以便促进克隆的5′Nde I位点和3′Eco RV序列。n表示相应于所述结合剂的环形部分的随机核苷酸(例如,A、C、G或T)的位置。起始密码子和终止密码子用粗体表示。
图3表示本发明的亲代结合剂的氨基酸序列(SEQ ID NO2)。采用了单字母氨基酸命名法,并且X是相应于五个环形区(i至v)的随机氨基酸。
图4表示通用结合剂的DNA序列(SEQ ID NO3)。加下划线的序列表示业已整合到所述DNA序列上以便促进克隆的5′Nde I位点和3′Eco RV序列。图1所示的所述结合剂DNA序列的环形部分业已被编码丙氨酸和甘氨酸的密码子所取代。这样,在建立组合文库之前,可以纯化所述通用结合剂并且进行稳定性研究。起始密码子和终止密码子用粗体表示。
图5提供了通用结合剂的氨基酸序列(SEQ ID NO4)。采用了单字母氨基酸命名法。所述环形区(i至v)业已用丙氨酸和甘氨酸取代。
图6表示所述亲代结合剂的三维结构。所述结构是由五个环限定的(通过细的管状链表示),它是主要的靶识别元件。总体拓扑结构是通过中央二硫键(未示出)稳定化的β夹心(通过箭标表示)。所述蛋白序列末端具有尾巴,所述尾巴可用于将所述分子锚定在用于诊断器械上的珠的表面或其他表面上。所述靶接触区只是由这些环的空间定向决定的。
图7是表示所述亲代结合剂的化学变性的曲线图。用解折叠的蛋白分数作为变性浓度的函数进行作图。所述解折叠的反应表现出2.7M GdnHCl的转变中点,它相应于自由能ΔG为42.7kJmol-1,(m=16.8kJ M-1mol-1)。
图8是表示自动发现针对特定靶分子的新型结合剂的程序的流程图。
图9是表示通过ITC分析得到的计算机产生的环i变体和牛胰蛋白酶之间的结合的曲线图。将结合剂和胰蛋白酶透析到20mM二甲基胂酸钠(pH6.9),40mM NaCl中。所述结合剂的浓度为1mM,并且将胰蛋白酶以20μM的浓度用于热量计测定池中。将温度保持在20℃。进行40次注射,每次5μL,在每次注射之间具有240秒的再平衡时间。
图10是表示自动发现针对特定靶分子的新型结合剂的程序的流程图。
图11是用于生成具有不同环肽序列的结合剂的系统的示意图。
图12A-12Q是具有SEQ ID NO38的通用多肽的结构坐标的列表。SEQ ID NO38多肽是与SEQ ID NO4类似的通用结合剂,所不同的是SEQ ID NO38不具备存在于SEQ ID NO4中的N-末端Met-Asp氨基酸。
发明详述本发明涉及包括多肽的结合剂,所述多肽具有“结构决定性”和“功能控制性”氨基酸,其中,所述结构决定性氨基酸能促进稳定的、反平行β桶构象的形成,而所述“功能控制性”氨基酸能促进对诸如独特的蛋白、多糖、肽或类似分子的独特分子实体的结合特异性。本发明的结合剂包括具有SEQ ID NO2、SEQ ID NO4或SEQ ID NO38的多肽。
结合剂特性本发明的稳定的结合剂多肽具有若干理想的特性。下面介绍这些理想特性中的一些。
首先,控制理想的结合剂多肽的稳定性和总体构象的残基是独特的,并且可以与控制功能的残基区别开。在鉴定之后,可以对所述功能控制性氨基酸残基进行操作,而又不改变理想的结合剂多肽的稳定性和总体构象。因此,本发明涉及亲代主链多肽,其中,业已鉴定了所有功能控制性氨基酸残基,并且进行了工程改造,以便它们能够被容易地修饰。在这种场合下感兴趣的功能是与特定的靶结合。
其次,所述结合剂多肽上允许的功能控制性氨基酸残基的数目足以允许产生具有不同程度功能性的多肽的多样性群体。没有必要将确切数目的功能控制性氨基酸整合到本发明结合剂多肽中。不过,使用太少的功能控制性氨基酸将不能产生结合剂的多样性群体,而使用大量的功能控制性氨基酸则意味着需要对大量的位点进行操作,以便产生最佳的结合剂。例如,如果只有两个残基被用于控制功能的话,在两个位点上进行的20个天然存在的氨基酸的系统取代只能产生相当小的只具有202个成员的结合剂的阵列。但是,如果将40个残基用于控制功能的话,则可以产生具有2040个成员的阵列。
本发明结合剂的功能控制性氨基酸的数目通常可以在大约15-大约50个氨基酸之间变动,或者在大约20-大约40个氨基酸之间变动。在某些实施方案中,将所述结合剂多肽设计成具有分散在五个不同的环中的大约30个靶识别(即,功能控制性)氨基酸。当将30个残基用于控制功能时,就可以产生具有2030(1039)种不同结合剂的阵列。
第三,所述功能控制性残基位于所述结合剂的三维结构中,以便形成至少一个明确的结合表面。因此,所述功能控制性氨基酸并非都聚簇在所述多肽氨基酸序列的一个区域。相反,所述功能控制性氨基酸分散在所述结合剂的若干个区域中,以便在折叠时,所述多肽能呈现或提供与所述功能控制性氨基酸有效排列的功能性结构域。本发明的一种示例性实施方案是具有五个环(i-v)的多肽,它们形成了靶结合表面。在某些实施方案中,本发明多肽的靶结合表面主要由环(i)和(iv)组成,尽管其他三个环增加了所述结合剂的多样性(并因此增加了用途)。
第四,所述功能控制性氨基酸聚簇在所述结合剂的独特区域,这些区域可以容易地交换,以便将不同的功能控制性氨基酸置于这些区域中。
第五,理想的结合剂由一个亚基组成,该亚基是由一个多肽链形成的,并且该多肽链能够在诸如大肠杆菌(E.coli)宿主细胞的选择的宿主细胞中正确地折叠。另外,所述多肽是高度稳定的,因此它能够抗热和化学变性,并且具有长的保存期限。
尽管上述因素中的若干种可应用于天然抗体上,但是有若干种不能应用于天然抗体上。例如,Fab片段的抗原结合位点由重链和轻链的高变区组成。通常,使用重组技术生产抗体是困难的,并且它们具有有限的稳定性。
结合剂结构本发明涉及包括多肽的结合剂,所述多肽具有“结构决定性”和“功能控制性”氨基酸,其中,所述结构决定性氨基酸能促进稳定的、反平行β桶构象的形成,而所述“功能控制性”氨基酸能促进与诸如独特的蛋白、多糖、肽等的独特分子实体的特异性结合。
本发明理想的多肽抑制剂具有反平行β桶构象。在本文中,β桶构象表示包括β链二级结构的多肽的核心,它能折叠成桶状三级结构。所述β链二级结构能够以反平行的方式排列。另外,所述β桶是通过链内氢键和内部疏水性堆积相互作用稳定化的。在本发明中,通过至少一个二硫键进一步稳定基本的β桶构象,这有助于保持所述折叠的总体拓扑结构。β桶是蛋白结构和功能领域技术人员所公知的公认的三级结构。
在所述桶状结构的表面上示出了参与与靶分子结合的氨基酸(功能决定性氨基酸)。
本发明的结合剂的设计和使用克服了对在先进的诊断中广泛使用的常规抗体的若干重要障碍,例如,它们的大的尺寸、它们保存期限不足、它们的较差的工程改造潜力、它们的多链组成、它们的较差的溶解度以及它们的成本。
用于设计本发明的结合剂的起点是存在于骆驼科(Camelidae)血清中的抗体的结构。骆驼以及多种相关的物种(例如,lamas)具有IgG-样抗体分子,所述分子只是由重链二聚体组成的。参见Hamers-Casterman等,Naturally occurring antibodies devoid of lightchains.Natute 363(1993年6月3日)446-448;WO97/49805。尽管这些“重链”抗体缺少轻链,但它们仍然具有抗原-结合特性。
下面提供了本发明的具有SEQ ID NO2的结合剂的一种例子。
1 Met Asp Val Gln Leu Gln Ala Ser Gly Gly11 Gly Ser Val Gln Ala Gly Gly Ser Leu Arg2l Leu Ser Cys Ala Ala Ser Xaa Xaa Xaa Xaa31 Xaa Xaa Xaa Cys Ala Gly Trp Phe Arg Asn41 Ala Pro Gly Lys Glu Arg Glu Gly Val Ala51 Ala Ile ASn Xaa Xaa Xaa Xaa Xaa Tyr Ser61 Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr71 Ile Ser Gln Leu Xaa Xaa Xaa Xaa Asn Val81 Tyr Leu Leu Met Asn Ser Leu Glu Pro Glu91 Asp Thr Ala Ile Tyr Tyr Cys Ala Ala Gly101 His Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Cys111 Gly His Gly Leu Ser Thr Xaa Xaa Xaa Xaa121 Xaa Xaa Pro Trp Gly Gln Gly Thr Gln Val131 Thr Val Ser Ser其中,Xaa是本领域技术人员可以获得的任何天然的或合成的氨基酸。
这种结合剂(SEQ ID NO2)被称为亲代结合剂,因为尽管所述结构决定性氨基酸大部分已经确定,但是所述功能决定性氨基酸(Xaa残基)尚未确定。所述功能决定性氨基酸可以根据需要由本领域技术人员容易地改变或修饰,例如,通过使用本发明的方法。SEQ ID NO2多肽中的所述功能决定性氨基酸聚簇在五个独立的环(i至v)上。SEQ ID NO2多肽的第一个环(i)位于27-33号位置;第二个环(ii)位于54-58号位置;第三个环(iii)位于75-78号位置;第四个环(iv)位于102-109号位置;而第五个环(v)位于117-122号位置。
业已制备了具有与所述亲代结合剂相同的结构决定性氨基酸的通用结合剂,不过在所述环状结构域只具有甘氨酸和丙氨酸残基。制备所述通用结合剂,以允许在制备具有不同环状序列的结合剂文库之前分析通用构建体的物理化学特性(例如稳定性)。另外,所述通用结合剂可用于与特定的结合剂构建体进行比较,所述构建体是通过本发明的方法分离的。在下面提供了通用结合剂的氨基酸序列的一种例子(SEQ ID NO4)。
1 MDVQLQASGG GSVQAGGSLR LSCAASAGAA GAACAGWFRQ41 APGKEREGVA AINAGAAGTS YADSVKGRFT ISQLAGAANV81 YLLMNSLEPE DTAIYYCAAG HAGAAGAATC GHGLSTAGAA121 GAPWGQGTQV TVSSSEQ ID NO38多肽是类似于SEQ ID NO4的通用结合剂,所不同的是SEQ ID NO38不具备存在于SEQ ID NO4中的N-末端Met-Asp氨基酸。下面提供了SE ID NO38通用结合剂的序列。
1 VQLQASGG GSVQAGGSLR LSCAASAGAA GAACAGWFRQ41 APGKEREGVA AINAGAAGTS YADSVKGRFT ISQLAGAANV81 YLLMNSLEPE DTAIYYCAAG HAGAAGAATC GHGLSTAGAA121 GAPWGQGTQV TVSS本发明的结合剂中的氨基酸残基可以是遗传编码的L-氨基酸、天然存在的非遗传编码的L-氨基酸、合成的L-氨基酸或上述任意一种的D-对映体。本文用于表示二十种遗传编码的L-氨基酸和常见非编码的氨基酸的氨基酸符号是常规符号,并且如表1所示。
表1



任何所述氨基酸或本领域技术人员公知的任何其他氨基酸都可以用作本发明的结合剂中的功能控制性氨基酸(Xaa)。
另外,本发明范围内包括的结合剂可能具有用具有类似化学和/或物理学特性的氨基酸取代的一个或多个结构决定性氨基酸,只要这些变体或衍生的结合剂多肽能够保留稳定的、反平行β桶构象就行。
能够彼此取代的氨基酸通常属于类似的类型或亚型。正如本领域技术人员所公知的,氨基酸可以分成三种主要类型亲水性氨基酸、疏水性氨基酸和半胱氨酸样氨基酸,这主要依赖于氨基酸侧链的特征。这些主要类型可进一步细分成亚型。亲水性氨基酸包括具有酸性、碱性或极性侧链的氨基酸,而疏水性氨基酸包括具有芳族或非极性侧链的氨基酸。非极性氨基酸还可以细分成包括脂族氨基酸。本文所使用的氨基酸类型的定义如下“疏水性氨基酸”表示具有在生理学pH下不带电荷并且能够被水溶液排斥的侧链的氨基酸。遗传编码的疏水性氨基酸的例子包括Ile、Leu和Val。非遗传编码的疏水性氨基酸的例子包括t-BuA。
“芳族氨基酸”表示疏水性氨基酸,它的侧链包括至少一个环,该环具有共轭的π-电子系统(芳基)。所述芳基还可以用取代基取代,如烷基、链烯基、炔基、羟基、磺酰基、硝基和氨基基团以及其他基团。遗传编码的芳族氨基酸的例子包括苯丙氨酸、酪氨酸和色氨酸。常见的非遗传编码的芳族氨基酸包括苯基甘氨酸、2-萘基丙氨酸、β-2-噻吩丙氨酸、1,2,3,4-四氢异喹啉-3-羧酸、4-氯苯丙氨酸、2-氟苯丙氨酸、3-氟苯丙氨酸和4-氟苯丙氨酸。
“非极性氨基酸”表示疏水性氨基酸,它的侧链在生理学pH下通常是不带电荷的,并且是非极性的。遗传编码的非极性氨基酸的例子包括甘氨酸、脯氨酸和甲硫氨酸。非编码的非极性氨基酸的例子包括Cha。
“脂族氨基酸”表示具有饱和的或不饱和的直链、分支或环状烃侧链的非极性氨基酸。遗传编码的脂族氨基酸的例子包括Ala、Leu、Val和Ile。非编码的脂族氨基酸的例子包括Nle。
“亲水性氨基酸”表示具有能被水溶液吸引的侧链的氨基酸。遗传编码的亲水性氨基酸的例子包括Ser和Lys。非编码的亲水性氨基酸的例子包括Cit和hCys。
“酸性氨基酸”表示侧链pK值小于7的亲水性氨基酸。酸性氨基酸在生理学pH下由于丧失氢离子而通常具有带负电荷的侧链。遗传编码的酸性氨基酸的例子包括天冬氨酸(天冬氨酸盐)和谷氨酸(谷氨酸盐)。
“碱性氨基酸”表示侧链pK值大于7的亲水性氨基酸。碱性氨基酸在生理学pH下由于与水合氢离子缔合而通常具有带正电荷的侧链。遗传编码的碱性氨基酸的例子包括精氨酸、赖氨酸和组氨酸。非遗传编码的碱性氨基酸的例子包括非环状氨基酸鸟氨酸、2,3-二氨基丙酸、2,4-二氨基丁酸和高精氨酸。
“极性氨基酸”表示在生理学pH下具有不带电荷的侧链的亲水性氨基酸,不过它具有这样的键,其中,由两个原子共同持有的电子被所述原子之一更紧密地持有。遗传编码的极性氨基酸的例子包括天冬酰胺和谷氨酰胺。非遗传编码的极性氨基酸的例子包括瓜氨酸、N-乙酰赖氨酸和甲硫氨酸亚砜。
“半胱氨酸样氨基酸”表示具有能够与其他氨基酸残基的侧链形成共价键如二硫键的侧链的氨基酸。通常,半胱氨酸样氨基酸一般具有包括至少一个硫羟(SH)基团的侧链。遗传编码的半胱氨酸样氨基酸的例子包括半胱氨酸。非遗传编码的半胱氨酸样氨基酸的例子包括高半胱氨酸和青霉胺。
正如本领域技术人员所了解的,上述分类并不是绝对的。某些氨基酸具有一种以上特有的特性,并因此能够包含在一种以上类型中。例如,酪氨酸同时具有芳环和极性羟基基团。因此,酪氨酸具有双重特性,并且可同时包括在芳族和极性类型中。类似地,除了能够形成二硫键之外,半胱氨酸还具有非极性特征。因此,尽管没有严格地划分为疏水性或非极性氨基酸,在很多场合下,半胱氨酸可用于赋予多肽疏水性。
某些常见的氨基酸不是遗传编码的,并且可以存在于本发明多肽和多肽类似物中或取代本发明多肽和多肽类似物中的氨基酸,这些氨基酸包括,但不局限于,β-丙氨酸(b-Ala)和其他ω-氨基酸,如3-氨基丙酸(Dap)、2,3-二氨基丙酸(Dpr)和4-氨基丁酸等;α-氨基异丁酸(Aib);ε-氨基己酸(Aha);δ-氨基戊酸(Ava);甲基甘氨酸(MeGly);鸟氨酸(Orn);瓜氨酸(Cit);叔丁基丙氨酸(t-BuA);叔丁基甘氨酸(t-BuG);N-甲基异亮氨酸(MeIle);苯基甘氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);2-萘基丙氨酸(2-Nal);4-氯苯丙氨酸(Phe(4-Cl));2-氟苯丙氨酸(Phe(2-F));3-氟苯丙氨酸(Phe(3-F));4-氟苯丙氨酸(Phe(4-F));青霉胺(Pen);1,2,3,4-四氢异喹啉-3-羧酸(Tic);β-2-噻吩丙氨酸(Thi);甲硫氨酸亚砜(MSO);高精氨酸(hArg);N-乙酰赖氨酸(AcLys);2,3-二氨基丁酸(Dab);2,3-二氨基丁酸(Dbu);p-氨基苯丙氨酸(Phe(pNH2));N-甲基缬氨酸(MeVal);高半胱氨酸(hCys)和高丝氨酸(hSer)。这些氨基酸也落入上文定义的类型中。
上述遗传编码的和非编码的氨基酸的分类总结在下面的表2中。应当理解的是,表2只是用于说明目的的,而不是要详尽地列举可能包括本文所述结合剂多肽的氨基酸残基。可用于制备本发明结合剂多肽的其他氨基酸残基可以在以下文献中查阅到,例如,参见Fasman,1989,CRC Practical Handbook of Biochemistry andMolecular Biology,CRC Press,Inc.,以及该文献所引用的参考文献。在这里没有特别提到的氨基酸可以根据与明确鉴定的氨基酸相比已知的行为和/或它们的特征性化学和/或物理特性方便地分成上述类型。
表2

本发明的结合剂多肽可以具有用相似类型的氨基酸取代过的任何结构决定性氨基酸,以便产生变体或衍生的结合剂多肽,只要所述结合剂多肽变体或衍生物保留了形成稳定的、反平行β桶构象的能力就行。
因此,通过取代SEQ ID NO2中的一个或多个氨基酸调节所述结构决定性氨基酸,可以使本发明的结合剂变得更稳定。可以将本领域技术人员能够获得的稳定性增强或设计选择方法用于这一目的。例如,本领域技术人员能够将SEQ ID NO2中的每一个结构决定性氨基酸系统地改变成任何现有的天然或合成氨基酸,观察修饰过的多肽结构是否能进一步抗热或化学变性,并且仅使用能改善所述多肽稳定性的氨基酸取代。
另外,通过系统地改变诸如SEQ ID NO2的结合剂的每一个所述功能控制性氨基酸(Xaa),可以调节本发明的结合剂的结合特性。
在一种实施方案中,将所述亲代结合剂(SEQ ID NO2)的至少一个结构决定性氨基酸改变成相同类型的氨基酸。在其他实施方案中,将所述亲代结合剂(SEQ ID NO2)的若干结构决定性氨基酸改变成相同类型的氨基酸。因此,本发明涉及具有以下序列的变体亲代结合剂(SEQ ID NO37)1 Xaa1Xaa2Xaa3Xaa4Xaa5Xaa6Xaa7Xaa8Xaa9Xaa1011 Xaa11Xaa12Xaa13Xaa14Xaa15Xaa16Xaa17Xaa18Xaa19Xaa2021 Xaa21Xaa22Xaa23Xaa24Xaa25Xaa26XaaXaa XaaXaa31 xaa Xaa Xaa Xaa34Xaa35Xaa36Xaa37Xaa38Xaa39Xaa4041 Xaa41Xaa42Xaa43Xaa44Xaa45Xaa46Xaa47Xaa48Xaa49Xaa5051 Xaa51Xaa52Xaa53Xaa Xaa Xaa XaaXaa Xaa59Xaa6061 Xaa61Xaa62Xaa63Xaa64Xaa65Xaa66Xaa67Xaa68Xaa69Xaa7071 Xaa71Xaa72Xaa73Xaa74Xaa Xaa XaaXaa Xaa79Xaa8081 Xaa81Xaa82Xaa83Xaa84Xaa85Xaa86Xaa87Xaa88Xaa89Xaa9091 Xaa91Xaa92Xaa93Xaa94Xaa95Xaa96Xaa97Xaa98Xaa99Xaa100101 Xaa101Xaa Xaa Xaa Xaa Xaa XaaXaa XaaXaa110111 Xaa111Xaa112Xaa113Xaa114Xaa115Xaa XaaXaa Xaa121 Xaa Xaa Xaa123Xaa124Xaa125Xaa126Xaa127Xaa128Xaa129Xaa130131 Xaa131Xaa132Xaa133Xaa134其中Xaa是本领域技术人员可以获得的任何天然或合成氨基酸;Xaa1、Xaa9、Xaa10、Xaa11、Xaa16、Xaa17、Xaa36、Xaa42、Xaa43、Xaa48、Xaa67、Xaa84、Xaa89、Xaa97、Xaa100、Xaa111、Xaa113、Xaa123、Xaa125和Xaa127各自分别是非极性氨基酸;Xaa2、Xaa45、Xaa47、Xaa63、Xaa88、Xaa90和Xaa91各自分别是酸性氨基酸;Xaa3、Xaa5、Xaa7、Xaa13、Xaa15、Xaa19、Xaa21、Xaa24、Xaa25、Xaa35、Xaa41、Xaa49、Xaa50、Xaa51、Xaa52、Xaa62、Xaa65、Xaa71、Xaa74、Xaa80、Xaa82、Xaa83、Xaa87、Xaa93、Xaa94、Xaa98、Xaa99、Xaa114、Xaa130和Xaa132各自分别是脂族氨基酸;Xaa4、Xaa6、Xaa8、Xaa12、Xaa14、Xaa18、Xaa22、Xaa26、Xaa40、Xaa53、Xaa59、Xaa60、Xaa61、Xaa64、Xaa70、Xaa72、Xaa73、Xaa79、Xaa81、Xaa85、Xaa86、Xaa92、Xaa95、Xaa96、Xaa115、Xaa116、Xaa126、Xaa128、Xaa129、Xaa131、Xaa133和Xaa134各自分别是极性氨基酸;Xaa23、Xaa34、Xaa97和Xaa110各自分别是半胱氨酸样氨基酸;Xaa37、Xaa38、Xaa69和Xaa124各自分别是芳族氨基酸;和Xaa20、Xaa39、Xaa44、Xaa46、Xaa66、Xaa68、Xaa101和Xaa112各自分别是碱性氨基酸。
本领域技术人员可以获得的任何方法都可用于改变本发明结合剂的结构决定性或功能控制性氨基酸。例如,可以将至少两种普通方法用于修饰本发明的结合剂。
第一种方法是通过设计。本领域技术人员可以检查已知天然抗体-抗原复合物的结构和结合结构域(特别是已通过X射线晶体学所解决的),以便鉴定能够稳定所述结合剂构象的特殊结构相互作用。类似地,本领域技术人员可以检查抗体-抗原或酶-抑制剂复合物的结构,以便鉴定可能增强所述结合剂对其靶的亲和力的特异性结合相互作用。
第二种更常用的方法是生成大量的结合剂阵列(“人工抗体”)。可以将选择的靶分子(“抗原”)用于从所述阵列中筛选具有需要的结合特性的结合剂。这种强力(brute-force)(但是有效的)组合方法由于所述结合剂的简单的、易于操作的结构而成为可能,所述结合剂可能是由一个相比较而言小的核酸编码的。
编码具有SEQ ID NO2的多肽的这样一种核酸是具有下面所提供的SEQ ID NO1的核酸。
1 ACACACCATATGGACGTTCA GCTGCAGGCT TCTGGTGGTG41 GTTCTGTTCA GGCTGGTGGT TCTCTGCGTC TGTCTTGCGC81 TGCTAGCnnn nnnnnnnnnn nnnnnnnnTG CGCAGGTTGG121 TTCCGTCAGG CTCCGGGTAA AGAACGTGAA GGTGTTGCTG161 CTATTAATnn nnnnnnnnnn nnnACTAGTT ACGCTGACTC201 TGTTAAAGGT CGTTTCACCA TCTCTCAATT Gnnnnnnnnn241 nnnAACGTTT ACCTGCTGAT GAACTCTCTG GAACCGGAAG281 ACACCGCTAT CTACTACTGC GCTGCTGGCC ACnnnnnnnn321 nnnnnnnnnn nnCACGTGCG GTCACGGTCT GAGTACTnnn361 nnnnnnnnnn nnnnnCCATG GGGTCAGGGT ACCCAGGTTA401 CCGTTTCTTC TTAGATATCA CAC其中,n可以是任何核苷酸(例如A、C、G或T)。
根据本发明,SEQ ID NO1具有可以通过标准分子生物学方法快速和容易地取代的核苷酸序列,以便生成大量的结合剂,这些试剂各自具有不同的结合特性。因此,可以容易地构建具有随机化的结合接触环状结构域的组合文库。可以筛选所述结合剂文库,以便鉴定能识别独特的靶分子的特定结合剂,例如,通过噬菌体展示或生物淘选(biopanning)方法。
组合文库本发明涉及结合剂文库和用于生成和筛选这些文库的方法,以便鉴定能结合目标靶分子的结合剂。所述结合剂多肽是用编码具有SEQID NO2或SEQ ID NO37的多肽的表达载体文库生产的,其中,Xaa氨基酸是任何氨基酸。用选择的靶分子筛选所述多肽结合剂文库,以便鉴定可以结合所述选择的靶分子的多肽。然后可以通过常规方法大量合成所述结合剂。
本发明的示例性筛选方法包括以下步骤(a)生成具有所述随机化序列的寡核苷酸,它具有大约为SEQ ID NO2或SEQ ID NO37结合剂的环形区的长度;(b)将所述随机化寡核苷酸插入表达载体(例如,包括SEQ ID NO1核酸),以便生成结合剂文库,其中,相应于环i-v的所述功能决定性氨基酸(例如,SEQ ID NO1的n核苷酸)被所述随机化寡核苷酸所取代;(c)表达所述结合剂文库;和(d)鉴定能结合选择的靶分子的结合剂。
因此,多肽结合剂组合文库的构建是用编码亲代或通用试剂的载体作为原材料的,例如,编码SEQ ID NO1的载体。
下面提供了具有SEQ ID NO1的核酸。
1 ACACACCATATGGACGTTCA GCTGCAGGCT TCTGGTGGTG41 GTTCTGTTCA GGCTGGTGGT TCTCTGCGTC TGTCTTGCGC81 TGCTAGCnnn nnnnnnnnnn nnnnnnnnTG CGCAGGTTGG121 TTCCGTCAGG CTCCGGGTAA AGAACGTGAA GGTGTTGCTG161 CTATTAATnn nnnnnnnnnn nnnACTAGTT ACGCTGACTC201 TGTTAAAGGT CGTTTCACCA TCTCTCAATT Gnnnnnnnnn241 nnnAACGTTT ACCTGCTGAT GAACTCTCTG GAACCGGAAG281 ACACCGCTAT CTACTACTGC GCTGCTGGCC ACnnnnnnnn321 nnnnnnnnnn nnCACGTGCG GTCACGGTCT GAGTACTnnn361 nnnnnnnnnn nnnnnCCATG GGGTCAGGGT ACCCAGGTTA401 CCGTTTCTTC TTAGATATCA CAC其中,n可以是任何核苷酸(例如A、C、G或T)。
具有未确定的n核苷酸的核苷酸位置相应于所述编码的多肽中的环形区。因此,在一种实施方案中,环i相应于SEQ ID NO1的88-108号核苷酸位置;环ii相应于SEQ ID NO1的169-183号核苷酸位置1;环iii相应于SEQ ID NO1的232-243号核苷酸位置;环iv相应于SEQ ID NO1的313-332号核苷酸位置;和环v相应于SEQ ID NO1的358-375号核苷酸位置。应当指出的是,环的长度和编码这些述环的相应核酸可以改变。因此,尽管编码所述环的核酸具有SEQ ID NO1中的限定长度,但这些环状编码区可以容易地除去,并且用具有不同长度的寡核苷酸取代。
将载体用于促进亲代或通用结合剂(例如,SEQ ID NO1核酸)的操作、复制和表达。所述载体可以是任何方便的载体,它能表达包括SEQ ID NO2或SEQ ID NO37的结合剂,所述序列来自编码所述结合剂的核酸。一旦构建了编码SEQ ID NO2或37通用结合剂的载体,本领域技术人员只需要在框内克隆环肽编码序列和SEQ IDNO2或37编码序列,即可获得本发明的随机结合剂多肽文库。
相应于所述结合剂的环形区的随机化寡核苷酸可以使用标准固相化学方法合成。尽管所述随机化寡核苷酸可以具有任何方便的侧翼序列,但可以将能提供限制位点的添加的侧翼序列用于促进将所述随机寡核苷酸插入编码所述结合剂的结构决定性氨基酸的核酸中。
例如,随机化寡核苷酸的序列可以是如下面的表3中所提供的。
表3.随机化环寡核苷酸序列

环形区(i至v)相应于所提供的结合区的环形区。因此表3提供了可用于生成结合剂的组合文库的寡核苷酸序列,以及位于所述随机核苷酸(n)旁侧并且促进克隆的整合的独特限制位点。示出了随机核苷酸(n)的位置和数目。因此,环i具有21个随机核苷酸,环ii具有15个随机核苷酸,环iii具有12个随机核苷酸,环iv具有21个随机核苷酸,且环v具有18个随机核苷酸。例如,环i的寡核苷酸是33个核苷酸的序列,它具有21个中央随机碱基,具有位于5’末端的Nhe I位点和位于3’末端的Fsp I位点。
由所述随机化寡核苷酸所提供的可变环状序列提供了所述文库的关键特征本发明结合剂的结合结构域。所述文库的大小可以根据可变密码子的数目而改变,并因此根据所需要的环的大小而改变。通常,所述文库具有至少106-108或更多个成员,尽管较小的文库在某些场合下是十分有用的。
编码所述环状序列的随机化寡核苷酸的集合不一定是完全随机的。例如,可以最优化密码子选择,以便在特定生物中表达。不过,利用随机化寡核苷酸然后最优化密码子选择以便进行随后的表达可能是比较简单和廉价的。来自重组载体中的随机生成的寡核苷酸混合物的肽的表达在被收作本文参考的以下文献中进行讨论Oliphant等,1986,Gene 44177-183。
例如,为了制备用于插入编码所述亲代结合剂的载体中的寡核苷酸,可以让所述每一种随机寡核苷酸(例如,SEQ ID NO25-29)与它们的互补性结合配偶体杂交。然后用选择的限制酶对消化所述载体,例如,如果要将环i随机寡核苷酸连接到所述载体上的话,使用Nhe I和Fsp I。分离这种线性质粒。用相同的限制酶消化环i寡核苷酸。混合消化过的寡核苷酸和质粒,并且连接在一起,例如,通过使用T4DNA连接酶。将相应于环形区ii至v的随机寡核苷酸以类似方法插入所述载体。
最终连接的载体产物随后可以导入合适的宿主细胞类型中,例如,细菌细胞类型、酵母细胞类型、昆虫细胞类型或哺乳动物细胞类型。然后可以将所述细胞铺平板,并且筛选能够结合选择的靶分子的结合剂多肽的表达。
任何能够在选择的宿主细胞中复制的载体都可用于本发明。一般,所述载体是能够提供所述结合剂多肽表达所需的核酸片段的表达载体。有多种载体可以公开获得。例如,所述载体可以是质粒、粘粒、病毒颗粒或噬菌体形式的。载体成分一般包括,但不局限于,一个或多个信号序列、复制起点、一个或多个标记基因、增强子元件、启动子和转录终止序列。
可以通过多种方法将所述结合剂和随机寡核苷酸环状核酸序列插入所述载体。一般,使用本领域公知的技术将DNA插入合适的限制性内切核酸酶位点。一般参见Sambrook等,1989,MolecularCloning,A Laboratory Manual,2d ed.,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.;Sambrook和Russell,Molecular CloningA Laboratory Manual,3rd edition(2001年1月15日)Cold Spring Harbor Laboratory Press,ISBN0879695765;Ausubel等,Current Protocols in MolecularBiology,Green Publishing Associates and Wiley Interscience,NY(1989))。采用本领域技术人员所公知的标准连接技术构建包括通用结合剂和一个或多个随机环状寡核苷酸的合适的表达载体。
因此,本发明提供了能够指导结合剂多肽表达的表达盒。可以将所述表达盒放入载体中,以便生成表达载体。
本发明的表达盒包括启动子。能够指导表达盒转录的任何启动子都可以使用。因此,在本发明的表达盒中可以包括很多启动子。某些有用的启动子包括组成型启动子、诱导型启动子、可调型启动子、细胞特异性启动子、病毒启动子和合成启动子。启动子是能够控制可操作地连接的核酸序列表达的核苷酸序列,这通过提供RNA聚合酶以及正确转录所需的可能的其他因子的识别位点来实现。启动子包括最小启动子,它只由转录起始所需要的所有基本元件组成,如TATA-盒和/或用于确定转录起始位点的其他序列。启动子可以从多种不同的来源获得。例如,启动子可以完全来自天然基因、由来自存在于自然界的不同启动子的不同元件组成或由完全合成的核酸序列组成。启动子可来自很多不同类型的生物,并且进行修剪以便在特定细胞中使用。
为了在细菌中表达多肽,使用具有细菌启动子的表达盒。细菌启动子是任何能够结合细菌RNA聚合酶并且启动下游(3′)编码序列转录成mRNA的任何DNA序列。启动子具有通常位于靠近编码序列5′末端的转录起始区。该转录起始区通常包括RNA聚合酶结合位点和转录起始位点。被称为操纵基因的第二个结构域可以存在并且与相邻的RNA聚合酶结合位点重叠,RNA合成从所述位点开始。所述操纵基因允许对转录进行负调控(诱导型),这是因为基因阻抑蛋白能够结合所述操纵基因,并因此抑制特定基因的转录。在不存在负调控元件,如所述操纵基因的情况下可以进行组成型表达。另外,可以通过基因激活蛋白结合序列实现正调控,所述序列如果存在的话,它通常位于RNA聚合酶结合序列的近端(5′)。基因激活蛋白的例子是分解代谢物激活剂蛋白(CAP),它有助于启动lac操纵子在大肠杆菌中的转录(Raibaud等,Ann.Rev.Genet.,18173(1984))。因此,受调控的表达可能是正的或负的,以便增强或减弱转录。
编码代谢途径酶的序列提供了特别有用的启动子序列。例子包括来自糖代谢酶的启动子序列,如半乳糖、乳糖(lac)(Chang等,Nature,1981056(1977))和麦芽糖。其他例子包括来自生物合成酶的启动子序列,如色氨酸(trp)(Goeddel等,N.A.R.,84057(1980);Yelverton等,N.A.R.,9731(1981);美国专利号4,738,921;和EPO公开号036 776和121 775)。β-内酰胺酶(bla)启动子系统(Weissmann,“The cloning of interferon and othermistakes”,inInterferon 3(ed.I.Gresser),1981)和噬菌体λPL(Shimatake等,Nature,292128(1981))和T5(美国专利号4,689,406)启动子系统也提供了有用的启动子序列。其他启动子是小球藻病毒启动子(美国专利号6,316,224)。
自然界不存在的合成启动子也可以用作细菌启动子。例如,可以将一种细菌或噬菌体启动子的转录激活序列与另一种细菌或噬菌体启动子的操纵子序列结合,以便产生合成的杂合启动子(美国专利号4,551,433)。例如,tac启动子是杂合的trp-lac启动子,它是通过lac阻抑物调控的,并且由trp启动子和lac操纵子序列组成(Amann等,Gene,25167(1983);de Boer等,Proc.Natl.Acad.Sci.USA,8021(1983))。另外,细菌启动子可以包括天然存在的非细菌来源的启动子,它具有结合细菌RNA聚合酶并且起始转录的能力。具有非细菌来源的天然存在的启动子也可以与相容的RNA聚合酶偶联,以便产生某些基因在原核生物中的高水平表达。噬菌体T7RNA聚合酶/启动子系统是偶联的启动子系统的例子(Studier等,J.Mol.Biol.,189113(1986);Tabor等,Proc.Natl.Acad.Sci.USA,821074(1985))。另外,杂合启动子还可以由噬菌体启动子和大肠杆菌操纵基因区组成(EPO公开号267 851)。
可以将具有诸如杆状病毒启动子的昆虫启动子的表达盒用于在昆虫细胞中表达多肽。杆状病毒启动子是能够结合杆状病毒RNA聚合酶并且起始编码序列转录成mRNA的任何DNA序列。启动子具有通常位于靠近编码序列的5′末端的转录起始区。该转录起始区通常包括RNA聚合酶结合位点和转录起始位点。可以存在被称为增强子的第二个结构域,并且通常位于结构基因的远端。杆状病毒启动子可以是可调型启动子或组成型启动子。有用的启动子序列可以从结构基因上获得,该基因随后在病毒感染周期中转录。其例子包括来自编码杆状病毒多角体蛋白基因的序列(Friesen等,“The Regulation ofbaculovirus Gene Expression”,inThe Molecular Biology ofBaculoviruses(ed.Walter Doerfler),1986;和EPO公开号127839和155 476),以及编码杆状病毒p10蛋白的基因(Vlak等,J.Gen.Virol.,69765(1988))。
能在酵母中起作用的启动子为本领域普通技术人员所公知。除了RNA聚合酶结合位点和转录起始位点之外,酵母启动子还可以具有被称为上游激活序列的第二个区。所述上游激活序列允许调控可能诱导的表达。在不存在上游激活序列的情况下,发生组成型表达。受调控的表达可以是正的或负的调控,以便增强或减弱转录。
用于酵母中的启动子可以从编码在代谢途径中有活性的酶的酵母基因获得。所述基因的例子包括醇脱氢酶(ADH)(EPO公开号284044)、烯醇化酶、葡糖激酶、葡糖-6-磷酸异构酶、甘油醛-3-磷酸脱氢酶(GAP或GAPDH)、己糖激酶、磷酸果糖激酶、3-磷酸甘油酸变位酶和丙酮酸激酶(PyK)。(EPO公开号329 203)。编码酸性磷酸酶的酵母PHO5基因同样提供了有用的启动子序列。(Myanohara等,Proc.Natl.Acad.Sci.USA,801(1983))。
还可以将非天然存在的合成启动子用于在酵母中表达。例如,来自一种酵母启动子的上游激活序列可以与另一种酵母启动子的转录激活区连接,产生合成的杂合启动子。所述杂合启动子的例子包括与GAP转录激活区连接的ADH调控序列(美国专利号4,876,197和4,880,734)。杂合启动子的其他例子包括由ADH2、GAL4、GAL10或PHO5基因的调控序列与诸如GAP或PyK的糖酵解酶基因的转录激活区组合组成的启动子(EPO公开号164 556)。另外,酵母启动子可以包括天然存在非酵母来源的启动子,它具有结合酵母RNA聚合酶和起始转录的能力。所述启动子的例子为本领域所公知(Cohen等,Proc.Natl.Acad.Sci.USA,771078(1980);Henikoff等,Nature,283835(1981);Hollenberg等,Curr.Topics Microbiol.Immunol.,96119(1981);Hollenberg等,“The Expression ofBacterial Antibiotic Resistance Genes in the YeastSaccharomyces cerevisiae”,inPlasmids of Medical,Environmental and Commercial Importance(eds.K.N.Timmis和A.Puhler),1979;Mercerau-Puigalon等,Gene,11163(1980);Panthier等,Curr.Genet.,2109(1980))。
本领域所公知的很多哺乳动物启动子可以与本发明的表达盒组合使用。哺乳动物启动子通常具有转录起始区,它通常靠近所述编码序列的5′末端,以及TATA盒,它通常位于转录起始位点上游25-30个碱基对(bp)。所述TATA盒被认为能指导RNA聚合酶II在正确的位点开始RNA合成。哺乳动物启动子还可以包括上游启动子元件,其通常位于TATA盒上游100-200bp之内。上游启动子元件决定了转录起始的速度,并且能够沿任一方向起作用(Sambrook等,“Expression of Cloned Genes in Mammalian Cells”,inMolecularCloningA Laboratory Manual,2nd ed.,1989)。
哺乳动物病毒基因通常是高水平表达的,并且具有宽的宿主范围;因此,编码哺乳动物病毒基因的序列通常能提供有用的启动子序列。例子包括来自SV40早期启动子、小鼠乳腺瘤病毒LTR启动子、腺病毒主要晚期启动子(Ad MLP)和单纯疱疹病毒启动子。另外,来自非病毒基因的序列,如鼠类金属硫蛋白基因也提供了有用的启动子序列。表达可以是组成型的或可调型的。
哺乳动物启动子还可以与增强子缔合。增强子的存在通常能加强来自相关启动子的转录。增强子是调控DNA序列,它在与同源或异源启动子连接时能刺激转录最高1000倍,使合成在正常的RNA起始位点开始。当增强子沿正常或翻转方向位于转录起始位点上游或下游,或距离启动子超过1000个核苷酸时是有活性的。(Maniatis等,Science,2361237(1987);Alberts等,Molecular Biology ofthe Cell,2nd ed.,1989))。来自病毒的增强子元件多数情况下是有用的,因为它们通常具有宽的宿主范围。例子包括SV40早期基因增强子(Dijkema等,EMBO J.,4761(1985)和衍生自劳斯肉瘤病毒(Gorman等,Proc.Natl.Acad.Sci.USA,796777(1982b))和来自人巨细胞病毒(Boshart等,Cell,41521(1985))的长末端重复序列(LTR)的增强子/启动子。另外,某些增强子是可以调控的,并且只有在存在诸如激素或金属离子的诱导物的情况下才有活性(Sassone-Corsi和Borelli,Trends Genet.,2215(1986);Maniatis等,Science,2361237(1987))。
可以理解的是,可以将很多启动子和相关的调控元件用于本发明的表达盒中,以便转录编码的多肽。提供上述启动子只是作为例子,而不被认为是对本发明范围内所包含的启动子的全面的列举。
本发明的表达盒可以包括用于提高编码本发明的结合剂的mRNA的翻译效率的核酸序列。所述增强了的翻译可用于提高所述结合剂的生产。有效的核糖体结合位点的存在可用于在原核生物中进行基因表达。在细菌mRNA中,具有六个核苷酸的保守片段,Shine-Dalgarno序列通常位于起始AUG密码子的上游。(Shine等,Nature,25434(1975))。该序列被认为能通过核糖体结合位点和大肠杆菌16SrRNA的3′末端之间的碱基配对促进核糖体结合。(Steitz等,“Genetic signals and nucleotide sequences in messenger RNA”,inBiological Regulation and DevelopmentGene Expression(ed.R.F.Goldberger),1979))。所述核糖体结合位点或它的可操作的衍生物包括在本发明表达盒的范围中。
翻译起始序列可以来自任何表达的大肠杆菌基因,并且可以用在本发明的表达盒中。优选的是,所述基因是高度表达的基因。翻译起始序列可以通过标准重组方法、合成技术、纯化技术或它们的组合获得,这些方法都是众所周知的。(Ausubel等,Current Protocols inMolecular Biology,Green Publishing Associates and WileyInterscience,NY.(1989);Beaucage和Caruthers,Tetra.Letts.,221859(1981);VanDevanter等,Nucleic Acids Res.,126159(1984)。另外,翻译起始序列可以从多个供货商那里购买(OperonTechnologies;Life Technologies Inc,Gaithersburg,MD)。在优选实施方案中,使用T7前导序列。所述T7标记前导序列来自高度表达的T7基因10顺反子。翻译起始序列的其他例子包括,但不局限于,麦芽糖结合蛋白(Mal E基因)起始序列(Guan等,Gene,6721(1997)),它存在于pMalc2表达载体中(New England Biolabs,Beverly,Mass.),以及下列基因的翻译起始序列硫氧还蛋白基因(Novagen,Madison,WI)、谷胱甘肽-S-转移酶基因(Pharmacia,Piscataway,N.J.)、β-半乳糖苷酶基因、氯霉素乙酰转移酶基因和大肠杆菌Trp E基因(Ausubel等,1989,Current Protocols inMolecular Biology,Chapter 16,Green Publishing Associates andWiley Interscience,NY)。
真核mRNA不包括Shine-Dalgarno序列。相反,翻译起始密码子的选择通常是由它与位于mRNA 5′末端的帽的接近程度决定的。紧位于真核mRNA起始密码子周围的的核苷酸影响翻译的效率。因此,本领域技术人员可以确定哪些核酸序列会增强由本发明表达盒所编码的多肽的翻译。所述核酸序列属于本发明的范围。
本发明的载体中还可以包括终止序列。通常,由细菌识别的转录终止序列是位于由翻译终止密码子3′末端的调控区,并因此与启动子一起位于编码序列旁侧。这些序列能够指导mRNA的转录,所述mRNA能够翻译成由所述DNA编码的多肽。转录终止序列通常包括具有大约50个核苷酸的DNA序列,能够形成茎环状结构,该结构有助于终止转录。例子包括来自具有强启动子的基因的转录终止序列,如大肠杆菌中的trp基因以及其他生物合成基因。
通常,由哺乳动物细胞识别的转录终止和多腺苷酸化序列是位于翻译终止密码子3′末端的调控区,因此与启动子元件一起位于编码序列旁侧。成熟的mRNA的3′末端是通过位点特异性转录后切割和多腺苷酸化形成的(Birnstiel等,Cell,41349(1985);Proudfoot和Whitelaw,“Termination and 3′end processing of eukaryoticRNA”,inTranscription and Splicing(eds.B.D.Hames和D.M.Glover)1988;Proudfoot,Trends Biochem.Sci.,14105(1989))。这些指导mRNA转录的序列能够翻译成由DNA编码的多肽。转录终止子/多腺苷酸化信号的例子包括来自SV40的信号(Sambrook等,“Expression of cloned genes in culturedmammalian cells”,inMolecular CloningALaboratory Manual,1989)。
由酵母所识别的转录终止序列是通常位于翻译终止密码子3′的调控区。可用作酵母和昆虫表达系统中的转录终止序列的例子是众所周知的(Lopez-Ferber等,Methods Mol.Biol.,3925(1995);King和Possee,The baculovirus expression system.A laboratoryguide.Chapman and Hall,London,英国(1992);Gregor和Proudfoot,EMBO J.,174771(1998);O′Reilly等,Baculovirusexpression vectorsa laboratory manual.W.H.Freeman &Company,New York,N.Y.(1992);Richardson,Crit.Rev.Biochem.Mol.Biol.,281(1993);Zhao等,Microbiol.Mol.Biol.Rev.,63405(1999))。
正如上文所指出的,任何载体都可用于制备本发明的文库。可以使用的载体包括,但不局限于能够在原核生物和真核生物中复制的载体。例如,可以使用能在细菌、酵母、昆虫细胞和哺乳动物细胞中复制的载体。载体的例子包括质粒、噬菌粒、噬菌体、病毒、粘粒和F-因子。
本发明包括本发明的核酸构建体和文库能够插入并且在体外或体内复制的任何载体。可以将特定载体用于特定细胞类型。另外,可以将穿梭载体用于在超过一种细胞类型中克隆并且复制。所述穿梭载体为本领域所公知。所述核酸构建体或文库可以在宿主细胞中以染色体外形式携带或者可以整合到宿主细胞染色体上。有多种载体的例子为本领域所公知,并且可以通过商业渠道获得。(Sambrook和Russell,Molecular CloningA Laboratory Manual,3rd edition(2001年1月15日)Cold Spring Harbor Laboratory Press,ISBN0879695765;New England Biolab,Beverly,MA;Stratagene,LaJolla,CA;Promega,Madison,WI;ATCC,Rockville,MD;CLONTECH,Palo Alto,CA;Invitrogen,Carlabad,CA;Origene,Rockville,MD;Sigma,St.Louis,MO;Pharmacia,Peapack,N.J.;USB,Cleveland,OH)。所述载体还提供了很多启动子和其他调控元件,本领域技术人员可以通过使用公知的重组技术将它们包括在本发明的核酸构建体中。
用于诸如细菌细胞的原核生物宿主中的载体包括复制系统,从而使它保持在所述宿主中,用于表达或用于克隆和扩增。另外,载体能够以高的或低的拷贝数存在于细胞中。一般,有大约5-大约200,通常大约10-大约150个拷贝的高拷贝数载体存在于宿主细胞中。含有高拷贝数载体的宿主细胞优选包括至少大约10个,更优选至少大约20个质粒载体。一般,大约1-10个,且通常大约1-4个拷贝的低拷贝数的载体存在于宿主细胞中。载体的拷贝数是通过按照本领域公知方法筛选不同的复制起点控制的。Sambrook和Russell,MolecularCloningA Laboratory Manual,3rd edition(2001年1月15日)Cold Spring Harbor Laboratory Press,ISBN0879695765。
可以通过使用整合载体将包括表达盒的核酸构建体整合到细菌宿主细胞的基因组中。整合载体通常包括至少一个与细菌染色体同源的序列,它使得所述载体能够整合。整合被认为是通过载体上的同源DNA和细菌染色体之间的重组事件产生的。例如,用来自各种芽孢杆菌属(Bacillus)菌株的DNA构建的整合载体整合到了芽孢杆菌属染色体中(EPO公开号127 328)。整合载体还可以包括噬菌体或转座子序列。
染色体外的载体和整合载体可以包括选择标记,以便选择业已转化了的细菌菌株。选择标记能够在细菌宿主中表达,并且可以包括使得细菌能抗诸如氨苄青霉素、氯霉素、红霉素、卡那霉素(新霉素)和四环素的药物的基因(Davies等,Ann.Rev.Microbiol.,32469(1978))。选择标记还可以包括生物合成基因,如组氨酸、色氨酸和亮氨酸生物合成途径中的基因。
业已开发了多种染色体外的载体或整合载体,用于转化到很多细菌中。例如,业已开发了以下细菌的载体枯草芽孢杆菌(B.Subtilis)(Palva等,Proc.Natl.Acad.Sci.USA,795582(1982);EPO公开号036 259和063 953;PCT公开号WO84/04541),大肠杆菌(Shimatake等,Nature,292128(1981);Amann等,Gene,40183(1985);Studier等,J.Mol.Biol.,189113(1986);EPO公开号036 776、136 829和136 907)),乳脂链球菌(Streptococcus cremoris)(Powell等,Appl.Environ.Microbiol.,54655(1988));浅青紫链球菌(Streptococcuslividans)(Powell等,Appl.Environ.Microbiol.,54655(1988))和浅青紫链霉菌(Streptomyces lividans)(美国专利号4,745,056)。有多种载体还可以通过商业渠道获得(New EnglandBiolabs,Beverly,MA;Stratagene,La Jolla,CA)。
可以将很多载体用于本发明的表达载体或文库,它们提供了结合剂在酵母中的选择和表达。所述载体包括,但不局限于,质粒和酵母人工染色体。所述载体优选具有两个复制系统,因此能够例如在酵母中维持表达,并且在原核宿主中维持克隆和扩增。所述酵母-细菌穿梭载体的例子包括YEp24(Botstein,等,Gene,817(1979)),pCl/1(Brake等,Proc.Natl.Acad.Sci.USA,814642(1984))和YRp17(Stinchcomb等,J.Mol.Biol.,158157(1982))。
表达载体还可以与整合载体一起整合到酵母基因组中。整合载体通常包括至少一个与酵母染色体同源的序列,它使得所述载体能够整合,并且优选包括位于本发明表达盒旁侧的两个同源序列。整合似乎是通过所述载体上的同源DNA和酵母染色体之间的重组事件发生的。(Orr-Weaver等,Methods in Enzymol.,101228(1983))。通过选择用于包含在所述载体上的合适的同源序列,可以使整合载体针对酵母上的特定基因座。可以整合一个或多个表达盒,这些表达盒能够影响生产的重组蛋白的水平。(Rine等,Proc.Natl.Acad.Sci.USA,806750(1983))。包含在所述载体中的染色体序列能够以单一片段形式出现在所述载体上,它导致了整个载体的整合,或在所述载体上包括两个与染色体上的相邻的片段同源并且位于表达盒旁侧的片段,它能够导致只有所述表达盒的稳定整合。
染色体外的载体和整合表达载体可以包括选择标记,以便能够选择业已转化过的酵母菌株。选择标记可以包括,但不局限于能够在酵母宿主中表达的生物合成的基因,如ADE2、HIS4、LEU2、TRP1和ALG7,和G418抗性基因,它能分别赋予酵母细胞对衣霉素和G418的抗性。另外,选择标记还可以赋予酵母在存在诸如金属的毒性化合物的情况下生长的能力。例如,CUP1的存在使得酵母能够在存在铜离子的情况下生长。(Butt等,Microbiol.Rev.,51351(1987))。
业已开发了用于转化到很多酵母中的很多载体。例如,业已开发了用于以下酵母的载体白色假丝酵母(Candida albicans)(Kurtz等,Mol.Cell.Biol.,6142(1986))、麦芽糖假丝酵母(Candidamaltose)(Kunze等,J.Basic Microbiol.,25141(1985))、多形汉逊氏酵母(Hansenula polymorpha)(Gleeson等,J.Gen.Microbiol.,1323459(1986);Roggenkamp等,Mol.Gen.Genet.,202302(1986))、脆壁克鲁维氏酵母(Kluyveromyces fragilis)(Das等,J.Bacteriol.,1581165(1984))、乳克鲁维氏酵母(Kluyveromyces lactis)(De Louvencourt等,J.Bacteriol.,154737(1983);van den Berg等,Bio/Technology,8135(1990))、季也蒙氏毕赤氏酵母(Pichia guillerimondii)(Kunze等,J.BasicMicrobiol.,25141(1985))、巴斯德毕赤氏酵母(Pichia pastoris)(Cregg等,Mol.Cell.Biol.,53376,1985;美国专利号4,837,148和4,929,555)、啤酒糖酵母(Saccharomyces cerevisae)(Hinnen等,Proc.Natl.Acad.Sci.USA,751929(1978);Ito等,J.Bacteriol.,153163(1983))、粟酒裂殖糖酵母(Schizosaccharomyces pombe)(Beach和Nurse,Nature,300706(1981))和解脂耶氏酵母(Yarrowia lipolytica)(Davidow等,Curr.Genet.,1039(1985);Gaillardin等,Curr.Genet.,1049(1985))。
业已开发了用于感染到若干昆虫细胞中的杆状病毒载体,并且可将其用于生产编码本发明结合剂多肽的核酸构建体。例如,业已开发了用于埃及伊蚊(Aedes aegypti)、苜蓿丫纹夜蛾(Autographacalifornica)、家蚕(Bombyx mori)、黑腹果蝇(Drosophilamelanogaster)、草地夜蛾(spodoptera frugiperda)和粉纹夜蛾(Trichoplusia ni)的重组杆状病毒(PCT公开号WO89/046699;Carbonell等,J.Virol.,56153(1985);Wright,Nature,321718(1986);Smith等,Mol.Cell.Biol.,32156(1983);并且一般参见Fraser等,In Vitro Cell.Dev.Biol.,25225(1989))。所述杆状病毒载体可用于将表达盒导入昆虫,并且提供结合剂多肽在昆虫细胞中的表达。
用于生产插入杆状病毒载体中的本发明的表达盒的方法在本领域是现有的。简单地讲,通过使用常用的重组方法将本发明的表达盒插入转移载体,通常是包括杆状病毒基因组片段的细菌质粒。所述质粒还可以包括多角体蛋白多腺苷酸化信号(Miller等,Ann.Rev.Microbiol.,42177(1988))和原核选择标记,如氨苄青霉素抗性和复制起点,以便在大肠杆菌中选择和繁殖。用于将外源基因导入AcNPV的方便的转移载体是pAc373。业已设计了本领域技术人员所公知的很多其他载体。所述载体是pVL985(Luckow和Summers,Virology,1731(1989))。
将野生型杆状病毒基因组和具有本发明的核酸构建体的转移载体转染到昆虫宿主细胞中,在这里,所述载体和野生型病毒基因组发生重组。将核酸构建体导入杆状病毒中所需位点的方法在本领域中是现有的。(Summers和Smith,Texas Agricultural Experiment StationBulletin No.1555,1987.Smith等,Mol.Cell.Biol.,32156(1983);和Luckow和Summers,Virology,1731(1989))。例如,可以通过同源双交换重组插入诸如多角体蛋白基因的基因;还可以插入被工程改造成需要的杆状病毒基因的限制酶位点中(Miller等,Bioessays,491(1989))。
表达包装的重组病毒,并且鉴定和纯化重组噬菌斑。用于杆状病毒和昆虫细胞表达系统的材料和方法能够以试剂盒形式通过商业渠道获得。(Invitrogen,San Diego,Calif.,美国(“MaxBac”试剂盒))。这些技术为本领域普通技术人员所公知,并且充分描述于以下文献中Summers和Smith,Texas Agricultural ExperimentStation Bulletin No.1555,1987。
业已发开了基于质粒的表达系统,可将它用于将本发明的核酸构建体导入昆虫细胞,并且生产结合剂多肽。(McCarroll和King,Curr.Opin.Biotechnol.,8590(1997))。这些质粒提供了生产用来生产结合剂多肽的重组病毒的替代形式。
可以将本发明的核酸构建体、表达载体或文库插入本领域所公知的或可以通过商业渠道获得的任何哺乳动物载体中。(CLONTECH,Carlsbad,CA;Promega,Madision,WI;Invitrogen,Carlsbad,CA)。所述载体可以包括其他元件,如具有功能性剪接供体和受体位点的增强子和内含子。核酸构建体可以在染色体外维持或者可以整合到宿主细胞的染色体DNA上。哺乳动物载体包括来自动物病毒的载体,它需要反式作用因子以便复制。例如,包括乳多空病毒,如SV40(Gluzman,Cell,23175(1981))或多瘤病毒的复制系统的载体,能够在存在合适的病毒T抗原的情况下以极其高的拷贝数复制。哺乳动物载体的其他例子包括来自牛乳头瘤病毒和EB病毒的载体。另外,所述载体可以具有两个复制系统,以便它能够例如,在哺乳动物细胞中维持表达,并且在原核宿主中维持克隆和扩增。所述哺乳动物-细菌穿梭载体的例子包括pMT2(Kaufman等,Mol.Cell.Biol.,9946(1989))和pHEBO(Shimizu等,Mol.Cell.Biol.,61074(1986))。
本发明涉及包括本发明的文库、本发明的表达载体或核酸的细胞。所述细胞可用于表达结合剂多肽。所述细胞还可用于扩增核酸构建体。很多细胞适合扩增核酸构建体,并且用于表达结合剂多肽。所述细胞可以是原核细胞或真核细胞。
在很多实施方案中,细菌被用作宿主细胞。细菌的例子包括,但不局限于,革兰氏阴性和革兰氏阳性生物。大肠杆菌是用于筛选文库、表达结合剂多肽和扩增核酸构建体的理想生物。很多可以公开获得的大肠杆菌菌株包括K-菌株,如MM294(ATCC 31,466);X1776(ATCC 31,537);KS 772(ATCC 53,635);JM109;MCl061;HMS174;和B-菌株BL21。可以将重组负型菌株用于核酸构建体扩增,以便避免重组事件。所述重组事件可能去除可读框的多联体,以及导致核酸构建体失活。另外,不能表达选择的蛋白酶的细菌菌株也可用于表达结合剂多肽,以便减少所表达的多肽的蛋白水解加工。所述菌株的一种例子是Y1090hsdR,它是lon蛋白酶缺陷型的。
还可将真核细胞用于生产结合剂多肽并且用于扩增核酸构建体。当需要额外的细胞加工时,将真核细胞用于生产结合剂多肽。例如,当需要多肽的糖基化时,结合剂多肽可以在真核细胞中表达。可以使用的真核细胞系的例子包括,但不局限于AS52、H187、小鼠L细胞、NIH-3T3、HeLa、Jurkat、CHO-K1、COS-7、BHK-21、A-431、HEK293、L6、CV-1、HepG2、HC11、MDCK、家蚕细胞、蚊子细胞和酵母。
用于将外源DNA导入细菌的方法在本领域是现有的,并且通常包括转化用CaCl2或诸如二价阳离子和DMSO的其他试剂处理过的细菌。还可以通过电穿孔、使用噬菌体或弹道转化(ballistictransformation)将DNA导入细菌细胞。转化方法通常根据要转化的细菌物种而有变化(Masson等,FEMS Microbiol.Lett.,60273(1989);Palva等,Proc.Natl.Acad.Sci.USA,795582(1982);EPO公开号036 259和063 953;PCT公开号WO84/04541[芽孢杆菌属(Bacillus)],Miller等,Proc.Natl.Acad.Sci.USA,8856(1988);Wang等,J.Bacteriol.,172949(1990)[弯曲杆菌属(Campylobacter)],Cohen等,Proc.Natl.Acad.Sci.USA,692110(1973);Dower等,Nuc.Acids Res.,166127(1988);Kushner,“An improved method for transformation of Escheriohiacoli with ColE 1-derived plasmids”,inGenetic EngineeringProceedings of the International Symposium on GeneticEngineering(eds.H.W.Boyer和S.Nicosia),1978;Mandel等,J.Mol.Biol.,53159(1970);Taketo,Biochim.Biophys.Acta,949318(1988)[大肠杆菌],Chassy等,FEMS Microbiol.Lett.,44173(1987)[乳杆菌属(Lactobacillos)],Fiedler等,Anal.Biochem,17038(1988)[假单胞菌属(Pseudomonas)],Augustin等,FEMS Microbiol.Lett.,66203(1990)[葡萄球菌属(Staphylococcus)],Barany等,J.Bacteriol.,144698(1980);Harlander,“Transformation of Streptococcus lactis byelectroporation”,inStreptococcal Genetics(ed.J.Ferretti和R.Curtiss III),1987;Perry等,Infec.Immun.,321295(1981);Powell等,Appl.Environ.Microbiol.,54655(1988);Somkuti等,Proc.4th Eur.Cong.Biotechnology,1412(1987)[链球菌属(Streptococcus)]。
用于将外源DNA导入酵母宿主的方法在本领域中也是现有的,并且通常包括转化用碱性阳离子处理过的原生质球或完整的酵母细胞。转化方法通常根据要转化的酵母物种而有变化(Kurtz等,Mol.Cell.Biol.,6142(1986);Kunze等,J.Basic Microbiol.,25141(1985)[假丝酵母属(Candida)],Gleeson等,J.Gen.Microbiol.,1323459(1986);Roggenkamp等,Mol.Gen.Genet.,202302(1986)[汉逊氏酵母属(Hansenula)],Das等,J.Bacteriol.,1581165(1984);De Louvencourt等,J.Bacteriol.,754737(1983);Van den Berg等,Bio/Technology,8135(1990)[克鲁维氏酵母属(Kluyveromyces)],Cregg等,Mol.Cell.Biol.,53376(1985);Kunze等,J.Basic Microbiol.,25141(1985);美国专利号4,837,148和4,929,555[毕赤氏酵母属(Pichia)],Hinnen等,Proc.Natl.Acad.Sci.USA,751929(1978);Ito等,J.Bacteriol.,153163(1983)[糖酵母属(Saccharomyces)],Beach和Nurse,Nature,300706(1981)[裂殖糖酵母属(Schizosaccharomyces)]和Davidow等,Curr.Genet.,1039(1985);Gaillardin等,Curr.Genet.,1049(1985)[耶氏酵母属(Yarrowia)])。
通常使用重组病毒,如本文所描述的杆状病毒将外源DNA导入昆虫细胞。
用于将异源多核苷酸导入哺乳动物细胞的方法为本领域所公知,并且包括脂类-介导的转染、葡聚糖-介导的转染、磷酸钙沉淀、1,5-二甲基-1,5-二氮十一亚甲基聚甲溴化物(polybrene)-介导的转染、原生质体融合、电穿孔、将多核苷酸被囊化在脂质体中、生物弹法(biollistics)以及将DNA直接显微注射到细胞核中。方法的选择依赖于要转化的细胞,因为某些类型的转化方法对一种细胞类型来说比其他类型更有效(Felgner等,Proc.Natl.Acad.Sci.,847413(1987);Felgner等,J.Biol.Chem.,2692550(1994);Graham和van der Eb,Virology,52456(1973);Vaheri和Pagano,Virology,27434(1965);Neuman等,EMBO J.,1841(1982);Zimmerman,Biochem.Biophys.Acta.,694227(1982);Sanford等,Methods Enzymol.,217483(1993);Kawai和Nishizawa,Mol.Cell.Biol.,41172(1984);Chaney等,Somat.Cell Mol.Genet.,12237(1986);Aubin等,Methods Mol.Biol.,62319(1997))。另外,用于转染真核细胞的很多商业化试剂盒和试剂是现有的。
在将核酸转化或转染到细胞中之后,可以通过使用选择标记选择所述细胞中核酸的存在。选择标记通常是在被导入受体细胞的核酸上编码的。不过,选择标记的共转染还可以在将核酸导入宿主细胞期间使用。能够在受体宿主细胞中表达的选择标记可以包括,但不局限于能赋予受体宿主细胞对以下药物的抗性的基因如放线菌素C1、放线菌素D、两性霉素、氨苄青霉素、博来霉素、羧苄青霉素、氯霉素、遗传霉素、艮他霉素、潮霉素B、单硫酸卡那霉素、氨甲蝶呤、丝裂霉素C、硫酸新霉素B、新生霉素钠盐、青霉素G钠盐、二盐酸嘌呤霉素、利福平、硫酸链霉素、盐酸四环素和红霉素(Davies等,Ann.Rev.Microbiol.,32469(1978))。选择标记还可以包括生物合成基因,如组氨酸、色氨酸和亮氨酸生物合成途径中的基因。在转染和转化宿主细胞之后,使所述细胞与合适的选择试剂接触。
例如,如果用编码对氨苄青霉素抗性的核酸构建体转化细菌的话,那么可将转化过的细菌放置在含有氨苄青霉素的琼脂平板上。然后,可以抑制没有导入所述核酸构建体的细胞生长以便产生菌落,而成功地转化了的细菌能够产生菌落。可以将类似系统用于选择其他类型的细胞,包括原核细胞和真核细胞。
因此,本发明涉及用于生成和筛选结合剂多肽文库的方法,这通过分子取代和对包括编码通用结合剂多肽的核酸的载体进行操作来实现。
结合剂的计算机设计本发明还提供了用于通过筛选随机结合剂的“虚拟”文库鉴定结合剂多肽的方法。所开发的计算机筛选方法是上文所描述的实际文库构建和筛选方法的替代(或平行的)途径。
所述计算机筛选方法一般涉及将靶(或“抗原”)的已知三维结构用作起点,并且将所述靶结构首先配合入亲代或通用结合剂,然后逐渐最优化所述结合剂中的环接触序列(即功能性氨基酸),以便使有利的结合反应最大化。
然后可以通过本发明的计算机筛选方法生成结合剂多肽文库,以便提供能够与选择的靶分子相互作用的多种结合剂。可以靶定所述靶分子中的特殊位点或序列(即,搜索区),以便与由所述文库提供的所述结合剂多肽相互作用。
在图10中提供了本发明的计算机筛选方法的通用流程。该方法的第一个步骤是确定分子靶1302。所述分子靶是结合剂多肽能够与其相互作用的靶分子。所述结合剂的相互作用的环能够结合或者与所述靶分子相互作用。确定所述靶分子涉及输入有关所述靶的三维结构的数据,例如,所述靶分子中每一个原子的空间组织和原子坐标,预计所述靶分子能够与所述结合剂相互作用。
本领域技术人员可以选择任何目标靶蛋白、碳水化合物或核酸。例如,所述靶蛋白可以是抗原、抗体、酶、激素、受体、配体、DNA-结合蛋白、膜相关蛋白或任何结构蛋白。所述文库的结合剂多肽能够与它结合的输入或靶核酸位点的例子包括启动子、增强子、多腺苷酸化位点、内含子、剪接信号、终止信号和翻译前导序列。
可以确定所述靶分子上的靶搜索区,而不是确定所述靶的完整结构。所述搜索区确定了所述结合剂要与其相互作用或结合的位点的物理和化学特性。例如,搜索区可以包括所述靶分子上选择的相互作用位点中所有原子的x、y和z坐标。在确定搜索区时可以考虑的其他参数包括在所述输入或靶分子内原子的电荷、亲水性、疏水性、距离和取向。
本发明的计算机化方法的另一个步骤包括确定环肽序列的大小1304。正如本文所披露的,肽环可以具有不同的长度。例如,所述文库中的理想的环肽的长度可以为大约1-大约40个氨基酸。在某些实施方案中,在所述文库中的环肽的长度可以为大约2-大约30个氨基酸。在其他实施方案中,所述文库中的环肽的长度可以为大约2-大约20个氨基酸。所述文库中的某些环肽的长度为大约2-大约15个氨基酸。所述文库中理想的肽环的长度还可以为大约2-大约10个氨基酸,或大约2-大约9个氨基酸。这些氨基酸编码至少一个环相互作用结构域,它具有对靶分子的结合亲和力和特异性。因此,尽管可以使用多种环长度,但所选择的大小应当不会对β桶核心结构的稳定性产生负面影响,例如,如通过建模研究或远程分子动力学模拟所分析的。在一种实施方案中,所述肽长度大约为环(i)-(v)序列的长度,就是说,大约4-大约7个氨基酸。
可以筛选多种不同的环肽序列与所述靶分子上略微不同的区域的相互作用。所述筛选可以同时进行或顺序进行。在某些实施方案中,不同的环状序列的筛选是顺序进行的,这通过确定第一个环序列的最优化序列,确定所述靶分子和结合剂的方向,以便允许所述确定的环序列和所述靶分子之间的最佳相互作用,然后确定另一个环的氨基酸序列来实现。这样,靶和结合剂之间的相互作用就逐渐地确定了,并且只需要进行较少的停靠相互作用。
在考虑所述靶搜索区时,本领域技术人员可以考虑所述通用结合剂的三维结构。这是因为所述环肽序列在所述靶上的定位在很大程度上是通过这些环在亲代或通用结合剂上的位置确定的(参见,例如SEQ ID NO2、SEQ ID NO37、SEQ ID NO38和图6)。所述通用或亲代结合剂具有134个氨基酸,总分子量为12.8kDa。图6表示所述亲代结合剂的三维结构。所述结合剂的总体拓扑结构是通过中央二硫键(未示出)稳定的β夹心结构(通过箭标表示)。提供所述试剂的结合位点的五个环用与所述箭标连接的细链表示。
通过使用程序SwissModel将氨基酸序列(SEQ ID NO38)穿在camelld抗体的三维α碳主链上(Protein Databank中的结构1jtt.ent),制备了通用结合剂多肽的三维结构。使用程序ProMod将所述最佳穿线结果转化成三维结构,它包括氨基酸侧链位置。对这种最初的模型进行一轮模拟的退火,以便使侧链冲突最小化。通过几轮的SYBYL水平的几何最优化使所有的二面角和扭转形成正确的几何形状。使用GROMOS96参数设置进行最后一轮能量最小化,而不使用反应场。因此,业已最优化了为所述通用结合剂提供的氨基酸序列,以便提供高度稳定的β桶构象。
所述方法中可以包括的另一个步骤是确定环肽的氨基酸序列中每一个位置上的氨基酸的类型1306。在很多实施方案中,本领域技术人员可以选择所有的氨基酸,例如,所有二十种天然存在的氨基酸。可以将所有的氨基酸残基置于允许的Ramachandran空间中,以便检查对最佳空间和化学相互作用的配合。
不过,本领域技术人员还可以在所述环肽上的不同位置上选择施用不同化学和物理类型的氨基酸。因此,具有相关的物理结构、或具有特定的化学特性、或具有特定的溶解度特性的氨基酸可以形成用于所述环序列中特定位置的氨基酸类型。本领域技术人员可以选择在所述环肽的每一个位置上可以进行多少氨基酸取代。类似地,用户可以选择任意组合的氨基酸,以便放置在所述环肽的给定位置上。
例如,技术人员可以选择任何种类或类型的氨基酸以放置在给定位置上。所述氨基酸的种类可以是,例如以下类型遗传编码的L-氨基酸、天然存在的非遗传编码的L-氨基酸、合成的L-氨基酸、遗传编码的氨基酸的D-对映体、天然存在的非遗传编码的氨基酸的D-对映体或合成的D-氨基酸。其他类型的氨基酸包括亲水性氨基酸、疏水性氨基酸、半胱氨酸样氨基酸、酸性氨基酸、碱性氨基酸、极性氨基酸、芳族氨基酸、非极性氨基酸或脂族氨基酸。其他类型和种类氨基酸的例子如上文所提供的。
在另一个步骤中,可以对所述类型的氨基酸的每一个成员进行重复地取代或放入所述环肽的预定位置,以便生成输出文库文件1308。所述输出文库文件包括多种输出环肽序列,各自具有独特的肽序列。
所述方法中可以包括的另一个步骤是将所述输出文库文件与分子停靠程序联系1310。因此,所述输出文库文件被用作停靠程序的输入数据,所述程序将每一个环肽配合到所述靶分子上的搜索区。然后将所述通用结合剂的每一个环上的氨基酸配合到所述靶分子的分子结构。
所述分子停靠程序能够将多种输出环肽序列的每一个配合到所述搜索区,然后产生结合环-靶分子配合得分。所述结合环-靶分子配合得分是给定环肽序列如何与靶分子的搜索区相互作用、结合或配合的量度。具有结合环-靶分子配合得分的肽环通常能够与所述靶分子中选择的位点很好地相互作用、结合或配合。
在所述方法的另一个步骤中,可以通过结合环-靶分子配合得分对所述多种输出环肽序列进行分级1312。所述分级允许容易地评估哪一种环肽能够与所述靶分子中选择的位点最有效的相互作用、结合或配合。
所述方法中可以包括的另一个步骤是显示所述多种输出环肽序列的每一个和相关的结合环-靶分子配合得分1314。所述多种输出环肽序列的至少一部分能够与所述靶分子稳定地相互作用。因此,本领域技术人员可以选择列出所有输出环肽序列。
另外,仅显示出了具有最高得分的环肽的百分比,而不是要列举具有它们的相关的配合得分的所有可能的环肽序列。所述百分比是在分析之前或分析期间输入的。另外,所述程序可以随机地挑取所有可能的环肽序列的特定百分比,以便写出到最终的结构文件。所述百分比的选择可能限定输出文库文件的大小和/或最终环状序列的复杂性。
在一种实施方案中,称为MKBIND的程序用FORTRAN 77编写,其可用于自动鉴定与特定靶分子结合的环状氨基酸序列。将所述代码编译以在Rocketcalc,LLC Beowulf计算组上的LINUX下运行。代码的并行化导致了搜索时间的显著加快。
在图8中示出了MKBIND的通用程序流程的流程图。MKBIND程序流程图从确定所述亲代结合剂1502和靶1512开始。将有关所述亲代结合剂和所述靶分子的三维结构信息作为两种不同的数据文件输入。所述信息包括亲代或通用结合剂(例如SEQ ID NO2、SEQ ID NO4或SEQ ID NO38)和所述靶分子中所有原子的原子坐标。
可以选择并且确定所述靶上特定的搜索区1514。例如,当选择特定位点或“表位”用于结合时,或者当所述靶非常大,以致于只能在靶的选择的区域检查结合相互作用时,可以使用所述搜索区。用于所述靶搜索的搜索区可以由本领域技术人员人工确定。在某些实施方案中,可以通过挑取可以鉴定的重心(或可以鉴定的结构区域,如正方形或三角形或坐标),选择所述靶分子的一部分,所述部分可以位于所述靶分子中选择的原子坐标的中心。在某些实施方案中,所述可鉴定的中心(正方形或三角形)的深度从所述中心的平均表面上突出大约1-大约5(或大约3),至所述水平下大约相同的距离(以便得到较深的沟)。例如,一般的搜索区域可以为大约20×20×6。
然后输入停靠参数或其他标准1516,包括这样的变量,如力场的选择、静电约束、网格(grid)位置、网格间距和能量截止标准等。所述停靠参数与靶定义和/或搜索区构成了输出靶文件。
所述结合剂中的环状结构最初是不确定的。用户还可以输入环的数目以便同时随机化1504,就是说,用户可以挑取任意的环或所有的环进行搜索。挑取要进行搜索的环的氨基酸类型或其他氨基酸限制1506。可以在每一个位置上搜索所有二十种天然存在的氨基酸,或可以在特定位置上搜索氨基酸亚类(例如,疏水性氨基酸)。
一旦确定了所述环的氨基酸,所述程序就生成了所述环的原子坐标文件。所述程序生成了具有由用户确定的氨基酸大小和类型的所有环的坐标文件1508。例如,如果选择简并环的话,所述程序生成了沿环的全长包括所有氨基酸组合的简并环。所述程序还可应用简单的坐标转化,以将新的环锚定在所述结合剂结构上。所述程序还确定了在亲代结构中所述环的末端需要位于何处。因此,将限定类型氨基酸的每一个成员取代到每一个环的每一个位置上1508,以便生成结合剂输出文件,它包括一系列包含具有所有可能的环状序列的所有可能的结合剂的结构坐标文件。
所述结合剂输出文件和输出靶文件然后与停靠程序联系1510,1518。所述结合剂输出文件1510可以是规则的原子坐标文件。所述输出靶文件1518可以是确定所述氨基酸残基在网格区域上的原子坐标的文件,以及网格本身的xyz坐标。所有三维结构被MKBIND用作原子坐标文件。所述三维结构能够测量特定网格区域中环(i至v)和氨基酸侧链之间的键长和能量。
所述分子停靠程序使用灵活的停靠算法用靶停靠每一种结合剂1520。所述程序使所述结合剂的坐标相对于所述靶分子的固定坐标旋转和平移,从而在它围绕所述靶试剂的质心旋转时改变所述结合剂的三维坐标并且同时沿一个轴平移这些坐标。
因此,在生成结合环之后,将所得到的结构放入所述搜索网格的几何中心。从功能上讲,这意味着所述结合剂的环结合性表面位于所述靶分子的坐标网格体积的中心。然后使所述结合剂沿一个轴以0.1A的间距朝向所述靶表面移动(仍然在网格内),并且计算配合得分。然后将所述结构再移动0.1A。如果通过这种移动提高了配合得分的话,就进一步移动所述结合剂,直到得分变低。在该点上使它向外移动0.1A(达到所述最后的最佳得分),然后以相同的方式向上移动,然后向下移动,并且随后向左和向右移动。所有这样的运动和重新定位,导致了“配合的最佳场所”。
然后计算每一种结合剂变体的停靠得分或配合得分1522。配合得分是粘合剂和靶之间的非键合分子间能量的负值。例如,可以按下面所述方法计算所述配合得分。
配合得分=-[Eelect+Evdw+EHB]其中,Eelect是静电能量,Evdw是范德瓦耳斯项,而EHB是氢键能量。该经验能量函数是这三个独立的能量项的总和Σqiqj4πϵ0r+Σ(Aijrij12-Bjjrij6)+Σ((ArAD6-BrA4))cos(θA-H-D)]]>好的配合得分是正的非零数字,并且可以是,例如最高的配合得分。如果所述配合程度高,或具有最高得分的话1524,那么所述环状序列和所述结合剂变体坐标文件被保存1528。如果配合程度低,那么所述环状序列和所述结合剂变体坐标文件就被弃去1526。最好的N个序列构成了输出结果,如果用户这样选择的话可以对它们做进一步的分析。因此,可以重复所述操作顺序,直到所有要求的随机化都完成了或达到了用户确定的配合数1530。
一旦发现了最佳配合,就写出粘合剂坐标文件。将所述坐标转化成能体现靶原子坐标,从而用户可以将所述靶和粘合剂拖动到屏幕上并且查看(和检查)配合。如果搜索超过一个环的话,则列出第二个文件,该文件提供了不同的环的氨基酸序列和相关的配合得分。这使得本领域技术人员能够进行初步的序列分析,以便了解哪种类型的氨基酸在特定位置上是有利的。可以将该信息用于帮助限制进行强力搜索的量。因此,例如,如果半胱氨酸通常存在于环(i)的3号位置上的话,那么本领域技术人员就可以在MKBIND程序的开始就将半胱氨酸锁定在3号位置上。
为了节省磁盘空间,可以每次生成一个最佳环状序列,从而将最优化的环状序列插入所述亲代结合剂,然后再停靠非最优化的环状序列。可以实施测量所述配合的稳健性的得分函数。如果它们是最高得分配合或高得分配合的话,就将坐标文件保存下来。所有高得分环状序列可以作为脱机分析的输出结果提供(例如比对)。
本文所描述的函数或算法是在软件中实施的,或者,在一种实施方案中,进行软件和人工实施的程序的组合。所述软件包括计算机可执行的指令,该指令储存在计算机可读的介质上,如存储器或其他类型的存储装置。术语“计算机可读的介质”还被用于表示软件可以通过它传播的载波。另外,所述函数相应于模块,它们是软件、硬件、它们的任意组合的固件。根据需要在一个或多个模块中实施多个功能,并且所描述的实施方案仅仅是示例。所述软件是在数字信号处理器、ASIC、微处理器或其他类型的在计算机系统上操作的处理器上执行的,所述计算机系统如个人计算机、服务器或其他计算机系统。
在另一种实施方案中,本发明还涉及用于制备具有不同环肽序列的结合剂的系统(参见图11)。所述系统可以包括处理器1104。存储器1102和/或能够与处理器偶联的显示器1106。该系统还可以包括能够在处理器上执行的构造环肽序列成分1108,以便生成肽序列。所述系统还可以包括能够在处理器上执行的分子停靠成分1110,以便将结合剂或环状结构与靶结构配合在一起。所述系统还可以包括能够在处理器上执行的输出环肽序列成分1112,以便显示环肽序列。还可以包括其他成分,如能够在处理器上执行的输出结合剂成分1114,以便显示结合剂序列,特别是最高得分的结合剂序列。
处理器,如个人电脑(PC)上的微处理器是逻辑电路,它能响应并且处理驱动计算装置的基本指令。计算装置包括PCs、便携式电脑、通用计算机等。储存器是可存取到计算装置中的指令和数据的电子存储场所。在正常操作期间,储存器通常含有操作系统、应用程序和数据。存储器的类型包括随机存取存储器(RAM)、只读存储器(ROM)、可编程序存储器(PROM)和可擦除的可编程序ROM(EPROM)以及诸如硬盘驱动器和软盘的存储装置。显示器是计算机输出机构,它能给计算机用户显示文本且常常显示图像。显示器的例子包括打印机、显示器等。
在另一种实施方案中,本发明涉及机器可存取介质,它具有能够指导所述机器执行一种方法的相关的内容。该方法可以是上文所述方法之一。例如,如图8或10所示的一种方法,在上文对它有进一步的说明。
业已将上文所描述的MKBIND程序用于构建新型结合剂,该结合剂能够结合牛胰蛋白酶。将通用亲代结合剂(例如,SEQ ID NO38,参见图12)和牛胰蛋白酶(PDB代码1auj.ent)的最初的三维结构用作输入。所述计算机筛选方法鉴定了具有环i序列ITAVCHK(SEQID NO35)的最高得分的环变体结合剂。通过将该i序列插入所述亲代结合剂构建了实际的结合剂多肽。然后表达并且纯化所述结合剂变体。对这种修饰的结合剂进行测试,并且发现它具有对所述靶分子(牛胰蛋白酶)的亲和力。
因此,业已通过定点诱变调节并且改善了骆驼单一结构域抗体片段,以便产生通用结合剂,所述通用结合剂可以被容易地进一步进行改进,以便产生对特定靶分子具有高亲和力的结合剂。本发明的筛选方法使得研究人员能够提高亲和力、改变特异性或修饰结合剂的生物物理特征,所述结合剂是通过现代重组DNA技术生产的。本发明的筛选方法还使得可以进行快速和高效的靶(“抗原”)筛选,以便发现多种靶的最佳结合剂,包括以下毒性靶,如炭疽、肉毒杆菌毒素、篦麻毒蛋白和处理起来危险的其他试剂。
通过分子操作和计算机介导的方法获得的结合剂的特性可以通过本领域技术人员所公知的方法进一步评估。例如,可以评估通过本发明方法获得的所述结合剂的稳定性、结合亲和力和其他诸如此类的特性。可以通过对结合相互作用的标准测试评估所述结合剂结合一种或多种选择的靶,或不能结合可能存在于结合测定中的成分的能力。例如,可以通过以下方法检测和评估结合相互作用非变性凝胶层析、非变性聚丙烯酰胺凝胶电泳、等温滴定量热法(ITC)或对任何现有免疫测定方法的改良。下面将对所述免疫测定方法作进一步的描述。
使用方法本发明也涉及用于本文所描述的结合剂的定量和定性诊断测定和方法。根据本发明,所述结合剂可通过用本发明的结合剂取代抗体而用于目前使用抗体进行的任何测定或方法中。还可以对所述结合剂进行修饰,以便包括报道分子或其他分子,这些分子有利于将所述结合剂应用于所述测定或方法中。
可将本发明的结合剂用于结合、检测或鉴定任何靶。所述靶是可以作为抗原或抗原表位进行表征的任何分子。因此,靶可以是蛋白、肽、碳水化合物、脂蛋白、蛋白聚糖、酶、激素、哺乳动物抗原、细菌抗原、真菌抗原或病毒抗原。细菌、真菌或病毒靶基本上包括本领域技术人员感兴趣的任何单细胞生物或寄生物。所述生物包括细菌、真菌、酵母菌株和其他单细胞生物,例如,人免疫缺陷病毒(HIV)抗原、肝炎病毒抗原(HCV、HBV、HAV)、埃博拉(Ebola)病毒抗原、流感病毒抗原、冈氏弓形虫(Toxoplasmosis gondii)抗原、巨细胞病毒抗原、幽门螺杆菌(Helicobacter pylori)抗原、风疹抗原等。
在应用本发明的结合剂之前,所述靶通常存在于溶液中或者可以置于溶液中。在使用结合剂的特殊制剂时,所述靶不需要是纯溶液形式的。相反,靶可以是不纯的,并且可以将所述结合剂用于检测或分离所述靶。
可以将本发明的结合剂用于检测或分离被怀疑含有所述靶的任何方便样品中的靶。所述样品包括临床样品、生物学流体、组织样品等(例如,匀浆化的)。样品可以包括土壤、空气、水和其他从环境中获得的材料。细菌蛋白、病毒蛋白、植物组织、动物组织、动物流体等也可用作要检测的样品或应用本发明的结合剂。样品还包括生物学样品,如细胞、血液、血浆、血清、尿液、粘液、组织、细胞或组织匀浆物等。
在某些实施方案中,所述样品在检测或接触所述结合剂之前可以稀释。稀释可以通过添加任何与要检测的每一种样品和要使用的结合剂相容的任何流体进行。例如,当血清被用作样品时,可以用选自下述的一种或多种流体稀释磷酸缓冲盐溶液,pH7.0-7.4(以下称之为“PBS”),含有TWEEN 20TM的PBS(以下称之为“PBS T”);含有硫柳汞的PBS T(以下称之为“PBS TT”),含有明胶的PBS TT(以下称之为“PBS TTG”)和含有牛γ球蛋白的PBS TTG(以下称之为“PBS TTGG”)。稀度可以根据需要改变,例如,为大约1∶10至大约1∶10,000。
可以将本发明的结合剂应用于本领域技术人员所公知的任何免疫测定方法中。例如,所述免疫测定可以包括一种、两种或者甚至三种本发明的结合剂。所述免疫测定可以在溶液中或在基质上进行,例如,所述结合剂或靶与固体表面结合。可以改良以便应用本发明的结合剂的免疫测定的例子包括ELISA测定、表面等离子体共振测定、放射免疫测定、免疫组织化学测定等。
可以从本发明的各种结合剂制剂中选择适合夹心测定的成对的结合剂。所述结合剂对包括第一种高亲和力结合剂和第二种高亲和力结合剂。在“顺序的”夹心测定中,可以将固定化的结合剂用于结合靶,除去测试样品中未结合的部分,将结合的靶用于吸附第二种结合剂,并且随后分离结合的和未结合的材料。结合的第二种结合剂的量与测试样品中靶的量成正比。本发明的结合剂不需要仅应用于“顺序的”夹心测定-可有利地将它们用于同时的夹心测定中,这些测定需要更少的步骤和在检测过程中少有或没有洗涤。在“同时的”夹心测定中,在添加第二种结合剂之前不除去所述测试样品。
在一种实施方案中,使用了基于表面等离子体共振(SPR)的传感器系统。SPR是用于实时测量两个或更多个分子之间的相互作用的有用工具,而不用使用任何检测标记。参见McDonnell,J.M.(2001)“Surface plasmon resonance towards an understanding of themechanisms of biological molecular recognition”Curr.Opin.Chem.Biol.,5,572-577。
SPR是以光学现象为基础的,其中,所述反应依赖于接近使用的传感器芯片表面附近的折射率的改变,并且所述反应与所述表面结合的分析物的质量成比例。SPR能够连续地分析相互作用的每一个步骤,而其他方法在最后的步骤完成之前不能分析所述结果。因此,可以将连续流动技术用于由SPR提供的连续监测系统。
一般,SPR是按以下方法使用的。将选择的结合剂制剂固定在传感器表面(基质)上,然后让固定化的结合剂与可能含有靶的检测溶液接触,所述结合剂能够与所述靶结合。让该检测溶液连续流过所述传感器表面。可以在不添加任何其他试剂的条件下检测固定化的结合剂和所述靶之间的结合反应。可将能够与所述靶起反应的第二种结合剂用于检测在固定化的结合剂和检测溶液中的任何靶之间形成的第一种复合物。所述SPR反应或信号随着来自所述溶液中更多的靶、结合剂或靶-结合剂复合物结合到传感器表面上固定化的结合剂上而增强。例如,所述结合反应可以用Biacore SPR仪器检测。
SPR角度对生物传感器芯片的金表面上的层的组成敏感。因此,首先通过让缓冲液从所述结合剂-固定化芯片的表面上通过来测定基线SPR反应。靶与一种或多种结合剂的结合导致了所述表面上折射率的提高,从而改变了SPR角度,这是因为它与结合的材料的量成正比。在生物学系统中,目标亲和力通常是相当强的,并且分子量超过200道尔顿的靶通常能够相当精确地检测。一般,SPR是灵敏的技术,与很多其他技术相比它需要更小的样品大小和更少的处理时间。
SPR还可以在所述结合剂-靶相互作用期间监控缔合相和离解相(Myszka,1997;Ohlsonet al,1997)。一般的传感器图(sensorgram)由基线信号(反应单位(RU)不会随时间改变)和在注射样品之后的缔合相(它会产生随时间增强的反应单位)组成。如果反应速度足够快的话,那么当缔合和离解速度相等时可能达到稳态水平。恢复的缓冲液流动导致了离解的复杂,且能够记录离解动力学。因此,能够测定缔合和离解动力学。在需要的时间,可以注射再生溶液,以便除去与所述表面结合的靶分子,并且重新建立最初的反应单位值。
因此,选择若干种对所述靶具有好的至极好的或高亲和力的候选结合剂,以便用于所述SPR免疫测定。从所述高亲和力结合剂制剂中,选择至少一种高亲和力结合剂制剂以便固定在合适的基质上。
通过本领域技术人员可以获得的任何方法将选择的结合剂制剂固定在合适的基质上。所述结合剂可以直接与所述基质上的选择的官能团连接。或者,可以通过接头或间隔区将所述抗体直接连接在所述基质上。
例如,可以通过与链霉抗生物素蛋白(或生物素)的连接固定选择的结合剂,然后通过生物素(或链霉抗生物素蛋白)部分附着在所述基质上,所述部分与所述基质共价连接。或者,可以将链霉抗生物素蛋白/生物素的多层薄膜应用于SPR基质。可以将金薄膜蒸发在基质上,并且将生物素层固定在所述膜上。然后将单层的链霉抗生物素蛋白固定在所述生物素化的金表面上。链霉抗生物素蛋白是从阿维丁链霉菌(Streptomyces avidinii)中获得的四价蛋白,它具有位于该分子相反表面上的成对排列的四个生物素结合位点。链霉抗生物素蛋白膜一旦与生物素化的金表面结合,就可将它用作连接分子,以便与生物素化的结合剂结合。参见Morgan,H.和D.M.Taylor,“ASurface Plasmon Resonance Immunosensor Based on theStreptavidin-Biotin Complex,”Biosens.& Bioelect.,7,(1992),pages 405-410;Taylor,D.M.等,“Characterizationof Chemisorbed Monolayers by Surface PotentialMeasurements,”J.Phys,DAppl.Phys.,124,(1991),pages443-450。
或者,将硫羟-末端硅烷用于对所述基质表面进行涂覆,并且将异双功能的交联剂N-γ-马来酰亚胺基丁酰氧基琥珀酰亚胺酯(GMBS)用于蛋白附着。所述硫羟-末端硅烷可以是巯醇基丙基三甲氧基硅烷(MTS)。所述GMBS的一端与存在于硅烷涂层上的硫羟基团起反应,并且另一端与所述结合剂的末端氨基起反应。参见美国专利号5,077,210。通过这种方法,能够以高密度固定结合剂(例如,2ng/mm2)。可以通过添加封闭剂(BSA、卵清蛋白、糖、葡聚糖等)将与所述基质非特异性结合的量降低到总结合量的2-5%。在这种低的背景水平下,当使用了3皮摩尔/ml的靶浓度时,可以测量低到150毫微微摩尔的靶结合。通过这种方法固定的结合剂可以保持它们的生物活性较长的时间。
在将选择的结合剂固定到合适的基质上之后,可以测定固定化的结合剂与靶的反应性,以便确保结合剂-靶亲和力没有受到将所述结合剂固定在传感器芯片上的不利影响。SPR需要少量的材料,并且具有固定化的结合剂的传感器芯片通常可用于超过100次分析循环。可以用弱酸性或碱性溶液再生所述芯片表面。有若干种柔和的混合溶液可用于再生(Andersson,1999)。
因此,本发明涉及可用于测定选择的靶的结合剂。结合剂可用于任何类型的免疫测定,其中通常应用抗体。
试剂盒本发明涉及用于生成结合剂的试剂盒,该试剂盒可用于实施本发明的方法。所述试剂盒包括编码亲代或通用结合剂的核酸,例如,编码SEQ ID NO2、SEQ ID NO4或SEQ ID NO37结合剂的核酸,或其变体和衍生物。所述核酸的例子包括包含SEQ ID NO1或SEQ IDNO3的核酸。在另一种实施方案中,所述试剂盒可以包括能够编码SEQ ID NO2、SEQ ID NO4或SEQ ID NO37结合剂的表达载体,或其变体和衍生物。在其他实施方案中,所述试剂盒可以包括具有随机环状序列的载体或寡核苷酸(例如,SEQ ID NO25-29寡核苷酸中的至少一种)的文库。所述试剂盒还包括利用所提供的核酸、寡核苷酸或载体生成结合剂文库的一套说明书。
在另一种实施方案中,本发明的试剂盒可以包括机器可存取介质,它具有能够指导所述机器执行一种方法的相关的内容。所述机器可存取介质可以是提供本发明的计算机程序的磁盘、光盘或其他介质。所提供的程序可以包括上述方法之一,例如,MKBIND程序或在图8或10中所示出的方法之一,这些方法在上文有进一步的说明。所述试剂盒还可以包括装有编码亲代或通用结合剂的核酸或表达载体的容器,所述核酸或表达载体例如编码SEQ ID NO2、SEQ ID NO4或SEQ ID NO37的核酸或载体,或其变体和衍生物。所述试剂盒可以包括有用的寡核苷酸(例如SEQ ID NO25-29寡核苷酸中的一种或多种),它们具有随机环状序列。所述试剂盒还可以包括运行所述计算机程序或产生文库的说明书。
将参考下面的实施例对本发明作更详细的描述。不过,应当理解的是,本发明并不局限于在实施例中所提供的具体细节。
实施例1结合剂构建分子建模用两种可视化程序,Swiss PDB Viewer(Guex和Peitsch,1997)和Rasmol(Sayle和Milner-White,1995)进行分子建模研究。模型工作是在运行Windows 2000的PC,以及Silicon Graphics,Inc.Octane UNIX工作站上进行的。另外,将来自MolecularSimulations,Inc.的Cerius2分子建模包用于Octane上。三维结构文件是从蛋白数据库中下载的,如下所述1bzq.ent、1f2x.ent、1g6v.ent、i3v.ent、1jto.ent、1jtt.ent、1jtp.ent、1kxq.ent、1amk.ent、1aml.ent、1b9b.ent和1hti.ent。
将这些文件用于分析蛋白的三维结构,以及在靶接触区中的保守的和变体氨基酸以及参与二级结构维持的氨基酸的化学性质和鉴定。将该信息用于设计亲代共有结合剂,所述结合剂可以利用遗传工程技术容易地进行操作,并且可以(在DNA水平上)用作所述组合文库的基础。
第一个步骤始于全长氨基酸序列,该序列是根据已知的camelid序列设计的。利用程序CLUSTAL(Higgins等,1992)计算了这些氨基酸序列的稳健的成对比对。然后根据这种比对构建了共有序列。除了来自丙糖异构酶的信息之外,将β桶结构整合到所述比对中,以便为该设计增加稳定性特征。
所述β桶基序是蛋白结构中已知的最稳定的超二级结构特征之一。它是通过一系列规则的链间氢键和桶内堆积相互作用稳定化的。因此,β桶是用于构建小的单体结合剂的理想的起点。
第三个步骤需要建立所述新型多肽的同源性模型。使用程序ProMod和SwissModel,将所述亲代结合剂的最终的氨基酸序列穿在1jtt.ent的α碳迹线上(Peitsch,1996;Peitsch等,1996)。然后使用GROMOS 96力场对该模型进行能量最小化,并且使用SYBYL力场(Clark等,1989)进行几轮分子机制几何学最优化。然后分析最终的最小化/最优化模型的差的侧链相互作用和扭转几何学。如果需要的话对所述结构模型进行校正。用来自Rocketcalc,LLC的Beowulf计算机组进行进一步的能量最小化实验。
在图5中提供了通用结合剂的氨基酸序列,示出了五个环形区(i至v),并且还在下面示出了所述序列(SEQ ID NO4)。
1 MDVQLQASGG GSVQAGGSLR LSCAASAGAA GAACAGWFRQ41 APGKEREGVA AINAGAAGTS YADSVKGRFT ISQLAGAANV81 YLLMNSLEPE DTAIYYCAAG HAGAAGAATC GHGLSTAGAA121 GAPWGQGTQV TVSS所述亲代结合剂的环形部分(SEQ ID NO4)具有丙氨酸和甘氨酸残基。这样,可以在建立组合文库之前纯化通用结合剂并且进行稳定性研究。
核酸设计、构建和克隆为了生成编码所述亲代结合剂的核酸,使用标准遗传密码对SEQID NO4的氨基酸序列进行反向翻译。密码子选择是基于大肠杆菌密码子偏倚的,这意味着为特定氨基酸选择的最终密码子是在大肠杆菌中编码氨基酸的最常用的密码子。添加旁侧序列以便有利于克隆,这样使得整个序列达到423bp。编码所述亲代结合剂的全长结构基因为405bp(SEQ ID NO3)。在图4中示出了SEQ ID NO3序列,并且在下面提供该序列。
1 ACACACCATATGGACGTTCA GCTGCAGGCT TCTGGTGGTG41 GTTCTGTTCA GGCTGGTGGT TCTCTGCGTC TGTCTTGCGC81 TGCTAGCGCT GGTGCTGCTG GTGCTGCTTG CGCAGGTTGG121 TTCCGTCAGG CTCCGGGTAA AGAACGTGAA GGTGTTGCTG161 CTATTAATGC TGGTGCTGCT GGTACTAGTT ACGCTGACTC201 TGTTAAAGGT CGTTTCACCA TCTCTCAATT GGCTGGTGCT241 GCTAACGTTT ACCTGCTGAT GAACTCTCTG GAACCGGAAG281 ACACCGCTAT CTACTACTGC GCTGCTGGCC ACGCTGGTGC321 TGCTGGTGCT GCCACGTGCG GTCACGGTCT GAGTACTGCT361 GGTGCTGCTG GTGCTCCATG GGGTCAGGGT ACCCAGGTTA401 CCGTTTCTTC TTAGATATCA CAC在上面的SEQ ID NO3中加下划线的序列表示为了促进克隆而业已整合到所述DNA序列中的5′Nde I位点和3′Eco RV序列。起始密码子和终止密码子用粗体表示。SEQ ID NO3结合剂的环形部分业已被编码丙氨酸和甘氨酸的密码子所取代。这样,在建立组合文库之前,可以纯化祖先结合剂,并且进行稳定性研究。
为了构建具有SEQ ID NO3序列的核酸,合成了跨越整个SEQ IDNO4编码区的18个单链寡核苷酸。所述寡核苷酸的长度通常为50个核苷酸。每一个寡核苷酸互补于另一个寡核苷酸,从而在与结合配偶体杂交时,所得到的片段包括具有30个碱基对的中央双链体区,并且它的每一端被10个核苷酸的单链区侧接。在表4中示出了寡核苷酸序列。将较短的寡核苷酸用于末端(表4中的寡核苷酸1和18)。
表4.用于通用结合剂的DNA寡核苷酸



所述基因的构建包括三个独立的步骤。
首先,将5μg的每一种寡核苷酸及其互补的结合配偶体一起混合在最终体积为10μL的10mM Tris-HCl(pH7.2),10mM NaCl中。因此,采用以下寡核苷酸的组合建立了九种不同的杂交反应寡核苷酸1和2(SEQ ID NO5和6);寡核苷酸3和4(SEQ ID NO7和8);寡核苷酸5和6(SEQ ID NO9和10);寡核苷酸7和8(SEQ ID NO11和12);寡核苷酸9和10(SEQ ID NO13和14);寡核苷酸11和12(SEQ ID NO15和16);寡核苷酸13和14(SEQ ID NO17和18)寡核苷酸15和16(SEQ ID NO19和20);和寡核苷酸17和18(SEQ ID NO21和22)。
所述混合物分别在95℃的水浴中加热10分钟。关掉加热,并且用5小时时间让整个水浴冷却到水温。
其次,将来自九个不同的“缓慢冷却”杂交反应的等分试样(10μL)混合在一起(最终体积50μL)。将所述试管在45℃下加热10分钟,然后放入冰浴中。然后向该试管中添加T4DNA连接酶和缓冲液(New England Biolabs),然后将反应物(最终体积60μL)在16℃下温育20小时。
第三,使用两种PCR引物从所述片段混合物中选择全长结构基因(表3,寡核苷酸19和20(SEQ ID NO23和24)),所述引物互补于所述结构基因的5′和3′末端。这样确保只能扩增全长基因产物。另外,所述3′扩增引物包括Eco RV位点,以便有利于克隆。所述5′扩增引物包括Nde I位点。PCR反应是使用1μL的连接混合物按以下方法进行的95℃,1分钟;49℃,1分钟;72℃,30秒。在Techne Progene PCR装置中进行该程序30个循环。在最后一次PCR循环之后,进行10分钟72℃的延伸温育。通过DNA琼脂糖凝胶电泳验证PCR反应产物。
然后通过Promega DNA Wizard PCR提纯试剂盒纯化PCR反应产物,并且制备用于克隆。首先,在存在ATP的条件下用T4 DNA聚合酶处理所述DNA片段,以便确保具有完整的双链体末端。该反应是按照来自New England Biolabs,Inc.的说明书进行的。使用Promega DNAWizard PCR提纯试剂盒再次纯化所述DNA。其次,用Nde I和Eco RV消化所述DNA,并且通过乙醇沉淀进行纯化。将最终的DNA重新悬浮在小体积的10mM Tris-HCl(pH8.0),1mM EDTA中。
用Nde I和Sma I消化克隆载体,所述克隆载体是修饰形式的pET29a(Invitrogen),其中,去掉了Fsp I、Ase I和Acl I载体位点,并且用Promega DNA提纯试剂盒纯化。这种消化产生了与DNA插入片段相容的线性载体。这种组合确保了所述片段的定向框内克隆。所述载体和插入片段以大约1∶10的摩尔比混合,并且在存在T4DNA连接酶的条件下,在16℃进行20小时时间连接在一起(总反应体积为20μL)。用5μL的连接反应物转化感受态JM109细菌。在LB/60μg/mL氨苄青霉素琼脂平板上生长之后,选择单一菌落,并且通过小量制备方法使用Promega miniprep DNA分离试剂盒从所述菌落中纯化质粒。通过DNA琼脂糖凝胶电泳、限制性内切核酸酶消化以及最终通过DNA测序评估分离的质粒。将质粒构建体命名为pBART2。该构建体编码所述基础或亲代结合剂(SEQ ID NO3)。
采用标准固相化学方法合成了相应于所述环形区的随机化寡核苷酸。所述寡核苷酸的序列示于下面的表5中。
表5.用于生产结合剂的随机文库的简并环状寡核苷酸的序列。

所述环形区(i至v)相应于本结合区的环形区。表5提供了用于生成结合剂的组合文库的寡核苷酸的序列,以及整合的独特的限制位点,这些位点位于随机核苷酸(n)旁侧,并且有利于克隆。示出了随机核苷酸(n)的位置和数目。因此,环i具有21个随机核苷酸,环ii具有15个随机核苷酸,环iii具有12个随机核苷酸,环iv具有21个随机核苷酸,且环v具有18个随机核苷酸。例如,编码环i的寡核苷酸是33个核苷酸的序列,其具有21个中央随机碱基,具有位于5’末端的Nhe I位点和位于3’末端的Fsp I位点。
为了制备用于插入编码所述亲代结合剂的载体中的寡核苷酸,在95℃的水浴中对SEQ ID NO25-29寡核苷酸中的每一种和它们的互补性结合配偶体分别加热10分钟。关掉加热,并且用3小时时间让整个水浴冷却到室温。
为了生成所述随机组合文库,首先用Nhe I和Fsp I消化所述pBART2载体。该线性质粒是通过在Sephadex G-25上层析分离的,该层析是在10mM Tris-HCl(pH7.8)中进行的。合并包括线性质粒的级分,并且通过Centricon(Amicon,Inc.)浓缩。对环i寡核苷酸进行类似的消化,并且通过天然PAGE纯化。消化过的寡核苷酸和质粒以10∶1的摩尔比混合,并且在16℃下在存在T4 DNA连接酶的条件下连接过夜。用10mM Tris-HCl(pH7.8)稀释连接反应物(以便降低T4DNA连接酶缓冲液甘油浓度)。将相应于环形区ii至v的随机寡核苷酸按照相同的方法顺序插入pBART2中。将所述最终连接产物用于转化JM109细胞。
文库筛选所生成的组合文库适合自动化筛选。为了制备试验筛选反应物,将独立的菌落合并成10个菌落的组,并且等分试样到387孔平板上,所述平板含有补充了氨苄青霉素(60μg/mL)的LB。在37℃下温育细胞10小时,然后诱导多肽表达3小时。通过添加BPER提取试剂裂解细胞,然后中和所述上清液。将来自每一个孔的5μL等分试样转移到新的平板上。通过用空气的热蒸汽蒸发孔溶液来将所述等分试样的蛋白内容物吸附到孔的侧壁上。
与初步试验相同,将所述蛋白胰蛋白酶用作所述结合剂结合的靶。将存在于磷酸缓冲盐溶液(PBS)中的Oregon Green(MolecularProbes,Inc.)标记的牛胰蛋白酶添加到所述孔中,并且在37℃下温育所述平板1小时。用PBS洗涤所述孔3次。用Dynex-MFX荧光微量滴定板读数器对荧光进行定量。激发波长和发射波长分别为485和500nm。在最初的处理中总共筛选了38,700个克隆。
对相应于第一次筛选的阳性孔的合并的克隆分别进行再次筛选,以便鉴定纯化形式的阳性菌落。筛选是按上述方法进行的。对来自阳性克隆的DNA进行测序。按上述方法表达并且纯化来自阳性克隆的多肽。
结果在图1中示出了所述亲代结合剂DNA克隆和蛋白的示意图。在图2中示出了所述通用亲代结合剂的DNA序列,而在图3中示出了通用的氨基酸序列。术语通用的表示所述环形区是不确定的,并且可以改变以便具有任何序列,正如在SEQ ID NO3中用“n”核苷酸表示的,以及在SEQ ID NO4中用“Xaa”氨基酸表示的。
对于所述亲代结合剂的实际构建来说,将编码丙氨酸和甘氨酸的交替的密码子插入用n表示的区域。这种添加示于图4的DNA序列和图5的氨基酸序列中。Ala-Gly(GCTGGT)重复的选择是任意的,并且仅仅被用作占位符(place-holder)。Ala-Gly(GCTGGT)重复的使用还使得能够进行亲代结合剂进行试验性表达、纯化和检测。所述亲代结合剂和编码所述亲代结合剂的核酸的优点之一是业已鉴定了所述结构决定性氨基酸(无环部位)并且可以连续地最优化。
对所述亲代结合剂氨基酸序列进行反向翻译,以便产生可用于构建组合文库的DNA克隆。进行倾向于大肠杆菌的密码子偏倚,以便确保最大的蛋白生产。将独特的限制位点整合到位于所有五个-环形区旁侧的DNA序列中。这极大地促进了所述组合文库的形成。还将旁侧限制位点整合到所述亲代结合剂DNA序列中,以便有利于克隆到蛋白表达载体上。尽管该系统对于细菌生产来说是最优化的,但人们可以通过将所述结构基因亚克隆到其他载体上,而在任何表达系统中生产所述结合剂多肽。
具有423个核苷酸的SEQ ID NO3序列的构建需要一系列短的寡核苷酸,因为它的长度超过了构建长度超过个碱基的DNA序列的现有合成方法。另外,使较长的DNA分子有效杂交是困难的。因此,用一系列杂交步骤进行构建。当独立的寡核苷酸以等摩尔的量混合在一起时,通过“缓慢冷却”杂交步骤能够有效地转化成双链体分子。用数小时时间使温度从95℃缓慢降低,有利于短的双链体的形成。所得到的片段包括具有30个碱基对的中央双链区,其旁侧为10个核苷酸的单链末端(最末端的寡核苷酸除外,它更短)。将这种“粘性末端”用于再次通过杂交驱动全长SEQ ID NO3序列的装配。
最终的SEQ ID NO3序列在这一阶段的形成是通过将双链体分子等摩尔混合物加热到45℃保持10分钟进行的。该步骤破坏了通过所述末端缔合所产生的任何部分形成的双链体结构,但是没有破坏完整形成的中央双链体区。通过将反应试管放置在冰上使加热的材料“快速冷却”。该杂交步骤有利于短的DNA区域的杂交(即,10个碱基的粘性末端)。然后通过T4DNA连接酶形成423bp DNA片段的磷酸二酯主链。
从通过PCR扩增得到的片段混合物中筛选全长基因序列。该步骤比从琼脂糖凝胶中纯化所述片段更为有效。这一步骤还得到了大量用于随后的克隆步骤的材料。通过用T4 DNA聚合酶产生平头末端并且用Nde I和Eco RV消化,来制备用于克隆的所述基因的末端。由此得到了能够有效地并且定向地克隆到蛋白表达载体中的DNA。在用若干转化过的细菌菌落进行质粒DNA的小量制备之后,通过DNA测序证实所述最终插入片段的有效性(数据未示出)。
另外,所采用的克隆方法使得能够通过组合系列的随机化环状序列容易地取代所述环状结构域。在表4中示出了用于生产所述环状变体的寡核苷酸(仅示出了编码链)。
尽管这里所提供的方法是相当简单的,但它仅仅是业已被用于构建所述文库的很多不同的分子生物学途径中的一种。因此,尽管将所述文库克隆到pET29a中,但显而易见的是,可以将所述整个文库(通过传统限制性内切核酸酶消化或通过PCR)亚克隆到更合适的生物淘选系统中,例如,噬菌体系统,其中,所述结合剂能通过噬菌体成本(cost)而展示。可以通过扩增所述插入片段整体并将它们重新克隆到其他选择的载体上,来再生整个文库。
所述组合文库的构建得到了具有大约6×1012个独立的克隆的文库。最初的细菌文库具有足够的多样性,以便有效筛选可以结合靶分子的结合剂。
通过使用自动化系统大大促进了所述文库的筛选。未来的文库最有可能存在于筛选系统中,该系统更适合较快的通量。即便如此,可以用四天时间自动地筛选大约超过38,000个克隆。通过该初步试验筛选,鉴定了一种阳性克隆。该克隆可以与牛胰蛋白酶结合(参见下文)。因此证实了利用所述构建的文库筛选能够结合新型靶的新型环状变体的可行性。所分离的克隆具有环i DNA序列CGTTACCTGCGTTACCCGTCT(SEQ ID NO30),它相应于氨基酸序列RYLRYPS(SEQ ID NO31)。相反,所述亲代结合剂的氨基酸序列是AGAAGAA(SEQ ID NO32)。
实施例2结合剂的生物化学和生物物理学研究该实施例说明了通过本发明方法生产的结合剂的某些化学、生物化学和物理学特性结合剂的纯化表达系统采用了一般的T7 RNA聚合酶超表达系统。所述载体构建体在所述结合剂多肽上添加了C-末端六组氨酸标记,以便有利于纯化。让来自1%接种物的含有表达质粒构建体的BL21(DE3)细胞在37℃下,在补充了1%葡萄糖和60μg/mL氨苄青霉素的Luria培养液中生长。当细胞达到0.8的A595值时(接种之后大约3小时),以0.5mM的最终浓度添加IPTG。在收获之前,再让细胞持续生长5小时。通常,每升获得了5g细胞。
通过以10,000×g离心10分钟使细胞沉淀并且重新悬浮在一倍体积的10mM Tris-HCl,pH8.0中。按上述方法再次对所述细胞进行离心,并且在-70℃下冷却至少2小时。将冷却的沉淀物重新悬浮在二倍体积的BPER大肠杆菌蛋白提取缓冲液(Pierce Scientific)中。该混合物在30℃下温育20分钟,偶然进行混合。通过以12,000×g离心20分钟使所得到的提取物澄清,并且用2L的His-Tag加样缓冲液对上清液进行透析(所有的His-Tag缓冲液和树脂均购自Novagen,Inc.)。用加样缓冲液将透析的材料稀释到最终浓度为2.5mg/mL,并且加样到5em×3.97cc2His-Tag树脂柱上,该树脂柱事先业已填充了镍。所有层析步骤都是在室温下进行的。用五倍柱体积的His-Tag洗涤缓冲液洗涤所述柱。用100mM-500mM咪唑-HCl梯度将蛋白从所述柱上洗脱。通过所述梯度收集级分,并且合并含有蛋白的级分(通过SDS PAGE测定),并且通过Centricon(Amicon,Inc.)浓缩到5mg/mL。将材料对10mM Tris-HCl(pH8.)、1mM EDTA、50mM NaCl进行充分透析,并且构成了级分I。
通过疏水性相互作用层析(HIC),用级分I制备均匀的结合剂。将硫酸铵(来自4M的母液)添加到级分I合并物中,达到1.5M的最终浓度。将该材料应用到BioRad Econo-Pac叔丁基HIC柱上(总的柱体积为1mL)。在对所述样品进行加样之后,直接应用100mL的从1.5M(NH4)2SO4/3.0M KCl/缓冲液I至单独缓冲液I的反向凹面梯度。均匀的多肽在最后三次梯度中从柱上洗脱。合并中央的95%的峰(通过吸收度测定)。通过用半透膜(Amieon YM-3)进行压滤将所述材料浓缩到2mL的最终体积,并且对2L的10mM Tris-HCl(pH7.5)、1mM EDTA、25mM NaCl进行透析。将浓缩的/透析的材料用于所有随后的分析。
化学变性所述亲代结合剂的稳定性测量是通过在存在尿素的条件下通过Shimadzu RF5301荧光计通过内在的色氨酸荧光(Lakowicz,1983)测量蛋白解折叠进行的。激发波长和发射波长分别为295nm和340nm。将激发和发射单色仪狭缝设定为1.5nm。将结合剂(20μM)与逐渐增加量的盐酸胍(GdnHCl,浓度范围为0-6.0M)混合,并且在室温下温育所述样品10小时,以便确保达到解折叠平衡。根据所述关系将相对荧光转化成自由能值(Pace等,1989)ΔG=-RTln[(yf-yiyi-yu)]]]>其中,yf和yu分别是完全折叠的和完全解折叠的亲代结合剂的相对荧光值。yi是解折叠的中间体的相对荧光,T是绝对温度,而R是气体常数。关系ΔG对[GdnHCl]的线性回归和外推被用于确定在不存在变性剂的条件下的自由能值(ΔGH20)。类似地,所述解折叠的多肽分数(Fu)是按照以下关系从荧光数据计算的(Pace等,1989)FU=(yf-yiyf-yu)]]>等温滴定量热法用购自MicroCal,Inc.的VP-ITC仪器进行等温滴定量热法(ITC)。滴定是通过将5□L的结合剂(浓度范围为0.5mM-1.0mM)注射入1.4mL的搅拌的反应测定池中进行的。在所述测定池中,牛胰蛋白酶(Sigma Chemical Co.)的浓度在10-30μM范围内。抑制剂和酶存在于20mM二甲基胂酸钠(pH6.9),40mM NaCl中。在20℃下进行滴定。用于滴定的一般实验条件是10秒的注射时间段,随后是注射之间的240秒的延迟时间,总共进行40次注射。进行将结合剂滴定到缓冲液中的空白滴定,以便校正稀释和混合的热。
独立系列的多个结合位点是用于结合实验评估的最常见的模型。用于总热量的分析溶液是通过下式确定的(Freire等,1990)Q=VΔH[[L]+1+[M]nK-(1+[M]nK-[L]K)2+4K[L]2K]]]>其中,Q是总热,V是测定池体积,ΔH是焓,M是大分子浓度(所述测定池中的结合配偶体),n是结合化学计量,L是配体浓度(注射器中的结合配偶体),而K是缔合常数。用Origin version 5(MicroCal,Inc.)将数据拟合该模型。
所述纯化方案需要大约两天时间完成。从大肠杆菌中纯化亲代结合多肽在每升诱导的培养物中得到了大约15mg多肽。所述多肽在大肠杆菌中超量生产大约36倍。所述多肽是以C-末端His-Tag融合体形式从细菌中分离这一事实有助于纯化方案。因此,便于表达所述多肽并且随后进行纯化。所述粗制细菌提取物的制备是通过以下步骤有效实现的化学裂解所述细菌,然后通过离心澄清裂解液。还可以在表达之后通过超声波或通过弗氏压碎器破坏所述细菌。因此通过两个步骤将所述多肽纯化至均一。在所述纯化实验整个过程中,仅通过SDS PAGE分析显现所述亲代结合剂。
所述亲代结合剂多肽以高度协同的方式解折叠。通过内在色氨酸荧光监控的平衡解折叠表现出发射荧光强度总体上降低了70%,以及发射最大峰值向较长的波长偏移了12nm(数据未示出)。将荧光强度发射光谱按上述方法转化成解折叠多肽的分数。
图7表示在2.7M GdnHCl的浓度产生的所述亲代结合剂解折叠曲线的中点。所述解折叠转变始于2.4M GdnHCl,并且在3.1M GdnHCl的变性剂浓度下结束。在该数据(未示出)的第一衍生图上的一个峰的存在支持了多肽以高度协同的两阶段过程变性的假说。将所述解折叠曲线转化成自由能对GdnHCl浓度的图,通过线性回归外推到在不存在尿素的条件下的自由能,表明了所述多肽具有42.7kJ mol-1的天然自由能。
所述亲代结合剂在BioSelect 125凝胶排阻柱上的层析表现与预期的单体多肽吻合。分析型凝胶过滤实验(数据未示出)表明了所述多肽从所述柱上的洗脱略微比肌红蛋白标准(12kDa)早一些。洗脱曲线与分子量为大约13.8kDa的单体多肽(它包括His-Tag)一致。
计算的斯托克斯半径为26。该值与原子模型的尺寸非常吻合。所述洗脱曲线还表明了所述多肽天然大体上是对称的,因为摩擦系数为1.27。不过,该摩擦系数表明了所述多肽具有轻度的扁球体特征,这可能表明了所述环形区在决定所述多肽的流体动力学特性方面起着部分作用。
实施例3计算机生成的结合剂序列该实施例说明了如何利用本发明提供的计算机程序生成能够结合特定靶分子的结合剂。
结合剂的计算机建模所述亲代结合剂多肽的长度为134个氨基酸,总分子量为12.8kDa。图6表示通用结合剂的三维结构。所述结合剂的总体拓扑结构是通过中央二硫键(未示出)稳定的β夹心(用箭标表示)。本发明的结合剂还具有五个环(用与所述箭标连接的细链表示),它是主要的靶识别因子。所述多肽序列的末端是可用于将所述分子锚定在珠表面上或其他表面上以便用于诊断器械的尾巴。所述靶接触区是由这些环的空间取向确定的。
通过使用程序SwissModel,将所述氨基酸序列(SEQ ID NO38)穿在camelid抗体的三维α碳主链上(Protein Databank中的结构1jtt.ent),制备了所述多肽的三维模型。使用程序ProMod将最优化的穿线结果转化成包括氨基酸侧链位置的三维结构。对这种初步的模型进行一轮模拟的退火,以便使负的侧链相互作用最小化。经过若干轮SYBYL水平的几何最优化,将所有的二面角和扭转转变成合适的几何形状。使用GROMOS96参数设置进行最后一轮的能量最小化,而没有使用反应场。结果如表6所示。最终的模型具有-3581kJ/mol的总能量,并且如图6所示。所有氨基酸残基都处在允许的Ramachandran空间内(数据未示出),并且没有负的空间相互作用。
表6.同源性模型的GROMOS 96能量最小化结果(仅示出了来自所述力场的主要参数)。
参数 能量(kJ/mol)键57角422扭转 690不合适111非键合的 -3082静电的-1779约束 0总计 -581计算机编程以FORTRAN 77编写程序MKBIND,可将该程序用于自动鉴定与特定靶分子结合的环状氨基酸序列。将代码编译成能在Rocketcalc,LLC Beowulf计算组上在LINUX下运行。所述代码的并行化导致了搜索时间的明显加快。
在图8中示出了MKBIND的通用程序流程的流程图。首先,将有关所述亲代结合剂和所述靶分子的三维结构的信息作为两种不同的亲代结合剂1502和靶1512的数据文件输入。该信息包括通用结合剂(SEQ ID NO38,参见图12)和所述靶分子中所有原子的原子坐标。
通过挑取可鉴定的重心(或可鉴定的结构区域,如正方形或三角形或坐标)来选择靶(胰蛋白酶)上的特定搜索区,所述搜索区可位于所述靶分子中选择的原子坐标的中心。在某些实验中,所述可鉴定的中心的深度(正方形或三角形)从该中心的平均表面突出大约3,至所述水平下大约相同的距离(以便获得较深的沟)。所选择的搜索区为大约20×20×6。
确定环(i)的长度为七个氨基酸。确定了所有二十种天然存在的氨基酸作为取代到环(i)的每一个位置上的氨基酸的类型。将产生环(i)的所有坐标文件的程序应用于简单的坐标转化,以将所述新型环锚定在所述结合剂结构上,并且生成结合剂输出文件,该文件包括一系列的文件,包含具有所有可能的环状序列的所有可能的结合剂的结构坐标。
然后将所述结合剂的输出文件和输出靶文件与停靠程序联系1510、1518。所述结合剂输出文件1510是规则的原子坐标文件。所述输出靶文件1518是确定氨基酸残基在靶网格区的原子坐标,以及网格本身的xyz坐标的文件。不过,所有三维结构都被MKBIND用作原子坐标文件。然后,所述分子停靠程序使用灵活的停靠算法用所述靶停靠每一种结合剂1520。因此,通过MKBIND程序将所述结合剂的环-结合表面处于所述靶分子的坐标网格的体积的中心。所述程序然后使所述结合剂沿一条轴向所述靶表面(仍然在所述网格内)以0.1A的间距移动,并且计算得分(参见下文)。然后使所述结构再移动0.1A。如果得分提高的话,继续移动所述结合剂,直到得分变低。在该点将它向外移动了0.1A(达到最后的最佳得分),然后以相同的方式向上移动,然后向下移动,并且随后向左和向右移动。所有这样的运动和重新定位导致了“配合的最佳场所”。
然后按下文所述计算每一个结合剂变体的停靠得分或配合得分。
配合得分=-[Eelect+Evdw+EHB]其中,Eelect是静电能量,Evdw是范德瓦耳斯项,而EHB是氢键能量。该经验能量函数是以上三个独立能量项的总和Σqiqj4πϵ0r+Σ(Aijrij12-Bjjrij6)+Σ((ArAD6-BrA4))cos(θA-H-D)]]>如果配合较差的话,就将所述环状序列和所述结合剂变体坐标文件放弃1526。获得最高得分1524,并且将环状序列和所述结合剂变体坐标文件保存1528。
一旦发现了最佳配合,就将粘合剂坐标文件写出。在屏幕上检查靶和最优化的结合剂结构图像,以便检查配合情况,输出所有高得分环状序列用于脱机分析(例如比对)。因此,将MKBIND用于构建能够结合牛胰蛋白酶的新型结合剂。
结果所述计算机程序MKBIND成功地并且自动地鉴定了结合牛胰蛋白酶的亲代结合剂环变体。为了缩短第一次试验的计算时间,仅对环i变体进行了搜索。其余的环被约束为它们最初的Ala-Gly重复序列。对环i进行全面搜索,就是说让所有20种氨基酸占据每一个序列。因此搜索了207(1.28×109)个序列。
该程序完成一次新的搜索需要大约0.01秒(即生成随机环变体结构,将它停靠到胰蛋白酶搜索网格,计算配合得分,并且输出坐标和环序列文件)。因此整个处理花费1.28×107秒(需要148天进行处理)。通过在Rocketcalc,LLC组上运行该系统加快了计算速度。在20个处理系统上的线性加速为18.9。不过,运行所述程序并不需要计算机组。通过最优化停靠参数可以大大加快搜索速度(即进行较少的严格搜索,并且不将网格间隔做的太细)。因为它是用标准FORTRAN 77编写的,所以该程序可以在任何计算机系统上运行。
所述搜索导致了能够结合牛胰蛋白酶的具有最高得分的环变体结合剂的鉴定。所鉴定的环-i序列是ITAVCHK(SEQ ID NO35)。通过将该序列插入所述亲代结合剂环i,构建了实际的结合剂蛋白(参见表6)。
通过计算机获得的环i序列与通过分子生物学方法获得的环i序列不同。在表7中比较了计算机生成的和生物学生成的环的序列。
表7.用胰蛋白酶作为靶的环i计算机搜索和生物学筛选的结果。

环i序列整合了旁侧Nhe I和Fsp I限制位点(小写字母)。
按上述方法表达并且纯化具有SEQ ID NO33和SEQ ID NO35的结合剂。在表8中提供了所述结合剂的生物化学和生物物理学特性。
表8.所述结合剂的各种特性。

检验了三种结合剂(SEQ ID NO4、SEQ ID NO33和35)的能力,以便确定它们是否能够有效结合牛胰蛋白酶。结合是通过等温滴定量热法(ITC)测定的。
所述亲代结合剂对胰蛋白酶没有天然结合亲和力(数据未示出)。在所有实验条件下,不存在可检测的结合。不过,如图9所示,两种环变体对胰蛋白酶具有显著的结合亲和力。
表9提供了在各种结合剂上观察到的某些热力学参数的总结。
表9.所述结合剂-牛胰蛋白酶相互作用的各种热力学参数。

nbd=未检测到结合以上等温滴定量热法结果表明了胰蛋白酶和SEQ ID NO33和35结合剂之间的相互作用是由焓驱动的,就是说ΔH是负值。该反应在熵方面是不利的,正如通过ΔS的负值所证实的。不过,所述焓项比TΔS项的量级大,因此总的自由能(ΔG)是负的。即使在计算机屏幕上仅对环i进行了最优化,本发明所采用的方法也产生了具有极好结合特性的结合剂。因此,对所有五个环进行搜索,导致了很高亲和力的环变体结合剂的鉴定。
该研究业已证实,可以根据β桶拓扑结构工程生产稳定的单体结合剂,以便生产能够作为潜在的抗体替代物用于免疫测定的结合剂。将氨基酸改变整合在基础亲代结合剂结构上,以便提高所述分子的稳定性,并且提供额外的功能性。选择用于结合相互作用的所述五个靶接触环提供了用于发现新型结合剂的巨大潜力。理论上讲,能够生产2030种不同的分子。这基本上意味着,该系统可用于制备针对任何靶分子或表位的结合剂。
设计、合成了编码这种新型结合剂的核酸,并且将其用于在大肠杆菌表达系统中生产所述结合剂。所述核酸整合了新型限制性内切核酸酶位点,以便制备环组合文库。生产了所述结合剂的两种变体,第一种变体是从所述组合文库中分离的,并且发现它具有环i序列,这使得所述结合剂能够结合胰蛋白酶。包括新型环i序列的第二种变体是采用自动和随机环生成和分子停靠系统从头发现的。该分子也能结合胰蛋白酶。所述结合剂分子是非常稳定和有功能的,因此所述结合剂系统可用于生产无数的结合剂,并且这种结合剂可用于取代诊断检测中的常规抗体。
参考文献Arnold,U.,and Ulbrich-Hofmann,R.(1997).Kinetic and thermodynamic thermalstabilities of ribonuclease A and ribonuclease B.Biochemistry 36,2166-2172.
Clark,M.,Cramer,R.D.,and van Opdensch,N.(1989).J.Computational Chem.10,982-986.
Guex,N.and Peitsch,M.C.(1997).Swiss Model and the Swiss-PdbViewerAnenvironment for comparative protein modeling.Electrophoresis 18,2714-2723.
Higgins,D.G.,Bleasby,A.J.,and Fuchs,R.(1992).Clustal VImproved software formultiple sequence alignment.CABIOS 8,189-191.
Lakowicz,J.R.(1983).Principles of Fluorescence Spectroscopy,Chapter 10,PlenumPress,New York,London.
Muyldermans,S.(2001).Single domain camel antibodiesCurrent status.Reviews inMolec.Biotech.74,277-302.
Pace,C.N.,Shirley,B.A.,and Thomson,J.A.(1989).In Protein Structure a practicalapproach(T.E.Creighton,Ed.),pp.311-330.IRL Press,Oxford,UK.
Peitsch,M.C.(1996).ProMod and Swiss-ModelInternet-based tools for automatedcomparative protein modeling.Biochem.Soc.Trans.24274-279.
Peitsch MC,Herzyk P,Wells TNC and Hubbard RE(1996)Automated modeling of thetransmembrane region of G-protein coupled receptor by Swiss-Model.Receptors andChannels 4161-164.
Sayle,R.A.and Milner-White,EJ.(1995).RasMolBiomolecular graphics for all.Trendsin Biochemical Sciences 20,374-376.
Siegel,LM.,and Monty,KJ.(1966).Determination of molecular weights and frictionalratios of proteins in impure systems by the use of gel filtration and density gradientcentrifugation.Application to crude preparations of sulfite and hydroxylaminereductases.Biochim.Biophys.Acta 112,346-362.
所有出版物和专利被收作本文参考,就如同分别被收作参考一样。本发明并不局限于所示出和描述的确切细节,因为可以理解的是,可以在权利要求书所限定的本发明的精神和范围内进行各种改变和修改。
序列表<110>Kimberly-Clark Worldwide,Inc.
Quirk,Stephen<120>识别靶的结合剂<130>18,808<140>10/335,181<141>2002-12-30<160>38<170>FastSEQ for Windows Version 4.0<210>1<211>423<212>DNA<213>人工序列<220>
<223>结合剂的合成的核酸序列<220>
<221>misc_feature<222>(1)...(423)<223>n=a、c、g或t<400>1acacaccata tggacgttca gctgcaggct tctggtggtg gttctgttca ggctggtggt 60tctctgcgtc tgtcttgcgc tgctagcnnn nnnnnnnnnn nnnnnnnntg cgcaggttgg120ttccgtcagg ctccgggtaa agaacgtgaa ggtgttgctg ctattaatnn nnnnnnnnnn180nnnactagtt acgctgactc tgttaaaggt cgtttcacca tctctcaatt gnnnnnnnnn240nnnaacgttt acctgctgat gaactctctg gaaccggaag acaccgctat ctactactgc300gctgctggcc acnnnnnnnn nnnnnnnnnn nncacgtgcg gtcacggtct gagtactnnn360nnnnnnnnnn nnnnnccatg gggtcagggt acccaggtta ccgtttcttc ttagatatca420cac 423
<210>2<211>134<212>PRT<213>人工序列<220>
<223>合成的结合剂<220>
<221>SITE<222>(1)...(134)<223>Xaa=任何天然或合成的氨基酸<400>2Met Asp Val Gln Leu Gln Ala Ser Gly Gly Gly Ser Val Gln Ala Gly1 5 10 15Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Xaa Xaa Xaa Xaa Xaa Xaa20 25 30Xaa Cys Ala Gly Trp Phe Arg Asn Ala Pro Gly Lys Glu Arg Glu Gly35 40 45Val Ala Ala Ile Asn Xaa Xaa Xaa Xaa Xaa Tyr Ser Tyr Ala Asp Ser50 55 60Val Lys Gly Arg Phe Thr Ile Ser Gln Leu Xaa Xaa Xaa Xaa Asn Val65 70 75 80Tyr Leu Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr85 90 95Cys Ala Ala Gly His Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Cys Gly His100 105 110Gly Leu Ser Thr Xaa Xaa Xaa Xaa Xaa Xaa Pro Trp Gly Gln Gly Thr115 120 125Gln Val Thr Val Ser Ser130<210>3<211>423<212>DNA<213>人工序列<220>
<223>通用结合剂的合成的核酸序列<400>3acacaccata tggacgttca gctgcaggct tctggtggtg gttctgttca ggctggtggt 60
tctctgcgtc tgtcttgcgc tgctagcgct ggtgctgctg gtgctgcttg cgcaggttgg120ttccgtcagg ctccgggtaa agaacgtgaa ggtgttgctg ctattaatgc tggtgctgct180ggtactagtt acgctgactc tgttaaaggt cgtttcacca tctctcaatt ggctggtgct240gctaacgttt acctgctgat gaactctctg gaaccggaag acaccgctat ctactactgc300gctgctggcc acgctggtgc tgctggtgct gccacgtgcg gtcacggtct gagtactgct360ggtgctgctg gtgctccatg gggtcagggt acccaggtta ccgtttcttc ttagatatca420cac 423<210>4<211>134<212>PRT<213>人工序列<220>
<223>合成的通用结合剂<400>4Met Asp Val Gln Leu Gln Ala Ser Gly Gly Gly Ser Val Gln Ala Gly1 5 10 15Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Ala Gly Ala Ala Gly Ala20 25 30Ala Cys Ala Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly35 40 45Val Ala Ala Ile Asn Ala Gly Ala Ala Gly Thr Ser Tyr Ala Asp Ser50 55 60Val Lys Gly Arg Phe Thr Ile Ser Gln Leu Ala Gly Ala Ala Asn Val65 70 75 80Tyr Leu Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr85 90 95Cys Ala Ala Gly His Ala Gly Ala Ala Gly Ala Ala Thr Cys Gly His100 105 110Gly Leu Ser Thr Ala Gly Ala Ala Gly Ala Pro Trp Gly Gln Gly Thr115 120 125Gln Val Thr Val Ser Ser130<210>5<211>40<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸
<400>5acacaccata tggacgttca gctgcaggct tctggtggtg 40<210>6<211>50<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>6tgaacagaac caccaccaga agcctgcagc tgaacgtcca tatggtgtgt50<210>7<211>50<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>7gttctgttca ggctggtggt tctctgcgtc tgtcttgcgc tgctagcgct50<210>8<211>50<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>8cagcagcacc agcgctagca gcgcaagaca gacgcagaga accaccagcc50<210>9<211>50<212>DNA<213>人工序列
<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>9ggtggtgctg ctggtgcttg cgcaggttgg ttccgtcagg ctccgggtaa 50<210>10<211>50<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>10ttcacgttct ttacccggag cctgacggaa ccaacctgcg caagcagcac 50<210>11<211>50<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>11agaacgtgaa ggtgttgctg ctattaatgc tggtgctgct ggtactagtt 50<210>12<211>50<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>12gagtcagcgt aactagtacc agcagcacca gcattaatag cagcaacacc 50<210>13<211>50<212>DNA<213>人工序列
<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>13acgctgactc tgttaaaggt cgtttcacca tctctcaatt ggctggtgct 50<210>14<211>50<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>14aaacgtaaga agcaccagcc aattgagaga tggtgaaacg acctttaaca 50<210>15<211>50<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>15gctaacgttt acctgctgat gaactctctg gaaccggaag acaccgctat 50<210>16<211>50<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>16gcagtagtag atagcggtgt cttccggttc cagagagttg atcagcaggt 50<210>17<211>50
<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>17ctactactgc gctgctggcc acgctggtgc tgctggtgct gccacgtgcg 50<210>18<211>50<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>18agaccgttac cgcacgtggc agcaccagca gcaccagcgt ggccagcagc 50<210>19<211>40<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>19gtcacggtct gagtactggc tggtgctgct ggtgctcatg 40<210>20<211>40<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>20accctgaccc catgagcacc agcagcacca gccagtactc 40
<210>21<211>43<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>21gggtcagggt acccaggtta ccgtttcttc ttagatatca cac 43<210>22<211>33<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>22gtgygatatc taagaagaaa cggtaacctg ggt33<210>23<211>22<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>23acacaccata tggacgttca gc22<210>24<211>21<212>DNA<213>人工序列<220>
<223>用于通用结合剂的合成的DNA寡核苷酸<400>24gtgtgatatc taagaaacgg t 21
<210>25<211>33<212>DNA<213>人工序列<220>
<223>用于产生随机结合剂文库的简并环寡核苷酸的合成序列<220>
<221>misc_feature<222>(1)...(33)<223>n=a、t、g或c<400>25gctagcnnnn nnnnnnnnnn nnnnnnntgc gca33<210>26<211>27<212>DNA<213>人工序列<220>
<223>用于产生随机结合剂文库的简并环寡核苷酸的合成序列<220>
<221>misc_feature<222>(1)...(27)<223>n=a、g、t或c<400>26attaatnnnn nnnnnnnnnn nactagt 27<210>27<211>24<212>DNA<213>人工序列<220>
<223>用于产生随机结合剂文库的简并环寡核苷酸的合成序列<220>
<221>misc_feature<222>(1)...(24)<223>n=a、t、g或c<400>27caattgnnnn nnnnnnnnaa cgtt 24<210>28<211>33<212>DNA<213>人工序列<220>
<223>用于产生随机结合剂文库的简并环寡核苷酸的合成序列<220>
<221>misc_feature<222>(1)...(33)<223>n=a、t、g或c<400>28tggccannnn nnnnnnnnnn nnnnnnncac gtg33<210>29<211>30<212>DNA<213>人工序列<220>
<223>用于产生随机结合剂文库的简并环寡核苷酸的合成序列<220>
<221>misc_feature<222>(1)...(30)<223>n=a、t、g或c<400>29agtactnnnn nnnnnnnnnn nnnnccatgg30<210>30<211>21<212>DNA<213>人工序列
<220>
<223>合成的环i DNA序列<400>30cgttacctgc gttacccgtc t 21<210>31<211>7<212>PRT<213>人工序列<220>
<223>合成的环i氨基酸序列<400>31Arg Tyr Leu Arg Tyr Pro Ser1 5<210>32<211>7<212>PRT<213>人工序列<220>
<223>合成的亲代结合剂氨基酸序列<400>32Ala Gly Ala Ala Gly Ala Ala1 5<210>33<211>7<212>PRT<213>人工序列<220>
<223>由分子生物学生成的合成的环i序列<400>33Arg Tyr Leu Arg Tyr Pro Ser1 5
<210>34<211>33<212>DNA<213>人工序列<220>
<223>由分子生物学生成的合成的环i序列<400>34gctagccgtt acctgcgtta cccgtcttgc gca 33<210>35<211>7<212>PRT<213>人工序列<220>
<223>由计算机生成的合成的环i序列<400>35Ile Thr Ala Val Cys His Lys1 5<210>36<211>33<212>DNA<213>人工序列<220>
<223>由计算机生成的合成的环i序列<400>36gctagcatca ccgctgtttg ccacaaatgc gca 33<210>37<211>134<212>PRT<213>人工序列<220>
<223>合成的变体亲代结合剂<220>
<221>SITE
<222>(1)...(134)<223>Xaa=任何天然或合成的氨基酸<220>
<221>SITE<222>1,9,10,11,16,17,36,42,43,48,67,84,89,97,100,111,113,123,125,127<223>Xaa=任何非极性氨基酸<220>
<221>SITE<222>3,5,7,13,15,19,21,24,25,35,41,49,50,51,52,62,65,71,74,80,82,83,87,93,94,98,99,114,130,132<223>Xaa=任何脂族氨基酸<220>
<221>SITE<222>4,6,8,12,14,18,22,26,40,53,59,60,61,64,70,72,73,79,81,85,86,92,95,96,115,116,126,128,129<223>Xaa=任何极性氨基酸<220>
<221>SITE<222>20,39,44,46,66,68,101,112<223>Xaa=任何碱性氨基酸<220>
<221>SITE<222>(37)...(38)<223>Xaa=任何芳族氨基酸<220>
<221>SITE<222>(90)...(91)<223>Xaa=任何酸性氨基酸<220>
<221>SITE<222>(2)...(2)<223>Xaa=任何酸性氨基酸<220>
<221>SITE<222>(45)...(45)<223>Xaa=任何酸性氨基酸<220>
<221>SITE<222>(47)...(47)<223>Xaa=任何酸性氨基酸<220>
<221>SITE<222>(63)...(63)<223>Xaa=任何酸性氨基酸<220>
<221>SITE<222>(88)...(88)<223>Xaa=任何酸性氨基酸<220>
<221>SITE<222>(131)...(131)<223>Xaa=任何极性氨基酸<220>
<221>SITE<222>(133)...(133)<223>Xaa=任何极性氨基酸<220>
<221>SITE<222>(134)...(134)<223>Xaa=任何极性氨基酸<220>
<221>SITE<222>(69)...(69)<223>Xaa=任何芳族氨基酸<220>
<221>SITE<222>(124)...(124)<223>Xaa=任何芳族氨基酸
<220>
<221>SITE<222>(23)...(23)<223>Xaa=任何半胱氨酸样氨基酸<220>
<221>SITE<222>(97)...(97)<223>Xaa=任何半胱氨酸样氨基酸<220>
<221>SITE<222>(34)...(34)<223>Xaa=任何半胱氨酸样氨基酸<220>
<221>SITE<222>(110)...(110)<223>Xaa=任何半胱氨酸样氨基酸<400>37Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa1 5 10 15Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa20 25 30Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa35 40 45Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa50 55 60Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa65 70 75 80Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa85 90 95Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa100 105 110Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa115 120 125Xaa Xaa Xaa Xaa Xaa Xaa130<210>38
<211>132<212>PRT<213>人工序列<220>
<223>合成的通用结合剂<400>38Val Gln Leu Gln Ala Ser Gly Gly Gly Ser Val Gln Ala Gly Gly Ser1 5 10 15Leu Arg Leu Ser Cys Ala Ala Ser Ala Gly Ala Ala Gly Ala Ala Cys20 25 30Ala Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly Val Ala35 40 45Ala Ile Asn Ala Gly Ala Ala Gly Thr Ser Tyr Ala Asp Ser Val Lys50 55 60Gly Arg Phe Thr Ile Ser Gln Leu Ala Gly Ala Ala Asn Val Tyr Leu65 70 75 80Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr Cys Ala85 90 95Ala Gly His Ala Gly Ala Ala Gly Ala Ala Thr Cys Gly His Gly Leu100 105 110Ser Thr Ala Gly Ala Ala Gly Ala Pro Trp Gly Gln Gly Thr Gln Val115 120 125Thr Val Ser Ser130
权利要求
1.包括多肽的分离的结合剂,所述多肽包括SEQ ID NO2或SEQ ID NO4。
2.如权利要求1的分离的结合剂,其中,所述多肽能够结合选择的靶分子。
3.如权利要求1的分离的结合剂,其中,所述多肽具有五个结合环,每一个环包括Xaa氨基酸,并且,其中所述Xaa氨基酸是遗传编码的L-氨基酸、天然存在的非遗传编码的L-氨基酸、合成的L-氨基酸或它们的D-对映体。
4.如权利要求3的分离的结合剂,其中,每一个Xaa氨基酸被交换成特定的氨基酸,并且所述多肽能够结合选择的靶分子。
5.分离的核酸,其编码包括SEQ ID NO2或SEQ ID NO4的多肽。
6.如权利要求5的分离的核酸,其中,所述核酸包括SEQ ID NO1或SEQ ID NO3。
7.如权利要求5的分离的核酸,其中,所述核酸在可复制的载体或可复制的质粒中。
8.分离的核酸,其包括SEQ ID NO25、SEQ ID NO26、SEQ IDNO27、SEQ ID NO28或SEQ ID NO29。
9.分离的结合剂,其包括具有β桶构象的多肽,其中,所述多肽包括SEQ ID NO37。
10.如权利要求9的分离的结合剂,其中,所述多肽能够结合选择的靶分子。
11.如权利要求9的分离的结合剂,其中,所述多肽具有五个包括Xaa氨基酸的结合环,并且,其中所述Xaa氨基酸是遗传编码的L-氨基酸、天然存在的非遗传编码的L-氨基酸、合成的L-氨基酸或它们的D-对映体。
12.如权利要求11的分离的结合剂,其中,每一个Xaa氨基酸被交换成特定的氨基酸,并且所述多肽能够结合选择的靶分子。
13.表达载体,其包括启动子和编码包括SEQ ID NO2或SEQ IDNO4的多肽的核酸。
14.如权利要求13的表达载体,其中,所述多肽具有包括Xaa氨基酸的五个结合环,并且,其中所述Xaa氨基酸是遗传编码的L-氨基酸、天然存在的非遗传编码的L-氨基酸、合成的L-氨基酸或它们的D-对映体。
15.如权利要求13的表达载体,其中,每一个Xaa氨基酸被交换成特定的氨基酸,并且所述多肽能够结合选择的靶分子。
16.如权利要求13的表达载体,其中,所述核酸包括SEQ ID NO1或SEQ ID NO3。
17.表达载体,其包括启动子和编码具有β桶构象的多肽的核酸,其中,所述结合剂多肽包括SEQ ID NO37。
18.如权利要求17的表达载体,其中,所述多肽能够结合选择的靶分子。
19.如权利要求18的表达载体,其中,所述多肽具有包括Xaa氨基酸的五个结合环,并且,其中所述Xaa氨基酸是遗传编码的L-氨基酸、天然存在的非遗传编码的L-氨基酸、合成的L-氨基酸或它们的D-对映体。
20.如权利要求19的表达载体,其中,每一个Xaa氨基酸被交换成特定的氨基酸,并且所述多肽能够结合选择的靶分子。
21.结合剂文库,其中,所述文库中的每一种结合剂包括包含SEQID NO2的多肽。
22.结合剂文库,其中,所述文库中的每一种结合剂包括具有β桶构象的多肽,所述多肽包括SEQ ID NO37。
23.制备结合剂核酸文库的方法,包括生成随机寡核苷酸的集合,每一种随机寡核苷酸包括大约6-大约30n核苷酸的随机序列,其中,n是A、C、G或T;和将每一种随机寡核苷酸取代到包括SEQ ID NO1的核酸中,以便生成结合剂核酸文库。
24.如权利要求23的方法,其中,所述随机寡核苷酸的集合中的至少一种包括SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28或SEQ ID NO29。
25.如权利要求23的方法,其中,所述方法还包括将所述结合剂核酸文库放入宿主细胞群体中,以便生成宿主细胞文库。
26.一种制备编码结合剂多肽的可复制的载体文库的方法,包括生成随机寡核苷酸的集合,每一种随机寡核苷酸包括大约6-大约30n核苷酸的随机序列,其中,n是A、C、G或T;和将每一种随机寡核苷酸取代到包括SEQ ID NO1的可复制的载体中,以便生成编码结合剂多肽的可复制的载体文库。
27.如权利要求26的方法,其中,所述随机寡核苷酸的集合中的至少一种包括SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28或SEQ ID NO29。
28.如权利要求26的方法,其中,所述方法还包括将所述结合剂载体文库放入宿主细胞群体中,以便生成宿主细胞文库。
29.一种制备结合剂多肽文库的方法,包括生成随机寡核苷酸的集合,每一种随机寡核苷酸包括大约6-大约30n核苷酸的随机序列,其中,n是A、C、G或T;将每一种随机寡核苷酸取代到包括SEQ ID NO1的表达载体中,以便生成编码结合剂多肽的表达载体文库;和将所述表达载体文库放入宿主细胞群体中,以便生成表达结合剂多肽文库的宿主细胞文库。
30.如权利要求29的方法,其中,所述随机寡核苷酸的集合中的至少一种包括SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28或SEQ ID NO29。
31.一种制备结合剂核酸文库的方法,包括生成随机寡核苷酸的集合,每一种随机寡核苷酸包括大约6-大约30n核苷酸的随机序列,其中,n是A、C、G或T;和将每一种随机寡核苷酸取代到包括SEQ ID NO37的核酸中,以便生成结合剂核酸文库。
32.如权利要求31的方法,其中,所述随机寡核苷酸的集合中的至少一种包括SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28或SEQ ID NO29。
33.一种制备编码结合剂多肽的可复制的载体文库的方法,包括生成随机寡核苷酸的集合,每一种随机寡核苷酸包括大约6-大约30n核苷酸的随机序列,其中,n是A、C、G或T;和将每一种随机寡核苷酸取代到包括SEQ ID NO37的可复制的载体中,以便生成编码结合剂多肽的可复制的载体文库。
34.如权利要求33的方法,其中所述随机寡核苷酸的集合中的至少一种包括SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQID NO28或SEQ ID NO29。
35.如权利要求33的方法,其中,所述方法还包括将所述结合剂载体文库放入宿主细胞群体中,以便生成宿主细胞文库。
36.一种制备结合剂多肽文库的方法,包括生成随机寡核苷酸的集合,每一种随机寡核苷酸包括大约6-大约30n核苷酸的随机序列,其中,n是A、C、G或T;将每一种随机寡核苷酸取代到包括SEQ ID NO37的表达载体中,以便生成编码结合剂多肽的表达载体文库;和将所述表达载体文库放入宿主细胞群体中,以便生成表达结合剂多肽文库的宿主细胞文库。
37.如权利要求36的方法,其中所述随机寡核苷酸的集合中的至少一种包括SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQID NO28或SEQ ID NO29。
38.一种计算机实施的制备结合剂文库的方法,包括在靶分子上确定包括相互作用位点的搜索区,具有至少一个结合环的结合剂能够与所述搜索区相互作用;确定要搜索的结合环的数目和每一种结合环的大小;确定每一种结合环氨基酸序列的每一个位置上的氨基酸类型;将确定类型的氨基酸成员取代到每一种结合环氨基酸序列的位置中,以便生成多种输出结合环序列;将所述多种输出结合环序列的每一种配合入所述搜索区,并且产生靶分子-结合环序列配合得分;和通过靶分子-结合环序列配合得分对所述多种输出结合环序列进行分级;其中,所述结合剂包括SEQ ID NO2或SEQ ID NO37。
39.如权利要求38的方法,其中,所述搜索区包括所述靶分子中每一个非氢原子的x-、y-和z-坐标。
40.如权利要求38的方法,其中,所述方法还包括输入所述包括SEQ ID NO或SEQ ID NO37的结合剂中每一个非氢原子的x-、y-和z-坐标。
41.如权利要求38的方法,其中,所述方法还包括接受输入百分比选择,以便将所述输出结合环序列限定在特定百分比上;其中,所述输入百分比选择能够限定输出文库文件大小和文库复杂性。
42.如权利要求38的方法,其中,具有较高的靶分子-结合环序列配合得分的输出结合环序列能够以较高的亲和力结合所述靶分子。
43.如权利要求38的方法,其中,每一种类型的氨基酸分别包括下列任意一种氨基酸遗传编码的L-氨基酸、天然存在的非遗传编码的L-氨基酸、合成的L-氨基酸、遗传编码的氨基酸的D-对映体、天然存在的非遗传编码的氨基酸的D-对映体或合成的D-氨基酸。
44.如权利要求38的方法,其中,每一种类型的氨基酸分别包括下列任意一种氨基酸亲水性氨基酸、疏水性氨基酸、半胱氨酸样氨基酸、酸性氨基酸、碱性氨基酸、极性氨基酸、芳族氨基酸、非极性氨基酸或脂族氨基酸。
45.如权利要求38的方法,其中,所述靶分子是牛胰蛋白酶,并且,所述输出结合环序列之一是SEQ ID NO35。
46.一种用于生成肽序列的系统,包括处理器;与所述处理器偶联的存储器;与所述处理器偶联的显示器;能够在所述处理器上执行的构造环肽序列成分,以便生成输出环肽序列;分子停靠成分,所述成分能够将多种输出环肽序列配合在靶分子上的搜索区,并且生成靶分子-结合环序列配合得分;能够在所述处理器上执行的输出环序列成分,以便显示环肽序列;和能够在所述处理器上执行的输出结合剂序列成分,以便显示结合剂序列。
47.具有能够指导机器执行如下方法的相关内容的机器可存取介质,所述方法包括在靶分子上确定包括相互作用位点的搜索区,具有至少一个结合环的结合剂能够与所述区相互作用;确定要搜索的结合环的数目和每一种结合环的大小;确定每一种结合环氨基酸序列中每一个位置上的氨基酸类型;将特定类型的氨基酸成员取代到每一种结合环氨基酸序列的位置上,以便生成多种输出结合环序列;将所述多种输出结合环序列的每一种配合入所述搜索区,并且产生靶分子-结合环序列配合得分;和通过靶分子-结合环序列配合得分对所述多种输出结合环序列进行分级;其中,所述结合剂包括SEQ ID NO2或SEQ ID NO37。
48.如权利要求47的机器可存取介质,其中,所述方法还包括包括存储最高等级的靶分子-结合环序列配合得分和相关的结合环序列。
49.如权利要求47的机器可存取介质,其中,所述机器可存取介质还可以包括所述包括SEQ ID NO2、SEQ ID NO37或SEQ ID NO38的结合剂中每一个非氢原子的x-、y-和z-坐标的文件。
50.如权利要求47的机器可存取介质,其中,所述SEQ ID NO2、SEQ ID NO37或SEQ ID NO38的x-、y-和z-坐标可以由所述分子停靠程序使用来将每一种结合环序列与靶分子进行比对。
全文摘要
本发明涉及具有结合环和稳定的β桶构象的结合剂。所述试剂的结合环可以容易地改变,以便所述结合剂能够结合任何选择的靶分子。还提供了用于生成具有不同结合环的结合剂的多种方法。
文档编号C07K14/00GK1756761SQ200380110076
公开日2006年4月5日 申请日期2003年10月9日 优先权日2002年12月30日
发明者S·奎尔克 申请人:金伯利-克拉克环球有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1