全面单克隆抗体产生的制作方法与工艺

文档序号:13083533阅读:744来源:国知局
本申请要求2010年12月31日提交的美国专利申请第61/429,004号和2011年1月4日提交的美国专利申请第61/429,690号的优先权;本申请是申请日为2011年12月28日、申请号201180068870.7且发明名称为“全面单克隆抗体产生”的中国专利申请的分案申请。发明背景哺乳动物的免疫系统是最万能的生物系统,因为可以产生超过1可以产7个抗体特异性。在个体动物中,存在至少5,000-10,000个能够产生独特抗体的不同B-细胞克隆。此外,由于抗体多样性产生过程中体细胞突变的过程,本质上可以产生无限数量的独特抗体分子。实际上,当前的生物和医学研究中有许多是针对开发这个库(repertoire)。Kohler和Milstein的杂交瘤方法的发展使得可以从免疫应答过程中诱发的抗体库中产生单克隆抗体,即,单特异性的抗体分子组成。不幸地是,目前用于产生单克隆抗体的方法不能够有效地研究由特定免疫原诱发的完整抗体应答。与这种不同抗体的巨大潜能形成对照,目前的杂交瘤方法通常每次融合只产生几百个不同的单克隆抗体。使用杂交瘤方法产生单克隆抗体的其他困难包括杂交瘤培养物的遗传不稳定性和生产能力低。本领域尝试克服这后两个问题的一种方法是,将来自特定目标杂交瘤的免疫球蛋白产生基因克隆至表达系统中。对在受试者中在给定瞬间表达的抗体进行分析,不是没有价值的,因为免疫球蛋白库可能含有数百万个不同的分子。目前只有少量能够特异性识别这库的元件的试剂是可利用的。确定所表达的基因的序列是可能的;然而,就实际情况而言,难以常规地分析超过约十个,或可能一百个基因,并且操作昂贵且费时。简而言之,目前只通过几种方法描述了免疫球蛋白库。本发明利用天然多样性和高多样性方法提供了有效产生高亲和性单克隆抗体的方法。发明概述在一个实施方案中,本发明提供了一种产生和鉴定结合至少一个靶抗原的重组抗体的方法,该方法包括筛选B细胞,以产生富集能够结合至少一个靶抗原的B细胞的B细胞文库;扩增获自在B细胞文库中表达的mRNA的cDNA,以制备包含VH和VL结构域的免疫球蛋白文库;由VH和VL结构域产生抗体,由此抗体包含轻链/重链组合并且由此所产生的组合的数量超过富集B细胞的文库中B细胞的数量;和用至少一个靶抗原筛选抗体,以鉴定能够结合至少一个靶抗原的抗体的子集;由此产生和鉴定结合至少一个靶抗原的重组抗体。在另一个实施方案中,本发明还提供了一种产生和鉴定结合至少一个靶抗原的重组抗体的方法,该方法包括筛选B细胞群,以产生富集能够结合至少一个靶抗原的B细胞的B细胞文库;扩增从在B细胞文库中的多个B细胞的单个B细胞中表达的mRNA获得的cDNA,以制备包含VH和VL结构域的免疫球蛋白文库;将免疫球蛋白文库克隆至表达载体中,以形成能够表达VH和VL结构域的表达载体的文库,由此将VH和VL结构域天然配对;和使用表达载体的文库在表达系统中表达VH和VL结构域,以形成抗体文库,其中抗体包含天然配对的VH和VL结构域;筛选用于结合至少一个靶抗原的抗体文库。在另一个实施方案中,本发明提供了一种产生和鉴定结合至少一个靶抗原的重组抗体的方法,该方法包括筛选B细胞,以产生富集能够结合至少一个靶抗原的B细胞的B细胞文库;扩增获自在B细胞文库中表达的mRNA的cDNA,以制备包含VH结构域的免疫球蛋白文库;由VH结构域和至少一个来自另一个来源的VL结构域产生抗体,由此抗体包含轻链/重链组合;和用至少一个靶抗原筛选抗体,以鉴定能够结合至少一个靶抗原的抗体的子集。在一些实施方案中,B细胞文库含有至少103个B细胞至至少108个B细胞,包括至少103个B细胞、105个B细胞、106个B细胞、107个B细胞或108个B细胞。在一些实施方案中,第一筛选选自荧光激活细胞分选术(FACS)和淘选(panning)。在一些实施方案中,至少一个靶抗原是单个靶抗原。在一些实施方案中,至少一个靶抗原是至少两个靶抗原,并且第一筛选步骤是筛选能够结合至少两个靶抗原的B细胞。至少两个靶抗原可以是单个靶分子上的两个表位。在一些实施方案中,B细胞是来自非人宿主的B细胞。可以用靶抗原免疫非人宿主。非人宿主可以是兔子或小鼠。在一些实施方案中,所产生的抗体是全长抗体。在其他实施方案中,它们是抗体片段、抗体衍生物、融合蛋白或嵌合抗体。嵌合抗体可以包含人Fc。在一些实施方案中,B细胞是来自人供体的B细胞。在一些实施方案中,产生是使用生物展示系统来获得展示抗体的细胞群的产生。在一些实施方案中,第二筛选步骤是通过荧光激活细胞分选术(FACS)的细胞群。生物展示系统可以是哺乳动物细胞表面展示系统、酵母细胞表面展示系统或细菌细胞表面展示系统。在一些实施方案中,所产生的抗体是全长抗体。在一些实施方案中,该方法还包括在产生抗体后、在筛选抗体后,或两者后,获得编码VH和VL结构域的DNA序列。获得编码VH和VL结构域的DNA序列包括高通量筛选、深度序或两者的组合。在一些实施方案中,其中筛选步骤是高通量筛选。高通量筛选可以是FACS或筛选阵列。在一些实施方案中,该方法还包括表征能够结合至少一个靶抗原的抗体。在一些实施方案中,表征包括进行结合测定,来测定对靶抗原的结合亲和性。结合测定可以是ELISA。对靶抗原的结合亲和性可以为10μM至1nM,包括高于10μM、高于100nM和高于10nM的结合亲和性。此外,结合亲和性可以高于1nM。在一些实施方案中,表征包括测定等电点、测定热稳定性、测定沉淀速率、测定折叠速率、测定抗原活性的中和、测定对抗活性、测定激动活性、测定表达水平、测定非特异性结合、测定特异性和测定酶活性的抑制、测定刚性/弹性、测定形状、测定电荷、测定在不同pH中的稳定性、测定在不同溶剂中的稳定性、测定UV稳定性、测定在不同机械条件下的稳定性、测定在不同声波条件下的稳定性、测定半衰期和/或测定糖基化。在一些实施方案中,该方法进一步包括演化(evolving)重组抗体。演化可以是全面位置演化(ComprehensivePositionalEvolution)、全面位置演化接着全面蛋白合成(ComprehensiveProteinSynthesis)、随机诱变和/或PCR改组。在一些实施方案中,抗体的选择、演化和表达是在真核细胞生产宿主中;并且该方法包括在真核细胞生产宿主中产生抗-抗原抗体文库;针对至少一种预定的特性、特征或活性筛选文库;从文库中选择模板抗体;用抗体细胞表面展示演化模板抗体,以在真核细胞生产宿主中产生一组突变抗体;针对至少一种预定的特性、特征或活性,筛选突变抗体;基于与模板抗体比较时至少一种预定的特性、特征或活性的优化从该组突变抗体中选择高表达突变型抗体(up-mutantantibody);以及在与产生步骤中相同的真核细胞生产宿主中表达高表达突变型抗体。在这个实施方案中,产生可以是通过细胞表面展示的产生。在一些实施方案中,该方法还包括人源化重组抗体。在一些实施方案中,该方法包括通过高通量筛选(任选包括荧光激活细胞分选术(FACS)或机器人技术)来自用靶抗原免疫的非人宿主筛选分离的B细胞,以产生富集能够结合靶抗原的B细胞文库;扩增获自在B细胞文库中表达的mRNA的cDNA,以制备包含VH和VL结构域的免疫球蛋白文库;使用生物展示系统来获得展示抗体的细胞群,从而从VH和VL结构域产生全长抗体的文库,由此抗体包含轻链/重链组合和由此所产生的组合的数量大于富集B细胞文库中的B细胞的数量;用靶抗原通过高通量筛选(任选包括荧光激活细胞分选术(FACS)或机器人技术)筛选细胞群,以鉴定展示能够结合靶抗原的抗体的细胞的子集;由此产生和鉴定结合靶抗原的重组抗体。附图简述图1显示了本发明用于从B细胞文库产生一个或多个重组单克隆抗体的实施方案。用靶抗原免疫非人宿主,以产生针对靶抗原的抗体。或者,B细胞可以获自人B细胞血液供体,或已经用人免疫系统改造的转基因动物。将获自宿主的B细胞接受筛选,如FACS筛选,并且分离结合靶抗原的B细胞,以提供富集结合靶抗原的B细胞的B细胞文库。在一个实施方案中,称为“天然多样性”方法,以保持原始重链和轻链组合的方式对来自文库的B细胞进行PCR。例如,对来自文库的单独B细胞进行RT-PCR,保持了来自每个细胞的原始重链和轻链组合。将所得到的核酸克隆,优选克隆至细胞表面展示系统中。然后筛选所得到的文库,例如通过ELISA、功能测定或测序,包括高通量、深度测序。如果需要,可以将苗头(hit)进行证实和归类。然后对任一个或全部苗头进行功能表征。在另一个实施方案中,称为“高多样性”方法,将B细胞文库集中,并对集中的细胞进行了PCR,如RT-PCR,以扩增重链和轻链核酸。任选将这些核酸测序,例如以证实序列多样性。在这个实施方案中,然后在克隆时将重链和轻链组合地结合,以形成重链/轻链组合分子的多样化文库。优选,将核酸克隆至细胞表面展示系统中。然后筛选所得到的文库,例如,通过ELISA、功能测定或测序,包括高通量、深度测序。如果需要,可以将苗头进行证实和归类。然后对任一个或全部苗头进行功能表征。图2A和2B描绘了从使用本发明的方法制得的嵌合文库中衍生的序列的同源性树。从根据本发明的免疫小鼠衍生的B细胞扩增重链和轻链序列。对15,000个重链和15,000个轻链测序,接着比较,显示了衍生克隆的高多样性。数据还表明分子接受超体细胞突变。高亮的序列表示亲和性成熟的克隆。图3显示了针对抗原结合和表达而生长(扩增)并通过FACS筛选的100,000个成员的克隆组合文库。还将没有克隆的CHO细胞分选为阴性对照。可以进行第二筛选。例如,可以进行测序(包括高通量、深度测序)、动力学测定或功能筛选/测定,来进一步鉴定或表征前导(lead)抗体。术语的定义为了便于理解本文提供的实例,将对一些频繁出现的方法和/或术语进行描述。术语“亲和性成熟”指的是对抗原的免疫应答的平均亲和性的增加。实际上,这可以在重复暴露于抗原后产生。特别优选的取代变体类型涉及取代亲本抗体(例如,人抗体)的一个或多个超变区残基。通常,为进一步研发选择所得到的变体相对于产生它们的亲本抗体将具有改善的生物特性。用于产生这类取代变体的便利方式涉及使用本文所述的技术或本领域技术人员已知的其他技术的亲和性成熟,例如,所述技术为噬菌体展示(SchierR.,J.Mol.Biol.,263:551-67,1996)。然后如本文中所述的,例如,Biacore分析,筛选变体的生物活性(例如,结合亲和性)。为了鉴定是用于修饰的良好候选物的超变区残基,可以进行丙氨酸扫描诱变,来鉴定明显有助于抗原结合的超变区残基。在一个或多个相关试验中具有优越特性的抗体可以经历进一步的研发。本文中所用的术语“试剂”表示抗体或抗体文库。通过包含在下文中所述的筛选测定中,评价试剂作为例如抗肿瘤剂、抗炎剂或凋亡调节剂的潜在活性。通过包含在下文中所述的筛选测定中,评价试剂作为特定蛋白相互作用抑制剂(即,选择性地抑制两个预定多肽之间的结合相互作用但基本上不干扰细胞生活力的试剂)的潜在活性。如本文中所用的术语“氨基酸”指的任何含有氨基(--NH2)和羧基(--COOH)的有机化合物;优选作为自由基,或可选地,缩合后作为肽键的一部分。本领域应理解“二十个天然编码的多肽-形成α-氨基酸”并且指的是:丙氨酸(ala或A)、精氨酸(arg或R)、天冬酰胺(asn或N)、天冬氨酸(asp或D)、半胱氨酸(cys或C)、谷氨酸(glu或E)、谷氨酰胺(gln或Q)、甘氨酸(gly或G)、组氨酸(his或H)、异亮氨酸(ile或I)、亮氨酸(leu或L)、赖氨酸(lys或K)、甲硫氨酸(met或M)、苯丙氨酸(phe或F)、脯氨酸(pro或P)、丝氨酸(ser或S)、苏氨酸(thr或T)、色氨酸(trp或W)、酪氨酸(tyr或Y)和缬氨酸(val或V)。术语“扩增”意思是增加多核苷酸的拷贝数。如本文中所用的术语“抗体”指的是完整的免疫球蛋白分子以及能够结合抗原表位的免疫球蛋白分子片段,如Fab、Fab′、(Fab)2、Fv和SCA片段。Fab片段由抗体分子的单价抗原结合片段组成,并可以通过木瓜蛋白酶消化整个抗体分子产生由完整的轻链与部分重链组成的片段而得到。可通过用胃蛋白酶处理整个抗体分子,然后还原产生由完整的轻链与部分重链组成的分子来获得抗体分子的Fab′片段。以这种方式处理每个抗体分子将获得两个Fab′片段。可通过用胃蛋白酶处理整个抗体分子不需随后还原来获得抗体的(Fab′)2片段。(Fab′)2片段是两个Fab′片段通过两个二硫键连接在一起形成的二聚体。Fv片段定义为作为两条链表达的含有轻链可变区和重链可变区的基因工程片段。单链抗体(“SCA”)为由合适的、弹性多肽连接体连接的含有轻链可变区和重链可变区的基因工程单链分子。术语“改良型生物药(biobetter)”指可以携带与之前批准的新生物治疗剂相同的治疗适应症并对相同或相似靶标发挥作用的产品。然而,改良型生物药通过表达优越的临床功效的独特的特征来区分。这可以凭借如降低的剂量、延长的半衰期、方便的剂量配制和提高的安全性这样的属性来体现。由于改良型生物药具有突变或其他修饰,它们是新的物质组合物,它们需要新的临床试验,并且通常到得到专利保护。术语“生物仿制药(biosimilar)”,又称作“后续生物制品(follow-onbiologic)”,是指专利或专营权届满后,得到官方批准的创新生物药剂制品(innovatorbiopharmaceuticalproducts)的新产品。术语“细胞生产宿主”或“制造宿主”指的是用于产生或制造蛋白的细胞系。真核细胞,如哺乳动物细胞,包括但不限于人、小鼠、仓鼠、大鼠、猴细胞系以及酵母、昆虫和植物细胞系。或者,可以使用原核细胞。在一个方面中,哺乳动物细胞生产宿主选自:3T3小鼠成纤维细胞;BHK21叙利亚仓鼠成纤维细胞;MDCK细胞;狗上皮细胞;Hela人上皮细胞;PtK1鼠袋鼠上皮细胞;SP2/0小鼠浆细胞及NS0小鼠浆细胞;HEK293人胚肾细胞;COS猴肾细胞;CHO;CHO-S中国仓鼠卵巢细胞;R1小鼠胚细胞;E14.1小鼠胚细胞;H1人胚细胞;H9人胚细胞;PERC.6,人胚细胞。在另一个方面中,细胞生产宿主是GS-NSO或GS-CHOK1细胞系。在另一个方面中,细胞生产宿主选自酿酒酵母(S.cerevisiae)酵母细胞;和毕赤酵母细胞。在另一个方面中,细胞生产宿主是细菌细胞系。具有“嵌合特性”的分子是指分子:1)与第一参考分子部分同源和部分异源;2)同时与第二参考分子部分同源和部分异源;没有3)排除同时与再一种或多种其它参考分子部分同源和部分异源的可能性。在非限制性的实施方案中,可通过组装重新排列的部分分子序列来制备嵌合分子。在非限制性的方面中,可使用多个分子模板通过合成嵌合多核苷酸来制备嵌合多核苷酸分子,使得所得到的嵌合多核苷酸具有多个模板的属性。如本文中所用的术语“同源”指的是物种之间进化和功能相关的基因序列。例如,但不限于,在人基因组中,人CD4基因是小鼠3d4基因的同源基因,因为这两个基因的序列和结构表明,它们是高度同源的,并且这两个基因编码都编码通过MHCII类限制性抗原识别的在发出T细胞激活信号中发挥功能的蛋白。术语“商业规模”意思是以用于转售的适当规模生产蛋白或抗体。如本文中所用的“比较窗口”指的是至少20个连续核苷酸位置的概念片段(conceptualsegment),其中多核苷酸序列可以与至少20个连续核苷酸的参考序列进行比较,且其中比较窗口中多核苷酸序列部分与参考序列(其不包含添加或缺失)相比可以包含20%或以下的添加或缺失(缺口),用于两条序列的最佳比对。用于比对比较窗口的序列最佳比对可以依照以下方法进行:SmithandWaterman(1981)Adv.Appl.Math.2:482的局部同源性算法,NeedlemenandWuncschJ.MoI.Biol.48:443(1970)的同源性比对算法,PearsonandLipmanProc.Natl.Acad.Sci.(U.S.A.)85:2444(1988)的相似性搜索法,这些算法的计算机化实施(WisconsinGeneticsSoftwarePackageRelease7.0中的GAP、BESTFIT、FASTA和TFASTA,GeneticsComputerGroup,575ScienceDr.,Madison,Wis.)或通过检查,并且选择通过各种方法产生的最佳比对(即,在比较窗口中形成同源性最高百分比)。如本文中所用的术语“互补性决定区”和“CDR”指的是由Kabat和Chothia例证的本领域公认的术语。CDR的定义,一般也被称为超变区或高变环(ChothiaandLeks,1987;Clothiaetal.,1989;Kabatvetal.,1987;以及Tramontanoetal.,1990)。尽管稍微更短或更长的可变结构域也适于形成单链抗体,但可变区结构域通常包含天然存在的免疫球蛋白链的氨基末端的大约105-115个氨基酸(例如,氨基酸1-110)。CDR是免疫球蛋白上决定所述分子特异性并与特定配体接触的部分。CDR是所述分子上最可变的部分并促成了这些分子的多样性。每个V结构域中存在三个CDR区,即CDR1、CDR2和CDR3。CDR-H表示可变重链的CDR区,而CDR-L涉及可变轻链的CDR区。H表示可变重链,而L表示可变轻链。Ig衍生区的CDR区可以如Kabat(1991)所述来确定。SequencesofProteinsofImmunologicalInterest(免疫学目标蛋白的序列),第5版,NIH公开号91-3242U.S.美国卫生和公众服务部(DepartmentofHealthandHumanServices),Chothia(1987)J.MoI.Biol.196,901-917和Chothia(1989)Nature,342,877-883。如本文所用的术语“全面的”指的是演化技术,其中在模板多核苷酸或模板多肽的每个位置上进行每一种可能的变化,并且通过测序或一些其他技术检测多核苷酸或多肽以证实已发生预期的变化。全面诱变指的是突变编码蛋白的基因区的DNA,所述突变改变所述蛋白的密码子氨基酸序列,然后通过测序或其他技术确定所有突变已经发生,并且在最佳情况中排列,其中每个克隆在可鉴定的位置和/或被独特地标记。然后进行所有表达的突变体的筛选,以确保对于提高的表型,所有都得到了全面表达,以提供有保证的全面覆盖,即,用包含BioAtlaCPE方法的全面筛选的CPE文库。同时也可以为了表达测量筛选系统中的非表达克隆,以确保一旦能够用于表达可替换的系统,如体外转录和翻译,没有不正确地标记为阴性或天然突变。或者,可以在筛选后对所有克隆进行测序,但应当包括所有阴性、天然和高表达突变型克隆。然后将没有鉴定的任何突变体加入第二轮筛选中,以产生真实的全面诱变和筛选表达/活性系统,如CPE。术语“全面位置演化”(CPETM)用于描述可以用于增强单个或多个抗体特性和结合特征的抗体演化技术平台。对于所有证实序列(或通过其他非统计学证实方法证实的)的蛋白内每个位置的63种可能的密码子变化,CPE平台可以将蛋白内每个单独密码子变化的体内作用全面性地作图。这种全面诱变技术通过测试沿着抗体可变结构域序列的每个位置的氨基酸变化快速地产生了抗体变体。术语“组合蛋白合成”(CPSTM)用于描述可以用于通过将抗体的最佳特性组合至新的、高性能抗体中来优化所需抗体特征的组合蛋白合成技术。可以在CPETM后使用CPSTM,并且其可以虑及随后产生和体内选择改进的单独密码子的所有排列,用于鉴定蛋白或抗体内密码子变化的最优组合或组。这些技术的组合可以显著扩大用于筛选的抗体变体的集合,并且显著提高了发现具有单个或多个增强特征的抗体的可能性,所述特征如结合亲和性、特异性、热稳定性、表达水平、效应子功能、糖基化和溶解性。“保守氨基酸取代”指的是具有相似侧链的残基的可互换性。例如,一组具有脂肪族侧链的氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;一组具有脂肪族羟基侧链的氨基酸是丝氨酸和苏氨酸;一组具有含酰胺侧链的氨基酸是天冬酰胺和谷氨酰胺;一组具有芳香侧链的氨基酸是苯丙氨酸、酪氨酸和色氨酸;一组具有碱性侧链的氨基酸是赖氨酸、精氨酸和组氨酸;以及一组具有含硫侧链的氨基酸是半胱氨酸和甲硫氨酸。优选的保守氨基酸取代组为:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸和天冬酰胺-谷氨酰胺。本文中所用的术语“对应于”意思是多核苷酸序列与全部或部分参考多核苷酸序列同源(即,是相同的、非严格进化相关的),或多肽序列与参考多肽序列是相同的。相比之下,本文中所使用的术语“与……互补”意思是互补序列与全部或部分参考核苷酸序列同源。为了说明,核苷序列“TATAC”对应于参考序列“TATAC”,并且与参考序列“GTATA”互补。术语“降解有效”量指的是与不接触酶的底物相比,加工至少50%底物所需的量。优选,至少80%底物被降解。如本文中所用的,术语“限定的序列框架”指的是在非随机的基础上,通常基于实验数据或结构数据,而选择的一组限定的序列;例如,除其它变化外,限定的序列框架可以包含预测形成β片层结构的一组氨基酸序列,或可以包含亮氨酸拉链七肽重复基序、锌指结构域。“限定的序列核”是一组包括有限范围可变性的序列。而(1)20个常规氨基酸的完全随机10-mer序列可以是(20)10个序列中的任一个序列,和(2)20个常规氨基酸的伪随机的10-mer序列可以是(20)10个序列中的任一个序列,但将在特定位置和/或整体表现出某些残基偏好,(3)如果各残基位被允许是可允许的20个常规氨基酸(和/或可允许的非常规氨基/亚氨基酸)中的任一个,则限定的序列核是序列的子集。在单个选定的文库成员序列的片段或全长中,限定的序列核通常包括变异和非变异的残基位置和/或包括变异的残基位置,其可以包含选自氨基酸残基的限定子集的残基等。限定的序列核可以指氨基酸序列或多核苷酸序列。举例,但不限于,序列(NNK)10和(NNM)10,其中,N代表A、T、G或C,K代表G或T,且M代表A或C,是限定的序列核心。如本文所用的术语“去免疫”涉及产生模板结合分子的变体,与原始野生型分子相比,通过使所述变体在人体内无免疫原性或免疫原性减少,修饰所述变体。根据本发明的去免疫分子涉及非人来源的抗体或其部分(如框架和/或CDR)。相应的实例是描述于US4,361,549中的抗体或其片段。术语“去免疫”还涉及显示出产生T细胞表位的倾向降低的分子。根据本发明,术语“产生T细胞表位的倾向降低”涉及T-细胞表位的去除,从而导致特定的T-细胞激活。此外,产生T细胞表位的倾向降低意思是有助于T细胞表位形成的氨基酸的取代,即,对于T细胞表位形成是必须的氨基酸的取代。换言之,产生T细胞表位的倾向降低涉及免疫原性降低或诱导抗原非依赖性T细胞增殖的能力降低。此外,产生T细胞表位的倾向降低涉及去免疫化,这意思是诱导抗原非依赖性T细胞增殖的氨基酸序列的潜在T细胞表位的缺失或减少。如本文中所用的术语“T细胞表位”涉及细胞内的肽、多肽或蛋白降解过程中释放出并且随后由主要组织相容性复合体(MHC)的分子呈递以触发T细胞激活的短肽序列,特别参见WO02/066514。对于由II类MHC呈递的肽,这种T细胞的激活随后可通过直接刺激B细胞产生所述抗体从而引发抗体应答。DNA的“消化”指的是用仅在DNA特定序列发挥作用的限制性酶催化的DNA断裂。本文中所用的各种限制性酶是可购得的,且它们所用的反应条件、辅酶因子和其它需求是本领域普通技术人员已知的。为了分析目的,1μg质粒或DNA片段通常使用在约20μl缓冲液中的约2个单位的酶。为了分离用于构建质粒的DNA片段,一般用在更大体积中的20至250个单位的酶消化5至50μgDNA。具体限制性酶的合适缓冲液和底物量是由制造商指定的。通常使用37℃下约1小时的孵育时间,但可根据供应商的说明有所变化。消化后,将反应物直接进行凝胶电泳,以分离所需的片段。如本文中所用的术语“DNA改组”表示在基本上同源但不相同的序列之间的重组,在一些实施方案中,DNA改组涉及通过非同源重组,如通过cer/lox和/或flp/frt系统等的交换(crossover)。改组可以是随机或非随机的。如本发明中所用的术语“表位”指的是抗原上的抗原决定簇,如IL-6多肽,抗体(如抗IL-6特异性抗体)的互补位可与其结合。抗原决定簇通常由分子的化学活性表面基团(如氨基酸或糖侧链)组成,且可以具有特定的三维结构特征以及特定的电荷特征。如本文中所用的“表位”指的是抗原或其它大分子上能形成与抗体的可变区结合体相互作用的结合相互作用的那部分。通常,这种结合相互作用表现为与CDR的一个或多个氨基酸残基的分子间接触。术语“演化”指的是与模板抗体相比,基因或合成修饰的抗体的至少一种特性、特征或活性的变化。当涉及到参考多肽时,术语“片段”、“衍生物”和“类似物”包括保留了至少一种与参考多肽至少基本上相同的生物功能或活性的多肽。此外,术语“片段”、“衍生物”或“类似物”的典型实例是“前体形式(pro-form)”分子,如通过切割修饰而产生具有显著较高活性的成熟酶的低活性前体蛋白。术语“片段”应用于核酸序列时,指的是编码抗体分子的一部分或子部分(sub-portion)的分子。例如,HCCDR1DNA片段,可以编码完整的重链CDR1,或其截短的部分。在一个方面中,本文中提供的某些方法提供了由模板多肽产生一组子代多肽,在所述子代多肽中,在每个氨基酸位置表现为“全范围单个氨基酸取代”。如本文中所用的,“全范围单个氨基酸取代”指的是如本文所述的形成天然编码多肽的20个天然编码的α-氨基酸。术语“基因”意思是参与产生多肽链的DNA片段;它包括编码区之前和之后的区域(前导区和拖尾区)以及个体编码片段(外显子)之间的间隔序列(内含子)。如本文中所用的“遗传不稳定性”指的是在减少事件(reductiveevents)过程中(其一般涉及通过重复序列的丢失使序列简化)高度重复序列被丢失的自然趋势。缺失往往涉及一个重复拷贝的丢失和重复之间一切的丢失。术语“异源”意思是单链核酸序列无法与另一条单链核酸序列或其补体进行杂交。因此,异源区域意思是多核苷酸区域或多核苷酸在其序列内含有无法与另一个核酸或多核苷酸杂交的区域(area)或区(region)。这些区或区域例如是突变区域。术语“同源(homoologous)”或“部分同源(homeologous)”是指一条单链核酸核酸序列可以与互补的单链核酸序列进行杂交。杂交的程度可能取决于许多因素,包括序列之间相同同一性的量和杂交条件,如后面讨论的温度和盐浓度。优选相同区大于约5bp,更优选相同区大于10bp。术语“人源化的”用来描述抗体,其中来自哺乳类动物(例如,小鼠)的互补性决定区(CDR)与人框架区相结合。通常将编码分离的CDR的多核苷酸移植(graft)到编码合适的可变区框架(和任选恒定区)的多核苷酸中,以形成编码完整抗体(例如,人源化的或完全人的)、抗体片段等的多核苷酸。在另一个方面中,除了小鼠抗体以外,还可以人源化其他物种,如,例如,其它啮齿动物、骆驼、兔、猫、狗、猪、马、牛、鱼、美洲驼和鲨鱼。广义而言,任何产生抗体的物种可以用于生产人源化抗体。此外,为了减少其潜在的抗原性,而不降低它们对靶苗头的亲和性,本发明的抗体可以为嵌合的、类人(human-like)的、人源化的或完全人抗体。嵌合的、类人的和人源化的抗体通常为如本领域所述的。通过在杂合抗体中整合尽可能少的外源序列来降低抗原性。可以通过本领域公知的方法来制备这些杂合抗体。免疫球蛋白轻链或重链可变区由被三个高变区(也称为CDR)隔开的“框架”区组成。框架区和CDR的范围已被精确的定义(参见,“SequencesofProteinsofImmunologicalInterest(免疫学目标蛋白的序列)”,Kabatetal.,1987)。物种内不同的轻链或重链框架区的序列相对保守。如本文所用,“人框架区”与天然存在的人免疫球蛋白的框架区基本上相同(约85或以上,通常90-95或以上)。抗体的框架区,即轻链和重链的组合框架区,用于定位和比对CDR。CDR主要负责结合抗原表位。按照本发明,框架区涉及免疫球蛋白的V结构域(VH或VL结构域)中的区,其为与抗原接触的高变互补性决定区(CDR)提供蛋白支架。在每个V结构域,存在四个框架区,称为FRL、FR2、FR3和FR4。框架1包括从V结构域的N-端直至CDR1的开始,框架2涉及CDR1和CDR2之间的区,框架3包括CDR2和CDR3之间的区,以及框架4意思是从CDR3的末端直至V结构域的C-端;特别参见,Janeway,Immunobiology(免疫生物学),GarlandPublishing,2001,5thed(第5版)。因此,框架区包括VH或VL结构域中CDR区外的所有区。在公开内容的一个方面中,将单个序列用于框架4,其通过抗体文库的每个成员保持恒定。在一个方面中,编码框架区4的单个序列是人框架集合中发现的最常见序列,仅限于来自功能表达抗体的种系序列。本领域技术人员很容易由给定的序列推断出框架区和CDR;参见Kabat(1991)SequencesofProteinsofImmunologicalInterest(免疫学目标蛋白的序列),5thedit(第5版),NIH公开号91-3242U.S.DepartmentofHealthandHumanServices(美国卫生和公众服务部),Chothia(1987)J.MoI.Biol.196,901-917和Chothia(1989)Nature,342,877-883。本发明的益处延及“工业应用”(或工业生产过程),该术语用于包括商业产业(或简单产业)中正确的应用以及非商业产业应用(例如,在非营利机构中进行生物医学研究)。相关应用包括在诊断、医药、农业、制造业和学术研究领域中的应用。、术语“相同的(identical)”或“同一性(identity)”意思是两条核酸序列具有相同的序列或互补序列。因此,“相同的区域”是指多核苷酸的区(region)或区域(area)相同,或整个多核苷酸与另一个多核苷酸的区域或多核苷酸相同或互补。术语“分离的”是指该物质从原始环境(例如,如果它是天然存在的,则指的是自然环境)中移出。例如,在活动物体内存在的天然产生的多核苷酸或蛋白不是分离的,但是与自然体系中的某些或全部共存的物质中分开的同样的多核苷酸或蛋白则是分离的。这样的多核苷酸可以作为载体的一部分,和/或这样的多核苷酸或蛋白可作为组合物的一部分,且仍然可以分离的,因为这种载体或组合物不是自然环境的一部分。“分离的核酸”意思是核酸,例如DNA或RNA分子,其不直接与5'和3'侧翼序列相邻,但当存在于其来源的生物体的天然存在的基因组中时通常与所述5'和3'侧翼序列直接相邻。因此,该术语描述,例如,并入载体(如质粒或病毒载体)中的核酸;并入异源细胞基因组(或同源细胞的基因组中,但与它天然存在的位置不同)中的核酸;及作为分开的分子存在的核酸,例如,通过PCR扩增或限制性酶消化产生的DNA片段,或通过体外转录产生的RNA分子。该术语还描述了形成编码其他多肽序列的杂合基因一部分的重组核酸,所述其他多肽序列用于例如产生融合蛋白。如本文中所用的“配体”指的是被特定受体识别的分子,如随机肽或可变片段序列。本领域技术人员应当认识到,分子(或大分子复合物)可以同时是受体和配体。通常,分子量较小的结合伴侣称为配体,而分子量较大的结合伴侣称为受体。“连接”指的是在两个双链核酸片段之间形成磷酸二酯键的过程(Maniatisetal.,1982,p.146)。除非另外规定,连接可使用已知的缓冲液和条件来完成,用10个单位的T4DNA连接酶(“连接酶”)/每0.5μg约等摩尔量的待连接DNA片段。如本文中所用的,“连接体”或“间隔物”是指连接两个分子(如DNA结合蛋白和随机肽),并可以将两个分子置于优选的构型中的一个分子或一组分子,例如,使得随机肽能够以DNA结合蛋白最小的空间位阻与受体结合。术语“哺乳动物细胞表面展示”指的是出于筛选的目的使蛋白或抗体或抗体的一部分在哺乳动物宿主细胞表面上表达和展示的技术;例如,通过荧光激活细胞分选术来筛选特异性的抗原结合。在一个方面中,哺乳动物表达载体用于免疫球蛋白同时以如同DuBridge等的US2009/0136950中的分泌的和细胞表面结合的形式表达,在此通过引用并入US2009/0136950。在另一个方面中,Gao等的技术用于编码抗体文库的病毒载体,或抗体片段,当在如同Gaoet等的US2007/0111260中的细胞中表达时,将抗体片段展示于细胞膜上,Gao等的US2007/0111260在此通过引用并入。整个IgG于哺乳动物细胞表面上的表面展示是已知的。例如,Akamatsuu等基于它们的抗原结合亲和性和生物活性,开发出适于直接分离IgG分子的哺乳动物细胞表面展示载体。使用EB病毒(Epstein-Barrvirus)衍生的游离基因载体,在细胞表面上展示作为整个IgG分子的抗体文库,并通过磁珠和荧光激活细胞分选术的组合来筛选出特异性抗原结合。从分选的细胞中回收编码具有所需结合特征的抗体的质粒,并将其转化为用于产生可溶性抗体的形式。Akamatsuuetal.,J.Immunol.Methods2007,327(1-2):40-52,在此通过引用将其并入。对于用于亲和性成熟的单链Fv抗体的细胞表面展示,Ho等使用了广泛用于瞬时蛋白表达的人胚胎肾293T细胞。通过从大量表达具有略低亲和性的WT抗体的细胞中进行单通细胞分选(single-passcellsorting),将表达具有较高亲和性的稀有突变抗体的细胞富集了240倍。此外,对使内在抗体热点随机化的组合文库进行单次选择后,获得了CD22结合亲和性增强的高度富集的突变体。Hoetal.,Isolationofanti-CD22FvwithhighaffinitybyFvdisplayonhumancells,ProcNatlAcadSci,USA,2006June20;103(25):9637-9642;在此通过引用将其并入本文。Beerli等,使用直接从人供体的外周血单核细胞(PBMC)中分离出的目标抗原特异性B细胞。从该B细胞集合产生了重组的抗原特异性单链Fv(scFv)文库,并使用辛德毕斯病毒表达系统通过哺乳动物细胞表面展示技术进行了筛选。这种方法可通过单轮FACS分离抗原特异性抗体。从阳性克隆中分离出重链(HC)和轻链(LC)的可变区(VR),并产生出作为完整IgG或Fab片段的重组的完全人抗体。以这种方式,分离出几个结合Qβ病毒样颗粒(VLP)即模型病毒抗原的超突变高亲和力抗体,以及分离出烟碱特异性抗体。在细胞培养物中,全部抗体显示出高表达水平。Beerlietal.,Isolationofhumanmonoclonalantibodiesbymammaliancelldisplay,ProcNatlAcadSciUSA,2008September23;105(38):14336-14341;通过引用将其并入本文。在小鼠模型中,临床前证实了了人烟碱特异性mAb。酵母细胞表面展示也是已知的,例如,参见KondoandUeda2004,Yeastcell-surfacedisplay-applicationsofmoleculardisplay(分子展示的酵母细胞表面展示应用),Appl.Microbiol.Biotechnol.,64(1):28-40,其描述了例如,利用酿酒酵母的细胞表面工程系统。几个用于在酿酒酵母中表达的代表性展示系统描述于Leeetal.,200,Microbialcell-surfacedisplay(微生物细胞表面展示)TRENDSinBitechnol.21(1):45-52。还参见BoderandWittrup1997,Yeastsurfacedisplayforscreeningcombinatorialpolypeptidelibraries(用于筛选组合多肽文库的酵母表面展示),NatureBiotechnol.,15(6):553。术语“制造”指的是以保证治疗性蛋白的至少I期临床试验的足够量或用于监管机构审批诊断蛋白的足够量来产生蛋白。术语“错义突变”指的是其中单核苷酸发生改变的点突变,其产生编码不同氨基酸的密码子。使氨基酸变为终止密码子的突变,称为无义突变。如本文中所用的“待演化的分子特性”包括由多核苷酸序列组成的分子、由多肽序列组成的分子,以及部分由多核苷酸序列且部分由多肽序列组成的分子。特别相关的-但绝不是限制-待演化的分子特性的实例包括在特定条件下的酶活性,如涉及温度;盐度;压力;pH以及甘油、DMSO、去污剂和/或在反应环境中所接触的任何其他分子的浓度。其他特别相关的-但绝不是限制-待演化的分子特性的实例包括稳定性--例如,在暴露于特定的环境中一段特定的时间后,残存的分子特性的量,该环境为诸如可能在存储过程中遇到的环境。术语“多维表位作图”(MEM)指的是确定表位并解析对于抗体结合很重要的氨基酸。关于由抗体识别的蛋白结合位点(表位)的信息,对将其用作生物学或诊断的工具以及理解其作用机制很重要。然而,抗原在其一级序列以及三维结构中是高度多样化的。表位通常分为三类:1)线性表位,即抗体结合多肽链线性部分的残基,2)构象表位,其中结合位点由结构元件形成(例如,α-螺旋、环),3)不连续表位,其中在抗原的三维结构中多肽链的两段或多段单独的序列结合在一起而形成结合表面。术语“进行突变”指的是在核酸序列中产生突变;当突变发生于蛋白编码区的情况下,将导致密码子改变,其可能会或可能不会产生氨基酸变化。术语“突变”是指野生型核酸序列的序列中的变化或肽或多肽序列中的变化。这种突变可以是点突变,如转换或颠换。所述突变可能是缺失、插入或重复。如本文中所用的,简并“N,N,G/T”核苷酸序列表示32种可能的三联体,其中“N”可以是A、C、G或T。如本文中所用的,简并“N,N,N”核苷酸序列表示64种可能的三联体,其中“N”可以是A、C、G或T。如本文所用的术语“天然存在”所适用对象指的是可以在自然界中发现的对象的事实。例如,生物体(包括病毒)中存在的、可从自然界来源分离出的、尚未在实验室中被人为修饰的多肽或多核苷酸的序列是天然存在的。一般来说,术语天然存在指的是在非病理(未患病)个体中存在的对象,例如对于该物种是普遍的。如本文中所用的,“核酸分子”由至少一个碱基或一个碱基对组成,这分别取决于其是单链或双链。此外,核酸分子可完全地或嵌合地(chimerically)属于任何含有核苷酸的分子,例如但不限于以下核酸分子的组:RNA、DNA、基因组核酸、非基因组核酸、天然存在和非天然存在的核酸及合成的核酸。非限制的实例包括与任何细胞器相关的核酸,如线粒体、核糖体RNA,以及由一种或多种不是与天然存在的成分一起天然存在的成分嵌合组成的核酸分子。此外,“核酸分子”可以部分含有一种或多种非核苷酸成分,例如但不限于氨基酸和糖类。因此通过举例而非限制,部分基于核苷酸和部分基于蛋白的核酶被认为是“核酸分子”。此外,通过举例而非限制,由可检测的部分,如放射性或可替换的非放射性标记来标记的核酸分子,同样被认为是“核酸分子”。术语“编码特定蛋白的核酸序列”或“特定蛋白的DNA编码序列”或“编码特定蛋白的核苷酸序列”--以及其他同义词--指的是当置于适当调控序列的控制下时,转录并翻译成蛋白的DNA序列。“启动子序列”是在细胞内能够结合RNA聚合酶并启动下游(3'方向)编码序列转录的DNA调控区。启动子是DNA序列的一部分。该序列区在其3'端具有起始密码子。启动子序列的确包含最少数量的碱基,其中是对于在高于背景的可检测水平下启动转录的必要元件。然而,在RNA聚合酶结合该序列并在起始密码子处(含启动子的3'端)开始转录后,转录沿3'方向向下游进行。在启动子内将发现转录起始位点(通过核酸酶S1的图谱来方便地确定)以及负责RNA聚合酶结合的蛋白结合域(共有序列)。术语“编码蛋白的核酸”或“编码蛋白的DNA”或“编码蛋白的多核苷酸”和其他同义词涵盖只包括蛋白的编码序列的多核苷酸以及包括其他编码和/或非-Cq3编码序列的多核苷酸。在一个优选的实施方案中,“具体核酸分子种类(species)”是由它的化学结构来限定的,例如但不限于,一级序列,在另一个优选的实施方案中,具体“核酸分子种类”是通过该核酸种类的功能或通过由该核酸种类衍生的产物的功能来限定的。因此,通过非限制性的实例,“具体核酸分子种类”可由一种或多种属于它的活性或特性来限定,包括属于其表达产物的活性或特性。即时定义“将核酸工作样品组装成核酸文库”包括将核酸样品并入基于载体的集合(collection)中的过程,如通过连接到载体中并转化宿主。相关载体、宿主和其他试剂及其具体非限制性实例将在下文中描述。本发明的即时定义“将核酸工作样品组装成核酸库”还包括将核酸样品并入非基于载体的集合中的过程,如通过连接适配子。优选适配子可以与PCR引物退火,以便促进PCR扩增。因此,在非限制性的实施方案中,“核酸文库”由一种或多种核酸分子的集合组成。在另一个优选的实施方案中,“核酸文库”由非基于载体的核酸分子的集合组成。在又一个优选的实施方案中,“核酸文库”由部分基于载体和部分非基于载体的核酸分子的组合集合组成。优选,根据单独的核酸分子种类,包含分子集合的文库是可搜索的且可分离的。本发明提供了“核酸构建体”或可替换的“核苷酸构建体”或可替换的“DNA构建体”。本文使用的术语“构建体”用来描述可以任选地化学结合一个或多个其它分子部分(如载体或载体的一部分)的分子,如多核苷酸(例如,植酸酶多核苷酸)。在具体的--但不是限制的--方面中,核苷酸构建体的实例为适合于宿主细胞转化的表达DNA的DNA表达构建体。“寡核苷酸”(或同义地“寡”)指的是可以化学合成的单链多脱氧核苷酸或两条互补的多脱氧核苷酸链。这种合成寡核苷酸可以含有或不含有5′磷酸。除非在激酶存在下向ATP中添加磷酸,否则那些不含有5′磷酸的合成寡核苷酸不会与另一个寡核苷酸连接。合成寡核苷酸会连接没有被去磷酸化的片段。为了实现基于聚合酶的扩增反应(如PCR),需提及“由至少第一同源序列即简并N,N,G/T序列和第二同源序列串联组成的32倍简并寡核苷酸”。如本文中所用的“同源的”是指进行基于聚合酶的扩增反应的寡核苷酸和亲本多核苷酸之间的同源性。如本文中所用的术语“可操作地连接”是指多核苷酸元件按功能关系进行连接。当核酸被置于与另一个核酸序列的功能关系中时,则它被“可操作地连接”。例如,如果启动子或增强子影响到编码序列的转录,则它被可操作地连接于所述编码序列。可操作地连接是指将要连接的DNA序列通常是连续的,且如果对于连接两个蛋白编码区是必须的,则其是连续的且位于阅读框中。RNA聚合酶将两条编码序列转录为一条mRNA时,编码序列与另一个编码序列“可操作地连接”,然后其被翻译成含有源自两条编码序列的氨基酸的单个多肽。该编码序列不必彼此相邻,只要所表达的序列最终被加工以产生所需的蛋白即可。如本文中所用的术语“生理条件”指的是与活的生物体相适的和/或通常存在于活的培养酵母细胞或哺乳动物细胞内的温度、pH值、离子强度、粘度等生化参数。例如,在典型实验室培养条件下生长的酵母细胞中的胞内条件为生理条件。体外转录混合物的合适的体外反应条件通常为生理条件。一般而言,体外生理条件包括50-200mMNaCl或KCl,pH6.5-8.5,20-45℃和0.001-10mM二价阳离子(例如,Mg++,Ca++);优选约150mMNaCl或KCl,pH7.2-7.6,5mM二价阳离子,且通常包括0.01-1.0%非特异性蛋白(例如,BSA)。常常存在非离子型去污剂(吐温,NP-40,TritonX-100),通常约0.001-2%,通常0.05-0.2%(v/v)。具体含水条件可以由操作者按照常规方法加以选择。对于一般性的指导,可以使用以下缓冲含水条件:10-250mMNaCl,5-50mMTrisHCl,pH5-8,任选添加二价阳离子和/或金属螯合剂和/或非离子去污剂和/或膜组分和/或消泡剂和/或闪烁材料(scintillants)。如本文中所用的术语“群”意思是组分(如,多核苷酸、其部分或多核苷酸或蛋白)的集合。“混合群”意思是属于同一核酸或蛋白家族(即相关的)但其序列不同(即不相同)并且因此生物活性不同的组分的集合。具有“原形式(pro-form)”的分子指的是如下的分子,在获得与对照的原形式分子相比具有不同属性的(例如,活性增加)更成熟的分子形式的过程中,所述分子经过一种或多种共价和非共价化学修饰(例如,糖基化、蛋白酶剪切、二聚化或寡聚化、温度诱导的或pH诱导的构象变化、与辅因子结合等)的任意组合。在成熟分子的产生过程中,当两种或多种化学修饰(例如,两种蛋白质水解,或蛋白质水解和去糖基化)可区别开来时,该参照前体分子可以称为“原前体形式(pre-pro-form)”的分子。“特性”可以描述任何特征,包括待优化蛋白或抗体的任何物理、化学或活性特征特性。例如,在某些方面中,待优化的预定特性、特征或活性可以选自:蛋白-蛋白聚集减少、蛋白稳定性增强、蛋白溶解度增加、蛋白pH稳定性增强、蛋白温度稳定性增强、蛋白溶剂稳定性增强、选择性增强、选择性下降、糖基化位点的引入、结合位点的引入、免疫原性下降、蛋白表达的增强、抗原亲和性增加、抗原亲和性下降、结合亲和性变化、免疫原性变化、催化活性变化、pH优化或特异性增强。待优化的其他特性或特征包括体内(例如,血清半衰期)和/或体外(例如,半衰期)抗体稳定性;抗体的熔化温度(Tm)(例如,如通过差异扫描量热法(DSC)或本领域已知的其他方法测定)、抗体的pI(例如,如等电聚焦(IEF)或本领域已知的其他方法测定);溶解性;结合特性(例如,抗体-抗原结合常数,如Ka、Kd、Kon、Koff)、平衡解离常数(KD);抗体溶解性(例如,在药物学上可接受的载体、稀释剂或赋形剂中的溶解性)、效应子功能(例如,抗体依赖性细胞-介导的细胞毒性(ADCC));表达水平和产生水平(例如,来自细胞的抗体产量)。“优化的”特性指的是与模板抗体相比,突变蛋白或抗体中具体特性的所需变化。在一个方面中,优化特性指的是其中相对于模板抗体,改进为约1%至500%,或相对于模板抗体,约2倍至1000倍。如本文中所用的,术语“伪随机”指的是这样的一组序列,其具有有限的变异性,例如,在另一个位置上残基的变异程度,但在任何伪随机位置上允许一定程度的残基变化,然而这些变化是有限的。如本文中所用的“准重复单元”指的是待重配的重复单元,且根据定义是不相同的。事实上,该方法不仅是为由相同的起始序列产生的几乎相同的编码单元而提出的,也是为那些可以在某些区域显著不同的相似或相关序列的重配而提出的。然而,如果该序列中含有足够的可以通过这种方法重配的同源序列,它们可以称为“准重复”单元。如本文中所用的“随机肽文库”指的是编码一组随机肽的一组多核苷酸序列,并指由那些多核苷酸序列编码的一组随机肽,以及含有那些随机肽的融合蛋白。如本文中所用的,“随机肽序列”指的是由两个或多个氨基酸单体组成并通过随机(stochastic)或随机(random)方法构建的氨基酸序列。随机肽可以包括含有不变序列的框架或支架基序。如本文中所用的,“受体”指的是对给定的配体具有亲和性的分子。受体可以为天然存在的或合成的分子。受体可以以未改变的状态或作为与其他物质的聚合物来使用。受体可以共价或非共价地,直接地或通过特异性的结合物质连接结合成员。受体的实例包括,但不限于抗体,包括单克隆抗体和与特异性抗原决定簇反应的抗血清(如病毒、细胞或其他物质)、细胞膜受体、复合碳水化合物和糖蛋白、酶和激素受体。“重组”蛋白指的是通过重组DNA技术产生的酶,即由编码所需蛋白的外源DNA构建体转化的细胞产生的。“合成”蛋白是通过化学合成制备的那些蛋白。术语“相关的多核苷酸”意思是多核苷酸的区(region)或区域(area)是相同的,以及多核苷酸的区或区域是异源的。如本文中所用的“减少性重配(reductivereassortment)”指的是通过由重复序列介导的缺失(和/或插入)事件而产生的分子多样性的增加。以下术语用来描述两个或多个多核苷酸之间的序列关系:“参照序列”、“比较窗口”、“序列同一性”、“序列同一性百分比”和“基本相同”。“参照序列”是用作序列比较基础的限定序列;参照序列可以是较大序列的子集,例如,作为序列表中给出的全长cDNA或基因序列的片段,或可以包含完整的cDNA或基因序列。一般来说,参照序列的长度为至少20个核苷酸,长度经常为至少25个核苷酸,通常长度为至少50个核苷酸。由于两个多核苷酸可以各自(1)包含在两个多核苷酸之间相似的序列(即,完整核苷酸序列的一部分),以及(2)还可以包含两个多核苷酸之间不同的序列,因此两个(或多个)多核苷酸之间的序列比较通常通过在“比较窗口”中比较两个多核苷酸序列从而确定和比较局部区域的序列相似性来进行。如本文中所用的“重复指数(RI)”是克隆载体中含有的准重复单元的平均拷贝数。术语“饱和”指的是其中在模板多核苷酸或模板多肽的每个位置上进行各种可能变化的演化技术;然而,每个位置上的变化不是通过检测来确定的,但仅为统计学推测,其中估计出模板每个位置上发生的大多数可能的变化或几乎每种可能的变化。饱和诱变指的是使编码蛋白的基因区的DNA发生突变,其改变所述蛋白的密码子氨基酸序列,然后基于接近全面覆盖的统计学过-采样(over-sampling),从基本上所有突变体的表达突变体中筛选出改进的表型,但不保证全面覆盖。术语“序列同一性”意思是在比较窗口中两个多核苷酸序列是相同的(即,基于核苷酸-核苷酸比对)。术语“序列同一性百分比”通过以下方式计算:在所述比较窗口中比较两个最佳比对序列,确定两个序列中出现相同核酸碱基(例如,A、T、C、G、U或I)位置的数量,产生匹配位置的数量,用匹配位置的数量除以比较窗口中的位置总数(即窗口大小),所得结果乘以100得到序列同一性百分比。如本文中所用的这个“基本相同”表示多核苷酸序列的特征,其中多核苷酸序列与至少25-50个核苷酸的比较窗口的参照序列相比,包含具有至少80%序列同一性、优选至少85%序列同一性、通常90至95%序列同一性、最通常至少99%序列同一性的序列,其中通过将参照序列与可以包括比较窗口中参照序列的总共20%或以下的缺失或添加的多核苷酸序列相比,计算序列同一性百分比。术语“沉默突变”指的是不会导致所表达多肽中的氨基酸改变且基于氨基酸插入的密码子使用的冗余的密码子变化。本领域已知的两个蛋白之间的“相似性”是通过氨基酸序列和一个蛋白的保守氨基酸取代与第二个蛋白序列的比较来确定的。可采用本领域众所周知的方法来确定相似性,例如,BLAST程序(美国国家生物信息中心网站(NationalCenterforBiologicalInformation)上的基础局部比对搜索工具(BasicLocalAlignmentSearchTool))。如本文中所用的术语“单链抗体”指的是多肽连接中包含VH域和VL域的多肽,通常通过间隔肽(例如,[Gly-Gly-Gly-Gly-Ser]x)连接,并且其可以在氨基-和/或羧基-端包括其他氨基酸序列。例如,单链抗体可以包含用于连接编码多核苷酸的粘连部分(tethersegment)。例如,scFv为单链抗体。单链抗体一般是基本上由免疫球蛋白超家族的基因编码的至少10个连续氨基酸的一个或多个多肽片段组成的蛋白(例如,参见WilliamsandBarclay,1989,pp.361-368,通过引用将其并入本文),最常见由啮齿动物、非人灵长类动物、禽类、猪、牛、绵羊、山羊或人类重链或轻链基因序列编码。功能性的单链抗体通常含有免疫球蛋白超家族基因产物的足够部分,从而保留了结合具体靶分子的特性,所述靶分子通常为受体或抗原(表位)。如果一对分子(例如,抗体-抗原对或核酸对)的成员彼此结合的亲和性比与其他非特异性分子结合的亲和性更大,则将它们称为彼此“特异性结合”。例如,针对抗原而产生的抗体与所述抗原的结合比它与非特异蛋白的结合更有效,则该抗体可描述为与该抗原特异性地结合。(同样,如果通过碱基配对相互作用核酸探针与靶标形成特异性的双链体,则可描述为该核酸探针特异性地结合核酸靶标(见上文))。“特异性杂交”在本文中限定为在第一多核苷酸和第二多核苷酸(例如,具有与第一个多核苷酸不同,但基本上相同序列的多核苷酸)之间形成杂合体,其中在混合物中基本上不相关的多核苷酸序列不形成杂合体。术语“具体多核苷酸”意思是具有确定的端点和具有确定的核酸序列的多核苷酸。两个多核苷酸,其中一个多核苷酸与第二多核苷酸的一部分的序列相同,但末端不同,则包含两个不同的具体多核苷酸。“严格的杂交条件”意思是仅在序列之间具有至少90%,优选至少95%,更优选至少97%同一性时,才会发生杂交。参见Sambrooketal.,1989年,通过引用将其整体并入本文。本发明还包括与多肽序列(如本文中公开的任一个SEQIDNO的序列)“基本相同”的多肽序列。“基本相同”的氨基酸序列是与参照序列只有保守氨基酸取代不同的序列,例如,用一个氨基酸取代同一类的另一个氨基酸(例如,用一种疏水性氨基酸,如异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸取代另一种疏水性氨基酸,或用一种极性氨基酸取代另一种极性氨基酸,如用精氨酸取代赖氨酸,用谷氨酸取代天门冬氨酸,或用谷氨酰胺取代天门冬酰胺)。此外,“基本相同”的氨基酸序列是与参照序列不同的序列,其与参照序列的不同之处在于一个或多个非保守取代、缺失或插入,特别是当这种取代发生在分子的非活性位点上时,且前提是多肽实质上保留了其行为特性。例如,植酸酶多肽上可以缺失一个或多个氨基酸,从而形成了没有显著改变其生物活性的多肽结构修饰。例如,可以除去对于植酸酶生物活性非必需的氨基或羧基端的氨基酸。这种修饰可导致活性较低的植酸酶多肽的形成。本发明提供“基本上纯的蛋白”。如本文中所用的术语“基本上纯的蛋白”用来描述分子,如多肽(例如,植酸酶多肽或其片段),其基本上不含自然情况下与其相结合的其他蛋白、脂类、碳水化合物、核酸和其他生物材料。例如,基本上纯的分子,如多肽,可以占目标分子至少60%的干重。可以使用标准方法,包括,例如,聚丙烯酰胺凝胶电泳(例如,SDS-PAGE)、柱层色谱(例如,高效液相色谱(HPLC))和氨基端氨基酸序列分析,来确定多肽纯度。如本文中所用的“基本上纯的”意思是目标物质是所存在的主要物质(即在摩尔量上,它比组合物中任何其他单独的大分子更丰富),优选地,基本上纯的级分是指组合物中,目标物占存在的所有大分子的至少约50%(在摩尔量上)。通常,基本上纯的组合物包含在组合物中存在的所有大分子的约80-90%或更多。更优选地,将目标物纯化成基本均一(采用常规检测方法检测不到组合物中的污染物),其中组合物基本上由一种大分子组成。溶剂物质、小分子(<500道尔顿)和元素离子物质不被认为是大分子。发明详述本发明涉及用于生产高亲和性单克隆抗体方法,包括筛选和分离识别靶抗原的B细胞。更特别地,本发明进一步涉及用于从B细胞产生至少一种靶抗原特异性的重组单克隆抗体的方法。(本发明不依赖于或利用永生化细胞,如杂交瘤细胞)。本文中所述的用于产生高多样性、高亲和性抗体的方法称为VersitopeTM抗体产生(VersitopeTMAntibodyGeneration)。在优选的实施方案中,产生了全长、表面展示的抗体。表面展示系统可以是酵母、哺乳动物或细菌。表面展示产生了“超亲合力”效应,其对于特定的选择方法是有益的。例如,细胞表面展示技术对于选择弱表位是有益的;因此,与只筛选较强结合表位的方法相比,在本发明中,表位覆盖最大化。例如,可以筛选和选择表达所需免疫球蛋白的B细胞,并且可以鉴定、克隆和表征免疫球蛋白重链(例如,VH区)和/或轻链(例如,VL区)的序列。本文中所公开的方法显著提高了单克隆抗体产生的效率,同时保持对靶抗原的高亲和性和表位覆盖。应当认识到,在许多情况中,使用本发明的方法会获得超过一种的具有合适特异性的重组单克隆抗体;因此在本文中提到“重组抗体”,指的是一种或多种重组抗体。一对分子(例如,抗体-抗原对或核酸对)的成员,如果它们彼此结合的亲和性比与其他非特异性分子结合的亲和性更大,则将它们称为彼此“特异性地结合”。例如,针对抗原产生的抗体与所述抗原的结合比它与非特异蛋白的结合更有效,则可将所述抗体描述为与该抗原特异性地结合。(同样,如果通过碱基配对相互作用核酸探针与靶标形成特异性双链体,则所述核酸探针可描述为特异性结合目标核酸)。本发明利用B细胞上的膜相关免疫球蛋白的表达来鉴定和选择脾细胞或其他生物样品(例如,血液)中的特异性B细胞。例如,使用荧光激活细胞分选术(FACS)或淘选,通过荧光或发光标记,检测和选择表达所需免疫球蛋白的B细胞。比色、放射性或其他方法和测定也可以使用。在本发明的另一个方面中,从非免疫的非人或人宿主分离全部B-细胞,并且通过例如使用PCR的扩增或其他策略分离B-细胞基因,如本文中所述的。因此,在优选的方面中,本发明提供了生产重组抗体的方法,其包括通过荧光激活细胞分选术(FACS)、淘选或另一种筛选方法,从用靶抗原免疫的非人宿主或人免疫的宿主筛选B细胞的步骤,以产生富集能够结合靶抗原的B细胞的B细胞文库。或者,从人或非人非免疫宿主分离B细胞,产生重组抗体。图1中用图显示了这些方法,并且本文中将详细说明。如本文中所用的术语免疫球蛋白或抗体指的是完整的免疫球蛋白分子,以及免疫球蛋白分子的能够结合抗原表位的衍生物或片段,如Fab、Fab′、(Fab)2、Fv和单链抗体片段。可以使用本领域公知的(参见,例如,HarlowandLane,同上)方法来制得这些抗体片段,并且下文将对其进一步描述,所述抗体片段保留了一部分选择性结合其来源的抗体抗原(例如,多肽抗原)的能力。Fab片段由抗体分子的单价抗原结合片段组成,并可以通过木瓜蛋白酶消化整个抗体分子产生由完整轻链与部分重链组成的片段而得到。衍生物包括修饰的衍生物,即,通过任何类型的分子与抗体的共价连接,使得共价连接没有阻止抗体产生抗-独特型应答。例如,但不限于,抗体衍生物包括已经通过以下方式修饰的抗体,例如糖基化、乙酰化、聚乙二醇化、磷酸化、酰胺化、通过抑制保护/阻断基团衍生化、蛋白酶剪切、连接细胞配体或其他蛋白等。可以通过已知技术,包括,但不限于,特异性化学裂解、乙酰化、甲酰化、衣霉素的代谢合成等,来进行多种化学修饰中的任一种。此外,衍生物可以含有一个或多个非典型氨基酸。如本文中所用的,配体是被具体受体识别的分子,如随机肽或可变片段序列。本领域技术人员应当认识到,分子(或大分子复合物)可以同时是受体和配体。通常,分子量较小的结合伴侣称为配体,而分子量较大的结合伴侣称为受体。如本文中所用的“受体”指的是对给定的配体具有亲和性的分子。受体可以为天然存在的或合成的分子。受体可以以未改变的状态或作为与其他物质的聚合物来使用。受体可以共价或非共价地,直接地或通过特异性的结合物质连接结合成员。受体的实例包括,但不限于,抗体,包括单克隆抗体和与抗原决定簇反应的抗血清(如病毒、细胞或其他物质)、细胞膜受体、复合碳水化合物和糖蛋白、酶和激素受体。可以通过用胃蛋白酶处理整个抗体分子,然后还原产生由完整的轻链与部分重链组成的分子来获得抗体分子的Fab′片段。以这种方式处理每个抗体分子将获得两个Fab′片段。可以通过用胃蛋白酶处理整个抗体分子而后不经过还原来获得抗体的(Fab′)2片段。(Fab′)2片段是两个Fab′片段通过两个二硫键连接在一起形成的二聚体。Fv片段定义为作为两条链表达的含有轻链可变区和重链可变区的基因工程片段。如本文中所用的术语“单链抗体”(“SCA”)指的是多肽连接中包含VH结构域和VL结构域的多肽,通常通过间隔肽(例如,[Gly-Gly-Gly-Gly-Ser]x)连接,并且其可以在氨基-和/或羧基-端包括其他氨基酸序列。例如,单链抗体可以包含用于连接编码多核苷酸的粘连部分(tethersegment)。例如,scFv为单链抗体。单链抗体一般是基本上由免疫球蛋白超家族基因编码的至少10个连续氨基酸的一个或多个多肽片段组成的蛋白(例如,参见WilliamsandBarclay,1989,pp.361-368,通过引用将其并入本文),最常见由啮齿动物、非人灵长类动物、禽类、猪、牛、绵羊、山羊或人类重链或轻链基因序列编码。功能性的单链抗体通常含有免疫球蛋白超家族基因产物的足够部分,从而保留了结合特异性靶分子的特性,所述靶分子通常为受体或抗原(表位)。如上所述,本发明涉及用于产生重组单克隆抗体的方法。具体而言,考虑了用于产生源自B细胞文库的重组单克隆抗体的方法,所述抗体结合通过FACS、淘选或其他筛选方法获得的靶抗原。尽管提及了结合靶抗原,但应当理解,可以筛选多个抗原来选择多功能抗体。多个抗原包括两个或多个不同抗原或相同靶标上的两个或多个不同表位。在本发明的第一个实施方案中,(“天然多样性”方法),保持了来自宿主的原始可变重链和可变轻链配对;即,所产生的抗体是“天然配对的”。这在某些时候是所需的,因为显然很可能源自免疫激发的宿主的B细胞中的体内轻链和重链的具体原始配对的确实存在意味着,这种重链和轻链的具体组合很可能在识别抗原中是功能性的。在该实施方案中,本发明提供了产生靶抗原特异性重组单克隆抗体的方法,其包括通过荧光激活细胞分选术(FACS)或其他方法,从用靶抗原免疫的非人或人宿主筛选B细胞群,以产生富集能够结合靶抗原的B细胞的B细胞文库;扩增获自在单个B细胞中表达的mRNA的cDNA,以制备包含VH和VL结构域的免疫球蛋白文库(对于B细胞文库中的多个B细胞,进行了单细胞扩增);将免疫球蛋白文库克隆至表达载体中,以形成能够表达VH和VL结构域的表达载体文库,使得VH和VL结构域天然配对;使用表达载体文库在表达系统中表达VH和VL结构域,以形成抗体文库,其中抗体包含天然配对的VH和VL结构域;筛选结合靶抗原的抗体文库;并且表征能够结合靶抗原的抗体。以这种方式,产生了一种或多种靶抗原特异性重组抗体。在另一个实施方案中,天然配对的抗体源自非免疫激发的宿主。本发明还包括另一个实施方案,其中产生了另外的轻链和重链组合(“高多样性方法”)。在这个实施方案中,本发明提供了产生靶抗原特异性重组单克隆抗体的方法,其包括通过荧光激活细胞分选术(FACS)、淘选或其他筛选方法,从用靶抗原免疫的非人或人宿主筛选B细胞,以产生富集能够结合靶抗原的B细胞的B细胞文库;扩增获自在B细胞文库中表达的mRNA的cDNA,以制备包含VH和VL结构域的免疫球蛋白文库;使用生物展示系统来获得展示抗体或片段或衍生物的细胞群,从而从VH和VL结构域产生抗体或片段或衍生物,由此抗体或片段或衍生物包含不存在于B细胞体内的轻链/重链组合,即,所产生的组合的数量超过富集B细胞文库中B细胞的数量;通过FACS,用靶抗原筛选细胞群,以鉴定展示能够结合靶抗原的抗体的细胞的子集;和表征能够结合靶抗原的抗体。以这种方式,产生了一种或多种靶抗原特异性重组抗体。在另一个实施方案中,抗体源自非免疫激发的宿主。在可替换的实施方案中,本发明提供了产生和鉴定结合至少一种靶抗原的重组抗体的方法,其包括筛选B细胞,以产生富集能够结合至少一种靶抗原的B细胞的B细胞文库;扩增获自在B细胞中表达的mRNA的cDNA,以制备包含VH结构域的免疫球蛋白文库;从VH结构域和至少一个来自另一个来源的VL结构域产生抗体,由此抗体包含轻链/重链组合;并且用至少一种靶抗原筛选抗体,以鉴定能够结合所述至少一种靶抗原的抗体的子集。以下将详细描述这些方法。B细胞文库的制备在本发明中,重组抗体源自B细胞。在一个实施方案中,可以根据标准技术免疫合适非人宿主(即,非人动物)以及制备和分离B细胞。可以用目标抗原或其免疫原性部分免疫合适的动物(例如,兔子、小鼠、大鼠、仓鼠、豚鼠、骆驼或山羊)。用于免疫非人动物(如,小鼠、大鼠、绵羊、山羊、猪、牛和马)的方法是本领域公知的。参见,例如,HarlowandLane,Antibodies:ALaboratoryManual(抗体:实验室手册),NewYork:ColdSpringHarborPress,1990。在本发明的另一个方面中,使用来自之前暴露的或免疫激发的病人的血液,并且从其分离B细胞。在另一个方面中,汇集从超过一个物种分离的B细胞。另外,可以使用转基因非人动物来产生人抗体,将所述转基因非人动物进行修饰,使其应答抗原激发时产生全人抗体,而不是动物的内源性抗体。(参见,PCT公布WO94/02602)。在非人宿主中编码免疫球蛋白重链和轻链的内源性基因已经丧失能力,并且将编码人免疫球蛋白重链和轻链的活性基因座插入宿主基因组中。例如,使用含有必需人DNA片段的酵母人造染色体,并入人基因。然后通过将含有比改造的全部补体少的中间转基因动物杂交,作为后代来获得提供所有所需修饰的动物。这样的非人动物的实例是PCT公布WO96/33735和WO96/34096中公开的称为XenomouseTM的小鼠。该动物产生可以用于产生B细胞文库的B细胞。通过本领域技术人员已知的其他方法制备的转基因人抗体动物,也可以用作本发明中的B细胞的来源。例如,GenPharmInternational,Inc.和MedicalResearchCouncil代表的“迷你基因座”方法。在迷你基因座方法中,通过包含来自Ig基因座的碎片(单个基因)模拟外源性Ig基因座。因此,一个或多个VH基因、一个或多个DH基因、一个或多个JH基因、mu恒定区和第二个恒定区(优选γ恒定区)形成用于插入动物中的构建体。例如,Surani等的U.S.专利第5,545,807号中描述了这个方法或涉及其工作。根据本发明的抗原或其表位可以是小肽、蛋白或非肽免疫原性化合物。抗原或免疫原可以是全长目标蛋白或源自抗原的免疫原性肽。在一些实施方案中,免疫原是长度为7至20个氨基酸、优选约8至17个氨基酸的肽长。可以根据公知技术,设计、构建和使用适于产生本发明抗体的肽抗原。参见,例如,Harlow&Lane,Eds.,ColdSpringHarborLaboratory(1988);Czernik,MethodsInEnzymology,201:264-283(1991);Merrifield,J.Am.Chem.Soc.85:21-49(1962)。免疫原性组合物的免疫原性常常会改变。抗体产生中所用的免疫原组合物的量会根据免疫原的性质以及用于免疫的动物而改变。多种途径可以用于给予免疫原(皮下、肌内、皮内、静脉内和腹膜内)。可以通过在免疫后的不同点获取免疫动物的血样来监控多克隆抗体的产生。还可以给予第二次的加强注射。常常需要加强宿主免疫系统,如可以通过将肽或多肽免疫原结合载体来实现。示例性和优选的载体是钥孔血蓝蛋白(KLH)和牛血清白蛋白(BSA)。其他白蛋白,如卵白蛋白、小鼠血清白蛋白或兔子血清白蛋白,也可以用作载体。所了解的用于将多肽缀合载体蛋白的方法是公知的,并且包括戊二醛、m-马来酰亚胺苯甲酰-N-羟基琥珀酰亚胺酯、碳化二亚胺和双-重氮化联苯胺。可以通过使用免疫应答的非特异性刺激剂(称为佐剂)来增强特定免疫原组合物的免疫原性。示例性并且优选的佐剂包括弗氏佐剂佐剂(含有杀灭的结核分枝杆菌(Mycobacteriumtuberculosis)的免疫应答的非特异性刺激剂)、不完全弗氏佐剂、RIBI(胞壁酰基二肽)、ISCOM(免疫刺激复合物)和氢氧化铝佐剂。作为对靶抗原的天然免疫应答的一部分,将发生产抗体细胞的增强,因为将刺激能够使抗体针对所述靶抗原的产抗体细胞(B细胞/B淋巴细胞)来增殖,并且因此将提高数量。这样的增强将随着时间发生,并且达到最大值,然后一旦所述抗原的含量降低或消除,将自然地变小,因为不再存在抗原诱导的B细胞增殖刺激,并且现有的B细胞将被天然产生的生物机制去除,例如,通过细胞死亡。从另一方面来说,产生本发明重组抗体的宿主已经在一定的时间点免疫激发/暴露于靶抗原,使得它们仍然处于对所述靶抗原等的免疫应答的活性期中。本领域技术人员可以容易地鉴定出处于免疫应答活性期中的宿主。例如,这样的宿主在应答靶抗原时将活跃地产生特异性抗体。因此,例如,所述靶抗原的高血清滴定度的特异性抗体的存在,表示这类合适的宿主。优选,将该高血清滴定度的特异性抗体与相对低血清滴定度的非特异性抗体组合,由此证明产抗体细胞的增强。再者,可以将候选宿主的血清滴定度与如上所述的天然供体或健康供体的血清滴定度相比较,以确定候选宿主中具体靶抗原的抗体的血清滴定度是否显著较高。因此,在暴露于抗原后存在时间窗口,其中源自用于为本发明的抗体表达文库提供遗传材料的宿主的B细胞可以得到最佳分离,以获得增强的B-细胞群的益处。满足这个要求的暴露于抗原后的时间长度在宿主与宿主之间可以是不同的,可能取决于外源试剂或所述靶抗原、宿主中B细胞的来源(例如,循环B细胞,相对于,例如,淋巴组织中的B细胞),并且还取决于是否增加对靶抗原的第一次、第二次或更多次的应答。然而,可以使用任何时间段,这是因为本发明的方法没有杂交瘤技术灵敏。如果需要,可以通过从宿主获取产抗体细胞(B细胞)的样品,例如,通过采取血样,并且使用相关靶抗原作为靶抗原,进行标准体外测定(例如,ELISA测定或ELISPOT测定,Czerkinslyetal.,1983,J.Immunol.Methods,vol65:109-121),并测量免疫反应的程度,从而容易地确定宿主的适用性。优选,还评估与对照抗原的免疫反应的程度,以提供对于所需抗体的样品增强水平的表示。与对照抗原低或相对低程度的免疫反应,证明了源自这些宿主的表达文库会含有较少的无关抗体,即,会得到富集并且对于抗所述抗原的抗体而言是多样化的。作为产生抗体的产抗体细胞来源的合适宿主的选择,也取决于希望包含在库中的抗体的类型。例如,如果希望产生包含富集的IgM谱系的文库,那么优选在宿主第一次暴露于靶抗原、试剂、疾病等之后,分离B细胞。另一方面,如果希望谱系反映出IgG形式(其是优选形式)或另一种形式(如IgA、IgD或IgE)抗体的富集集合,可以在第一次暴露于靶抗原等之后分离B细胞,但更优选,在第二次或随后的暴露后分离。这种免疫反应测量可以进行一次或多次,以监控宿主对抗原的免疫应答的进展和程度,并且评估(通过,例如,与天然供体进行合适的比较)是否存在合适增强的B细胞群。这样,可以确定从宿主收集产抗体细胞(其含有遗传材料,从其将产生表达文库)的最佳时间。此外,可以容易地鉴定出不适于或不再适于提供用于文库产生的材料的宿主。在一个方面中,该方法包括使用上文所述的ELISPOT测定(或其他合适的测定)。这样的测定尤其适用于测试循环B细胞,并且其基于用希望获得抗体的具体靶抗原(并且通过其将宿主免疫激发)包被表面,并且加入限定数量的B细胞。可以通过常规ELISA检测来检测分泌结合抗原的抗体的B细胞。该试验仅仅检测分泌特异性抗体的B细胞,而没有检测具有特异性膜结合抗体的B细胞,因此具有特异性抗体的B细胞的试剂数量实际上高于测试结果。在酶联免疫吸附测定(ELISA)中,将具有未知量抗原的样品非特异性地(通过吸附于表面)或特异性地(在“夹层”ELISA中,通过由相同抗原特异性的另一个抗体来捕获)固定于固体支持物上(通常是聚苯乙烯微量滴定平板)。抗原固定后,加入检测抗体,从而与抗原形成复合物。检测抗体可以共价连接酶,或自身可以通过二抗来检测,所述二抗通过生物缀合连接酶。每个步骤之间,通常用温和的去污剂溶液洗涤平板,以除去没有特异性结合的任何蛋白或抗体。在最终的洗涤步骤后,通过加入酶底物产生可见信号来使平板显影,所述可见信号表明样品中抗原的数量。传统ELISA通常涉及发色报告子和物质,其产生一定种类的可观察的颜色变化以表明抗原或分析物的存在。较新的ELISA-样技术利用荧光、电化学发光和实时PCR报告子来产生可定量信号。这些新的报告子具有各种优势,包括较高的灵敏度和信号倍增(multiplexing)。在技术上,这种较新类型的测定严格来说不是ELISA,因为它们不是“酶联的”,而是连接了一些非酶报告子。然而,已知这些测定中的一般原理很大程度上是相似的,因此常常将它们归入与ELISA相同的类别中。重复加强和滴定的过程直至获得合适的滴定度。当获得所需的免疫原性水平时,从动物中分离出产抗体B细胞。可以从脾、淋巴结或外周血、来自骨髓的细胞、扁桃体或任何其他次要淋巴组织、肿瘤浸润的淋巴细胞、受自体免疫疾病影响的组织或器官,或从已知带有产抗体B细胞的任何其他组织或流体或其他样品分离产抗体B细胞。在一些情况中,B细胞的合适来源将取决于搜寻抗体的疾病或免疫激发。对产生本发明该实施方案的抗体的非人宿主的主要要求在于,它们已经在一定的时间点免疫激发/暴露于靶抗原,使得它们仍然含有产抗体细胞库,其富集产生针对一种或多种靶抗原的抗体的细胞。可以分离并筛选(如下文中所述)单独的B细胞,以鉴定产生目标抗原特异性免疫球蛋白的细胞。然后将所鉴定的细胞用于本发明的各个实施方案中。在某些实施方案中,可以从患有感染、癌症、自体免疫病症或任何其他疾病的动物或人的血液或其他生物样品中分离产抗体B细胞,以鉴定潜在临床重要性的病原体、肿瘤和疾病特异性抗体。例如,动物可以是暴露于传染剂(例如,病毒、细菌、寄生物、朊病毒等)的动物和/或可以制备对抗传染剂(例如,病毒、细菌、寄生物、朊病毒等)的有用抗体的动物。来自免疫宿主的某些B细胞制备了抗一种或多种所述靶抗原的抗体。在本发明中,通过使用荧光激活细胞分选术(FACS)、磁激活细胞分选术(MACS)、淘选或其他筛选方法进行筛选和分选,富集淋巴细胞集合的所需B细胞,以在制备抗体或表达文库之前产生B细胞文库。与现有技术的富集方法相反,现有技术的方法只提供了几个表达不同抗体的B细胞子集,并且因此只有几个天然存在的可变重链(VH)和可变轻链(VL)基因的组合,而本发明的B细胞文库含有至少10个表达不同抗体的B细胞子集,并且在一些实施方案中,至少1000个表达对靶抗原具有亲和性的不同抗体的B细胞子集,并且再更进一步的实施方案中,至少103、104、105、106、107或108个表达不同抗体的B细胞子集。本发明的方法最大化了B细胞收集,并且提供了非常高的多样性。在其他实施方案中,利用了来自非免疫的人或非人供体的B细胞。动物的天然库(抗原激发前的库)提供了可以以中等亲和性(约106至107M-1的Ka)结合基本上任何非自体分子的抗体。抗体结合位点的序列多样性并未在种系中直接编码,而是以组合方式从V基因片段装配。免疫引发制备VH-VL组合的任何B细胞,其结合免疫原,以增殖(克隆扩增)和分泌如上所述的相应抗体。然而,来自未免疫供体的脾细胞和/或B细胞或其他外周血淋巴细胞(PBL)的使用,更好地表示了可能的抗体库,并且还允许使用任何动物(人或非人)物种构建B-细胞随后的抗体文库。可以通过如上所述的FACS分选或淘选来完成B细胞文库的产生。FACS是强有力的系统,其不仅定量荧光信号,而且还将含有预选特征(如,荧光强度、大小和生活力)的细胞从混合群中分离出来。随着细胞流过FACS,激光针对单独的细胞。当细胞的密集核物质干扰激光束路线时,产生了光散射图样。因此,可以基于细胞散射激光的能力,来随机选择细胞。在一个实施方案中,目标抗原(或其抗原部分)直接或间接连接荧光标记物,如异硫氰酸荧光素(FITC)或本领域公知的许多荧光染料分子中的任何分子,并且通过FACS分选仪来检测。FACS分选仪是测量细胞荧光的装置,其允许根据那些细胞的散射和荧光信号分析和分离细胞群。因此,细胞被荧光染料标记,所述荧光染料通常偶联于识别某一细胞类型的抗体。使用例如光电倍增管、CCD-和CMOS-检测仪和光子计数装备来检测所得到的信号(参见,例如,BaumgarthandRoederer,JImmunolMethods(2000)243:77-97)。淘选指的是用合适的受体(在这种情况中,抗体),使用靶抗原包被的表面来分离或浓缩具体细胞。例如,富集抗原反应性B细胞的一种方法是在已经包被有抗原的塑料盘上进行淘选。然后从塑料盘上洗脱抗原反应性B细胞,并且用于分离核酸。在某种程度上,与抗原反应性B细胞相反,也可以同时进行FACS分析和淘选(以及其他分离方法),来富集B细胞。选择总B细胞群的优势是更可能地包括浆细胞,或活跃地分泌免疫球蛋白的B细胞,这在需要用于检测的细胞表面免疫球蛋白存在的程序中可能会漏掉。常规的MACS程序描述于Miltenyietal.,“HighGradientMagneticCellSeparationwithMACS(使用MACS的高梯度磁细胞分离)”,Cytometry11:231-238(1990)。为了通过MACS分选细胞,用磁珠标记细胞,并使细胞通过顺磁性分离柱。将分离柱置于强永磁铁中,由此在柱内形成磁场。用磁标记的细胞被捕获在柱子中;细胞没有通过。然后从柱子上洗脱捕获的细胞。用于构建核酸的重组方法B细胞遗传材料的扩增本发明使用操纵核酸以产生单克隆抗体的步骤。在一般意义中,在本发明的每个实施方案中,使用B细胞遗传材料的扩增,例如反向转录聚合酶链式反应(RT-PCR),来产生cDNA。在天然多样性方法中,对B细胞文库中的单个细胞进行B细胞遗传材料RT-PCR扩增,而在高多样性方法中,对汇集的B细胞文库进行RT-PCR。对于全长抗体分子,免疫球蛋白基因可以获自B细胞的基因组DNA或mRNA。在哺乳动物载体系统中克隆抗体重链和轻链。用双链序列分析来证实装配。可以在其他人或哺乳动物宿主细胞系中表达抗体构建体。然后可以通过对表达的目标抗体进行瞬时转染测定和蛋白印迹分析来验证构建体。可以使用快速测定方法分离和筛选具有最高生产力的稳定细胞系。使用本领域技术人员已知的任何数量的重组、合成和/或纯化方法,可以从生物来源,即B细胞,衍生本发明的核酸组合物,如RNA、cDNA、基因组DNA或其任意组合。“核酸”或“重组核酸”意思是核酸,例如DNA或RNA分子,其不直接与5'和3'侧翼序列相邻,而当存在于其来源的生物体的天然存在的基因组中时通常是于5'和3'侧翼序列直接相邻。因此,该术语描述,例如,并入载体(如质粒或病毒载体)中的核酸;并入异源细胞基因组(或同源细胞的基因组中,但位于与它天然存在的位置不同的位置)中的核酸;及作为分离的分子存在的核酸,例如,通过PCR扩增或限制性酶消化产生的DNA片段,或通过体外转录产生的RNA分子。该术语还描述了形成编码其他例如在融合蛋白生产中可使用的多肽序列的杂合基因一部分的重组核酸。RNA或DNA的扩增方法是本领域公知的,并且基于本文中呈现的教导和指导,根据本发明可以使用,而不需要大量实验。已知的DNA或RNA扩增方法包括但不限于,聚合酶链式反应(PCR)和相关扩增方法(参见,例如,Mullis等的美国专利第4,683,195号、第4,683,202号、第4,800,159号、第4,965,188号;Tabor等的第4,795,699号和第4,921,794号;Innis等的第5,142,033号;Wilson等的第5,122,464号;Innis等的第5,091,310号;Gyllensten等的第5,066,584号;Gelfand等的第4,889,818号;Silver等的第4,994,370号;Biswas等的第4,766,067号;Ringold等的第4,656,134号,以及使用靶序列的反义RNA作为用于双链DNA合成的模板的RNA介导的扩增(Malek等的美国专利第5,130,238号,具有商品名NASBA),将这些参考文献的全部内容通过引用引入本文中(参见,例如,Ausubel,同上;或Sambrook,同上)。例如,聚合酶链式反应(PCR)技术可以用于从基因组DNA或cDNA文库直接扩增本发明的多核苷酸序列和相关基因。PCR和其他体外扩增方法还可以用于,例如,克隆编码待表达蛋白的核酸序列、制备用作检测样品中所需mRNA存在的探针的核酸、用于核酸测序或用于其他目的。通过体外扩增方法足以指导本领域技术人员的技术的实例可见于Berger,同上,Sambrook,同上和Ausubel,同上,以及Mullis等,U.S.Pat.No.4,683,202(1987);和Innisetal.,PCRProtocolsAGuidetoMethodsandApplications(PCR实验方案,方法和应用指导)编辑,AcademicPressInc.,SanDiego,Calif.(1990)中找到。可购得的用于基因组PCR扩增的试剂盒是本领域已知的。参见,例如,Advantage-GCGenomicPCRKit(Clontech)。此外,例如,T4基因32蛋白(BoehringerMannheim)可以用于提高长PCR产物的产量。在一些实施方案中,将严格条件下与本发明的多核苷酸选择性杂交的寡核苷酸探针用于鉴定cDNA(或基因组)DNA文库中的所需序列。“寡核苷酸”(或同义地“寡”)指的是可以化学合成的单链多脱氧核苷酸或两条互补的多脱氧核苷酸链。这种合成寡核苷酸可以含有或不含有5′磷酸。除非在激酶存在下向ATP中添加磷酸,否则那些不含有5′磷酸的合成寡核苷酸不会与另一个寡核苷酸连接。合成寡核苷酸会连接没有被去磷酸化的片段。为了实现基于聚合酶的扩增反应(如PCR),需提及“由至少第一同源序列即简并N,N,G/T序列和第二同源序列串联组成的32倍简并寡核苷酸”。如本文中所用的,“同源的”是指进行基于聚合酶的扩增反应的寡核苷酸和亲本多核苷酸之间的同源性。RNA的分离,以及cDNA和基因组文库的构建,是本领域普通技术人员公知的。(参见,例如,Sambrooketal.,MolecularCloning:ALaboratoryManual(分子克隆:实验室手册),2ndEdition(第2版),ColdSpringHarborPress,ColdSpringHarbor,N.Y.(1989)和Ausubeletal.,eds.CurrentProtocolsinMolecularBiology(通用分子生物学实验方案)(1987-1993))。“严格的杂交条件”意思是仅在序列之间具有至少90%,优选至少95%,更优选至少97%同一性时,才会发生杂交。参见Sambrooketal.,1989,通过引用将其并入本文。便利的是,可以使用在其上固定了多种物质(例如,抗原等)的固相(如,阵列),以多元测定形式进行本文所述的方法步骤,如扩增、筛选等。在一些实施方案中,矩阵是蛋白生物芯片。使用蛋白生物芯片,可以筛选上百乃至上千抗原。如本文中所用的“阵列”、“微阵列”或“生物芯片”指的是通常具有吸附剂连接的平面的固体基质。常常,生物芯片的表面包含多个可编址的位置,其中每个位置具有与其结合的吸附剂。可以使生物芯片适应于结合探针界面,并且因此,起探针的作用。“蛋白生物芯片”指的是适用于捕获多肽的生物芯片。本领域中描述了许多蛋白生物芯片。例如,产生多肽阵列的方法描述于DeWildtetal.,2000,Nat.Biotechnol.18:989-994;Luekingetal.,1999,Anal.Biochem.270:103-111;Ge,2000,NucleicAcidsRes.28,e3,1-VII;MacBeathandSchreiber,2000,Science289:1760-1763;WO01/40803和WO99/51773Al。矩阵的使用允许通过机器人和/或以高通量方式进行多个步骤,如筛选。例如,使用可购得的机器人器械,例如,来自GeneticMicroSystems或BioRobotics,对用于矩阵的多肽进行高速点样。阵列基质可以是例如硝基纤维素、塑料、玻璃,例如,表面修饰的玻璃。阵列还可以包括多孔阵列,例如,丙烯酰胺、琼脂糖或另一种聚合物。在生物芯片上捕获时,可以通过各种检测方法来检测分析物,所述检测方法选自例如气相离子光谱法、光学方法、电化学方法、原子力显微镜和射频法。特别感兴趣的是质谱的使用,并且特别是SELDI。光学方法,包括,例如,荧光、发光、化学发光、吸光值、反射率、透射率、双折射或折射率的检测(例如,表面等离子共振、椭圆光度法、共振镜方法、光栅耦合器波导方法或干涉测量法)。光学方法包括显微镜(共焦和非共焦)、成像方法和非成像方法。各种形式的免疫测定(例如,ELISA)是用于检测固相上捕获的分析物的普遍方法。电化学方法包括伏安法和安培法。射频法包括多极共振光谱法。在本发明的一些实施方案中,例如,用于制备单克隆抗体的天然多样性方法,可以使用已经确定用单细胞工作的技术。一种技术结合特定的可以用于FACS中的附件,以将单个细胞偏转到分开的容器中。这样的附件是可购得的,并且是本领域公知的。这样的附件可用于将单个细胞分配至例如标准96孔微量滴定培养板的选定区隔中。或者,可以将有限稀释的细胞沉积至微量滴定板中,以确保单个细胞沉积。利用PCR对单个B细胞进行第二种技术,以扩增VH和VL片段。在天然多样性方法中,使用单细胞PCR,以在单个细胞中保持VL和VH的天然配对。通过单链可变区(VL)和重链可变区(VH)内的互补性决定区(CDR)来确定抗体的特异性。用于进行单细胞PCR的方法是本领域公知的(例如,Larrick,J.W.etal.,Bio/Technology7:934(1989))。例如,可以用固定溶液或含有如甲醛、戊二醛等化学物质的溶液将来自B细胞文库的产抗体B细胞固定。然后用包含例如去污剂的渗透溶液渗透细胞。固定和渗透处理应当提供足够的多孔性,使酶、核苷酸和其他试剂可以进入细胞,而没有过度破坏细胞区隔或其中的核酸。酶和核苷酸的添加然后进入细胞,以将细胞VH和VL逆转录成相应的cDNA序列。可以在单个步骤中或任选与PCR程序一起进行逆转录,使用逆转录酶、足量的四种dNTP和结合mRNA的引物,给逆转录酶提供3’羟基来启动聚合。可以使用与mRNA互补的任何引物,但优选使用与VH和VL分子的3’-末端互补的引物,以助于可变区mRNA的选择。各种研究已经表明,可以制备简并寡核苷酸来用作用于VH和Vκ或Vλ的5’-端引物。制备寻靶分子(targetingmolecule)的组合文库方法依赖于这样的引物。此外,各种实验已经证明,PCR可以从单个细胞扩增目标基因片段,如VH和VL。由于甚至能用单个细胞工作,这种PCR方法可以产生抗体,甚至在目标B细胞以低频率产生的情况中。在高度多样性实施方案中,在FACS分选后,将B细胞文库的细胞合并,并且对整个细胞集合进行RT-PCR。通过制备和表征抗体的公知程序(参见,例如,Antibodies:ALaboratoryManual(抗体:实验室手册),1988;按引用将其并入本文中),容易地完成用于克隆抗体目的的mRNA的产生。例如,通过本领域标准且常规的合适方法从B-细胞文库中提取总RNA。然后通过合适的方法,例如,使用随机六聚物寡核苷酸或V基因或V-基因家族特异性引物,从RNA合成cDNA。再者,如上所述,这些是本领域技术人员已知的方法。可以将源自B-细胞文库的核酸分子文库,例如,源自这样的B-淋巴细胞的RNA或cDNA分子文库,克隆至表达载体中,以形成表达文库。在一些实施方案中,只扩增源自B细胞文库的VH结构域,以产生VH结构域的文库。使用本文中所述的方法,将来自另一个来源的VL文库与VH文库组合使用,以产生抗体。可以通过本领域技术人员已知的任一种方式将VH和VL文库结合在一起,来构建抗体片段的文库。例如,可以在不同的载体中产生每个文库,并且载体在体外或在体内重组。或者,可以将文库按序克隆至相同载体中,或通过PCR装配在一起,然后克隆。PCR装配也可以用于将VH和VLDNA与编码弹性肽间隔物的DNA连接在一起,以形成如本文中别处所述的单链Fv(scFv)文库。再另一种技术中,“细胞内PCR装配”用于通过PCR在淋巴细胞内结合VH和VL,然后克隆所连接基因的库。B-细胞文库遗传材料的克隆和表达如在此所用的“抗体表达文库”或“表达文库”可以指核酸或蛋白水平的分子的集合(即,两个或多个分子)。因此,该术语可以指编码多个抗体分子的表达载体的集合(即,在核酸水平)或可以指在合适的表达系统中表达后的抗体分子的集合(即,在蛋白水平)。或者,表达载体/表达文库可以包含可以表达它们的合适宿主细胞中。在本发明的表达文库中编码或表达的抗体分子可以是任何合适形式的,例如,可以是完整的抗体分子或可以是抗体片段,例如,单链抗体(例如,scFv抗体)、Fv抗体、Fab抗体、Fab’2片段、双抗等。术语“编码(encoding)”和“编码(codingfor)”特定酶与“编码(encoding)/编码(codingfor)特定酶的核酸序列”或“特定酶的DNA编码序列”或“编码(encoding)/编码(codingfor)特定酶的核苷酸序列”相同--以及其他同义术语--指的是当置于合适的调控序列的控制下时,转录并翻译成酶的DNA序列。“启动子序列”是在细胞内能够结合RNA聚合酶并启动下游(3'方向)编码序列转录的DNA调控区。启动子是DNA序列的一部分。该序列区在其3'端具有起始密码子。启动子序列的确包含最少数量的碱基,和对于在高于背景的可检测水平下启动转录的必要元件。然而,在RNA聚合酶结合该序列并在起始密码子处(含启动子的3'端)开始转录后,转录沿3'方向向下游进行。在启动子内将发现转录起始位点(通过核酸酶S1的图谱来方便地确定)以及负责RNA聚合酶结合的蛋白结合结构域(共有序列)。本发明的抗体表达文库可以鉴定、产生、选择或获得的抗体分子形成本发明的再一个方面。再者,这些抗体分子可以是蛋白或编码抗体分子的核酸,该核酸随后并入至合适的表达载体中和/或包含在合适的宿主细胞内。然后将cDNA集合进行第一轮PCR反应(primaryPCRreaction),使用与抗体基因重链的IgG恒定区杂交的寡核苷酸和与抗体基因可变重链区的5’端杂交的寡核苷酸。还设定了PCR反应,用于扩增κ和λ类可变轻链(VL)集合。可以基于已知的和公众可获得的免疫球蛋白基因序列数据库信息来设计这样的寡核苷酸。即,经逆转录,可以使用免疫球蛋白基因特异性的引物,并且特别是VH和VL核酸末端区域特异性的引物,通过PCR来扩增所得到的cDNA序列。可以从使用V基因家族特异性引物或V基因特异性引物通过PCR扩增产生的VH和VL序列的文库方便地获得VH和VL序列(Nicholls等,J.Immunol.Meth.,1993,165:81;W093/12227),或基于可用的序列信息,根据标准的本领域已知方法来设计。(VH和VL序列可以连接,通常使用插入间隔物序列(例如,编码框内弹性肽间隔物)来连接,形成编码单链抗体的盒。)可以将V区序列方便地克隆为用于表达免疫球蛋白的细胞的cDNA或PCR产物。在本文中所述的方法中,并且特别是在所述的特定步骤后(例如,在单细胞PCR后;在哺乳动物或其他细胞表面展示后,在FACS筛选后等),任选将VH和VL测序。出于其他原因,使用测序来证实多样性的水平在可接受的水平。测序可以包括高通量筛选、深度测序(其中从多个单独样品中测序相同的基因,以鉴定序列中的差异),或两者的组合。在希望保持天然VH和VL组合的一些实施方案中,除了cDNA引物以外,使用用于VH区基因5’端的一个引物或用于VL基因5’端的另一个引物,将cDNA进行PCR扩增,并在相同的反应中连接。这些引物还含有额外序列的互补尾,使得VH和VL基因自我装配。在PCR扩增和连接后,获得混合产物的机会,换句话说,获得混合可变区的机会,是最小的,因为扩增和连接反应是在每个细胞内进行的。通过利用填充剂(bulkyagent)(如,地高辛标记的核苷酸)来进一步减低混合的风险,以进一步确保V区cDNA对没有离开细胞区隔,并且混合仍然保留在用于PCR扩增和连接的细胞内。通过互补末端序列的杂交来连接所扩增的序列。连接后,从细胞收集序列,用于本文中所述的更多方法步骤中。例如,如果需要,可以使用末端引物将收集的DNA进行PCR扩增,并且克隆至载体中,所述载体可以是质粒、噬菌体、粘粒、噬菌粒、病毒载体或其组合,如下文中将详述的。可以将常规限制酶位点并入杂交的序列中,以促进克隆。这些载体还可以作为连接的可变区的文库,供以后使用。在希望提供另外的VH和VL组合的一些实施方案中,选择表达系统来促进这。例如,噬菌体表达系统允许重链和轻链序列随机重组。其他合适的表达系统是本领域技术人员已知的。应当注意到,在VH和VL序列源自非人的情况中,在一些实施方案中,优选将这些序列与完全人的Fc嵌合。如本文中所用的“嵌合的”指的是免疫球蛋白,其中重链和轻链可变区不是人来源的,并且其中重链和轻链的恒定区是人来源的。通过扩增可变结构域并克隆至人Fc中来实现这。人Fc可以是载体的一部分,或在分开的分子中,也可以使用Fc文库。在优选的实施方案中,嵌合分子在哺乳动物细胞(如,CHO细胞)中生长,用FACS筛选两次,以从细胞群中富集表达目标抗体的细胞。将嵌合抗体进行表征,在功能性表征后进行测序,或直接功能性表征或动力学。以下将详细描述生长、筛选和表征。重要的是注意到以上所述的PCR反应是针对克隆IgG形式的抗体所述的。这些是优选的,因为它们通常与更成熟的免疫应答相关,并且通常呈现出比IgM高的亲和性,由此使得它们对于特定的治疗和诊断应用更理想。然而,显然,如果需要或合适,可以设计允许克隆一种或多种其他形式的免疫球蛋白分子(例如,IgM、IgA、IgE和IgD)的寡核苷酸。应当注意到,在本发明的方法和表达文库中,一旦已经鉴定出可以分离出产抗体细胞群的合适宿主,并且已经在合适的时间分离出合适的所述细胞群,并任选富集,如上所述,不需要立即产生抗体表达文库,只要细胞中所含的遗传材料可以保持完整,由此可以在晚些时候制备文库即可。因此,例如,可以通过合适的方法,例如,通过冷冻,将细胞、细胞裂解物或核酸,如,源自其的RNA或DNA,进行保存,直至晚些时候,以及晚期时候需要产生表达文库时。一旦已经产生表达载体的文库,然后在合适的表达系统中表达所编码的抗体分子,并且使用本领域公知和证明的合适技术进行筛选。因此,以上限定的本发明的方法可以包括在合适的表达系统中表达表达载体文库和为具有所需特性的抗体筛选所表达的文库的更多步骤,如以下将更详细解释的。如本文中所示,通过公开内容的方法制备的包含编码抗体序列的核酸的核酸分子可以包括,但不限于,单独编码抗体片段的氨基酸序列的那些,整个抗体或其一部分的编码序列,抗体、片段或部分的编码序列,以及其他序列,如至少一个信号前导或融合肽的编码序列,具有或不具有上述的其他编码序列,如至少一个内含子,与其他的非编码序列一起,非编码序列包括但不限于非编码5’和3’序列,如在转录、mRNA加工(包括剪接和多腺苷酸化信号(例如--核糖体结合和mRNA的稳定性))中起作用的转录的、非翻译的序列;编码其他氨基酸的其他编码序列,如提供其他功能性的那些。因此,编码抗体的序列可以与标记物序列融合,如编码有助于包含抗体片段或部分的融合抗体的纯化的肽的序列。然后任选将PCR产物进行第二轮PCR反应(secondaryPCRreaction),使用与抗体可变结构域V-重链、V-轻链κ和V-轻链λ的5’和3’端杂交的新寡核苷酸组(按照需要,根据与新寡苷酸组一起使用的第一轮PCR反应是否是设计用来扩增重链或轻链抗体基因的一部分)。这些寡核苷酸有利地包括限定的限制酶组(即,限制酶位点)特异性的DNA序列,用于随后的克隆。必须选择选定的限制酶,使得可以在人抗体V-基因片段内切割。可以基于已知的和公众可获得的免疫球蛋白基因序列以及限制酶数据库信息来设计这样的寡核苷酸。然而,待包括的优选限制酶位点是NcoI、HindIII、MluI和NotI。这样的第二轮PCR反应的产物是各种V-重链、V-轻链κ和V-轻链λ抗体片段/结构域的库。因此,当目标表达文库形式是scFv或Fv形式(其中只存在抗体的VH和VL结构域)时,通常进行这种第二轮PCR反应。本领域技术人员应当认识到重链或轻链Fv或Fab片段,或单链抗体,也可以与这个系统一起使用。可以将重链或轻链诱变,接着将互补链加入溶液中。然后使两条链结合,并且形成功能性抗体片段。随机非特异性轻链或重链序列的添加使得可以产生组合系统,来产生不同成员的文库。包含从本文限定的免疫激发宿主的B淋巴细胞衍生的抗体基因的可变重链区,或其片段,和/或可变轻链区,或其片段的克隆片段库的文库形成本发明的再一个方面。任选将这些包含克隆的可变区的文库插入表达载体中,以形成表达文库。或者,如果需要,可以设定第一轮和第二轮PCR反应,使得保留分离的B细胞中所含的各种重链和/或轻链抗体链的恒定区的全部或部分。当表达文库形式是Fab形式时,这是理想的,在Fab形式中,重链成分包含VH和CH结构域,而轻链成分包含VL和CL结构域。再次,这样包含重链和/或轻链抗体链的恒定区的全部或部分的克隆片段的文库形成本发明的再一个方面。这些核酸可以方便地包含除了本发明多核苷酸以外的序列。例如,可以将包含一个或多个核酸酶限制位点的多克隆位点插入核酸中,以帮助多核苷酸的分离。此外,可以将可翻译序列插入,以帮助本发明的翻译的多核苷酸的分离。例如,六-组氨酸标记物序列提供了纯化本发明蛋白的方便方式。本发明的核酸--排除编码序列--任选是用于本发明多核苷酸的克隆和/或表达的载体、适配子或连接体。可以将其他序列添加至这些克隆和/或表达序列上,以优化它们在克隆和/或表达中的作用、帮助多核苷酸的分离或提高多核苷酸至细胞中的引入。克隆载体、表达载体、适配子和连接体的使用是本领域公知的。(参见,例如,Ausubel,上文;或Sambrook,上文)。核酸筛选和分离方法可以基于本发明的多核苷酸的序列,如本文中公开的那些,使用探针来筛选cDNA或基因组文库。探针可以用于与基因组DNA或cDNA序列杂交,以在相同或不同生物体中分离同源基因。本领域技术人员应当认识到,在该测定中可以使用各种程度的杂交严格性;并且杂交或洗涤介质可以是严格的。因为用于杂交的条件变得更严格,用于发生双链体形成的探针和目标之间必须存在更高的互补程度。可以通过温度、离子强度、pH和存在部分变性溶剂(如,甲酰胺)中的一种或多种来控制严格程度。例如,通过例如操纵0%至50%范围内的甲酰胺浓度来改变反应物溶液的极性,从而方便地改变杂交严格性。可检测结合需要的互补程度(序列同一性)将根据杂交介质和/或洗涤介质的严格性而改变。互补程度最佳地为100%,或70-100%,或其中任意范围或数值。然而,应当理解到,通过降低杂交和/或洗涤介质的严格性,可以抵偿探针和引物中的次要序列变化。用于构建核酸的合成方法还可以通过已知方法的直接化学合成来制备本发明的分离核酸(参见,例如,Ausubel等,上文)。化学合成通常产生单链寡核苷酸,可以通过与互补序列杂交,或使用单链作为模板用DNA聚合酶聚合,将其转变成双链DNA。本领域技术人员应当认识到尽管DNA的化学合成限于约100个或更多个碱基的序列,但通过较短序列的连接可以获得较长序列。本发明还提供了在选择性杂交条件下与本文公开的多核苷酸杂交的分离核酸。因此,该实施方案的多核苷酸可以用于分离、检测和/或定量包含这类多核苷酸的核酸。例如,本发明的多核苷酸可以用于鉴定、分离或扩增保藏文库中的部分或全长克隆。在一些实施方案中,多核苷酸是分离的基因组或cDNA序列,或与来自核酸文库的cDNA互补。在一些实施方案中,“核酸文库”由基于载体的一个或多个核酸分子的集合组成。在其他实施方案中,“核酸文库”由非基于载体的核酸分子的集合组成。在再另一个实施方案中,“核酸文库”由部分基于载体和部分非基于载体的核酸分子的组合集合组成。优选,根据单独的核酸分子种类,包含分子集合的文库是可搜索的且可分离的。优选,cDNA文库包含至少80%全长序列,优选至少85%或90%全长序列,并且更优选至少95%全长序列。可以将cDNA文库标准化来提高稀有序列的表现。对于相对于互补序列,序列同一性降低的序列,通常但不是排他地使用低或中等严格杂交条件。对于同一性更高的序列,任选使用中等和高严格条件。低严格条件使得具有约70%序列同一性的序列可以选择性杂交,并且可以用于鉴定直系同源(orthologous)或旁系同源(paralogous)序列。本发明还涉及包括本发明的分离核酸分子的载体、用重组载体进行基因改造的宿主细胞和通过重组技术生产至少一种抗体,如本领域公知的。参见,例如,Sambrook等,上文;Ausubel等,上文,通过引用将每一篇都全部引入本文。在制备表达文库时,可以将产自单细胞或细胞集合的PCR产物克隆至质粒中,用于体外转录/翻译,或在一些实施方案中,将合适的控制元件包括在PCR产物内,用于直接的体外转录/翻译。基因的体外转录/翻译使用无细胞提取物来提供所需的酶、核糖体和蛋白因子。通过从所需DNA模板合成mRNA来指导蛋白合成。DNA模板必须含有对于所用系统合适的控制元件,包括核糖体结合位点和启动子序列。本领域技术人员应当清楚地认识到用于每个系统的合适所需元件。多核苷酸可以任选连接于含有用于在宿主中繁殖的可选择标记物的载体。通常,在沉淀物中,如磷酸钙沉淀物,或在与带电脂质的复合物中,引入质粒载体。如果载体是病毒,可以使用合适的包装细胞系将其进行体外包装,然后转导至宿主细胞中。DNA插入片段应当可操作地连接于合适的启动子。表达构建体还应含有用于转录启动、终止的位点,并且在转录的区域内,含有用于翻译的核糖体结合位点。构建体表达的成熟转录本的编码部分将优选在待翻译mRNA的开始处包括翻译起始密码子和合适地置于待翻译mRNA末端处的终止密码子(例如,UAA,UGA或UAG),对于哺乳动物或真核细胞表达,优选UAA和UAG。本文中所用的术语“构建体”描述可任选化学键合一个或多个其他分子部分(如,载体,或载体部分)的分子,如多核苷酸(例如,植酸酶多核苷酸)。在特异性的--但绝非限制的--方面中,通过适用于宿主细胞转化的DNA表达构建体来举例说明核苷酸构建体。表达载体将优选但任选包括至少一个可选择标记物。这样的标记物包括,例如,但不限于,用于真核细胞培养的氨甲蝶呤(MTX)、二氢叶酸还原酶(DHFR,美国专利第4,399,216号;第4,634,665号;第4,656,134号;第4,956,288号;第5,149,636;第5,179,017号)、氨苄青霉素、新霉素(G418)、霉酚酸或谷氨酰胺合成酶(GS,美国专利第5,122,464号;第5,770,359号;第5,827,739号)抗性,以及用于在大肠杆菌和其他细菌或原核生物中培养的四环素或氨苄青霉素抗性基因(据此通过引用,将上述专利完全并入)。以下描述的适用于表面展示和全长抗体展示的表达载体,是特别优选的。用于以上所述的宿主细胞的合适培养基和条件是本领域已知的。合适的载体对本领域技术人员而言是显而易见的。可以通过磷酸钙转染、DEAE-葡聚糖介导的转染、阳离子脂质介导的转染、电穿孔、转导、感染或其他已知方法来实现将载体构建体引入宿主细胞中。现有技术中描述了这样的方法,如,Sambrook,上文,第1-4和16-18章;Ausubel,上文,第1、9、13、15、16章。再次指出,在天然多样性方法中,核酸分子对应于体内发现的序列,并且很可能在抗原结合中是功能性的,这是由于通过宿主中的B淋巴细胞应答特定的免疫激发表达了它们的事实。在高度多样性的方法中,核酸分子产自B细胞文库集合,并且因此可以形成体内不存在的其他轻链/重链组合。扩增的序列可以通过DNA测序来表征、作为单独序列直接克隆至表达系统中,或可操作地连接,使得重链和轻链核酸作为一个连续的、框内蛋白来表达所。合适的可变基因片段可以克隆至表达载体中,使得产生表达文库。如本文中所用的,术语“可操作地连接”指的是多核苷酸元件按功能关系进行连接。当将核酸置于与另一条核酸序列的功能关系中时,所述核酸是“可操作地连接的”例如,如果启动子或增强子影响到编码序列的转录,则它被可操作地连接编码序列。可操作地连接意思是,将连接的DNA序列通常是连续的,且如果有必要连接两个蛋白编码区,则其是连续的且位于阅读框内。当RNA聚合酶将两条编码序列转录为一条mRNA,然后其被翻译成含有源自两条编码序列的氨基酸的单个多肽时,编码序列与另一条编码序列“可操作地连接”。该编码序列不必彼此连续,只要所表达的序列经加工最终产生所需的蛋白即可。在利用单细胞PCR的实施方案中,将所扩增的序列作为单独序列直接克隆至表达系统中,或可操作地连接,使得重链和轻链核酸序列作为一个连续、框内蛋白来表达。另外,可以通过DNA测序,包括高通量测序方法,来表征。然而,从以上的讨论应当得知,本发明的方法和表达文库不限于任何特定形式的抗体以及根据本领域公知的方法相等地产生这些形式,例如Fab片段、Fab’2片段、Fv片段、抗体等。此外,可以使用其他类型的表达载体。特别是,可以使用其他形式的原核表达载体,以及不同类型的展示载体,如噬菌体、共价或核糖体展示载体。表达载体的主要要求在于,其含有在选择的特定表达系统获得编码目标多肽的合适核酸分子的表达所需的所有必需成分。因此,表达载体,以及编码抗体分子的核酸片段,可以任选另外含有其他合适成分,例如,复制起点、用于启动转录和蛋白表达的诱导型启动子、抗生素抗性基因和标记物、通用标签、检测标签(如,myc标签)或报告分子、使得能够通过例如PCR扩增的引物结合位点或任何其他所需的序列元件。这些其他成分的合适来源,以及这些其他成分在文库构建体内的定位,从而使得它们能够执行所需功能,完全在本领域技术人员常规实践知识内。克隆至合适表达载体中后,可以将抗体表达文库转化至大肠杆菌细胞或其他合适宿主细胞中,这取决于所用的载体系统。可用于生产抗体分子的表达系统的类型包括细菌、酵母、昆虫和哺乳动物表达系统,用于其的方法是本领域公知的。用于生产单链抗体的技术也适用于生产目标抗原的单链抗体。首先使用的是用于蛋白生产的原核体外技术(Zubayetal.,1970)。随后使用麦芽(Roberts,1973)和兔子网状细胞(Pelham,1976)研发了真核系统。几种新的研发已经提高了这些技术的效率。实例包括,研发大肠杆菌核酸酶缺陷菌株的,来提高使用直链DNA模板的结果(Yang,1980),以及用微球菌核酸酶处理网状细胞裂解物,来降低来自系统的任何背景表达。为体外转录/翻译研发的更近的系统是基于通过噬菌体RNA聚合酶的转录,包括SP6和SP7(Krieg,1987,Studier,1990)。置于T7启动子元件控制下的DNA,可以用作用于通过T7RNA聚合酶的体外转录的模板,或用于使用添加于原核或真核蛋白合成系统中的聚合酶进行完整体外转录/翻译的模板。尽管本发明的方法可以与任何体外转录/翻译系统一起使用,但优选将T7系统用于转录,并且优选使用原核翻译系统,因为不需要RNA的加帽。DNA表达构建体通常将包括可操作连接于编码序列的表达控制DNA序列,包括天然相关的或异源启动子区。优选,表达控制序列将是在载体中能够转化或转染真核宿主细胞的真核启动子系统。一旦载体已经并入至合适的宿主中,将宿主保持在适于核苷酸序列高水平表达的条件下,并且收集和纯化抗体。如本文中所用的,术语“生理条件”指的是与活的生物体相适的和/或通常存在于活的培养酵母细胞或哺乳动物细胞内的温度、pH值、离子强度、粘度等生化参数。例如,在常规实验室培养条件下生长的酵母细胞中的胞内条件为生理条件。体外转录混合物的合适体外反应条件通常为生理条件。一般而言,体外生理条件包括50-200mMNaCl或KCl,pH6.5-8.5,20-45℃和0.001-10mM二价阳离子(例如,Mg++,Ca++);优选约150mMNaCl或KCl,pH7.2-7.6,5mM二价阳离子,且通常包括0.01-1.0%非特异性蛋白(例如,BSA)。常常存在非离子型去污剂(吐温,NP-40,TritonX-100),通常约0.001-2%,通常0.05-0.2%(v/v)。特定的含水条件可以由操作者按照常规方法加以选择。对于一般性的指导,可以使用以下缓冲含水条件:10-250mMNaCl,5-50mMTrisHCl,pH5-8,任选添加二价阳离子和/或金属螯合剂和/或非离子去污剂和/或膜组分和/或消泡剂和/或闪烁剂(scintillants)。如之前所述的,将在序列已经可操作地连接于表达控制序列(即,已经放置来确保结构基因的转录和翻译)后,在宿主中表达DNA序列。这些表达载体通常可在宿主生物体中作为游离基因或作为宿主染色体DNA的完整部分复制。通常,表达载体将含有选择标记物,例如,四环素或新霉素,以允许检测用所需DNA序列转化的那些细胞(参见,例如,美国专利第4,704,362号,通过引用将其并入本文)。除了真核微生物,如酵母,哺乳动物组织细胞培养物也可以用于产生本发明的抗体(参见,Winnacker,“FromGenestoClones”,VCHPublishers,N.Y.,N.Y.(1987),通过引用将其并入本文)。优选原核细胞,因为本领域中已经研发了许多能够分泌完整免疫球蛋白的合适宿主细胞,并且包括CHO细胞系、各种COS细胞系、HeLa细胞、骨髓瘤细胞系、转化的B-细胞。用于这些细胞的表达载体可以包括表达控制序列,如复制起点、启动子、增强子(Queenetal.,Immunol.Rev.1986,89:49),和必需的加工信息位点,如核糖体结合位点、RNA剪接位点、聚腺苷酸化位点和转录终止子序列。优选的表达控制序列是源自免疫球蛋白基因、细胞巨化病毒、SV40、腺病毒、牛乳头状瘤病毒等的启动子。可以通过将增强子序列插入载体中来提高真核DNA转录。增强子是增强通过启动子的转录的10至30obp的顺式作用序列。当5’或3’至转录单元时,增强子可以有效提高转录。如果位于内含子内或编码序列自身内,它们也是有效的。通常,使用病毒增强子,包括SV40增强子、细胞巨化病毒增强子、多瘤病毒增强子和腺病毒增强子。还常常使用来自哺乳动物系统的增强子序列,如小鼠免疫球蛋白重链增强子。哺乳动物表达载体系统通常还会包括可选择标记物基因。合适的标记物实例包括,二氢叶酸还原酶基因(DHFR)、胸苷激酶基因(TK)或赋予药物抗性的原核基因。头两种标记物基因更喜欢使用在生长培养基中没有添加胸苷时缺乏生长能力的突变细胞系。然后可以通过在未补充的培养基上生长的能力来鉴定转化的细胞。可以用作标记物的原核药物抗性基因的实例包括赋予G418、霉酚酸和潮霉素抗性的基因。可以根据细胞宿主的类型,通过公知方法将含有目标DNA片段的载体转染至宿主细胞中。例如,氯化钙转染通常用于原核细胞,而磷酸钙处理、脂质体转染或电穿孔可以用于其他细胞宿主。用于转染哺乳动物细胞的其他方法包括使用聚凝胺(Polybrene)、原生质体融合、脂质体、电穿孔和微注射(通常,参见,Sambrook等,上文)。一旦已经被克隆,可以使用标准或新技术,例如,通过以受控(例如,如本文中所述的定点诱变、全面位置演化(CPE)和/或全面蛋白合成(CPS))或随机方式的涉及一个或多个核苷酸添加、删除和/或取代的突变,或通过结构域交换、盒诱变、链改组等,可以将编码抗体分子各个部分(例如,抗体的重链或轻链或其部分,例如,VH和/或VL链)的核酸分子进一步多样化。合成的核苷酸可以用于多样化核酸序列的产生中。因此,可以化学合成编码抗体结构域的全部或部分核酸。然而,在这个阶段优选使用于构成表达文库的编码各种抗体结构域的分离核酸分子不接受进一步的多样化。选定的重组抗体的生物展示一些优选的实施方案利用生物展示系统或哺乳动物细胞表面展示系统。术语“生物展示”指的是处于筛选目的使蛋白或抗体或抗体一部分在哺乳动物、细菌或酵母宿主细胞表面上表达和展示的技术;例如,通过磁珠和荧光激活细胞分选术的组合,通过筛选特异性抗原结合。在一个方面中,哺乳动物表达载体用于免疫球蛋白同时以如DuBridge等的US2009/0136950中的分泌形式和细胞表面结合形式表达,,通过引用将US2009/0136950并入本文。在另一个方面中,在细胞中表达时,使用Gao等的技术,用于编码抗体文库的病毒载体,或当在如Gao等的US2007/0111260中的细胞内表达时,将抗体片段展示展示于细胞膜上,Gao等的US2007/0111260通过引用并入本文。个IgG于哺乳动物上的表面展示是已知的。例如,Akamatsuu等基于它们的抗原结合亲和性和生物活性研发了适于直接分离IgG分子哺乳动物细胞表面展示载体其适用,。使用EB病毒衍生的游离基因载体,在细胞表面上展示作为整个IgG分子的抗体文库,并且通过磁珠和荧光激活细胞分选术的组合来筛选特异性抗原结合。从分选的细胞回收编码具有所需结合特征的抗体的质粒,并且将其转化为用于产生可溶性IgG的形式。Akamatsuuetal.,J.Immunol.Methods2007327(1-2):40-52;将其通过引用并入本文中。对于用于亲和性成熟的单链Fv抗体的细胞表面展示,Ho等使用了广泛用于瞬时蛋白表达的人胚肾293T细胞,,。通过从大量表达具有略低亲和性的WT抗体的细胞中进行单通细胞分选,将表达具有较高亲和性的稀有突变抗体的细胞富集了240倍。此外,在对使内在抗体热点随机化的组合文库进行单次选择后,获得了CD22结合亲和性增强的高度富集的突变体。Hoetal.,Isolationofanti-CD22FvwithhighaffinitybyFvdisplayonhumancells(通过人细胞上的Fv展示分离具有高亲和性的抗-CD22Fv),ProcNatlAcadSciUSA2006年6月20日;103(25):9637-9642;通过引用将其并入本文。Beerli等使用了从人供体的外周血单核细胞(PBMC)中直接分离出来靶抗原特异性的B细胞。从该B细胞集合产生了重组的抗原特异性单链Fv(scFv)文库,并并使用辛德毕斯病毒表达系统通过哺乳动物细胞表面展示技术进行了筛选。该方法使得可以通过单轮FACS来分离抗原特异性抗体。从阳性克隆中分离出重链(HC)和轻链(LC)的可变区(VR),并产生作为完整IgG或Fab片段的重组全长人抗体。以这种方式,分离了几个结合Qβ病毒样颗粒(VLP)即模型病毒抗原的超突变高亲和性抗体,以及分离了烟碱特异性抗体。在细胞培养物中,所有抗体显示出高表达水平。在小鼠模型中,临床前证实了人烟碱特异性mAb。Beerlietal.,Isolationofhumanmonoclonalantibodiesbymammaliancelldisplay,ProcNatlAcadSciUSA.2008September23;105(38):14336-14341;通过引用将其并入本文。酵母细胞表面展示也是已知的,例如,参见KondoandUeda2004,KondoandUeda2004,Yeastcell-surfacedisplay-applicationsofmoleculardisplay,Appl.Microbiol.Biotechnol.,64(1):28-40,其描述了,例如,使用酿酒酵母的细胞表面工程化系统。几个用于在酿酒酵母中表达的代表性展示系统描述于Leeetal.,2003,Microbialcell-surfacedisplay,TRENDSinBiotechnol.21(1):45-52。以及Boder和Wittrup1997,Yeastsurfacedisplayforscreeningcombinatorialpolypeptidelibraries,NatureBiotechnol.,15(6):553.PakabuntoK,XuZ,ZhangY,TsurushitaN。在优选的实施方案中,在细胞表面展示系统中展示了全长抗体。已经研发了完整抗体细胞表面展示系统用于一些真核细胞,如酵母(参见,例如,BoderandWittrup,2000,MethodsinEnzymology,328:430-444)。在更优选的实施方案中,在哺乳动物细胞表面展示系统中展示全长抗体。全长抗体哺乳动物细胞表面展示系统是本领域已知的,例如:Akamatsuetal.,WholeIgGsurfacedisplayonmammaliancells:Applicationtoisolationofneutralizingchickenmonoclonalanti-IL-12antibodies,JImmunolMethods.2007年10月31日;327(1-2):40-52.;美国专利第7,790,655号;美国专利第7,732,195号;Zhouetal.,Developmentofanovelmammaliancellsurfaceantibodydisplayplatform,MAbs.2010年9月-10月;2(5):508-18。在本发明的方法中,这样的哺乳动物表达系统,特别是使用分子的细胞表面展示用于筛选和选择的系统,用来鉴定和选择用于制造或演化后制造的候选物。优选,这样的哺乳动物宿主是成纤维细胞(3T3,小鼠;BHK21,叙利亚仓鼠)、上皮细胞(MDCK,狗;Hela,人;PtK1,大鼠,袋鼠)、浆细胞(SP2/0和NS0,小鼠)、肾细胞(293人;COS,猴)、卵巢细胞(CHO,中国仓鼠)、胚细胞(R1和E14.1,小鼠;H1和H9,人;PERC.6,人)。使用细胞表面展示技术在哺乳动物细胞表面上展示蛋白,用于筛选。作为与膜分子的融合体来克隆蛋白,当其表达时,在细胞表面上展示蛋白,例如,用于快速、高通量筛选。这样的融合蛋白是本领域技术人员已知的。例如,WO10/094027,通过引用将其全部并入本文,描述了一种类型的适用于本文所述细菌展示系统的融合蛋白。可以使用基于亲和性的富集测定,为所需的结合活性筛选展示表达的免疫球蛋白的重组宿主细胞。在一些实施方案中,通过包括但不限于荧光激活细胞分选术(FACS)、基于珠子的分选术(如,基于磁珠的分选术(MACS))或其他固相淘选技术的测定,为特异性结合感兴趣的靶抗原的免疫球蛋白筛选展示免疫球蛋白的重组宿主细胞。也可以对免疫球蛋白或细胞膜上展示的免疫球蛋白进行ELISA测定。对于可以用于测定特异性免疫反应性的免疫测定形式和条件的描述,还可以参见,Harlow&Lane,Antibodies,ALaboratoryManual(1988)。任选,可以在FACS筛选步骤前、在FACS筛选步骤后或两种情况下进行测序。选定的重组抗体的表征表达后,将所产生的抗体接受进一步筛选、结合证实、高通量动力学、功能表征和任选测序,以提供具有所需特性的重组单克隆抗体。不仅仅合成,还可以根据各种特性和大范围的功能来表征抗体。特性包括等电点、热稳定性、沉淀速率、刚性/弹性、形状、电荷,在不同pH、溶剂、UV、机械和声波条件下的稳定性、半衰期、糖基化、折叠和/或在不同条件下的其他特性。一种检测折叠的方式是被同源结合伴侣识别的能力。多种不同免疫测定形式可以用于该目的并且是本领域公知的。主要是,当使蛋白接触特定目标或相关配体组时,可以测定亲和性或特异性变化。热稳定性。可以使用本领域已知的多种非限制的生物物理或生物化学技术来分析本发明的组合物的热稳定性。在某些实施方案中,通过分析光谱评价热稳定性。示例性分析光谱方法是差示扫描量热法(DSC)。DSC使用量热计,其对伴随大部分蛋白或蛋白结构域解折叠的热吸收敏感(参见,例如,Sanchez-Ruiz,etal.,Biochemistry,27:1648-52,1988)。为了测定蛋白的热稳定性,将蛋白样品插入量热计中,并且升高温度,直至蛋白解折叠。蛋白解折叠时的温度表示整体的蛋白稳定性。另一种示例性分析型光谱方法是圆二色(CD)光谱。CD光谱测量作为递增温度函数的组合物旋光性。圆二色(CD)光谱测量由于结构不对称引起的左旋偏振光对比右旋偏振光吸收的差异。无序的或解折叠的结构导致CD光谱与有序或折叠结构的光谱差异非常大。CD光谱反映出蛋白对提高温度的变性作用的灵敏度,并且因此表示蛋白的热稳定性(参见vanMierloandSteemsma,J.Biotechnol,79(3):281-98,2000)。用于测量热稳定性的另一种示例性分析型光谱方法是荧光发射光谱(参见,vanMierloandSteemsma,上文)。用于测量热稳定性的再另一种示例性分析型光谱方法是核磁共振(NMR)光谱(参见,例如,vanMierloandSteemsma,上文)。在其他实施方案中,通过生物化学方式测量本发明的组合物的热稳定性。用于测定热稳定性的示例性生物化学方法是热激发测定(thermalchallengeassay)。在“热激发测定”中,将本发明的组合物接受一定范围的升高温度,持续设定的时间段。例如,在一个实施方案中,将测试分子接受一定范围的递增温度,例如,持续1-1.5小时。然后通过相关的生物化学测定检测蛋白的活性。例如,如果蛋白是结合蛋白(例如,本发明的scFv或含scFv多肽),则可以通过功能性或定量ELISA测定结合蛋白的结合活性。在某些实施方案中,使用以上任一种技术(例如,分析型光谱技术),通过测量本发明组合物的熔化温度(Tm)来评价热稳定性。熔化温度是热跃迁曲线中点的温度,其中组合物中的50%的分子处于折叠状态。在其他实施方案中,使用分析型量热技术(例如,DSC),通过测量本发明组合物的比热或热容(Cp)来评价热稳定性。组合物的比热是将1mol水的温度升高1℃需要的能量(例如,以kcal/mol计)。大的Cp是变性或无活性蛋白组合物的特点。在某些实施方案中,通过测定组合物在热跃迁前后的比热来测量组合物的热容变化(ACp)。在其他实施方案中,通过测量或测定热力学稳定性的其他参数,包括解折叠的Gibbs自由能(AG)、解折叠的焓(AH)或解折叠的熵(AS),来评价热稳定性。在其他实施方案中,使用以上的一个或多个生物化学测定(例如,热激发测定)来测定50%组合物保持其活性(例如,结合活性)的温度(即,Tc值)。等电点(PI),有时候也缩写为IEP,是特定分子或表面不携带净电荷的pH。可以根据其等电点(整体电荷),在聚丙烯酰胺凝胶上,使用称为等电聚焦的技术(其使用pH梯度来分离蛋白),来分离抗体。沉降速率是测量分子应答离心中产生的离心力而移动的速率的分析方法。所述沉降速率提供了有关分子质量和分子形状两者的信息。在一些情况中,这种技术还可以测量扩散系数和分子质量。可以直接测定抗体折叠,或相对而言,从其他参数(如溶解性和产量)来推断。例如,产量提高反映出折叠效率提高。抗体活性的中和指的是抗体通过抑制或中和抗原或感染体所具有的任何生物作用来保护细胞免于所述抗原或感染体的能力。中和活性的测定取决于具体抗原,并且合适的测定对本领域技术人员而言应当是显而易见的。拮抗活性的测定指的是抗体结合受体,从而阻断或抑制激动剂介导的应答,但自身没有引起生物应答的能力。拮抗活性的测定取决于具体受体,并且合适的测定对本领域技术人员而言显而易见的。激动活性的测定指的是抗体结合受体、引发生物应答的能力。激动活性的测定取决于特定的受体,并且合适的测定将是本领域技术人员清楚的。可以通过许多方法测定抗体表达水平。在结合目标mRNA的在先逆转录(RT-PCR)的PCR中,当与可检测标记一起使用时,提供了用于利用少至一个细胞测量基因表达的手段。免疫测定通常可以分成两种类型:需要多个分离步骤的异相测定,和直接进行的均相测定。异相免疫测定通常涉及固定在固体基质上的配体或抗体。使含有配体的样品接触固定的抗体,并且从直接或间接连接于固定的复合物的标记,测定基质支持物上形成的复合物的量。如本

技术实现要素:
中所用的,将配体限定为与不同分子相互作用形成紧密结合的稳定复合物的物质。配体优选是靶抗原或其免疫原性部分。对于实践目的,结合亲和性通常高于约106M-1,优选,具有约至少5×107M-1的亲和性,更优选具有1×108M-1至1×109M-1或更高的亲和性,有时候高达1×1010M-1-1015M-1。可以按照夹层测定进行异相免疫测定,其中将目标分子与固定的抗体反应,所述抗体以高亲和性特异性结合该分子。在第二个步骤中,将由抗原的相同或不同抗体与标记物分子形成的缀合物与抗原-抗体复合物在固定基质上反应。除去过量游离标记物缀合物后,测量结合的标记物缀合物,其与样品中配体的含量成比例。免疫复合物形成的检测是本领域公知的,并且可以通过应用各种方法来实现。这些方法通常基于标记或标记物的检测,如本领域中已知的放射性、荧光、化学发光、电化学发光、生物或酶标签或标记物中的任何一种。涉及这些标记使用的美国专利包括美国专利第3,817,837号、第3,850,752号、第3,939,350号、第3,996,345号、第4,277,437号、第4,275,149号以及第4,366,241号,通过引用将每篇专利并入本文。当然,可以发现通过使用第二结合配体(如二抗或生物素/抗生物素蛋白配体结合排列)的其他优点,这是本领域已知的。用于检测的优选方法包括放射性免疫测定(RIA)或酶联免疫吸附测定(ELISA),由于通常提高的灵敏度,ELISA是最优选的。ELISA广泛用于生物技术应用中,特别是作为用于多种抗原物质的免疫测定。ELISA的灵敏度是基于信号的酶放大。其他技术包括蛋白质印迹、“夹层”免疫测定、免疫沉淀测定、沉淀反应、凝胶扩散沉淀反应、免疫扩散测定、凝集测定、补体固定测定、免疫放射性测量测定、荧光免疫测定和蛋白A免疫测定,仅仅是举几个实例。这样的测定是常规的并且是本领域公知的(参见,例如,Ausubel,etal.,eds,1994,CurrentProtocolsinMolecularBiology(分子生物学通用实验方案),Vol.1,JohnWiley&Sons,Inc.,NewYork,通过引用将其全部并入本文中)。还可筛选功能活性,如抗原活性的中和,或拮抗或激动活性,具有高抗原结合亲和性或能够抑制酶活性。这样的测定是本领域已知的,例如,受体/配体结合的功能筛选。可以基于结合亲和性选择抗体,如,例如,可以使用BIAcoreTM仪,或使用竞争性放射性免疫测定。因此,通常针对与特定的靶抗原(例如,用其进行了初始免疫且初始B细胞结合的靶抗原)相互作用的抗体分子来筛选抗体表达文库。因此一旦使用本发明的方法鉴定出一种或多种抗体分子(或编码其的核酸),可以对其进行分离和纯化。测定的其他所需特性包括测定表达水平、测定非特异性结合和测定特异性。因此,本发明的再一个方面提供了从本文限定的抗体表达文库中鉴定和/或分离一种或多种呈现所需特性的抗体分子的方法,所述方法包括针对展示出某些特性的分子筛选本发明的抗体表达文库的步骤。因此,本发明的优选方面提供了从本文限定的抗体表达文库中鉴定和/或分离一种或多种是靶抗原的特异性结合伴侣的抗体分子的方法,该方法包括以下步骤:a)针对结合具体靶抗原的抗体分子筛选本发明的表达文库和b)鉴定和/或分离相关文库成员。一旦鉴定出抗体文库成员,就可以任选地使其接受进一步的操作,如人源化、筛选其他功能性、演化和/或工程化。在一个实施方案中,可以将抗体人源化。通过CDR移植或重塑人源化,涉及将来自每个免疫球蛋白链的小鼠CDR插入人可变区的FW区内。一种CDR移植的方法可以用于形成所谓的框架-修补免疫球蛋白(framework-patchedimmunoglobin),并且公开于Leung等的美国专利第7,321,026号中,通过引用将其并入本文。与之前所述的人源化方法不同,以前的方法将来自供体的CDR移植至单个受体免疫球蛋白的框架上,修补框架片段(FR1、FR2、FR3和FR4)或FR,以替代亲本免疫球蛋白相应的FR。将这些来自不同免疫球蛋白和来自不同物种的FR的自由搭配混合,并进行匹配形成最终的免疫球蛋白链。利用来自供体免疫球蛋白的一个或多个互补性决定区(CDR)和来自一个或多个人或灵长类动物免疫球蛋白的框架序列的一部分,制备了免疫球蛋白链。通过非人抗体和人抗体模板之间的最佳同源性选择单独的FR序列。然而,这种方法是劳动密集的,并且不容易鉴定最佳框架区。另一种CDR移植方法描述于Williamsetal.inAntibodyEngineering(抗体工程化),Vol.1,Chapter21(第21章),KontermanandDubel,(eds.)Springer-VerlagBerlinHeidelberg2010,pp.319中。通过非人抗体和人抗体模板之间的最佳同源性选择FR序列。认为人可变区的选择是非常重要的。在公众数据库中存在超过9,000个重链和超过2,500κ抗体。这些包括Kabat、GenBank和IMGT数据库。通过将这些数据库用Kabat编号系统比对并在需要的情况下引入缺口,将每个人可变区与小鼠序列的同一性进行评分。在FW区、标准VH-VK界面残基和从潜在重要的同一性模型鉴定出的残基测定残基同一性。此外,鉴定了FW区中的糖基化模式,其可以导致对抗体结合的糖基化-依赖性作用。通过最大化与小鼠抗体的序列同一性和同源性,将所得到的人可变区序列进行提炼。Williams等(Willianmsetal.2010)描述的典型的CDR移植策略,从来自小鼠B细胞杂交瘤的可变区cDNA的克隆和测序开始。利用cDNA序列制备了嵌合重链和轻链构建体。平行设计了CDR移植的人可变区,并且制备了CDR移植的人源化重链和轻链构建体。使用嵌合和/或人源化表达构建体在瞬时转染中表达重组抗体。测试了重组人源化抗体的抗原结合效力。如果效力低,通过用选定的框架小鼠残基取代来制备进一步人源化的抗体形式。目的是获得具有最佳抗原结合效力但具有最小小鼠框架区抗体的人源化抗体。这种通过CDR移植进行人源化的方法多少也是劳动密集的,可能需要多次重复来制备呈现出最合需要的特征的人源化抗体。还涉及重塑来降低免疫原性的另一种人源化抗体的方法,涉及合成组合物文库,所述组合物文库包含框内融合于来自框架区子库的框架区的来自供体抗体的CDR。Wu等的US2010/0216975(Wuetal.US2010/0216975)中公开了这种称为抗体框架改组(framework-shuffling)的技术,通过引用将其并入本文。例如,Wu等制备了利用通过重叠延伸的聚合酶链式反应按序装配的组合子文库。快速人源化免疫原性降低的抗体,同时与供体抗体相比,保持或提高抗原结合特异性和亲和性,并且同时优化蛋白表达的另一种技术,公开于201年12月31日提交的美国专利申请第61/428,917号中,由此通过引用将其并入。简而言之,公开了从模板抗体产生人源化抗体的方法,在所述人源化抗体中,可变区或CDR源自模板抗体,而抗体的框架和恒定区源自一个或多个人抗体。在一个方面中,框架来自功能上表达的人抗体的人框架集合。在另一个方面中,使用单个序列用于轻链和重链中的任一个或两个中的框架区4。在进一步的方面中,将编码框架4的序列包含在表达载体中。源自模板抗体的可变区或CDR与模板抗体的可变区或CDR优选具有约90%至约100%的同一性,尽管考虑了任何和所有修饰,包括取代、插入和缺失,只要人源化抗体保持结合靶抗原的能力即可。可以针对其他抗原以及靶抗原来筛选本发明的抗体表达文库和选定的抗体,以测定特异性。例如,可以针对与靶抗原相似的抗原来筛选本发明的文库,以避免或获得交叉反应性抗体。例如,在产生对抗传染病的抗体的过程中,可以针对致病介质(disease-causingagent)的不同株系来筛选文库。对于一个株系具有特异性的抗体可以识别疾病特异性抗原。相反,结合不同株系的抗体可以识别株系中的共有抗原。至少抗体必须识别抗原上共有的或结构上相似的表位。通过用两种或多种不同但相关的靶抗原(例如,来自具体传染介质的不同株系的靶抗原)筛选本发明的文库而鉴定的这类抗体(即,通过差示筛选鉴定的抗体)是用作对抗致病介质的具体株系或不同株系的治疗或预防抗体的特别有用的候选物,并且形成本发明的优选实施方案。在一个实施方案中,可以使用全面位置演化(CPE)来演化抗体。CPE描述于2010年7月16日提交的发明名称为NovelMethodsofProteinEvolution(新的蛋白演化方法)的美国专利申请系列第61/365,216号中。通过引用将美国专利申请系列第61/365,216号全部并入。简而言之,在第一个步骤中,使用直链肽作为简单实例,产生了从位置1至n(n对应于多肽链中的残基数目)的每个密码子的一组天然存在氨基酸变体(或其子集,或氨基酸衍生物)。对于目标分子的每个多肽链重复该程序。对于19个天然氨基酸的每一个而言,最小组的氨基酸突变只含有一个密码子。然而,应当认识到,每个表达系统遭遇密码子偏好,其中不足的tRNA集合可以导致翻译停止、早熟性翻译终止、翻译移码和氨基酸错误插入。因此,为了表达优化,每组含有多达63个不同的密码子,包括终止密码子。在下一个步骤中,通过将每个新分子测序来证实突变。还可以使用其他证实方法。然后针对以下至少之一来筛选每个氨基酸组:-功能改善-中性突变-抑制突变-表达-克隆与宿主细胞的相容性。在一个方面中,如,例如,同时针对改善的功能和表达,筛选多个特征。将用于每组的数据合并,用于整个多肽链,并且产生靶分子的详细功能图(本文中称为EvoMapTM)。该图含有每个突变怎样影响靶分子的性能/表达和/或克隆能力的详细信息。其允许鉴定在蛋白功能(或在抗体情况中,为抗原/受体结合)没有丧失的情况下未发生变化的所有位点。还显示了在哪发生了变化而没有影响功能。该图进一步鉴定导致没有在宿主系统中表达的分子的变化,并且因此没有评价突变的作用。在EvoMapTM中,将模板上的每个位置鉴定为限制性位点(不可突变的)、完全可突变位点、部分可突变位点或用于特定氨基酸取代的高表达突变型。每个部分可突变位点可以进一步指定为易于用例如带电的残基取代或非极性残基取代,以及非表达克隆和/或不能在宿主系统中克隆的分子。可以利用EvoMapTM,以识别和重新组有益的单个氨基酸取代,并且筛选以进一步优化目标分子中的所需特征。然而,某些特征的演化可能需要两个或多个同时突变变成可观察的。EvoMapTM可以开发用来有效地且成本有效地以非随机方式产生一组多位点突变多肽。然后可以针对多位点高表达突变体来筛选这组多位点突变多肽。CPE能够完成体内证实的蛋白突变图谱。整组的高表达突变体的鉴定能够进行进一步的组合演化步骤。可以利用CPE来通过选择非表面突变、消除T-细胞表位和模仿体细胞突变降低演化蛋白的免疫原性风险。在一个方面中,CPE可以用于产生多达5、10或15个氨基酸,或多达全部19个氨基酸的文库。在蛋白中的每个位置进行改变,并且筛选所需的特征,如结合亲和性或表达,并且形成EvomapTM。稍后一轮的突变和筛选可以用于产生全部19个氨基酸的数据。根据图谱看,鉴定完全可突变的位点。这些位点可用于鉴定这样的位置,所述位置经修饰可以产生新的可以形成并测试新特征的分子的集合。例如,信息学可以用于鉴定序列中的HLA单元型,并且可以通过在从图谱鉴定出的“中性”(“完全可突变的”)位点进行特异性靶向改变来进行所需的改变,以避免这些单元型,其中主要的特征将没有受到影响。这可以潜在地降低免疫原性风险(可以选择非表面突变,消除t-细胞表位,模拟超体细胞突变)。此外,图谱可以显示出用于位点特异性修饰(糖基化和化学缀合)的位点,以提高各种特征。此外,沉默突变的优化可以提高各种宿主中的蛋白表达。组合蛋白合成(CPSTM)涉及组合来自CPE、CPI、CPD或任何其他研发技术的单独目标(hit),以组合两个或多个突变。CPS用于合成具有组合突变的蛋白,然后针对优化的基因和蛋白特征对其进行筛选。在一个方面中,CPS中组合了两个或多个导致高表达突变体或中性突变的点突变。CPS描述于2010年7月16日提交的美国专利申请系列第61/365,216号中。在一个实施方案中,将CPE与CPS组合来形成突变体,可以将筛选其所需的特性。在一个方面中,通过同时一次改变2个aa或3个aa或4个aa,与一次改变一个相比,在CPE过程中可以节约时间和资源;因此如果蛋白中aa数量是N,那么对一次针对2个aa产生和筛选的总数为(202)×1/2N;一次针对3个为(203)×1/3N等等。例如,在一个特定的方面中,(在2个aa实施例中):将第一个aa位置的第一个aa与第2个aa位置的全部20个组合,并且所有其他aa的保持相同,然后将第一个aa位置的第二个aa与第二个aa位置的全部20个组合,并且所有其他aa的保持相同。筛选整个群的高表达突变体,然后沿着线向下进行下两个aa的第二组的突变。在相似的方面中,这可以一次对3个aa或一次对4个aa进行。在另一个方面中,CPE方法接着进行高表达突变体(包括其任何子集)的CPS。当已经使用本发明的方法和表达文库选择、鉴定、人源化、演化、工程化和/或纯化了一个或多个抗体分子候选物时,可以制造这些候选物或其成分、片段、变体或衍生物,并且如果需要,与至少一种药物学上可接受的载体或赋形剂进行配制。这样制造的抗体分子或其成分、片段、变体或衍生物,也包括在本发明中。或者,这些抗体分子可以采用编码抗体分子的核酸形式,进而将所述核酸并入合适的表达载体中和/或包含在合适的宿主细胞中。因此,编码所述抗体分子的核酸分子,或含有所述核酸分子的表达载体形成本发明的更多方面。一旦根据本发明已经选择、鉴定了具体抗体分子或其成分、片段、变体或衍生物等,视情况,通过在合适的宿主细胞或系统中表达,并且从宿主细胞或系统或从其生长培养基或上清液中分离抗体分子,可以容易地使用编码所选抗体的表达载体(或适于使用)来产生足量的抗体分子。或者,可以通过其他合适方法,例如,通过编码抗体的核酸的化学合成以及在合适的宿主或体外转录系统中表达,来产生所述抗体分子。因此,本发明的再一个方面提供了制造特定抗体分子的方法,包括以下步骤:根据上文所述的本发明的方法,鉴定是靶抗原的结合伴侣的特定抗体分子,制造所述鉴定的抗体分子或其成分、片段、变体或衍生物,并任选将所述制造的抗体分子与至少一种药物学上可接受的载体或赋形剂进行配制。以这种方式鉴定、制造或配制的抗体分子(或其成分、片段、变体或衍生物)形成本发明的更多方面。对于这样的成分、片段、变体或衍生抗体分子的主要要求是,就结合特定抗原的能力而言保持最初的功能活性,或具有提高的功能活性。在一个实施方案中,产生、演化所选的抗体,并在真核宿主中表达,如哺乳动物细胞宿主或酵母细胞宿主,用于在单个系统中制造。全面整合抗体优化(comprehensiveintegratedantibodyoptimization,CIAO!TM),可以同时演化蛋白性能和优化表达。CIAO!TM公开于2010年7月16日提交的国际专利申请系列第PCT/US2010/42302号中,通过引用将其全部并入本文。在一个实施方案中,公开内容提供了在哺乳动物细胞生产宿主中选择、演化和表达抗体的方法;所述方法包括用抗体细胞表面展示在所述哺乳动物细胞生产宿主中产生抗抗原抗体文库;针对至少一种预定的特性、特征或活性,筛选所述文库;从所述文库中选择模板抗体;演化所述模板抗体,以用抗体细胞表面展示在所述哺乳动物细胞生产宿主中产生一组突变抗体,针对至少一种预定的特性、特征或活性筛选所述突变抗体;基于与模板抗体比较时至少一种预定的特性、特征或活性的优化,从该组突变抗体中选择高表达突变型抗体;以及在与产生步骤中所用的相同哺乳动物细胞生产宿主中表达所述高表达突变型抗体。在一个方面中,抗原是预先选定的。在另一个方面中,抗抗原抗体文库是人源化的抗抗原抗体文库。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1