集合及其使用方法

文档序号:3570473阅读:1355来源:国知局
专利名称:集合及其使用方法
集合及其使用方法相关申请的交叉引用本申请要求2010年1月四日提交的美国临时申请系列第61Λ99,401号和2009 年5月四日提交的美国临时申请系列第61/182,350号的权益,二者均通过引用整体并入本文。背景在尤其是治疗性抗体领域中的药物研发上的进展正快速地使许多疾病的治疗成为可能和/或改进许多疾病的治疗。这些达到新颖的目标空间并提供新颖的作用机制的进展正日益改善患者的生活质量,甚至是患有最严重的和挑战性的疾病的患者。一般对于保健制度特别是患者来说的一个挑战是由这些药物进展赋予的新药的成本也在快速地增加。 高成本是由于药物特别是抗体的研发所需的投资目前每种市售产品超过十亿美元。研发的高失败风险和极长的研发时间线使得这些投资不可避免。从潜在治疗性抗体的鉴定时起直到它上市并可以使患者受益可能要超过十五年。从鉴定、临床前、临床到进入市场的每个研发阶段充满了挑战和风险。制药公司不断地审估以确定如何通过减少时间线和失败风险来减少研发成本,以使最有效的药品快速达到患者手中,并使他们负担得起。以下公开内容提供了允许更快地鉴定用于治疗可以说任何疾病的最优治疗性抗体的一种有价值的进展。候选的治疗性抗体必须满足许多研发标准以使其上市,所述研发标准诸如长期稳定性和高表达产率。本公开的进展提高了鉴定直接从开始就满足所有的严格研发标准的抗体的概率和速度。由此得到的抗体将更廉价地生产并且在众多疾病的治疗上将是有效的且安全的。鉴定治疗性抗体的公知方法是通过使用噬菌体展示技术。噬菌体展示利用生长在细菌中的病毒样粒子来展示抗体。这种技术的一个益处是使用的文库是巨大的,具有高达IX 101°种抗体,可以快速地测试这些抗体与任何疾病相关的任何靶的结合。见, 例如,Knappik 等人,(2000), 〃 Fully synthetic human combinatorial antibody libraries(HuCAL)based on modular consensus frameworks and CDRs randomized with trinucleotides (基于模块共有构架和以三个核苷酸随机化的⑶R的全合成的人组合抗体文库(HuCAL)),“ J. Mol. Biol. 11 ;296(1) 57-860以这些大数目为研究对象的益处是对靶进行筛选的结果可产生数百种结合该治疗靶的抗体,所有这些抗体可能是治疗上相关的。但一个问题是,通常这些抗体中只有一些是可研发的,意味着它们能够满足所需的所有严格标准以使其上市。为了使新的噬菌体展示文库快速缩短鉴定时间线并减少内在风险,该文库应包括具有如下特性的抗体所述特性对于选择和临床研发是必要的并且将在患者中产生安全且有效的治疗。这些特性包括1)高噬菌体展示率,使得能够针对感兴趣的靶对该集合 (collection)的每一种和每一个抗体进行测试;幻高表达水平,使得抗体或片段可被高效地复制;幻高热稳定性,使得抗体能够以有效形式到达患者;4)在血清中的高稳定性,使得抗体能够在体内存活达治疗相关的时间力)低免疫原性风险,从而提高安全性,以及5)高度多样性,使得可使用一个文库来鉴定针对任何治疗靶的抗体。
以基本方式模拟人免疫系统的文库将是具有高度价值的,或甚至是最佳的解决办法。人免疫系统包括被种系基因编码的抗体。抗体在部分上包括可变重链和可变轻链。存在大约50种可变重链种系基因和大约50种可变轻链种系基因,合起来提供约2,500种不同的可变重链和可变轻链对的组合。在人中,认为所有这2500种组合被产生。但已发现, 某些可变重链、可变轻链和/或可变重链和可变轻链组合(对)以比其他可变重链、可变轻链和/或可变重链和可变轻链组合(对)更高的水平表达。假设一定存在某些比另一些表达得更多的原因,且如果这样的话,假设高表达的种系基因可能具有有利的功能特性。 因此,提供具有有利的功能特性的抗体文库的一种方式是产生包括来自免疫组库(immune repertoire)的丰富的可变重链、可变轻链和/或可变重链和可变轻链种系对的文库。此外,认为人存在的种系基因序列出于明显的原因具有非常低的免疫原性,因此可以在重组抗体中模拟这些序列以降低免疫原性风险。已从事了评估人免疫组库中普遍的可变重链和轻链种系基因配对的方法。见de Wildt 等人,Analysis of heavy and light chain pairings indicates that receptor editing shapes the human antibody repertoire (重链禾口轻链配对的分析指示受体编辑 (receptor editing)塑造人抗体谱),J Mol Biol. 22 ;285 (3) :895-901 (1999 年 1 月),通过引用将其整体并入。Wildt等人从人供体采取血样,分选已经历体细胞超突变(somatic hypermutation)的IgG+B细胞,PCR扩增cDNA,对每个cDNA进行测序,并将每条序列与已知的人可变结构域种系基因进行比对。Wildt等人观察到,仅有一些种系基因占据免疫组库的优势地位,并且频繁表达的重链和轻链基因区段通常是成对的。还已尝试保持个体B细胞的重链和轻链可变结构域配对。例如,已公开可变结 1 "! ] !^ (cognate pair),,白勺t_。 JAL Meijer ^A, Isolation of human antibody repertoires with preservation of the natural heavy and light chain pairing (1 存天然重链和轻链配对的人抗体谱的分离),J Mol Biol. ,358(3) =764-72(2006年5月5 日);和W02005042774。根据Mei jer等人所述的技术的文库已从免疫过的宿主的个体B细胞产生。一般而言,通过FACS分选B细胞,以选择代表体细胞超突变细胞的⑶38hi B细胞, PCR扩增它们的cDNA,并且将该抗体基因产物插入Fab载体中以用于选择。这种同源对文库不是没有限制。例如,提供B细胞的宿主通常被免疫;并且分选的B细胞群已经被超突变, 因此,得到的文库偏向于特定的免疫原。另外,已尝试利用突出的可变重链或可变轻链产生文库。例如,在Shi等人, "De Novo Selection of High-Affinity Antibodies from Synthetic Fab Libraries Displayed on Phage as pIX Fusion Proteins (在噬菌体上展示为pIX融合蛋白的来自合成的Fab文库的高亲和力抗体的重新选择)J Mol Biol. ,397(2) :385-96 (2010年3 月26日)(不被认为是关于本发明的现有技术)以及对应的专利申请W0200908M62 ;和 W02006014498中,根据可变重链或可变轻链种系蛋白序列在人免疫组库中的使用频率将它们掺入文库中。还进行了另外的尝试,该尝试将特异性种系对掺入文库中。例如,W01999020749描述了一种文库,其中文库成员包括具有由人种系重链基因区段DP-47(IGHV3-2;3)编码的高变环和/或由该种系基因编码的构架区的规范结构的重链,和/或具有由人种系轻链基因区段02/012 (IGKV1-39/1D-39)编码的高变环和/或由该种系基因编码的构架区的规范结构的轻链。另外的方法已产生直接来自B细胞或衍生自B细胞的文库。例如,Glanville等人,Precise Determination of the Diversity of a Combinatorial Antibody Library Gives Insight into the Human Immunoglobulin Repertoire (组合抗体文库的多样性的准确测定给予了对人免疫球蛋白谱的深入了解),Natl Acad Sci 1 ; 106 (48) 20216-21 (2009年12月)(不被认为是关于本发明的现有技术),描述了由肪4种人供体免疫球蛋白M(IgM)谱的多样性构建的抗体文库。具体而言,对来自6M个人类供体的重链和轻链V基因cDNA分别进行PCR扩增(分离可变重链和轻链对),然后将这些重链和轻链结构域随机地重新关联。W0200305M16描述了从显示对感兴趣的病原体明显响应的宿主分离B细胞,这些病原体产生于被微生物感染或用疫苗治疗。在W0200305M16中,对编码可变区的CDR3区的cDNA进行测序,并且设计包含优势CDR3的抗体片段。W02009100896描述了从免疫的宿主分离B细胞,其中对编码可变重链区和可变轻链区的cDNA进行测序,并且确定未配对的可变重链和可变轻链序列的丰度。在W02009100896(不被认为是关于本发明的现有技术)中,合成包括随机重组的可变重链和可变轻链的文库,其中抗体是对一种免疫原特异的。这些方法和其他方法的概述见于Fuh等人,Synthetic antibodies as therapeutics (作为疗法的合成抗体),Expert Opin Biol Ther. ,7(1) :73-87 (2007 年 1 月)。因此,对于掺入在人免疫组库中表达的具有有利的生物物理特性的可变重链和可变轻链种系基因对的抗体或其片段的集合存在高度需求,所述有利的生物物理特性产生在患者中安全且有效的容易开发的抗体。本发明满足了这些需求和其他需求。概述本公开内容对有效地鉴定针对任何靶的可开发的且在患者中安全和有效的抗体的问题提供了有价值的解决办法。从最一般的意义上讲,发明人开始于如下想法以基本方式模拟人免疫系统的抗体文库可能是有利的。一方面,发明人决定通过将来自人免疫组库的最佳种系基因序列掺入抗体中来模拟人免疫系统。这样,在一些实施方案中,文库的抗体包括序列上为种系的部分,例如构架区。使用种系序列将显著地降低在患者中治疗性使用的重组抗体的免疫原性风险。此外,发明人根据其如下假设而研究在人免疫组库中富含的可变重链和可变轻链种系基因对可能具有有利的生物物理特性,将导致更有效率的临床研发,提高得到的抗体在患者中的安全性和效力。作为背景,每个B细胞编码一种抗体,并且每种抗体包含可变重链和可变轻链。可将抗体的可变重链和可变轻链中的每一个与种系序列比对以确定抗体的起源,意味着可变重链和可变轻链由哪些种系基因编码。因此,对于每种抗体来说,可变重链和可变轻链构成种系对,例如,VH3-23与VK1-5配对。为了证实突出的种系基因对可能具有有利的生物物理特性的假设,第一步是鉴定存在于人免疫组库中的可变重链和可变轻链种系基因对。这是通过广泛地查找公开可用的文献并通过从人宿主中对B细胞采样而完成。下一步,汇集、分析原始数据,并根据发生率对存在于人免疫组库中的可变重链和可变轻链种系对进行分级。从这个数据很清楚的是, 某些可变重链和可变轻链种系基因对比其他种系对更频繁地存在于人免疫组库中。另外,发明人认为某些可变重链和可变轻链种系基因对在幼稚B细胞(未经历抗原的)与经历抗原的B细胞中可差异地表达,因此,基于采样的B细胞的发育或分化来分析汇集数据。从我们的分析很清楚的是,某些种系基因对在幼稚B细胞群与经历抗原的B细胞群中差异地表达。下一步,必须确定要测试哪些种系蛋白对,因为在人免疫组库中存在约2500对。 一种方式是测试最突出地出现在人免疫组库中的可变重链和可变轻链种系蛋白对,例如, 见表18。人们可例如选择前四百对用于测试,或者选择表达高于某个阈值浓度的可变重链和可变轻链种系基因对。这种方法将需要合成和测试大量可变重链和可变轻链种系蛋白对序列;因此,这种方法可能不是非常有效率的。作为一种可选的方法,发明人选择了代表、准确地再现或覆盖大多数来自人免疫组库的突出表达的对的一小组可变重链和可变轻链种系对。这种方法部分上基于如下观察结果少量可变重链、可变κ轻链和可变λ轻链种系基因在人免疫组库中占优势。Wildt 等人在895-896页描述了这种现象。Wildt等人还说明频繁表达的重链和轻链基因区段通常是成对的,并且观察到采样的一半配对仅对应于五个种系对。因此,可以联合少量的突出表达的重链和轻链种系基因(未成对的)以产生一组代表人免疫组库的对。这种方法以下列方式进行。分析汇集数据和另外的数据(仅鉴定VH或VL的表达而不是关联对的表达)来确定在人免疫组库中可变重链、可变κ轻链和可变λ轻链的种系基因表达。下一步,评估突出表达的可变重链、可变κ轻链和可变λ轻链种系蛋白序列 (不是对)以确定其与研发相关的生物物理特性。经由计算机模拟(in silico)评估了可变重链、可变κ轻链和可变λ轻链种系蛋白序列的以下特性(i)CDR长度,(ii)等电点 (Pl)(优选的等电点是8或以上,因为这将提供在中性配制缓冲液中的稳定性),(iii)翻译后修饰(PTM)(具体地说,N连接的糖基化位点(NxS或NxT)或化学修饰如Asp切割(通常在DP)),(iv) Asp异构化(DD,DG),(ν)脱酰胺作用(NS,NG)(这可在体内(在血清中)或在储存时在配制缓冲液中发生并且导致抗体结合的丧失),(vi)在CDR中甲硫氨酸的存在 (当暴露于溶剂时可被氧化),(vii)未成对的半胱氨酸的存在(将与任何其他未成对的半胱氨酸形成二硫键,由此导致蛋白的交联和/或较低的表达水平),(viii)偏离种系,(ix) 潜在的T细胞表位的存在,以及(χ)理论上的聚集倾向。下一步,组合具有有利的生物物理特征的可变重链、可变κ轻链和可变λ轻链种系对以形成可变重链和可变轻链对。如表23所示,这一小组的对代表、准确地再现或覆盖大多数来自人免疫组库的突出表达的对。这是通过如下方式完成的合成可变重链和可变轻链种系基因、将它们组合成对、将这些对表达成蛋白并测试每种蛋白来鉴定这些对的生物物理特性。测试了以下特性(i)在噬菌体上以Fab形式的相对展示率,(ii)以Fab形式的相对表达水平,例如,在大肠杆菌中;(iii)以Fab形式的热稳定性;(iv)以Fab形式在牛血清或小鼠血清中的稳定性;(ν)以IgG形式的相对表达水平;(vi)以IgG形式在牛血清中的稳定性。鉴定具有有利的生物物理特性的种系蛋白对后,将集合设计成包括这些对。本公开内容的一个方面是如下抗体或功能片段的集合所述抗体或功能片段包括具有增强可研发性(developability)的有利特性的可变重链和轻链种系基因对,但不包括不具有这些特性的可变重链和轻链种系基因对,即使不具有这些特性的可变重链和轻链种系基因对被突出地表达在人免疫组库中。以这种方式,将集合设计成不包括自然存在的(在2,500对中)不具有有利的功能特性的可变重链和轻链的组合或对。例如,VH4-34是人免疫组库中频繁出现的,如表20所示,但是还已知源自这种重链种系基因的抗体对B细胞有细胞毒性,因此源自这种基因的抗体可从文库设计中排除。见Miat等人,Rapid cytotoxicity of human B lymphocytes induced by VH4-34(VH4. 21)gene-encoded monoclonal antibodies (由VH4-34(VH4. 21)基因编码的单克隆抗体诱导的人B淋巴细胞的快速细胞毒性),Clin Exp Immunol.,105(1) :183-90(1996 年 7 月)。在一些实施方案中,本发明的集合包括含大量功能上有利的可变重链和可变轻链的组合或对的抗体,以致这些集合的抗体十分多样,从而提供可用于鉴定针对任何治疗靶的抗体的集合。这些集合克服了现有技术的许多问题。例如,源自B细胞的同源文库没有加入这个概念,因为在这种文库中存在的VH和VL类配对与在B细胞样品中存在的类配对相同。如果取得足够大的B细胞样品,近似50个VH和50个VL的类配对组合Q500)中的每一个都将存在。在本公开内容中VH和VL对的广泛测试显示许多VH和VL种系基因对没能具有容许在临床上的可研发性的特性。因此,这种同源文库包括可能不可开发的许多VH和VL对。 因此,产生只包括具有有利的功能特性的VH和VL类对的大多样性的文库可能是令人期望的,但是对于同源文库方法,这是不能的。此外,在一些实施方案中,包含在集合中的种系基因对是基于幼稚B细胞或未经历抗原的B细胞的样品,因此,所代表的种系基因对不偏向于特定的免疫原,并且这些集合可能在针对任何免疫原进行筛选上是优秀的。附图描述

图1显示在周质提取具有VH3-23重链(上图)和VH1-69重链(下图)的抗体后的抗-Fd表达ELISA的结果,每种抗体带有三种修饰的phoA信号序列之一,所述修饰的phoA 信号序列相比于野生型(TKA)信号序列包括C端限制酶切位点AfIII (VLS)、NheI (VLA)和 AvrII (VLG)。在VH3-23组中,所有修饰的phoA信号序列保持了野生型(TKA)范围内的表达水平。图2显示了在周质提取具有VK1-39轻链(左上图)、VK3-11轻链(右上图)、 VL1-40轻链(左下图)和VL3-1轻链(右下图)的抗体后的抗-Fd表达ELISA的结果,每种抗体带有三种修饰的ompA信号序列之一,所述修饰的ompA信号序列相比于野生型(AQA) 信号序列包括C端限制酶切位点NdeI (AYG) ,NdeI (AYA)和BsiWI (TYA)。使用V κ和V λ Fab 片段二者测试了包括C端限制酶切位点的修饰的ompA信号序列和野生型信号序列。包括 NdeI (AYA)的信号序列始终显示与野生型(AQA) —样好或更好的表达。图3显示了如实施例1-1. 3中详述的被选择用于掺入phoA和ompA大肠杆菌信号序列的C端中的限制酶切位点,并且包括CDR 3周围的信号序列及其各自的取向。这幅图在展示大肠杆菌信号序列的同时还表示如实施例1. 5中详述的选择用于在IgG表达中使用的人重链和κ链前导序列中掺入的C端限制酶切位点。图4-9显示在1Tsuiji M.等人Q006)中分离并描述的B细胞的VH/VL种系基因对。图10-12显示在Tiller Τ.等人Q007)中分离并描述的B细胞的VH/VL种系基因对。
图13-17显示在Mietzner B.等人Q008)中分离并描述的B细胞的VH/VL种系基因对。图18-20显示在Wardemann H.等人Q003)中分离并描述的B细胞的VH/VL种系基因对。图21-23显示在Yurasov S.等人Q005)中分离并描述的B细胞的VH/VL种系基因对。图M16显示在Yurasov S.等人Q006)中分离并描述的B细胞的VH/VL种系基因对。图27显示用于扩增分离自人宿主的单个分选的成熟的幼稚B细胞(mn)和抗体分泌细胞(asc)的cDNA的PCR策略,如实施例2. 2中详述的。图观-36显示如实施例2. 2中详述的分离自人样品的B细胞的VH/VL对。图37显示选择用于合成、组合和功能表征的20种VH种系基因,如实施例4_4. 1 详述的。该图还显示每种种系基因经由计算机模拟分析的结果,其中Pl代表等电点,PTM是如本文所述的互补决定区中的翻译后修饰,NxS/T是N连接的糖基化位点,并且在CDR中的 Met是甲硫氨酸。图38显示选择用于合成、组合和功能表征的8种V λ和12种V κ种系基因,如实施例4-4. 1详述的。该图还显示每种种系基因的经由计算机模拟分析的结果,其中pi代表等电点,PTM是如本文所述的互补决定区中的翻译后修饰,NxS/T是N连接的糖基化位点,并且在⑶R中的Met是甲硫氨酸。图39显示了来自示于图446的实施例2. 1和示于图观_36的实施例2. 2的汇集数据的VH/Vk对。数字条目代表汇集数据中鉴定的来自个体B细胞的每个VH/V κ种系基因对的数目。Y轴显示根据汇集数据中的表达频率从顶部(VH3-23)到底部(VH3-20)排序的VH种系基因。X轴显示根据汇集数据中的表达频率从左(IGKV3-20)到右(IGKV1D-17) 排序的V κ种系基因。数字1358是采样的B细胞数目。图40显示了来自示于图446的实施例2. 1和示于图观_36的实施例2. 2的汇集数据的VH/νλ对。数字条目代表汇集数据中鉴定的来自个体B细胞的每个VH/V λ种系基因对的数目。Y轴显示根据汇集数据中的表达频率从顶部(VH3-23)到底部(VH3-20)排序的VH种系基因。X轴显示根据汇集数据中的表达频率从左(IGLV2-14)到右(IGLV4-60)排序的V λ种系基因。数字779是采样的B细胞数目。图41显示了来自示于图446的实施例2. 1和示于图观_36的实施例2. 2的汇集数据的VH/Vk对,但仅包括未成熟的B细胞、新的迁移B细胞和成熟的幼稚B细胞的未经历抗原的B细胞群以鉴定在幼稚的人免疫组库中突出的VH/Vk对。数字条目代表汇集数据中鉴定的来自个体B细胞的每个VH/VL种系基因对的数目。Y轴显示根据汇集数据中的表达频率从顶部(VH3-23)到底部(VH3-20)排序的VH种系基因。X轴显示根据汇集数据中的表达频率从左(IGKV3-20)到右(IGKV1D-17)排序的Vk种系基因。数字888是采样的 B细胞数目。图42显示了来自示于图446的实施例2. 1和示于图观_36的实施例2. 2的汇集数据的VH/νλ对,但仅包括未成熟的B细胞、新的迁移B细胞和成熟的幼稚B细胞的未经历抗原的B细胞群以鉴定在幼稚的人免疫组库中突出的VH/VX对。数字条目代表汇集数据中鉴定的来自个体B细胞的每个VH/VX种系基因对的数目。Y轴显示根据汇集数据中的表达频率从顶部(VH3-23)到底部(VH3-20)排序的VH种系基因。X轴显示根据汇集数据中的表达频率从左(IGLV2-14)到右(IGLV4-60)排序的V λ种系基因。数字457是采样的B 细胞数目。图43显示了来自示于图446的实施例2. 1和示于图观_36的实施例2. 2的汇集数据的VH/V κ对,但仅包括IgG抗体分泌细胞以及IgM和IgG记忆性B细胞的经历抗原的 B细胞群。数字条目代表汇集数据中鉴定的来自个体B细胞的每个VH/Vk种系基因对的数目。Y轴显示根据汇集数据中的表达频率从顶部(VH3-23)到底部(VH3-20)排序的VH种系基因。X轴显示根据汇集数据中的表达频率从左(IGKV3-20)到右(IGKV1D-17)排序的Vk 种系基因。数字470是采样的B细胞数目。图44显示了来自示于图446的实施例2. 1和示于图观_36的实施例2. 2的汇集数据的VH/V λ对,但仅包括IgG抗体分泌细胞以及IgM和IgG记忆性B细胞的经历抗原的 B细胞群。数字条目代表汇集数据中鉴定的来自个体B细胞的每个VH/VX种系基因对的数目。Y轴显示根据汇集数据中的表达频率从顶部(VH3-23)到底部(VH3-20)排序的VH种系基因。X轴显示根据汇集数据中的表达频率从左(IGLV2-14)到右(IGLV4-60)排序的νλ 种系基因。数字322是采样的B细胞数目。图45A-C显示由VH种系基因编码的氨基酸序列,如在以下文献中所述=Tomlinson 等人’ (1992), "The Repertoire of Human Germline Vh Sequences Reveals about Fifty Groups of Vh Segments with Different Hypervariable Loop (人禾中系 Vh 序列的组库揭示大约五十组具有不同超变环的Vh区段)” J. Mol. Biol. 227,776-798 ;Matsuda 等人(1998), "The complete nucleotide sequence of the human immunoglobulin heavy chain variable region locus (人免疫球蛋白重链可变区基因座的完整核苷酸序列),,J Exp Med 188(11) :2151-62 ;禾口 LeFranc MP(2001) "Nomenclature of the human immunoglobulin heavy (IGH) genes (人免疫球蛋白重链(IGH)基因的命名)· ”Exp Clin Immunogenet. 18(2) :100_16o图46A-C显示了由Vk种系基因编码的氨基酸序列,如在以下文献中所述 Sellable 禾口 Zachau(1993),“The variable genes of the human immunoglobulin kappa locus (人免疫球蛋白κ基因座的可变基因),”Biol.Chem Hoppe Seyler. 374(11) 1001-22 ;Brensing_Kiippers 等人(1997), "Thehuman immunoglobulin kappa locus on yeast artificial chromosomes (YACs)(在酵母人工染色体(YAC)上的人免疫球蛋白κ 基因座)”Gene. 191(2) :173-81 ;Kawasaki 等人(2001), "Evolutionary dynamics of the human immunoglobulin kappa locus and the germline repertoire of the Vkappa genes(人免疫球蛋白κ基因座和Vk基因的种系组库的进化动态)”Eur J Immunol 31(4) :1017-28 ;禾口 Lefranc MP(2001) " Nomenclature of the human immunoglobulin kappa(IGK) genes (人免疫球蛋白 κ (IGK)基因的命名)〃 Exp Clin Immunogenet.,18, 161-174。图4743显示由¥入种系基因编码的氨基酸序列,如在以下文献中所述=Kawasaki 等人,(1997) “One-Megabase Sequence Analysis of the Human immunoglobulin lambda Gene Locus(人免疫球蛋白λ基因座的一兆碱基序列分析)”Genome Research 7(3)250-61 ;Frippiat 等人,(1995) “ Organization of the human immunoglobulin lambda light-chain locus on chromosome 22qll. 2 (在染色体 22qll. 2 上的人免疫球蛋白 λ 轻链基因座的组织)〃 Hum. Mol. Genet.,4,983-991 ;和 LeFranc MP (2001) “ Nomenclature of the human immunoglobulin lambda(IGL) genes ( Λ^it S S λ (IGL) SSW^ 名)·Εχρ Clin Immunogenet. ;18 :242_254。图48显示pJPdl三顺反子(tricistronic)噬菌体展示载体。图49显示ρJPxIFab表达载体。图 50 显示 pMxll (pMORPHXll)Fab 表达载体。图51显示pM0RPH30Fab展示载体。图52显示pJP_h_IgGlf可变重链IgG表达载体。图53显示pJP_h_Ig_ κ可变κ轻链IgG表达载体。图54显示pJP_h_Ig_ λ 2可变λ轻链IgG表达载体。图55显示测试的400个VH/VL种系基因对的相对Fab展示率。较高的数字指示较高的展示水平。图56显示测试的400个VH/VL种系基因对的相对Fab表达水平。较高的数字指示较高的Fab表达水平。图57显示以Fab形式的测试的400个VH/VL种系基因对的温度稳定性数据。数字60和70指示在测试的设置中在60°C或70°C稳定持续45min的VH/VL对。数字4指示温度不稳定的对并且bg指示低表达水平。图58显示以Fab形式的测试的400个VH/VL种系基因对在牛血清中的稳定性数据。S代表在测试的条件下稳定的并且U代表在测试的条件下不稳定的。图59显示以Fab形式的测试的400个VH/VL种系基因对在小鼠血清中的稳定性数据。S代表在测试的条件下稳定的并且U代表在测试的条件下不稳定的。图60显示测试的400个VH/VL种系基因对的相对IgG表达率。较高的数字指示较高的IgGl表达水平。图61显示以IgG形式的测试的400个VH/VL种系基因对的血清稳定性数据。S代表在测试的条件下稳定的并且U代表在测试的条件下不稳定的。详述定义为了使理解本发明容易,提供了以下定义和阐释。一般术语在数值和范围上下文中的术语“大约”或“近似”是指近似于或接近于使得本发明可按预期实行(诸如具有期望的序列同源性的数字或百分比)的所列的值或范围的值或范围,根据本文包含的教导这对于技术人员是清楚的。这至少部分上是由于可变的培养条件和生物系统的可变性。因此,这些术语涵盖超出系统误差产生的值的值。这些术语使隐含的东西明确。通常,“大约”涵盖陈述值的士 10%。因此,术语“大约”可用来描述范围。在发明概述和发明描述中本文列出的所有范围包括关于该范围的数字或在该范围的数字之间的所有数字或值。本发明的范围明白地命名并列出在该范围中的所有整数、 小数和分数值。
术语“受治疗者”包括人和非人动物。非人动物包括所有脊椎动物,例如,哺乳动物和非哺乳动物,如非人灵长类、羊、狗、牛、鸡、两栖动物和爬行动物。除另外说明,术语“患者”或“受治疗者”在本文可互换使用。术语“治疗”包括施用组合物或抗体以阻止或延迟疾病的症状、并发症或生物化学标记(biochemical indicia)的发作,减轻症状或停止或抑制疾病、病症或疾患的进一步发展。因此,治疗涵盖但不限于“治愈”。治疗可以是预防性的(以阻止或延迟疾病的发作,或阻止或减缓临床症状或其亚临床症状的表现)或在疾病表现后治疗性的抑制或减轻症状。如本文所用的“数据库或可读介质”是指用于储存序列数据的任何格式以及由此的任何信息集合,如数据库文档、查找表、Excel电子表格等等。在某些实施方案中,数据库以电子形式存储,如计算机可读的存储装置。这包括介质,如服务器、客户端(client)、硬盘、⑶、DVD、个人数字助理如Palm Pilot、磁带、zip盘、计算机内部ROM(只读存储器)或因特网或万维网。其他计算机可获取的用于存储文档的介质将对本领域技术人员是明显的。“经由计算机模拟”是指在计算机上进行的操作、分析和设计,但还可以同样在纸上或通过心算进行。抗体及其特性如本文所用的术语“抗体”包括整个抗体。抗体可以是多克隆的、亲和力纯化的多克隆的、单克隆的、全人的、鼠的或啮齿动物的、嵌合的、骆驼的或人源化的抗体。抗体可属于任何的抗体类,如IgG, IgGl、IgG2、IgG3、IgG4、IgA(包括人亚类IgAl和IgA2)、IgD、 IgE、IgG或IgM。天然存在的“抗体”是包括由二硫键相互连接的至少两条重(H)链和两条轻(L)链的糖蛋白。如本文所用的术语“其功能片段”包括任何抗原结合片段,如Fab、F(ab' )2、 Fab\ Fv, scFv、包括Fc部分的单链、纳米抗体以及具有不同于可变构架区的支架的其他抗体样结构。术语“其功能片段”包括但不限于抗体的任何功能部分,其中功能包括免疫原的结合或效应子功能。如本文所用,术语“亲和力”是指在抗原位点处在抗体与抗原之间的相互作用的强度。在每个抗原位点之内,抗体“臂”的可变区通过非共价力与抗原在许多位点相互作用; 相互作用越大,亲和力越强。如本文所用,术语抗体或其功能片段如IgG抗体的“高亲和力” 是指抗体具有对靶抗原10_8M或更低、10_9M或更低、ΙΟ,Μ或更低、或10_"Μ或更低的KD。然而,“高亲和力”结合对于其他抗体同种型来说可能不同。例如,对于IgM同种型的“高亲和力”结合是指抗体具有10_7Μ或更低、或10_8Μ或更低的KD。如本文所用的术语“Kassoc”或“Ka”意指特定的抗体-抗原相互作用的缔合速率, 而本文所用的术语“Kdis”或“Kd”意指特定的抗体-抗原相互作用的解离速率。如本文所用的术语“KD”意指解离常数,它由Kd与Ka的比(即Kd/Ka)获得并且被表示为摩尔浓度 (M)。抗体的KD值可使用本领域充分确立的方法来确定。一种用于确定抗体KD的方法是通过使用表面等离子共振或使用生物传感器系统如Biacore 系统。术语“交叉阻断(cross-block)”、“交叉阻断的”和“交叉阻断了”在本文可互换使用,来表示在标准的竞争结合测定中抗体或其他结合剂干扰其他抗体或结合剂与相同的靶结合的能力。抗体或其他结合剂能够干扰另一种抗体或结合分子与相同的靶结合的能力或程度,以及因此是否可以根据本发明将其说成交叉阻断,可使用标准竞争结合测定法来确定。一种适合的测定包括Biacore技术的使用(例如,通过使用BIAcore 3000仪器 (BiaCOre,UppSala,SWeden)),该技术可利用表面等离子共振技术测量相互作用的程度。另一种测量交叉阻断的测定法利用基于ELISA的方法。术语“表位”表示能够特异性结合抗体的蛋白决定簇。表位通常由化学活性表面分类的分子如氨基酸或糖侧链组成,并且通常具有特定的三维结构特征以及特定的电荷特征。构象表位和非构象表位的差别在于在存在变性溶剂的情况下与前者的结合丧失,但与后者的结合没有。术语“嵌合抗体”是其中恒定区或其部分被改变、取代或交换以使得抗原结合位点 (可变区)与具有不同或改变的类别、效应子功能和/或种类的恒定区连接的抗体分子。术语“同种型”是指由重链恒定区基因提供的抗体类(例如,IgM, IgE, IgG如IgGl 或IgG4)。同种型还包括这些类之一的修饰形式,其中已作出修饰来改变Fc功能,例如,增强或减少效应子功能或与Fc受体的结合。术语“种系”表示从亲本到后代传下来的编码抗体或其功能片段的核酸序列。术语“种系蛋白序列”表示a)由种系基因编码的抗体或其功能片段的可变区的氨基酸序列,b)由编码抗体或其功能片段的可变区的修饰的核酸序列所编码的氨基酸序列,所述抗体或其功能片段的可变区具有与由种系基因编码的抗体或其功能片段的可变区相同的氨基酸序列,其中所述核酸序列通过以下方式修饰例如,密码子优化、期望的限制酶切位点的添加、优化的GC含量、不期望的剪接位点的去除或mRNA不稳定性基序的去除, 或c)由种系基因编码的但在氨基酸序列中具有点突变的氨基酸序列,所述点突变诸如为了去除不期望的半胱氨酸,或引入期望的限制酶切位点例如Bbsl,或产生于合成、扩增或克隆中的错误。术语“种系基因序列”表示a)编码抗体或其功能片段的可变区的种系基因的核酸序列,或b)编码具有与由种系基因所编码的抗体的可变区相同的氨基酸序列的抗体或其功能片段的修饰的氨基酸序列,其中所述氨基酸序列通过以下方式修饰例如,密码子优化、期望的限制酶切位点的添加、优化的GC含量、不期望的剪接位点的去除或mRNA不稳定性基序的去除。术语“种系基因对”表示编码抗体或其功能片段的可变重链和可变轻链的核酸序列及其对应的种系基因的对。例如,种系基因对可以是VH3-23/VK 1-5,其中由VH3-23/ VK 1-5编码的抗体包括由种系基因VH3-23编码的可变重链或其部分以及由种系基因 Vk 1-5编码的可变轻链或其部分。术语“种系蛋白对”表示如下抗体或其功能片段,其中可变重链或其部分以及可变轻链或其部分a)各自由特定的种系基因编码,或b)各自由编码具有与由特定的种系基因编码的抗体的可变区相同的氨基酸序列的抗体或其功能片段的可变区的修饰的核酸序列编码,其中所述核酸序列通过以下方式修饰例如,密码子优化、期望的限制酶切位点的添加、优化的GC含量、不期望的剪接位点的去除或mRNA不稳定性基序的去除,或c)各自包含由种系基因编码的但在氨基酸序列中具有点突变的氨基酸序列,所述点突变诸如为了去除不期望的半胱氨酸,或引入期望的限制酶切位点例如Bbsl,或产生于合成、扩增或克隆中的错误。例如,种系蛋白对可以是由VH3-23/VK 1-5编码的抗体或功能片段,其中该抗体包括由种系基因VH3-23编码的可变重链或其部分以及由种系基因V κ 1-5编码的可变轻链或其部分。“种系蛋白对”包括如在实施例5中所制备的构建体,所述构建体包括a)对于VH 前导序列(掺入如图3所示的NheI RE位点的修饰的phoA);种系FRl、 CDRU FR2、CDR2和FR3 (掺入如图3所示的BssHIIRE位点);如在Ewert S.等人,J. Mol. Biol. (2003)325,531-553 中所用的 4D5 抗体的 CDR-H3 (WG⑶GFYAMDY);以及 JH4FR4(掺入如图3所示的Xhol/Sall RE位点);b)对于Vk 前导序列(掺入如图3所示的NdeI RE位点的ompA);种系FR1、CDR1、 FR2、CDR2和FR3(掺入如图3所示的BbsI RE位点);根据Ewert S.等人,J. Mol. Biol. (2003)325,531-553 的 κ 样 CDR-L3 (QQHYTTPPT);以及 JklFR4 (掺入如图 3 所示的 KpnI RE 位点);和c)对于VX 前导序列(掺入如图3所示的NdeI RE位点的ompA);种系FR1、CDR1、 FR2、CDR2和FR3(掺入如图3所示的BbsI RE位点);根据Ewert S.等人,J. Mol. Biol. (2003) 325,531-553 的 λ 样 CDR-L3 (QSYDSSLSGVV);以及 J12/3FR4 (掺入如图 3所示的KpnI RE位点)。这些构建体中的每一种被合成、表达并且如实施例6和7所述作为Fab和IgG测试了以下功能特性a)在噬菌体产生和噬菌体ELISA之后以Fab形式的相对展示;b)在大肠杆菌中的Fab产生、大肠杆菌细胞裂解和产生的Fab的ELISA检测后的相对Fab表达水平; c)在大肠杆菌中的Fab产生、大肠杆菌细胞裂解和升高温度下孵育后非变性Fab的ELISA 检测后Fab的温度稳定性;d)在牛/小鼠血清中孵育后借助非变性Fab的ELISA检测的来自大肠杆菌裂解物的Fab的牛/小鼠血清稳定性;e)在哺乳动物细胞中产生IgGl和ELISA 检测细胞培养上清液中的分泌IgGl后的相对的人IgGl表达水平;和f)在牛/小鼠血清中孵育后借助非变性Fab的ELISA检测的人IgGl的牛血清稳定性。JigtJft^S(substantially germline protein sequence) 示由种系基因编码的但在氨基酸序列中具有点突变的氨基酸序列,所述点突变诸如,为了去除不期望的半胱氨酸,或引入期望的限制酶切位点例如Bbsl,或产生于合成、扩增或克隆中的错误。“种系基因”是编码在以下出版物中所公开的抗体或其功能片段的种系基因的核酸,对于 VH :Tomlinson 等人,(1992),“The Repertoire of Human Germline Vh Sequences Reveals about Fifty Groups of Vh Segments with Different Hypervariable Loop (人种系Vh序列的组库揭示大约五十组具有不同超变环的Vh区段)”J. Mol.Biol. 227,776-798 ;Matsuda 等人(1998) ,“The complete nucleotide sequence of the human immunoglobulin heavy chain variable region locus( A 免疫球蛋白重链可变区基因座的完整核苷酸序列)”J Exp Med 188(11) 2151-62 ; 禾口 LeFranc MP(2001) "Nomenclature of the human immunoglobulin heavy (IGH) genes (人免疫球蛋白重链(IGH)基因的命名).” Exp Clin Immunogenet. 18(2) :100_16 ; 对于 νλ :Kawasaki 等人’ (1997) “One-Megabase Sequence Analysis of the Human immunoglobulin lambda Gene Locus(人免疫球蛋白λ基因座的一兆碱基序列分 |/f ) “ Genome Research 7(3) 250-61 ;Frippiat ^A, (1995) “ Organization of the human immunoglobulin lambda light-chain locus on chromosome 22qll.2(在染色体22qll.2上的人免疫球蛋白λ轻链基因座的组织)"Hum. Mol. Genet.,4,983-991 ;和LeFranc MP(2001)“ Nomenclature ofthe human immunoglobulin lambda (IGL) genes(A 免疫球蛋白λ (IGL)基因的命名)· Exp Clin Immunogenet. ; 18 :242_254 ;以及对于V κ SchableiB Zachau (1993), "The variable genes of the human immunoglobulin kappa locus (人免疫球蛋白κ基因座的可变基因),”Biol.Chem Hoppe Seyler. 374(11) 1001-22 ;Brensing_Kiippers 等人(1997), "The human immunoglobulin kappa locus on yeast artificial chromosomes (YACs)(在酵母人工染色体(YAC)上的人免疫球蛋白κ 基因座)”Gene. 191(2) 173-81 ;Kawasaki 等人(2001),‘‘Evolutionary dynamics of the human immunoglobulin kappa locus and thegermline repertoire of the Vkappa genes(人免疫球蛋白κ基因座和Vk基因的种系组库的进化动态)”Eur J Immunol 31(4) 1017-28 ;禾口 Lefranc MP(2001) “ Nomenclature of the human immunoglobulin kappa(IGK) genes (人免疫球蛋白 κ (IGK)基因的命名)〃 Exp Clin Immunogenet.,18, 161-174,由此通过引用将它们全部以整体并入。可变重链的JH4、可变κ轻链的Jk 1、以及可变λ轻链区的JX 2/3的序列在以下出版物中描述:Scaviner 等人,(1999),“ Protein displays ofthe human immunoglobulin heavy, kappa and lambda variable and j oining regions ( 球蛋白重链、κ和λ链可变区和接合区的蛋白展示)“Exp Clin Immunogenet. 16 (4) 234-40 ;X^tT JH :Ravetch ^X, (1981), "Structure of the human immunoglobulin mu locus characterization of embryonic and rearrangedj and D genes.(入;^ 求胃白mu基因座的结构胚性的和重排的J和D基因的表征)”Cell 27 (3pt 2) :583_91 ;对于 JK :Hieter 等人(1982), "Evolution of human immunoglobulin kappa J region genes. (人免疫球蛋白1^了区基因的进化)”了 Biol Chem 257(3) :1516_22 ;对于JL :Kawasaki等人’ (1997) “One-Megabase Sequence Analysis of the Human immunoglobulin lambda Gene Locus(人免疫球蛋白λ基因座的一兆碱基序列分析)”Genome Research 7(3) 250-61,通过引用它们全部以整体并入本文。JH4序列是(YFDYWGQGTLVTVSS) Jk 1序列是 (WTFGQGTKVEIK);并且 J λ 2/3 序列是(WFGGGTKLTVL)。术语“依赖于位置的氨基酸利用”是指特定氨基酸序列在多肽中的给定位置出现的可能性。在本发明中,对于通过个体种系基因分类的重排氨基酸序列确定了依赖于位置的氨基酸利用。这使得CDR在其天然的种系环境中的个性、精确的设计成为可能。术语“可变结构域/区(VH或VL) ”表示包括基本上由分别组成轻链(包括κ和 λ )和重链免疫球蛋白基因座的VL (包括Vk和V λ )、VH、JL (包括Jk和J λ )以及JH核酸中的任何一个编码的一个或多个Ig结构域的免疫球蛋白的区域。轻链或重链可变区(VL和 VH)由散布三个称为“互补决定区”或“⑶R”的高变区的“构架”区或“FR”区组成。构架区和 CDR 的范围已被精确地定义(见 Kabat,1991,J. Immunol.,147,915-920. ;Chothia & Lesk, 1987,J. Mol.Biol. 196 :901_917 ;Chothia 等人,1989,Nature 342 :877_883 ;Al-Lazikani 等人,1997,J. Mol. Biol. 273 :927_948)。抗体的构架区即组分轻链和重链的联合构架区用来安置和对齐⑶R,⑶R主要负责与抗原结合。术语“构架区”表示被Kabat等人(1991)定义为充当可变结构域的抗原结合环的支架的这种可变结构域的一部分的抗体可变结构域。构架区的实例包括可变重链或可变轻链的 FR1、FR2、FR3 和 FR4。
20
术语“互补决定区”或“⑶R”表示由Kabat等人(1991)定义的抗体的抗原结合环。 抗体Fv片段的两个可变结构域的每一个包含三个⑶R。互补决定区包括可变重链或可变轻链的 CDR1、CDR2 和 CDR3。“优选的VH和VL类对”表示那些在免疫组库中优选的VH和VL类对,所述免疫组库例如根据标准阈值组的人免疫组库。例如,丰富的VH-VL对;或具有有利的生物物理特性如低免疫原性、稳定性的VH-VL对;容易被展示和/或表达的VH-VL对;或者以在约2500个人B细胞的样品中至少0. 05%的浓度出现的VH-VL对。在人免疫组库中优选的VH和VL类对可具有胜过其他VH和VL类对的优选的特征。术语“幼稚”表示未经历抗原的。术语“幼稚B细胞”表示如下B细胞其中编码抗体或其功能片段的核酸没有经历体细胞超突变,因此被认为包括种系基因的核酸,存在V(D) J基因区段重排。被认为幼稚的 B细胞群是未成熟的B细胞、新的迁移B细胞和成熟的幼稚B细胞。术语“幼稚的人免疫组库(nai've human immune r印ertoire),,表示分离自人免疫系统的未经历抗原的B细胞的核酸的组库,其中编码抗体或其功能片段的核酸没有经历体细胞超突变,因此被认为包括种系基因的核酸,存在V(D) J基因区段重排。组库可以是个体或群体的组库。只要获得足够的B细胞,本发明顺从于从单个个体确定免疫组库。优选地,从多个个体获得免疫组库以避免样品偏倚。术语“人免疫组库(human immune repertoire) ”表示分离自人免疫系统的B细胞的核酸的组库。组库可以是个体或群体的组库,并且可以来自于幼稚B细胞和/或经历抗原的B细胞。只要获得足够的B细胞,本发明顺从于从单个个体确定免疫组库。优选地,从多个个体获得免疫组库以避免样品偏倚。将“抗原”和“免疫原”定义为被抗体特异性结合的任何分子。术语“对免疫原特异的”表示在抗体与相应分子之间的特异性关联。如本文所用的“⑶R多样化”或“多样的⑶R”是通过任何适合的方法对⑶R的氨基酸序列的修饰。CDR—般已知是免疫原结合区,因此具有包含代表CDR中的较大多样性的成员的集合提高了集合将包括对于任何免疫原具有特异性和最佳特性的抗体或其片段的概率。通过改变一个或多个CDR的氨基酸组成而获得多样性。这可以通过本领域技术人员已知的任何方法达成,包括本文所述的方法。“编码抗体或其片段的合成核酸的集合”表示编码该抗体或其片段的所有核酸是合成的,但不是指可与这些合成的核酸可操作地连接的其他核酸,如载体。在分子生物学上下文中使用的术语术语“合成”或“合成了”表示基因合成,其中核酸序列被合成为物理DNA,包括多核苷酸。标准的DNA合成包括单核苷酸合成,其中产生单链寡核苷酸,然后利用PCR样组件连接重叠的寡核苷酸。公司如 Sloning (Puchheim, Germany) >Geneart (Regensburg, Germany)、 DNA2. 0 (Menlo Park, CAUSA)和 Genscript (Piscataway,NJ USA)提供了基因合成技术。例如,Sloning利用一组事先制备的双链三联体核苷酸,这些核苷酸退火并随后被连接。术语“合成的”描述了通过合成制备或被合成的分子。术语“集合(collection)”或“文库”表示至少两个成员。术语“成员”包括但不限于编码抗体或其片段的核酸或者抗体或其片段本身。
术语“宿主”是指任何宿主,包括哺乳动物,如人、鼠类或啮齿动物,小鼠、大鼠、松鼠、花栗鼠、囊地鼠、豪猪、河狸、仓鼠、沙土鼠、豚鼠、兔、狗、猫、牛或马。术语“核酸”在本文可与术语“多核苷酸”互换使用,并且是指处于单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及其聚合物。该术语涵盖包含已知的核苷酸类似物或修饰的骨架残基或连接的核酸,这些核酸是合成的、天然存在的和非天然存在的,具有与参考核酸相似的结合特性。这些类似物的实例包括但不限于硫代磷酸酯、氨基磷酸酯、甲基膦酸酯、手性甲基膦酸酯、2-0-甲基核糖核苷酸以及肽-核酸(PNA)。除非另外指明,否则特定的核酸序列还隐含地涵盖其保守修饰的变体(例如,简并密码子取代)和互补序列以及明确指出的序列。具体地说,如以下所述,简并密码子取代可通过如下方式达成产生其中一个或多个选择的(或全部的)密码子的第三个位置被混合碱基和/或脱氧肌苷残基取代的序列(Batzer等人,Nucleic Acid Res. 19 :5081,1991 ; Ohtsuka 等人,J. Biol. Chem. 260 :2605_2608,1985 ;和 Rossolini 等人,Mol. Cell. Probes 8 91-98,1994)。术语“可操作地连接”是指在两个或更多个多核苷酸(例如,DNA)区段之间的功能关系。通常,它是指转录调节序列与被转录的序列的功能关系。例如,如果启动子或增强子序列在适当的宿主细胞或其他表达系统中刺激或调控编码序列的转录,那么启动子或增强子序列与该编码序列可操作地连接。一般来说,与被转录的序列可操作地连接的启动子转录调节序列在物理上与该被转录的序列邻接,即它们是顺式作用的。然而,一些转录调节序列如增强子不必与它们增强转录的编码序列物理上邻接或位置上很靠近。如本文所用,术语“密码子优化的”或“密码子优化”表示已利用在生产细胞或生物中优选的密码子改变核苷酸序列来编码氨基酸序列。优化的核苷酸序列被工程化以保留最初由初始核苷酸序列编码的氨基酸序列。此外,可将核苷酸序列设计成完全或尽可能不含抑制性基序、剪接位点、mRNA不稳定性基序和不期望的限制酶切位点。还可以优化核苷酸序列的GC含量、期望的限制酶切位点以及其他参数。可优化序列在不同宿主中的表达, 包括细菌细胞或真核细胞。由优化的核苷酸序列编码的氨基酸序列也被称为优化的。术语“氨基酸”是指天然存在的氨基酸和合成的氨基酸,以及以类似于天然存在的氨基酸的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的氨基酸,以及后来被修饰的那些氨基酸,例如,羟基脯氨酸、Y-羧基谷氨酸和0-磷酸丝氨酸。氨基酸类似物是指具有与天然存在的氨基酸相同的基本化学结构(即,与氢、羧基、氨基和R基结合的α碳)的化合物,例如,高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基硫鐺(methionine methyl sulfonium)。这些类似物具有修饰的R基(例如,正亮氨酸)或修饰的肽骨架,但保留了与天然存在的氨基酸相同的基本化学结构。氨基酸模拟物是指具有与氨基酸的一般化学结构不同的结构但以类似于天然存在的氨基酸的方式起作用的化学化合物。术语“多肽”和“蛋白”在本文可互换使用,是指氨基酸残基的聚合物。这些术语适用于其中一个或更多个氨基酸残基是对应的天然存在的氨基酸的人工化学模拟物的氨基酸聚合物,并适用于天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。除非另外指明,否则特定的多肽序列还隐含地涵盖其保守修饰的变体。术语“保守修饰的变体”适用于氨基酸序列和核酸序列二者。就特定的核酸序列来说,保守修饰的变体是指那些编码相同或基本上相同的氨基酸序列的核酸,或者在核酸不编码氨基酸序列的情况下是指基本相同的序列。因为遗传密码的简并性,大量功能相同的核酸编码任何给定蛋白。例如,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此, 在丙氨酸被密码子指定的每个位置,该密码子可被改变为所述的任何对应密码子而不改变所编码的多肽。这种核酸变异是“沉默变异”,是一类保守修饰变异。本文编码多肽的每个核酸序列还描述了该核酸的每种可能的沉默变异。技术人员将认识到,核酸中的每个密码子(除了通常是甲硫氨酸唯一密码子的AUG和通常是色氨酸唯一密码子的TGG之外)可被修饰产生功能相同的分子。因此,编码多肽的核酸的每种沉默变异隐含在每个描述的序列中。对于多肽序列来说,“保守修饰的变体”包括导致氨基酸被化学上相似的氨基酸取代的对多肽序列的个体取代、缺失或添加。提供功能相似的氨基酸的保守取代表是本领域公知的。这些保守修饰的变体不包括但不排除本发明的多态变体、种间同源物和等位基因。 以下八组包括互相为保守取代的氨基酸1)丙氨酸(A)、甘氨酸(G) ;2)天冬氨酸(D)、谷氨酸(E) ;3)天冬酰胺(N)、谷氨酰胺(Q) ;4)精氨酸(R)、赖氨酸(K) ;5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V) ;6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W) ;7)丝氨酸(S)、 苏氨酸(T);和8)半胱氨酸(C)、甲硫氨酸(M)(见,例如Creighton,Proteins (1984))。在一些实施方案中,术语“保守序列修饰”用来指如下氨基酸修饰不显著影响或改变包含该氨基酸序列的抗体的结合特征的氨基酸修饰。术语“相同的”或“同一性”百分比在两个或更多个核酸或多肽序列的上下文中是指相同的两条或更多条序列或子序列。如果两条序列在比较窗口或者在使用以下序列比较算法之一或通过人工比对和肉眼检查所测量的指定区域比较和比对最大对应性时具有指定百分比的相同氨基酸残基或核苷酸(即,在限定的区域或者当不限定时整个序列的60% 同一性、任选65%、70%、75%、80%、85%、90%、95%或99%同一性),那么这两条序列是 “基本上相同的”。任选地,同一性在长度为至少约50个核苷酸(或10个氨基酸)的区域, 或更优选在长度为100到500或1000或更多个核苷酸(或20、50、200或更多个氨基酸) 的区域存在。对于序列比较,通常一条序列用作与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入计算机中,指定子序列坐标,如果必要的话, 指定序列算法程序参数。可使用缺省的程序参数,或者可指定可选的参数。然后序列比较算法基于程序参数计算测试序列相对于参考序列的序列同一性百分比。如本文所用的“比较窗口”包括参考选自由20到600、通常约50到约200、更通常约100到约150组成的组的任何一个邻接位置数目的区段,在比较窗口中在序列与参考序列被最佳地比对后可将该序列与参考序列的相同数目的邻接位置进行比较。用于比较的序列比对方法是本领域公知的。用于比较的序列的最佳比对可通过如下方式进行例如, 通过 Smith 和 Waterman (1970) Adv. App 1. Math. 2 :482c 的局部同源性算法,通过 Needleman 和 Wunsch,J. Mol. Biol. 48 :443,1970 的同源性比对算法,通过 Pearson 和 Lipman,Proc. Nat,1. Acad. Sci. USA 85 :2444,1988的相似性搜寻方法,通过这些算法的计算机实现(在 Wisconsin 遗传性软件包,Genetics Computer Group, 575Science Dr. , Madison, WI 中的GAP、BESTFIT、FASTA和TFASTA),或通过人工比对和肉眼检查(见,例如,Brent等人, Current Protocols in Molecular Biology (现代分子生物学实验技术),John Wiley&Sons,Inc. (2003))。适于确定序列同一性百分比和序列相似性百分比的算法的两个实例是分别被描述于 Altschul 等人,Nucl. Acids Res. 25 :3389_3402,1977 和 Altschul 等人,J. Mol. Biol. 215 =403-410,1990中的BLAST和BLAST 2. 0算法。用于执行BLAST分析的软件是通过美国国立生物技术信息中心公开可用的。这种算法包括首先通过识别问询序列中长度 W的短字(word)来识别高得分序列对(HSP),该高得分序列对当与数据库序列中的相同长度的字对齐时匹配或满足某个正值阈值得分Τ。T被称为相邻字得分阈值(neighborhood word score threshold) (Altschul等人,上述)。这些最初的相邻字命中(hit)充当用于启动搜索的种子以寻找包含它们的更长的HSP。字命中沿每条序列在两个方向上延伸直到累计的比对得分可被增加为止。对于核苷酸序列,使用参数M(对一对匹配残基的奖励得分;总是> 0)和N(对错配残基的处罚得分;总是< 0)计算累计得分。对于氨基酸序列,使用评分矩阵来计算累计得分。当发生以下情况时字命中在每个方向上的延伸停止累计比对得分从其所达到的最大值下降了量X ;由于一个或更多个负得分残基比对的累计,累计得分趋于零或零以下;或者到达任一条序列的末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列而言)使用字长(W) 11,期望(E)10,M = 5, N = -4以及两条链的比较作为缺省值。对于氨基酸序列,BLASTP程序使用字长(W)3,和期望(E) 10 以及 BL0SUM62 评分矩阵(参见 Henikoff 和 Henikoff,Proc. Natl. Acad. Sci. USA 89 10915,1989),比对(B) 50,期望(E) 10,M = 5,N = -4和两条链的比较作为缺省值。BLAST算法还进行两条序列之间的相似性的统计分析(见,例如,Kar 1 in和 Altschul,Proc. Natl. Acad. Sci. USA 90 :5873_5787,1993)。由 BLAST算法提供的一种相似性量度是最小和概率(P(N)),它提供了在两条核苷酸序列或氨基酸序列之间的匹配将偶然发生的概率的指示。例如,如果在测验核酸与参考核酸的比较中最小和概率小于大约0. 2、 更优选地小于大约0. 01、并且最优选地小于大约0. 001,那么认为该核酸与参考序列是相似的。两条氨基酸序列之间的同一性百分比还可以使用已被加入ALIGN程序(2. 0版) 中的 E. Meyers 和 W. Miller 的算法(Comput. Appl. Biosci.,4 :11_17,1988)确定,使用 PAMl20残基权重表、空位长度罚分12和空位罚分4。此外,两条氨基酸序列之间的同一性百分比可使用已被加入GCG软件包的GAP程序(在www. gcg. com可获得)中的Needleman 和 Wunsch(J. Mol. Biol. 48 444-453,1970)算法确定,使用 Blossom 62 矩阵或 PAM250 矩阵,以及空位权重(gap weight) 16、14、12、10、8、6 或 4,以及长度权重(length weight) U 2、3、4、5 或 6。除了以上指出的序列同一性百分比外,两条核酸序列或多肽基本上相同的另一个指征是由第一核酸编码的多肽与针对由第二核酸编码的多肽而产生的抗体有免疫交叉反应,如以下所述。因此,多肽通常与另一多肽基本上相同,例如,在这两条多肽差异仅为保守取代的情况下。两条核酸序列基本上相同的另一指征是这两个分子或它们的互补序列在严格条件下彼此杂交,如以下所述。两条核酸序列基本上相同的又另一个指征是可使用相同的引物来扩增该序列。术语“重组的宿主细胞”(或简称“宿主细胞”)是指重组表达载体已被引入其中的细胞。应理解这些术语不仅意指特定的受试细胞而且意指这种细胞的子代。因为某些修
24饰由于突变或环境影响可发生在随后的代中,所以这种子代事实上可与母本细胞不同,但是仍被包括在本文所用的术语“宿主细胞”的范围之内。典型的宿主细胞是原核的(如细菌的,包括但不限于大肠杆菌)或真核的(其包括酵母、哺乳动物细胞和更多)。术语“载体”意指如下多核苷酸分子所述多核苷酸分子能够运输与其连接的另一个多核苷酸。优选的载体是能够自主复制和/或表达与其连接的核酸的那些载体。能够指导与其可操作地连接的核酸的表达的载体在本文被称为“表达载体”。一种类型的载体是 “质粒”,是指附加的DNA区段可被连入其中的环状双链DNA环。另一种类型的载体是病毒载体,其中附加的DNA区段可被连入该病毒的基因组中。某些载体能够在它们被引入的宿主细胞中自主复制(例如,具有细菌的复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如,非附加型哺乳动物载体)可在引入宿主细胞中后被整合到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,某些载体能够指导与其可操作地连接的基因的表达。这些载体在本文称为“重组表达载体”(或简称“表达载体”)。一般来说,在重组DNA 技术中有实用性的表达载体通常处于质粒形式。在本说明书中,“质粒”和“载体”可被互换使用,因为质粒是最常用的载体形式。然而,本发明旨在包括具有同等功能的那些其他形式的表达载体,如病毒载体(例如,复制缺陷型逆转录病毒、腺病毒以及腺伴随病毒)。载体通常包括原核复制子,原核复制子可包括能够在细菌宿主细胞中指导编码VH 和/或VL的同源物的表达(转录和翻译)的原核启动子,所述细菌宿主细胞例如用编码VH 和/或VL的同源物转化的大肠杆菌(Escherichia coli)。启动子是允许RNA聚合酶的结合和转录发生的由DNA序列形成的表达控制元件。与细菌宿主相容的启动子序列通常被提供在包含用于插入DNA区段的便利限制酶切位点的质粒载体中。这些载体质粒的实例包括可商购的 PUC8、pUC9、pBR322 和 pBR329、pPL 以及 pKK223。“展示载体”包括具有指导重组DNA分子在宿主细胞中在染色体外复制和维持的能力的DNA序列,所述宿主细胞例如用重组DNA分子转化的细菌宿主细胞。这些DNA序列是本领域公知的。展示载体可以是例如起源于fd、M13或fl丝状噬菌体类别的噬菌体载体或噬菌粒载体。这些载体能够促进蛋白(包括,例如,结合蛋白或其片段)在丝状噬菌体表面上的展示。适合于在噬菌体、核糖体、DNA、细菌细胞或真核细胞(例如酵母或哺乳动物细胞)上展示的展示载体也是本领域公知的,例如,是病毒载体或编码嵌合蛋白的载体。“唯一的”限制酶切位点是在给定的核酸分子上只存在或出现一次的限制酶切位点ο集合及其生产和使用方法本公开内容使得可用于鉴定针对任何靶的治疗性抗体的抗体或其功能片段的集合成为可能,其中所述抗体在临床上可开发并且在患者中是安全且有效的。作为背景,发明人设想在人免疫组库中富含的可变重链和可变轻链种系基因对可能具有有利的生物物理特性,将导致更有效率的研发,提高得到的抗体在患者中的安全性和效力。每个B细胞编码一种抗体,并且每种抗体包含可变重链和可变轻链。可将抗体的可变重链和可变轻链中的每一个与种系基因序列比对以确定抗体的起源,意味着可变重链和可变轻链由哪些种系基因形成。因此,对于每种抗体而言,可以说,可变重链和可变轻链构成种系基因对,例如, VH3-23与VK1-5配对。这种有利的生物物理特性可包括a)以Fab形式的相对高的展示率;b)相对高的Fab表达水平;c) Fab的温度稳定性;d)Fab的牛/小鼠血清稳定性;e)相对高的人IgGl表达水平;和f)人IgGl的牛血清稳定性。为了证实种系基因对可能具有有利的生物物理特性的假设,第一步是鉴定在人免疫组库中表达的可变重链和可变轻链种系基因对。在一些方面,本发明包括产生合成抗体或其功能片段的集合的方法,所述方法包括获得包括人免疫组库中存在的可变重链和可变轻链种系基因对的数据的步骤。在一些实施方案中,数据是从提供可变重链和可变轻链种系基因对的公开可用的文献中获得。一般来说,在相关的公开可用的文献中,遵循以下方法从人供体中分离B细胞,分选B细胞以确定其发育或分化的阶段,产生并扩增代表编码来自每个B细胞的抗体的DNA的cDNA,对该cDNA测序,将编码可变重链和可变轻链的cDNA 与已知的种系基因序列比对,并确定来自每个B细胞的种系基因对。在一些实施方案中,数据是从人B细胞的采样和分离获得的,其包括与文献中使用的方法类似的方法。在这些方面,生产合成抗体或其功能片段的集合的方法包括获得包含存在于人免疫组库中的可变重链和可变轻链种系基因对的数据的步骤;其中该获得步骤还包括如下步骤aa)从样品中分离人B细胞;ab)从该B细胞产生cDNA ;ac) PCR扩增来自B细胞的cDNA ;ad)对PCR产物进行测序;和ae)鉴定PCR产物的种系基因。两个数据集提供了人免疫组库中存在的可变重链和可变轻链种系基因对。下一步,汇集、分析原始数据,并根据表达水平对存在于人免疫组库中的可变重链和可变轻链种系基因对进行分级。在这些方面,本发明包括产生抗体或其功能片段的集合的方法,所述方法包括鉴定在人免疫组库中被突出表达的可变重链和可变轻链种系基因对。在人免疫组库中被突出表达的种系基因对从这个数据很清楚的是,某些可变重链和可变轻链种系基因对比其他种系对更频繁地存在于人免疫组库中。因为这些突出的对预期具有优异的生物物理特性,所以本发明的方面包括源自在人免疫组库中突出的种系基因对的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区源自于在人免疫组库中突出的种系基因对。在其他方面,本发明包括含在人免疫组库中被突出表达的种系基因对的基本上的种系蛋白序列的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区包括在人免疫组库中被突出表达的种系基因对的基本上的种系蛋白序列。在其他方面,本发明包括含在人免疫组库中被突出表达的种系基因对的种系蛋白序列的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区包括在人免疫组库中被突出表达的种系基因对的种系蛋白序列。在一些方面,本发明包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括种系蛋白对的种系蛋白序列,其中所述种系基因在人免疫组库中被突出表达。在一些实施方案中,本发明包括合成抗体或其功能片段的集合,其中所述可变重链和可变轻链构架区基本上由在人免疫组库中被突出表达的种系基因对的种系蛋白序列组成。在一些实施方案中,抗体或其功能片段基本上由在人免疫组库中被突出表达的种系基因对组成,其中在一些实施方案中,一个或更多个⑶R基本上由在人免疫组库中被突出表达的种系基因对的种系蛋白序列组成。在一些实施方案中,本发明包括合成抗体或其功能片段的集合,其中所述可变重链和可变轻链构架区由在人免疫组库中被突出表达的种系基因对的种系蛋白序列组成。在一些实施方案中,抗体或其功能片段由在人免疫组库中被突出表达的种系蛋白对所编码的种系蛋白对组成,其中在一些实施方案中,一个或更多个 CDR基本上由在人免疫组库中被突出表达的种系基因对的种系蛋白序列组成。在一些实施方案中,这些集合的大多数或基本上全部的抗体或其功能片段包括在人免疫组库中被突出表达的种系基因对的种系蛋白序列。在一些实施方案中,在人免疫组库中丰富的或被突出表达的种系基因对以如下浓度表达在人免疫组库中至少0. 05%,在人免疫组库中至少0. 09% ;在人免疫组库中至少 0. 14% ;在人免疫组库中至少0. 19% ;在人免疫组库中至少0. 23% ;在人免疫组库中至少 0. 28% ;在人免疫组库中至少0. 33% ;在人免疫组库中至少0. 37% ;在人免疫组库中至少 0. 42% ;在人免疫组库中至少0. 47% ;在人免疫组库中至少0. 51% ;在人免疫组库中至少 0. 56% ;在人免疫组库中至少0. 61% ;在人免疫组库中至少0. 66% ;在人免疫组库中至少 0. 70% ;在人免疫组库中至少0. 84% ;在人免疫组库中至少0. 89% ;在人免疫组库中至少
0.94% ;在人免疫组库中至少1.03% ;在人免疫组库中至少1. 12% ;在人免疫组库中至少
1.17% ;或在人免疫组库中至少1. 26%。本发明的另外一方面是集合可用于鉴定针对任何免疫原的抗体或其功能片段的能力。根据CDR长度和在构象或规范结构上的多样性,认为产生具有在人免疫组库中被突出表达的至少两个可变重链和可变轻链种系蛋白对的集合将提供在该集合中的多样性,尤其是在该集合的抗体的互补决定区中的多样性。这容许本发明的集合可用于鉴定针对任何免疫原的抗体或其功能片段。因此,本发明的一些方面包括含抗体或其功能片段的集合, 所述抗体或其功能片段包含如下数目的选自人免疫组库的突出表达的种系蛋白对的不同的种系蛋白对至少两个不同的种系蛋白对;至少三个不同的种系蛋白对;至少四个不同的种系蛋白对;至少五个不同的种系蛋白对;至少六个不同的种系蛋白对;至少七个不同的种系蛋白对;至少八个不同的种系蛋白对;至少九个不同的种系蛋白对;至少十个不同的种系蛋白对;至少十一个不同的种系蛋白对;至少十二个不同的种系蛋白对;至少十三个不同的种系蛋白对;至少十四个不同的种系蛋白对;至少十五个不同的种系蛋白对;至少十六个不同的种系蛋白对;至少十七个不同的种系蛋白对;至少十八个不同的种系蛋白对;至少十九个不同的种系蛋白对;至少二十个不同的种系蛋白对;至少21个不同的种系蛋白对;至少22个不同的种系蛋白对;至少23个不同的种系蛋白对;至少24个不同的种系蛋白对;至少25个不同的种系蛋白对;至少26个不同的种系蛋白对;至少27个不同的种系蛋白对;至少28个不同的可变重链种系蛋白;至少29个不同的种系蛋白对序列;至少 30个不同的种系蛋白对;至少31个不同的种系蛋白对;至少32个不同的种系蛋白对;至少 33个不同的种系蛋白对;至少34个不同的种系蛋白对;至少35个不同的种系蛋白对;至少 36个不同的种系蛋白对;至少37个不同的种系蛋白对;至少38个不同的种系蛋白对;至少 39个不同的种系蛋白对;至少40个不同的种系蛋白对;至少41个不同的种系蛋白对;至少 42个不同的种系蛋白对;至少43个不同的种系蛋白对;至少44个不同的可变重链种系蛋白;至少45个不同的种系蛋白对序列;至少46个不同的种系蛋白对;至少47个不同的种系蛋白对;至少48个不同的种系蛋白对;至少49个不同的种系蛋白对;或至少50个不同的种系蛋白对。在一些实施方案中,集合包括含选自表18所示的种系基因对的一个或更多个种系蛋白对的可变重链和可变轻链构架区。在一些实施方案中,本发明包括分离的抗体或其功能片段,所述分离的抗体或其功能片段包含可变重链结构域和可变轻链结构域,所述可变重链结构域和可变轻链结构域包含FRl、CDRl、FR2、CDR2和FR3,所述FRl、CDRl、FR2、CDR2和FR3包含种系基因对的种系蛋白序列,其中所述种系基因对选自表18的种系基因对。在幼稚的人免疫组库中被突出表达的种系基因对还预料某些可变重链和可变轻链种系基因对可在幼稚B细胞(未经历抗原的)与经历抗原的B细胞中差异地表达,因此,基于采样的B细胞的发育或分化来分析数据。包含在幼稚B细胞中被差异表达的种系基因对的种系蛋白对的集合可能在选择针对任何免疫原的抗体或其功能片段上是有利的。因此,本发明的方面包括源自于在幼稚的人免疫组库中被突出表达的种系基因对的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区源自于在幼稚的人免疫组库中被突出表达的种系基因对。在其他方面,本发明包括含在幼稚的人免疫组库中被突出表达的种系基因对的基本上的种系蛋白序列的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区包括在幼稚的人免疫组库中被突出表达的种系基因对的基本上的种系蛋白序列。在其他方面,本发明包括含在幼稚的人免疫组库中被突出表达的种系基因对的种系蛋白序列的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区包括在幼稚的人免疫组库中被突出表达的种系基因对的种系蛋白序列。 在一些方面,本发明包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合, 其中所述构架区包括种系蛋白序列,其中所述种系蛋白序列包括可变重链和可变轻链种系蛋白对,其中所述种系蛋白对由在幼稚的人免疫组库中被突出表达的种系基因对编码。在一些实施方案中,本发明包括合成抗体或其功能片段的集合,其中所述可变重链和可变轻链构架区基本上由在幼稚的人免疫组库中被突出表达的种系基因对的种系蛋白序列组成。在一些实施方案中,抗体或其功能片段基本上由如下种系蛋白对组成所述种系蛋白对由在幼稚的人免疫组库中被突出表达的种系基因对编码。在一些实施方案中,本发明包括合成抗体或其功能片段的集合,其中所述可变重链和可变轻链构架区由在幼稚的人免疫组库中被突出表达的种系基因对的种系蛋白序列组成。在一些实施方案中,抗体或其功能片段由如下种系蛋白对组成所述种系蛋白对由在幼稚的人免疫组库中被突出表达的种系基因对编码。在一些实施方案中,这些集合的大多数或基本上全部的抗体或其功能片段包括在幼稚的人免疫组库中被突出表达的种系基因对的种系蛋白序列。在一些实施方案中,在幼稚的人免疫组库中丰富的或被突出表达的种系基因对以如下浓度表达在幼稚的人免疫组库中至少0. 07%,在幼稚的人免疫组库中至少0. 15% ; 在幼稚的人免疫组库中至少0. 22% ;在幼稚的人免疫组库中至少0. 30% ;在幼稚的人免疫组库中至少0. 37% ;在幼稚的人免疫组库中至少0. 45% ;在幼稚的人免疫组库中至少 0. 52% ;在幼稚的人免疫组库中至少0. 59% ;在幼稚的人免疫组库中至少0. 67% ;在幼稚的人免疫组库中至少0. 74% ;在幼稚的人免疫组库中至少0. 82% ;在幼稚的人免疫组库中至少0. 89% ;在幼稚的人免疫组库中至少0. 97% ;在幼稚的人免疫组库中至少1. 19% ;或在幼稚的人免疫组库中至少1. 56%。
本发明的另外一方面是集合可用于鉴定针对任何免疫原的抗体或其功能片段的能力。根据CDR长度和在构象或规范结构上的多样性,认为产生具有在幼稚的人免疫组库中被突出表达的种系基因对所编码的至少两个可变重链和可变轻链种系蛋白对的集合将提供在该集合中的多样性,尤其是在该集合的抗体的互补决定区中的多样性。这容许本发明的集合可用于鉴定针对任何免疫原的抗体或其功能片段。因此,本发明的一些方面包括含抗体或其功能片段的集合,所述抗体或其功能片段包含如下数目的不同的种系蛋白对: 至少两个不同的种系蛋白对;至少三个不同的种系蛋白对;至少四个不同的种系蛋白对; 至少五个不同的种系蛋白对;至少六个不同的种系蛋白对;至少七个不同的种系蛋白对; 至少八个不同的种系蛋白对;至少九个不同的种系蛋白对;至少十个不同的种系蛋白对; 至少十一个不同的种系蛋白对;至少十二个不同的种系蛋白对;至少十三个不同的种系蛋白对;至少十四个不同的种系蛋白对;至少十五个不同的种系蛋白对;至少十六个不同的种系蛋白对;至少十七个不同的种系蛋白对;至少十八个不同的种系蛋白对;至少十九个不同的种系蛋白对;至少二十个不同的种系蛋白对;至少21个不同的种系蛋白对;至少22 个不同的种系蛋白对;至少23个不同的种系蛋白对;至少24个不同的种系蛋白对;至少25 个不同的种系蛋白对;至少26个不同的种系蛋白对;至少27个不同的种系蛋白对;至少28 个不同的可变重链种系蛋白;至少29个不同的种系蛋白对序列;至少30个不同的种系蛋白对;至少31个不同的种系蛋白对;至少32个不同的种系蛋白对;至少33个不同的种系蛋白对;至少34个不同的种系蛋白对;至少35个不同的种系蛋白对;至少36个不同的种系蛋白对;至少37个不同的种系蛋白对;至少38个不同的种系蛋白对;至少39个不同的种系蛋白对;至少40个不同的种系蛋白对;至少41个不同的种系蛋白对;至少42个不同的种系蛋白对;至少43个不同的种系蛋白对;至少44个不同的可变重链种系蛋白;至少45 个不同的种系蛋白对序列;至少46个不同的种系蛋白对;至少47个不同的种系蛋白对;至少48个不同的种系蛋白对;至少49个不同的种系蛋白对;或至少50个不同的种系蛋白对。在一些实施方案中,集合包括含选自表19的种系基因对的一个或更多个种系蛋白对的可变重链和可变轻链构架区。在一些实施方案中,本发明包括分离的抗体或其功能片段,所述分离的抗体或其功能片段包含可变重链结构域和可变轻链结构域,所述可变重链结构域和可变轻链结构域包含FRl、CDRl、FR2、CDR2和FR3,所述FRl、CDRl、FR2、CDR2和FR3包含构成种系蛋白对的种系蛋白序列,其中所述种系蛋白对选自表19的种系基因对。在人免疫组库中被突出表达的可变重链、可变κ轻链、以及可变λ轻链种系基因下一步,分析汇集数据和附加的数据以确定在人免疫组库中可变重链、可变κ轻链、和可变λ轻链的种系基因表达。因此,本发明的额外方面包括产生抗体或其功能片段的集合的方法,所述方法包括鉴定在人免疫组库中被突出表达的可变重链、可变κ轻链、 和可变λ轻链种系基因的步骤。这样做的一个途径是基于可变重链、可变κ轻链、和可变 λ轻链种系基因的表达水平将它们排序。包含由在人免疫组库中被突出表达的种系基因编码的可变重链或可变轻链种系蛋白序列的抗体可能具有增强研发及在患者中的安全性和效力的有利生物物理特性。因此,本发明的方面包括源自于在人免疫组库中被突出表达的可变重链或可变轻链种系基因的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个
29或更多个构架区和/或互补决定区源自于在人免疫组库中被突出表达的可变重链或可变轻链种系基因。在其他方面,本发明包括含在人免疫组库中被突出表达的可变重链或可变轻链种系基因的基本上的种系蛋白序列的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区包含在幼稚的人免疫组库中被突出表达的可变重链或可变轻链种系基因的基本上的种系蛋白序列。在其他方面,本发明包括含在人免疫组库中被突出表达的可变重链或可变轻链种系基因的种系蛋白序列的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区包含在人免疫组库中被突出表达的可变重链或可变轻链种系基因的种系蛋白序列。在一些方面,本发明包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括种系蛋白序列,其中所述种系蛋白序列由在人免疫组库中被突出表达的可变重链或可变轻链种系基因编码。在一些实施方案中,本发明包括合成抗体或其功能片段的集合,其中所述可变重链和可变轻链构架区基本上由在人免疫组库中被突出表达的可变重链或可变轻链种系基因的种系蛋白序列组成。在一些实施方案中,抗体或其功能片段基本上由如下可变重链或可变轻链种系蛋白序列组成所述种系蛋白序列由在幼稚的人免疫组库中被突出表达的种系基因编码。在一些实施方案中,本发明包括合成抗体或其功能片段的集合,其中所述可变重链和可变轻链构架区由在人免疫组库中被突出表达的可变重链或可变轻链种系基因的种系蛋白序列组成。在一些实施方案中,抗体或其功能片段由如下可变重链或可变轻链种系蛋白序列组成所述种系蛋白序列由在人免疫组库中被突出表达的种系基因编码。在一些实施方案中,这些集合的大多数或基本上全部的抗体或其功能片段包括在幼稚的人免疫组库中被突出表达的种系基因编码的种系蛋白序列。在一些实施方案中,在人免疫组库中丰富的或被突出表达的可变重链种系基因以如下浓度表达在人免疫组库中至少0. ;在人免疫组库中至少0.2% ;在人免疫组库中至少0. 3% ;在人免疫组库中至少0. 4% ;在人免疫组库中至少0. 5% ;在人免疫组库中至少0. 6% ;在人免疫组库中至少1. 0% ;在人免疫组库中至少1. 6% ;在人免疫组库中至少2.1% ;在人免疫组库中至少2.2% ;在人免疫组库中至少2.6% ;在人免疫组库中至少2. 7% ;在人免疫组库中至少3.0% ;在人免疫组库中至少3.2% ;在人免疫组库中至少3. 3% ;在人免疫组库中至少4.0% ;在人免疫组库中至少4. ;在人免疫组库中至少4. 5% ;在人免疫组库中至少4. 6% ;在人免疫组库中至少5. 3% ;在人免疫组库中至少 5.8% ;或在人免疫组库中至少6. 8% ;在人免疫组库中至少7.6% ;在人免疫组库中至少 8.0% ;或在人免疫组库中至少10.6%。在一些实施方案中,在人免疫组库中丰富的或被突出表达的可变κ轻链种系基因以如下浓度表达在人免疫组库中至少0. 1%,在人免疫组库中至少0.2% ;在人免疫组库中至少0. 3% ;在人免疫组库中至少0. 4% ;在人免疫组库中至少0. 5% ;在人免疫组库中至少0.7% ;在人免疫组库中至少1.0% ;在人免疫组库中至少1. 1% ;在人免疫组库中至少1. 3% ;在人免疫组库中至少1. 9% ;在人免疫组库中至少2. 2% ;在人免疫组库中至少2. 4% ;在人免疫组库中至少2. 6% ;在人免疫组库中至少4. 6% ;在人免疫组库中至少6. 0% ;在人免疫组库中至少7. 6% ;在人免疫组库中至少8. 5% ;在人免疫组库中至少 11. 1% ;在人免疫组库中至少11. 2% ;在人免疫组库中至少14. 2% ;或在人免疫组库中至少 16. 2%。在一些实施方案中,在人免疫组库中丰富的或被突出表达的可变λ轻链种系基因以如下浓度表达在人免疫组库中至少0. 1%,在人免疫组库中至少0. 3% ;在人免疫组库中至少0. 5% ;在人免疫组库中至少0. 6% ;在人免疫组库中至少1. 0% ;在人免疫组库中至少1. 2% ;在人免疫组库中至少1. 5% ;在人免疫组库中至少1. 7% ;在人免疫组库中至少4. 5% ;在人免疫组库中至少5. 1% ;在人免疫组库中至少5. 3% ;在人免疫组库中至少 6.5% ;在人免疫组库中至少8. 1% ;在人免疫组库中至少10.0% ;或在人免疫组库中至少 11. 3% ;或在人免疫组库中至少18. 1%。本发明的另外一方面是集合可用于鉴定针对任何免疫原的抗体或其功能片段的能力。认为产生具有在人免疫组库中被突出表达的一个或更多个可变重链、可变κ轻链和可变λ轻链种系基因的集合将产生在该集合中的多样性,尤其是在CDR长度和在构象或规范结构上的多样性,由此使得该集合可用于鉴定针对任何免疫原的抗体或其功能片段。本发明的实施方案包括含抗体或其功能片段的集合,所述抗体或其功能片段包含如下数目的不同的可变重链种系蛋白序列至少两种不同的可变重链种系蛋白序列;至少三种不同的可变重链种系蛋白序列;至少四种不同的可变重链种系蛋白序列;至少五种不同的可变重链种系蛋白序列;至少六种不同的可变重链种系蛋白序列;至少七种不同的可变重链种系蛋白序列;至少八种不同的可变重链种系蛋白序列;至少九种不同的可变重链种系蛋白序列;至少十种不同的可变重链种系蛋白序列;至少十一种不同的可变重链种系蛋白序列; 至少十二种不同的可变重链种系蛋白序列;至少十三种不同的可变重链种系蛋白序列;至少十四种不同的可变重链种系蛋白序列;至少十五种不同的可变重链种系蛋白序列;至少十六种不同的可变重链种系蛋白序列;至少十七种不同的可变重链种系蛋白序列;至少十八种不同的可变重链种系蛋白序列;至少十九种不同的可变重链种系蛋白序列;至少二十种不同的可变重链种系蛋白序列;至少21种不同的可变重链种系蛋白序列;至少22 种不同的可变重链种系蛋白序列;至少23种不同的可变重链种系蛋白序列;至少24种不同的可变重链种系蛋白序列;至少25种不同的可变重链种系蛋白序列;至少26种不同的可变重链种系蛋白序列;至少27种不同的可变重链种系蛋白序列;至少28种不同的可变重链种系蛋白;至少29种不同的可变重链种系蛋白序列;至少30种不同的可变重链种系蛋白序列;至少31种不同的可变重链种系蛋白序列;至少32种不同的可变重链种系蛋白序列;至少33种不同的可变重链种系蛋白序列;至少34种不同的可变重链种系蛋白序列; 至少35种不同的可变重链种系蛋白序列;至少36种不同的可变重链种系蛋白序列;至少 37种不同的可变重链种系蛋白序列;至少38种不同的可变重链种系蛋白序列;至少39种不同的可变重链种系蛋白序列;至少40种不同的可变重链种系蛋白序列;至少41种不同的可变重链种系蛋白序列;至少42种不同的可变重链种系蛋白序列;至少43种不同的可变重链种系蛋白序列;至少44种不同的可变重链种系蛋白;至少45种不同的可变重链种系蛋白序列;至少46种不同的可变重链种系蛋白序列;至少47种不同的可变重链种系蛋白序列;至少48种不同的可变重链种系蛋白序列;至少49种不同的可变重链种系蛋白序列。本发明的实施方案包括含抗体或其功能片段的集合,所述抗体或其功能片段包含如下数目的不同的可变κ轻链种系蛋白序列至少两种可变κ轻链种系蛋白序列;至少三种不同的可变κ轻链种系蛋白序列;至少四种不同的可变κ轻链种系蛋白序列;至少五种不同的可变κ轻链种系蛋白序列;至少六种不同的可变κ轻链种系蛋白序列;至少七种不同的可变κ轻链种系蛋白序列;至少八种不同的可变κ轻链种系蛋白序列;至少九种不同的可变κ轻链种系蛋白序列;至少十种不同的可变κ轻链种系蛋白序列;至少十一种不同的可变κ轻链种系蛋白序列;至少十二种不同的可变κ轻链种系蛋白序列; 至少十三种不同的可变κ轻链种系蛋白序列;至少十四种不同的可变κ轻链种系蛋白序列;至少十五种不同的可变κ轻链种系蛋白序列;至少十六种不同的可变κ轻链种系蛋白序列;至少十七种不同的可变K轻链种系蛋白序列;至少十八种不同的可变K轻链种系蛋白序列;至少十九种不同的可变K轻链种系蛋白序列;至少二十种不同的可变K轻链种系蛋白序列;至少21种不同的可变K轻链种系蛋白序列;至少22种不同的可变K 轻链种系蛋白序列;至少23种不同的可变κ轻链种系蛋白序列;至少24种不同的可变κ 轻链种系蛋白序列;至少25种不同的可变κ轻链种系蛋白序列;至少26种不同的可变κ 轻链种系蛋白序列;至少27种不同的可变κ轻链种系蛋白序列;至少28种不同的可变κ 轻链种系蛋白;至少29种不同的可变κ轻链种系蛋白序列;至少30种不同的可变κ轻链种系蛋白序列;至少31种不同的可变κ轻链种系蛋白序列;至少32种不同的可变κ轻链种系蛋白序列;至少33种不同的可变κ轻链种系蛋白序列;至少34种不同的可变κ轻链种系蛋白序列;至少35种不同的可变κ轻链种系蛋白序列。本发明的实施方案包括含抗体或其功能片段的集合,所述抗体或其功能片段包含如下数目的不同的可变λ轻链种系蛋白序列至少两种不同的可变λ轻链种系蛋白序列; 至少三种不同的可变λ轻链种系蛋白序列;至少四种不同的可变λ轻链种系蛋白序列; 至少五种不同的可变λ轻链种系蛋白序列;至少六种不同的可变λ轻链种系蛋白序列; 至少七种不同的可变λ轻链种系蛋白序列;至少八种不同的可变λ轻链种系蛋白序列; 至少九种不同的可变λ轻链种系蛋白序列;至少十种不同的可变λ轻链种系蛋白序列; 至少十一种不同的可变λ轻链种系蛋白序列;至少十二种不同的可变λ轻链种系蛋白序列;至少十三种不同的可变λ轻链种系蛋白序列;至少十四种不同的可变λ轻链种系蛋白序列;至少十五种不同的可变λ轻链种系蛋白序列;至少十六种不同的可变λ轻链种系蛋白序列;至少十七种不同的可变λ轻链种系蛋白序列;至少十八种不同的可变λ轻链种系蛋白序列;至少十九种不同的可变λ轻链种系蛋白序列;至少二十种不同的可变λ 轻链种系蛋白序列;至少21种不同的可变λ轻链种系蛋白序列;至少22种不同的可变λ 轻链种系蛋白序列;至少23种不同的可变λ轻链种系蛋白序列;至少24种不同的可变λ 轻链种系蛋白序列;至少25种不同的可变λ轻链种系蛋白序列;至少26种不同的可变λ 轻链种系蛋白序列;至少27种不同的可变λ轻链种系蛋白序列;至少28种不同的可变λ 轻链种系蛋白;至少29种不同的可变λ轻链种系蛋白序列;至少30种不同的可变λ轻链种系蛋白序列;至少31种不同的可变λ轻链种系蛋白序列;至少32种不同的可变λ轻链种系蛋白序列;至少33种不同的可变λ轻链种系蛋白序列。在一些实施方案中,集合包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括选自由以下组成的组的一种或更多种可变重链种系蛋白序列 IGHV3-23 ;IGHV3-30 ;IGHV4-39 ;IGHV4-34 ; IGHV4-59 ; IGHV1-69 ;IGHV5-51 ; IGHV3-7 ; IGHV1-18 ; IGHV3-48 ; IGHV3-15 ; IGHV3-21 ; IGHV1-2 ; IGHV3-33 ; IGHV4-31 ; IGHV3-53 ;IGHV3-11 ; IGHV3-9 ; IGHV4-4 ; IGHV1-46 ; IGHV3-74 ; IGHV1-24 ; IGHV4-61 ; IGHV1-8 ; IGHV1-3 ; IGHV3-49 ; IGHV3-43 ; IGHV4-28 ; IGHV3-64 ;和 IGHV7-81。在一些实施方案中,集合包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括选自由以下组成的组的一种或更多种可变κ轻链种系蛋白序列 IGKV3-20 ;IGKV1-39/1D-39;IGKV1-5 ;IGKV3-15 ; IGKV4-1 ; IGKV3-11 ; IGKV2-28/2D-28; IGKV1-33/1D-33 ; IGKV2-30 ; IGKV1-9 ;IGKV1-17 ; IGKV1-27;IGKV1-8 ;IGKV1-16 ; IGKV1-6 ; IGKV1-12 ; IGKV2D-29 ; IGKV1-13 ; IGKV1D-8 ;和 IGKV2-24。在一些实施方案中,集合包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括选自由以下组成的组的一种或更多种可变λ轻链种系蛋白序列 JGLV2-14;IGLV1-40 ; IGLV1-44 ;IGLV1-51 ; IGLV2-23 ; IGLV3-21 ;IGLV1-47 ; IGLV3-1 ; IGLV2-11 ; IGLV2-8 ; IGLV6-57 ; IGLV3-25 ; IGLV7-46 ;IGLV1-36 ; IGLV7-43 ; IGLV9-49 ; IGLV4-69 ; IGLV2-18 ; IGLV3-10 ;禾口 IGLV3-27。在一些实施方案中,本发明包括含FR1、⑶Rl、FR2、⑶R2和FR3的分离的抗体或其功能片段,所述FRl、CDRl、FR2、CDR2和FR3包含选自由以下组成的组的种系蛋白序列IGHV3-23 ;IGHV3-30 ;IGHV4-39 ;IGHV4-34 ;IGHV4-59 ;IGHVl-69 IGHV5-51 ; IGHV3-7 ;IGHV1-18 ; IGHV3-48 ;IGHV3-15 ; IGHV3-21 ;IGHV1-2 ; IGHV3-33 IGHV4-31 ;IGHV3-53 ;IGHV3-11 ;IGHV3-9 ;IGHV4-4 ;IGHV1-46 ;IGHV3-74 ;IGHV1-24 IGHV4-61 ;IGHV1-8 ;IGHV1-3 ;IGHV3-49 ;IGHV3-43 ;IGHV4-28 ;IGHV3-64 ;IGHV7-81 IGKV3-20 ;IGKV1-39/1D-39 ;IGKV1-5 ; IGKV3-15 ; IGKV4-1 ; IGKV3-11 ; IGKV2-28/2D-28 IGKV1-33/1D-33 ;IGKV2-30;IGKV1-9 ;IGKV1-17 ; IGKV1-27 ; IGKV1-8 ;IGKV1-16 ; IGKV1-6 IGKV1-12 ; IGKV2D-29 ;IGKV1-13 ; IGKV1D-8;IGKV2-24 ; IGLV2-14 ; IGLV1-40 ; IGLV1-44 IGLV1-51 ; IGLV2-23 ;IGLV3-21 ;IGLV1-47 ; IGLV3-1 ; IGLV2-11 ; IGLV2-8 ; IGLV6-57 IGLV3-25;IGLV7-46 ; IGLV1-36 ; IGLV7-43 ; IGLV9-49 ; IGLV4-69 ; IGLV2-18 ; IGLV3-10 ;和 IGLV3-27。具有有利的生物物理特性的可变重链、可变κ轻链和可变λ轻链种系基因下一步,评估突出的可变重链、可变κ轻链和可变λ轻链种系蛋白序列以确定其与研发相关的生物物理特性。经由计算机模拟评估了可变重链、可变κ轻链和可变λ轻链种系蛋白序列的以下特性CDR长度;等电点(pi),优选的等电点是7. 5或以上,因为这应该提供在标准的PH 5.5到?!1 7配制缓冲液中的稳定性;在互补决定区中的翻译后修饰 (PTM)(具体地说,N连接的糖基化位点(NxS或NxT)或化学修饰如Asp切割(通常在DP), Asp异构化(DD,DG),脱酰胺作用(NS,NG)(这可在体内(在血清中)或在储存时在配制缓冲液中发生并且导致抗体结合的丧失);在CDR中甲硫氨酸的存在(当暴露于溶剂时可被氧化);未成对的半胱氨酸的存在(将与任何其他未成对的半胱氨酸形成二硫键,由此导致蛋白的交联和/或较低的表达水平);偏离种系;潜在的T细胞表位的存在;以及理论上的聚集倾向。在一些实施方案中,本发明包括产生合成抗体或其功能片段的集合的方法,所述方法包括如下步骤a)鉴定包含如下特性的可变重链和/或可变轻链种系蛋白序列i) 在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸; iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位;ν)中等或低的聚集倾向;和vi)至少7. 5的等电点;和b)产生含在a)中鉴定的可变重链和/或可变轻链种系基因序列的抗体或其功能片段的集合。本发明的方面包括源自于具有一种或多种如下特性的可变重链和/或可变轻链种系蛋白序列的合成抗体或其功能片段的集合i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸; iv) 一个或更少的潜在T细胞表位;ν)中等或低的聚集倾向;或vi)至少7. 5的等电点,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区源自于具有这些特性的可变重链和/或可变轻链种系蛋白序列。本发明的方面包括合成抗体或其功能片段的集合,所述合成抗体或其功能片段包括具有一种或多种如下特性的可变重链和/或可变轻链种系蛋白序列的基本上的种系蛋白序列i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位;ν)中等或低的聚集倾向;或vi)至少7. 5的等电点,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区包括来自具有这些特性的可变重链和/或可变轻链种系蛋白序列的基本上的种系蛋白序列。本发明的方面包括合成抗体或其功能片段的集合,所述合成抗体或其功能片段包括具有一种或多种如下特性的可变重链和/或可变轻链种系蛋白序列的种系蛋白序列i) 在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸; iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位;ν)中等或低的聚集倾向;或vi)至少7. 5的等电点,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区包括具有这些特性的可变重链和/或可变轻链种系蛋白的种系蛋白序列。本发明的方面包括合成抗体或其功能片段的集合,所述合成抗体或其功能片段包括不含未成对半胱氨酸的可变重链和/或可变轻链种系蛋白序列。本发明的方面包括含如下可变重链和/或可变轻链种系蛋白序列的合成抗体或其功能片段的集合所述可变重链和/或可变轻链种系蛋白序列包含互补决定区中的四个或更少的翻译后修饰;互补决定区中的三个或更少的翻译后修饰;互补决定区中的两个或更少的翻译后修饰;互补决定区中的一个或更少的翻译后修饰;或互补决定区中无翻译后修饰。本发明的方面包括源自于如下可变重链和/或可变轻链种系蛋白序列的合成抗体或其功能片段的集合所述可变重链和/或可变轻链种系蛋白序列包括至少7. 5的等电点;至少8. 0的等电点;至少8. 5的等电点;至少9的等电点;或至少9. 5的等电点。本发明的方面包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括具有一种或更多种如下特性的可变重链和/或可变轻链种系蛋白序列i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位;ν)中等或低的聚集倾向;或vi)至少7. 5的等电点。在一些实施方案中,合成抗体或其功能片段的集合包括具有至少两种如下特性的可变重链和/或可变轻链种系蛋白序列i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位;ν)中等或低的聚集倾向;或vi)至少7. 5的等电点。在一些实施方案中,合成抗体或其功能片段的集合包括具有至少四种如下特性的可变重链和/或可变轻链种系蛋白序列i)在互补决定区中四个或更少的翻译后修饰;ii) 在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位;ν)中等或低的聚集倾向;或vi)至少7. 5的等电点。在一些实施方案中,合成抗体或其功能片段的集合包括具有至少四种如下特性的可变重链和/或可变轻链种系蛋白序列i)在互补决定区中四个或更少的翻译后修饰;ii) 在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位;ν)中等或低的聚集倾向;或vi)至少7. 5的等电点。在一些实施方案中,合成抗体或其功能片段的集合包括具有至少五种如下特性的可变重链和/或可变轻链种系蛋白序列i)在互补决定区中四个或更少的翻译后修饰;ii) 在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位;ν)中等或低的聚集倾向;或vi)至少7. 5的等电点。在一些实施方案中,合成抗体或其功能片段的集合包括具有如下特性的可变重链和/或可变轻链种系蛋白序列i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位;ν)中等或低的聚集倾向;和vi)至少7. 5的等电点。在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区基本上由具有一种或更多种如下特性的可变重链和/或可变轻链种系蛋白序列组成i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位; ν)中等或低的聚集倾向;或vi)至少7. 5的等电点。在一些实施方案中,抗体或其功能片段基本上由具有一种或多种如下特性的可变重链和/或可变轻链种系蛋白序列组成i)在互补决定区中四个或更少的翻译后修饰;ii) 在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位;ν)中等或低的聚集倾向;或vi)至少7. 5的等电点。在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区由具有一种或更多种如下特性的可变重链和/或可变轻链种系蛋白序列组成i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位;ν)中等或低的聚集倾向;或vi)至少7. 5的等电点。在一些实施方案中,抗体或其功能片段由具有一种或多种如下特性的可变重链和 /或可变轻链种系蛋白序列组成i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位;ν)中等或低的聚集倾向;或vi)至少7. 5的等电点。在一些实施方案中,这些集合的大多数或基本上全部的抗体或其功能片段包括具有一种或多种如下特性的可变重链和/或可变轻链种系蛋白序列i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未
35成对半胱氨酸;iv) —个或更少的潜在T细胞表位;ν)中等或低的聚集倾向;或vi)至少 7.5的等电点。一些实施方案包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括种系蛋白序列,其中所述种系蛋白序列包含如下特性i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位;和ν)至少7. 5的等电点。一些实施方案包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括种系蛋白序列,其中所述种系蛋白序列包含如下特性i) 一个或更少的未成对半胱氨酸。一些实施方案包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括种系蛋白序列,其中所述种系蛋白序列包含如下特性i) 一个或更少的未成对半胱氨酸;ii) 一个或更少的潜在T细胞表位。一些实施方案包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括种系蛋白序列,其中所述种系蛋白序列包含如下特性i) 一个或更少的未成对半胱氨酸;ii) 一个或更少的潜在T细胞表位;和iii)至少7. 5的等电点。一些实施方案包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括种系蛋白序列,其中所述种系蛋白序列包含如下特性i)在互补决定区中两个或更少的甲硫氨酸;ii) 一个或更少的未成对半胱氨酸;iii) 一个或更少的潜在T细胞表位;和iv)至少7. 5的等电点。本发明的另外一方面是集合可用于鉴定针对任何免疫原的抗体或其功能片段的能力。认为产生具有一个或更多个可变重链、可变κ轻链和可变λ轻链种系蛋白序列的集合将产生在该集合中的多样性,尤其是在CDR长度和在构象或规范结构上的多样性,由此使得该集合可用于鉴定针对任何免疫原的抗体或其功能片段。本发明的实施方案包括含如下抗体或其功能片段的集合所述抗体或其功能片段包括如下数目的不同的可变重链种系蛋白序列至少两种不同的可变重链种系蛋白序列; 至少三种不同的可变重链种系蛋白序列;至少四种不同的可变重链种系蛋白序列;至少五种不同的可变重链种系蛋白序列;至少六种不同的可变重链种系蛋白序列;至少七种不同的可变重链种系蛋白序列;至少八种不同的可变重链种系蛋白序列;至少九种不同的可变重链种系蛋白序列;至少十种不同的可变重链种系蛋白序列;至少十一种不同的可变重链种系蛋白序列;至少十二种不同的可变重链种系蛋白序列;至少十三种不同的可变重链种系蛋白序列;至少十四种不同的可变重链种系蛋白序列;至少十五种不同的可变重链种系蛋白序列;至少十六种不同的可变重链种系蛋白序列;至少十七种不同的可变重链种系蛋白序列;至少十八种不同的可变重链种系蛋白序列;至少十九种不同的可变重链种系蛋白序列;或至少二十种不同的可变重链种系蛋白序列,所述不同的可变重链种系蛋白序列包含如下特性i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位;ν) 中等或低的聚集倾向;或vi)至少7. 5的等电点。本发明的实施方案包括含如下抗体或其功能片段的集合所述抗体或其功能片段包括如下数目的不同的可变κ轻链种系蛋白序列至少两种不同的可变κ轻链种系蛋白29/172 页
序列;至少三种不同的可变κ轻链种系蛋白序列;至少四种不同的可变κ轻链种系蛋白序列;至少五种不同的可变κ轻链种系蛋白序列;至少六种不同的可变κ轻链种系蛋白序列;至少七种不同的可变κ轻链种系蛋白序列;至少八种不同的可变κ轻链种系蛋白序列;至少九种不同的可变κ轻链种系蛋白序列;至少十种不同的可变κ轻链种系蛋白序列;至少十一种不同的可变κ轻链种系蛋白序列;至少十二种不同的可变κ轻链种系蛋白序列,所述不同的可变κ轻链种系蛋白序列包含如下特性i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位;ν)中等或低的聚集倾向;或vi)至少7. 5 的等电点。本发明的实施方案包括含如下抗体或其功能片段的集合所述抗体或其功能片段包括如下数目的不同的可变λ轻链种系蛋白序列至少两种不同的可变λ轻链种系蛋白序列;至少三种不同的可变λ轻链种系蛋白序列;至少四种不同的可变λ轻链种系蛋白序列;至少五种不同的可变λ轻链种系蛋白序列;至少六种不同的可变λ轻链种系蛋白序列;至少七种不同的可变λ轻链种系蛋白序列;至少八种不同的可变λ轻链种系蛋白序列,所述不同的可变λ轻链种系蛋白序列包含如下特性i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸;iv) —个或更少的潜在T细胞表位;ν)中等或低的聚集倾向;或vi)至少7. 5的等电点。在一些实施方案中,集合包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括选自由以下组成的组的一种或更多种可变重链种系蛋白序列IGHVl-2 ;IGHV1-18 ;IGHV1-69 ;IGHV1-46 ;IGHV3-7 ;IGHV3-11 ;IGHV3-15 ;IGHV3-21 ; IGHV3-23 ;IGHV3-30 ;IGHV3-33 ;IGHV3-48 ;IGHV3-53 ;IGHV3-73 ;IGH3-74 ;IGHV4-4 ; IGHV4-31 ; IGHV4-39 ; IGHV 5-51和 IGHV6-1。在一些实施方案中,集合包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括选自由以下组成的组的一种或更多种可变κ轻链种系蛋白序列IGKVl-5 ;IGKV1-6 ;IGKV1-9 ;IGKV1-12 ;IGKV1-16 ;IGKV1-17 ;IGKV1-27 ;IGKV1-39 ; IGKV2-30 ; IGKV3-11 ; IGKV3-15 ;和 IGKV3-20。在一些实施方案中,集合包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括选自由以下组成的组的一种或更多种可变λ轻链种系蛋白序列 IGLV1-40 ; IGLV1-47 ;IGLV1-51 ; IGLV2-11 ; IGLV2-23 ; IGLV2-14 ; IGLV3-1 和 IGLV3-21。在一些实施方案中,本发明包括含FR1、⑶Rl、FR2、⑶R2和FR3的分离的抗体或其功能片段,所述FR1、⑶Rl、FR2、⑶R2和FR3包含选自由以下组成的组的种系蛋白序列 JGHV1-2 ;IGHV1-18 ; IGHV1-69 ; IGHV1-46 ; IGHV3-7 ; IGHV3-11 ;IGHV3-15 ; IGHV3-21 ; IGHV3-23 ;IGHV3-30 ;IGHV3-33 ;IGHV3-48 ;IGHV3-53 ;IGHV3-73 ;IGH3-74 ;IGHV4-4 ; IGHV4-31 ; IGHV4-39 ; IGHV 5-51 ; IGHV6-1 ; IGKV1-5 ;IGKV1-6 ; IGKV1-9 ; IGKV1-12 ; IGKV1-16 ;IGKV1-17 ;IGKV1-27 ; IGKV1-39 ; IGKV2-30 ; IGKV3-11 ;IGKV3-15 ; IGKV3-20 ; IGLV1-40 ; IGLV1-47 ; IGLV1-51 ; IGLV2-11 ;IGLV2-23 ; IGLV2-14 ; IGLV3-1 和 IGLV3-21。具有有利的生物物理特性的种系基因对下一步,必须确定要测试哪些种系蛋白质对,因为在人免疫组库中存在约2500
37对。一种方式是测试最突出地出现在人免疫组库中的可变重链和可变轻链种系蛋白对,例如,见表18。人们可例如选择前四百对用于测试,或者选择表达高于某个阈值浓度的可变重链和可变轻链种系蛋白对。因此,本发明的方面包括生产合成抗体或其功能片段的集合的方法,其中所述生产步骤还包括如下步骤鉴定以至少0. 05%的浓度在人免疫组库中表达的可变重链和可变轻链种系基因对;产生包含所鉴定的种系蛋白对的抗体或其功能片段; 并且评估所述种系蛋白对的如下特性i)以Fab形式的相对展示率;ii)以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在 37°C持续大于十天的在牛血清中的稳定性;ν)以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。这种方法将需要合成和测试大量可变重链和可变轻链种系蛋白对序列;因此,这种方法将不是非常有效率的。作为一种替代的方法,发明人选择了代表、准确地再现或覆盖大多数来自人免疫组库的突出表达的对的一小组可变重链和可变轻链种系对。这种方法部分上基于如下观察结果少量可变重链、可变κ轻链和可变λ轻链种系基因在人免疫组库中占优势。Wildt 等人在895-896页描述了这种现象。Wildt等人还说明频繁表达的重链和轻链基因区段通常是成对的,并且观察到采样的一半配对仅对应于五个种系对。因此,可以联合少量的突出表达的重链和轻链种系基因(未成对的)以产生一组代表人免疫组库的对。因此,本发明的方面包括如下抗体或其片段的集合所述抗体或其片段包括代表、 准确地再现或覆盖人免疫组库或幼稚的人免疫组库的大多数突出表达的可变重链和可变轻链种系基因对的种系蛋白对。如以下所述,随着首先测试可变重链和可变轻链种系蛋白对的有利的生物物理特性,然后将集合设计成包括具有一种或更多种这些有利的生物物理特性的种系蛋白对,我们的方法产生了包含可充分开发的抗体或其片段的集合。本发明的方面包括生产抗体或其功能片段的集合的方法,所述方法包括鉴定具有一种或多种如下特性的可变重链和可变轻链种系蛋白对的步骤i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab pMxll_FH VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与 M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。在一些方面,本发明包括生产抗体或其功能片段的集合的方法,所述方法包括产生含可变重链和可变轻链构架区的抗体或其功能片段的集合,其中所述一种或更多种构架区包括种系蛋白对的种系蛋白序列,其中所述种系蛋白对包括一种或更多种如下特性 i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1_69VLA_ V11-40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在 37°C持续十四天的在牛血清中的稳定性。在一些实施方案中,FRU FR2和FR3区包括种系蛋白序列。在一些实施方案中,FRl、FR2和FR3区包括种系蛋白对的种系蛋白序列。在一些实施方案中,抗体或其功能片段包括含种系蛋白序列的一个或更多个互补决定区。在一些实施方案中,抗体或其功能片段包括含种系蛋白对的种系蛋白序列的一个或更多个互补决定区。在一些实施方案中,⑶Rl区和⑶R2区包括种系蛋白序列。在一些实施方案中,⑶Rl 区和⑶R2区包括种系蛋白对的种系蛋白序列。在一些实施方案中,FRU⑶Rl、FR2、⑶R2 和FR3区包括种系蛋白序列。在一些实施方案中,FR1、⑶Rl、FR2、⑶R2和FR3区包括种系蛋白对的种系蛋白序列。在一些实施方案中,FR4区包括JH4重链区。在一些实施方案中, 尺4区包括了1^ 1轻链区。在一些实施方案中,FR4区包括JX 2/3轻链区。在其他实施方案中,本发明包括生产抗体或其功能片段的集合的方法,所述方法包括产生集合,其中产生还包括如下步骤合成编码抗体或其功能片段的核酸;将核酸克隆到载体中;并且表达抗体或其功能片段。合成并测试可变重链和可变轻链种系蛋白对的突出表达的或代表的组后,然后可将集合设计成包括具有有利的生物物理特性的种系蛋白对。本发明的方面包括源自于具有一种或更多种如下特性的种系蛋白对的合成抗体或其功能片段的集合i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii) 与Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在 60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和 vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性,其中在一些实施方案中,抗体或其功能片段的一个或更多个构架区和/或互补决定区源自于具有这些特性的种系蛋白对。本发明的方面包括如下合成抗体或其功能片段的集合所述合成抗体或其功能片段包括具有一种或更多种如下特性的种系蛋白对的基本上的种系蛋白序列i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与 M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性,其中在一些实施方案中,抗体或其功能片段的一个或更多个构架区和/或互补决定区包括具有这些特性的种系蛋白对的基本上的种系蛋白序列。本发明的方面包括如下合成抗体或其功能片段的集合所述合成抗体或其功能片段包括具有一种或更多种如下特性的种系蛋白对的种系蛋白序列i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性; iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性,其中在一些实施方案中,抗体或其功能片段的一个或更多个构架区和/或互补决定区包括具有这些特性的种系蛋白对的种系蛋白序列。在一些方面,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区包括具有一种或更多种如下特性的种系蛋白对的种系蛋白序列i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν) 与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。在一些实施方案中,包含种系蛋白对的种系蛋白序列的构架区包括FR1、FR2和 FR3区。在一些实施方案中,抗体或其功能片段包括含种系蛋白序列的一个或更多个互补决定区。在一些实施方案中,抗体或其功能片段包括含种系蛋白对的种系蛋白序列的一个或更多个互补决定区。在一些实施方案中,⑶Rl区和⑶R2区包括种系蛋白序列。在一些实施方案中,⑶Rl区和⑶R2区包括种系蛋白对的种系蛋白序列。在一些实施方案中,FR1、 ⑶R1、FR2、⑶R2和FR3区包括种系蛋白序列。在一些实施方案中,FR1、⑶Rl、FR2、⑶R2和 FR3区包括种系蛋白对的种系蛋白序列。在一些实施方案中,FR4区包括JH4重链区。在一些实施方案中,FR4区包括Jk 1轻链区。在一些实施方案中,FR4区包括J λ 2/3轻链区。在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区包括具有至少两种如下特性的种系蛋白对的种系蛋白序列i)以Fab 形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1-69VLA_V11_40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν) 与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区包括具有至少三种如下特性的种系蛋白对的种系蛋白序列i)以Fab 形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1-69VLA_V11_40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν) 与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区包括具有至少四种如下特性的种系蛋白对的种系蛋白序列i)以Fab 形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1-69VLA_V11_40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν) 与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区包括具有至少五种如下特性的种系蛋白对的种系蛋白序列i)以Fab 形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1-69VLA_V11_40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν) 与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。
在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区包括具有如下特性的种系蛋白对的种系蛋白序列i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与 M0R03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区基本上由具有一种或更多种如下特性的种系蛋白对的种系蛋白序列组成i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1_69VLA_ V11-40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在 37°C持续十四天的在牛血清中的稳定性。在一些实施方案中,抗体或其功能片段基本上由包括一种或更多种如下特性的种系蛋白对的种系蛋白序列组成i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab 形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区由具有一种或更多种如下特性的种系蛋白对的种系蛋白序列组成 i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1_69VLA_ V11-40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在 37°C持续十四天的在牛血清中的稳定性。在一些实施方案中,抗体或其功能片段由包括一种或更多种如下特性的种系蛋白对的种系蛋白序列组成i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii) 与Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在 60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和 vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。在一些实施方案中,这些集合的大多数或基本上全部的抗体或其功能片段包括具有一种或更多种如下特性的种系蛋白对的种系蛋白序列i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以 Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。在一些方面,集合的抗体或其功能片段包括具有一种或更多种如下特性的种系蛋白对的种系蛋白序列i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii) 与Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在 60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和 vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。在一些实施方案中,抗体或其功能片段基本上由包括如下特性的种系蛋白对的种系蛋白序列组成i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以 IgG形式在37°C持续十四天的在牛血清中的稳定性。在一些实施方案中,抗体或其功能片段由包括如下特性的种系蛋白对的种系蛋白序列组成i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以 IgG形式在37°C持续十四天的在牛血清中的稳定性。在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述可变重链构架区和可变轻链构架区包括种系蛋白对的种系蛋白序列,其中所述种系蛋白对包括如下特性i)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;和ii)以IgG形式在37°C持续十四天的在血清中的稳定性。在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述可变重链构架区和可变轻链构架区包括种系蛋白对的种系蛋白序列,其中所述种系蛋白对包括如下特性i)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;ii)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;iii)以IgG 形式在37°C持续十四天的在血清中的稳定性。在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述可变重链构架区和可变轻链构架区包括种系蛋白对的种系蛋白序列,其中所述种系蛋白对包括如下特性i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iii)以Fab形式在 37°C持续大于十天的在牛血清或小鼠血清中的稳定性;和iv)以IgG形式在37°C持续十四天的在血清中的稳定性。在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述可变重链构架区和可变轻链构架区包括种系蛋白对的种系蛋白序列,其中所述种系蛋白对包括如下特性i)与Fab VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表达水平;ii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iii)以Fab 形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;iv)与M0R03080相比至少
420. 4的以IgG形式的表达水平;和ν)以IgG形式在37°C持续十四天的在血清中的稳定性。在其他实施方案中,本发明的集合包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述可变重链构架区和可变轻链构架区包括种系蛋白对的种系蛋白序列,其中所述种系蛋白对包括如下特性i)以Fab形式在60°C或更高温度持续至少 45分钟的热稳定性;ii)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;iii)与M0R03080相比至少0.4的以IgG形式的表达水平;和iv)以IgG形式在37°C持续十四天的在血清中的稳定性。在其他实施方案中,本发明的集合和/或生产这些集合的方法包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括含如下以Fab形式的相对展示率的种系蛋白对的种系蛋白序列相比于对照至少0. 1 ;相比于对照至少0. 2 ;相比于对照至少0. 3 ;相比于对照至少0. 4 ;相比于对照至少0. 5 ;相比于对照至少0. 6 ;相比于对照至少0. 7 ;相比于对照至少0. 8 ;相比于对照至少0. 9 ;相比于对照至少1. 0 ;相比于对照至少1. 1 ;相比于对照至少1. 2 ;相比于对照至少1. 3 ;相比于对照至少1. 4 ;相比于对照至少1. 5 ;相比于对照至少1. 6 ;相比于对照至少1. 7 ;相比于对照至少1. 8 ;相比于对照至少1. 9 ;相比于对照至少2. 0 ;相比于对照至少2. 1 ;相比于对照至少2. 2 ;相比于对照至少2. 3 ;相比于对照至少2. 4 ;相比于对照至少2. 5 ;相比于对照至少2. 6 ;相比于对照至少2. 7 ;相比于对照至少2. 8 ;相比于对照至少2. 9 ;相比于对照至少3. 0 ;相比于对照至少3. 2 ;相比于对照至少3. 3 ;相比于对照至少3. 4 ;相比于对照至少3. 5 ;相比于对照至少3. 6 ;相比于对照至少3. 7 ;相比于对照至少3. 8 ;相比于对照至少4. 1 ;相比于对照至少4. 3 ;相比于对照至少4. 4 ;相比于对照至少4. 5 ;相比于对照至少4. 6 ;相比于对照至少4. 7 ;相比于对照至少5. 0 ;相比于对照至少5. 1 ;相比于对照至少5. 2 ;相比于对照至少5. 4 ;相比于对照至少5. 5 ;相比于对照至少5. 7 ;相比于对照至少5. 9 ;相比于对照至少6. 0 ;相比于对照至少6. 1 ;相比于对照至少6. 3 ;相比于对照至少6. 4 ;相比于对照至少6. 7 ;相比于对照至少6. 9 ;相比于对照至少7. 0 ;相比于对照至少7. 1 ;相比于对照至少7. 2 ;相比于对照至少7. 3 ;相比于对照至少7. 4 ;相比于对照至少8. 1 ;相比于对照至少8. 2 ;相比于对照至少8. 3 ;相比于对照至少8. 4 ;相比于对照至少8. 5 ;相比于对照至少8. 6 ;相比于对照至少8. 7 ;相比于对照至少8. 8 ;相比于对照至少8. 9 ;相比于对照至少9. 1 ;相比于对照至少9. 2 ;相比于对照至少9. 3 ;相比于对照至少9. 4 ;相比于对照至少
9.5 ;相比于对照至少9. 7 ;相比于对照至少9. 8 ;相比于对照至少10. 0 ;相比于对照至少
10.2 ;相比于对照至少10. 3 ;相比于对照至少10. 5 ;相比于对照至少10. 6 ;相比于对照至少10. 7 ;相比于对照至少10. 8 ;相比于对照至少11. 0 ;相比于对照至少11. 2 ;相比于对照至少11. 3 ;相比于对照至少11. 5 ;相比于对照至少11. 7 ;相比于对照至少11. 8 ;相比于对照至少12. 1 ;相比于对照至少12. 3 ;相比于对照至少12. 4 ;相比于对照至少12. 9 ;相比于对照至少13. 0 ;相比于对照至少13. 6 ;相比于对照至少14. 4 ;相比于对照至少14. 5 ;相比于对照至少16. 1 ;相比于对照至少16. 6 ;相比于对照至少16. 7 ;相比于对照至少17. 1 ;相比于对照至少19. 4 ;相比于对照至少27. 3 ;或相比于对照至少29. 0。在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述可变重链构架区和可变轻链构架区包括种系蛋白对的种系蛋白序列,其中所述种系蛋白对包括含如下值的以Fab形式的相对展示率采样的前10% Fab中的值;采样的前15% Fab中的值;采样的前20% Fab中的值;采样的前25% Fab中的值;采样的前30% Fab中的值;采样的前35% Fab中的值;采样的前40% Fab中的值;采样的前45% Fab中的值;采样的前50% Fab中的值;采样的前55% Fab中的值;采样的前60% Fab中的值;采样的前65% Fab中的值;采样的前70% Fab中的值;采样的前75% Fab中的值;采样的前 80% Fab中的值;采样的前85% Fab中的值;或采样的前90% Fab中的值。在其他实施方案中,本发明的集合和/或生产这些集合的方法包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括种系蛋白对的种系蛋白序列, 所述种系蛋白对的种系蛋白序列包括如下值的以Fab形式的相对表达水平相比于Fab VH1-69VLA_V11-40AYA 至少 0. 1 ;相比于 Fab VH1-69VLA_V11_40AYA 至少 0. 2 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 3 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 4 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 5 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 6 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 7 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 8 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 0. 9 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 1. 0 ;相比于 Fab VH1-69VLA_V11-40AYA 至少 1. 1 ;相比于 Fab VH1-69VLA_V11_40AYA 至少 1. 2 ;或相比于 Fab VH1-69VLA_V11-40AYA 至少 1. 3。在其他实施方案中,本发明的集合和/或生产这些集合的方法包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括种系蛋白对的种系蛋白序列, 所述种系蛋白对的种系蛋白序列包括以Fab形式在70°C或更高温度持续至少45分钟的热稳定性;或包括以Fab形式在80°C或更高温度持续至少45分钟的热稳定性。在其他实施方案中,本发明的集合和/或生产这些集合的方法包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括种系蛋白对的种系蛋白序列,所述种系蛋白对的种系蛋白序列包括如下值的以IgG形式的相对表达水平相比于 M0R03080至少0. 1 ;相比于M0R03080至少0. 2 ;相比于M0R03080至少0. 3 ;相比于M0R03080 至少0. 4 ;相比于M0R03080至少0. 5 ;相比于M0R03080至少0. 6 ;相比于M0R03080至少0. 7 ; 相比于M0R03080至少0. 8 ;相比于M0R03080至少0. 9 ;相比于M0R03080至少1. 0 ;相比于 M0R03080至少1. 1 ;相比于M0R03080至少1. 2 ;相比于M0R03080至少1. 3 ;相比于M0R03080 至少1. 4 ;相比于M0R03080至少1. 5 ;相比于M0R03080至少1. 6 ;相比于M0R03080至少1. 7 ; 相比于M0R03080至少1. 8 ;相比于M0R03080至少1. 9。在某些方面,本发明包括集合以及生产或使用含抗体或其功能片段的集合的方法,所述抗体或其功能片段包括含种系蛋白序列、基本上的种系蛋白序列或源自于种系蛋白序列的序列的一个或更多个互补决定区。在某些实施方案中,抗体或其功能片段包括含种系蛋白序列的CDRl和CDR2。在某些实施方案中,抗体或其功能片段包括含种系蛋白对的种系蛋白序列的⑶Rl和⑶R2。在一些方面,一个或更多个构架区包括种系蛋白对的种系蛋白序列。如在一些方面,?1 4选自由朋、1^1和入2/3组成的组。如图45A-47B所示,种系蛋白序列只包括 FR1-FR3。因此在某些方面,当所述可变重链构架区和可变轻链构架区包括种系蛋白序列时,FR1、FR2和/或FR3包括种系蛋白序列。在一些方面,一个或更多个构架区包括种系蛋白序列,容许一个或更多个互补决定区的多样化。在一些实施方案中,本发明包括集合以及生产和制备所述包括多样化HCDR3区的合成抗体或其功能片段的集合的方法。在一些实施方案中,本发明包括集合以及生产和使用所述包括多样化LCDR3区的合成抗体或其功能片段的集合的方法。本发明的另外一方面是集合可用于鉴定针对任何免疫原的抗体或其功能片段的能力。根据CDR长度和在构象或规范结构上的多样性,认为产生具有包括以上功能特性的至少两个可变重链和可变轻链种系蛋白对的集合将提供在该集合中的多样性,尤其是在该集合的抗体的互补决定区中的多样性。这容许本发明的集合可用于鉴定针对任何免疫原的抗体或其功能片段。本发明的一些实施方案包括如下集合所述集合包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括具有如下特性的种系蛋白对的种系蛋白序列i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1_69VLA_ V11-40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在 37°C持续十四天的在牛血清中的稳定性,其中所述集合包括含如下数目的不同的种系蛋白对的抗体或其功能片段至少两个不同的种系蛋白对;至少三个不同的种系蛋白对;至少四个不同的种系蛋白对;至少五个不同的种系蛋白对;至少六个不同的种系蛋白对;至少七个不同的种系蛋白对;至少八个不同的种系蛋白对;至少九个不同的种系蛋白对;至少十个不同的种系蛋白对;至少十一个不同的种系蛋白对;至少十二个不同的种系蛋白对; 至少十三个不同的种系蛋白对;至少十四个不同的种系蛋白对;至少十五个不同的种系蛋白对;至少十六个不同的种系蛋白对;至少十七个不同的种系蛋白对;至少十八个不同的种系蛋白对;至少十九个不同的种系蛋白对;至少二十个不同的种系蛋白对;至少21个不同的种系蛋白对;至少22个不同的种系蛋白对;至少23个不同的种系蛋白对;至少24个不同的种系蛋白对;至少25个不同的种系蛋白对;至少26个不同的种系蛋白对;至少27个不同的种系蛋白对;至少28种不同的可变重链种系蛋白;至少29个不同的种系蛋白对序列;至少30个不同的种系蛋白对;至少31个不同的种系蛋白对;至少32个不同的种系蛋白对;至少33个不同的种系蛋白对;至少34个不同的种系蛋白对;至少35个不同的种系蛋白对;至少36个不同的种系蛋白对;至少37个不同的种系蛋白对;至少38个不同的种系蛋白对;至少39个不同的种系蛋白对;至少40个不同的种系蛋白对;至少41个不同的种系蛋白对;至少42个不同的种系蛋白对;至少43个不同的种系蛋白对;至少44种不同的可变重链种系蛋白;至少45个不同的种系蛋白对序列;至少46个不同的种系蛋白对;至少47个不同的种系蛋白对;至少48个不同的种系蛋白对;至少49个不同的种系蛋白对或至少50个不同的种系蛋白对。包含种系基因序列的抗体或其功能片段另外,认为利用种系蛋白序列将降低抗体在施用至患者时的免疫原性风险。因此, 本发明的方面包括集合以及生产和使用含可变重链和可变轻链构架区的合成抗体或其功能片段的所述集合的方法,其中所述构架区包括种系蛋白序列。在一些实施方案中,抗体或其功能片段的可变重链和可变轻链构架区包括基本上的种系序列。在一些实施方案中,抗体或其功能片段的可变重链和可变轻链构架区源自于种系序列。在一些实施方案中,所述抗体或其功能片段包括含种系蛋白序列、基本上的种系序列或源自于种系蛋白序列的FR1、FR2、FR3和FR4区。在某些实施方案中,所述抗体或其功能片段包括含代表性种系蛋白对的种系蛋白序列的FR1、FR2、FR3。在一些实施方案中,使用的FR4区是可变重链的JH4,可变κ轻链的J κ 1和可变λ轻链的J λ 2/3。又因为利用种系蛋白序列将降低抗体在患者中施用时的免疫原性风险,所以本发明的某些方面包括集合以及生产或使用包含一个或更多个互补决定区的抗体或其功能片段的集合的方法,所述一个或更多个互补决定区包括种系蛋白序列、基本上的种系序列或源自于种系蛋白序列。在某些实施方案中,抗体或其功能片段包括含种系蛋白序列的CDRl 和CDR2。在某些实施方案中,抗体或其功能片段包括含种系蛋白对的种系蛋白序列的CDRl 和 CDR2。在一些方面,一个或更多个构架区包括种系蛋白序列,容许一个或更多个互补决定区的多样化。在一些实施方案中,本发明包括集合以及生产和制备所述包括多样化HCDR3 区的合成抗体或其功能片段的集合的方法。在一些实施方案中,本发明包括集合以及生产和使用所述包括多样化LCDR3区的合成抗体或其功能片段的集合的方法。CDR可通过本领域公知的方法设计,包括那些公开在Knappik等人2000 ;WO 97/08320 ;W02008053275 ; W02009036379 ;W02007056441 ;W02009114815中的方法,这些文献全部通过引用整体并入。另外,为了产生包含具有低免疫原性风险的抗体或其功能片段的集合,在某些方面,本发明的集合以及生产和使用这些集合的方法包括含人序列的抗体或其功能片段。在一些方面,本发明的集合包括至少IXlO4;至少IXlO5;至少IXlO6;至少 IX IO7;至少IX IO8;至少IX IO9;至少IX IOltl;或至少IX IO11种编码抗体或其功能片段的核酸序列或者抗体或其功能片段。在一些方面,集合的抗体或其功能片段是合成的。在一些方面,集合包括编码抗体或其功能片段的核酸。本发明另外的实施方案在一些方面,本发明包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述可变重链构架区和可变轻链构架区包括种系蛋白对的种系蛋白序列,其中所述种系蛋白对包含如下特性i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1_69VLA_V11-40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;禾口vi)以IgG形式在37°C持续十四天的在血清中的稳定性;其中所述抗体或其功能片段的集合包括至少两个不同的种系蛋白对的种系蛋白序列,且其中所述种系蛋白对由种系基因对编码。在一些实施方案中,本发明包括合成抗体或其功能片段的集合,其中所述可变重链和可变轻链构架区基本上由包括如下特性的种系蛋白对的种系蛋白序列组成i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1_69VLA_V11-40AYA相比至少0. 4的以Fab形式的表达水平;
46
iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;禾口vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。在一些实施方案中,本发明包括合成抗体或其功能片段的集合,其中所述可变重链和可变轻链构架区由包括如下特性的种系蛋白对的种系蛋白序列组成i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1_69VLA_V11-40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。在一些实施方案中,所述种系基因对以至少0.05%的浓度存在于人免疫组库中。 在一些实施方案中,所述种系基因对以至少0. 23%的浓度存在于人免疫组库中。在一些实施方案中,所述种系基因对以至少0. 51 %的浓度存在于人免疫组库中。在一些实施方案中, 所述种系基因对以至少0.07%的浓度存在于幼稚的人免疫组库中。在一些实施方案中,所述种系基因对以至少0.52%的浓度存在于幼稚的人免疫组库中。在一些实施方案中,所述种系基因对以至少0.88%的浓度存在于幼稚的人免疫组库中。在一些实施方案中,所述抗体或其功能片段包括人序列。在一些实施方案中,所述抗体或其功能片段的集合包括至少十七个不同的种系蛋白对的种系蛋白序列。在一些实施方案中,所述抗体或其功能片段包括含种系蛋白序列的一个或更多个互补决定区。在一些实施方案中,所述抗体或其功能片段包括含种系蛋白序列的FR1、CDR1、 FR2、CDR2和FR3区。在一些实施方案中,所述抗体或其功能片段包括选自由以下组成的组的FR4区JH4、Jk 1和JX 2/3。在一些实施方案中,所述抗体或其功能片段包括多样化的 HCDR3区。在一些实施方案中,所述抗体或其功能片段包括多样化的IXDR3区。在一些实施方案中,集合包括IXlO4种抗体或其功能片段。在一些实施方案中, 所述种系蛋白对包括含在采样的前60% Fab中的值的以Fab形式的相对展示率。在一些实施方案中,所述种系蛋白对包括与Fab VH1-69VLA_V11-40AYA相比至少0. 6的以Fab形式的表达水平。在一些实施方案中,所述种系蛋白对包括以Fab形式在70°C或更高温度持续至少45分钟的热稳定性。在一些实施方案中,所述种系蛋白对包括与M0R03080相比至少 0.6的以IgG形式的表达水平。在一些实施方案中,可变重链和可变轻链构架区包括选自由以下组成的组的种系蛋白对的种系蛋白序列IGHV3-23/IGKVl-5 ; IGHV3-23/IGKV3-20 ;IGHV4-39/ IGKV3-15 ; IGHV3-23/IGKV3-15 ; IGHV4-39/IGKV1-39/1D-39 ; IGHV1-18/IGKV3-20 ; IGHV3-30/IGKV3-20 ; IGHV4-39/IGKV1-5 ; IGHV1-69/IGKV1-39/1D-39 ;IGHV5-51/ IGLV1-40 ; IGHV4-39/IGKV3-20 ; IGHV3-23/IGLV 2-14 ;IGHV4-39/IGLV 3-21 ;IGHV3-23/ IGKV1-39/1D-39 ; IGHV3-30/IGKV1-39/1D-39 ;IGHV1-69/IGKV3-20 ; IGHV3-48/IGKV3-20 ; IGHV1-2/IGKV3-20 ;IGHV3-30/IGKV4-1 ;IGHV5-51/IGLV 2-14 ;IGHV5-51/IGKV3-20 ; IGHV3-7/IGKV1-39/1D-39 ;IGHV3-7/IGKV1-5 ;IGHV3-15/IGKV3-20 ;IGHV4-39/IGLV2-14 ; ighv3-23/igkv3-11 ;ighv3-30/igkv1-5 ;ighv3-30/igkv3-15 ;ighv3-21/igkv1-5 ; ighv3-21/igkv3-15 ; ighv3-30/iglv 1-51 ;ighv3-21/iglv 1-51 ;和 ighv1-69/igkv3-11。在一些实施方案中,所述抗体的所述功能片段选自由Fab、F (ab' ) 2、Fab,、Fv和 scFv组成的组。在一些方面,本发明包括编码公开的抗体集合的核酸的集合。在一些方面,本发明包括含编码公开的抗体集合的核酸的载体。在一些方面,本发明包括含编码公开的抗体集合的核酸的重组宿主细胞。在一些实施方案中,重组宿主细胞是原核的或真核的。在一些实施方案中,重组宿主细胞是大肠杆菌或哺乳动物细胞。在一些方面,本发明包括含可变重链构架区和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括种系蛋白序列,其中所述种系蛋白序列包含如下特性i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii) 一个或更少的未成对半胱氨酸;iv) 一个或更少的潜在t细胞表位;ν)中等或低的聚集倾向;和vi)至少7.5的等电点;且其中所述抗体或其功能片段的集合包括至少两种不同的可变重链种系蛋白序列,其中所述种系蛋白序列由种系基因序列编码。在一些实施方案中,所述可变重链或可变轻链种系基因序列以至少0. 5%的浓度存在于人免疫组库中。在一些实施方案中,所述抗体或其功能片段的集合包括至少五种不同的可变重链种系蛋白序列。在一些实施方案中,所述抗体或其功能片段包括人序列。在一些实施方案中,所述可变重链或可变轻链种系基因序列以至少5. 0%的浓度存在于人免疫组库中。在一些实施方案中,所述抗体或其功能片段包括含种系蛋白序列的一个或更多个互补决定区。在一些实施方案中,所述抗体或其功能片段包括含种系蛋白序列的fr1、cdr1、 fr2、cdr2和fr3。在一些实施方案中,所述抗体或其功能片段包括选自由以下组成的组的 fr4区jh4、jk 1和jx 2/3。在一些实施方案中,所述抗体或其功能片段还包括多样化的 hcdr3区。在一些实施方案中,所述抗体或其功能片段还包括多样化的ixdr3区。在一些实施方案中,集合包括1 x io4种抗体或其功能片段。在一些实施方案中,所述可变重链种系蛋白序列选自由以下组成的组ighv3_23 ; ighv3-30 ; ighv4-39 ; ighv4-34 ; ighv4-59 ;ighv1-69 ; ighv5-51 ; ighv3-7 ;ighv1-18 ; ighv3-48 ;ighv3-15 ; ighv3-21 ; ighv1-2 ; ighv3-33 ; ighv4-31 ; ighv3-53 ; ighv3-11 ; ighv3-9 ; ighv4-4 ; ighv1-46 ; ighv3-74 ; ighv1-24 ; ighv4-61 ; ighv1-8 ; ighv1-3 ; ighv3-49 ; ighv3-43 ; ighv4-28 ; ighv3-64 ;和 ighv7-81。在一些实施方案中,所述可变κ轻链种系蛋白序列选自由以下组成的组 igkv3-20 ; igkv1-39/1d-39 ; igkv1-5 ; igkv3-15 ; igkv4-1 ; igkv3-11 ; igkv2-28/2d-28 ; igkv1-33/1d-33 ;igkv2-30 ; igkv1-9 ;igkv1-17 ; igkv1-27 ; igkv1-8 ;igkv1-16 ; igkv1-6 ; igkv1-12 ; igkv2d-29 ;igkv1-13 ; igkv1d-8 ;和 igkv2-24。
在一些实施方案中,所述可变λ轻链种系蛋白序列选自由以下组成的组 IGLV2-14 ; IGLV1-40 ;IGLV1-44 ;IGLV卜51 ; IGLV2-23 ;IGLV3-21 ;IGLV1-47 ;IGLV3-1 ; IGLV2-11 ; IGLV2-8 ; IGLV6-57 ; IGLV3-25 ; IGLV7-46 ;IGLV1-36 ; IGLV7-43 ; IGLV9-49 ; IGLV4-69 ; IGLV2-18 ; IGLV3-10 ;和 IGLV3-27。在一些方面,本发明包括生产公开的合成抗体或其功能片段的集合的方法。在一些实施方案中,生产步骤还包括产生含可变重链和可变轻链构架区的抗体或其功能片段的
皇A 朱η j其中所述可变重链构架区和可变轻链构架区包含种系蛋白对的种系蛋白序列,其中所述种系蛋白对包含如下特性i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与Fab VH1_69VLA_V11-40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性;且其中所述抗体或其功能片段的集合包括至少两个不同的种系蛋白对。在一些实施方案中,生产步骤还包括如下步骤a)获得包括在人免疫组库中存在的可变重链和可变轻链种系基因对的数据;b)鉴定包含如下特性的可变重链和可变轻链种系蛋白对i)以Fab形式的相对展示率包括在采样的前75% Fab中的值;ii)与 Fab pMxll_FH VH1-69VLA_V11_40AYA相比至少 0. 4 的以 Fab 形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)与M0R3080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性;和c)产生包含在步骤b)中鉴定的种系蛋白对的可变重链种系蛋白序列和可变轻链种系蛋白序列的抗体或其功能片段的集合。在一些实施方案中,步骤b)还包括如下步骤ba)鉴定以至少0.05%的浓度存在于人免疫组库中的可变重链和可变轻链种系基因对;bb)产生包含在步骤ba)中鉴定的种系蛋白对的抗体或其功能片段;和be)评估所述种系蛋白对的如下特性i)以Fab形式的相对展示率;ii)以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性;ν)以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。
49
在一些实施方案中,步骤a)还包括如下步骤aa)从样品中分离人B细胞;ab)从所述B细胞产生cDNA ;ac) PCR扩增来自B细胞的cDNA ;ad)对所述PCR产物测序;ae)鉴定每种PCR产物的种系基因。在一些实施方案中,产生集合的步骤还包括如下步骤ca)合成编码所述抗体或其功能片段的核酸;cb)将所述核酸克隆到载体中;cc)表达所述抗体或其功能片段。在一些实施方案中,所述种系基因对以至少0.05%的浓度存在于人免疫组库中。 在一些实施方案中,所述种系基因对以至少0. 23%的浓度存在于人免疫组库中。在一些实施方案中,所述种系基因对以至少0. 51 %的浓度存在于人免疫组库中。在一些实施方案中, 所述种系基因对以至少0.07%的浓度存在于幼稚的人免疫组库中。在一些实施方案中,所述种系基因对以至少0.52%的浓度存在于幼稚的人免疫组库中。在一些实施方案中,所述种系基因对以至少0.88%的浓度存在于幼稚的人免疫组库中。在一些实施方案中,所述抗体或其功能片段包括人序列。在一些实施方案中,所述抗体或其功能片段包括至少十七个不同的种系蛋白对的种系蛋白序列。在一些实施方案中,所述抗体或其功能片段包括含种系蛋白序列的一个或更多个互补决定区。在一些实施方案中,所述抗体或其功能片段包括含种系蛋白序列的FR1、CDRU FR2、CDR2和FR3。在一些实施方案中,所述抗体或其功能片段包括选自由以下组成的组的FR4区JH4、JK 1和JX2/3。在一些实施方案中,所述抗体或其功能片段包括多样化的 HCDR3区。在一些实施方案中,所述抗体或其功能片段包括多样化的IXDR3区。在一些实施方案中,集合包括1 X IO4种抗体或其功能片段。在一些实施方案中,所述种系蛋白对包括含在采样的前60% Fab中的值的以Fab 形式的相对展示。在一些实施方案中,所述种系蛋白对包括与Fab VH1-69VLA_V11-40AYA相比至少0. 6的以Fab形式的表达水平。在一些实施方案中,所述种系蛋白对包括以Fab形式在70°C或更高温度持续至少45分钟的热稳定性。在一些实施方案中,所述种系蛋白对包括与M0R03080相比至少0. 6的以IgG形式的表达水平。在一些实施方案中,可变重链和可变轻链构架区包括选自由以下组成的组的种系蛋白对的种系蛋白序列IGHV3-23/IGKVl-5 ;IGHV3-23/IGKV3-20 ;IGHV4-39/IGKV3-15 ; IGHV3-23/IGKV3-15 ; IGHV4-59/IGKV1-39/1D-39 ;IGHV4-39/IGKV1-39/1D-39 ;IGHV4-59/ IGKV3-20 ;IGHV1-18/IGKV3-20 ;IGHV3-30/IGKV3-20 ;IGHV4-39/IGKV1-5 ;IGHV1-69/ IGKV1-39/1D-39 ; IGHV5-51/IGLV1-40 ; IGHV3-23/IGKV4-1 ; IGHV4-39/IGKV3-20 ; IGHV3-23/IGLV 2-14 ; IGHV4-39/IGLV 3-21 ; IGHV3-23/IGKV1-39/1D-39 ; IGHV3-30/ IGKV1-39/1D-39 ; IGHV3-30/IGKV3-11 ; IGHV1-69/IGKV3-20 ; IGHV3-48/IGKV3-20 ; IGHV1-2/IGKV3-20 ;IGHV3-30/IGKV4-1 ;IGHV5-51/IGLV 2-14 ;IGHV4-59/IGKV4-1 ; IGHV5-51/IGKV3-20 ; IGHV3-7/IGKV1-39/1D-39 ; IGHV3-7/IGKV1-5 ;IGHV3-15/IGKV3-20 ; IGHV4-39/IGLV 2-14 ;IGHV4-39/IGLV 2-8 ;IGHV3-23/IGKV3-11;IGHV3-30/IGKV1-5 ;IGHV3-30/IGKV3-15 ;IGHV3-21/IGKV1-5 ;IGHV3-21/IGKV3-15 ;IGHV3-30/IGLV1-51 ; IGHV3-21/IGLV 1-51 ;IGHV3-53/IGLV 1-44 ;IGHV4-59/IGKV3-15 ;IGHV5-51/IGKV4-1 ; IGHV1-69/IGKV4-1 ;和 IGHV1-69/IGKV3-11。在一些方面,所述抗体的所述功能片段选自由Fab、F(ab' ) 2、Fab,、Fv和scFv组成的组。在一些方面,本发明包括编码含C端限制酶切位点的信号序列或前导序列的分离的核酸。在一些实施方案中,限制酶切位点是NheI。在一些实施方案中,信号序列或前导序列包括PhoA或人重链前导序列。在一些实施方案中,限制酶切位点是NdeI。在一些实施方案中,信号序列包括ompA或人κ前导序列。在一些方面,本发明包括含如下核酸的载体所述核酸编码含C端限制酶切位点的信号序列或前导序列。在一些方面,本发明包括含所述载体的宿主细胞。在一些实施方案中,宿主细胞是原核的或真核的。在一些实施方案中,宿主细胞是大肠杆菌。在一些实施方案中,宿主细胞是哺乳动物细胞。在一些方面,本发明包括含FRl、OTRl、FR2、raR2和FR3的分离的抗体或其功能片段,所述FRl、OTRl、FR2、raR2和FR3包含种系蛋白对的种系蛋白序列,其中所述种系蛋白对选自由以下组成的组IGHV3-23/IGKV1-5 ; IGHV3-23/IGKV3-20 ; IGHV4-39/IGKV3-15 ; IGHV3-23/ IGKV3-15 ; IGHV4-39/IGKV1-39/1D-39 ; IGHV1-18/IGKV3-20 ; IGHV3-30/IGKV3-20 ; IGHV4-39/IGKV1-5 ;IGHV1-69/IGKV1-39/1D-39 ;IGHV5-51/IGLV 1-40 ;IGHV4-39/ IGKV3-20 ; IGHV3-23/IGLV 2-14 ; IGHV4-39/IGLV 3-21 ; IGHV3-23/IGKV1-39/1D-39 ; IGHV3-30/IGKV1-39/1D-39 ; IGHV1-69/IGKV3-20 ; IGHV3-48/IGKV3-20 ; IGHV1-2/ IGKV3-20 ; IGHV3-30/IGKV4-1 ;IGHV5-51/IGLV 2-14 ;IGHV5-51/IGKV3-20 ;IGHV3-7/ IGKV1-39/1D-39 ;IGHV3-7/IGKV1-5 ;IGHV3-15/IGKV3-20 ;IGHV4-39/IGLV2-14 ;IGHV3-23/ IGKV3-11 ;IGHV3-30/IGKV1-5 ;IGHV3-30/IGKV3-15 ;IGHV3-21/IGKV1-5 ;IGHV3-21/ IGKV3-15 ; IGHV3-30/IGLV 1-51 ;IGHV3-21/IGLV 1-51 ;和 IGHV1-69/I。一方面,本公开内容描述了包括含可变重链和轻链构架区(具体是FRl)的抗体的集合,所述可变重链和轻链构架区包含种系序列。预期具有种系构架区将降低抗体在施用至患者时的免疫原性风险。然而,必须使用限制酶切位点以使得能将编码抗体集合的核酸标准地克隆到展示载体和/或表达载体中,以便可针对免疫原筛选抗体。过去,用于克隆的限制酶切位点通常位于构架区内,从而修饰核酸序列远离种系。为了确保本公开内容的每种抗体的至少构架I(FRl)区保持种系序列,在FRl内应该没有任何非天然存在的限制酶切位点。因此,本公开内容的一个方面是在原核信号序列和人前导序列的C端内具体是在三个C端残基内掺入限制酶切位点。另外,包含限制酶切位点的信号序列和前导序列必须是有功能的并且容许抗体或其片段在原核和哺乳动物表达系统中均有良好的展示和表达水平。在一些方面,本发明包括编码含C端限制酶切位点的信号序列或前导序列的分离的核酸。在一些实施方案中,限制酶切位点是NheI或NdeI。在一些实施方案中,信号序列或前导序列包括PhoA或人重链前导序列。在一些实施方案中,信号序列或前导序列包括 ompA或人κ前导序列。在一些方面,本发明包括含如下分离的核酸的载体所述分离的核酸编码含C端限制酶切位点的信号序列或前导序列。在一些方面,本发明包括含编码具有 C端限制酶切位点的信号序列或前导序列的分离的核酸的宿主细胞或含编码具有C端限制酶切位点的信号序列或前导序列的分离的核酸的载体。在一些实施方案中,相应的宿主细胞是原核的,例如大肠杆菌,或是真核的,例如哺乳动物细胞。本公开内容第一次公开如下概念在幼稚的人免疫组库中最普遍的VH和VL类对可能具有优选的特征,如更大的稳定性和更低的免疫原性。本公开内容还第一次将这种概念引入集合设计中并且利用全基因合成来产生这些集合。本公开内容使得鉴定幼稚的和经历抗原的人免疫组库中的VH和VL类对、确定最普遍的VH和VL类对并然后产生包含这些 VH和VL类对的集合的方法成为可能。更具体而言,本公开内容的集合包括具有高度多样化的CDR的最普遍的和/或最优选的VH和VL类配对。这种策略提高了集合包括稳定的、具有低免疫原性和对特定抗原的高亲和力的针对任何免疫原的抗体或其片段的概率。该结果极大地提高了集合包括可用于治疗或诊断目的的针对任何免疫原的高度有效的抗体或其片段的概率。因此,可对从人宿主的幼稚B细胞获得的编码抗体或其片段的核酸序列(或其选定部分)进行测序。从这些序列数据,可鉴定在免疫组库中代表性的种系家族VH/VL链类配对。基于某些指标如普遍性(prevalence)和/或有利的生物物理特性,选择重链和轻链类对掺入集合中。然后可通过基因合成来合成集合。在一些实施方案中,合成的集合包括基本上的种系VH和VL构架区,其中CDR是多样化的,或者VH和/或VL仅一个CDR是多样化的。使用从人宿主的幼稚B细胞获得的DNA序列作为“模板”,本公开内容使得鉴定最普遍的VH和VL对的方法成为可能。一旦阐明VH和VL类对的相对丰度,就可以产生包含最普遍的和/或最优选的VH和VL类对的抗体或其片段的高度多样的集合。利用这种信息, 技术人员能够产生高度的多样性而不牺牲可归因于最普遍的和/或最优选的VH和VL类对组合的关键益处。在本公开内容之前,没有人阐释最普遍的和/或最优选的VH和VL类对或尝试将该知识应用到文库产生技术中。因此,这种方法提供了编码代表幼稚的人免疫系统的抗体或其片段的核酸的全面的集合。利用本文公开的集合设计和展示方法,可产生大多样性的集合,因为一些实施方案包括至少IX101°种成员的集合。在一些方面,本公开内容使得包含公开的核酸集合的载体和宿主细胞成为可能。在一些方面,本公开内容使得生产这些集合的方法成为可能。在一些实施方案中,在单独步骤中获得代表人免疫组库的幼稚DNA序列,并将其储存在数据库中;因此集合设计可经由计算机模拟被容易地改变、优化和定制,容许通常可在合成文库中实现的定制水平。在一些方面,本公开内容使得利用所公开的集合鉴定抗体或其片段的方法成为可能。在一些方面,本发明涉及编码抗体或其片段的集合或文库,所述抗体或其片段包含由免疫组库中丰富和/或优选的VH和VL种系家族和/或基因编码的种系蛋白序列。在一些实施方案中,编码抗体或其片段的核酸是种系、基本上的种系或其密码子优化的变体。这些集合或文库可包括具有有利的生物物理特性的VH和VL种系家族和/或基因,所述有利的生物物理特性包括在噬菌体上的高度展示;以Fab形式在大肠杆菌中的高表达;以IgG 形式在哺乳动物细胞中的高表达;高热稳定性;血清稳定性;低聚集倾向(即,高溶解性); 和低免疫原性风险。在一些实施方案中,集合或文库可包括存在于幼稚的人免疫组库中的 VH和VL种系家族和/或基因。相关的实施方案包括制备和使用这些集合的方法。在一些方面,本发明涉及编码抗体或其片段的集合或文库,所述抗体或其片段包含由免疫组库中丰富和/或优选的VH和VL种系家族和/或基因以及免疫组库中丰富和/ 或优选的VH/VL类对编码的种系蛋白序列。在一些实施方案中,编码抗体或其片段的核酸是种系、基本上的种系或其密码子优化的变体。这些集合或文库可包括由具有有利的生物物理特性的VH和VL种系家族和/或基因和/或VH/VL类对编码的种系蛋白序列,所述有利的生物物理特性包括在噬菌体上的高度展示;以Fab形式在大肠杆菌中的高表达;以IgG 形式在哺乳动物细胞中的高表达;高热稳定性;血清稳定性;低聚集倾向(即,高溶解性); 和低免疫原性风险。在一些实施方案中,集合或文库可包括由存在于幼稚的人免疫组库的 VH和VL种系家族和/或基因和/或VH/VL类对编码的种系蛋白序列。相关的实施方案包括制备和使用这些集合的方法。因此,本发明包括编码基本上代表免疫组库的抗体或其片段的核酸的集合,其中每种抗体或其片段包括VH/VL类对,其中基本上代表免疫组库是使得该集合中存在的每个 VH/VL类对为在免疫组库中以至少0. 05%、至少1 %或至少2%的VH/VL类对的浓度存在的 VH/VL类对。免疫组库可以是个体或群体,并且可以是幼稚的。这种免疫组库可被测定为如下VH/VL类对的免疫组库,例如在来自个体的至少IX IO5个B细胞中的VH/VL类对;在来自多个个体的群体的至少1 X IO5个B细胞中的VH/VL类对;或存在于至少1 X IO5种抗体中的VH/VL类对。免疫组库可以是幼稚B细胞或经历抗原的B细胞的免疫组库。个体或群体可以是人。免疫组库可通过分析公开可用的数据库和/或文献来确定。在一些实施方案中,编码抗体或其片段的核酸是合成的,如通过全基因合成而产生。在相关的实施方案中,核酸是种系序列;基本上的种系序列;或是种系或基本上的种系序列的密码子优化的变体。在一些实施方案中,CDR中至少一个是高度多样化的。在一些实施方案中,本公开内容的集合包括抗体或其片段,其中VH和VL 二者的 FRl、FR2和FR3包括具有优选特征的VH和VL类对的种系蛋白序列。最优选地,本公开内容的集合包括抗体或其片段,其中VH和VL 二者的FR1、FR2和FR3包括具有优选特征的VH 和VL类对的种系蛋白序列,其中VH和VL 二者的CDR3是高度多样化的。在相关的实施方案中,所述编码抗体或其片段的核酸的集合被克隆到载体中。适合的载体是本领域已知的,并且包括展示载体如噬菌体展示载体、质粒载体、噬菌粒载体、 包括细菌表达载体或哺乳动物表达载体的表达载体。在另外的相关实施方案中,集合或克隆到载体中的集合被转化到宿主细胞中。因此,本发明包括宿主细胞的集合。适合的宿主细胞包括原核宿主细胞(如大肠杆菌)和真核宿主细胞(如哺乳动物宿主细胞)。在另一实施方案中,本发明是包含来自约1345个幼稚的人B细胞或来自可读介质上的公开可用的序列的VH/VL类对的数据库。这种数据库可用于本发明的集合和文库的设计和构建。本发明还包括生产编码基本上代表免疫组库的抗体或其片段的核酸的集合的方法。免疫组库可以是一人或多人的幼稚B细胞或经历抗原的B细胞的免疫组库。这种方法可包括如下步骤(a)鉴定以至少0. 05%、至少或至少2%的VH/VL类对的浓度在免疫组库中存在的VH/VL类对;(b)合成编码如下抗体或其片段的核酸的集合所述抗体或其片段包含以至少0. 05%、至少1 %或至少2%的VH/VL类对的浓度在免疫组库中存在的VH/VL 类对。该鉴定步骤可以不同方式进行。例如,鉴定VH/VL类对可包括从一个或多个人宿主中分离幼稚B细胞,并且通过分离并测序编码VH/VL类对的DNA、mRNA或cDNA或通过用对每个VH和VL特异的一种或多种核酸探针探测来确定每个B细胞中的VH/VL类对,然后分析VH/VL类对。在可选的或补充的实施方案中,VH/VL类对可以从预先存在的数据库如抗体序列数据库中确定。在可选的或补充的实施方案中,VH/VL类对可以从文献鉴定。因而, 在一个实施方案中,本发明包括获得抗体核酸序列(预先存在的或重新产生的抗体核酸序列),通过序列比对确定VH/VL类对,并且核对这些序列以鉴定免疫组库中存在的VH/VL类对。在一些实施方案中,使用所述方法来产生其中大多数成员具有促进抗体或其片段的生产和表达(例如在噬菌体上或从细胞)的有利的生物物理特性的集合,并且生产可溶的、热稳定的抗体。更具体地说,这些特性包括(i)有效地展示在噬菌体上;( )有效地展示在哺乳动物细胞上;(iii)以Fab形式很好地表达在大肠杆菌中;(iv)以IgG形式很好地表达在哺乳动物细胞中;(ν)热稳定性;(vi)可溶性;和(vii)低免疫原性。通过确定具有这些特性中的一些或全部特性的VH/VL类对,人们可以例如通过只合成那些具有这类特性的核酸来构建其中大多数成员具有这些生物物理特性的集合。因此,本发明包括这种集合以及制备这种集合的方法。在一些实施方案中,合成的核酸是种系、基本上的种系或其密码子优化的变体。可将变异引入至少一个互补决定区(⑶幻中。任何⑶R是合适的,尤其是⑶R3。优选地,添加至⑶R的序列变异限于框内序列并且不含半胱氨酸和终止密码子,由此确保文库的所有成员被正确地表达。合成了核酸后,可将其克隆到载体(如展示载体、噬菌体展示载体;噬菌粒载体; 或哺乳动物表达载体)中,并且可将其转化到宿主细胞中。适合的宿主细胞包括原核宿主细胞(例如大肠杆菌)和真核宿主细胞(例如哺乳动物宿主细胞)。在另外的实施方案中,本发明提供了鉴定对免疫原特异的抗体的方法。在一个实施方案中,这种方法可以包括鉴定以至少0. 05%、至少或至少2%的VH/VL类对的浓度在免疫组库中存在的VH/VL类对;对编码包含以至少0. 05%、至少或至少2%的VH/VL 类对的浓度在免疫组库中存在的VH/VL类对的抗体或其片段的核酸的集合进行合成;展示或表达该集合的抗体或其片段;针对特定免疫原筛选该集合;并且选择对所述免疫原特异的至少一种抗体或其片段。因为本发明的方法和集合可以按照有利的生物物理特性来构建,所以通过制备编码具有这些有利特性的抗体或其片段的核酸的集合并针对特定免疫原进行筛选来鉴定结合这种免疫原的抗体,本发明对于鉴定用于治疗疾病或病症的抗体或其抗体片段是特别有用的。在一些方面,本发明涉及包含VH/VL对的抗体或其片段的集合或文库。在一些实施方案中,抗体或其片段的集合或文库包含由免疫组库中丰富的VH和VL种系家族和/或基因编码的种系蛋白序列。在一些实施方案中,本发明涉及包含由具有某些有利的生物物
54理特征的VH和VL种系家族和/或基因编码的种系蛋白序列的抗体或其片段的集合或文库。在一些实施方案中,VH和VL种系家族和/或基因是免疫组库中天然存在的那些,并且在该文库中是更丰富的或更普遍的。在一些实施方案中,抗体或其片段的集合或文库包含由VH和VL种系家族和/或基因编码的种系蛋白序列。在一些实施方案中,抗体或其片段的集合或文库包括来自种系、基本上的种系或密码子优化的VH和VL种系家族和/或基因的构架区和/或CDR区。在一些实施方案中,抗体或其片段的集合或文库包含由合成的、通过全基因合成而构建的VH和VL种系家族和/或基因编码的种系蛋白序列。在一些实施方案中,抗体或其片段的集合或文库包含由合成的、通过全基因合成而构建的VH和VL种系家族和/或基因的部分。在一些实施方案中,抗体或其片段的集合或文库包括由具有有利的生物物理特性的VH和VL种系家族和/或基因编码的种系蛋白序列,所述有利的生物物理特性帮助筛选和进一步研发尤其是在治疗背景下的抗体。有利的生物物理特性包括但不限于(i)它们以Fab形式被很好地展示在噬菌体上;(ii)它们以IgG形式被很好地展示在哺乳动物细胞上;(iii)它们以Fab形式被大量表达在例如大肠杆菌中,以及以IgG形式被大量表达在例如哺乳动物细胞中;(iv)是热力学稳定的;(ν)具有高血清稳定性;(vi)具有低聚集倾向(即高可溶性);和(vii)具有低免疫原性风险。在其他方面,本公开内容的集合包括含优选的VH和VL类对的种系蛋白序列的抗体或其片段。本公开内容的集合优选地包括抗体或其片段,其中一个或更多个构架区包括由具有优选的特征的VH和VL类对编码的种系蛋白序列,特别是其中VH和VL的FR1、FR2 和FR3包括具有优选的特征的VH和VL类对的种系蛋白序列。CDR可以是高度多样化的。 优选地,VH和VL 二者的⑶R3是高度多样化的。在一些实施方案中,VH和/或VL的⑶Rl 和CDR2是种系序列或基本上的种系序列。这种策略提高了本公开内容的集合包括能够被开发用于治疗用途的针对任何免疫原的抗体或其片段的概率,因为集合中存在的大多数抗体或其片段包括具有以上优选特征的VH和VL对的种系序列。选择的抗体还将具有低免疫原性和对特定抗原的高亲和力。 该结果极大地提高了从公开的集合选择的抗体或其片段针对任何免疫原是高效的且可被研发用于治疗或诊断目的的概率。这些集合克服了现有技术的许多问题。例如,在源自B细胞的同源文库中,该文库存在的VH和VL类配对取决于样品中存在的类配对。如果取得足够大的B细胞样品,大约 50个VH和50个VL的类配对组合(约2500个)中的每一个都将存在。存在如此多的VH 和VL类对可比拟背景噪声。产生只包括最普遍的VH和VL类对的大多样性的文库可能是令人期望的,但是对于同源文库方法,这是不可能的。此外,在一些实施方案中,集合所基于的DNA序列是从未经历抗原的幼稚B细胞的样品获得,因此,所表达的成员不偏向于特定抗原并且可以使用集合来针对任何免疫原进行筛选。因此,可对从人宿主的幼稚(未经历抗原的)B细胞获得的编码抗体或其片段的核酸序列(或其选定部分)进行测序。从这些序列数据,可鉴定在免疫组库中主要代表的种系家族VH/VL链类配对。基于某些指标如普遍性,选择重链和轻链类对加入集合中。然后可通过基因合成来合成集合。在一些实施方案中,合成的集合包括基本上的种系VH和VL 构架区,其中CDR是多样化的。
利用从例如人宿主的幼稚(未经历抗原的)B细胞或从公开可用的数据库或文献获得的DNA序列作为“模板”,本公开内容使得鉴定最普遍的VH和VL种系家族和/或基因和/或类对的方法成为可能。阐释了 VH和VL种系家族和/或基因和/或类对的相对丰度后,就可以测试包含由VH和VL种系家族和/或基因和/或类对编码的种系蛋白序列的抗体或其片段的如下优选特征(i)它们以Fab形式被很好地展示在噬菌体上;(ii)它们以Fab 形式和IgG形式被大量表达;(iii)并且它们是热力学稳定的。通过测试由最普遍的VH和 VL种系家族和/或基因和/或类对编码的种系蛋白序列,可鉴定具有优选特征的那些。利用这种信息,技术人员能够产生高度的多样性而不牺牲可归因于最普遍的VH和VL种系家族和/或基因和/或类对组合的关键益处。利用本文公开的集合设计和展示方法,可产生大多样性的集合,因为一些实施方案包括至少IX 101°种成员的集合。本公开内容总体上涉及包含具有最优选的特征的VH和VL类对的合成抗体集合。 在一些实施方案中,集合包括由类对代表的VH和VL家族编码的种系蛋白序列。本公开内容总体上涉及包含具有优选的特征的一个或更多个VH和VL类对的合成抗体集合。在一些方面,集合包括由类对代表的VH和VL家族编码的种系蛋白序列。在一些方面,本公开内容使得鉴定在免疫组库中最普遍的VH和VL种系基因、测试具有最普遍的VH和VL种系基因序列的抗体以鉴定具有优选特征的VH和VL种系基因、并然后产生包含优选的VH和VL类对的集合的方法成为可能。本公开内容使得鉴定在人免疫组库(可能是幼稚的)中的VH和VL类对、确定最普遍的VH和VL类对、测试这些VH和VL 类对以鉴定具有优选特征的VH和VL类对、并然后产生包含优选的VH和VL类对的集合和 /或源自于优选的VH和VL种系基因的抗体的方法成为可能。一旦鉴定了 VH和VL和/或 VH和VL类对,就鉴定了它们相应的种系序列,这样可将种系序列加入到集合设计中。在一些方面,本公开内容使得包含公开的核酸集合的载体和宿主细胞成为可能。在一些方面,本公开内容使得生产这些集合的方法成为可能。在一些实施方案中,在单独步骤中获得代表人免疫组库的DNA序列,并将其储存在数据库中;因此,集合设计可经由计算机模拟被容易地改变、优化和定制,容许通常可在合成文库中实现的定制水平。在一些方面,本公开内容使得利用所公开的集合鉴定抗体或其片段的方法成为可能。方法、核酸、蛋白、载体、宿主细胞在一方面,本公开内容使得由全基因合成产生的核酸的集合成为可能。基因合成技术近年已取得相当大的进展并且可产生非常大的核酸集合。以下公司提供了这种合成月艮务Entelechon (Regensburg、Germany)、Geneart (Regensburg、Germany)禾口 Sloning Biotechnology (PuchheinuGermany)。为了使基因合成公司得以产生集合,可提供该集合的每个成员的序列。在一些实施方案中,本公开内容使得编码包含以至少0. 05%的VH和VL类对的浓度存在于至少1 X IO5个B细胞的样品中的VH和VL类对的抗体或其片段的合成核酸的集合成为可能。在其他实施方案中,本公开内容的集合包括以至少1 %的VH和VL类对的浓度存在于至少IXlO5个B细胞的样品中的VH和VL类对。在其他实施方案中,本公开内容的集合包括以至少1.5%的VH和VL类对的浓度存在于至少IXlO5个B细胞的样品中的VH 和VL类对。在其他实施方案中,本公开内容的集合包括以至少2%的VH和VL类对的浓度存在于至少IXlO5个B细胞的样品中的VH和VL类对。在其他实施方案中,本公开内容的集合包括以至少3%的VH和VL类对的浓度存在于至少1 X IO5个B细胞的样品中的VH和 VL类对。在其他实施方案中,本公开内容的集合包括以至少4%的VH和VL类对的浓度存在于至少IXlO5个B细胞的样品中的VH和VL类对。在其他实施方案中,本公开内容的集合包括以至少5%的VH和VL类对的浓度存在于至少1 X IO5个B细胞的样品中的VH和VL 类对。在一些实施方案中,本公开内容使得其中从分离自人宿主的B细胞中鉴定VH和VL 类对的集合成为可能。在一些实施方案中,B细胞是幼稚的。在一些实施方案中,核酸的集合编码包含VH和VL构架区的抗体或其片段。在优选的实施方案中,核酸的集合被合成包括具有多样化的CDR的种系VH和VL构架区。种系构架区是令人期望的,因为包含种系构架区的抗体或其片段不可能具有免疫原性。利用本文公开的集合设计和展示方法,可产生大多样性的集合,因为一些实施方案包括至少1XIO4种核酸序列的集合,一些实施方案包括至少1 X 105、106、IO7,108、109、 IOloUO11或IO12种核酸序列的集合。这种多样性是通过合成包括如下成员的集合而产生 所述成员包括具有多样化的CDR的普遍的VH和VL类对。本公开内容的集合是从基本上代表免疫组库的序列数据而设计。在一些实施方案中,序列数据是通过检索公开可用的免疫球蛋白序列表而获得。例如,可利用Ig-Blast检索NCBI或者可检索公开可用的文献。到2005年为止,该数据库包括至少25,000种FASTA 格式的人重排抗体序列。在22,500个条目中,13,235个代表VH序列,1,506个代表V κ并且2,259个代表V λ。从这些序列中,VH、Vk和V λ可归类为其对应的种系家族和/或基因。因为一些Ig-Blast包括完全的抗体序列,每个VH和VL结构域类配对的正确的种系家族和/或基因可从数据库序列确定。如果利用这种方法,本领域技术人员能够容易地确定每个VH和VL种系家族和/或基因的突出性(prominence)和/或每个VH和VL结构域类对的种系家族和/或基因。选择哪些VH和VL和/或VH和VL类对加入文库中能够以许多方式完成。在一些实施方案中,选择具有最高普遍性的VH和VL加入集合或文库中。在一些实施方案中,选择具有有利的生物物理特性的VH和VL加入集合或文库中。在一些实施方案中,选择具有最高普遍性的VH和VL类对加入集合或文库中。在一些实施方案中,选择具有有利的生物物理特性的VH和VL类对加入集合或文库中。在一些实施方案中,选择具有最高普遍性和/或有利的生物物理特性的VH和VL和/或具有最高普遍性的VH和VL类对和/或具有有利的生物物理特性的VH和VL类对加入集合或文库中。这种方法的一个缺点是公开可用的数据库通常填充了针对特定免疫原而产生的抗体的序列,因此这些序列是有偏性的。此外,在大部分数据库中,重链和轻链的序列是不相联系的,因此不能鉴定VH和VL类配对。在一些实施方案中,核酸序列通过如下方式获得从一个或更多个宿主收获B细胞,从B细胞分离DNA,并且优选地对DNA测序。优选地,B细胞是幼稚的。B细胞的样品是从一个或更多个人供体收获的。以下是可用于分离B细胞的技术。通过使用以抗CD43和抗Mac-1/CDllb单克隆抗体(例如经磁性微珠)针对其他细胞类型的阴性选择从脾脏中分离静息B淋巴细胞(B细胞)。这种策略从脾细胞的混合群中去除非B细胞并且依靠如下事实除了静息的脾B细胞之外大多数成熟的白细胞表达CD43 (事实上,除了粒细胞、单核细胞、巨噬细胞、血小板、自然杀伤(NK)细胞、胸腺细胞和外周CD8+细胞和大多数CD4+T细胞之外,⑶43的表达显示在不成熟的B细胞、浆细胞和某些成熟细胞上)。抗Mac-I/⑶lib 微珠被包括在阴性选择中以改善髓样细胞的除去。通过利用AutoMACS自动磁珠细胞分选仪(Miltenyi Biotec),B细胞分离可以是自动化的。如通过B220+细胞的荧光分析所评定的,这种分离常规地产生> 95%纯的大约4X IO7个B细胞/脾脏。还参见Miltenyi S, Muller W, Weichel W 禾口 RadbruchA. (1990)Cytometry 11 U),231-238。所收获的B细胞的数目基本上代表免疫组库。在一些实施方案中,至少IX IO4个 B细胞从宿主分离,更优选至少IO5个B细胞、更优选至少IO6个B细胞、最优选IO7个B细胞从宿主分离。编码来自B细胞的抗体或其片段的DNA被分离并扩增,例如,重链和轻链通过 PCR反应连接。DNA被优选地测序。测序的DNA可以是从B细胞mRNA产生的cDNA。从真核细胞如B细胞提取mRNA是公知的技术程序。存在许多技术方案并且商业试剂盒是可用的。如PolyATtract mRNA 分离系统(Promega,Madison, WI, USA)或多种 RNeasy 和 OligotexDirectmRNA试剂盒(均来自于Qiagen,Hilden, Germany)。这些技术中许多利用真核mRNA的聚腺苷酸尾,例如经由对oligo (dT)基质如oligo(dT)纤维素的亲和纯化。可以利用特定引物经反转录接着通过常规PCR从分离的mRNA选择性扩增cDNA。 特定引物用于扩增可变重链和可变轻链结构域核酸。参见Cancer Surv. 1997 ;30 =21-44, J Clin. Pathol. 1994 ;47 :493-6, J. Clin. Pathol. 1990 ;43 :888-90 或 Mol. Pathol. 2002 年 4 月;55(2) :98-101。将编码来自一个B细胞的可变和可变轻链结构域的DNA保持在一起,以使得可以鉴定可变结构域重链和轻链类配对。用于分离编码个体B细胞的可变结构域配对的核酸的技术是本领域公知的。见,例如,W001/92291 ;W092/15678 ;W093/03151, W02005/042774 ; Mullinax RL 等人,19^Biotechniques 12 :6864-868 ;Chapal,N.等人 1997Biotechniques 23,518-524,, Embleton MJ 等人,1992Nucleic Acids Res. 20 15,3831—3837 ;Coronella, J. Α.等人2000Nucleic Acids Res. 28 :20,E85 ;Thirion S等人,1996European Journal of Cancer Prevention 5 :6507-511 ;禾口 Wang,X 等人 2000 J. Immunol. Methods20,217—225。这些技术可被单独使用或与其他方法组合使用。例如,如果大样品的可变重链和轻链结构域序列没有从其对应的B细胞中被一起成功地鉴定,那么可完成以下方法,以鉴定正确的可变重链和可变轻链结构域类对。完成了每个个体B细胞的单细胞PCR。优选地,来自每个B细胞的DNA被测序。存在多家能够对整个基因组测序的公司, 如 Helicos Biosciences Corporation (Cambridge, MA, USA) Helicos 能够用其真实单分子测序(True Single Molecule Sequencing )技术直接以高速度和高效率对DNA或RNA 的单分子测序。能够进行类似测序工作的其他公司包括Illumina(San Diego, CA, US A ; Solexa system)和Roche (Basel, CH ;454系统)。在测序之前不需要克隆步骤。在另一方面,本公开内容使得鉴定免疫组库中存在的重链和轻链可变结构域对的种系家族的方法成为可能。使用本领域技术人员已知的方法可将所有抗体或其片段追溯到其种系家族。通过分析编码抗体或其片段的核酸的序列,VH和VL 二者的种系家族可通过
58本领域技术人员已知的方法确定。例如,Wildt等人,(1999)从3位患者中采样B细胞并鉴定了 365种VH和VL类配对。将来自每个B细胞的RNA用于cDNA合成并且对编码VH和 VL区的cDNA进行PCR扩增和测序。如Wildt的图1所示,某些VH和VL类比其他VH和VL 类更频繁配对,例如,VH3-8 与 V κ 3-1、V κ 3-19, V κ 4-1, V κ 2-3 ^ V κ 1-2,以及 VH3-9 与 Vk 3-1、V κ 3-3 或 Vk 1-5。在另一方面,本公开内容使得在合成集合之前设计多样化的互补决定区的方法成为可能。CDR可通过本领域公知的方法设计,包括在Knappik等人2000 ;WO 97/08320中公开的方法。在另一方面,本公开内容使得选择期望被包括在编码抗体或其片段的核酸的集合中的可变结构域类配对的方法成为可能。在一些实施方案中,合成了包含由公开的方法鉴定的所有VH和VL结构域类对的核酸的集合。此外,VH和VL类对的普遍性可通过多种统计检验确定。最简单的形式是,简单地计数个体VH和VL类对。更复杂的统计检验可考虑各种其他参数。通过非限制性实例的方式,以下统计检验和参考文献可作为已在这种或类似的分析中进行大量探讨的实例来指导贝叶斯压缩估计(Bayesian Shrinkage Estimation)(见例如,Biometrics 59(2003) 476-486),DADA (cDNA丰度的数字分析,见例如,BMC Genomics 2002,3 7),线性建模(太平洋生物计算讨论会(Pacific Symposium on Biocomputing),1999,4 :41-52)和各种聚类方法(BMC Bioinformatics 2006,7 :397,第 4 次 IEEE 国际数据挖掘会议(Fourth IEEE International Conference on Data Mining(ICDM' 04)),H 403—406 M)。在其他方面,本公开内容使得包含编码抗体或其片段的核酸集合的载体的集合成为可能。在一些实施方案中,载体包含表达载体、展示载体、噬菌体展示载体或噬菌粒载体。真核表达载体是本领域公知的并且还可商购获得。通常,提供这些载体包含用于插入期望的DNA的便利的限制酶切位点。这些载体的实例包括pSVL和pKSV-10、pBPV-1/ PML2d 和 pTDTl (ATCC,编号 31255)。在其他方面,本公开内容使得用公开的载体集合转化的宿主细胞的集合成为可能。宿主细胞可以是真核的或原核的。细菌细胞是优选的原核宿主细胞并且通常是大肠杆菌(Escherichia coli, Ε. coli)的菌株,诸如,例如,可从 Bethesck Research Laboratories, Inc.,Bethesda, Md获得的大肠杆菌菌株DH5。优选的真核宿主细胞包括酵母和哺乳动物细胞,包括鼠类细胞和啮齿类细胞,优选脊椎动物细胞,如来自小鼠、大鼠、猴或人细胞系的细胞。引入载体到宿主细胞中可通过本领域技术人员已知的许多转化或转染方法完成, 包括磷酸钙沉淀、电穿孔、显微注射、脂质体融合、RBC血影(ghost)融合、原生质体融合、病毒感染以及类似方法。单克隆全长抗体、Fab片段、Fv片段和scFv片段的生产是公知的。用重组DNA分子转化适当的细胞宿主是通过通常取决于所用的载体类型的方法而完成。关于原核宿主细胞的转化,见,例如,Cohen等人,Proceedings National Academy of Science, USA,第 69 卷,第 2110 页(1972);和 Maniatis 等人,Molecular Cloning, a Laboratory Manual (分子克隆实验室指南),冷泉港实验室,冷泉港,纽约(1982)。关于用包含rDNA的逆转录病毒载体转化脊椎动物细胞,见例如,Sorge等人,Mol. Cell. Biol., 4 :1730-1737(1984) ;Graham 等人,Virol. ,52 :456(1973);禾口 Wigler 等人,ProceedingsNational Academy ofSciences,USA,第 76 卷,第 1373-1376 页(1979)。在另一方面,本公开内容使得包含如下序列数据的试剂盒或数据库成为可能,所述序列数据阐述编码如下抗体或其片段的核酸所述抗体或其片段包含在至少IX IO5个幼稚的人B细胞的样品中存在的核酸,其中所述序列数据在可读介质上。在另一方面,本公开内容使得生产编码抗体或其片段的合成核酸的集合的方法成为可能,所述方法包括合成编码包含以至少0. 05%的VH和VL类对存在于至少约2500个B 细胞的样品中的VH和VL类对的抗体或其片段的核酸的集合。在一些实施方案中,本公开内容使得生产编码基本上代表免疫组库的抗体或其片段的核酸的集合的方法成为可能,所述方法包括(a)鉴定以至少0. 05%、至少或至少2%的VH/VL类对的浓度在免疫组库中存在的VH/VL类对;(b)合成编码如下抗体或其片段的核酸的集合所述抗体或其片段包含以至少0. 05%、至少1 %或至少2%的VH/VL类对的浓度在免疫组库中存在的VH/VL类对。在一些实施方案中,鉴定VH/VL类对包括(i)从一个或更多个人宿主中分离B细胞; (ii)通过选自如下的方法确定每个B细胞中的VH/VL类对(A)对编码VH/VL类对的DNA、 mRNA或cDNA进行分离并测序;或(B)用对每个VH和VL特异的一种或更多种核酸探针进行探测;和(iii)分析VH/VL类对。在一些实施方案中,鉴定VH/VL类对包括(i)获得抗体核酸序列;(ii)通过序列比对确定VH/VL类对;(iii)核对这些来自至少100种抗体的序列以鉴定在免疫组库中存在的VH/VL类对。在一些实施方案中,这些方法包括选择显示选自以下组成的组的至少一种生物物理特性的VH/VL类对(i)有效地展示在噬菌体上;(ii) 有效地展示在哺乳动物细胞上;(iii)以Fab形式很好地表达在大肠杆菌中;(iv)以IgG形式很好地表达在哺乳动物细胞中;(ν)热稳定性;(vi)可溶性;和(vii)低免疫原性;以及合成编码显示至少一种所述生物物理特性的抗体或其片段的核酸的集合。在一些实施方案中,编码抗体或其片段的核酸的集合是种系、基本上的种系或密码子优化的种系核酸的变体。在一些实施方案中,在合成编码含VH/VL类对的抗体或其片段的核酸的集合的过程中, 将序列变异引入至少一个互补决定区(CDR)中。在一些实施方案中,序列变异限于不含终止密码子的序列。在一些实施方案中,这些方法还包括将核酸的集合克隆到载体中。在一些实施方案中,载体选自以下组成的组(i)展示载体,(ii)噬菌体展示载体;(iii)噬菌粒载体;和(iv)哺乳动物表达载体。在一些实施方案中,这些方法还包括转化到宿主细胞中。在一些实施方案中,宿主细胞选自由以下组成的组(i)原核宿主细胞;(ii)真核宿主细胞(iii)大肠杆菌宿主细胞;和iv)哺乳动物宿主细胞。一些实施方案还包括将所述核酸插入载体的集合中并且转化/转染到宿主细胞中并展示抗体或其片段。在一些实施方案中,载体是表达载体、展示载体,如噬菌粒载体。一些实施方案还包括将所述载体转染到适合的宿主细胞中。在一些实施方案中,宿主细胞是原核的,例如大肠杆菌,或是真核的,例如哺乳动物细胞。在另一方面,本公开内容使得鉴定对免疫原特异的抗体或其抗体片段的方法成为可能,所述方法包括如下步骤合成编码如下抗体或其片段的核酸的集合所述抗体或其片段包含以至少0. 05%的VH和VL类对的浓度存在于至少约2500个B细胞的样品中的VH 和VL类对;针对特定免疫原筛选该集合;并且选择对所述免疫原特异的一种或更多种抗体或其片段。一些实施方案包括鉴定对免疫原特异的抗体或其抗体片段的方法,所述方法包括如下步骤(a)鉴定以至少0. 05%、至少或至少2%的VH/VL类对的浓度在免疫组库中存在的VH/VL类对;(b)对编码包含以至少0. 05%、至少或至少2%的VH/VL类对的浓度在免疫组库中存在的VH/VL类对的抗体或其片段的核酸的集合进行合成;(c)展示或表达该集合的抗体或其片段;(d)针对特定免疫原筛选该集合;和(e)选择对所述免疫原特异的至少一种抗体或其片段。一些实施方案包括鉴定用于治疗疾病或病症的抗体或其抗体片段的方法,所述方法包括如下步骤(a)鉴定以至少0. 05%、至少或至少2%的VH/VL 类对的浓度在免疫组库中存在的VH/VL类对;(b)鉴定显示选自以下组成的组的至少一种生物物理特性的VH/VL类对(i)有效地展示在噬菌体上;(ii)有效地展示在哺乳动物细胞上;(iii)以Fab形式很好地表达在大肠杆菌中;(iv)以IgG形式很好地表达在哺乳动物细胞中;(ν)热稳定性;(vi)可溶性;和(vii)低免疫原性;(c)合成编码如下抗体或其片段的核酸的集合所述抗体或其片段包含以至少0. 05%、至少或至少2%的VH/VL类对的浓度在免疫组库中存在并展示(i)-(vii)的至少一种生物物理特性的VH/VL类对;(d)展示或表达来自所述集合的抗体或其片段;(e)针对与所述疾病或病症相关的特定免疫原筛选该集合;和(f)选择对所述免疫原特异的至少一种抗体或其片段。在一些实施方案中,B细胞分离自人宿主。在一些实施方案中,B细胞是幼稚的。 在一些实施方案中,在至少1 X约2500个B细胞的样品中存在的VH和VL类对是通过如下方法鉴定的所述方法包括从一个或更多个人宿主收获幼稚B细胞;从收获的B细胞中分离DNA ;并且分析所分离的DNA。在一些实施方案中,分析DNA的步骤包括对DNA测序。在一些实施方案中,分析DNA的步骤还包括鉴定每个VH和VL类对在样品中存在的频率。一些实施方案还包括将所述核酸插入载体的集合中并且转化/转染到宿主细胞中,并展示抗体或其片段。在另一方面,本公开内容使得鉴定对免疫原特异的抗体或其抗体片段的方法成为可能,所述方法包括如下步骤合成编码如下抗体或其片段的核酸的集合所述抗体或其片段包含以至少0. 05%的VH和VL类对的浓度存在于至少约2500个B细胞的样品中的VH 和VL类对;针对特定免疫原筛选该集合;并且选择对所述免疫原特异的一种或更多种抗体或其片段。在一些实施方案中,B细胞分离自人宿主。在一些实施方案中,B细胞是幼稚的。 在一些实施方案中,在至少约2500个B细胞的样品中的VH和VL类对是通过如下方法鉴定的所述方法包括从一个或更多个人宿主收获B细胞;从收获的B细胞中分离DNA ;并且分析所分离的DNA。在一些实施方案中,分析DNA的步骤包括对DNA测序。在一些实施方案中,分析DNA的步骤还包括鉴定每个VH和VL类对在样品中存在的频率。在一些实施方案中,在测试/筛选之前利用噬菌体、酵母、核糖体、细菌或真核的展示来展示集合。在一些实施方案中,集合被展示在原核或真核细胞上。在一些实施方案中,集合以Fab或IgG形式或其他本领域技术人员已知的形式展示。筛选可以通过使用本领域公知的方法之一进行,例如噬菌体展示、选择性感染的噬菌体、筛选结合的多核糖体技术、以及用于酶活性或蛋白稳定性的测定系统。许多这类方法是本领域技术人员已知的并且作为示例性参考文献在以下提供Valle RP, Curr. Opin.Drug Discov. Devel. 2003 ¥ 3 月;6 (2) :197-203 ;Ackermann BL Expert Rev. Proteomics. 2007 年 4 月;4 (2) :175-86 ;禾口 Anderson KS J Proteome Res. 2005 年 7—8 月; 4(4) 1123-33。
61
在一个实施方案中,进行筛选测定以使得抗体对配体的结合直接或间接产生可检测的信号。这些信号包括,例如,复合物的产生、催化反应产物的形成、能量的释放或摄取,等等。来自用主题的重组DNA进行转化的群体的细胞可被克隆以产生例如单克隆集落。可以将来自这些集落的细胞收获、裂解并且用本领域已知的方法检验其DNA内容物的重组DNA的存在,所述本领域已知的方法例如在Southern, J. Mol. Biol. ,98 :503(1975)或 Berent 等人,Biotech. 3 :208(1985)中所述的。生物物理特性本发明还包括集合以及制备这些集合的方法,在这些集合中VH/VL类对具有令人期望的生物物理特性。有利的和期望的生物物理特性包括较高的稳定性、较高的表达水平和低的聚集倾向。适合的生物物理特性便于在不同的阶段利用集合。例如,如果抗体或其片段是可溶的并且不聚集,且被很好地表达在筛选背景如噬菌体中,那么有利于集合的筛选。以下特性使得诸如用于动物试验和治疗用途的抗体的随后开发变得容易诸如抗体可溶性、热稳定性、高水平表达(尤其是作为IgG在哺乳动物中的高水平表达)和低免疫原性。为了确保全部或至少大多数的抗体或其片段具有这些有利的生物物理特性,可提前筛选VH/VL类对以鉴定哪些类对显示这些特性中的哪些。然后通过合成只编码那些具有这类有利的生物物理特性的抗体的核酸来构建文库。当然,不是所有的VH/VL类对都将以相同的程度显示所有的生物物理特性,并且技术人员将在确定要合成哪些VH/VL类对之前确定哪些特性是更相关的和/或每种特性的平衡。因而,在某些方面,本发明提供了选择被有效地展示诸如在噬菌体表面上或在其他展示技术中的VH/VL组合的合成抗体文库。优选地全部、基本上全部或实质上全部的VH/ VL组合被有效的展示。展示效率可通过如在本发明中所述的噬菌体夹心ELISA测量。在其他方面,本发明提供了选择被以Fab形式很好地表达在大肠杆菌中的VH-VL 组合的合成抗体文库。优选地全部、基本上全部或实质上全部的VH/VL组合被以Fab形式很好地表达在大肠杆菌中。在大肠杆菌中以Fab形式的表达可被定量且在细菌培养物中优选为多于ang/L、多于5mg/L、多于10mg/L或多于15mg/L。在某些方面,所有的VH-VL以多于2mg/L表达,基本上所有的VH-VL组合以多于5mg/L的水平表达,大部分VH-VL组合以多于10mg/L的水平在细菌培养物中表达,和/或至少两个、至少三个、至少四个或至少五个 VH-VL组合以多于15mg/L的水平在细菌培养物中表达。在某些方面,本发明提供了选择被以Fab形式很好地表达在哺乳动物系统中的 VH-VL组合的合成抗体文库。目前市售的绝大多数基于抗体的治疗性生物制品为IgG形式是因为多种原因(i)由于IgG与新生儿受体(Fcfoi)的相互作用,IgG分子在人体内的半衰期非常高(约3周);(ii) IgG分子是高度可溶的、热力学稳定的且对血液中的蛋白酶是相对耐受的;和(iii) IgG具有清除肿瘤细胞所需的ADCC(抗体依赖性细胞介导的细胞毒作用)和/或CDC(补体依赖性细胞毒作用)活性。Fab形式的特定VL/VH组合的表达不一定与IgG形式的相同的VL/VH组合的表达相关,所以IgG形式的VL/VL组合的表达和可溶性也是重要的独立因素。哺乳动物系统可包括,例如,哺乳动物悬浮培养、哺乳动物粘附细胞培养、HKBll细胞、PERC. 6细胞或CHO细胞。优选地全部、基本上全部或实质上全部的VH/VL组合被以IgG 形式很好地表达在哺乳动物系统中。在某些方面本发明提供了合成的人抗体文库,其中所有的VH-VL组合以多于10mg/L的水平以IgG形式被表达在哺乳动物系统中,其中基本上全部的VH-VL组合以多于15mg/L的水平以IgG形式被表达在哺乳动物系统中;其中大多数 VH-VL组合以多于20mg/L的水平以IgG形式被表达在哺乳动物系统中;和/或至少三种、 至少四种或至少五种VH-VL组合以多于25mg/L的水平以IgG形式被表达在哺乳动物系统中。在某些方面,本发明提供了选择热稳定的VH/VL组合的合成抗体文库。优选地全部、基本上全部或实质上全部的组合是热稳定的,具有至少681、701、721、741或761 的Tm。可以如本文所述测量热稳定性。在某些方面,本发明提供了合成的人抗体文库,其中基本上全部的VH-VL组合具有多于68°C的Tm ;基本上全部的VH-VL组合具有多于70°C的 Tm,或多于72°C的Tm ;大多数VH-VL组合具有多于74°C的Tm ;和/或许多VH-VL组合具有多于76°C的Tm。在某些方面,至少三种、至少四种或至少五种VH-VL组合具有多于70°C的 Tm。在某些方面,本发明提供了选择可溶(即不趋向于聚集)的VH-VL组合的合成抗体文库。可以通过如下方式确定可溶性例如,通过测试的Fab在细菌宿主或IgGl在真核宿主中良好的折叠和表达特征或在纯化后通过分析性尺寸排阻色谱而确定的聚集。低免疫原性可被预测或通过本领域已知的方法直接测试,但也可以通过以下事实推断给定VH/VL类对在文库中是最丰富的并且使用的蛋白序列是基本上的种系蛋白序列。如本文所述,抗体序列数据可以从B细胞获得,例如,幼稚B细胞、公开可用的数据库和/或文献。可将每个抗体序列与最接近的种系家族和/或基因比对。从这个数据,人们能够确定丰富的VH和VL种系家族和/或基因和/或VH/VL类对。确定丰富的VH和VL种系家族和/或基因和/或VH/VL类对后,人们能够选择测试哪些VH和VL种系家族和/或基因和/或VH/VL类对的有利的生物物理特性。一种方法是根据丰度将VH和VL种系家族和/或基因排序,然后测试最丰富的VH和VL种系家族和 /或基因,例如前20最丰富的VH和VL种系家族和/或基因。此外,人们可以组合前20种最丰富的VH和VL种系家族和/或基因,产生例如400个VH和VL的组合,并测试它们的有利的生物物理特性。另外或补充地,人们能够测试最丰富的VH/VL类对的有利的生物物理特性。有利的生物物理特性包括但不限于⑴它们以Fab形式被很好地展示在噬菌体上;(ii)它们以IgG形式被很好地展示在哺乳动物细胞上;(iii)它们以Fab形式被大量表达在例如大肠杆菌中,以及以IgG形式被大量表达在例如哺乳动物细胞中;(iv)是热力学稳定的;(ν)具有高血清稳定性;(vi)具有低聚集倾向(即高可溶性);和(vii)具有低免疫原性风险。在一些方面,本发明包括编码如下抗体或其片段的合成核酸的集合所述抗体或其片段包含以至少0. 5 %的VH和VL类对的浓度存在于至少1 X IO5个B细胞的样品中的VH 和VL类对。在一些实施方案中,VH和VL类对以至少的VH和VL类对的浓度存在于至少IXlO5个B细胞的样品中。在一些实施方案中,VH和VL类对以至少2%的VH和VL类对的浓度存在于至少IXlO5个B细胞的样品中。在一些实施方案中,B细胞分离自人宿主。 在一些实施方案中,B细胞是幼稚的。在一些方面,集合包括编码包含种系VH和VL构架区的抗体或其片段的核酸。在一些实施方案中,集合包括至少IX IO4种核酸序列、至少IX IO6 种核酸序列、至少1 X IO8种核酸序列、至少1 X IOltl种核酸序列、或至少1 X IO11种核酸序列。在一些方面,本发明包括包含如下序列数据的试剂盒,所述序列数据阐述编码如下抗体或其片段的核酸所述抗体或其片段包含在至少IXlO5个幼稚的人B细胞的样品中存在的核酸,其中所述序列数据在可读介质上。在一些实施方案中,本发明包括编码抗体或其功能片段的核酸的集合。在一些实施方案中,载体是噬菌体展示载体。在一些实施方案中,载体是噬菌粒载体。在一些方面,本发明包括用集合载体转化的宿主细胞,所述集合载体包括编码抗体或其功能片段的核酸的集合。在一些实施方案中,宿主细胞是原核的。在一些实施方案中,宿主细胞是大肠杆菌。在一些实施方案中,宿主细胞是真核的。在一些实施方案中,宿主细胞是哺乳动物细胞。在一些方面,本发明包括生产编码抗体或其片段的合成核酸的集合的方法,所述方法包括合成编码如下抗体或其片段的核酸的集合所述抗体或其片段包含以至少 0. 5%的VH和VL类对的浓度存在于至少1 X IO5个B细胞的样品中的VH和VL类对。在一些实施方案中,B细胞分离自人宿主。在一些实施方案中,B细胞是幼稚的。在一些实施方案中,通过包括如下步骤的方法鉴定存在于至少1 X IO5个B细胞的样品中的VH和VL类对aa)从一个或更多个人宿主中收获幼稚B细胞;ab)从步骤aa)中收获的B细胞分离DNA ;和ac)分析在步骤ab)中分离的DNA。在一些实施方案中,分析DNA的步骤包括对DNA测序。在一些实施方案中,分析DNA 的步骤还包括鉴定每个VH和VL类对存在于样品中的频率。在一些实施方案中,这些方法还包括将核酸插入到载体的集合中。在一些实施方案中,载体是表达载体。在一些实施方案中,载体是展示载体。在一些实施方案中,展示载体是噬菌粒载体。在一些实施方案中, 所述方法还包括将所述载体转染到适合的宿主细胞中。在一些实施方案中,宿主细胞是原核的。在一些实施方案中,宿主细胞是大肠杆菌。在一些实施方案中,宿主细胞是真核的。 在一些实施方案中,宿主细胞是哺乳动物细胞。在一些方面,本发明包括鉴定对免疫原特异的抗体或其抗体片段的方法,所述方法包括如下步骤a)合成编码如下抗体或其片段的核酸的集合所述抗体或其片段包含以至少0. 5%的VH和VL类对的浓度存在于至少1 X IO5个B细胞的样品中的VH和VL类对; b)针对特定免疫原筛选该集合;和c)筛选对所述免疫原特异的一种或更多种抗体或其片段。在一些实施方案中,B细胞分离自人宿主。在一些实施方案中,B细胞是幼稚的。在一些实施方案中,通过包括如下步骤的方法鉴定存在于至少1 X IO5个B细胞的样品中的VH和 VL类对aa)从一个或更多个人宿主中收获幼稚B细胞;ab)从步骤aa)中收获的B细胞分离DNA ;和ac)分析在步骤ab)中分离的DNA。在一些实施方案中,分析DNA的步骤包括对DNA测序。在一些实施方案中,分析 DNA的步骤还包括鉴定每个VH和VL类对存在于样品中的频率。在一些实施方案中,合成集合的步骤还包括将所述核酸插入到载体的集合中。在一些实施方案中,所述方法还包括将所述载体转染到适合的宿主细胞中。在一些实施方案中,所述方法还包括展示所述集合。
实施例棚列1甚應言辦卿AtfT辦歹_立神种限吿丨瞧搬,点避系FRl区一方面,本公开内容描述了包括含种系蛋白序列的构架区特别是FRl的抗体的集合。预期具有种系序列将降低抗体在施用于人时的免疫原性风险。然而,必须使用相容的限制酶切位点以使得能将编码抗体集合的核酸标准地克隆到展示载体和/或表达载体中, 以便可针对免疫原筛选抗体。过去,用于克隆的限制酶切位点通常位于构架区内,从而修饰核酸和/或氨基酸序列远离种系。为了确保本公开内容的每种抗体的至少构架I(FRl)区保持种系蛋白序列,在FRl内应该没有任何非天然存在的限制酶切位点。因此,本公开内容的一个方面是在原核信号序列和人前导序列的C端内具体是在三个C端残基内掺入相同的或至少相容的限制酶切位点。另外,包含相同的或相容的限制酶切位点的信号序列和前导序列必须是有功能的并且容许抗体或其片段在原核和哺乳动物表达系统中均有良好的展示和表达水平。^MM 1. 1 在大肠杆菌信号序歹Il的C端丰富的某的分析以下描述了要掺入信号序列大肠杆菌ompA和phoA的C端中的限制酶切位点的选择和得到的信号序列的功能性的评估。第一步,分析在信号序列的C端三个氨基酸(_3到-1)处的常见氨基酸残基,并且产生如表1所示的共有序列。见Chou等人,Prediction of protein signal sequences (蛋白信号序列的预测),Protein Pept. Sci. 3(6) =615-22(2002 年 12 月)。信号序列的三个C端氨基酸的共有序列-3-2-1ALASAGVSST Q在-3位,主要观察到A、S、V和T氨基酸。在_2位,主要观察到L、A、S和Q氨基酸。在-1位,主要观察到A、G和S。棚列1.2:(DhoA) _吿丨瞧爐在比较表1中所示的共有序列与已知限制酶切位点后,选择以下三个限制酶切位点AflII、NheI和AvrII用于掺入到phoA C端中并随后研究其表达水平。重要的是注意到哪些情况下将野生型核苷酸序列改变成修饰的核苷酸序列氨基酸序列也被改变。选择的限制酶切位点的核酸序列和对应的氨基酸序列显示在表2中。表2 AflllVLS
GTC TTA AGY
NhelVLA
GTG CTA GCN
AvrllVLG
GTC CTA GGN作为对照,研究野生型phoA信号序列的表达水平。包括3个C端序列的野生型 PhoA信号序列的核酸和氨基酸序列显示在表3中。表3 野生型大肠杆菌phoA信号序列(从-3位到-1位的C端氨基酸序列是没有限制酶切位点的TKA)MKQSTIALALLPLLFTPVTKAATGAAACAGAGCACCATTGCCCTGGCCCTGCTGCCGCTGCTGTTTACCCCAGTGACCAAAGCCPhoA 野生型 C 端 TKAACC AAA GCC为了评估表达水平,将表2中所示的限制酶切位点掺入到phoA信号序列中,从而还修饰了野生型氨基酸序列。得到的信号序列用来表达包含a)VH3-23或b)VHl_69种系蛋白序列的Fab片段。选择这些种系序列因为它们已知是稳定的并且被很好地表达。将 4D5抗体的CDR-H3 (WG⑶GFYAMDY)掺入到VH3-23和VH1-69种系基因序列中,并且JH4种系基因序列用于FR4。4D5抗体被公开在(PDB条目IFVC ;Carter, P.,Presta, L.,Gorman, C. Μ. , Ridgway, J. B. , Henner, D. , Wong, W. L.等人(1992) ; Humani ζ at ion Biophysical Properties of Human Antibody Domains551 of an anti-p 185HER2 antibody for human cancer therapy (用于人癌症治疗的抗pl85HER2抗体的人抗体结构域551的人源化生物物理特性)· Proc. Natl Acad. Sci. USA, 89,4285-4289 中。产生基于 pMORPHXll (示于图 50)的质粒,所示质粒包括a)包含表2的C端限制酶切位点和氨基酸序列的phoA信号序列,b) VH3-23和VH1-69的VH序列,该VH序列如以上所示掺入了 CDR-H3和JH4,和c)来自 M0R03207的稳定的且很好地表达的轻链。在Geneart (Regensburg,Germany)产生了所有的基因。通过在周质提取后进行抗Fd ELISA来检查表达和周质运输。在周质提取后使用 BBS缓冲液的抗Fd表达ELISA的结果显示在图1中。如所示的,在VH3-23组中,包括C端限制酶切位点AfIII (VLS)、NheI (VLA)和AvrII (VLG)的信号序列保持在野生型(TKA)范围内的表达水平,其中NheI(VLA)比野生型(TKA)表现得更好。另外,在摇瓶中过夜培养后进行大肠杆菌中的Fab表达,并且在通过亲和色谱和缓冲液更换的Fab纯化后确定了 Fab生产水平。结果显示在表4中。表 4 使用包括C端限制酶切位点AfIII (VLS) ,NheI (VLA)和AvrII (VLG)的信号序列相比于野生型(TKA)的Fab表达
66Fab构建体表达率(mg/L)
VH3-23 TKA11.0
VH3-23 VLS2.0
VH3-23 VLA11.0VH3-23 VLG9.0
VHl-69 TKA7.5
VH1-69 VLS5.0
VHl-69 VLA2.5
VH1-69 VLG3.5如所示的,包括C端限制酶切位点AfIII (VLS)、NheI (VLA)和AvrII (VLG)的信号序列相比于野生型(TKA)表达相似量的Fab。基于以上数据,选择NheI (VLA)限制酶切位点掺入到重链信号序列(phoA)中。修饰的NheI (VLA) phoA信号序列的核酸和氨基酸序列显示在表5中。^ 5具有C端VLA和NheI限制酶切位点(=GCTAGC)的修饰的大肠杆菌phoA信号序列MKQSTIALALLPLLFTPVVLAATGAAACAGAGCACCATTGCCCTGGCCCTGCTGCCGCTGCTGTTTACCCCAGTGGTGCTAGCC实施例1.3 用于κ和λ轻链大肠杆菌信号序列(ompA)的限制酶切位点的选择与实施例1. 2中所述相似的方法用于选择掺入到κ和λ的轻链信号序列(ompA) 的C端中的限制酶切位点。在比较表1中所示的共有序列与已知的限制酶切位点后,选择以下限制酶切位点NdeI (AYG)、NdeI (AYA)和BsiWI (TYA)掺入到ompA C端,从而还修饰该氨基酸序列,随后研究其表达水平。选择的限制酶切位点的序列显示在表6中。表 6
NdelAYG
GCA TAT GGN
NdelAYA
GCA TAT GCN
BsiWITYA
ACG TAC GCN作为对照,研究野生型ompA信号序列的表达水平。包括3个C端序列的野生型 ompA信号序列的核酸和氨基酸序列显示在表7中。表7 野生型大肠杆菌ompA信号序列(从_3位到_1位的C端氨基酸序列是没有限制酶切位点的AQA)
MKKTAIAIAVALAGFATVAQAATGAAAAAAACCGCCATTGCCATTGCCGTGGCCCTGGCAGGCTTTGCCACCGTGGCGCAGGCCOmp 野生型 C 端 A Q AGCG CAG GCC为了评估表达水平,将表6中所示的限制酶切位点掺入ompA信号序列中。得到的修饰的信号序列用于表达Fab片段,所述Fab片段包括a) κ 1012 (IGKV1-39),b) k3L6(IGKV3-11),或c) λ Vl-13 (IGLV1-40)种系基因序列。选择这些种系序列因为它们已知是稳定的并且被很好地表达。在a) κ 1012(IGKVl-39)和b) κ 3L6 (IGKV3-11) 中,掺入了 CDR-L3 区QQHYTTPPT(对于 κ ),在 c) λ 1 Vl-13 (IGLV1-40)中,掺入了 CDR-L3区QSYDSSLSGVV (对于λ ),并且在a) -c)中,Jkl种系基因序列用作κ轻链的FR4;并且J12/3种系基因序列用作λ轻链的FR4。产生了 pMORPHXll (图50中所示)质粒,其包括a)包含表6的C端限制酶切位点的ompA信号序列,b)VL种系序列 κ 1012(IGKVl-39)、b) κ 3L6 (IGKV3-11)或 c) λ 1V1-13 (IGLV1-40),该 VL 种系序列如上所述掺入了⑶R-L3和FR4,以及c)在实施例1. 2中所述的为重链的IGHVH3-23TKA构建体。 在 Geneart (Regensburg, Germany)产生了所有的基因。通过进行在大肠杆菌中的过夜Fab生产、周质提取、和周质提取后的抗Fd ELISA, 检查了表达和周质运输。在周质提取后使用BBS缓冲液的抗Fd表达ELISA的结果显示在图2中。如所示的,包括NdeI (AYA)的信号序列显示与野生型(AQA) —样好或更好的表达。另外,在摇瓶中过夜培养后进行大肠杆菌中的Fab表达,并且在通过亲和色谱和缓冲液更换的Fab纯化后确定了 Fab生产水平。结果显示在表8中。表 8 使用与野生型(AQA)相比包括C端限制酶切位点NdeI (AYA)的信号序列的Fab表达。
构建体表达率(mg/L)
VK1-39 AQA8.5
VK1-39 AYA5.5VK3-11 AQA7.0
VK3-11AYA9.5
VL1-40 AQA5.0
VL1-40 AYA5.0基于以上数据,选择NdeI (AYA)限制酶切位点掺入到κ和λ信号序列(ompA)中。 修饰的NdeI (AYA) ompA信号序列的核酸和氨基酸序列显示在表9中。^ 9具有C端AYA和NdeI限制酶切位点(=CATATG)的修饰的大肠杆菌ompA信号序列MKKTAIAIAVALAGFATVAYAATGAAAAAAACCGCCATTGCCATTGCCGTGGCCCTGGCAGGCTTTGCCACCGTGGCATATGCC实施例1. 4 在噬菌体展示中Fab片段被信号序列展示的效率的评估
如实施例1. 2和1. 3中所述,选择以下限制酶切位点掺入到Fab信号序列和IgG 前导序列的C端重链可变区(phoA和重链前导序列):NheI (VLA)轻链可变区(κ和λ) (ompA禾口 κ前导序列)Nde I (AYA)图3显示选择的限制酶切位点和对应的氨基酸序列。为了显示这些修饰的信号序列介导Fab片段的有效运输和生产,产生了掺入选择的信号序列到三顺反子展示载体中的载体构建体,该载体构建体编码VH、VL和pill (用于噬菌体展示的噬菌体外壳蛋白ρΙΠ)。这样做是为了证实包含所选的信号序列的这些载体能够提供有用的噬菌体展示率。产生了 PJPdl (图48所示)三顺反子载体构建体,其包含VH3-23或VH1-69种系基因的VH,或VL1-40、VK3-11、或VK1-39种系基因的VL,以及选择的重链(PhoA)限制酶切位点NheI (VLA),且野生型phoA(TKA)作为对照,或选择的轻链 (ompA)限制酶切位点NdeI (AYA),且野生型ompA(AQA)作为对照。此外,产生了包含相同组分的pM0RPH30(图51所示)三顺反子载体构建体作为对照。相对展示率显示在表10中。表10
权利要求
1.合成抗体或其功能片段的集合,所述合成抗体或其功能片段包含可变重链构架区和可变轻链构架区,其中所述可变重链构架区和所述可变轻链构架区包含种系蛋白对的种系蛋白序列, 其中所述种系蛋白对包含如下特性i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与FabVH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性; ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在血清中的稳定性;其中所述抗体或其功能片段的集合包括至少两个不同的种系蛋白对的种系蛋白序列,并且其中所述种系蛋白对由种系基因对编码。
2.根据权利要求1所述的集合,其中所述可变重链构架区和所述可变轻链构架区基本上由包含如下特性的种系蛋白对的种系蛋白序列组成i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与FabVH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性; ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。
3.根据权利要求1或2所述的集合,其中所述可变重链构架区和所述可变轻链构架区由包含如下特性的种系蛋白对的种系蛋白序列组成i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与FabVH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性; ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。
4.根据前述权利要求中任一项所述的集合,其中所述种系基因对以至少0.05%的浓度存在于人免疫组库中。
5.根据前述权利要求中任一项所述的集合,其中所述种系基因对以至少0.23%的浓度存在于人免疫组库中。
6.根据前述权利要求中任一项所述的集合,其中所述种系基因对以至少0.51%的浓度存在于人免疫组库中。
7.根据前述权利要求中任一项所述的集合,其中所述种系基因对以至少0.07%的浓度存在于幼稚的人免疫组库中。
8.根据前述权利要求中任一项所述的集合,其中所述种系基因对以至少0.52%的浓度存在于幼稚的人免疫组库中。
9.根据前述权利要求中任一项所述的集合,其中所述种系基因对以至少0.88%的浓度存在于幼稚的人免疫组库中。
10.根据前述权利要求中任一项所述的集合,其中所述抗体或其功能片段包括人序列。
11.根据前述权利要求中任一项所述的集合,其中所述抗体或其功能片段的集合包括至少十七个不同的种系蛋白对的种系蛋白序列。
12.根据前述权利要求中任一项所述的集合,其中所述抗体或其功能片段包括含种系蛋白序列的一个或更多个互补决定区。
13.根据前述权利要求中任一项所述的集合,其中所述抗体或其功能片段包括含种系蛋白序歹丨J的FRl区、CDRl区、FR2区、CDR2区和FR3区。
14.根据前述权利要求中任一项所述的集合,其中所述抗体或其功能片段包括选自由以下组成的组的FR4区JH4、J κ 1禾口 J λ 2/3。
15.根据前述权利要求中任一项所述的集合,其中所述抗体或其功能片段包括多样化的HCDR3区。
16.根据前述权利要求中任一项所述的集合,其中所述抗体或其功能片段包括多样化的LCDR3区。
17.根据前述权利要求中任一项所述的集合,其中所述集合包括IXIO4种抗体或其功能片段。
18.根据前述权利要求中任一项所述的集合,其中所述种系蛋白对包括包含在采样的前60% Fab中的值的以Fab形式的相对展示率。
19.根据前述权利要求中任一项所述的集合,其中所述种系蛋白对包括与Fab VH1-69VLA_V11-40AYA相比至少0. 6的以Fab形式的表达水平。
20.根据前述权利要求中任一项所述的集合,其中所述种系蛋白对包括以Fab形式在 70°C或更高温度持续至少45分钟的热稳定性。
21.根据前述权利要求中任一项所述的集合,其中所述种系蛋白对包括与M0R03080相比至少0. 6的以IgG形式的表达水平。
22.根据前述权利要求中任一项所述的集合,其中所述可变重链构架区和所述可变轻链构架区包括选自由以下组成的组的种系蛋白对的种系蛋白序列IGHV3-23/ IGKV1-5 ;IGHV3-23/IGKV3-20 ;IGHV4-39/IGKV3-15 ;IGHV3-23/IGKV3-15 ;IGHV4-39/ IGKV1-39/1D-39 ; IGHV1-18/IGKV3-20 ; IGHV3-30/IGKV3-20 ; IGHV4-39/IGKV1-5 ; IGHV1-69/IGKV1-39/1D-39 ; IGHV5-51/IGLV1-40 ; IGHV4-39/IGKV3-20 ; IGHV3-23/ IGLV2-14 ; IGHV4-39/IGLV 3-21 ; IGHV3-23/IGKV1-39/1D-39 ; IGHV3-30/IGKV1-39/1D-39 ; IGHV1-69/IGKV3-20 ;IGHV3-48/IGKV3-20 ;IGHV1-2/IGKV3-20 ;IGHV3-30/IGKV4-1 ; IGHV5-51/IGLV 2-14 ; IGHV5-51/IGKV3-20 ; IGHV3-7/IGKV1-39/1D-39 ; IGHV3-7/ IGKV1-5 ;IGHV3-15/IGKV3-20 ;IGHV4-39/IGLV2-14 ;IGHV3-23/IGKV3-11 ;IGHV3-30/ IGKV1-5 ;IGHV3-30/IGKV3-15 ; IGHV3-21/IGKV1-5 ; IGHV3-21/IGKV3-15 ; IGHV3-30/IGLV 1-51 ;IGHV3-21/IGLV 1-51 ;和 IGHV1-69/IGKV3-11。
23.根据前述权利要求中任一项所述的集合,其中所述抗体的所述功能片段选自由 Fab、F (ab ‘ ) 2、Fab,、Fv 禾口 scFv 组成的组。
24.编码根据前述权利要求中任一项所述的集合的核酸的集合。
25.—种载体,所述载体包含权利要求M所述的核酸。
26.一种重组宿主细胞,所述重组宿主细胞包含权利要求M所述的核酸或权利要求25 所述的载体。
27.如权利要求沈所述的重组宿主细胞,所述重组宿主细胞是原核的或真核的。
28.根据权利要求27所述的重组宿主细胞,所述重组宿主细胞是大肠杆菌(E.coli)或哺乳动物细胞。
29.合成抗体或其功能片段的集合,所述合成抗体或其功能片段包含可变重链构架区和可变轻链构架区,其中所述构架区包括种系蛋白序列, 其中所述种系蛋白序列包含如下特性 i)在互补决定区中四个或更少的翻译后修饰; )在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位; ν)中等或低的聚集倾向;和vi)至少7. 5的等电点;且其中所述抗体或其功能片段的集合包括至少两种不同的可变重链种系蛋白序列, 其中所述种系蛋白序列由种系基因序列编码。
30.根据权利要求四所述的集合,其中所述可变重链种系基因序列或可变轻链种系基因序列以至少0. 5%的浓度存在于人免疫组库中。
31.根据权利要求四或30所述的集合,其中所述抗体或其功能片段的集合包括至少五种不同的可变重链种系蛋白序列。
32.根据权利要求四-31中任一项所述的集合,其中所述抗体或其功能片段包括人序列。
33.根据权利要求四-32中任一项所述的集合,其中所述可变重链种系基因序列或可变轻链种系基因序列以至少5. 0%的浓度存在于人免疫组库中。
34.根据权利要求四-33中任一项所述的集合,其中所述抗体或其功能片段包括含种系蛋白序列的一个或更多个互补决定区。
35.根据权利要求四-34中任一项所述的集合,其中所述抗体或其功能片段包括含种系蛋白序列的FRl、CDRl、FR2、CDR2和FR3。
36.根据权利要求四-35中任一项所述的集合,其中所述抗体或其功能片段包括选自由以下组成的组的FR4区JH4、J κ 1禾口 J λ 2/3。
37.根据权利要求四-36中任一项所述的集合,其中所述抗体或其功能片段还包括多样化的HCDR3区。
38.根据权利要求四-37中任一项所述的集合,其中所述抗体或其功能片段还包括多样化的IXDR3区。
39.根据权利要求四-38中任一项所述的集合,其中所述集合包括IXIO4种抗体或其功能片段。
40.根据权利要求四-39中任一项所述的集合,其中所述可变重链种系蛋白序列选自由以下组成的组IGHV3-23 ; IGHV3-30 ; IGHV4-39 ; IGHV4-34 ; IGHV4-59 ; IGHV1-69 ; IGHV5-51 ;IGHV3-7 ;IGHV1-18 ;IGHV3-48 ;IGHV3-15 ;IGHV3-21 ;IGHV1-2 ;IGHV3-33 ; IGHV4-31 ;IGHV3-53 ;IGHV3-11 ;IGHV3-9 ;IGHV4-4 ;IGHV1-46 ;IGHV3-74 ;IGHV1-24 ; IGHV4-61 ; IGHV1-8 ; IGHV1-3 ; IGHV3-49 ; IGHV3-43 ; IGHV4-28 ; IGHV3-64 ;禾口 IGHV7-81。
41.根据权利要求四-40中任一项所述的集合,其中所述可变κ轻链种系蛋白序列选自由以下组成的组 JGKV3-20 ; IGKV1-39/1D-39 ; IGKV1-5 ; IGKV3-15 ; IGKV4-1 ; IGKV3-11 ; IGKV2-28/2D-28 ; IGKV1-33/1D-33 ; IGKV2-30 ; IGKV1-9 ;IGKV1-17 ; IGKV1-27 ; IGKV1-8 ; IGKV1-16 ; IGKV1-6 ;IGKV1-12 ; IGKV2D-29 ;IGKV1-13 ; IGKV1D-8 ;和 IGKV2-24。
42.根据权利要求四-41中任一项所述的集合,其中所述可变λ轻链种系蛋白序列选自由以下组成的组 JGLV2-14 ;IGLV1-40 ;IGLV1-44 ;IGLV1-51 ;IGLV2-23 ;IGLV3-21 ; IGLV1-47 ;IGLV3-1 ;IGLV2-11 ; IGLV2-8 ; IGLV6-57 ; IGLV3-25 ; IGLV7-46 ;IGLV1-36 ; IGLV7-43 ; IGLV9-49 ; IGLV4-69 ; IGLV2-18 ; IGLV3-10 ;和 IGLV3-27。
43.一种生产根据权利要求1-3中任一项所述的合成抗体或其功能片段的集合的方法。
44.根据权利要求43所述的方法,其中所述生产的步骤还包括产生含可变重链构架区和可变轻链构架区的抗体或其功能片段的集合,其中所述可变重链构架区和所述可变轻链构架区包含种系蛋白对的种系蛋白序列, 其中所述种系蛋白对包含如下特性i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与FabVH1-69VLA_V11_40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性; ν)与M0R03080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性;且其中所述抗体或其功能片段的集合包括至少两个不同的种系蛋白对。
45.根据权利要求43或44所述的方法,其中所述生产的步骤还包括如下步骤a)获得包括在人免疫组库中存在的可变重链和可变轻链种系基因对的数据;b)鉴定包含如下特性的可变重链和可变轻链种系蛋白对i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与FabpMxll_FH VH1-69VLA_V11-40AYA相比至少0. 4的以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性; ν)与M0R3080相比至少0. 4的以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性;且c)产生包含在步骤b)中鉴定的种系蛋白对的可变重链种系蛋白序列和可变轻链种系蛋白序列的抗体或其功能片段的集合。
46.根据权利要求45所述的方法,其中步骤b)还包括如下步骤ba)鉴定以至少0. 05%的浓度存在于人免疫组库中的可变重链和可变轻链种系基因对;bb)产生包含在步骤ba)中鉴定的种系蛋白对的抗体或其功能片段;和 be)评估所述种系蛋白对的如下特性i)以Fab形式的相对展示率;ii)以Fab形式的表达水平;iii)以Fab形式在60°C或更高温度的热稳定性;iv)以Fab形式在37°C持续大于十天的在牛血清或小鼠血清中的稳定性; ν)以IgG形式的表达水平;和vi)以IgG形式在37°C持续十四天的在牛血清中的稳定性。
47.根据权利要求45或46所述的方法,其中步骤a)还包括如下步骤aa)从样品中分离人B细胞;ab)从所述B细胞产生cDNA;ac)PCR扩增来自所述B细胞的cDNA ;ad)对PCR产物测序;ae)鉴定每种PCR产物的种系基因。
48.根据权利要求43-46中任一项所述的方法,其中产生集合的所述步骤还包括如下步骤ca)合成编码所述抗体或其功能片段的核酸;cb)将所述核酸克隆到载体中;cc)表达所述抗体或其功能片段。
49.根据权利要求43-48中任一项所述的方法,其中所述种系基因对以至少0.05%的浓度存在于人免疫组库中。
50.根据权利要求43-49中任一项所述的方法,其中所述种系基因对以至少0.23%的浓度存在于人免疫组库中。
51.根据权利要求43-50中任一项所述的方法,其中所述种系基因对以至少0.51%的浓度存在于人免疫组库中。
52.根据权利要求43-51中任一项所述的方法,其中所述种系基因对以至少0.07%的浓度存在于幼稚的人免疫组库中。
53.根据权利要求43-52中任一项所述的方法,其中所述种系基因对以至少0.52%的浓度存在于幼稚的人免疫组库中。
54.根据权利要求43-53中任一项所述的方法,其中所述种系基因对以至少0.88%的浓度存在于幼稚的人免疫组库中。
55.根据权利要求43-54中任一项所述的方法,其中所述抗体或其功能片段包括人序列。
56.根据权利要求43-55中任一项所述的方法,其中所述抗体或其功能片段包括至少十七个不同的种系蛋白对的种系蛋白序列。
57.根据权利要求43-56中任一项所述的方法,其中所述抗体或其功能片段包括含种系蛋白序列的一个或更多个互补决定区。
58.根据权利要求43-57中任一项所述的方法,其中所述抗体或其功能片段包括含种系蛋白序歹丨J的FRl、CDRl、FR2、CDR2和FR3。
59.根据权利要求43-58中任一项所述的方法,其中所述抗体或其功能片段包括选自由以下组成的组的FR4区JH4、J κ 1禾口 J λ 2/3。
60.根据权利要求43-59中任一项所述的方法,其中所述抗体或其功能片段包括多样化的HCDR3区。
61.根据权利要求43-60中任一项所述的方法,其中所述抗体或其功能片段包括多样化的IXDR3区。
62.根据权利要求43-61中任一项所述的方法,其中所述集合包括IXIO4种抗体或其功能片段。
63.根据权利要求43-62中任一项所述的方法,其中所述种系蛋白对包括包含在采样的前60% Fab中的值的以Fab形式的相对展示率。
64.根据权利要求43-63中任一项所述的方法,其中所述种系蛋白对包括与Fab VH1-69VLA_V11-40AYA相比至少0. 6的以Fab形式的表达水平。
65.根据权利要求43-64中任一项所述的方法,其中所述种系蛋白对包括以Fab形式在 70°C或更高温度持续至少45分钟的热稳定性。
66.根据权利要求43-65中任一项所述的方法,其中所述种系蛋白对包括与M0R03080 相比至少0. 6的以IgG形式的表达水平。
67.根据权利要求43-66中任一项所述的方法,其中所述可变重链构架区和所述可变轻链构架区包括选自由以下组成的组的种系蛋白对的种系蛋白序列IGHV3-23/ IGKV1-5 ;IGHV3-23/IGKV3-20 ;IGHV4-39/IGKV3-15 ;IGHV3-23/IGKV3-15 ;IGHV4-59/ IGKV1-39/1D-39 ; IGHV4-39/IGKV1-39/1D-39 ; IGHV4-59/IGKV3-20 ; IGHV1-18/IGKV3-20 ; IGHV3-30/IGKV3-20 ; IGHV4-39/IGKV1-5 ; IGHV1-69/IGKV1-39/1D-39 ; IGHV5-51/ IGLV 1-40 ;IGHV3-23/IGKV4-1 ;IGHV4-39/IGKV3-20 ;IGHV3-23/IGLV 2-14 ;IGHV4-39/ IGLV 3-21 ; IGHV3-23/IGKV1-39/1D-39 ; IGHV3-30/IGKV1-39/1D-39 ; IGHV3-30/ IGKV3-11 ;IGHV1-69/IGKV3-20 ;IGHV3-48/IGKV3-20 ;IGHV1-2/IGKV3-20 ;IGHV3-30/ IGKV4-1 ;IGHV5-51/IGLV 2-14 ;IGHV4-59/IGKV4-1 ;IGHV5-51/IGKV3-20 ;IGHV3-7/ IGKV1-39/1D-39 ; IGHV3-7/IGKV1-5 ; IGHV3-15/IGKV3-20 ; IGHV4-39/IGLV 2-14 ; IGHV4-39/IGLV 2-8 ; IGHV3-23/IGKV3-11 ; IGHV3-30/IGKV1-5 ; IGHV3-30/IGKV3-15 ; IGHV3-21/IGKV1-5 ;IGHV3-21/IGKV3-15 ;IGHV3-30/IGLV1-51 ;IGHV3-21/IGLV 1-51 ; IGHV3-53/IGLV 1-44 ; IGHV4-59/IGKV3-15 ;IGHV5-51/IGKV4-1 ; IGHV1-69/IGKV4-1 ;和 IGHV1-69/IGKV3-11。
68.根据权利要求43-67中任一项所述的方法,其中所述抗体的所述功能片段选自由 Fab、F (ab ‘ ) 2、Fab,、Fv 和 scFv 组成的组。
69.一种分离的核酸,所述分离的核酸编码含C端限制酶切位点的信号序列或前导序列。
70.根据权利要求69所述的核酸,其中所述限制酶切位点是NheI。
71.根据权利要求69或70所述的核酸,其中所述信号序列或前导序列包括phoA或人重链前导序列。
72.根据权利要求69所述的核酸,其中所述限制酶切位点是NdeI。
73.根据权利要求69或72所述的核酸,其中所述信号序列包括ompA或人κ前导序列。
74.一种载体,所述载体包含根据权利要求69-73中任一项所述的核酸。
75.一种宿主细胞,所述宿主细胞包含权利要求74所述的载体。
76.根据权利要求75所述的宿主细胞,所述宿主细胞是原核的或真核的。
77.根据权利要求75或76所述的宿主细胞,所述宿主细胞是大肠杆菌细胞。
78.根据权利要求75或76所述的宿主细胞,所述宿主细胞是哺乳动物细胞。
79.一种分离的抗体或其功能片段,所述分离的抗体或其功能片段包括含种系蛋白对的种系蛋白序列的FRl、⑶Rl、FR2、⑶R2和FR3,其中所述种系蛋白对选自由以下组成的组IGHV3-23/IGKV1-5 ; IGHV3-23/IGKV3-20 ; IGHV4-39/IGKV3-15 ; IGHV3-23/ IGKV3-15 ; IGHV4-39/IGKV1-39/1D-39 ;IGHV1-18/IGKV3-20 ; IGHV3-30/IGKV3-20 ; IGHV4-39/IGKV1-5 ;IGHV1-69/IGKV1-39/1D-39 ;IGHV5-51/IGLV 1-40 ;IGHV4-39/ IGKV3-20 ; IGHV3-23/IGLV 2-14 ; IGHV4-39/IGLV 3-21 ; IGHV3-23/IGKV1-39/1D-39 ; IGHV3-30/IGKV1-39/1D-39 ; IGHV1-69/IGKV3-20 ; IGHV3-48/IGKV3-20 ; IGHV1-2/ IGKV3-20 ; IGHV3-30/IGKV4-1 ;IGHV5-51/IGLV 2-14 ;IGHV5-51/IGKV3-20 ;IGHV3-7/ IGKV1-39/1D-39 ;IGHV3-7/IGKV1-5 ;IGHV3-15/IGKV3-20 ;IGHV4-39/IGLV2-14 ;IGHV3-23/ IGKV3-11 ; IGHV3-30/IGKV1-5 ; IGHV3-30/IGKV3-15 ; IGHV3-21/IGKV1-5 ; IGHV3-21/ IGKV3-15 ; IGHV3-30/IGLV1-51 ; IGHV3-21/IGLV 1-51 ;和 IGHV1-69/I。
全文摘要
本公开内容使得鉴定人免疫组库中的VH和VL类对、确定最普遍的VH和VL类对和具有有利的生物物理特性的VH和VL类对的方法成为可能。更具体而言,本公开内容的集合包括具有高度多样化的CDR的最普遍的和/或最优选的VH和VL类配对。
文档编号C07K16/00GK102449149SQ201080022793
公开日2012年5月9日 申请日期2010年5月29日 优先权日2009年5月29日
发明者乔瑟夫·普拉斯勒, 塔贾·赫尔曼, 托马斯·蒂勒, 斯特法妮·尤林格, 马库斯·恩泽尔伯格 申请人:莫佛塞斯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1