表现不同结合特征的VL抗原结合蛋白的制作方法

文档序号:11849509阅读:624来源:国知局
表现不同结合特征的VL抗原结合蛋白的制作方法与工艺
本申请根据35U.S.C.§119(e)要求2014年3月21日提交的美国临时专利申请第61/968,896号、2014年12月5日提交的美国临时专利申请第62/088,117号和2014年11月13日提交的美国临时专利申请第62/079,078号的权益,每个申请据此通过引用并入。
技术领域
本发明总体上涉及结合小分子的VL抗原结合蛋白和/或表征VL抗原结合蛋白相互作用及使用源自所述表征的信息将VL抗原结合蛋白分成多组,所述组可以用作选择具有常规抗体未表现出来的结合特征的抗原结合VL蛋白的指导。背景抗体作为有前景的用于生物诊断学和/或治疗的形态出现。例如,中和抗体可以在其确立达到感染之前拦截病原体并使其失活。拮抗性抗体可妨碍在例如肿瘤进展或自身免疫性中普遍的失调信号传导,而激动性抗体可用于增强免疫反应。这些能力部分基于抗体对表位的特异性识别和亲和力,表位是抗体结合的抗原位点。可针对一种靶抗原产生许多抗体,并且每种抗体在亲和力和表位识别的任一方面或两方面可有很大变化。另外,因为常规抗体中的抗原结合位点不太适合所有抗原,所以基于传统抗体的设计可能受到限制。本发明涵盖仍然需要基于免疫球蛋白的治疗设计的改进和多样化的认识。概述本文描述的各个方面和实施方案部分基于以下惊人的发现,表达含有可操作地连接至重链恒定区的免疫球蛋白轻链可变结构域和可操作地连接至轻链恒定区的免疫球蛋白轻链可变结构域的结合蛋白的经遗传修饰的非人动物可以解决本文认识到的各种问题和/或可以提供惊人的结果。例如,基因组包括(i)含有未重排的人轻链基因片段(例如,VL和JL基因片段)的免疫球蛋白重链基因座;和(ii)含有未重排的人轻链基因片段(例如,VL和JL基因片段)的免疫球蛋白轻链基因座的非人动物可以提供更多样化的难以由常规人源化非人动物获得的抗原结合蛋白(例如VL结合蛋白)库。本文公开的基因工程化动物中产生的VL抗原结合蛋白以比可由常规抗体达到的更高的亲和力结合至小分子,并且还可表现出与常规抗体所表现出的那些结合特征或性状不同的一种或多种结合特征或性状。通常,如本文所公开的VL抗原结合蛋白包含杂交免疫球蛋白链,所述杂交免疫球蛋白链包含特异性结合小分子并且可操作地连接至重链恒定区的免疫球蛋白轻链可变结构域。VL抗原结合蛋白还可包含第一和第二免疫球蛋白轻链可变结构域,其中所述第一和第二免疫球蛋白轻链可变结构域缔合形成特异性结合小分子的结合口袋。在一些实施方案中,本发明提供了一种抗原结合蛋白,其基本上由缔合形成结合口袋的第一和第二免疫球蛋白轻链可变结构域组成,其中所述抗原结合蛋白特异性结合小分子。在一些实施方案中,第一免疫球蛋白轻链可变结构域可操作地连接至重链恒定结构域。这种杂交VL-CH免疫球蛋白链源自可操作地连接至重链恒定区基因的轻链可变(VL)基因片段和轻链连接(JL)基因片段。第二免疫球蛋白轻链可变结构域可以可操作地连接至轻链恒定结构域(VL-CL)。在一些实施方案中,VL抗原结合蛋白的每条链均缺乏由免疫球蛋白重链可变区基因片段编码和/或源自其的氨基酸序列。在一些实施方案中,第一免疫球蛋白轻链可变结构域由源自人Vκ基因片段的重排轻链可变区基因编码,该基因片段选自由Vκ4-1、Vκ1-5、Vκ3-15、Vκ3-20和Vκ1-33组成的组。在另一个实施方案中,第一免疫球蛋白轻链可变结构域源自选自由Jκ1、Jκ3、Jκ4和Jκ5组成的组的Jκ基因片段。在另一个实施方案中,第一免疫球蛋白轻链可变结构域源自Vκ1-5基因片段。在另一个实施方案中,第一免疫球蛋白轻链可变结构域源自Vκ1-5基因片段,并且第二免疫球蛋白轻链结构域源自Vκ3-20基因片段。在另一个实施方案中,第一免疫球蛋白轻链可变结构域源自Vκ1-5基因片段,和选自由Jκ3、Jκ4和Jκ5组成的组的Jκ基因片段。在一个实施方案中,第一免疫球蛋白轻链可变结构域源自Vκ4-1基因片段。在另一个实施方案中,第一免疫球蛋白轻链可变结构域源自Vκ4-1基因片段和Jκ1基因片段。在一个实施方案中,第一免疫球蛋白轻链可变结构域源自Vκ4-1基因片段并且第二免疫球蛋白轻链可变结构域源自Vκ4-1或Vκ3-20基因片段。在一个实施方案中,第一免疫球蛋白轻链可变结构域源自Vκ3-20基因片段。在另一个实施方案中,第一免疫球蛋白轻链可变结构域源自Vκ3-20基因片段和Jκ1或Jκ2基因片段。在一个实施方案中,第一免疫球蛋白轻链可变结构域源自Vκ3-20基因片段并且第二免疫球蛋白轻链可变结构域源自Vκ4-1或Vκ1-5基因片段。在一个实施方案中,第一免疫球蛋白轻链可变结构域源自Vκ3-15基因片段。在另一个实施方案中,第一免疫球蛋白轻链可变结构域源自Vκ3-15基因片段和Jκ5基因片段。在一个实施方案中,第一免疫球蛋白轻链可变结构域源自Vκ3-15基因片段并且第二免疫球蛋白轻链可变结构域源自Vκ1-39基因片段。在其它实施方案中,第一和第二可变结构域源自表A中陈述的各自的Vκ1:Jκ1Vκ2:Jκ2基因片段。表A在一些实施方案中,杂交VL-CH免疫球蛋白链的CDR3长度比与轻链恒定结构域(VL-CL)连接的第二免疫球蛋白轻链可变结构域的CDR3长度短。在一些实施方案中,杂交免疫球蛋白链的CDR3比轻链的CDR3短至少一个氨基酸。在其它实施方案中,CDR3长度相差至少2个氨基酸。在其它实施方案中,CDR3长度相差至少3个氨基酸。在其它实施方案中,CDR3长度相差至少4个氨基酸。在一些实施方案中,杂交免疫球蛋白链的CDR3长度为6个氨基酸,并且轻链的CDR3长度为约9个氨基酸。在一些某些实施方案中,重链恒定区来自于非人动物。在一些实施方案中,轻链恒定区来自于非人动物。在一些实施方案中,重链恒定区选自CH1、铰链、CH2、CH3、CH4及其组合。在一些实施方案中,重链恒定区包含CH1、铰链、CH2和CH3。在一些实施方案中,第一和/或第二免疫球蛋白轻链可变结构域为人免疫球蛋白轻链可变结构域。在一些实施方案中,第一和/或第二免疫球蛋白轻链可变结构域来自选自小鼠和大鼠的啮齿动物。在一些实施方案中,本文公开的VL抗原结合蛋白以比包含免疫球蛋白轻链和重链可变结构域的抗原结合蛋白更高的亲和力结合小分子。在一些实施方案中,VL抗原结合蛋白以小于50nM的KD特异性结合小分子。在其它实施方案中,VL抗原结合蛋白的KD小于40nM。在另外的实施方案中,VL抗原结合蛋白的KD小于30nM。在另一个实施方案中,VL抗原结合蛋白的KD小于20nM。在另一个实施方案中,VL抗原结合蛋白的KD小于10nM。一方面,本文提供了包含编码特异性结合如本文所公开的小分子的VL抗原结合蛋白的杂交免疫球蛋白链或轻链的可变结构域的重排轻链可变区基因的细胞或核酸,及获得此类细胞或核酸的方法。在一些实施方案中,提供了获得对小分子有特异性的VL抗原结合蛋白的方法,其可包括获得包含和/或编码结合小分子的VL抗原结合蛋白的一个或多个免疫球蛋白轻链可变(VL)结构域的细胞或核酸序列。所述方法通常包括从本文所公开的经遗传修饰的非人动物分离结合小分子的VL结合蛋白和/或包含编码VL抗原结合蛋白的核酸序列的细胞,其中所述VL结合蛋白特异性结合小分子。本文公开的经遗传修饰的非人动物包括,例如哺乳动物,并且在特定实施方案中,包括啮齿动物(例如小鼠、大鼠或仓鼠)。在一些实施方案中,非人动物包括鸟类,例如鸡。在各个实施方案中,啮齿动物选自小鼠和大鼠。在一些实施方案中,如本文所公开的非人动物的基因组包括(i)含有未重排的人轻链基因片段(例如,VL和JL基因片段)的免疫球蛋白重链基因座;和(ii)含有未重排的人轻链基因片段(例如,VL和JL基因片段)的免疫球蛋白轻链基因座。在一些实施方案中,(i)的未重排的人免疫球蛋白VL和JL基因片段存在于基因组中的内源免疫球蛋白重链基因座处。在一些实施方案中,该非人动物缺乏所有内源功能性VH、DH和JH基因片段。在一些实施方案中,该非人动物缺乏所有内源、功能性VH、DH和JH基因片段,并且该非人动物包含Adam6a基因、Adam6b基因或两者。在一些某些实施方案中,Adam6a基因、Adam6b基因或两者异位性地位于基因组内。在一些实施方案中,(ii)的未重排的人免疫球蛋白VL和JL基因片段存在于该非人动物的内源免疫球蛋白轻链基因座处。在某些实施方案中,内源免疫球蛋白轻链基因座为κ轻链基因座。在一些实施方案中,(i)的未重排的人免疫球蛋白VL和JL基因片段为人Vκ和Jκ基因片段。在一些实施方案中,(ii)的未重排的人免疫球蛋白VL和JL基因片段为人Vκ和Jκ基因片段。在一些实施方案中,(ii)的未重排的人免疫球蛋白VL和JL基因片段为人Vκ和Jκ基因片段,并且轻链恒定区核酸序列为小鼠Cκ区核酸序列或大鼠Cκ区核酸序列。在一些实施方案中,非人动物包含表达特异性结合小分子的VL抗原结合蛋白的细胞。在一些实施方案中,该细胞为淋巴细胞,例如NK细胞、T细胞或B细胞。在一些实施方案中,该细胞表达包含杂交VL-CH链的VL结合蛋白。在一些实施方案中,VL结合蛋白包含两个相同的免疫球蛋白轻链可变结构域。在其它实施方案中,VL结合蛋白包含两个具有异源序列的免疫球蛋白轻链可变结构域。在一些实施方案中,从本文所公开的动物分离的细胞为B细胞。在其它实施方案中,该细胞为记忆B细胞。也可通过例如从分离自本文公开的非人动物的细胞鉴定编码特异性结合小分子的VL结合蛋白的第一和第二免疫球蛋白轻链可变结构域的第一和第二核酸序列,来分离包含编码特异性结合小分子的VL抗原结合蛋白的杂交免疫球蛋白链或轻链的可变结构域的重排轻链可变区基因的核酸。在一些实施方案中,获得如本文所公开的细胞和/或核酸的方法包括(a)用小分子或与载体连接的小分子使非人动物免疫,其中所述非人动物在其基因组中包含(i)可操作地连接至非人重链恒定区核酸序列的未重排的人免疫球蛋白轻链可变(VL)和轻链连接(JL)基因片段,和(ii)可操作地连接至非人轻链恒定区核酸序列的未重排的人免疫球蛋白轻链可变(VL)和轻链连接(JL)基因片段,(b)从免疫的非人动物分离细胞,其中所述细胞包含编码第一和第二免疫球蛋白轻链可变结构域的第一和第二核酸序列;并且(c)从该细胞鉴定编码特异性结合小分子的VL结合蛋白的第一和第二免疫球蛋白轻链可变结构域的第一和第二核酸序列。在一些实施方案中,使非人动物免疫包括用小分子或与载体连接的小分子使非人动物初免,使非人动物休息一段时间,并用小分子或与载体连接的小分子使动物再次免疫。在一些实施方案中,该段时间为几天、至少一周、至少两周、至少三周、至少四周或至少一个月。在一些实施方案中,使非人动物免疫包括使非人动物产生免疫反应。在一些实施方案中,所述细胞通过荧光激活细胞分选(FACS)或流式细胞术获得。在一些实施方案中,该细胞得自免疫的非人动物的组织,并且其中该组织选自由脾脏、淋巴结、血液和骨髓组成的组。在一些实施方案中,本发明的方法还包括使淋巴细胞与癌细胞融合,例如以产生杂交瘤。在某些实施方案中,癌细胞为骨髓瘤细胞。因此,本文还提供了杂交瘤和从中分离的核酸,其中所述杂交瘤表达对小分子有特异性的VL结合蛋白。在一些实施方案中,制备对小分子有特异性的VL抗原结合蛋白的方法还可包括:使编码对小分子有特异性的VL抗原结合蛋白的第一和第二免疫球蛋白轻链可变结构域的第一和第二核酸在适于使第一和第二免疫球蛋白轻链可变结构域作为特异性结合小分子的二聚体表达的表达系统中表达。还提供了一种非人动物,其包含(a)在其基因组中的:(i)可操作地连接至非人重链恒定区核酸序列的未重排的人免疫球蛋白轻链可变(VL)和轻链连接(JL)基因片段,和(ii)可操作地连接至非人轻链恒定区核酸序列的未重排的人免疫球蛋白轻链可变(VL)和轻链连接(JL)基因片段;和(b)特异性结合小分子的VL抗原结合蛋白。在一些实施方案中,该非人动物表现出的抗原阳性B细胞是参考非人动物的2倍或更多,例如至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少10倍或至少20倍或更多。在一些实施方案中,参考非人动物在免疫后表达嵌合抗体,其中所述嵌合抗体具有包含人VH结构域和小鼠CH结构域的重链和具有人VL结构域和小鼠CL结构域的轻链。在某些实施方案中,参考非人动物为野生型非人动物。在一些实施方案中,免疫包括用小分子或与载体连接的小分子使非人动物初免,使非人动物休息一段时间,并用小分子或与载体连接的小分子使动物再次免疫。在一些实施方案中,该段时间为几天、至少一周、至少两周、至少三周、至少四周或至少一个月。在一些实施方案中,抗原阳性B细胞为记忆B细胞。在一些实施方案中,该非人动物表现出的抗体滴度是参考非人动物的至少2倍、至少3倍、至少4倍或至少5倍或更高。在一些某些实施方案中,参考非人动物是经遗传修饰的小鼠,其在免疫后表达嵌合抗原结合蛋白,并且该嵌合抗原结合蛋白包含含有人VH结构域和小鼠CH结构域的重链和具有人VL结构域和小鼠CL结构域的轻链。在某些实施方案中,参考非人动物为野生型非人动物。在一些实施方案中,本发明的小分子为半抗原并且与载体连接。在某些实施方案中,载体包括钥孔戚血蓝蛋白(KLH)、似鲍罗螺血蓝蛋白(CCH)、牛血清白蛋白(BSA)、阳离子化牛血清白蛋白(cBSA)或卵清蛋白。在一些实施方案中,本发明的小分子是分子量低于6kDa的有机化合物。一方面,本文公开了鉴定和/或分离表现出常规抗体未表现出来的结合特征的抗原特异性VL抗原结合蛋白的方法,这样鉴定和/或分离的抗原特异性VL抗原结合蛋白,编码该抗原结合蛋白的核酸,和/或表达该抗原结合蛋白的宿主细胞。在一个实施方案中,一种鉴定在特异性结合抗原时表现出本文所公开的也特异性结合该抗原的常规抗体未表现出来的独特结合特征的一种或多种VL抗原结合蛋白的方法包括:(a)分析特异性结合抗原的多种免疫球蛋白蛋白中的每一种的一种或多种结合特征,其中所述多种免疫球蛋白蛋白包括VL抗原结合蛋白和常规抗体,其中每种VL抗原结合蛋白均包含杂交免疫球蛋白链,所述杂交免疫球蛋白链包含(i)源自一个或多个轻链可变区基因片段的可变结构域和(ii)源自一个或多个重链恒定区基因片段的恒定结构域,其中每种常规抗体均包含源自一个或多个重链可变区的免疫球蛋白重链可变区和源自一个或多个轻链可变区基因片段的免疫球蛋白轻链可变区基因片段;(b)基于每种所述免疫球蛋白蛋白的至少一种结合特征将所述多种免疫球蛋白蛋白分成一个或多个组,其中表现出类似结合特征的VL抗原结合蛋白和常规抗体被分到同一组;并且(c)鉴定包含所有或基本上所有VL抗原结合蛋白的组。在一些实施方案中,通过差异性抗原破坏来分析所述多种免疫球蛋白蛋白中的每一种的一种或多种结合特征。在一些实施方案中,本文所公开的方法还包括为所述多种免疫球蛋白蛋白中的每一种所结合的所述抗原的一个或多个表位绘图;其中结合所述抗原的相同表位的免疫球蛋白蛋白被分到同一功能组。在一些实施方案中,为所述多种免疫球蛋白蛋白中的每一种所结合的所述抗原的一个或多个表位绘图包括选自由以下组成的组的表位绘图测定:交叉阻断测定、抗原突变体的丙氨酸扫描、肽印迹、肽裂解分析、表位切除、表位提取、抗原的化学修饰及其组合。在本文公开的方法中,所述多种抗原结合蛋白的一种或多种结合特征使用固定在固体表面的抗原测定。在一些实施方案中,该固体表面包含生物传感器芯片或聚苯乙烯珠粒。在一些实施方案中,在固体之后和分析之前修饰抗原。可用化学品(例如,三(2-羧乙基))膦盐酸盐(TCEP●HCl)/碘乙酰胺、N-乙基-N'-(二甲氨基丙基)碳二亚胺(EDC)/乙醇胺、碘乙酰胺和肼、对羟苯基乙二醛(HPG)、过氧化氢、N-溴代琥珀酰亚胺、N-乙酰基咪唑、四硝基甲烷、对氨苯基胂酸、丹磺酰氯、戊二醛、茚三酮、焦碳酸二乙酯(DEPC)、乙酸磺基琥珀酰亚胺酯(磺基-NHS-乙酸酯)、聚乙二醇5000(PEG-5000)、7-羟基香豆素-3-羧酸、琥珀酰亚胺酯及其组合)和/或酶(例如猪胰蛋白酶、胞内蛋白酶Glu-C、胞内蛋白酶Asp-N、胰凝乳蛋白酶、胞内蛋白酶Lys-C和胞内蛋白酶Arg-C、胃蛋白酶、木瓜蛋白酶、嗜热菌蛋白酶、枯草杆菌蛋白酶、蛋白酶K、菠罗蛋白酶巯基特异性蛋白酶(无花果蛋白酶)及其组合)实现修饰。根据本文公开的方法分类包括主要组分分析(PCA)和/或分级聚类。在一个实施方案中,选择两个主要组分用于呈现数据。在一个实施方案中,分类包括主要组分分析。在另一个实施方案中,分类包括分级聚类。在另一个实施方案中,分类包括主要组分分析和分级聚类两者。分类可基于一种或多种结合特性,包括每种免疫球蛋白蛋白对如上所述一组经化学和/或酶促破坏/修饰的抗原表面的结合信号强度。可将这种分类结果与一组免疫球蛋白蛋白的其它典型测定数据比对,如缔合常数、解离常数、平衡常数、对来自不同物种或相同物种的有关家族成员的抗原同系物的结合特异性、功能活性数据(例如,阻断配体阻断的能力、抗原磷酸化和/或抗原内化到细胞中)或其任何组合。比对结果,可展示为“树状表格”,例如源自差异性抗原破坏的分级聚类树状图,与每种免疫球蛋白蛋白的其它不同测定数据比对,可用于揭示同一分类的免疫球蛋白蛋白间的行为模式。本文所公开的一些分析方法还包括(d)分离被分到鉴定为包含所有或基本上所有VL抗原结合蛋白的功能组中的一种或多种VL抗原结合蛋白和/或(e)确认分离的所述一种或多种VL抗原结合蛋白结合未被常规抗体识别的所述抗原的一个或多个表位。确认分离的所述一种或多种VL抗原结合蛋白结合未被常规抗体识别的所述抗原的一个或多个表位可包括高通量竞争性结合蛋白测定。可为根据本文公开的分析方法分离的所述一种或多种VL抗原结合蛋白中的任一种确定编码其的氨基酸序列和/或核酸序列。因此,本文还提供了根据本文公开的分析方法分离的VL抗原结合蛋白、包含编码这样鉴定和/或分离的VL抗原结合蛋白的杂交免疫球蛋白链的可变区的CDR的核苷酸序列的分离核酸,及表达此类核酸的宿主细胞。本文还提供了鉴定对常规抗体掩蔽而被一种或多种抗原特异性VL抗原结合蛋白识别的抗原的一个或多个表位的方法,其包括使用本文公开的方法鉴定结合抗原未被常规抗体识别的表位的一种或多种VL抗原结合蛋白并且(b)为被鉴定的一种或多种抗原特异性抗原结合蛋白识别的所述一个或多个表位绘图。本发明的其它特征、目的和优点在以下的详细描述中显而易见。然而应理解,详细描述虽然指出了本发明的实施方案,但是仅以说明,而非限制的方式给出。从详细描述看在本发明范围内的各种变化和修改将对本领域技术人员变得显而易见。附图简述本文所包括的由以下各图组成的附图仅仅是为了说明的目的,而不是为了限制。图1说明小鼠重链基因座的示意图(不按比例)(在上方)和人κ轻链基因座的示意图(不按比例)(在下方)。小鼠重链基因座长度为约3Mb并且含有大约200个重链可变(VH)基因片段、13个重链多样性(DH)基因片段和4个重链连接(JH)基因片段以及增强子(Enh)和重链恒定(CH)区。人κ轻链基因座复制到分别跨越约440kb和600kb的相反极性的远侧和近侧重叠群(contig)。介于两个重叠群之间的是被认为不含Vκ基因片段的约800kb的DNA。人κ轻链基因座含有约76个Vκ基因片段、5个Jκ基因片段、内含增强子(Enh)和单个恒定区(Cκ)。图2示出向小鼠重链基因座中逐渐插入40个人Vκ和5个人Jκ基因片段的示例性靶向策略。示出了具有重组酶识别位点(R1、R2等)的潮霉素(hyg)和新霉素(neo)选择盒。在下方示出了包含可操作地连接至小鼠CH区的人Vκ和Jκ基因片段的经修饰小鼠重链基因座。图3示出向小鼠重链基因座中逐渐插入人Vλ和人Jλ基因片段(或4个人Jλ基因片段)的示例性靶向策略。示出了具有重组酶识别位点(R1、R2等)的潮霉素(hyg)和新霉素(neo)选择盒。在下方示出了包含可操作地连接至小鼠CH区的人Vλ和Jλ基因片段(一个或四个)的经修饰小鼠重链基因座。图4示出从KOH小鼠(MAID1713/1242)和人源化小鼠(VI3)获得的抗原阳性抗体(或VL抗原结合蛋白)的总数(左)和百分比(右)。图5示出从KOH小鼠(MAID1713/1242)和人源化小鼠(VI3)获得的对抗原B有特异性的抗体的相对结合动力学。图6提供对抗原C(一种糖蛋白)有特异性的739种结合蛋白的二维主要组分分析(PCA)图,该图突出了表现出至少一种如通过差异性抗原破坏(DAD)测定的不同于典型抗原A特异性抗体(○)的结合特征的一群抗原C特异性VL抗原结合蛋白(●)。图7提供VL结合蛋白的数量(总数;y-轴),该结合蛋白对抗原A抗原B(■)或抗原C(□)有特异性并且在(A)杂交链或(B)轻链中具有一定CDR3氨基酸长度(x-轴)。定义本发明不限于特定方法和描述的实验条件,因而方法和条件可改变。还应理解,本文中所用的术语仅仅是为了描述特定实施方案的目的,而非旨在限制,因为本发明的范围由权利要求书限定。除非另有定义,否则本文中所用的所有术语和短语包括该术语和短语在本领域中已经获得的含义,除非明确指出相反或从使用该术语或短语的上下文显而易见。虽然与本文所述的那些类似或等效的任何方法和材料均可用于本发明的实践或试验,但是现在描述的是特定方法和材料。提到的所有出版物据此通过引用并入。“抗原结合蛋白”、“结合蛋白”、“免疫球蛋白蛋白”等是指包含抗原结合位点的单肽或多聚肽分子,其可经体细胞突变,能够识别并结合抗原(或其表位部分),例如能够诱导免疫反应并且尤其诱导亲和力成熟免疫球蛋白分子产生的物质。抗原结合蛋白涵盖VL抗原结合蛋白和常规抗体。抗原结合蛋白的“抗原结合位点”是指抗原结合蛋白结合抗原的区域。“VL抗原结合蛋白”、“抗原结合VL蛋白”、“VL结合蛋白”等是指包含可形成抗原结合位点,可操作地连接至重链恒定区的免疫球蛋白轻链可变结构域的免疫球蛋白蛋白。“VL抗原结合蛋白”包括还包含轻链,使得VL结合蛋白包含两个可形成抗原结合位点的轻链可变结构域的免疫球蛋白分子。在一个实施方案中,VL抗原结合蛋白的至少两个轻链可变结构域同源。在一些实施方案中,两个轻链可变结构域中的每一个均由轻链可变区(VL)基因片段和/或轻链连接区(JL)基因片段编码或源自其中。在优选的实施方案中,两个轻链可变结构域中的一个可为杂交免疫球蛋白链的一部分,而两个轻链可变结构域中的另一个可为免疫球蛋白轻链(L)的一部分。此类VL结合结构域已有描述,参见例如,2011年8月2日提交的美国专利公布第20120096572号,其通过引用整体并入本文。术语“抗体”、“常规抗体”、“典型抗体”、“抗原结合抗体”等,通常是指最少包含抗原结合位点的免疫球蛋白蛋白,该抗原结合位点包含(i)源自重链可变(VH)基因片段、重链多样性(DH)基因片段和/或重链连接JH)基因片段的重链可变结构域和(ii)源自轻链可变(VL)基因片段和/或轻链连接(JL)基因片段的轻链可变结构域。在一个优选的实施方案中,抗体的VH和VL结构域同源。因此,术语抗体、常规抗体、典型抗体等涵盖单链可变片段(scFv)、片段抗原结合(Fab)区、F(ab’)2片段等。此类术语还涵盖四聚体分子,例如具有通过二硫键相互连接的两条免疫球蛋白重(H)链和两条免疫球蛋白轻(L)链的分子。每条重链均包含重链可变结构域和重链恒定区(CH)。重链恒定区包含三个结构域,CH1、CH2和CH3。每条轻链均包含轻链可变结构域和轻链恒定区(CL)。重链和轻链可变结构域可进一步细分为高变区,被称为互补决定区(CDR),其间穿插有更保守的被称为骨架区(FR)的区域。每个重链和轻链可变结构域均包含三个CDR和四个FR,从氨基末端到羧基末端按以下顺序排列:FR1、CDR1、FR2、CDR2、FR3、CDR3、FR4(重链CDR可缩写为HCDR1、HCDR2和HCDR3;轻链CDR可缩写为LCDR1、LCDR2和LCDR3)。术语“高亲和力”抗体包括具有相对于其靶表位约10-9M或更低(例如约1x10-9M、1x10-10M、1x10-11M或约1x10-12M)的KD的抗体。在一个实施方案中,KD通过表面等离子体共振,例如BIACORETM测量;在另一个实施方案中,KD通过ELISA测量。如本文应用于一个或多个目标值的术语“大约”,包括与规定的参考值类似的值。在某些实施方案中,除非另有说明或另外从上下文显见(除了此数字将超过可能值的100%的情况),否则术语“大约”或“约”包括在任一方向上落在规定参考值的25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更小范围内的一系列值。术语“生物活性”包括任何物质在生物体系、体外或体内(例如在生物体内)具有活性的特征。例如,当存在于生物体内时,在该生物体内具有生物效应的物质被视为具有生物活性。在特定实施方案中,当蛋白质或多肽具生物活性时,通常将该蛋白质或多肽的共有蛋白质或多肽的至少一种生物活性的部分称为“生物活性”部分。在小分子环境下的术语“载体”,例如连接于小分子的载体,是指小分子可与之偶联以赋予小分子免疫原性的大分子,通常为蛋白质。术语“同源”在“与……同源”的意义上使用时,例如第一VL结构域与第二VL结构域“同源”,旨在包括对来自于根据本发明由小鼠产生的相同结合蛋白的两个VL结构域之间的关系的提及。例如,根据本发明的实施方案的经遗传修饰的小鼠,例如具有其中VH、DH和JH区被VL和JL区替换的重链基因座的小鼠,产生具有由相同小鼠CH区(e.g.,IgG同种型)与第一人VL结构域融合构成的两条相同多肽链,和由相同小鼠CL区与第二人VL结构域融合构成的两条相同多肽链的抗体样结合蛋白。在小鼠中的克隆选择期间,通过克隆选择过程选择第一和第二人VL结构域以在单一抗体样结合蛋白的情况下一起出现。因此,由于克隆选择过程,在单一抗体样分子中一起出现的第一和第二VL结构域称为“同源”。相反,出现在第一抗体样分子中的VL结构域和出现在第二抗体样分子中的VL结构域不同源,除非第一和第二抗体样分子具有相同的重链(即,除非与第一人重链区融合的VL结构域和与第二人重链区融合的VL结构域相同)。短语“互补决定区”或术语“CDR”包括由通常(即,在野生型动物中)出现在免疫球蛋白分子(例如,抗体或T细胞受体)的轻链或重链的可变区中的两个骨架区之间的生物体免疫球蛋白基因的核酸序列编码的氨基酸序列。CDR可由例如种系序列或重排或未重排的序列,和例如由天然或成熟B细胞或T细胞编码。CDR可经体细胞突变(例如,由动物种系中编码的序列改变)、人源化和/或经氨基酸取代、添加或缺失而修饰。在一些情况下(例如,对于CDR3而言),CDR可由不连续(例如,在未重排的核酸序列中),但是例如由于剪接或连接该序列(例如,V-D-J重组形成重链CDR3),在B细胞核酸序列中连续的两个或更多个序列(例如,种系序列)编码。术语“同等”包括可能相互不同,但是足够相似而容许之间进行比较,以致可基于观察到的差异或相似性合理地作出结论的两种或更多种物质、实体、情形、条件集合等。本领域的普通技术人员将理解,在上下文中,在任何给定环境下对于两种或更多种此类试剂、实体、情形或条件集合等,需要什么程度的同一性才能视为同等。描述保守性氨基酸取代的术语“保守性”包括氨基酸残基被具有相似化学性质(例如,电荷或疏水性)的侧链R基团的另一个氨基酸残基取代。一般而言,保守性氨基酸取代基本上不会改变蛋白质的目标功能性质,例如受体结合配体的能力。具有化学性质相似的侧链的氨基酸分组的实例包括脂肪族侧链如甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;脂肪族羟基侧链如丝氨酸和苏氨酸;含酰胺的侧链如天冬酰胺和谷氨酰胺;芳香族侧链如苯丙氨酸、酪氨酸和色氨酸;碱性侧链如赖氨酸、精氨酸和组氨酸;酸性侧链如天冬氨酸和谷氨酸;及含硫侧链如半胱氨酸和甲硫氨酸。保守性氨基酸取代组包括,例如缬氨酸/亮氨酸/异亮氨酸、苯丙氨酸/酪氨酸、赖氨酸/精氨酸、丙氨酸/缬氨酸、谷氨酸/天冬氨酸和天冬酰胺/谷氨酰胺。在一些实施方案中,保守性氨基酸取代可以是蛋白质中的任何天然残基被丙氨酸取代,正如用于例如丙氨酸扫描诱变一样。在一些实施方案中,保守性取代是在据此通过引用并入的Gonnet等(1992)ExhaustiveMatchingoftheEntireProteinSequenceDatabase,Science256:1443-45中公开的PAM250对数似然矩阵中具有正值的取代。在一些实施方案中,如果取代在PAM250对数似然矩阵中具有非负值,则将其视为“中度保守性”。在一些实施方案中,免疫球蛋白轻链或重链中的残基位置相差一个或多个保守性氨基酸取代。在一些实施方案中,免疫球蛋白轻链或其功能片段(例如,允许表达并且从例如B细胞中分泌的片段)中的残基位置与本文列出氨基酸序列的轻链不相同,而相差一个或多个保守性氨基酸取代。术语“破坏”当在“差异性抗原破坏”的情况之外使用时,包括断开(例如,经由同源重组)DNA的事件结果。在一些实施方案中,破坏可实现或代表DNA序列的缺失、插入、倒置、修饰、替换、取代或其任何组合。在一些实施方案中,破坏可实现或代表在DNA中的编码序列中引入突变,如错义、无义或移码突变,或其任何组合。在一些实施方案中,破坏可在细胞内源的基因或基因座中发生。在一些实施方案中,插入可包括将整个基因或基因片段,例如外显子,插入到细胞或基因组中的内源位点。在一些实施方案中,插入可引入不同于将其插入的内源序列的来源的序列。在一些实施方案中,破坏可增加基因或基因产物(例如,基因编码的蛋白质)的表达和/或活性。在一些实施方案中,破坏可降低基因或基因产物的表达和/或活性。在一些实施方案中,破坏可改变基因或基因产物(例如,编码的蛋白质)的序列。在一些实施方案中,破坏可使基因或基因产物(例如,编码的蛋白质)截短或片段化。在一些实施方案中,破坏可使基因或基因产物延伸;在一些此类实施方案中,破坏可实现融合蛋白的组装。在一些实施方案中,破坏可影响基因或基因产物的水平,而不影响活性。在一些实施方案中,破坏可影响基因或基因产物的活性,而不影响水平。在一些实施方案中,破坏可对基因或基因产物的水平无显著影响。在一些实施方案中,破坏可对基因或基因产物的活性无显著影响。在一些实施方案中,破坏可对基因或基因产物的水平或活性无显著影响。短语“内源基因座”或“内源基因”包括在引入破坏(例如,如本文所述的缺失、插入、倒置、修饰、替换、取代或其组合)之前在亲本或参考生物体中发现的遗传基因座。在一些实施方案中,内源基因座具有在自然界中发现的序列。在一些实施方案中,内源基因座为野生型。在一些实施方案中,含有如本文所述的内源基因座的参考生物体为野生型生物体。在一些实施方案中,含有如本文所述的内源基因座的参考生物体为工程化生物体。在一些实施方案中,含有如本文所述的内源基因座的参考生物体为实验室繁育的生物体(野生型或工程化的)。短语“内源启动子”包括例如在野生型生物体中与内源基因自然缔合的启动子。短语“表位结合蛋白”包括具有至少一个CDR并且能够选择性识别表位,例如能够以约1微摩尔或更低的KD(例如,为约1x10-6M、1x10-7M、1x10-8M、1x10-9M、1x10-10M、1x10-11M或约1x10-12M的KD)结合表位的蛋白质。治疗性表位结合蛋白(例如,治疗性抗体)经常需要在纳摩尔或皮摩尔范围内的KD。“功能的”,例如在提到功能性多肽时,包括保持通常与天然蛋白质相关的至少一种生物活性的多肽。在另一种情况下,功能免疫球蛋白基因片段可包括能够有效重排以产生重排的免疫球蛋白基因序列的可变基因片段。短语“功能片段”包括表位结合蛋白的可以表达、分泌并且以微摩尔、纳摩尔或皮摩尔范围内的KD特异性结合表位的片段。特异性识别包括具有至少在微摩尔范围、纳摩尔范围或皮摩尔范围内的KD。短语“基因片段”或“片段”包括对(重链或轻链)可变(V)基因片段、多样性(D)基因片段或(重链或轻链)连接J基因片段的提及,其包括可参与重排(例如由内源重组酶介导)以形成各自可操作地连接至一个或多个(重链或轻链)恒定(C)基因片段的重排V/J或重排V/D/J基因序列的免疫球蛋白基因座(在例如人和啮齿动物中)处的未重排序列。除非另外指出,否则V、D和J片段包含根据12/23规则允许V/J重组或V/D/J重组的重组信号序列(RSS)。基因片段还包括对(重链或轻链)恒定区基因片段的提及,其可包含在恒定区基因片段5’端的称为转换区(switchregion)的重复DNA,转换区允许特异性重组,从而引起同种型转换。重链恒定区基因序列可包含一个重链恒定区基因片段或一个聚类的重链恒定区基因片段,例如在种系组织中,该聚类的重链恒定区基因片段还可优选包含在每个重链恒定区基因片段5’的允许通过位点特异性重组进行同种型转换的转换区。除非另外指出,该片段还包含在自然界中与之缔合的序列或其功能等效物(例如,对于V片段而言为启动子和前导序列)。提到免疫球蛋白核酸序列时的术语“种系”包括可以传到后代的核酸序列。短语“免疫球蛋白重链”、“重链”等通常是指全长免疫球蛋白蛋白,其从氨基末端到羧基末端包括重链可变结构域(VH)和重链恒定(CH)结构域,并且包括缺乏CH1结构域,并且任选另外缺乏铰链区的重链。免疫球蛋白重链序列可来自于任何生物体。“重链可变结构域”是指具有优选由重排重链可变区基因编码或源自其中的氨基酸序列的免疫球蛋白结构域,重排重链可变区基因通常包含来自于重链可变(VH)基因片段(或其一部分)、重链多样性(DH)基因片段(或其一部分)和重链连接(JH)基因片段(或其一部分)的序列。在优选的实施方案中,重链可变区基因序列,例如重排VH-DH-JH基因序列,源自未重排的VH、DH和JH基因片段库,优选能够进行有效基因重排,例如能够连接形成框内重链可变区基因序列的种系未重排的VH、DH和JH基因片段。VH基因片段、DH基因片段或JH基因片段包括来自于任何生物体,包括但不限于啮齿动物(例如,小鼠、大鼠等)和人的VH基因片段、DH基因片段或JL基因片段。包含体细胞突变(例如,未由VH、DH和/或JH基因片段的种系序列编码的氨基酸)的重链可变结构域和编码重链可变结构域的重排重链可变区基因无论如何均可被视为源自种系VH、DH和/或JH基因片段或其部分,其在第一种情况下,例如在抗原介导增殖之前经有效重排以形成编码重链可变结构域的基因。除非另有说明,否则免疫球蛋白重链可变结构域通常从氨基末端到羧基末端包括三个重链互补决定区(CDR)和四个重链骨架(FR)区,例如FRH1-CDRH1-FRH2-CDRH2-FRH3-CDRH3-FRH4。VH结构域也可指从重链的N末端延伸(从N末端到C末端)到重链恒定结构域的N末端的重链部分。重链恒定结构域(CH)是指具有优选由来自于任何生物体的重链恒定区基因片段或其部分编码的氨基酸序列的免疫球蛋白结构域。示例性重链恒定区基因片段包括但不限于分别编码IgM、IgD、IgG、IgA或IgE重链恒定结构域的Cμ基因片段、Cδ基因片段、Cγ(例如,Cγ1、Cγ2、Cγ3、Cγ4)基因片段、Cα(例如,Cα1、Cα2)基因片段或Cε基因片段。典型重链恒定区基因片段通常包含各自编码CH1结构域、铰链、CH2结构域、CH3结构域,任选CH4结构域(例如,在IgM或IgE的情况下)和任选跨膜(M)结构域(例如,在淋巴细胞上的膜结合免疫球蛋白的情况下)的外显子。CH结构域也可指具有由缺乏功能CH1区并且任选另外缺乏功能铰链区的重链恒定区基因编码的氨基酸序列的免疫球蛋白结构域。通常,CH结构域也可指从FR4外部延伸(从N末端侧到C末端侧)到重链的C末端的重链部分。CH结构域还可指从FR4外部延伸(从N末端侧到C末端侧)到杂交链的C末端的杂交链部分。具有细微偏差,例如从C末端截掉一个、两个、三个或几个氨基酸的重链恒定结构域将由短语“重链恒定结构域”以及具有序列修饰,例如1、2、3、4、5、6、7、8、9或10个氨基酸取代的重链恒定结构域涵盖。可在选自以下的一个或多个位置处产生氨基酸取代,例如(参考免疫球蛋白恒定结构域例如人IgG恒定结构域的EU编号)228、233、234、235、236、237、238、239、241、248、249、250、252、254、255、256、258、265、267、268、269、270、272、276、278、280、283、285、286、289、290、292、293、294、295、296、297、298、301、303、305、307、308、309、311、312、315、318、320、322、324、326、327、328、329、330、331、332、333、334、335、337、338、339、340、342、344、356、358、359、360、361、362、373、375、376、378、380、382、383、384、386、388、389、398、414、416、419、428、430、433、434、435、437、438和439。例如,而非以限制的方式,重链恒定结构域可经修饰以表现出增强的血清半衰期(与无所述修饰的相同重链恒定结构域相比)并且具有在位置250(例如E或Q);250和428(例如L或F);252(例如L/Y/F/W或T)、254(例如S或T)和256(例如S/R/Q/E/D或T)的修饰;或在428和/或433(例如L/R/P/Q或K)和/或434(例如H/F或Y)的修饰;或在250和/或428的修饰;或在307或308(例如308F、V308F)和434的修饰。在另一个实例中,所述修饰可包括428L(例如M428L)和434S(例如N434S)修饰;428L、259I(例如V259I)和308F(例如V308F)修饰;433K(例如H433K)和434(例如434Y)修饰;252、254和256(例如252Y、254T和256E)修饰;250Q和428L修饰(例如T250Q和M428L);307和/或308修饰(例如308F或308P)。残基根据EU编号系统编号。在另一个非限制性实例中,重链恒定结构域可经修饰以对蛋白质A表现出变化的亲和力,这在双特异性抗体的分离中有用,参见例如美国专利第8,586,713号,其通过引用整体并入本文。术语“异源”包括来自不同来源的物质或实体。例如,当关于多肽、基因或基因产物使用或存在于特定细胞或生物体中时,该术语阐明有关多肽、基因或基因产物1)经人工工程化;2)通过人工(例如,经由基因工程)引入细胞或生物体(或其前体)中;和/或3)不是有关细胞或生物体(例如,有关细胞类型或生物体类型)自然产生的或其中存在的。术语“宿主细胞”包括已经将异源(例如外源)核酸或蛋白质引入其中的细胞。技术人员在阅读本公开之后将理解,此类术语不但包括特定受试细胞,而且用于包括该细胞的后代。因为在随后的世代中由于突变或环境影响可发生某些修饰,所以此类后代实际上可能不与亲本细胞相同,但是本领域技术人员仍将其理解为包括在术语“宿主细胞”的范围内。在一些实施方案中,宿主细胞是或包括原核或真核细胞。一般而言,宿主细胞是适于接受和/或产生异源核酸或蛋白质的任何细胞,而不管为该细胞指定的生命界如何。可根据本公开用作宿主细胞的示例性细胞包括原核生物和真核生物的细胞(单细胞或多细胞)、细菌细胞(例如,大肠杆菌(E.coli)、芽孢杆菌属各种(Bacillusspp.)、链霉菌属各种(Streptomycesspp.)的菌株等)、分枝杆菌细胞、真菌细胞、酵母细胞(例如,酿酒酵母(S.cerevisiae)、粟酒裂殖酵母(S.pombe)、巴斯德毕赤酵母(P.pastoris)、甲醇毕赤酵母(P.methanolica)等)、植物细胞、昆虫细胞(例如,SF-9、SF-21、杆状病毒感染的昆虫细胞、粉纹夜蛾等)、非人动物细胞、人细胞或细胞融合物,例如杂交瘤或四重杂交瘤(quadromas)。在一些实施方案中,细胞为人、猴、猿、仓鼠、大鼠或小鼠细胞。在一些实施方案中,细胞为真核并且选自以下细胞:CHO(例如,CHOK1、DXB-11CHO、素食者-CHO)、COS(例如,COS-7)、视网膜细胞、Vero、CV1、肾(例如,HEK293、293EBNA、MSR293、MDCK、HaK、BHK)、HeLa、HepG2、WI38、MRC5、Colo205、HB8065、HL-60、(例如,BHK21)、Jurkat、Daudi、A431(表皮)、CV-1、U937、3T3、L细胞、C127细胞、SP2/0、NS-0、MMT060562、塞尔托利氏细胞(Sertolicell)、BRL3A细胞、HT1080细胞、骨髓瘤细胞、肿瘤细胞和源自前述细胞的细胞系。在一些实施方案中,细胞包含一个或多个病毒基因,例如表达病毒基因的视网膜细胞(例如,PER.C6TM细胞)。在一些实施方案中,宿主细胞是或包括分离的细胞。在一些实施方案中,宿主细胞是组织的一部分。在一些实施方案中,宿主细胞是生物体的一部分。本领域理解的术语“人源化”包括其结构(即,核苷酸或氨基酸序列)包括与在自然界中在非人动物中发现的有关核酸或蛋白质的型式基本上或相同对应并且可与在自然界中在人中发现的相应型式区分的部分的核酸或蛋白质,并且还包括其结构不同于非人动物型式中存在的那些并且相反与在人型式中发现的同等结构更加密切对应的部分。在一些实施方案中,“人源化”基因是编码基本上具有与人多肽(例如,人蛋白质或其部分-例如其特征部分)的氨基酸序列相同的氨基酸序列的多肽的基因。为给出唯一的实例,在膜受体的情况下,“人源化”基因可编码胞外部分的氨基酸序列与人胞外部分相同或基本上相同并且其余序列与非人(例如,小鼠)多肽的序列相同或基本上相同的多肽。在一些实施方案中,人源化基因包含人基因的DNA序列的至少一部分。在一些实施方案中,人源化基因包含在人基因中发现的整个DNA序列。在一些实施方案中,人源化蛋白具有包含在人蛋白中出现的部分的氨基酸序列。在一些实施方案中,人源化蛋白具有整个序列是在人蛋白中发现的氨基酸序列。在一些实施方案(包括例如,其中人源化蛋白具有整个序列是在人蛋白中发现的氨基酸序列的一些实施方案)中,人源化蛋白由非人动物的内源基因座表达,所述内源基因座对应于编码该蛋白质的有关人基因的同源物或直系同源物。关于序列比较的术语“同一性”包括通过本领域已知的可用于测量核苷酸和/或氨基酸序列同一性的许多不同算法中的任一种确定的同一性。在一些实施方案中,使用ClustalWv.1.83(slow)比对,采用10.0的开放空位罚分,0.1的延伸空位罚分,并且使用Gonnet相似矩阵(MACVECTORTM10.0.2,MacVectorInc.,2008)测定如本文所述的同一性。术语“同一性”包括多聚分子之间,例如核酸分子(例如,DNA分子和/或RNA分子)之间和/或多肽分子之间的整体关联性。在一些实施方案中,如果聚合分子的序列至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%相同,则认为聚合分子相互“基本上相同”。正如本领域技术人员所理解的那样,多种算法可用,其容许序列的比较以便测定其同源程度,包括在考虑不同序列中哪些残基相互“对应”时,通过在一个序列中相对于另一个序列容许指定长度的空位。两个核酸序列之间的百分比同一性的计算,例如,可以通过为了最佳比较目的而比对所述两个序列来进行(例如,为了最佳比对可在第一和第二核酸序列之一或两者引入空位并且为了比较的目的可忽视非对应序列)。在某些实施方案中,为了比较目的而比对的序列的长度是参考序列长度的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或基本上100%。然后比较相应核苷酸位置处的核苷酸。第一序列中的位置被与第二序列中相应位置相同的核苷酸占据时,则分子在该位置相同。两个序列之间的百分比同一性是序列共有相同位置的数量的函数,考虑到了为了两个序列的最佳比对需要引入的空位数量和每个空位的长度。用于测定两个核苷酸序列之间的百分比同一性的代表性算法和计算机程序包括,例如Meyers和Miller的算法(CABIOS,1989,4:11-17),该算法已经并入使用PAM120加权残基表,空位长度罚分12和空位罚分4的ALIGN程序(2.0版本)中。两个核苷酸序列之间的百分比同一性可选地,例如使用GCG软件包中的GAP程序,使用NWSgapdna.CMP矩阵测定。术语“分离的”包括已经(1)与在最初产生时(在自然界中和/或在实验环境下)与之缔合的组分的至少一些分开,和/或(2)通过人工设计、生产、制备和/或制造的物质和/或实体。分离的物质和/或实体可与最初与之缔合的其它组分的约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或多于约99%分开。在一些实施方案中,分离的物质纯度为约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或超过约99%。物质如果基本上不含其它组分,则是“纯的”。在一些实施方案中,正如本领域技术人员将理解的那样,物质在与某些其它组分,例如一种或多种载体或赋形剂(例如,缓冲剂、溶剂、水等)组合之后,仍可被视为是“分离的”或“纯的”;在此类实施方案中,计算该物质的百分比分离或纯度,不包括此类载体或赋形剂。为给出唯一的实例,在一些实施方案中,当a)根据其起源或衍生来源不与在自然界中在其天然状态下伴随它的一些或所有组分缔合;b)基本上不含来自于在自然界中产生它的物种的相同物种的其它多肽或核酸;c)由不是在自然界中产生它的物种的细胞或其它系统表达或以其它方式与来自于该细胞或表达系统的组分缔合时,认为生物聚合物如自然界中存在的多肽或多核苷酸是“分离的”。因此,例如,在一些实施方案中,将化学合成或在与自然界中产生它的细胞体系不同的细胞体系中合成的多肽视为“分离的”多肽。可选或另外地,在一些实施方案中可将已经经受一种或多种纯化技术的多肽视为“分离的”多肽,达到其已与a)在自然界中与之缔合;和/或b)在最初产生时与之缔合的其它组分分开的程度。“轻链可变结构域”是指具有优选由重排轻链可变区基因编码或源自重排轻链可变区基因的氨基酸序列的免疫球蛋白结构域,重排轻链可变区基因通常包含来自于轻链可变(VL)基因片段(或其一部分)和轻链连接(JL)基因片段(或其一部分)的序列。在优选的实施方案中,轻链可变区基因序列,例如重排VL-JL基因序列,源自未重排的VL和/或未重排的JL基因片段库,优选能够进行有效基因重排,例如能够重排形成框内轻链可变区基因序列的种系未重排的VL基因片段和/或种系未重排的JL基因片段。VL基因片段或JL基因片段包括来自于任何生物体,包括但不限于啮齿动物(例如,小鼠、大鼠等)和人的VL基因片段或JL基因片段。包含体细胞突变(例如,不是由VL和/或JL基因片段的种系序列编码的氨基酸)的轻链可变结构域和编码轻链可变结构域的重排轻链可变区基因无论如何均可被视为源自种系VL和JL基因片段或其部分,其在第一种情况下,例如在抗原介导增殖之前经有效重排以形成编码轻链可变结构域的基因。除非另有说明,否则免疫球蛋白轻链可变结构域通常从氨基末端到羧基末端包括三个轻链互补决定区(CDR)和四个重链骨架(FR)区,例如FRL1-CDRL1-FRL2-CDRL2-FRL3-CDRL3-FRL4。VL结构域也可指从轻链的N末端延伸(从N末端到C末端)到轻链的轻链恒定结构域的N末端的轻链部分。VL结构域也可指从杂交链的N末端延伸(从N末端到C末端)到杂交链的重链恒定结构域的N末端的杂交链部分。轻链恒定结构域(CL)是指具有优选由来自于任何生物体的轻链恒定区基因编码的氨基酸序列,例如但不限于由Cκ或Cλ基因片段,例如啮齿动物或人Cκ或Cλ基因片段编码的氨基酸序列的免疫球蛋白结构域。此类Cκ或Cλ结构域在本领域公知。通常,CL结构域也可指从FRL4外部延伸(从N末端到C末端)到轻链的C末端的轻链部分。短语“微摩尔范围”旨在意指1-999微摩尔,短语“纳摩尔范围”旨在意指1-999纳摩尔;短语“皮摩尔范围”旨在意指1-999皮摩尔。短语“免疫球蛋白杂交链”、“杂交链”、“杂交免疫球蛋白链”等是指从氨基末端到羧基,包括轻链可变结构域(可能或可能未经体细胞突变)和重链恒定结构域的免疫球蛋白蛋白。通常,杂交链由可操作地连接至重链恒定区基因序列的重排轻链可变区基因序列编码。杂交免疫球蛋白链的轻链可变区基因序列可通常包含来自于轻链可变(VL)基因片段(或其一部分)和轻链连接(VJ)基因片段的序列。在优选的实施方案中,轻链可变区基因序列,例如编码杂交链可变结构域的重排VL-JL基因序列源自未重排的VL和JL基因片段库,优选种系未重排的VL和JL基因片段,该基因片段(a)能够进行有效基因重排,例如能够重排以形成框内轻链可变区基因序列并且(b)可操作地连接至一个或多个重链恒定区基因片段,例如未重排聚类的恒定区基因片段或一个恒定区基因片段。短语“非人动物”包括非人脊椎动物生物体。在一些实施方案中,非人动物为圆口纲脊椎动物、多刺鱼、软骨鱼(例如,鲨鱼或鳐鱼)、两栖动物、爬行动物、哺乳动物或鸟类。在一些实施方案中,非人哺乳动物为灵长类动物、山羊、绵羊、猪、狗、牛或啮齿动物。在一些实施方案中,非人动物为啮齿动物如大鼠或小鼠。短语“核酸”在其广义上包括并入或可以并入寡核苷酸链中的任何化合物和/或物质。在一些实施方案中,核酸是经由磷酸二酯键并入或可以并入寡核苷酸链中的化合物和/或物质。正如从上下文清楚的那样,在一些实施方案中,“核酸”包括一个或多个单独的核酸残基(例如,核苷酸和/或核苷)。在一些实施方案中,“核酸”包括包含单独的核酸残基的寡核苷酸链。“可操作地连接”也是指其中可操作地连接的组分以其预期方式起作用的关系。在一种情况下,编码蛋白质的核酸序列可以可操作地连接至调控序列(例如,启动子、增强子、沉默子序列等)以便维持恰当的转录调控。在一种情况下,免疫球蛋白可变区(或V(D)J片段)的核酸序列可以可操作地连接至免疫球蛋白恒定区的核酸序列以便使序列间恰当重组成重排免疫球蛋白重链或轻链基因序列。术语“多肽”包括氨基酸的任何聚合链。在一些实施方案中,多肽具有在自然界中存在的氨基酸序列。在一些实施方案中,多肽具有在自然界中不存在的氨基酸序列。在一些实施方案中,多肽具有因其通过人工作用设计和/或产生而工程化的氨基酸序列。术语“重组”旨在包括通过重组方式设计、工程化、制备、表达、产生或分离的多肽(例如,如本文所述的B细胞活化因子蛋白),如使用转染到宿主细胞中的重组表达载体表达的多肽,分离自重组、组合人多肽组合库的多肽(HoogenboomH.R.,(1997)TIBTech.15:62-70;AzzazyH.和HighsmithW.E.,(2002)Clin.Biochem.35:425-445;GavilondoJ.V.和LarrickJ.W.(2002)BioTechniques29:128-145;HoogenboomH.和ChamesP.(2000)ImmunologyToday21:371-378),分离自对于人免疫球蛋白基因而言为转基因的动物(例如,小鼠)的抗体(参见例如,Taylor,L.D.等(1992)Nucl.AcidsRes.20:6287-6295;KellermannS-A.和GreenL.L.(2002)CurrentOpinioninBiotechnology13:593-597;LittleM.等(2000)ImmunologyToday21:364-370)或通过涉及将选定序列元件相互剪接的任何其它方式制备、表达、产生或分离的多肽。在一些实施方案中,在自然界中发现一种或多种此类选定序列元件。在一些实施方案中,经由电脑设计一种或多种此类选定序列元件。在一些实施方案中,一种或多种此类选定序列元件由例如来自于天然或合成来源的已知序列元件的诱变(例如,体内或体外)产生。例如,在一些实施方案中,重组多肽由在目标源生物体(例如,人、小鼠等)的基因组中发现的序列组成。在一些实施方案中,重组多肽具有由诱变(例如,在体外或体内,例如在非人动物中)产生的氨基酸序列,以致重组多肽的氨基酸序列是虽然源于多肽序列并且与之相关,但是可能并非天然存在于非人动物体内基因组中的序列。术语“参考”在本文用于描述将目标物质或值与之比较的标准或对照物质或值。在一些实施方案中,基本上与目标物质或值的试验或测定同时测试参考物质和/或确定参考值。在一些实施方案中,参考物质或值为历史参考,任选地在有形介质中体现。通常,正如本领域技术人员将理解的那样,在与用于测定或表征目标物质或值的同等条件下测定或表征参考物质或值。在一些实施方案中,对照或“参考”非人动物(例如,小鼠)在本文中提供并且包括基因组表达传统免疫球蛋白分子(即,具有同源VH和VL结构域的免疫球蛋白)的基因工程化非人动物。在一些某些实施方案中,对照基因工程化非人动物包括人源化小鼠(参见例如,美国专利第8,502,018和8,642,835号,其通过引用并入本文)和/或“ULC小鼠”(参见US2011-0195454A1、US2012-0021409A1、US2012-0192300A1、US2013-0045492A1、US2013-0185821A1和US2013-0302836A1;其通过引用整体并入本文)。术语“替换”在本文用于包括将宿主基因座中(例如,基因组中)发现的“被替换的”核酸序列(例如,基因)从该基因座去除并且使不同的“替换”核酸位于其位置的过程。在一些实施方案中,被替换的核酸序列和替换核酸序列相互同等之处在于,例如它们相互同源和/或含有相应元件(例如,蛋白质编码元件、调控元件等)。在一些实施方案中,被替换的核酸序列包括启动子、增强子、剪接供体位点、剪接受体位点、内含子、外显子、非翻译区(UTR)中的一种或多种;在一些实施方案中,替换核酸序列包括一个或多个编码序列。在一些实施方案中,替换核酸序列是被替换的核酸序列的同源物。在一些实施方案中,替换核酸序列是被替换序列的直系同源物。在一些实施方案中,替换核酸序列是或包括人核酸序列。在一些实施方案中,包括替换核酸序列是或包括人核酸序列时,被替换的核酸序列是或包括啮齿动物序列(例如,小鼠序列)。这样放置的核酸序列可包括一个或多个调控序列,该调控序列是用于获得这样放置的序列的源核酸序列的一部分(例如,启动子、增强子、5'-或3'-非翻译区等)。例如,在各个实施方案中,替换是内源序列被异源序列取代,导致由这样放置的核酸序列(包括异源序列)生成基因产物,但是内源序列不表达;替换是内源基因组序列被编码具有与内源序列编码的蛋白质相似功能的蛋白质的核酸序列替换(例如,内源基因组序列编码可变结构域,并且DNA片段编码一个或多个人可变结构域)。在各个实施方案中,内源基因或其片段被相应的人基因或其片段替换。相应的人基因或其片段是为被替换的内源基因或其片段的直系同源物,或在结构和/或功能上与之基本上相似或相同的人基因或片段。短语“小分子”包括在载体不存在时,分子量大小小于约6千道尔顿(kD),并且可提取自天然来源或合成产生(异型生物质)的有机化合物。“小分子”也可包括还包含无机原子,例如络合金属的有机化合物。“小分子”可指半抗原,例如可结合呈传统免疫球蛋白形式的抗原结合蛋白,但不会引起适应性免疫反应的分子。在一些实施方案中,在载体不存在时,小分子小于约5kD、4kD、3kD、约2kD或约1kD。在一些实施方案中,如本文所述,在载体不存在时,小分子的分子量范围为1kD至6kD。在一些实施方案中,在载体不存在时,小分子的分子量小于1.5kD。在一些某些实施方案中,如本文所述,在载体不存在时,小分子的分子量小于1400道尔顿(D)、小于1300D、小于1200D、小于1100D、小于1000D、小于900D、小于800D、小于700D、小于600D、小于500D、小于400D、小于300D、小于200D或小于100D。在一些实施方案中,在载体不存在时,小分子小于约800道尔顿(D)、约600D、约500D、约400D、约300D、约200D或约100D。在一些实施方案中,在载体不存在时,小分子小于约2000g/mol、小于约1500g/mol、小于约1000g/mol、小于约800g/mol或小于约500g/mol。在一些实施方案中,小分子不是聚合物。在一些实施方案中,小分子不包括聚合部分。在一些实施方案中,小分子不是蛋白质或多肽(例如,不是寡肽或肽)。在一些实施方案中,小分子不是多核苷酸(例如,不是寡核苷酸)。在一些实施方案中,小分子不是多糖。在一些实施方案中,小分子不包括多糖(例如,不是糖蛋白、蛋白聚糖、糖脂等)。在一些实施方案中,小分子不是脂质。在一些实施方案中,小分子是调节剂。在一些实施方案中,小分子具生物活性。在一些实施方案中,小分子可检测(例如,包含至少一个可检测部分)。在一些实施方案中,小分子为治疗剂)。短语“体细胞高频突变”包括对来自于已经历类别转换的B细胞的核酸序列或由体细胞核酸序列编码的氨基酸序列的提及,其中类别转换B细胞中的免疫球蛋白可变区的核酸序列(例如,编码轻链可变结构域或包括轻链CDR或FR序列的核苷酸序列)与类别转换之前B细胞中的核酸序列不相同,例如尚未经历类别转换的B细胞和已经历类别转换的B细胞之间CDR或骨架核酸序列上有差异。“体细胞突变”或包括对来自于亲和力成熟B细胞的与非亲和力成熟B细胞中的相应免疫球蛋白可变区序列(即,种系细胞的基因组中的序列)不相同的核酸序列或由此编码的氨基酸序列的提及。短语“体细胞突变”还包括对在B细胞暴露于目标表位之后来自于B细胞的免疫球蛋白可变区核酸序列的提及,其中该核酸序列不同于B细胞暴露于目标表位之前的相应核酸序列。短语“体细胞突变”包括来自于在动物,例如具有人免疫球蛋白可变区核酸序列的小鼠中响应于抗原激发已经产生的,并且由此类动物中的固有操作性选择过程产生的免疫球蛋白的序列。术语“基本上”包括表现出全部或近全部范围或程度的目标特征或性质的定性条件。生物领域的普通技术人员将理解,生物和化学现象很少(即使有)完成和/或继续进行到完成或实现或避免绝对结果。因此术语“基本上”在本文用于捕获许多生物和化学现象中固有的完全性的潜在缺乏。短语“基本同源性”包括氨基酸或核酸序列间的比较。正如本领域普通技术人员将认识到那样,两个序列如果在相应位置上含有同源残基,则通常将其视为“基本上同源”。同源残基可为相同残基。可选地,同源残基可以是具有适当相似的结构和/或功能特征的不同残基。例如,正如本领域普通技术人员公知的那样,通常将某些氨基酸分类为“疏水性”或“亲水性”氨基酸,和/或具有“极性”或“非极性”侧链。一个氨基酸取代为另一个相同类型的氨基酸常常可视为“同源”取代。表1和2中总结了典型氨基酸分类。正如本领域所公知,可使用多种算法中的任一种比较氨基酸或核酸序列,所述算法包括商用计算机程序中可用的那些,例如用于核苷酸序列的BLASTN和用于氨基酸序列的BLASTP、空位BLAST和PSI-BLAST。示例性的此类程序在Altschul等,Basiclocalalignmentsearchtool,J.Mol.Biol.,215(3):403-410,1990;Altschul等,MethodsinEnzymology;Altschul等,"GappedBLASTandPSI-BLAST:anewgenerationofproteindatabasesearchprograms",NucleicAcidsRes.25:3389-3402,1997;Baxevanis等,Bioinformatics:APracticalGuidetotheAnalysisofGenesandProteins,Wiley,1998;和Misener等(编辑),BioinformaticsMethodsandProtocols(MethodsinMolecularBiology,第132卷),HumanaPress,1999中有描述。除鉴定同源序列外,以上提到的程序通常提供同源性程度的指示。在一些实施方案中,如果两个序列的相应残基在一段相关残基上至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同源,则将两个序列视为基本上同源。在一些实施方案中,相关段为完整序列。在一些实施方案中,相关段为至少9、10、11、12、13、14、15、16、17个或更多个残基。在一些实施方案中,相关段包括沿着完整序列的连续残基。在一些实施方案中,相关段包括沿着完整序列的不连续残基。在一些实施方案中,相关段为至少10、15、20、25、30、35、40、45、50或更多个残基。表1表2短语“基本同一性”包括氨基酸或核酸序列间的比较。正如本领域普通技术人员将认识到那样,两个序列如果在相应位置上含有相同残基,则通常将其视为“基本上相同”。正如本领域所公知,可使用多种算法中的任一种比较氨基酸或核酸序列,所述算法包括商用计算机程序中可用的那些,例如用于核苷酸序列的BLASTN和用于氨基酸序列的BLASTP、空位BLAST和PSI-BLAST。此类示例性程序在Altschul等,Basiclocalalignmentsearchtool,J.Mol.Biol.,215(3):403-410,1990;Altschul等,MethodsinEnzymology;Altschul等,NucleicAcidsRes.25:3389-3402,1997;Baxevanis等,Bioinformatics:APracticalGuidetotheAnalysisofGenesandProteins,Wiley,1998;和Misener等(编辑),BioinformaticsMethodsandProtocols(MethodsinMolecularBiology,第132卷),HumanaPress,1999中有描述。除鉴定相同序列外,以上提到的程序通常提供同一性程度的指标。在一些实施方案中,如果两个序列的相应残基在一段相关残基上至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同,则将两个序列视为基本上相同。在一些实施方案中,相关段为完整序列。在一些实施方案中,相关段为至少10、15、20、25、30、35、40、45、50或更多个残基。短语“靶向载体”或“靶向构建体”包括包含靶向区域的多核苷酸分子。靶向区域包含与靶细胞、组织或动物中的序列相同或基本上相同的序列并且提供了靶向构建体经由同源重组向该细胞、组织或动物的基因组内的位置的整合。还包括使用位点特异性重组酶识别位点(例如,loxP或Frt位点)进行靶向的靶向区域。在一些实施方案中,本发明的靶向构建体还包含特别感兴趣的核酸序列或基因、选择标记、控制和或调控序列,和允许通过外源添加有助于或利于涉及此类序列的重组的蛋白质而介导的重组的其它核酸序列。在一些实施方案中,本发明的靶向构建体还包含整个或部分的目标基因,其中目标基因是编码具有与由内源序列编码的蛋白质相似功能的整个或部分蛋白质的异源基因。关于核酸序列的术语“未重排的”,包括动物细胞种系中存在的核酸序列。通常,在未修饰的非人动物中的B细胞发育期间,未重排的基因片段的第一次重排是重链基因座中DH和JH基因片段的连接,产生前B细胞。后续重排包括重链基因座中的VH-DHJH连接,并且如果有效,则包括轻链基因座中轻链可变区基因片段的重排,例如VL基因片段与JL基因片段的连接。如果连接是在框内(“有效”),则认为重排“有效”。一个等位基因处的有效重排可引起等位基因排斥,例如另一个等位基因沉默。“未重排”还指能够进行有效重排以形成与重链恒定区基因片段可操作地连接的轻链可变区基因的未重排VL和JL基因片段,此类可操作连接产生编码杂交免疫球蛋白链的基因,这样也可引起一个或多个内源重链等位基因的等位基因排斥和/或一个或多个内源轻链基因座处轻链可变区基因片段的重排。短语“可变结构域”包括免疫球蛋白轻链或重链(根据需要修饰)的氨基酸序列,其按照从N末端到C末端的顺序(除非另外指出)包含以下氨基酸区域:FR1、CDR1、FR2、CDR2、FR3、CDR3、FR4。术语“变体”包括与参考实体表现出显著结构同一性,但是在一个或多个化学部分的存在或水平上与参考实体相比,在结构上不同于参考实体的实体。在许多实施方案中,变体在功能上也不同于其参考实体。一般而言,是否将特定实体适当地视为参考实体的“变体”是基于其与参考实体的结构同一性程度。正如本领域技术人员将认识到的那样,任何生物或化学参考实体均具有某些特征结构元件。按照定义,变体是共有一种或多种此类特征结构元件的不同化学实体。为了给出仅有的几个实例,小分子可具有特征核心结构元件(例如,大环核心)和/或一个或多个特征侧悬部分,使得小分子的变体是共有核心结构元件和特征悬垂部分,但是在其它悬垂部分和/或核心内存在的键的类型(单键与双键、E与Z等)上不同的变体,多肽可具有由多个相对于彼此在线性或三维空间上具有指定位置和/或有助于特定生物功能的氨基酸组成的特征序列元件,核酸可具有由多个相对于彼此在线性或三维空间上具有指定位置的核苷酸残基组成的特征序列元件。例如,由于氨基酸序列上的一个或多个差异和/或与多肽骨架共价连接的化学部分(例如,碳水化合物、脂质等)中的一个或多个差异,变体多肽可不同于参考多肽。在一些实施方案中,变体多肽与参考多肽显示出至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%或99%的总体序列同一性。可选地或另外,在一些实施方案中,变体多肽与参考多肽未共有至少一个特征序列元件。在一些实施方案中,参考多肽具有一种或多种生物活性。在一些实施方案中,变体多肽共有参考多肽的一种或多种生物活性。在一些实施方案中,变体多肽缺乏参考多肽的一种或多种生物活性。在一些实施方案中,变体多肽与参考多肽相比显示出一种或多种生物活性的水平降低。在许多实施方案中,如果没有特定位置的少量序列改变,目标多肽具有与亲本相同的氨基酸序列,则将目标多肽视为亲本或参考多肽的“变体”。通常,与亲本相比,变体中少于20%、15%、10%、9%、8%、7%、6%、5%、4%、3%、2%的残基被取代。在一些实施方案中,变体与亲本相比具有10、9、8、7、6、5、4、3、2或1个被取代的残基。常常,变体具有很少量(例如,少于5、4、3、2或1个)被取代的功能残基(即,参与特定生物活性的残基)。此外,与亲本相比变体通常具有不超过5、4、3、2或1个添加或缺失,并且常常没有添加或缺失。而且,任何添加或缺失通常少于约25个、约20个、约19个、约18个、约17个、约16个、约15个、约14个、约13个、约10个、约9个、约8个、约7个、约6个,并且通常少于约5个、约4个、约3个或约2个残基。在一些实施方案中,亲本或参考多肽是在自然界中发现的多肽。正如本领域普通技术人员将理解的那样,通常可在自然界中发现特定目标多肽的多种变体,特别是在目标多肽为传染物多肽时。术语“载体”包括能够转运与之缔合的另一个核酸的核酸分子。在一些实施方案中,载体能够染色体外复制和/或表达在宿主细胞如真核和/或原核细胞中与之连接的核酸。能够指导操作性连接的基因的表达的载体在本文中称为“表达载体”。术语“野生型”具有其在本领域所理解的含义,包括具有正如在自然界中所发现的结构和/或活性,处于“正常”(与突变体、患病、改变等相反)状态或环境的实体。本领域普通技术人员将认识到,野生型基因和多肽常常以多种不同形式(例如,等位基因)存在。某些实施方案的详细描述除了别的之外,本发明提供了使用具有编码轻链可变结构域(例如,VL区)的人遗传物质的基因工程化非人动物的方法。在某些实施方案中,此类非人动物用于,例如产生和分离人VL结构域和此类人VL结构域中所包含的互补决定区(CDR),所述互补决定区结合避开传统免疫球蛋白形式的抗原决定簇。预期此类非人动物提供用于表现出独特抗原结合特征的人VL结构域的产生和亲和力成熟化的新型体外系统。此类抗原结合蛋白具有识别可避开天然免疫球蛋白的外源抗原的能力。在一些实施方案中,本发明的非人动物与对照经遗传修饰的非人动物相比能够产生结合抗原的同源人VL结构域;在一些实施方案中,此类非人哺乳动物产生和/或具有表达在结构上类似于免疫球蛋白,而无任何重链可变序列的结合蛋白的B细胞群。在一些实施方案中,由此类非人动物表达的抗原结合蛋白特征在于抗原结合部分只由人VL结构域组成。在一些实施方案中,本发明的非人动物包含含有来自于非人动物和异源物种(例如,人)的遗传物质的内源免疫球蛋白重链基因座并且包含含有来自于非人动物和异源物种(例如,人)的遗传物质的内源免疫球蛋白轻链基因座。在一些实施方案中,本发明的非人动物包含包括未重排的人VL和JL基因片段的免疫球蛋白重链基因座和包括未重排的人VL和JL基因片段的免疫球蛋白轻链基因座。在一些实施方案中,抗原结合蛋白的表达受非人免疫球蛋白遗传物质(例如,非人免疫球蛋白启动子和/或增强子)的控制。在以下部分中详细描述了本发明的各个方面。部分的使用并非意在限制本发明。每个部分均适用于本发明的任一方面。对小分子有特异性的免疫球蛋白样结合蛋白一方面,提供了特异性结合小分子的VL抗原结合蛋白。本文描述的VL抗原结合蛋白方面包括包含由杂交免疫球蛋白基因编码的杂交链的VL抗原结合蛋白,杂交免疫球蛋白基因包含或源自优选未重排且更优选为人的VL基因片段(或其一部分),其与可操作地连接至编码一个或多个重链恒定结构域的核苷酸序列的优选未重排且更优选为人JL基因片段(或其一部分)重排。轻链基因片段重排后,获得重排核苷酸序列,其包含与编码重链恒定区的序列融合的编码轻链可变区的序列。该序列编码具有与重链恒定结构域融合的轻链可变结构域的杂交免疫球蛋白链。因此,在一个实施方案中,从N末端到C末端,杂交免疫球蛋白基本上由VL结构域和CH结构域组成。在一个实施方案中,CH结构域包含CH1区、铰链、CH2区、CH3区和任选CH4区。在另一个实施方案中,CH1结构域缺乏功能CH1结构域,例如缺乏整个或部分的CH1结构域,并且另外可缺乏铰链区。在一些实施方案中,VL抗原结合蛋白包含杂交免疫球蛋白链,其包含特异性结合小分子的免疫球蛋白轻链可变结构域,其中所述免疫球蛋白轻链可变结构域可操作地连接至重链恒定区。在一些实施方案中,VL抗原结合蛋白包含第一和第二免疫球蛋白轻链可变结构域,其中所述第一和第二免疫球蛋白轻链可变结构域可缔合形成特异性结合小分子的结合口袋。一方面,提供了一种抗原结合蛋白,其基本上由缔合形成结合口袋的第一和第二免疫球蛋白轻链可变结构域组成,其中所述抗原结合蛋白特异性结合小分子。在一个实施方案中,第一和/或第二免疫球蛋白轻链可变结构域为人免疫球蛋白轻链可变结构域。在一个实施方案中,第一和/或第二免疫球蛋白轻链结构域来自于啮齿动物。在一个实施方案中,啮齿动物选自小鼠或大鼠。在各个实施方案中,如本文所公开的VL抗原结合蛋白,例如本文公开的经遗传修饰的非人动物,例如小鼠产生的那些,平均来说可小于常规抗体,并且具有与更小尺寸相关的优点。更小尺寸至少部分通过一般存在于VH结构域中的DH区编码的氨基酸序列的缺乏来实现。更小尺寸也可以在源自例如Vκ区和Jκ区的CDR3形成时实现。在一个实施方案中,轻链可变结构域以比由人免疫球蛋白轻链和重链可变结构域形成的人抗原结合蛋白的结合口袋更高的亲和力结合小分子。在一个实施方案中,第一和/或第二免疫球蛋白轻链可变结构域为人免疫球蛋白轻链可变结构域。在一个实施方案中,轻链可变结构域的结合口袋以比由人免疫球蛋白轻链和重链可变结构域形成的人抗体的结合口袋更高的亲和力结合小分子。在一个实施方案中,第一轻链可变结构域与第一免疫球蛋白重链恒定区连接。在一个实施方案中,第一免疫球蛋白重链恒定区来自于非人动物。在一个实施方案中,非人动物为啮齿动物。在一个实施方案中,啮齿动物选自小鼠或大鼠。在一个实施方案中,非人动物为鸡。在一个实施方案中,第一免疫球蛋白重链恒定区选自CH1、铰链、CH2、CH3、CH4及其组合。在一个实施方案中,第一免疫球蛋白重链恒定区包含CH1、铰链、CH2和CH3。在一个实施方案中,第二免疫球蛋白轻链可变结构域与第二免疫球蛋白轻链恒定区连接。在一个实施方案中,第二免疫球蛋白轻链恒定区来自于非人动物。在一个实施方案中,非人动物为啮齿动物。在一个实施方案中,啮齿动物选自小鼠或大鼠。在一个实施方案中,非人动物为鸡。在一个实施方案中,VL抗原结合蛋白包含两个相同的轻链可变结构域。在一个实施方案中,VL抗原结合蛋白包含两个具有异源序列的轻链可变结构域。结合小分子的VL抗原结合蛋白可得自如本文所公开的经遗传修饰的非人动物或源自在用小分子免疫后从此类动物分离的细胞和/或核酸。表达VL蛋白的经遗传修饰的非人动物提供了表达包含杂交免疫球蛋白链的VL抗原结合蛋白的非人动物,杂交免疫球蛋白链具有与免疫球蛋白轻链可变结构域融合的重链恒定结构域。此外,提供了多种策略以遗传修饰非人动物,例如啮齿动物,包括但不限于大鼠和小鼠,以表达作为VL抗原结合蛋白的一部分的杂交链,其中所述杂交链由编码VL区,可操作地连接至编码CH区的核苷酸序列的核酸编码或源自该核酸。此类经遗传修饰的非人动物代表用于产生具有一些常规抗体的四聚体结构,然而与传统抗体相比表现出独特结合特征的VL抗原结合蛋白群体的来源。本文描述的经修饰非人动物可产生VL抗原结合蛋白,其也包含与杂交链配对的同源轻链以产生抗体样,例如可为四聚体的VL抗原结合蛋白,但是其中代替重链(或成对的重链),VL抗原结合蛋白包含杂交链(或成对的杂交链),该杂交链包含VL结构域—而不是VH结构域—与CH结构域融合。在各个实施方案中,经修饰非人动物产生VL抗原结合蛋白,其中杂交链的VL结构域表现出比轻链的VL结构域增强程度的体细胞高频突变。在一些实施方案中,杂交链的VL区表现出比与CL区融合的VL区高约1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍或5倍或更多的体细胞高频突变。在一些实施方案中,经修饰非人动物,例如小鼠,响应于抗原展现出一群包含杂交链的VL结构域的抗原结合蛋白,其中该群VL抗原结合蛋白在杂交链的VL结构域中表现出比在野生型小鼠响应于相同抗原所展现出的一群抗原结合蛋白,例如轻链的VL结构域中所观察到的平均高约1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍或更多的体细胞高频突变。在一个实施方案中,杂交链的VL结构域中的体细胞高频突变包含在CDR3中的一个或多个或两个或更多个N添加。在各个实施方案中,VL抗原结合蛋白包含杂交链,该杂交链包含由免疫球蛋白轻链序列编码的可变结构域,免疫球蛋白轻链序列包含比在自然界中对于由内源轻链基因座重排的轻链所观察到的更多数量的N添加,例如VL和人JL基因片段重排形成与重链恒定区基因可操作地连接的重排可变区基因,其中所述重排轻链可变区包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16个或更多个N添加。一方面,提供了非人动物,例如小鼠,其包含免疫球蛋白杂交链基因座。在一个实施方案中,杂交链基因座在内源重链基因座内产生,其中在内源小鼠免疫球蛋白重链基因座处的一个或多个免疫球蛋白重链可变区(VH)基因片段、重链多样性(DH)基因片段和重链连接(JH)基因片段被一个或多个轻链可变区(VL)基因片段和一个或多个轻链连接区(JL)基因片段替换。一方面,提供了一种非人动物,其包含替换内源免疫球蛋白重链基因座的杂交链基因座,例如一个或两个重链基因座的所有或基本上所有内源VH、DH和JH基因片段被一个或多个VL基因片段和一个或多个JL基因片段替换,二者在内源重链基因座处形成重排VL基因序列,其能够与内源小鼠CH基因重组形成源自VL基因片段、JL基因片段和内源小鼠CH基因的重排基因。非人动物还涵盖免疫球蛋白基因座的人源化,其产生类似于一些常规抗体的四聚体结构,而在结合特征上不同的结合蛋白,例如VL抗原结合蛋白表达,并且引起所述VL抗原结合蛋白在非人动物的细胞膜表面的表达。在一些实施方案中,本发明的非人动物能够在VL抗原结合蛋白的杂交链和轻链中的任一个或两者上产生结合抗原的人VL结构域;在一些实施方案中,此类非人哺乳动物产生和/或具有表达结合蛋白的B细胞群,所述结合蛋白包含并非由任何VH、DH和/或JH基因片段序列编码或源自其中的可变结构域。在一些实施方案中,由此类非人动物表达的VL抗原结合蛋白特征在于抗原结合部分只由人VL结构域组成。在一些实施方案中,本发明的非人动物在内源免疫球蛋白重链基因座处包含来自于非人动物和异源物种(例如,人)的遗传物质并且在内源免疫球蛋白轻链基因座处包含来自于非人动物和异源物种(例如,人)的遗传物质。在一些实施方案中,本发明的非人动物包含包括未重排的人VL基因片段和/或人JL基因片段的免疫球蛋白杂交链基因座和包括未重排的人VL基因片段和/或人JL基因片段的免疫球蛋白轻链基因座。在一些实施方案中,VL抗原结合蛋白的表达受非人免疫球蛋白遗传物质(例如,非人免疫球蛋白启动子和/或增强子)的控制。在一个实施方案中,VL片段为人VL。在一个实施方案中,JL片段为人JL。在一个具体实施方案中,VL和JL片段为人VL和人JL片段。在一个实施方案中,所有或基本上所有VH、DH和JH基因片段被至少六个人Vκ基因片段和至少一个Jκ基因片段替换。在一个实施方案中,所有或基本上所有VH、DH和JH基因片段被至少16个人Vκ基因片段(人Vκ)和至少一个Jκ基因片段替换。在一个实施方案中,所有或基本上所有VH、DH和JH基因片段被至少30个人Vκ基因片段和至少一个Jκ基因片段替换。在一个实施方案中,所有或基本上所有VH、DH和JH基因片段被至少40个人Vκ基因片段和至少一个Jκ基因片段替换。在一个实施方案中,所述至少一个Jκ基因片段包括2、3、4或5个人Jκ基因片段。在一个实施方案中,VL片段为人Vκ片段。在一个实施方案中,人Vκ片段包含4-1、5-2、7-3、2-4、1-5和1-6。在一个实施方案中,Vκ片段包含3-7、1-8、1-9、2-10、3-11、1-12、1-13、2-14、3-15、1-16。在一个实施方案中,人Vκ片段包含1-17、2-18、2-19、3-20、6-21、1-22、1-23、2-24、3-25、2-26、1-27、2-28、2-29和2-30。在一个实施方案中,人Vκ片段包含3-31、1-32、1-33、3-34、1-35、2-36、1-37、2-38、1-39和2-40。在一个实施方案中,VL片段为人Vκ片段并且包含4-1、5-2、7-3、2-4、1-5、1-6、3-7、1-8、1-9、2-10、3-11、1-12、1-13、2-14、3-15和1-16。在一个实施方案中,Vκ片段还包含1-17、2-18、2-19、3-20、6-21、1-22、1-23、2-24、3-25、2-26、1-27、2-28、2-29和2-30。在一个实施方案中,Vκ片段还包含3-31、1-32、1-33、3-34、1-35、2-36、1-37、2-38、1-39和2-40。在一个实施方案中,VL片段为人Vλ片段并且包含人λ轻链基因座的聚类A的片段。在一个具体实施方案中,人λ轻链基因座的聚类A的片段从hVλ3-27延伸到hVλ3-1。在一个实施方案中,VL片段包含人λ轻链基因座的聚类B的片段。在一个具体实施方案中,人λ轻链基因座的聚类B的片段从hVλ5-52延伸到hVλ1-40。在一个实施方案中,VL片段包括人λ轻链可变区序列,该序列包含聚类A的基因组片段和聚类B的基因组片段。在一个实施方案中,人λ轻链可变区序列包含聚类A的至少一个基因片段和聚类B的至少一个基因片段。在一个实施方案中,VL片段包括聚类B的至少一个基因片段和聚类C的至少一个基因片段。在一个实施方案中,VL片段包含hVλ3-1、4-3、2-8、3-9、3-10、2-11和3-12。在一个具体实施方案中,VL片段包含从Vλ3-12跨度到Vλ3-1的人λ轻链基因座的连续序列。在一个实施方案中,连续序列包含至少2、3、4、5、6、7、8、9、10、11或12个hVλ。在一个具体实施方案中,hVλ包括3-1、4-3、2-8、3-9、3-10、2-11和3-12。在一个具体实施方案中,hVλ包含从Vλ3-12跨度到Vλ3-1的人λ基因座的连续序列。在一个实施方案中,hVλ包含13至28个或更多个hVλ。在一个具体实施方案中,hVλ包括2-14、3-16、2-18、3-19、3-21、3-22、2-23、3-25和3-27。在一个具体实施方案中,hVλ包含从Vλ3-27跨度到Vλ3-1的人λ基因座的连续序列。在一个实施方案中,VL片段包含29至40个hVλ。在一个具体实施方案中,VL片段包含从Vλ3-29跨度到Vλ3-1的人λ基因座的连续序列,和从Vλ5-52跨度到Vλ1-40的人λ基因座的连续序列。在一个具体实施方案中,经遗传修饰的小鼠中hVλ1-40和hVλ3-29之间的所有或基本上所有序列基本上由在自然界中(例如在人群体中)发现的hVλ1-40基因片段下游(3’非翻译部分下游)的大约959bp的人λ序列、限制酶位点(例如PI-SceI),接着是在自然界中发现的hVλ3-29基因片段上游的大约3,431bp的人λ序列组成。在一个实施方案中,Jκ是人的并且选自由以下组成的组:Jκ1、Jκ2、Jκ3、Jκ4、Jκ5及其组合。在一个具体实施方案中,Jκ包含Jκ1至Jκ5。在一个实施方案中,VL片段为人Vλ片段,并且Jκ基因片段包含具有12-mer间隔区的RSS,其中RSS并置于Jκ基因片段的上游末端。在一个实施方案中,VL基因片段为人Vλ并且VLH基因座包含两个或更多个Jκ基因片段,各自包含具有12-mer间隔区的RSS,其中RSS并置于每个Jκ基因片段的上游末端。在一个具体实施方案中,VL片段包含从Vκ4-1到Vκ2-40跨越人κ基因座的连续人κ基因片段,并且JL片段包含从Jκ1到Jκ5跨越人κ基因座的连续基因片段。在一个实施方案中,VL片段为Vλ片段并且在VL片段和J片段之间不存在DH片段时,VL片段下游侧接(即,并置于下游侧)23-merRSS,并且Jκ片段(若存在)或Jλ片段(若存在)上游侧接(即,并置于上游侧)12-merRSS。在一个实施方案中,V基因片段为Vκ基因片段并且在V基因片段和J基因片段之间不存在DH基因片段时,Vκ基因片段各自与12-merRSS并置于下游侧,并且Jκ片段(若存在)或Jλ片段(若存在)各自与23-merRSS并置于上游侧。一方面,提供了一种细胞,其包含如本文所述的经修饰免疫球蛋白基因座。在一个实施方案中,细胞选自全能细胞、多能细胞、诱导多能干细胞(iPS)和ES细胞。在一个实施方案中,ES细胞是源自129S6/SvEvTac和C57BL/6NTac杂合胚胎的F1ES系(F1H4;Valenzuela等,2007,同上),杂合胚胎其还含有人κ轻链基因片段对小鼠κ轻链基因片段的原位替换(例如,参见美国专利第6,596,541和8,642,835号,其通过引用整体并入本文)。在一个实施方案中,在基因组包含50%BALB/c[Tac]、25%C57BL/6N[Tac]和25%129S4/SvJae(V17)的杂交ES细胞系中进行遗传修饰。在一个具体实施方案中,细胞为小鼠细胞,例如小鼠ES细胞。在一个实施方案中,对于经修饰免疫球蛋白基因座而言该细胞为纯合。在一个实施方案中,细胞为大鼠细胞,例如大鼠ES细胞(参见,US-2014-0310828-A1,其通过引用整体并入本文)。小分子在一个实施方案中,小分子为半抗原,并且小分子与载体连接。在一个实施方案中,载体包括钥孔戚血蓝蛋白(KLH)、似鲍罗螺血蓝蛋白(CCH)、牛血清白蛋白(BSA)、阳离子化牛血清白蛋白(cBSA)或卵清蛋白。在一个实施方案中,小分子是分子量小于6kDa的有机化合物。在一些实施方案中,小分子是半抗原,因为它只有在连接于较大载体时才引起免疫反应,但是在缺乏载体或其它佐剂的其它同等条件下,例如在佐剂不存在时单独用作免疫原时不产生有用或显著的免疫反应。半抗原的实例包括但不限于抗生素、杀虫剂、除草剂、杀昆虫剂、药物、维生素、类固醇、激素、毒素、易爆物和染料(参见例如,Gunther,S.等,SuperHapten:acomprehensivedatabaseforsmallimmunogeniccompounds,NucleicAcidsRes.,2007,D906-910,其通过引用整体并入本文)。半抗原和相应的半抗原-载体偶联物的综合列表也可以在半抗原数据库中找到(Singh,M.等,Bioinformatics,2006,22:253-255),数据库可经由互联网在万维网(www)上URL"imtech.res.in/raghava/haptendb/”进入。在一些实施方案中,载体是结合半抗原并使其能够诱导免疫反应的大分子。在一些实施方案中,载体是分泌蛋白或细胞表面蛋白。在一些实施方案中,载体是聚合物。在一些实施方案中,载体是钥孔戚血蓝蛋白(KLH)。在一些实施方案中,载体是似鲍罗螺血蓝蛋白(CCH)的纯化制剂。在一些实施方案中,载体是牛血清白蛋白(BSA)。在一些实施方案中,载体是通过用过量乙二胺使天然BSA改性,用带正电的伯胺使带负电的羧基基本封端而制备的阳离子化BSA(cBSA)。在一些实施方案中,载体是卵清蛋白。在一些实施方案中,小分子是天然类固醇。在一些实施方案中,小分子是特征在于17个碳原子呈4个环排列的分子结构的类固醇。如本文所述的类固醇的实例包括但不限于激素和生物碱。在一些实施方案中,类固醇为强心类固醇(CTS)。在一些实施方案中,CTS是Na+/K+-ATP酶的抑制剂。CTS的实例包括但不限于强心甾(内源性哇巴因(ouabain))、蟾蜍二烯羟酸内酯(bufadienolide)、蟾蜍灵(bufalin)、海蟾蜍毒素(marinobufagenin,MBG)和远华蟾蜍精(telocinobufagin)。在一些实施方案中,半抗原为海蟾蜍毒素(MBG)并且载体为牛血清白蛋白。在一些实施方案中,类固醇为皮质醇。在一些实施方案中,小分子为毒物或有毒物质,包括但不限于对硫磷(parathion)、马拉硫磷(malathion)、焦磷酸四乙酯(TEPP)、4,6-二硝基-邻甲酚(DNOC)、甲基对硫磷(metacide)、内吸磷(demeton)(systex)、氯丹(chlordane)、毒杀芬(toxaphene)、艾氏剂(aldrin)、六六六、林丹(lindane)、狄氏剂(dieldrin)、鱼藤酮(rotenone)、pestex、二氯二苯三氯乙烷(DDT)、硒化合物(silocide)、磷化锌(Zn3P2)、番木鳖碱化合物、华法林(warfarin)和三氧化二砷。在一些实施方案中,小分子是穿过血脑屏障并且对中枢神经系统起作用的精神药物或精神调理物质,在中枢神经系统其影响脑功能,引起知觉、情绪、意识、认知和行为上的变化。在一些实施方案中,小分子为刺激物,包括但不限于咖啡因(caffeine)、尼古丁(nicotine)、安非他明(amphetamine)和可卡因(cocaine)。在一些实施方案中,小分子为原阿片碱,包括但不限于吗啡(morphine)、可待因(codeine)、海洛因(heroin)、芬太尼(fentanyl)、美沙酮(methadone)和羟考酮(oxycodone)。在一些实施方案中,小分子是扭曲感官知觉,包括视觉和听觉的迷幻药物。迷幻药物的实例包括但不限于酶斯卡林(mesacaline)、裸盖菇素(psilocybin)、二甲色胺(DMT)、麦角酸二乙胺(LSD)、二甲氧基甲苯异丙胺(DOM或“STP”)、亚甲二氧基甲基苯丙胺(MDMA或“摇头丸(ecstasy)”)。在一些实施方案中,小分子为神经递质,包括但不限于乙酰胆碱、去甲肾上腺素、肾上腺素、多巴胺、血清素、谷氨酸盐、甘氨酸和γ-氨基丁酸(GABA)。在一些实施方案中,小分子包括但不限于毛喉素(forskolin)、茄边碱(solamarigine)、藏花素(crocin)、大麻化合物、阿片生物碱(opiumalkaloid)、人参皂苷(ginsenoside)、小蘖碱(berberine)、番泻苷(sennoside)、芍药苷(paeoniflorin)、甘草甜素(glycyrrhizin)、银杏酚酸(ginkgolicacid)、乌头类生物碱(aconitinealkaloid)和黄芩苷(baicalin)。核酸构建体、细胞和制备其的方法一方面,提供了编码特异性结合小分子的VL结合结构域的可变结构域的核酸,和表达该核酸的细胞。一方面,提供了如本文所述的来自于小鼠的核酸序列制备用于生产人治疗剂的细胞系的用途。在一个实施方案中,人治疗剂是包含与人重链恒定序列融合的人轻链可变序列(例如,源自人Vλ或人Vκ片段)的结合蛋白。在一个实施方案中,人治疗剂包含为人λ或κ免疫球蛋白链的第一多肽,和包含与人重链恒定序列融合的人Vλ或人Vκ可变序列的第二多肽。一方面,提供了一种表达系统,其包含哺乳动物细胞,哺乳动物细胞包含编码多肽的核酸,所述多肽包含与人CH结构域融合的体细胞突变的人VL结构域。在一个实施方案中,表达系统还包含编码与人CL结构域融合的免疫球蛋白VL结构域的核苷酸序列,其中与人CL结构域融合的VL结构域是具有与人CH结构域融合的VL结构域的同源轻链。在一个实施方案中,合适的细胞选自B细胞、杂交瘤、四重杂交瘤、CHO细胞、COS细胞、293细胞、HeLa细胞和表达病毒核酸序列的人枧网膜细胞(例如,PERC.6TM细胞)。一方面,提供了制备结合蛋白的方法,从如本文所公开的非人动物分离细胞或核酸,其中所述细胞或核酸包含或编码结合小分子的VL结合蛋白。在一些实施方案中,所述方法还包括使编码VL区序列的核苷酸序列与编码人CH区的基因在框内克隆以形成人结合蛋白序列,使人结合蛋白序列在合适的细胞中表达。在一个实施方案中,非人已经用小分子或与载体连接的小分子免疫,并且与CH区融合的VL区特异性结合(例如,以微摩尔、纳摩尔或皮摩尔范围内的KD)小分子的表位。在一个实施方案中,编码与CH区融合的VL区的核苷酸序列在小鼠中经体细胞突变。一方面,提供了一种制备结合小分子的抗原结合蛋白的方法,所述方法包括(a)用小分子或与载体连接的小分子使非人动物免疫,其中所述非人动物在其种系中包含(i)可操作地连接至非人重链恒定区核酸序列的未重排的人免疫球蛋白轻链可变(VL)和轻链连接(JL)基因片段,和(ii)可操作地连接至非人轻链恒定区核酸序列的未重排的人免疫球蛋白轻链可变(VL)和轻链连接(JL)基因片段,(b)使非人动物对小分子或与载体连接的小分子产生免疫反应;(c)从免疫的非人动物分离细胞(例如,淋巴细胞),其中所述细胞包含编码第一和第二免疫球蛋白轻链可变结构域的第一和第二免疫球蛋白可变区核酸序列;(d)鉴定编码在配对时,特异性结合小分子或与载体连接的小分子的第一和第二免疫球蛋白轻链可变结构域的第一和第二免疫球蛋白轻链可变区核酸序列;并且(e)使(d)的核酸序列在适于表达抗原结合蛋白的表达系统中表达以形成包含结合小分子的第一和第二轻链可变结构域的二聚体的抗原结合蛋白。在一些实施方案中,从所述动物(例如,从脾脏或淋巴结)回收细胞(如B细胞)。该细胞可与骨髓瘤细胞系融合以制备永生杂交瘤细胞系,并且筛选和选择此类杂交瘤细胞系以鉴定产生抗体的杂交瘤细胞系,所述抗体含有对用于免疫的抗原有特异性的杂交重链。在一个实施方案中,免疫包括用小分子或与载体连接的小分子使非人动物初免,使非人动物休息一段时间,并用小分子或与载体连接的小分子使动物再次免疫。在一些实施方案中,该段时间为几天、至少一周、至少两周、至少三周、至少四周或至少一个月。一方面,提供了如本文所述在小鼠中产生的免疫球蛋白可变区(VR)(例如,包含与人JL融合的VL序列)。在一个具体实施方案中,免疫球蛋白VR源自选自Vκ片段和Vλ片段的种系人基因片段,其中VR由来自于小鼠的重排序列编码,其中所述重排序列经体细胞高频突变。在一个实施方案中,重排序列包含1至5个体细胞高频突变。在一个实施方案中,重排序列包含至少6、7、8、9或10个体细胞高频突变。在一个实施方案中,重排序列包含10个以上的体细胞高频突变。在一个实施方案中,重排序列与一个或多个人或小鼠重链恒定区序列(例如,选自人或小鼠CH1、铰链、CH2、CH3及其组合)融合。一方面,提供了如本文所述在小鼠中产生的结合蛋白的免疫球蛋白可变结构域氨基酸序列。在一个实施方案中,VR与一个或多个人或小鼠重链恒定区序列(例如,选自人或小鼠CH1、铰链、CH2、CH3及其组合)融合。一方面,提供了如本文所述源自小鼠的核酸序列编码的轻链可变结构域。一方面,提供了如本文所述在小鼠中产生的或源自如本文所述在小鼠中产生的序列的结合蛋白或其抗原结合片段(例如,Fab、F(ab)2、scFv)。双特异性结合蛋白提供了包含与免疫球蛋白轻链可变结构域融合的免疫球蛋白重链恒定区的免疫球蛋白样结合蛋白,以及具有与轻链恒定结构域融合的免疫球蛋白轻链可变结构域和与重链恒定结构域融合的免疫球蛋白轻链可变结构域的结合蛋白。还提供了表达此类结合蛋白的细胞,产生此类结合蛋白的小鼠,及相关方法和组合物。本文所述的结合蛋白和编码结合蛋白的核苷酸序列可用于制备多特异性结合蛋白,例如双特异性结合蛋白。在这一方面,基本上由第一VL结构域与CH区融合组成的第一多肽可与基本上由第二VL结构域与CH融合组成的第二多肽缔合。在第一VL结构域和第二VL结构域特异性结合不同表位时,可以使用这两个VL结构域制备双特异性结合分子。CH区可以相同或不同。在一个实施方案中,例如,可以修饰CH区中的一个以便消除蛋白质A结合决定簇,而另一个重链恒定区不这样修饰(参见美国专利第8,586,713B2号,其通过引用整体并入本文)。这种特定排列简化了双特异性结合蛋白从例如同二聚体(例如第一或第二多肽的同二聚体)混合物的分离。一方面,提供了用于制备包含一个或多个κ和/或λ轻链可变区免疫球蛋白序列和疫球蛋白重链恒定区序列的蛋白质,包括包含人λ或κ轻链可变结构域和人或小鼠重链恒定区序列的蛋白质的核酸构建体、细胞、胚胎、小鼠和方法。一方面,描述了结合蛋白,其包含源自轻链(即,κ和/或λ)免疫球蛋白可变结构域,而非源自全长重链免疫球蛋白可变结构域的免疫球蛋白可变结构域。还提供了用于制备结合蛋白,包括经遗传修饰的小鼠的方法和组合物。一方面,本文所述的方法和组合物用于制备双特异性结合蛋白。在这一方面,与CH区融合的第一VL和与CH区融合的第二VL各自独立地与相同同种型(例如,人IgG1、IgG2、IgG3或IgG4)的人IgG序列在框内克隆。第一VL特异性结合第一表位,而第二VL特异性结合第二表位。第一和第二表位可在不同抗原上,或在相同抗原上。在一个实施方案中,与第一VL融合的CH区的IgG同种型和与第二VL融合的CH区的IgG同种型为相同同种型,但是不同之处在于一个IgG同种型包含至少一个氨基酸取代。在一个实施方案中,所述至少一个氨基酸取代致使携带该取代的重链与缺乏该取代的重链相比,不能或基本上不能结合蛋白质A。在一个实施方案中,第一CH区包含选自IgG1、IgG2和IgG4的人IgG的第一CH3结构域;并且第二CH区包含选自IgG1、IgG2和IgG4的人IgG的第二CH3结构域,其中第二CH3结构域包含减少或消除第二CH3结构域与蛋白质A的结合的修饰(参见美国专利8,586,713B2,其通过引用整体并入)。在一个实施方案中,第二CH3结构域包含根据EU编号系统编号的435R修饰。在另一个实施方案中,第二CH3结构域还包含根据EU编号系统编号的436F修饰。在一个实施方案中,第二CH3结构域是包含修饰的人IgG1的结构域,所述修饰选自由以下组成的组:根据EU编号系统编号的D356E、L358M、N384S、K392N、V397M和V422I。在一个实施方案中,第二CH3结构域是包含修饰的人IgG2的结构域,所述修饰选自由以下组成的组:根据EU编号系统编号的N384S、K392N和V422I的。在一个实施方案中,第二CH3结构域是包含修饰的人IgG4的结构域,所述修饰选自由以下组成的组:根据EU编号系统编号的Q355R、N384S、K392N、V397M、R409K、E419Q和V422I。在一个实施方案中,结合蛋白包含具有如本文叙述的一个或多个修饰的CH区,其中结合蛋白的恒定区在人中无免疫原性或基本上无免疫原性。在一个具体实施方案中,CH区包含在人中不呈递免疫原表位的氨基酸序列。在另一个具体实施方案中,结合蛋白包含在野生型人重链中未发现的CH区,并且CH区不包含产生T细胞表位的序列。在一个实施方案中,Fc结构域可经修饰以具有改变的Fc受体结合,这转而影响效应子功能。包括Fc结构域的工程化重链恒定区(CH)可为嵌合型。同样,嵌合CH区组合了源自一个以上免疫球蛋白同种型的CH结构域。例如,嵌合CH区包含源自人IgG1、人IgG2或人IgG4分子的CH2结构域的一部分或全部,连同源自人IgG1、人IgG2或人IgG4分子的CH3结构域的一部分或全部。嵌合CH区还可含嵌合铰链区。例如,嵌合铰链可包含源自人IgG1、人IgG2或人IgG4铰链区的“上部铰链”氨基酸序列(根据EU编号位置216至227的氨基酸残基),连同源自人IgG1、人IgG2或人IgG4铰链区的“下部铰链”序列(根据EU编号位置228至236的氨基酸残基)。在一个实施方案中,嵌合铰链区包含源自人IgG1或人IgG4上部铰链的氨基酸残基和源自人IgG2下部铰链的氨基酸残基。对于某些疗法而言,Fc结构域可经工程化以激活所有、一些正常Fc效应子功能,或都不激活,而不影响含Fc的蛋白质(例如抗体)的预期药代动力学性质。对于包含嵌合CH区并且具有改变的效应子功能的蛋白质的实例,参见2014年1月31日提交的美国申请第14/170,166号,其整体并入本文。分析结合特征、分类和相关方法本文公开了出乎意料的发现,VL抗原结合蛋白,特别是如果在非人动物中产生,包含如本文所公开的杂交免疫球蛋白基因,当特异性结合抗原时可表现出一种或多种独特或不同的结合特征,即特异性结合相同抗原的典型或常规抗体未表现出来的结合特征。此类VL抗原结合蛋白的鉴定和/或分离包括评价此类抗原特异性VL抗原结合蛋白与抗原的结合特征的方法,并且也可包括将那些结合特征与特异性结合相同抗原的典型或常规抗体的结合特征做比较。一些实施方案还包括分离编码表现出一种或多种不同结合特征的VL抗原结合蛋白的核酸序列并且,任选地,使核酸序列表达。作为总体概述,分析抗原结合蛋白的结合特征的方法包括(a)在容许结合,优选特异性结合的条件下使抗原特异性结合蛋白与抗原(包括其片段和/或其经修饰片段)接触,并且(b)若有,则检测抗原(或其片段和/或其修饰片段)和结合蛋白之间形成的结合蛋白-抗原复合物。如本文中所用的“结合特征”是指公知的任一种可测量性质,包括但不限于敏感性、特异性、亲合力、亲和力等。技术人员将认识到,这些一般结合特征可为特异性结合特征,例如表位特异性、缔合常数、解离常数、平衡常数等的组合的结果。结合特性包含此类结合特征中的一种或多种。“特异性结合”、“特异性结合”、“特异性地结合”、“抗原特异性”等是指与抗原形成复合物的抗原结合蛋白在生理条件下相对稳定。特异性结合特征在于高亲和力和低至中等能力,区别于通常具有低亲和力与中等至高能力的非特异性结合。通常当缔合常数KA高于106M-1时,将结合视为特异性。如有必要,可通过改变结合条件来减少非特异性结合,而基本上不影响特异性结合。适当的结合条件,如抗原结合蛋白的浓度、溶液的离子强度、温度、允许结合的时间、阻断剂(例如,血清白蛋白、乳酪蛋白)的浓度等,可由技术人员使用常规技术优化。分析许多针对抗原的抗原结合蛋白的方法在本领域公知,并且包括但不限于常规交叉阻断测定、表位绘图、丙氨酸扫描突变体、肽印迹(Reineke(2004)MethodsMolBiol248:443-63)、肽裂解分析、表位切除和表位提取及抗原的化学修饰(Tomer(2000)ProteinScience:9:487-496)。通常,这些方法可包括将抗原(或其片段,包括其修饰片段)固定在表面上。通常,适于固定、结合和/或连接抗原或其片段的固体或半固体支撑物(和为使固体支撑物适于固定抗体的修饰)在本领域公知。固体支撑物的非限制性实例包括生物传感器芯片阵列、珠粒(例如,聚苯乙烯珠粒、磁化珠粒)、微孔板等。因此,例如,二氧化硅壳内封装的CdSe-CdS核壳纳米晶体可易于衍生以偶联至抗原或其片段(Bruchez等(1998)Science281:2013-2016)。类似地,已经使强荧光量子点(硫化锌封端的硒化镉)共价偶联到生物分子,以用于超灵敏生物检测(Warren和Nie(1998)Science281:2016-2018)。荧光标记的珠粒可从LuminexandQuantumDot购买获得。另外,衬垫、薄膜、纳米孔或微流体通道也可用作固体支撑物。在一些实施方案中,抗原或其片段(包括其修饰片段)可固定、结合或连接在固体或半固体表面如聚偏二氟乙烯、硝基纤维素、琼脂糖和/或聚丙烯酰胺凝胶垫上。也可使用经醛、聚赖氨酸或同型功能交联剂激活的载玻片。在一些实施方案中,抗原或其片段可排列在三维阵列,例如Mirzabekov等,NucleicAcidsRes24(15):2998-3004(1996)描述的三维聚丙烯酰胺凝胶垫微阵列中。在一个优选的实施方案中,抗原或其片段也可固定在生物传感器芯片表面、聚苯乙烯珠粒等的上面。抗原结合的方法和条件在本领域公知并且在本文中进一步描述。在本领域还公知用于检测抗原结合蛋白复合物的方法和条件。抗原结合蛋白复合物的检测可以是定性的和/或定量的。也可检测例如一个集合中,多种(通常,很多种)结合蛋白的结合。检测抗原结合蛋白复合物的方法包括,例如ELISA、荧光免疫测定、Western和斑点印迹、免疫沉淀、使用竞争多肽的竞争测定和聚焦免疫测定(focalimmunoassay)、表面等离子体共振(SPR)技术、多重检测测定等。差异性抗原破坏在一个优选的实施方案,如本文所公开的分析方法部分基于在对大分子引入一系列独立的稳定变化之后,两种结合蛋白对大分子的反应模式(例如,结合特性)之间的相似性程度反映了两种结合蛋白所结合的大分子的表位之间的相似性程度的原理。评价在大分子中产生变化后的此类大分子相互作用是本文称为修饰辅助分型(Modification-AssistedProfiling,MAP)、基于抗原结构的抗体分型(AntigenStructure-basedAntibodyProfiling,ASAP)或差异性抗原破坏(DAD)的方法。DAD是根据每种抗原结合蛋白与经化学或酶促修饰的抗原或其片段的结合特性的相似性为针对相同抗原的许多抗原结合蛋白分类的方法(美国专利申请公布第2004/0101920号,明确通过引用整体并入本文;也参见Shi等(2006)J.Immunol.Methods314:9-20))。每个类别可反映与另一类别所代表的结合特征(例如,表位)明显不同或部分重叠的结合特征(例如,表位)。这种技术允许快速过滤基因相同的抗原结合蛋白,使得表征可集中在基因不同的抗原结合蛋白上。DAD可用于将本发明的VL抗原结合蛋白分成与常规抗体相比表现出独特结合特征的抗原结合蛋白组,例如结合对典型抗体掩蔽的表位的VL抗原结合蛋白。优选地,抗原蛋白可固定在生物传感器芯片表面或聚苯乙烯珠粒上。基于亲和力的生物传感器采用生物分子,如抗体、受体、配体、酶、碳水化合物或核酸作为固态电子设备和溶液相生物之间的界面处的信号转换器。这些生物分子相互作用的固有识别性质可通过具有高度灵敏性和选择性的生物传感器观察和测量(对于综述,参见Baird和Myszka(2001)J.MolecularRecognition,14:261-268)。使用生物传感器的优点包括能够实时收集数据,从而快速地提供关于结合反应的详细信息,和第二,相互作用生物分子间的结合反应不需要标记生物分子,例如不用荧光或放射性标记来观察结合反应。大多数已确立的生物传感器仪器和技术目前是由BiacoreAB(Uppsala,Sweden)提供。Biacore仪器(型号1000、2000和3000)是可以直接从96孔板接收样品的全自动、基于传感器芯片的SPR装置。停靠在这些仪器之一时,称为芯片的传感器表面被分成四个可以独立或串联操作的独立流动池。这种流动池构造允许缓冲液连续通过传感器表面,从而在将分析物溶液换成缓冲液时减少了对耗时洗涤步骤的需要。另外,连续流动系统确保配体在结合测量过程的持续期间暴露于恒定分析物浓度。此外,每个传感器芯片上四个流动池的可用性容许使用者固定三个不同样品并保持相同传感器芯片内的参考表面。Biacore2000和3000型能够同时监测所有四个流动池内的结合相互作用。分析物向每个表面连续递送允许串联参考削减和提高的数据质量(Myszka(1999)J.Mol.Recogn.12:279-284;Rich等(2000)Curr.Opin.Biotechnol.11:54-71)。其它生物传感器如AffinitySensor提供的仪器、NipponLaserElectronics提供的SPR670、AnalyticalμSystem提供的Bio-SuplarII和TexasInstruments提供的SPREETATM也可用于实践本发明的方法。聚苯乙烯珠粒可经例如一种测定,诸如多重LUMINEXTM测定(LuminexCorp.,TX)加工。由于LUMINEXTM能够处理多达100种不同类型的珠粒的多重分析,所以LUMINEXTM提供了几乎无限的具有各种修饰的抗原表面,从而在抗体表位分析中产生提高的分辨率。抗原结构的修饰或改变可通过倾向于特异性修饰抗原蛋白的特定氨基酸残基的侧链的化学处理,或酶处理来实现。可优选地对固定在表面,例如生物传感器表面、聚苯乙烯珠粒等上面的抗原进行所有修饰。可进行许多不同类型的抗原修饰,其中每个表面或珠粒包含以一种方式修饰的抗原。通常,在所述分析中可包括固定未修饰抗原的适当对照表面。适于实现化学改变或修饰的化学品的非限制性实例包括琥珀酰亚胺酯及其衍生物、含伯胺的化合物、肼和碳酰肼、游离氨基酸、长度上含2至20个残基的同型和异型寡肽、三(2-羧乙基))膦盐酸盐(TCEP●HCl)/碘乙酰胺、N-乙基-N'-(二甲氨基丙基)碳二亚胺(EDC)/乙醇胺、碘乙酰胺和肼、对羟苯基乙二醛(HPG)、过氧化氢、N-溴代琥珀酰亚胺、N-乙酰基咪唑、四硝基甲烷、对氨苯基胂酸、丹磺酰氯、戊二醛、茚三酮、焦碳酸二乙酯(DEPC)、乙酸磺基琥珀酰亚胺酯(磺基-NHS-乙酸酯)、聚乙二醇5000(PEG-5000)和7-羟基香豆素-3-羧酸、琥珀酰亚胺酯。技术人员将认识到许多其它化学品仍可用于实践DAD。适于实现抗原的酶改变或修饰的酶,特别是蛋白酶的非限制性实例包括经修饰的猪胰蛋白酶、胞内蛋白酶Glu-C、胞内蛋白酶Asp-N、胰凝乳蛋白酶、胞内蛋白酶Lys-C和胞内蛋白酶Arg-C、胃蛋白酶、木瓜蛋白酶、嗜热菌蛋白酶、枯草杆菌蛋白酶、蛋白酶K、菠罗蛋白酶和巯基特异性蛋白酶(无花果蛋白酶)。再次,技术人员将易于认识到其它蛋白酶可用于实践本发明的方法。使用SPR技术,可以使用允许同时测量所有表面,包括每个传感器芯片的一个非改性表面和三个改性表面上的抗原结合蛋白复合物的实验装置测量结合为共振单位(RU)。可将归一化反应计算为来自于三个改性表面中的每一个与对照(非改性)传感器表面的结合反应的百分比。因此,可通过使每个样品在三个单独制备的传感器芯片上运行来收集每个样品的9个反应数据(%),每个传感器芯片含有一个非改性表面和三个不同改性表面。在一个优选的实施方案中,抗原可固定到聚苯乙烯珠粒上。珠粒包含根据本领域公知的方法产生的非修饰和非修饰抗原。使用,例如多重检测测定,例如LUMINEXTM检测测定,可将抗原结合蛋白复合物测量为平均荧光强度并且可计算归一化反应。分类在特定和具体的应用中,本发明提供了一种评价抗原结合蛋白,例如VL抗原结合蛋白和典型抗体与其所针对的抗原之间的相互作用的方法,使得将抗原结合蛋白分成功能组(也称为聚类或分类)的快速方法成为可能,该组的成员,称为同属,对抗原,例如经化学或酶促修饰的抗原表现出独特且相似的结合特征或特性。基于其结合特征或特性的相似性而聚类的结合蛋白被认为具有相似的结合特征,例如结合相同表位或相似表位。这些聚类可任选地呈矩阵形式,或呈如同树状图的“树状”形式,或呈计算机可读形式,或呈任何数据输入装置兼容的形式展示。可从矩阵、树状图或通过计算机或其它计算装置捕获关于聚类的信息。数据捕获可以是可视的、手动的、自动化的或其任何组合。如本文中所用,术语“分类”可用作名词,指根据本发明的方法被鉴定为具有对一组经修饰/破坏的抗原表面具有相似结合特性的结合蛋白聚类。术语“分类”也可用作动词,指实践本发明的方法,包括对通过所述测定产生的数据的任何分析。分类,如本文所述,是基于一种或多种结合特征,例如其识别的表位,为结合蛋白分组的过程。更具体地,分类包括用于区分不同结合蛋白的表位识别性质的方法和系统,连同基于其表位识别性质为结合蛋白聚类并鉴定具有不同结合特性的结合蛋白的分类的计算过程。因此,实施方案包括用于测定如本文所讨论的结合蛋白的表位结合性质的测定,和分析由此类测定产生的数据的过程。分类可通过以下任一种方法实现:1)例如,通过目视检查为结合特征分组,处理表现为刻度条(例如,对照距每种经修饰抗原表面的百分比)的每种抗原结合;2)计算每个结合蛋白矩阵的行列式值并且将所有计算的行列式分成组(参见"Calculus--OneandSeveralVariables"第6版,Salas和Einar编,第715-717页,1990);或3)将模式识别算法和相关生物信息软件应用到通过该方法产生的结合特性数据并且将结合蛋白分成功能组。在一个实施方案中,可使用适当的统计软件将抗原结合蛋白复合物的归一化反应特性组织成组。也可通过计算每个反应矩阵的行列式,接着将行列式分成组并且可能目测检查每个组的刻度颜色条形(曲线)以验证分组结果来实现分组。整个“分组过程”可通过生物信息模式识别或数据挖掘计算软件实现。此类软件的非限制性实例包括DNA微阵列分析常规使用的可商购获得的程序,如J-express(DeNova,Inc.Vancouver,BritishColumbia)、StanfordGeneClusterSoftware(StanfordUniversity,Calif.)、StatSoftofStatistica或技术人员开发的其它合适的非商业性程序。可采用各种技术目测如上所述产生的曲线。为使人观察者能做有意义的比较,呈现该曲线的空间应易于理解。虽然难以目测高维空间中有意义的趋势或聚类,但是一个实施方案包含预计与特定曲线最相关的两个或三个维度(结合特征),虽然也许不可能观察在相同二维或三维空间上的其它可能有意义的结合特征。可采用各种技术解决这个问题。此类技术创造低维空间,在其中个体维度捕获数据的两个或更多个特征。此类技术的实例包括主要组分分析(PCA)、线性和非线性判别分析、多维标度和投影寻踪技术。特别优选的方法涉及PCA的使用。PCA确定在多维空间中数据集合显示出最大变化的向量(维度)。第一主要组分显示出数据变化最大的方向。第二主要组分显示出数据变化第二大的方向并且以此类推。可以选择许多适于描绘其数据的主要组分。通常,选择一、二或三个第一主要组分用于向人观察者呈现数据。主要组分分析在Jackson,J.E.(1991)AUserGuidetoPrincipalComponents.NewYork:JohnWileyandSons;和Jolliffe,I.T.(1986)PrincipalComponentAnalysis.NewYork:Springer-Verlag中有更全面的描述,其二者通过引用并入本文用于所有目的。用于进行主要组分分析的各种可商购获得的工具可用。用于进行PCA的示例性统计计算包可从Seattle,Wash.的InsightfulCorporation(前MathSoft)或St.Louis,Mo的PartekCorporation获得,例如PartekGenomicSuiteSoftware。主要组分分析可以直接方式应用于定量结合特性。然而,通常必须使其经历主要组分分析之前归一化曲线数据集合。这是因为包含曲线的单独特征的各个标量以截然不同的尺度存在。为了使这些不同特征达到用于有意义的PCA分析的同等尺度,可以进行转化以归一化所述数据。在一个优选的实施方案中,可通过考虑沿着该维度的所有数据,减去该数据的平均值并除以标准偏差来标定每个维度。这样有效地标定了数据以进行归一化。在一个优选的实施方案中,可按以下方式归一化由差异性抗原破坏产生的数据。可通过抗原结合蛋白与经修饰抗原表面(或珠粒集合)的结合信号除以相同抗原结合蛋白与未修饰抗原表面(或珠粒集合)的结合信号归一化原始数据。随后,可将指定表面(或珠粒集合)的所有值除以来自于所有结合蛋白与该表面(或珠粒集合)的平均值。最后,可使用log2作为底转化所有值。在另一个实施方案中,通过高通量竞争结合蛋白测定,例如多重竞争抗体分类(MCAB)测定产生结合特性,并且使用竞争模式识别(CPR)方法分析输入数据,二者在美国专利第8,568,992号(整体并入本文)中均有描述。结合特性,例如信号强度归一化后,可使用各种公知的计算方法鉴定复杂数据中的基本模式。已经证明对大的生物数据集合的分析有价值的方法是分级聚类。应用这种方法,可基于其相异性值将结合蛋白被迫分成严格等级的嵌套子集。在一个说明性实施方案中,首先将具有最低相异性值的一对结合蛋白分组在一起。接下来将具有次最小相异性(或平均相异性)的一对或聚类的结合蛋白分组在一起。反复地重复这个过程直至剩余一个聚类。按这种方式,根据与其它结合蛋白度相比,其结合特性的相似程度来为结合蛋白分组。在一个实施方案中,将结合蛋白分组成树状图(有时称为“系统树”),其分支长度表示两种结合蛋白的结合模式之间的相似性程度。两种结合蛋白之间的分支长度长表明它们很可能结合不同的表位。分支长度短表明两种结合蛋白很可能竞争相同表位。根据本文公开的方法鉴定的功能组可使用公知方法根据相同功能组中的结合蛋白应共有独特或不同的结合特征的原理验证。在一个实施方案中,单个分类中结合蛋白的独特或不同结合特征导致该分类的结合蛋白结合或竞争抗原的相同表位,其中代表不同功能组的结合蛋白应不结合或竞争抗原的相同表位。在这个实施方案中,ELISA、竞争测定、表位绘图测定、肽测定等,全部可用于验证本文确定的分类。当分类包含至少90%,优选至少95%,更优选至少98%和最优选至少99%VL蛋白质时,分类或功能组包含所有或基本上所有VL抗原结合蛋白。在一个实施方案中,分类包含100%VL抗原结合蛋白。在一个实施方案中,分析了足够数量的抗原特异性VL抗原结合蛋白和常规抗体以进行有意义的比较和分类。在一个实施方案中,分析表达VL抗原结合蛋白并且用抗原免疫的非人动物的血清中的或从中分离的结合蛋白并且与用相同抗原免疫的对照非人动物的血清中的或从中分离的结合蛋白比较。在一个实施方案中,免疫包括初免,即首次向非人动物施用抗原,允许非人动物休息一段时间,例如几天、一周、两周、三周、四周、五周等,并且再向非人动物施用抗原一次或多次。实施例阐述以下非限制性实例以便为本领域的普通技术人员提供如何制备和使用本文描述的非人动物的全面公开和描述并且有助于其理解,而非旨在限制发明人视为其发明的范围,其也非旨在表示以下实验是进行的全部或唯一的实验。实施例不包括本领域普通技术人员将公知的常规方法(分子克隆技术等)的详细描述。已经作出努力以确保关于所用数字(例如量、温度等)的精确性,但是应考虑一些实验误差和偏差。除非另外指出,否则份数是重量份,分子量是重均分子量,温度是摄氏度并且压力是大气压或接近大气压。实施例1.具有经修饰免疫球蛋白基因座的非人动物的产生该实施例说明了将非人动物的免疫球蛋白基因座工程化为含有以下基因座的示例性方法:(a)包含可操作地连接至免疫球蛋白重链恒定区核酸序列的未重排的人免疫球蛋白轻链VL和JL基因片段的免疫球蛋白重链基因座;和(b)包含可操作地连接至免疫球蛋白轻链恒定区核酸序列的未重排的人免疫球蛋白轻链VL和JL基因片段的免疫球蛋白轻链基因座。下面描述了用于将人轻链V和J基因片段(例如,Vκ和Jκ)插入鼠免疫球蛋白重链基因座中的示例性靶向载体的构建。图2说明了含有用于使用同源重组插入鼠免疫球蛋白重链基因座中的多个人κ轻链基因片段的四种示例性靶向载体。各种靶向构建体使用基因工程技术制备(参见,例如,美国专利第6,586,251号和Valenzuela,D.M.,Murphy,A.J.,Frendewey,D.,Gale,N.W.,Economides,A.N.,Auerbach,W.,Poueymirou,W.T.,Adams,N.C.,Rojas,J.,Yasenchak,J.,Chernomorsky,R.,Boucher,M.,Elsasser,A.L.,Esau,L.,Zheng,J.,Griffiths,J.A.,Wang,X.,Su,H.,Xue,Y.,Dominguez,M.G.,Noguera,I.,Torres,R.,Macdonald,L.E.,Stewart,A.F.,DeChiara,T.M.,Yancopoulos,G.D.(2003).High-throughputengineeringofthemousegenomecoupledwithhigh-resolutionexpressionanalysis.NatBiotechnol21,652-659)以修饰小鼠基因组细菌人工染色体(BAC)库。可通过同源重组修饰小鼠BACDNA以缺失内源VH、DH和JH基因片段以用于后续插入未重排的人VL和JL基因片段。可选地,内源VH、DH和JH基因片段可保持完整并且失活,使得内源基因片段重组形成功能可变区受抑制(例如,通过基因片段的倒置或破坏)。在通过引用整体并入本文的美国专利申请公布第2012-0096572A1号中描述了经遗传修饰的小鼠及其制备方法,该小鼠的基因组含有免疫球蛋白重链基因座,所述免疫球蛋白重链基因座包含可操作地连接至免疫球蛋白重链恒定区核酸序列的未重排的人免疫球蛋白轻链VL和JL基因片段。如图2所示,使用本领域公认的标准分子技术将四种靶向载体工程化以逐渐地将40个人Vκ基因片段和5个人Jκ基因片段插入失活小鼠重链基因座(例如,缺失的内源VH、DH和JH基因片段)中。表3阐述了每个靶向载体中所包含的人DNA的大小,所述靶向载体含有用于插入小鼠免疫球蛋白重链基因座的各种人κ轻链基因片段。在靶向载体中可包括任何数量的人Vκ和Jκ基因片段。图2阐述的示例性靶向载体包括在种系人κ轻链基因座(图1)的近侧重叠群中天然存在的人κ轻链基因片段。图2下方示出了所有四种靶向载体连续插入之后所得到的内源重链基因座。表3使用类似的方法,可构建在鼠重链恒定区情况下的人轻链可变结构域的其它组合。另外的轻链可变结构域可源自人Vλ和Jλ基因片段。图3中阐述了包括含不同数量的人Vλ和Jλ基因片段的人DNA的示例性靶向载体。人λ轻链基因座延伸超过1,000kb并且含有80个以上编码可变(V)或连接(J)片段的基因。在人λ轻链基因座的70个Vλ基因片段中,根据公开的报道,30-38的任一处似乎都是功能基因片段。70个Vλ序列排列成三个聚类,全部含有不同V基因家族组的不同成员(聚类A、B和C)。在人λ轻链基因座内,观察到的所有Vλ结构域一半以上由基因片段1-40、1-44、2-8、2-14和3-21编码。存在7个Jλ基因片段,仅其中4个被视为通用功能性Jλ基因片段Jλ1、Jλ2、Jλ3和Jλ7。在一些等位基因中,据报道第五个Jλ-Cλ基因片段对为假基因(Cλ6)。如本文所述,多个人Jλ基因片段向杂交重链基因座中的掺入,可通过从头合成构建。以这种方式,在种系构型中含有多个人Jλ基因片段的基因组片段用多个人Vλ基因片段工程化并且允许在重链恒定区情况下的正常V-J重组。图3中示出了包括多个Jλ基因片段的示例性靶向载体(靶向载体1')。使轻链可变结构域与重链恒定区偶联表示在非人动物中产生具有人VL区的独特VL抗原结合蛋白的潜在丰富的多样性来源。利用小鼠中人λ轻链基因座(或如上所述的人κ基因座)的这种多样性引起独特杂交重链的工程化并且对经遗传修饰动物的免疫库产生另一规格的结合蛋白并且随后将其用作产生治疗剂的下一代平台。上述靶向载体可用于使小鼠胚胎干(ES)细胞电穿孔到产生的经修饰ES细胞以产生表达VL抗原结合蛋白的嵌合小鼠(即,可操作地连接至小鼠重链恒定区的人轻链基因片段)。含有未重排人轻链基因片段插入的ES细胞通过定量PCR测定、(Lie和Petropoulos,1998.Curr.Opin.Biotechnology9:43-48)鉴定。设计特异性引物集和探针用于插入人序列和相关选择盒,损失小鼠重链序列和保留在内源重链基因座侧翼的小鼠序列。携带人轻链基因片段(例如,Vκ和Jκ)的ES细胞可以用表达重组酶的构建体转染以便去除通过插入人轻链基因片段引入的任何不需要的选择盒。任选地,可通过与表达重组酶的小鼠交配来去除选择盒(例如,US6,774,279,其通过引用整体并入本文)。任选地,表达盒保留在小鼠中。上述靶向的ES细胞用作供体ES细胞并且通过方法引入8-细胞期小鼠胚胎中(参见例如,美国专利第7,294,754号和Poueymirou,W.T.,Auerbach,W.,Frendewey,D.,Hickey,J.F.,Escaravage,J.M.,Esau,L.,Dore,A.T.,Stevens,S.,Adams,N.C.,Dominguez,M.G.,Gale,N.W.,Yancopoulos,G.D.,DeChiara,T.M.,Valenzuela,D.M.(2007).F0generationmicefullyderivedfromgene-targetedembryonicstemcellsallowingimmediatephenotypicanalyses.NatBiotechnol25,91-99)。使用检测内源免疫球蛋白重链基因座处独特人轻链基因片段的存在的等位基因测定的修改(Valenzuela等,同上),通过基因分型来鉴定在小鼠免疫球蛋白重链基因座处独立携带人轻链基因片段的(完全源自供体ES细胞的F0小鼠)。对幼犬进行基因分型并且选择对于经遗传修饰的免疫球蛋白重链基因座而言为杂合或纯合的幼犬以表征含VL的重链的表达。人κ轻链基因片段向小鼠重链基因座的引入在F1ES系中进行(F1H4;Valenzuela等2007,同上),F1ES系源自还含有小鼠κ轻链基因片段经人κ轻链基因片段的原位替换的129S6/SvEvTac和C57BL/6NTac杂合胚胎(例如参见美国专利第6,596,541和8,642,835号,其通过引用整体并入本文)。如上所述产生包含基因工程化重链基因座的小鼠,所述重链基因座含有再重链基因座中的未重排的人免疫球蛋白轻链VL和JL基因片段(KOH小鼠:MAID1713:40个人Vκ基因片段和5个人Jκ基因片段;MAID1994:40个人Vκ基因片段和5个人Jκ基因片段,和整合的Adam6基因)。简言之,在KOH小鼠中,所有内源功能性重链可变基因片段缺失并且被40个未重排的人Vκ基因片段和五(5)个未重排的人Jκ基因片段替换,所述基因片段可操作地连接至免疫球蛋白重链恒定区核酸序列。纯合人源化小鼠(VI3;参见美国专利第8,642,835号和美国专利第8,502,018B2号,其通过引用整体并入本文)与纯合KOH小鼠(MAID1713或MAID1994)小鼠交配以产生对于经修饰的轻链等位基因和KOH等位基因而言为杂合的小鼠。由这种杂交产生的F1杂合小鼠相互交配以获得对于每个等位基因而言为纯合的小鼠(MAID1713HO1242HO、MAID1994HO1242HO)。此类小鼠表达具有类似于免疫球蛋白结构的结构的VL抗原结合蛋白,然而不同之处在于此类结合蛋白缺乏重链可变结构域。使用上述特异性探针和引物通过TAQMANTM筛选和核型分析确认免疫球蛋白重链和轻链基因座中经遗传修饰的等位基因的存在。纯合KOH小鼠包含向其中所有内源可变重链V、D和J基因片段均已缺失的小鼠重链基因座中插入如本文所述的未重排人轻链基因片段(例如,人Vκ和Jκ),和向其中所有小鼠Vκ和Jκ基因均已缺失的小鼠κ(κ)轻链基因座中插入未重排人轻链基因片段(例如,人Vκ和Jκ)。在一些实施方案中,KOH小鼠还包含整合的Adam6基因。基因组包含以下等位基因的小鼠被称为MAID1713/1242,“KOH小鼠”:(i)含有插入的四十(40)个未重排的人Vκ和五(5)个Jκ基因片段、使得所述人Vκ和Jκ基因片段可操作地连接至内源重链恒定区的免疫球蛋白重链等位基因,和(ii)含有插入四十(40)个未重排的人Vκ和五(5)个Jκ基因片段、使得所述人Vκ和Jκ基因片段可操作地连接至内源轻链恒定区的免疫球蛋白轻链等位基因(参见美国专利申请公布第2012-0096572A1号,其通过引用整体并入本文)。具有所述等位基因并且还具有整合的小鼠Adam6基因的小鼠被称为MAID1994/1242(参见美国专利申请公布第2013-0212719A1号,其通过引用整体并入本文)。实施例2.VL抗原结合蛋白的产生和表征本实施例描述了由经特异性工程化而表达包含免疫球蛋白轻链可变结构域并且无重链可变结构域(如上所述)的免疫球蛋白样分子的小鼠产生抗原结合蛋白。本实施例具体说明了对小分子(例如,类固醇和天然产物生物碱)有特异性的示例性抗原结合蛋白的产生,所述抗原结合蛋白含有(i)各自包含与免疫球蛋白轻链恒定结构域连接的免疫球蛋白轻链可变结构域的两个多肽,和(ii)各自包含与免疫球蛋白重链恒定结构域连接的免疫球蛋白轻链可变结构域的两个多肽。VL抗原结合蛋白得自经遗传修饰的小鼠,该小鼠的基因组包括免疫球蛋白重链和轻链基因座,其各自含有分别可操作地连接至内源重链和轻链恒定区的未重排的人轻链基因片段(例如,VL和JL基因片段)。与野生型和/或对照经遗传修饰的小鼠相比,此类小鼠为非蛋白靶标提供了用于制备抗原结合蛋白的稳健体内系统。免疫通常,用抗原激发本文所述的小鼠,并且从该动物(例如,从脾脏或淋巴结)回收细胞(如B细胞)。该细胞可与骨髓瘤细胞系融合以制备永生杂交瘤细胞系,并且筛选和选择此类杂交瘤细胞系以鉴定产生抗体的杂交瘤细胞系,所述抗体含有对用于免疫的抗原有特异性的杂交重链。编码杂交重链和轻链的人Vκ区的DNA可被分离并且连接到期望的恒定区,例如,重链和/或轻链。由于与小鼠重链恒定区融合的人Vκ基因片段的存在,产生了独特的抗体样库并且由于产生的独特的抗体样形式,免疫球蛋白库的多样性显著增加。这样在免疫后对抗原特异性库赋予增加的多样性水平。随后在细胞,如CHO细胞中产生所得的克隆序列。可选地,编码抗原特异性VL抗原结合蛋白或可变结构域的DNA可直接从抗原特异性淋巴细胞(例如,B细胞;参见US7,582,298B2,其通过引用整体并入)分离。最初,分离高亲和力VL抗原结合蛋白,其具有人Vκ区和小鼠恒定区。如上所述,表征VL抗原结合蛋白并且选择其期望的特征,包括亲和力、选择性、表位等。小鼠恒定区可经所需的人恒定区替换以产生含有来自于本发明的未重排杂交重链基因座的经体细胞突变的人Vκ结构域的独特全人VL抗原结合蛋白。合适的人恒定区包括,例如野生型或经修饰的IgG1或IgG4或,可选地Cκ或Cλ。KOH小鼠的单独群组单独地用天然产物生物碱(抗原A)和类固醇(抗原B)免疫。“VI3”(人源化小鼠,参见美国专利第8,642,835号和美国专利第8,502,018B2号)和“ULC”小鼠的单独群组(参见US2011-0195454A1、US2012-0021409A1、US2012-0192300A1、US2013-0045492A1、US2013-0185821A1和US2013-0302836A1;所述申请通过引用整体并入本文)也经免疫以提供相当的免疫反应特性。简言之,使抗原A缀合至KLH并且用作免疫原使KOH、VI3和ULC小鼠免疫。对于抗原B而言,BSA缀合物用作使KOH和VI3品系免疫的免疫原。在开始免疫之前从小鼠收集免疫前血清。经由足垫(f.p.)注射,按在25μl体积中与10μg作为佐剂的CpG寡核苷酸(Invivogen)混合的2.35μg缀合物施用免疫原用于最初初免。随后,在第3、6、11、13、17、20天经由相同途径用各2.35μg的免疫原,连同作为佐剂的10μg的CpG和25μg的Adju-Phos(Brenntag)对小鼠加强,总共加强6次。分别在第4次和第6次加强后,在第15和22天为小鼠放血。测定抗血清对抗原A的KLH缀合物的滴度。对于抗原B,对BSA缀合的抗原B和BSA测定滴度。对于KOH小鼠,在完成6次加强之后,使小鼠有4至5周的休息期,此后再施用4次使用免疫原的加强。对小鼠放血并测定抗血清滴度。当实现所需免疫反应时,收获脾细胞并且与小鼠骨髓瘤细胞融合以保持其存活力并且形成杂交瘤细胞系。筛选并选择杂交瘤细胞系以鉴定产生抗原特异性VL抗原结合蛋白的细胞系。使用这种技术获得几种抗原特异性VL抗原结合蛋白(即,在小鼠重链和轻链恒定结构域的情况下具有人Vκ结构域的结合蛋白)。可选地,直接从抗原阳性B细胞分离抗原特异性VL抗原结合蛋白,未与骨髓瘤细胞融合,如美国专利第7,582,298号中所述,其明确地通过引用整体并入本文。使用这种方法,获得几种全人抗原特异性VL抗原结合蛋白(即,具有人Vκ结构域和人恒定结构域的抗体)。抗血清滴度测定通过标准ELISA测定对免疫原的血清滴度。下面详细描述了该测定。在4℃下以2μg/ml对96孔微量滴定板(ThermoScientific)涂布在磷酸盐缓冲盐水(PBS,IrvineScientific)中的抗原A(经取代的芳香族天然产物生物碱)或抗原B(类固醇)的BSA缀合物过夜。第二天,使用洗板机(MolecularDevices),用含有0.05%吐温20(Tween20)(PBS-T,Sigma-Aldrich)的磷酸盐缓冲盐水洗涤板4次。然后用250μl于PBS中的0.5%牛血清白蛋白(BSA,Sigma-Aldrich)封闭板并且在室温下孵育1小时。然后板用PBS-T洗涤4次。在0.5%BSA-PBS中从1:300或1:1000开始将来自于免疫小鼠的血清和免疫前血清连续稀释三倍,一式两份添加到封闭的板中,然后在室温下孵育1小时。将最后两个孔留为空白以用作二抗对照(本底对照)。再次用PBS-T在洗板机中洗涤板4次。然后按1:5000/1:10,000稀释度,将山羊抗小鼠IgG-Fc-辣根过氧化物酶(HRP)缀合的二抗(JacksonImmunoresearch)添加到板中并且在室温下孵育1小时。然后用PBS-T洗涤板8次并且使用TMB/H2O2作为底物显影。孵育底物20分钟并且用2N硫酸(H2SO4,VWR,cat#BDH3500-1)或1N磷酸(JTBaker,Cat#7664-38-2)终止反应。在分光光度计(Victor,PerkinElmer)上在450nm下读板。使用GraphpadPRISM软件计算滴度。测量在小鼠中对注射的免疫原诱导的免疫反应作为滴度,将其定义为抗原结合吸光度高于本底两倍时最高血清稀释度的倒数。在免疫过程结束时,KOH和VI3小鼠引起同等高的滴度。通过Luminex对结合蛋白的鉴定为制备用于筛选的抗原偶联珠粒,0.12mL于pH6.2的0.1M磷酸钠缓冲液(J.T.Baker目录号4011-01)中的Luminex珠粒悬浮液(羧化微珠,LuminexCorp.)通过添加15μl的50mg/mLEDC(1-乙基-3-(3-二甲氨基丙基)碳二亚胺,Sigma目录号No.03449)和15μl的50mg/mLSulfo-NHS(N-羟基琥珀酰亚胺,Pierce目录号24510)、接着在室温下孵育10分钟来活化。随后,将0.5mL于pH5的50mMMES缓冲液(ACROS目录号327765000)中的20μg/mLBSA缀合的抗原A(经取代的芳香族天然产物生物碱)添加到活化珠粒中,并且使伯胺偶联反应进行两小时,并且通过添加1/10体积的pH8的1MTris溶液(Teknova目录号T1080)猝灭珠粒上的剩余活性基团。用含有0.05%吐温-20(Calbiochem目录号655205)的PBS(LifeTechnologies目录号14190-144)洗涤珠粒,并且储存在含有2%w/vBSA(Sigma目录号A4503)的PBS缓冲液中。以相同方式,还制备了一批有BSA蛋白质偶联的阴性对照珠粒。为筛选结合蛋白,使75μl含有3000个抗原A-BSA珠粒的等分试样分布到96孔过滤板(Millipore目录号MSBVN1250)的每个预水化孔中。将每种结合蛋白样品(25μl)添加到每个孔中并且在4℃下在板振荡器上使板孵育过夜。第二天早上,使用真空歧管用含有0.05%吐温-20的PBS缓冲液(PBS-T)洗涤珠粒,并且通过用0.1mL于PBS-T中的1.25μg/mLR-藻红蛋白缀合的山羊抗人Igκ抗体(SouthernBiotech目录号2063-09)在室温下孵育珠粒30分钟来检测珠粒结合的结合蛋白。然后洗涤珠粒并悬浮在0.15mL的PBS-T中,并且用基于Luminex流式细胞术的分析仪测量中位荧光强度(MFI)。以类似方式,制备BSA缀合的抗原B(类固醇)珠粒并筛选含结合蛋白的样品。相对结合动力学开始筛选之前,将50nM的中性亲和素(Neutravidin)与200nM生物素标记的抗原预先孵育至少24小时。将中性亲和素标记至小分子通过增加小分子质量重量增强了结合蛋白粗上清液的通量亲和力筛选的灵敏度。首先固定有抗人Fc或抗小鼠Fc特异性抗体的Biacore传感器表面,用于从粗条件培养基捕获抗体。然后在结合蛋白捕获表面上注射小分子/中性亲和素溶液两分钟,接着结合的复合物解离10分钟。在25℃下使用HBST作为运行缓冲液进行实验。图4阐述了从KOH小鼠和人源化小鼠获得的抗原阳性抗体(即,VL抗原结合蛋白)的总数(左)和百分比(右)。图5阐述了从KOH小鼠和人源化小鼠获得的针对抗原B的抗体的示例性结合动力学。结果显示在抗原A珠粒上,人源化小鼠(VI3)产生的528种结合蛋白样品中的10种具有MFI>1000。对于抗原B珠粒而言,人源化小鼠(VI3)显示350种结合蛋白样品中仅两种具有高于1000的MFI。相反,在抗原A珠粒上KOH小鼠显示528种样品中的453种具MFI>1000。在抗原B珠粒上,KOH小鼠显示339种样品中的74种具有MFI>1000。所有抗原阳性样品在阴性对照BSA珠粒上显示出最小或可以忽略的结合(例如,MFI约118)。人κ基因片段使用为进一步表征在根据本发明的小鼠中产生的抗-抗原A或抗-抗原BVL抗原结合蛋白,克隆编码人Vκ结构域(来自于VL抗原结合蛋白的重链和轻链两者)的核酸并且使用由通过引用整体并入本文的US2007/0280945A1中描述的那些方法改编的方法测序。由抗体的核酸序列和预测的氨基酸序列,鉴定对于从经抗原A或B(如上所述)免疫的小鼠获得的选定且纯化的VL抗原结合蛋白的杂交重链可变区的基因使用。表4阐述了来自于选定的抗-抗原AVL抗原结合蛋白的人Vκ和Jκ基因片段的使用。表5阐述了来自于选定的抗-抗原BVL抗原结合蛋白的Vκ和Jκ基因片段的使用。基因使用数据显示,根据本发明的小鼠可以产生针对小抗原的独特杂交重链可变区,其源自免疫球蛋白重链基因座中的多个人Vκ和Jκ基因片段。人Vκ和Jκ基因片段使用进一步证明了其基因座内以及与轻链Vκ和Jκ基因片段相比多种重排和变化的重排。此外,在杂交重链和轻链间的基因片段使用多样性明显。表4表5亲和力测定使用BIACORETM2000仪器(GEHealthcare)通过SPR(表面等离子体共振)测定选定的抗原B特异性且纯化的VL抗原结合蛋白的平衡解离常数(KD)。所有数据均在25℃下使用DPBS+0.1%DMSO作为样品和运行缓冲液获得。简言之,每种纯化的VL抗原结合蛋白是在先前使用标准的胺偶联化学方法用高密度的蛋白质A衍生化的CM5传感器芯片表面上。捕获步骤期间,在蛋白质A表面按5μL/min的流速注射纯化的抗-抗原BVL抗原结合蛋白,总共3-4分钟。在捕获步骤之后按100μL/min的流速,在270μM-13.7nM原液的三倍稀释浓度范围下注射运行缓冲液或分析物1.5分钟。监测抗原从捕获的纯化VL抗原结合蛋白的解离至少5分钟。通过简单注射pH1.5的10mM甘氨酸去除捕获的纯化VL抗原结合蛋白。所有传感图均通过从分析物传感图中减去来自于缓冲液注射的传感图而双重参考,从而去除由纯化VL抗原结合蛋白从捕获表面解离引起的人为现象。使用BiacoreT100评价软件v2.1将每种纯化VL抗原结合蛋白的结合数据拟合为具有质量转移的1:1结合模型。表6提供了一种对抗原B有特异性的可商购获得的抗体,11种纯化的抗原B特异性VL抗原结合蛋白和3种从对照VI3动物获得的对照抗体的结合数据。表6IC=归因于低信号的无结果的1:1结合拟合分析NB=未结合11种纯化的抗-抗原BVL抗原结合蛋白的结合亲和力不同,全部表现出在约4.4nM至1.93μM范围内的KD。显著地,11种VL抗原结合蛋白中有7种表现出约10nM或更低的KD。相反,可商购获得的抗体对抗原A具有约57nM的结合亲和力,并且从对照动物分离的三种抗体都不表现出在纳摩尔范围的KD。表现出在低纳摩尔范围的KD的纯化VL抗原结合蛋白的T1/2测量值在15和156秒之间变化。不希望受任何特定理论约束,表6中所示纯化VL抗原结合蛋白的结合特性上的波动,和特别是一些纯化VL抗原结合蛋白结合的低亲和力或缺乏,可能是一种或多种VL抗原结合蛋白识别只有在与载体连接时才存在的抗原A的表位的结果。无论如何,使用纯化抗体的亲和力数据与由连接到重链和轻链恒定区(如表4中所述)的重排人轻链可变结构域的组合缔合产生的VL抗原结合蛋白一致,其为高亲和力、经克隆选择、体细胞突变,能够高效结合小分子,并且因此是治疗相关的。实施例3:分析结合特征免疫单独地用购自R&D体系的人分泌型糖蛋白(抗原C)使KOH小鼠群组免疫。“Adam6/VI3”(具有整合Adam6基因的人源化小鼠,参见美国专利第8,642,835号和美国专利第8,502,018B2号)、“ULC”小鼠(参见US2011-0195454A1、US2012-0021409A1、US2012-0192300A1、US2013-0045492A1、US2013-0185821A1和US2013-0302836A1;所述申请通过引用整体并入本文)和野生型Balb/c小鼠的单独群组也经免疫以提供相当的免疫反应特性。缀合至半抗原的抗原C用作免疫原以使KOH、Adam6/VI3、ULC和Balb/c小鼠免疫。在开始免疫之前从小鼠收集免疫前血清。经由足垫(f.p.)注射,按在25μl体积中与10μg作为佐剂的CpG寡核苷酸(Invivogen)混合的2.35μg缀合物施用免疫原用于最初初免。随后,在第3、6、11、13、17、20天经由相同途径用2.35μg的免疫原,连同作为佐剂的10μg的CpG和25μg的Adju-Phos(Brenntag)为小鼠加强,总共加强6次。分别在第4次和第6次加强后,在第15和22天为小鼠放血。测定抗血清对抗原C的半抗原缀合物的抗体滴度。对于KOH小鼠,在完成6次加强之后,使小鼠有4至5周的休息期,此后再施用4次使用免疫原的加强。对小鼠放血并测定抗血清滴度。珠粒上抗原C的制备和修饰为制备用于筛选的抗原偶联珠粒,0.12mL于pH6.2的0.1M磷酸钠缓冲液(J.T.Baker目录号4011-01)中的Luminex珠粒悬浮液(羧化微珠,LuminexCorp.)通过添加15μl的50mg/mLEDC(1-乙基-3-(3-二甲氨基丙基)碳二亚胺,Sigma目录号No.03449)和15μl的50mg/mLSulfo-NHS(N-羟基琥珀酰亚胺,Pierce目录号24510)、接着在室温下孵育10分钟来活化。随后,将0.5mL于pH5的50mMMES缓冲液(ACROS目录号327765000)中的20μg/mL抗原C添加到活化珠粒中,并且使伯胺偶联反应进行两小时,并且通过添加1/10体积的pH8的1MTris溶液(Teknova目录号T1080)猝灭珠粒上的剩余活性基团。用含有0.05%吐温-20(Calbiochem目录号655205)的PBS(LifeTechnologies目录号14190-144)洗涤珠粒,并且储存在含有2%w/vBSA(Sigma目录号A4503)的PBS缓冲液中。以相同方式,还制备了一批阴性对照珠粒。19个与抗原C偶联的珠粒集合单独地用以下差异性抗原破坏试剂之一处理:胰蛋白酶、Glu-C、Asp-N、胰凝乳蛋白酶、Lys-C、ArgC、胃蛋白酶、磺基-NHS-乙酸酯、EDC/乙醇胺、TCEP/碘乙酰胺、PEG-5000、木瓜蛋白酶、嗜热菌蛋白酶、枯草杆菌蛋白酶、蛋白酶K、菠罗蛋白酶、无花果蛋白酶和H1193或7-羟基香豆素-3-羧酸、琥珀酰亚胺酯。化学处理包括在室温下在10mM新鲜溶于磷酸盐缓冲溶液(PBS)中的活性化学品中孵育珠粒集合90分钟。蛋白水解处理包括在室温下在10-100mg新鲜溶于PBS或其它推荐缓冲液中的酶中孵育珠粒集合90分钟。一个另外的珠粒集合在室温下在PBS中孵育90分钟并且与该珠粒集合偶联的抗原C保持未修饰。在上述孵育之后,在含有0.05%吐温20(PBS-T)的PBS中洗涤珠粒集合并且储存在具有5%BSA和0.02%叠氮化钠的PBS中。为筛选结合蛋白,汇合如上所述的19个经修饰的抗原珠粒和未修饰的对照抗原珠粒。将七十五(75)μl含3000个珠粒的等分试样分布到96孔过滤板(Millipore目录号MSBVN1250)的每个预水化孔中。将每种抗体样品(25μl)添加到每个孔中并且在4℃下在板振荡器上孵育板过夜。第二天早上,使用真空歧管用PBS-T洗涤珠粒,并且通过与0.2mL于PBS-T中的1.25μg/mLR-藻红蛋白缀合的山羊抗小鼠或人IgG抗体在室温下孵育45分钟来检测珠粒结合的抗体。然后洗涤珠粒并悬浮在0.2mL的PBS-T中,并且用Luminex荧光分光光度计测量中位荧光强度(MFI)。将结合数据进行如上所述的生物信息数据分析。图6提供了基于差异性抗原破坏表位分析数据的736个抗原C结合蛋白聚类的2DPCA展示。用矩形突出显示的是与测试的常规抗体不共有表位结合特征的独特表位聚类。这个独特表位分类的成员是包含编码杂交免疫球蛋白链的免疫球蛋白基因座的小鼠中产生的VL抗原结合蛋白,杂交免疫球蛋白链具有可操作地融合至由一个或多个重链恒定区基因编码的重链区的由一个或多个轻链可变区基因片段编码的可变区。生物传感器表面上经修饰抗原C的制备抗原C,一种分泌型糖蛋白,通过标准的NHS/EDC介导的胺偶联程序偶联至CM5生物传感器芯片表面。偶联至每个流动池表面的抗原C的量介于3000至10,000RU之间。为最小化拥挤效应,优选的偶联密度为5000RU左右。注意使几乎相同量的抗原C偶联到全部四个流动池,这样可以在与三个修饰流动池信号和非修饰对照流动池表面的结合间做公平比较。使用六种测序级蛋白水解酶修饰每个偶联的抗原C表面:胰蛋白酶、胞内蛋白酶Glu-C和胞内蛋白酶Asp-N以修饰来自第一生物传感器芯片的流动池2、3和4,及胰凝乳蛋白酶、胞内蛋白酶Lys-C和胞内蛋白酶Arg-C以修饰来自第二生物传感器芯片的流动池2、3和4。将Biacore2000设为2μl/min流速的单流动池模式并且将60μl于0.1MTris-HCl(pH8.0)中的200μg/ml胰蛋白酶注入流动池2中。可观察向下弯曲的传感图作为典型的蛋白水解消化特性,表明胰蛋白酶特别去除胰蛋白酶可消化的物质。向流动池内重复注射相同剂量的酶,直至形成稳定表面。当流动池2上胰蛋白酶消化完成时,向流动池3注射60μl在与胰蛋白酶相同的缓冲液中的50μg/ml胞内蛋白酶Glu-C。同样,向相同流动池内重复注射相同剂量的酶,直至形成稳定表面。以相同方式,向流动池4注射60μl在相同缓冲液中的50μg/ml胞内蛋白酶Asp-N以产生稳定的经endoAsp-N修饰的表面。在酶处理结束时,将Biacore2000设为全流动池模式。再生缓冲液流过所有四个抗原C表面以产生稳定的最终工作表面。对具有经修饰免疫球蛋白基因座的非人动物和如实施例2中所述的对照动物中产生的对抗原C有特异性的结合蛋白,以及先前表征的可商购获得的对抗原C有特异性的抗体转移到新的96孔微量滴定板并且与75μl的2X稀释缓冲液(20mMHepes(pH7.4),300mMNaCl、0.01%P-20、40mg/mlCMDX)混合。将混有2X稀释缓冲液的适当对照培养基用作阴性对照。将每种结合蛋白样品注入全部四个流动池并且在注射结束时记录来自每个流动池的结合信号(RU)并且使表面再生。通过Biacore制造商提供的自动化Wizard程序控制每种抗体样品的结合/再生循环。以如上所述在第一芯片的制备中相似的方式,分别用胰凝乳蛋白酶、胞内蛋白酶Lys-C和胞内蛋白酶Arg-C消化来自第二芯片的含有相同量的抗原C的流动池2、3和4。将相同集合的结合蛋白样品注入所有四个流动池中并且以与第一芯片相同的方式收集其结合信号(RU)。通过标准的醛偶联方案(BIAApplicationsHandbook,4.5)使相同量的抗原C偶联到第三CM5芯片的全部四个流动池。偶联至每个流动池表面的抗原C的量介于3000至10,000RU之间,优选的偶联量在5000RU左右以最小化任何拥挤效应。为修饰抗原C中赖氨酸的任何ε胺而不使其结构变性,按5μl/min向流动池2内注射5mM溶于磷酸盐缓冲盐水(PBS)中的磺基-NHS-乙酸酯20分钟。为修饰抗原C中任何谷氨酸和天冬氨酸残基的任何羧酸基团而不使其结构变性,按相同流速向流动池3内注射200mM溶于H2O中的EDC7分钟,接着注射50mM溶于H2O中的肼7分钟。对于抗原C的变性处理,按相同流速向流动池4内注射100mM溶于0.1MTris-HCl(pH8.0)中的TCEP20分钟,接着注射100mM溶于0.1MTris-HCl(pH8.0)中的碘乙酰胺。在处理结束时,将Biacore2000设为全流动池模式。向所有四个抗原C表面注射再生缓冲液三次以产生稳定的最终工作表面。当收集含有9个经修饰抗原C表面和3个未修饰抗原C对照表面的三张单独芯片的结合数据时,将每种结合蛋白对9个经修饰抗原C表面的9个反应RU值全部转化为与未修饰对照的反应RU值的反应比。将全部测试的结合蛋白制剂的反应数据进行如上所述的生物信息数据分析。表位聚类分布的结果通过典型模式识别(非监督)展示方法显示。此列展示方法之一是层次树(树状图),其按树状排列列出结合蛋白的聚类关系。在层次树中,可能共有表位的结合蛋白将通过相对较短的“臂”连接在一起,其中不可能共有表位的那些将通过相对较长的“臂”连接在一起。通过表位绘图验证结合蛋白聚类可通过其它方法如ELISA、竞争测定等验证来自于如通过DAD确定的两个不同功能组(或聚类或分类)的结合蛋白。表位绘图测定通常通过Biacore或Octet仪器进行。来自于两个不同功能组的抗体应不与相同表位相互作用。因此,来自于一个聚类的第一抗体与固定抗原的结合在任何重要程度上应不妨碍来自于不同聚类的第二抗体的结合。相反,来自于相同聚类的抗体在结合其抗原时应表现出相互接近完全的竞争。还使用抗原C一级序列来源的肽阵列验证使用DAD鉴定的功能组。源自抗原C的肽或覆盖整个抗原C序列的重叠肽在PVDF膜上制备为点阵列或印在典型蛋白质微阵列载玻片上。将代表不同功能组的结合蛋白或来自相同功能组的结合蛋白与肽阵列孵育,接着进行标准点印迹或蛋白质阵列结合和染色程序。来自相同功能组的识别相同表位的结合蛋白应在肽阵列板或载玻片上展示出相同或几乎相同的结合模式。相反,来自不同功能组的识别抗原C上的不同表位的结合蛋白应对肽阵列展示出不同的结合模式。实施例4.对小分子有特异性的VL结合蛋白的评价评价如实施例1-3中所公开的针对抗原A、抗原B和抗原C的VL结合蛋白的结构特征。具体而言,测定对抗原A(生物碱小分子;n=132)、抗原B(类固醇小分子;n=87)或抗原C(糖蛋白小分子,n=61)有特异性的VL结合蛋白的杂交链和轻链的CDR3长度。表7示出了来自于对抗原A、抗原B或抗原C有特异性的VL结合蛋白的具有为6、7、8、9、10、11或12的CDR3氨基酸长度的杂交链的数量。表8示出了来自于这些相同VL结合蛋白的具有为7、8、9或10的CDR3氨基酸长度的轻链的数量。图7以柱状图形式提供了该数据。表7CDR3长度抗原A抗原B抗原C总数633841726881193117481094451391113010411222表8CDR3长度抗原A抗原B抗原C总数7213891111998864823210231134VL结合蛋白轻链中的CDR3的长度始终为约9个氨基酸,与抗原特异性无关。相反,评价的VL结合蛋白的杂交链中的CDR3的长度更加可变,特别是对于对小分子有特异性的VL结合蛋白而言。对抗原C(一种糖蛋白)有特异性的VL结合蛋白的杂交链具有长度为约10至11个氨基酸的CDR3长度,少数具有少于10个氨基酸。相反,来自于对小分子,例如抗原A或抗原B有特异性的VL结合蛋白的杂交链的CDR3很可能长度小于10个氨基酸。对抗原B有特异性的VL结合蛋白只有不到一半(约40%)具有6个氨基酸的CDR3长度。总之,这些实施例证明尤其是经遗传修饰来产生如本文所述的VL抗原结合蛋白的非人动物(例如啮齿动物和小鼠)提供了稳健的体内系统,用于有效产生表现出典型抗体未表现出来的结合特征(例如,很可能通过使用小分子上不太适于常规抗体结合的新型互补位或结合表面,以高亲和力结合小分子的能力)的抗原特异性VL抗原结合蛋白。等效案在这样描述本发明至少一个实施方案的几个方面后,本领域的技术人员将认识到对于本领域技术人员而言将易于进行各种改变、修改和改进。此类改变、修改和改进旨在为本公开的一部分,并且旨在为本发明的精神和范围之内。因此,前面的描述和附图仅举例而言并且下面的权利要求书详细描述了本发明。还应理解,本发明的任何实施方案或方面均可明确地从权利要求书中排除,而不管说明书中是否叙述特约除外事项。本领域的技术人员将认识到归因于测定或本文所述其它过程中获得的值的典型标准偏差或误差。本文引用以描述发明背景和提供关于其实践的附加细节的出版物、网站和其它参考材料据此通过引用并入。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1