发现替代性抗原特异性抗体变体的方法与流程

文档序号：18974478发布日期：2019-10-29 03:10阅读：606来源：国知局

背景技术：

现今，通常通过噬菌体展示或通过免疫实验室动物并从中分离产生抗体的b细胞来产生抗体。在后一种情况下，待处理的b细胞数量基于b细胞或相应分泌的抗体的性质而减少。然后，获得序列信息。因此，候选物选择主要基于抗体的结合和功能特性进行，但在氨基酸序列方面是“不知情的”，因此，例如，在可开发性方面，如未配对的cys-残基、不寻常的糖基化位点、降解热点(asp、asn、met等)是“不知情的”。

在wo2015/070191中，报道了用于检测基因组变体的系统和方法。wo2015/155035报道了用于鉴定和绘制由抗体应答靶向的表位的方法。在wo2015/164757中报道了病毒中和抗体表位绘制的方法。wo2016/023962报道了基于共有的等位基因检测。而在wo2016/118883中报道了罕见序列变体的检测、方法和组合物。

在当前免疫方法中获得的大量b细胞阻止了由此产生的所有分离抗体的详细表征。必须选择和减少克隆数量，降低特征性免疫应答的多样性。

wu等人公开了通过结构和深度测序揭示的hiv-1中和抗体的集中进化(science333(2011)1593-1602)。

zhu等人公开了通过b细胞转录物的二代测序从头鉴定vrco1类hiv-1中和抗体(proc.natl.acad.sci.usa110(2013)e4088-e4097)。

wu等人和zhu等人各公开了用于鉴定来自与参照结合物相同或不同物种的给定参照结合序列的“新”同源抗体(cognateantibody)变体的方法。

fridy等人公开了一种用于快速生产多功能纳米抗体库的稳健通路(nat.meth.11(2014)1253-1260+si)。如wu等人和zhu等人一样，fridy等人所进行的方法没有公开任何使用序列库搜索抗体变体的结果或方法或方式。

glanville等公开了文库选择项目中深度测序所带来的见解(curr.opin.struct.biol.33(2015)146-160)。

因此，需要提供基于免疫应答多样性中包含的序列信息鉴定结合相同抗原但具有不同特性的另外的或变体抗体的方法。

技术实现要素：

然而，本发明人已经发现，通过利用二代测序的定量性质，可以克服上述特征性免疫应答多样性丧失所带来的挑战。

本发明人已经发现，通过将b细胞克隆(bcc)的多功能性与二代测序(ngs)的能力相结合，可以鉴定从一种或多种针对相同抗原的免疫动物中获得的b细胞群中存在的参照结合物的变体结合物。

本文报道的方法将b细胞克隆的效率与二代测序的能力合并，提供了用于鉴定参照抗体的抗体变体的高度简化的方法，而无需进行深入的基于筛选的(免疫或细胞)测定。

已经发现，利用本文报道的方法，可以鉴定抗体可变结构域以及具有至少一个可开发性热点的完整vh/vl对(即具有至少一个易于发生翻译后修饰的氨基酸残基)、不包含所述可开发性热点的变体(即具有的至少一个易于发生翻译后修饰的氨基酸残基改变为不易于发生相同的翻译后修饰的不同氨基酸残基)。

本文报道的方法的另一个结果是能够提供用相同抗原免疫的一个动物个体或一组动物独特的抗体反应谱。该谱可以是有价值信息的来源。

本文报道的一个方面是用于选择参照抗体可变结构域编码核酸的变体的方法，其中与所述参照编码核酸编码的参照抗体可变结构域氨基酸序列相比，所述参照抗体可变结构域编码核酸的变体编码的变体抗体可变结构域氨基酸序列具有改善的可开发性，或其中在所述参照抗体可变结构域编码核酸的变体编码的变体抗体可变结构域氨基酸序列中，翻译后修饰的至少一个氨基酸残基与所述参照编码核酸编码的参照抗体可变结构域氨基酸序列相比，已经改变，其中当变体和参照抗体可变结构域与相应的其他结构域配对时，形成与相同抗原结合的抗体结合位点，

该方法包括以下步骤：

(i)提供多个含dna的样品，每个样品包括一个或多个抗体可变结构域编码核酸；

(ii)使用共有序列特异性引物对(i)的多个抗体可变结构域编码核酸进行pcr扩增以获得扩增产物；

(iii)对步骤(ii)中获得的多个扩增产物进行测序，以确定每个核苷酸在每个位置的相对比例(在测序读取中)；

(iv)在(iii)的测序(读取)结果和参照抗体可变结构域编码核酸之间进行序列比对；

(v)在(iv)的所述序列比对中进行基于序列同一性或同源性的抗体可变结构域编码核酸的排序，其中参照抗体可变结构域编码核酸是模板序列；和

(vi)从步骤(v)的序列排序的前10个序列之一中选择变体抗体可变结构域编码核酸；

从而选择在步骤(vi)中选择的变体以使得可开发性得到改善和/或至少一个翻译后修饰的氨基酸残基已经改变。

本文报道的一个方面是用于选择参照抗体可变结构域的变体的方法，其中参照抗体可变结构域具有至少一个翻译后修饰的氨基酸残基，该方法包括以下步骤：

-接收通过测序来自多个b细胞克隆的核酸产生的测序数据，每个b细胞克隆产生特异性结合与参照抗体相同的靶的抗体；

-将测序数据与作为模板序列的参照抗体的序列比对；

-选择与参照序列具有最高结构/功能同一性/相似性的序列，但其不具有参照抗体可变结构域的至少一个翻译后修饰的氨基酸残基。

本文报道的一个方面是用于鉴定与相同靶/抗原特异性结合的参照抗体的变体抗体的方法，所述方法包括以下步骤：

i)提供

α)参照抗体的氨基酸序列或核酸序列，其中参照抗体与靶/抗原特异性结合，

β)所述参照抗体的至少一种生物学特性和任选的一种或多种测定法以测定至少一种生物学特性，

γ)特异性结合与参照抗体相同的靶的变体抗体的多个氨基酸序列或核酸序列，其已经通过二代测序确定，

ii)产生一组或多组(相关的)vh或/和vl序列，其中基于以下进行序列比对

α)vh或/和vl的相同长度，或/和

β)所有β-片层框架区的相同长度，或/和

γ)所有hvr/cdr的相同长度，或/和

δ)相同的hvr3/cdr3序列、框架和/或其他hvr/cdr中允许的多至3个氨基酸交换的突变，或/和

ε)允许的多至2个氨基酸交换的同源hvr/cdr3序列和相同的hvr/cdr1和2，或/和

ζ)允许框架和hvr/cdr中的突变；

iii)根据以下对ii)的一组或多组中的比对序列排序

α)与参照抗体序列不同的氨基酸的数量，和/或

β)与参照抗体序列不同的氨基酸的位置，和/或

γ)由与参照抗体序列不同的氨基酸产生的物理化学性质的变化，和/或

δ)由与参照抗体序列不同的氨基酸产生的vh/vl方向的不同；

iv)将最好的10个比对和排序的抗体之一鉴定为参照抗体的变体抗体，从而变体抗体具有至少一个比参照抗体少翻译后修饰的氨基酸残基。

在该方面的一个实施方案中，步骤ii)还包括用相同的编号方案注释序列，该编号方案是wolfguy编号方案。

在该方面的一个实施方案中，序列中的不同以以下形式注释：参照抗体氨基酸残基-位置-变体抗体氨基酸残基，并且被分组为突变元组。

在该方面的一个实施方案中，物理化学性质的变化由电荷、疏水性和/或大小的变化决定。

在该方面的一个实施方案中，使用突变风险评分确定物理化学性质的变化。

在该方面的一个实施方案中，基于下表确定突变风险评分，其中在该表中未明确给出的残基用值1加权：

其中，位置101至125对应于重链可变结构域框架1，位置151至199对应于cdr-h1，位置201至214对应于重链可变结构域框架2，位置251至299对应于cdr-h2，位置301至332对应于重链可变结构域框架3，位置351至399对应于cdr-h3，位置401至411对应于重链可变结构域框架4。

在该方面的一个实施方案中，特异性结合与参照抗体相同的靶的变体抗体的多个氨基酸序列或核酸序列从来自与参照抗体相同的免疫活动的b细胞获得，其中对表达抗原特异性抗体的b细胞进行b细胞富集

在所有方面的一个实施方案中，在变体中除去以下一个或多个：i)可变结构域或hvr中的未配对cys-残基，ii)糖基化位点，和iii)降解热点(asp、asn或met)。

本文报道的一个方面是用于选择参照抗体可变结构域的变体的方法，其中参照抗体可变结构域具有至少一个翻译后修饰的氨基酸残基，该方法包括根据前述方面中任一项的方法的步骤。

本文报道的一个方面是用于产生抗体的方法，其包括以下步骤：

-培养包含根据前述方面中任一项的方法获得的核酸和表达功能性抗体所需的所有其他核酸的细胞，

-从细胞或培养基中回收抗体。

本文报道的一个方面是包含根据前述方面中任一项的方法获得的核酸的细胞。

本文报道的一个方面是用于鉴定特异性结合相同靶/抗原的参照抗体的变体抗体(与参照抗体具有相当的生物学特性)的方法，所述方法包括以下步骤：

i)提供

α)参照抗体的氨基酸序列或核酸序列，其中参照抗体与靶/抗原特异性结合，

β)所述参照抗体的至少一种生物学特性和任选的一种或多种测定法以测定至少一种生物学特性，

γ)特异性结合与参照抗体相同的靶的变体抗体的多个(至少10、至少100、至少1000、至少10000个)氨基酸序列或核酸序列(任选地在/从与参照抗体相同的免疫活动中获得)，其通过二代测序确定，

ii)产生一组或多组相关的vh或/和vl序列，其中基于以下进行序列比对

α)vh或/和vl的相同长度，或/和

β)所有β-片层框架区的相同长度，或/和

γ)所有hvr/cdr的相同长度，或/和

δ)相同的hvr3/cdr3序列、允许的框架和/或hvr/cdr中1或2(1至3个氨基酸交换)突变，或/和

ε)高度同源的hvr/cdr3序列(允许1或2个氨基酸交换)和相同的hvr/cdr1和2(在框架区允许突变)，或/和

ζ)允许框架和hvr/cdr中的突变；

iii)根据以下对ii)的一组或多组中的比对序列排序

α)与参照抗体序列不同的氨基酸的数量，和/或

β)与参照抗体序列不同的氨基酸的位置，和/或

γ)由与参照抗体序列不同的氨基酸产生的物理化学性质的变化，和/或

δ)由与参照抗体序列不同的氨基酸产生的vh/vl方向(角度)的不同；

iv)将最好的10个(或最好的5个、最好的3个或最好的)比对和排序的抗体之一鉴定为参照抗体的变体抗体。

在一个实施方案中，步骤ii)还包括用相同的编号方案注释序列并注释不同。在一个实施方案中，编号方案是kabateu编号或wolfguy编号方案。在一个优选的实施方案中，编号方案是wolfguy编号方案。在一个实施方案中，不同以以下形式注释：参照抗体氨基酸残基-位置-变体抗体氨基酸残基。在一个实施方案中，变体抗体相对于参照抗体的突变被分组在突变元组中。

在一个实施方案中，步骤ii)进一步包括去除与参照抗体和/或变体抗体之一的序列相同的序列，或者相对于参照抗体在不同氨基酸的数量、位置和/或类型方面相同或相似的序列。

在一个实施方案中，物理化学性质的变化由(总)电荷、疏水性和/或大小的变化确定。在一个实施方案中，使用突变风险评分确定物理化学性质的变化。在一个实施方案中，基于下表确定风险评分，其中在该表中未明确给出的残基用值1加权：

其中，wolfguy索引位置101至125对应于重链可变结构域框架1，位置151至199对应于cdr-h1，位置201至214对应于重链可变结构域框架2，位置251至299对应于cdr-h2，位置301至332对应于重链可变结构域框架3，位置351至399对应于cdr-h3，位置401至411对应于重链可变结构域框架4。

在一个实施方案中，突变风险评分取负值，其中较大的负值表示较大的功能丧失风险。

在一个实施方案中，特异性结合与参照抗体相同的靶的变体抗体的多个(至少10个、至少100个、至少1,000个、至少10,000个)氨基酸序列或核酸序列从来自与参照抗体相同的免疫活动的b细胞获得，其中对表达抗原特异性抗体的b细胞进行b细胞富集。在一个实施方案中，富集通过抗原特异性分选或/和细胞淘选或/和非抗原特异性抗体产生b细胞耗尽进行。

本文报道的一个方面是用于鉴定特异性结合相同靶/抗原的参照抗体的变体抗体(与参照抗体具有相当的生物学特性)的方法，所述方法包括以下步骤：

i)确定/生成/测量

α)参照抗体的氨基酸序列或核酸序列，其中参照抗体特异性结合靶/抗原，

β)参照抗体的至少一种生物学特性，

γ)通过对多个(至少10个、至少100个、至少1,000个、至少10,000个)变体抗体进行二代测序氨基酸序列或核酸序列，其中变体抗体与参照抗体特异性结合相同的靶/抗原，任选地在/从与参照抗体相同的免疫活动中获得；

ii)基于以下比对vh或/和vl序列，以产生一组或多组相关的vh/vl序列

α)vh或/和vl的相同长度，或/和

β)所有β-片层框架区的相同长度，或/和

γ)所有hvr/cdr的相同长度，或/和

δ)相同的hvr3/cdr3序列、框架和/或hvr/cdr1或2中允许的突变(1至3个氨基酸交换)，或/和

ε)高度同源的hvr3/cdr3序列(允许的1或2个氨基酸交换)和相同的hvr/cdr1和2(带有框架中带有允许的突变)，或/和

ζ)允许框架和hvr/cdr中的突变；

iii)根据以下对ii)的一组或多组中的比对序列排序

α)与参照抗体序列不同的氨基酸的数量，和/或

β)与参照抗体序列不同的氨基酸的位置，和/或

γ)由与参照抗体序列不同的氨基酸产生的物理化学性质的变化，和/或

δ)由与参照抗体序列不同的氨基酸产生的vh/vl方向(角度)的不同；

iv)将10个(或5个或3个或)最好的比对和排序的抗体之一鉴定为参照抗体的变体抗体。

在一个实施方案中，步骤ii)还包括用相同的编号方案注释序列并注释不同。在一个实施方案中，编号方案是kabateu编号或wolfguy编号方案。在一个优选实施方案中，编号方案是wolfguy编号方案。在一个实施方案中，以以下形式注释不同：参照抗体氨基酸残基-位置-变体抗体氨基酸残基。在一个实施方案中，变体抗体相对于参照抗体的突变被分组在突变元组中。

在一个实施方案中，步骤ii)进一步包括去除与参照抗体和/或变体抗体之一的序列相同的序列，或者相对于参照抗体在不同氨基酸的数量、位置和类型方面相同或相似的序列。

在一个实施方案中，物理化学性质的变化由电荷、疏水性和/或大小的变化确定。在一个实施方案中，使用突变风险评分确定物理化学性质的变化。在一个实施方案中，基于下表确定风险评分，其中在该表中未明确给出的残基用值1加权：

其中wolf-guy索引位置101至125对应于重链可变结构域框架1，位置151至199对应于cdr-h1，位置201至214对应于重链可变结构域框架2，位置251至299对应于cdr-h2，位置301至332对应于重链可变结构域框架3，位置351至399对应于cdr-h3，位置401至411对应于重链可变结构域框架4(位置501至523对应于轻链可变结构域框架1，位置551至599对应于cdr-l1，位置601至615对应于轻链可变结构域框架2，位置651至699对应于cdr-l2，位置701至734对应于轻链可变结构域框架3，位置751至799对应于cdr-l3，位置801至810对应于轻链可变结构域框架4)。

在一个实施方案中，突变风险评分取负值，其中较大的负值表示较大的功能丧失风险。

在一个实施方案中，特异性结合与参照抗体相同的靶的变体抗体的多个(至少10个、至少100个、至少1,000个、至少10,000个)氨基酸序列或核酸序列从与参照抗体相同免疫活动的b细胞获得，其中对表达抗原特异性抗体的b细胞进行b细胞富集。在一个实施方案中，通过抗原特异性分选或/和细胞淘选或/和产生非抗原特异性抗体的b细胞的耗尽进行富集。

本文报道的一个方面是用于鉴定特异性结合相同靶/抗原的参照抗体的变体抗体(具有与参照抗体相当的生物学特性)的方法，所述方法包括以下步骤：

a)提供产生/表达与参照抗体结合相同靶/抗原的(多个)不同抗体的多个b细胞(从与参照抗体相同的动物物种获得)；

b)从多个b细胞中分离(和扩增)抗体编码核酸；

c)通过二代测序方法对编码抗体的核酸进行测序；

d)通过以下产生编码抗体的核酸序列的序列比对

i)基于以下比对vh或/和vl序列，以生成一组或多组相关的vh/vl序列：

α)vh或/和vl的相同长度，或/和

β)所有β-片层框架区的相同长度，或/和

γ)所有hvr/cdr的相同长度，或/和

δ)相同的hvr3/cdr3序列、允许的框架和/或hvr/cdr1或2中的突变(1至3个氨基酸交换)，或/和

ε)高同源的hvr3/cdr3序列(允许的1或2个氨基酸交换)和相同的hvr/cdr1和2(带有框架中允许的突变)，或/和

ζ)允许框架和hvr/cdr中的突变；

ii)通过以下对ii)的一组或多组中的比对序列排序

α)与参照抗体序列不同的氨基酸的数量，和/或

β)与参照抗体序列不同的氨基酸的位置，和/或

γ)由与参照抗体序列不同的氨基酸产生的物理化学性质的变化，和/或

δ)由与参照抗体序列不同的氨基酸产生的vh/vl方向(角度)的不同；

e)鉴定参照抗体的一个或多个变体抗体；

f)确定变体抗体的一种或多种生物学特性；和

g)选择具有相当的或改善的一种或多种生物学特性的变体抗体，从而鉴定参照抗体的变体抗体。

本文报道的一个方面是用于鉴定特异性结合相同靶/抗原的参照抗体的变体抗体(具有与参照抗体相当的生物学特性)的方法，所述方法包括以下步骤：

(i)提供一个或多个含有dna的样品，其包含多个编码抗体的核酸；

(ii)使用共有序列特异性引物对(i)的每个样品中的编码抗体的核酸的区域进行pcr扩增，其中共有序列特异性引物结合多个编码抗体的核酸中的多个基因共同的共有序列，从而产生扩增产物的库；

(iii)对所述扩增产物进行测序以确定每个核苷酸在每个位置的相对比例(在测序读取中)；

(iv)在(iii)的测序(读取)结果和至少一个参照序列之间进行序列比对(基于序列同一性)，该参照序列对应于具有所需特性的抗体；和

(v)鉴定参照抗体的一个或多个变体抗体。

本文报道的一个方面是用于鉴定特异性结合相同的靶/抗原的参照抗体的变体抗体(具有与参照抗体相当的生物学特性)的方法，所述方法包括以下步骤：

a)从包含编码抗体可变结构域的核酸的生物样品中扩增一个或多个感兴趣的区域，其中对于每个感兴趣的区域产生多个扩增子；

b)将适体和随机组分连接到(a)中产生的每个扩增子上并扩增每个所述延伸的扩增子；

c)对(b)中产生的包含随机组分的扩增子进行测序，其中产生冗余读取，并且其中冗余读取通过随机组分分组，并鉴定共有序列；

d)比较共有序列与参照序列，其中与参照序列不同的共有序列包含突变/变异；和

e)基于步骤d)的结果鉴定一个或多个变体抗体。

在一个实施方案中，步骤a)至c)是

a)使包含一个或多个特异于生物样品中一个或多个感兴趣区域的引物对的引物库杂交，所述生物样品包含编码抗体可变结构域的核酸，从引物对的上游引物延伸至引物对的下游引物，将延伸产物连接到引物对的下游引物上，其中产生包含侧翼为扩增所需序列的感兴趣区域的产物；

b)连接包含随机组分的适体并将包含索引序列的适体连接到(a)的产物上并扩增每个所述延伸序列；

c)对(b)中产生的包含随机组分的产物进行测序，其中产生冗余读取，并且其中冗余读取通过随机组分分组，并鉴定共有序列。

本文报道的一个方面是用于选择参照抗体可变结构域编码核酸的变体的方法，其中由所述编码核酸编码的参照抗体可变结构域氨基酸序列具有至少一个可开发性热点(即包含至少一个翻译后修饰的氨基酸残基，其导致在其结合位点之一中包含所述参照抗体可变结构域的参照抗体的生物学特性的改变(对其靶/抗原的结合亲和力降低))，该方法包括以下步骤：

(i)提供多个含dna样品(分泌抗体的b细胞的基因组物质)，每个样品包括一个或多个编码抗体可变结构域的核酸；

(ii)使用共有序列特异性引物对(i)的编码抗体可变结构域的核酸进行pcr扩增，以获得扩增产物(其中所述共有序列特异性引物结合对核酸中多个基因是共同的共有序列，从而产生扩增产物的库)；

(iii)对步骤(ii)中获得的多个扩增产物进行测序，以确定每个核苷酸在每个位置的相对比例(在测序读取中)；

(iv)在(iii)的测序(读取)结果和参照抗体可变结构域编码核酸之间进行序列比对(基于序列同一性)；

(v)在参照抗体可变结构域编码核酸作为完美/模板/参照序列的序列比对中，进行基于序列同一性/同源性的编码抗体可变结构域的核酸的排序；和

(vi)基于步骤(v)的序列排序选择编码变体抗体可变结构域的核酸，

其中选择步骤(vi)中选择的变体抗体可变结构域，以便除去可开发性热点(即，使其与参照抗体相比，包含少至少一个翻译后修饰的氨基酸残基，从而导致降低参照抗体的生物学特性的变化(减少对其靶/抗原的结合亲和力的降低)，所述参照抗体在其结合位点之一中包含所述参照抗体可变结构域)。

在所有方面的一个实施方案中，可开发性热点(翻译后修饰的氨基酸残基)选自可变结构域中或hvr之一中的一个或多个未配对的cys-残基、一个或多个糖基化位点、n-或o-糖基化位点中的氨基酸残基、或/和一个或多个降解热点(asp、asn或met)。

本文报道的一个方面是用于选择参照抗体可变结构域的变体的方法，其中所述参照抗体可变结构域具有至少一个可开发性热点，该方法包括以下步骤：

-接收通过测序来自多个b细胞克隆的核酸产生的测序数据，每个b细胞克隆产生特异性结合与参照抗体相同的靶的抗体；

-比对测序数据与作为完美/模板/参照序列的参照抗体可变结构域的序列；

-选择与参照抗体可变结构域序列具有最高结构/功能同一性/相似性但不具有可开发性热点的序列。

在一个实施方案中，可开发性热点(翻译后修饰的氨基酸残基)选自可变结构域中或hvr之一中的一个或多个未配对的cys-残基、一个或多个糖基化位点、n-或o-糖基化位点中的氨基酸残基、或/和一个或多个降解热点(asp、asn或met)。

本文报道的一个方面是用于选择参照抗体可变结构域的变体的方法，其中所述参照抗体可变结构域具有至少一个可开发性热点，该方法包括本文报道的方法之一的步骤。

本文报道的一个方面是用于产生抗体的方法，其包括以下步骤：

-培养包含编码参照抗体的变体抗体的核酸的细胞，其中用本文报道的方法之一和表达功能性抗体所需的所有其他核酸获得所述核酸，

-从细胞或培养基中回收抗体。

本文报道的一个方面是包含用本文报道的方法之一获得的核酸的细胞。

明确指出，每个方面也可以是不同方面的实施方案。

本文报道的方法可用于鉴定不具有可开发性议题的参照抗体的替代性抗原特异性抗体变体。

本文报道的方法甚至可以与多克隆血清一起使用，如通过使用这些“单克隆化的”ngs。

发明的详细描述

容易理解的是，如本文一般描述的实施方案是示例性的。以下对各种实施方案的更详细描述并非旨在限制本公开的范围，而是仅代表各种实施方案。此外，在不脱离本公开的范围的情况下，本领域技术人员可以改变本文公开方法的步骤或动作的顺序。换句话说，除非为了实施方案的正确操作需要特定的步骤或动作顺序，否则可以修改特定步骤或动作的顺序或使用。

定义

关于人免疫球蛋白轻链和重链的核苷酸序列的一般信息在以下文献中给出：kabat,e.a.等人,sequencesofproteinsofimmunologicalinterest,第5版,publichealthservice,nationalinstitutesofhealth,bethesda,md(1991)。

如本文所用，重链和轻链所有恒定区和结构域的氨基酸位置根据kabat等人，sequencesofproteinsofimmunologicalinterest,第5版,publichealthservice,nationalinstitutesofhealth,bethesda,md(1991)中描述的kabat编号系统编号，在文中称为“根据kabat编号”。具体地，kabat等人sequencesofproteinsofimmunologicalinterest,第5版,publichealthservice,nationalinstitutesofhealth,bethesda,md(1991)的kabat编号系统(参见第647-660页)用于kappa和lambda同种型的轻链恒定结构域cl，并且kabateu索引编号系统(参见第661-723页)用于恒定重链结构域(ch1、铰链、ch2和ch3，在本文中通过称为“根据kabateu索引编号”进一步阐明)。

必须注意的是，如本文和所附权利要求中所使用的，单数形式“一(a)”，“一(an)”和“该(the)”包括复数指代，除非上下文另有明确说明。因此，例如，提及“一(a)细胞”包括多个这样的细胞及其本领域技术人员已知的等同物，等等。同样，术语“一(a)”(或“一(an)”)、“一个或多个”和“至少一个”在本文中可互换使用。还应注意，术语“包含”、“包括”和“具有”可互换使用。

对于本领域技术人员来说，将氨基酸序列(例如多肽的氨基酸序列)转换为编码该氨基酸序列的相应核酸序列是众所周知的。因此，核酸的特征在于由各个核苷酸组成的其核酸序列，并且同样还在于由其编码的多肽的氨基酸序列。

重组dna技术的使用使得能够产生核酸的衍生物。例如，这些衍生物可以通过取代、改变、交换、缺失或插入在个别或几个核苷酸位置进行修饰。修饰或衍生化可以例如通过定点诱变的方法进行。这些修饰可以由本领域技术人员容易地进行(参见例如sambrook,j.等人,molecularcloning:alaboratorymanual(1999)coldspringharborlaboratorypress,newyork,usa；hames,b.d.,和higgins,s.g.,nucleicacidhybridization–apracticalapproach(1985)irlpress,oxford,england)。

用于实施本发明的有用方法和技术描述于例如ausubel,f.m.(编辑),currentprotocolsinmolecularbiology,volumesitoiii(1997)；glover,n.d.,和hames,b.d.,编辑,dnacloning:apracticalapproach,第i和ii卷(1985),oxforduniversitypress；freshney,r.i.(编辑),animalcellculture–apracticalapproach,irlpresslimited(1986)；watson,j.d.等人,recombinantdna,第2版,chslpress(1992)；winnacker,e.l.,fromgenestoclones；n.y.,vchpublishers(1987)；celis,j.编辑,cellbiology,第2版,academicpress(1998)；freshney,r.i.,cultureofanimalcells:amanualofbasictechnique,第2版,alanr.liss,inc.,n.y.(1987)。

术语“约”表示其后跟随的数值的+/-20％的范围。在一个实施方案中，术语“约”表示其后跟随的数值的+/-10％的范围。在一个实施方案中，术语“约”表示其后跟随的数值的+/-5％的范围。

术语“聚糖”表示多糖或寡糖。本文还使用聚糖来指糖缀合物的碳水化合物部分，糖缀合物如糖蛋白、糖脂、糖肽、糖蛋白质组、肽聚糖、脂多糖或蛋白聚糖。聚糖通常仅由单糖之间的为β糖苷键的单糖组成。聚糖可以是单糖残基的均聚物或杂聚物，并且可以是直链或支链的。

本文的术语“抗体”以最广泛的含义使用，并且包括各种抗体结构，包括但不限于单克隆抗体、多克隆抗体和多特异性抗体(例如双特异性抗体)，只要它们表现出所需的抗原结合活性即可。

如本文所用的术语“二代测序”表示一种包括大规模平行测序的方法，其提供比传统测序(例如传统的sanger测序)高得多的序列输出。该术语通常也被定义为“深度测序”或“第二代测序”(metzker,m.l.,nat.rev.genet.11(2010)31-46；mardis,e.r.,annu.rev.genom.hum.genet.9(2008)387-402)。使用二代测序方法允许在非常短的时间内获得测序数据。可商购获得用于进行二代测序的不同技术，例如焦磷酸测序(454lifesciences，rochediagnosticscorp.，basel，switzerland)、通过合成测序(hiseq^tm和miseq^tm，illumina,inc.,sandiego,ca)、通过连接测序(solid^tm,lifetechnologiescorp.logan,ut)、polonator测序、离子半导体测序(ionpgm^tm,和ionproton^tm,lifetechnologiescorp.,logan,ut)、iontorrent测序、纳米孔测序、单分子实时测序(smrt^tm,pacificbiosciences,menlopark,ca)、heliscope单分子测序、隧道电流测序、杂交测序、质谱测序、微流体sanger测序、rna聚合酶(rnap)测序等等。

术语“测序平台”表示用于测序核酸的系统，包括基因组dna(gdna)、互补dna(cdna)和rna。该系统可包括一个或多个机器或设备(例如，扩增机器、测序机器、检测设备等)、数据存储和分析设备(例如，硬盘驱动器、远程存储系统、处理器等)、试剂(例如，引物、探针、接头、标签、ntp等)及用于它们使用的特定方法。例如，通过合成测序和焦磷酸测序和不同平台。

术语“读取(read)”表示确定特定多核苷酸中核苷酸的特定位置或序列的核苷酸同一性的单个实例。如果在测序分析中确定核苷酸或多核苷酸序列x次，则对于该核苷酸或多核苷酸存在“x读取”或“x的读取深度”或“x的读取覆盖率”。

如本文所用，术语“高变区”或“hvr”是指抗体可变结构域的每个区域，其在序列上高变(“互补决定区”或“cdr”)和/或形成结构上限定的环(“高变环”)的氨基酸残基区段，和/或含有抗原接触残基(“抗原接触”)的氨基酸残基区段。通常，抗体包含六个hvr；三个在vh中(h1、h2、h3)和三个在vl中(l1、l2、l3)。

本文的hvr包括

(a)在氨基酸残基26-32(l1)、50-52(l2)、91-96(l3)、26-32(h1)、53-55(h2)和96-101(h3)处存在的高变环(chothia,c.和lesk,a.m.,j.mol.biol.196(1987)901-917)；

(b)在氨基酸残基24-34(l1)、50-56(l2)、89-97(l3)、31-35b(h1)、50-65(h2)和95-102(h3)处存在的cdr(kabat,e.a.等人,sequencesofproteinsofimmunologicalinterest,第5版publichealthservice,nationalinstitutesofhealth,bethesda,md(1991),nihpublication91-3242)；

(c)在氨基酸残基27c-36(l1)、46-55(l2)、89-96(l3)、30-35b(h1)、47-58(h2)和93-101(h3)处存在的抗原接触(maccallum等人j.mol.biol.262:732-745(1996))；和

(d)(a)、(b)和/或(c)的组合，包括hvr氨基酸残基46-56(l2)、47-56(l2)、48-56(l2)、49-56(l2)、26-35(h1)、26-35b(h1)、49-65(h2)、93-102(h3)和94-102(h3)。

除非另有说明，否则可变结构域中的hvr残基和其他残基(例如fr残基)在本文中根据kabat等人，同上编号。

“分离的”抗体是一种已经从其天然环境的组分分离的抗体。在一些实施方案中，将抗体纯化至大于95％或99％的纯度，如，例如通过电泳(例如，sds-page、等电聚焦(ief)、毛细管电泳)或色谱法(例如，离子交换或反相hplc)测定的。关于评估抗体纯度的方法的综述，参见，例如，flatman,s.等人,j.chromatogr.b848(2007)79-87。

“分离的”核酸是指已经从其天然环境的组分分离的核酸分子。分离的核酸包括通常含有核酸分子的细胞中含有的核酸分子，但核酸分子存在于染色体外或不同于其天然染色体位置的染色体位置。

如本文所用的术语“单克隆抗体”是指从基本上同质的抗体群获得的抗体，即，组成群的各个抗体是相同的和/或结合相同的表位，除了可能的变体抗体，例如，含有天然发生的突变或在单克隆抗体制剂的生产过程中产生的突变，这些变体通常以少量存在。与通常包括针对不同决定簇(表位)的不同抗体的多克隆抗体制剂相反，单克隆抗体制剂的每种单克隆抗体针对抗原上的单一决定簇。因此，修饰语“单克隆”表示抗体的特征是从基本上同质的抗体群获得的，并且不应解释为需要通过任何特定方法产生抗体。例如，根据本发明使用的单克隆抗体可以通过多种技术制备，包括但不限于杂交瘤方法、重组dna方法、噬菌体展示方法和利用含有全部或部分人免疫球蛋白基因座的转基因动物的方法。

抗体的“类别”是指其重链具有的恒定结构域或恒定区的类型。存在抗体的五种主要类型：iga、igd、ige、igg和igm，并且这些中的一些可以进一步分为亚类(同种型)，例如igg1、igg2、igg3、igg4、iga1和iga2。对应于不同类别免疫球蛋白的重链恒定结构域分别称为α、δ、ε、γ和μ。

术语“n-连接的寡糖”表示通过天冬酰胺-n-乙酰基葡糖胺键在天冬酰胺氨基酸残基上与肽主链连接的寡糖。n-连接的寡糖也称为“n-聚糖”。所有n-连接的寡糖具有man3glcnac2的共同五糖核心。它们在外周糖的存在和支链(也称为触角)数量方面不同，所述外周糖如n-乙酰基葡糖胺、半乳糖、n-乙酰半乳糖胺、岩藻糖和唾液酸。任选地，该结构还可含有核心岩藻糖分子和/或木糖分子。n-连接的寡糖与天冬酰胺或精氨酸侧链的氮连接。n-糖基化基序，即n-糖基化位点，包含asn-x-ser/thr共有序列，其中x是除脯氨酸之外的任何氨基酸。因此，n-糖基化位点中的氨基酸残基可以是asn-x-ser/thr共有序列中的任何氨基酸残基，其中x是除脯氨酸之外的任何氨基酸。在一个实施方案中，是n-糖基化位点中的氨基酸残基asn、ser或thr。

术语“o-连接的寡糖”表示在苏氨酸或丝氨酸氨基酸残基处与肽主链连接的寡糖。在一个实施方案中，是o-糖基化位点中的氨基酸残基ser或thr。

术语“糖基化状态”表示抗体的特定或所需的糖基化模式。“糖型”是包含特定糖基化状态的抗体。此类糖基化模式包括，例如，在抗体fc区的n-297位置(根据kabat编号)连接一个或多个糖，其中所述糖是天然、重组、合成或半合成产生的。可通过本领域已知的许多方法测定糖基化模式。例如，在us2006/0057638和us2006/0127950中报道了分析蛋白质上碳水化合物的方法(其公开内容通过引用整体并入本文)。

术语“可变区”或“可变结构域”是指抗体重链或轻链的结构域，其参与抗体与抗原的结合。天然抗体的重链和轻链(分别为vh和vl)的可变结构域通常具有相似的结构，每个结构域包含四个保守构架区(fr)和三个高变区(hvr)。(参见，例如，kindt,t.j.等人kubyimmunology,第6版,w.h.freemanandco.,n.y.(2007)，第91页)。单个vh或vl结构域可足以赋予抗原结合特异性。此外，可以使用来自结合抗原的抗体的vh或vl结构域分离结合特定抗原的抗体，以筛选分别互补vl或vh结构域的文库。参见，例如，portolano,s.等人,j.immunol.150(1993)880-887；clackson,t.等人,nature352(1991)624-628)。

可以基于“百分比(％)序列同一性”进行变体氨基酸序列或变体核酸序列相对于参照氨基酸序列或参照核酸序列的比对。“百分比(％)序列同一性”定义为在比对序列并且(如果需要)引入缺口以实现最大百分比序列同一性后，变体序列中与参照序列中的残基相同的残基的百分比。可以以本领域技术范围内的各种方式实现比对，例如，使用可公开获得的计算机软件，如blast、blast-2、align或megalign(dnastar)软件。本领域技术人员可确定用于比对序列的适当参数，包括在所比较的序列全长上实现最大比对所需的任何算法。然而，为了本文的目的，使用序列比较计算机程序align-2产生％序列同一性值。align-2序列比较计算机程序由genentech，inc.授权，并且源代码已经在美国版权局(华盛顿特区，20559)在用户文档中提交，其在美国版权登记号txu510087下注册。align-2程序可从加利福尼亚州南旧金山的genentech,inc.公开获得，或者可以从源代码编译。应编译align-2程序以在unix操作系统上使用，包括数字unixv4.0d。所有序列比较参数均由align-2程序设置，没有改变。

在使用align-2进行序列比较的情况下，如下计算给定(变体)序列a与、和、或相对于给定(参照)序列b的％序列同一性(或者可以表述为给定(变体)序列a具有或包含与、和、或相对于给定(参照)序列b的某一％序列同一性)：

100乘以x/y的分数

其中x是序列比对程序align-2(其中程序比对a和b)评分为相同匹配的残基数，其中y是b中总的残基数。可以理解，序列a的长度不等于序列b的长度时，a与b的％序列同一性不等于b与a的％序列同一性。

本申请中使用的术语“糖结构”表示在特定氨基酸残基处的单个、限定的n-或o-连接的寡糖。因此，术语“具有g1糖结构的抗体”表示根据kabat编号方案在约氨基酸位置297处包含天冬酰胺氨基酸残基的抗体或在fab区中包含双触角寡糖的抗体，其在寡糖的非还原端仅包含一个末端半乳糖残基。本申请中使用的术语“寡糖”表示包含两个或更多个共价连接的单糖单元的聚合糖。

术语“可开发性热点”表示多肽的氨基酸序列(例如，抗体可变结构域)内的氨基酸残基，其是翻译后修饰的，即易于发生翻译后修饰。这种翻译后修饰导致一种生物学特性(例如，在抗体可变结构域的情况下抗原结合)改变，例如，减少或丧失。

术语“翻译后修饰”表示生物合成后多肽内氨基酸残基的共价修饰。通过修饰现有的官能团或引入新的官能团，可以在氨基酸侧链上发生翻译后修饰。常见翻译后修饰为：对于ala是n-乙酰化；对于arg是脱亚氨基化、甲基化；对于asn是脱酰胺化、n-连接糖基化；对于asp是异构化；对于cys是二硫键形成、氧化、棕榈酰化、n-乙酰化、s-亚硝基化；对于gln是环化；对于glu是环化、γ-羧化；对于gly是n-豆蔻酰化、n-乙酰化；对于his是磷酸化；对于lys是乙酰化、泛素化、sumo化、甲基化、羟基化；对于met是n-乙酰化、氧化；对于pro是羟基化；对于ser是磷酸化、o-连接糖基化、n-乙酰化；对于thr是磷化、o-连接糖基化、n-乙酰化；对于trp是氧化、犬尿氨酸形成；对于tyr是硫酸化、磷酸化；对于val是n-乙酰化。

术语“抗体的结合位点”表示轻链可变结构域和重链可变结构域的对。

抗体糖基化

人抗体主要在重链ch2结构域或fab区中的约297位置(asn297)上的天冬酰胺残基上糖基化，其中具有或多或少岩藻糖基化的双触角复合寡糖(抗体氨基酸残基根据kabat，同上编号)。在每个臂中双触角糖结构可以以至多两个连续的半乳糖(gal)残基终止。臂根据与中心甘露糖残基的糖苷键表示为(1,6)和(1,3)。表示为g0的糖结构不包含半乳糖残基。表示为g1的糖结构在一个臂中含有一个或多个半乳糖残基。表示为g2的糖结构在每个臂中含有一个或多个半乳糖残基(raju,t.s.,bioprocessint.1(2003)44-53)。人恒定重链区详细报道在kabat，同上和brueggemann,m.等人,j.exp.med.166(1987)1351-1361；love,t.w.等人,methodsenzymol.178(1989)515-527。抗体fc区的cho型糖基化描述于例如routier,f.h.,glycoconjugatej.14(1997)201-207。

抗体通常包含两个所谓的全长轻链多肽(轻链)和两个所谓的全长重链多肽(重链)。全长重链和轻链多肽中的每一个含有可变结构域(可变区)(通常是全长多肽链的氨基末端部分)，其包含与抗原相互作用的结合区。全长重链和轻链多肽中的每一个包含恒定区(通常是羧基末端部分)。全长重链的恒定区介导抗体i)与携带fcγ受体(fcγr)的细胞(如吞噬细胞)或ii)携带新生儿fc受体(fcrn)(也称为brambell受体)的细胞的结合。其还介导与某些因子的结合，包括经典补体系统的因子，如组分(c1q)。全长抗体的轻链或重链的可变结构域又包含不同的区段，即四个框架区(fr)和三个高变区(cdr)。“全长抗体重链”是在n末端至c末端方向上由抗体重链可变结构域(vh)、抗体恒定结构域1(ch1)、抗体铰链区、抗体恒定结构域2(ch2)、抗体恒定结构域3(ch3)和任选地在亚类ige抗体的情况下，抗体恒定结构域4(ch4)组成的多肽。“全长抗体轻链”是在n末端至c末端方向上由抗体轻链可变结构域(vl)和抗体轻链恒定结构域(cl)组成的多肽。全长抗体链通过cl结构域和ch1结构域之间以及全长抗体重链的铰链区之间的多肽间二硫键连接在一起。

近年来已经报道，抗体的糖基化模式，即糖组成和多种连接的糖结构，对生物学性质具有强烈影响(参见例如jefferis,r.,biotechnol.prog.21(2005)11-16)。由哺乳动物细胞产生的抗体含有2-3质量％的寡糖(taniguchi,t.等人,biochem.24(1985)5551-5557)。例如，在g类抗体(igg)中这等同于小鼠源igg中的2.3个寡糖残基(mizuochi,t.等人,arch.biochem.biophys.257(1987)387-394)，以及人源igg中的2.8个寡糖残基(parekh,r.b.等人,nature316(1985)452-457)，其中通常两个位于fc区中的asn297上，剩余的在可变区中(saba,j.a.等人，anal.biochem.305(2002)16-31)。

对于不同n-或o-连接的寡糖的注释，从寡糖分子的非还原端到还原端列出各个糖残基。选择最长的糖链作为表示的基本链。n-或o-连接的寡糖的还原端是单糖残基，其直接与抗体氨基酸主链的氨基酸结合，而位于基本链还原端的相对末端的n-或o-连接的寡糖末端，被称为非还原端。

所有寡糖描述为非还原糖的名称或缩写(即gal)，然后是糖苷键(α或β)、环键(1或2)、参与键合的还原糖的环位置(2、3、4、6或8)、然后是还原糖的名称或缩写(即glcnac)的配置。各糖优选为吡喃糖。有关标准糖生物学命名法的综述，参见essentialsofglycobiologyvarki等人编辑,1999,cshl出版社。

术语“确定的糖结构”在本申请中表示糖结构，其中糖结构的非还原端的单糖残基是特定种类。术语“确定的糖结构”在本申请中表示糖结构，其中糖结构的非还原端的单糖残基被确定并且是特定种类。

翻译后易于修饰的氨基酸残基

asn和asp残基在形成环状琥珀酰亚胺中间体之前共享共同的降解途径。在后续氨基酸的主链氮对asn/asp侧链γ-羰基的亲核攻击引起asn的脱酰胺化或asp脱水后，由分子内重排导致琥珀酰亚胺的形成。亚稳态环状酰亚胺可以在其两个羰基中的任一个上水解，以不同的比例形成天冬氨酰或异天冬氨酰键，这取决于水解条件和构象限制。此外，提出了替代的降解机制，如通过主链羰基氧的亲核攻击形成环状异酰亚胺或直接水辅助水解asn至asp。本领域技术人员已知几种分析方法，主要是电荷敏感方法，如离子交换色谱法或等电聚焦，用于检测任一降解产物，即琥珀酰亚胺、asp或isoasp。最适合用于蛋白质中降解位点的定量和定位的是通过液相色谱串联质谱(lc-ms/ms)进行的分析。

wolfguy编号方案

wolfguy编号将cdr区定义为kabat和chothia定义的集合并。此外，编号方案基于cdr长度(并且部分地基于序列)注释cdr环尖端，使得cdr位置的索引指示cdr残基是否是升序或降序环的一部分。与已建立的编号方案的比较如下表所示。

表：使用chothia/kabat(ch-kb)、honegger和wolfguy编号方案的cdr-l3和cdr-h3的编号。后者具有从n末端基部到cdr峰的递增编号和从c末端cdr端开始的递减编号。kabat方案固定最后两个cdr残基，并引入字母以适应cdr长度。与kabat命名法相反，honegger编号不使用字母，并且对于vh和vl是共同的。

设计wolfguy使得结构上等同的残基(即在fv结构中保守空间定位方面非常相似的残基)尽可能用等同的索引编号。这在图1中说明。

wolfguy编号的全长vh和vl序列的实例可以在下表中找到。

表：用wolfguy、kabat和chothia编号的具有pdbid3pp4(21)的晶体结构的vh(左)和vl(右)序列。在wolfguy中，cdr-h1-h3、cdr-l2和cdr-l3仅根据长度编号，而cdr-l1根据环长度和典型聚簇成员编号。后者通过计算与不同共有序列的序列相似性来确定。在这里，我们仅给出cdr-l1编号的单个示例，因为它对于生成我们的vh-vl方向序列指纹并不重要。

二代测序(ngs)

(a)样品制备

在某些方面，本文报道的方法部分地包括从包含核酸的生物样品中扩增一个或多个感兴趣区域。对于每个感兴趣区域，扩增产生多个扩增子。

扩增在一个或多个引物对的存在下发生。引物对的第一引物包含与感兴趣区域的上游部分互补的序列，引物对的第二引物包含与感兴趣区域的下游部分互补的序列。设计引物对使其与核酸的互补链退火(即引物对的一个引物与正义链退火，引物对的一个引物与反义链退火)。可以基于待扩增的感兴趣区域改变互补序列。引物对的互补序列可包含与感兴趣区域互补的约10至约100个核苷酸。

使一个或多个引物对与包含核酸的样品接触。核酸可以是例如rna或dna。可以使用修饰形式的rna或dna。在一个示例性实施方案中，核酸是cdna。

通常，使用聚合酶链反应(pcr)进行感兴趣区域的扩增。pcr反应可在单个反应小瓶中包含样品(其包含核酸)、一个或多个引物对、聚合酶、水、缓冲液和三磷酸脱氧核苷酸(dntp)。可以根据本领域的标准方法进行pcr。作为非限制性实例，pcr反应可包括变性，然后进行约15至约30个循环的变性、退火和延伸，然后进行最终延伸。

(b)测序文库制备

在某些方面，本文报道的方法部分地包括将适体和/或索引序列连接至部分(a)中产生的每个扩增子或产物。

在一个实施方案中，通过pcr将包含适体、随机组分和/或索引序列的核苷酸序列与扩增子或产物连接。例如，可以使扩增子或产物与包含适体和索引序列的核苷酸序列接触，并进行pcr反应。然后，使该产物与包含适体的核苷酸序列接触，并进行pcr反应。所得产物是包含适体、感兴趣区域、索引序列和下游适体的核苷酸序列。或者，可以使扩增子或产物与包含适体和随机组分的核苷酸序列接触，并进行pcr反应。然后，使该产物与包含适体和索引序列的核苷酸序列接触，并进行pcr反应。所得产物是包含适体、索引序列、感兴趣区域、随机组分和下游适体的核苷酸序列。

然后对包含适体、随机组分和/或索引序列的产物或扩增子进行指数pcr。在一个实施方案中，指数pcr反应可以在单个反应小瓶中包含产物或扩增子(其包含适体、随机组分和/或索引序列)、引物、聚合酶、水、缓冲液和脱氧核苷酸三磷酸(dntp)。可以根据本领域的标准方法进行指数pcr。作为非限制性实例，指数pcr反应可包括变性，然后进行约15-30个循环的变性、退火和延伸，然后进行最终延伸。

在进行指数pcr时，扩增包含适体和/或索引序列的产物或扩增子。指数pcr产物包含适体、感兴趣区域、下游适体和索引序列。

(c)测序

在某些方面，本文报道的方法部分包括对指数pcr产物进行测序。对指数pcr产物的测序产生冗余读取。冗余读取按随机组分分组，并鉴定共有序列，使得冗余读取减少序列错误。

可以根据本领域的标准方法进行测序。优选在大规模平行测序平台上进行测序，这些测序平台中的许多是商业上可获得的，包括但不限于illumina、roche/454、iontorrent和pacbio。在示例性实施方案中，使用illumina测序。

读取可以通过索引序列分开并修剪以去除引物序列。可以通过随机组分对读取进行分组。在某些实施方案中，可以除去具有少于三个、少于四个或少于五个读取的读取组。为了消除模糊序列，可以按丰度对随机组分进行分类，并以约85％的同一性聚簇。或者，可以按丰度对随机组分进行分类，并以约65％至约95％的同一性聚簇。可以从最大丰度到最小丰度对随机组分聚簇。鉴于大多数测序错误是随机的，并且正确的序列应该比具有测序错误的变体更频繁地发生，丰度加权聚簇提供了消除最有可能由于测序错误导致的假随机组分、同时保留丰度更高(并且很可能是真正阳性)的随机组分的方法。

每个扩增子或产物的这种冗余测序允许每个扩增子或产物的错误校正。例如，通过在每个碱基位置对核苷酸进行评分和加权，为每个随机组分组产生共有序列。保留具有与相同随机组分相关的最高丰度序列相同的共有序列的序列；这个过程称为质量过滤。具体地，在每个位置，比较每个序列读取所调用的核苷酸，如果读取之间存在至少约90％的一致性，则调用共有核苷酸。如果一致性小于约90％，则在该位置的共有序列中调用“n”。

(d)与参照序列比较

在鉴定错误校正的共有序列(eccs)之后，可以将eccs与参照序列进行比较以确定一个或多个不同的存在。参照序列可以是抗体序列，其中搜索具有相同生物学特性但没有负性特征的变体，如搜索可开发性议题(热点)。

本文报道的方法

在本领域中，通常通过以下方法来鉴定备用/替代候选物：在氨基酸序列中引入突变以解决例如原始候选物的可开发性责任或对没有选择(de-selected)的抗体进行从头筛选。在第一种情况下，不能排除由于去除可开发性责任也可能影响抗体的结合和/或治疗性质。在后一种情况下，是否可以找到真正的替代候选物是值得怀疑的。

通过使用二代测序(ngs)，与先前方法相比，可测序的b细胞克隆的数量显著增加。但是，只有在早期筛选中显示出有前途特性的克隆才会被进一步探索。对于其他克隆，将简单地存储序列数据。也就是说，并非所有测序的克隆都将被表达和完全表征。

现在已经发现，在项目中获得的ngs数据的这种未使用的潜力可以用于鉴定lead候选物的一个或多个替代候选物，其中替代候选物不具有例如原始lead抗体的一种或多种可开发性责任，例如，易于发生翻译后修饰的氨基酸残基或分离的半胱氨酸残基。通过使用ngs序列信息基于氨基酸/核苷酸序列鉴定与所选候选物密切相关的抗体并且同时保持lead候选物的至少一种生物学/结合特性来实现这种鉴定和选择，即包含可开发性热点的参照抗体。

在所有方面的一个实施方案中，高度多样性文库包括在原始抗原特异性文库中，以增加文库多样性并允许更好的测序。例如，可以使用illuminainc.出售的基因组phix文库。

在所有方面的一个实施方案中，使用illumina技术进行扩增和测序步骤。在这种情况下，在扩增步骤期间，根据illumina的说明，将称为适体并且是后续测序步骤所需的特定子序列添加到核苷酸片段中。

在所有方面的一个优选实施方案中，在测序前进行两次pcr。

在一个实施方案中，使用市售的miseq试剂盒(illuminainc.)进行测序。

在所有方面的一个实施方案中，使用配对末端测序方法进行测序，其中同时测序核苷酸片段的两端。这允许更快速的测序，并且在长片段的情况下特别有用。

在所有方面的一个实施方案中，使用多重技术，使得可以在相同的运行期间对不同的样品进行测序，从而允许快速和同时分析样品/文库的许多组合。为了进行多重测序，通常在使用特异性pcr引物的扩增步骤期间添加特定序列(条形码或索引)。

例如，市售的miseq试剂盒提供配对末端测序和多重测序。

可以通过能够处理由测序产生的数据的软件来进行测序数据的分析。合适的软件工具是市售的。合适软件的一个例子是bwa(burrows-wheeleraligner)，参见lih.和durbinr.(2009)(lih.和durbinr.(2009)fastandaccurateshortreadalignmentwithburrows-wheelertransform.bioinformatics,25:1754-60)的工作。另一个合适的软件是fastqc(参见网站：www.bioinformatics.babraham.ac.uk/projects/fastqc/)，这是一种分析和控制高通量序列数据的工具。

在其他情况下，根据本文报道的方法，一个或多个共有序列特异性引物可进一步包含标签和/或适体。

当前方法在一个具体实施方案中包括以下一般步骤：

-组装配对的(illuminamiseq)读取，例如，通过计算机程序(可选地包括校正：molecularidentifiergroup-basederrorcorrection(migec)软件流水，其允许umi条形码提取和基于完整vh序列的共有构建的错误校正)；

-抗体可变结构域的提取，任选地包括校正：序列复制校正，仅考虑n≥3个cdr3簇、信号肽检测和质量评估；

-结构指导的抗体变体的聚簇和排序；和

-就其保留vh/vl配对、结合和功能的能力，相对于参照序列排序突变，任选地，排序基于矩阵并且还取决于突变的保守性。

结构指导的抗体变体的聚簇和排序(scarab)

抗体可变区变体表征

本文报道的方法基于给定的参照抗体，其中重链可变区(vh)序列和轻链可变区(vl)序列是已知的(随后表示为“参照”或“参照抗体”)。

另外，存在一组已知的vh和/或vl序列，其可被认为与参照抗体的vh和/或vl序列相关(随后表示为“变体”或“变体抗体”)，例如，衍生自在与参照抗体相同的免疫活动中获得的b细胞。参照及其变体之间的关系是/可以基于，例如，i)vh和vl序列的相同长度，ii)所有β-片层框架区的相同长度，或/和iii)所有互补决定区(cdr)的相同长度。

比对/选择各序列的标准取决于可获得的数据库。如果可获得有限数量的变体，则标准应该减低严格性，而当可获得大量变体时，标准可以/应该更严格(以便鉴定最可能的变体)。例如，整个vh和/或vl中的突变数可以用作允许小于10、小于9、小于8、小于7、小于6、小于5、小于4的标准。但必须注意的是，随着允许的突变数，变体与参照抗体不具有相同/相当的结合特性的可能性正在增加。或者，可以使用如在氨基酸或/和核酸水平上hvr3/cdr3中小于“x”个突变、所有hvr/cdr中小于“y”个突变、所有fr中小于“z”个突变、总共小于“n”个突变或其组合作为标准。

如果选择的标准是去除可开发性热点，则比对/选择标准可以是：

-在hvr/cdr中没有(游离)半胱氨酸；

-在可变结构域中没有降解倾向的asp、asn、met残基/基序。

然后使用建立的注释方案注释参照序列及其变体，例如，wolfguy抗体编号方案(bujotzek,a.等人,prot.struct.funct.bioinform.,83(2015)681-695)。这在整个方法中使用，即它用于本文报道的方法中的所有和任何位置的注释。wolfguy注释的vh参照序列及其变体的示例可以在图1中找到。

一旦基于残基索引对注释的vh和vl序列进行比对，可以在紧凑的“突变元组”方面描述变体，其仅描述相对于参照的序列不同(即，取代氨基酸的类型和位置)。使用抗体763的vh变体在下表中说明该原理。

表：参照抗体763的六种vh变体的突变元组符号(也参见图1)。突变元组是串联的一系列字符串，每个字符串指定i)参照序列中存在的氨基酸类型(1字母代码)，ii)氨基酸所在的wolfguy位置，和iii)序列变体的氨基酸类型(1字母代码)，如果它不与参照序列之一匹配。

聚簇

因为给定的一组序列变体可以是大且冗余的，所以进行聚簇以鉴定在相应氨基酸取代的数量、位置和类型方面相同或相似的变体是有意义的。为此目的，例如，可以使用成熟确立的k-medoids聚簇算法。

对于当前情况(抗体可变结构域)，k的合适下限是数据组中不同突变元组长度的数量。例如，如果要聚簇的数据组由变体(t322p)、(r306k)、(e211a，r306k)和(q102p，s103p，s125p，y196s，r306k)组成，则k的最小值应设置为3，允许对元组长度1、2和5进行分别聚簇。如果需要，可以进一步增加k的值以基于氨基酸取代的位置实现更精细的聚簇。

为了对由突变元组描述的序列变体进行基于k-medoids的聚簇，可以设计新的距离度量，其结合了氨基酸取代的抗体特异性位置以及交换的近似物理化学性质。后者使用blosum62氨基酸取代矩阵定量(henikoff,s.和henikoff,j.g.,proc.nat.acad.sci.,89(1992)10915-10919)。

这是按照以下概述完成的。

给出两个示例性突变元组(e211a，r306k)和(y293d，s295n，t322p)：

1.计算两个元组之间基于位置的距离矩阵(残基编号中的距离：293-211＝82等)：

2.挑取具有最小距离的突变对：s295n和r306k(残基编号距离为11)。

该对的距离贡献是(11+abs(blosum62(s，n)-blosum62(r，k)))²。

更新距离矩阵，以便删除所采用的对：

重复步骤(步骤2)，直到所有突变都配对。

3.如果每个元组的突变数不匹配，则保留未配对的突变(在本实施例中为t322p)。为了解释未配对突变t322p，向距离添加

(310+abs(blosum62(t,t)-blosum62(t,p)))²

根据vhwolfguy索引(411-101)，值310是理论最大距离。重复步骤(3)直到考虑所有未配对的突变。

在该实施例中，两个突变元组之间的距离为：

mutation_tuple_dist[(e211a,r306k),(y293d,s295n,t322p)]＝sqrt((11+abs(blosum62(s,n)–blosum62(r,k)))²+(82+abs(blosum62(y,d)–blosum62(e,a)))²+(310+abs(blosum62(t,t)–blosum62(t,p)))²)＝sqrt(12²+84²+316²)≈327.194

突变风险评分

突变风险评分是定量由上述突变元组指定的抗体变体将失去参照抗体显示的功能的风险的手段(其中该功能通常是对给定靶/抗原的结合亲和力)。突变风险评分总是取负值，较大的负值表示较大的功能丧失风险。

突变风险评分结合blosum62矩阵，根据所产生的生化特性(如电荷、疏水性和大小)变化评级氨基酸取代的严重性。此外，突变风险评分包含抗体可变区位置特异性加权因子，以解释发生氨基酸取代的位置。例如，属于通常参与抗原结合的cdr的残基的权重高于不太可能参与抗原结合的外周残基。

对于由xiposiyi形式的n个突变串组成的给定突变元组，突变风险评分计算如下：

下表指定了vh结构域保守位置的抗体特异性权重。未在此表中明确给出的残基用值1加权。残基用wolfguy编号方案编号。

表：框架(左)和cdr区(右)的vh结构域的保守位置的抗体特异性权重。

abangle距离

除了定量给定变体的突变风险之外，评估变体是否可能保留参照抗体的vh-vl方向是有意义的。目的是获得保留与参照抗体相同的抗原结合特性和稳定性的抗体变体。为此目的，使用由dunbar等人(prot.eng.des.sel.26(2013)611-620)定义的六个abangle方向量度hl、hc1、lc1、hc2、lc2和dc(五个角度和一个线性距离量度)来表征vh-vl方向。使用bujotzek等人(bujotzek,a.等人,prot.struct.funct.bioinform.,83(2015)681-695)描述的基于机器学习的方法预测参照抗体及其变体的各个abangle值。在该方法中，从vh和vl结构域之间的结构域界面上影响残基的序列指纹预测vh-vl方向的参数。

abangle的概念

当在任何两个基于氨基酸的结构之间进行比较时，通常使用基于距离的度量，如等同原子的均方根偏差(rmsd)。

为了表征任何两个三维对象之间的方向，需要定义：

-每个对象的参照框架。

-测量关于方向参数的轴。

-描述和定量这些参数的术语。

abangle的概念是一种使用五个角度(hl、hc1、lc1、hc2和lc2)和距离(dc)以一致和绝对意义完全表征vh-vl方向的方法。抗体的一对可变结构域vh和vl统称为抗体fv片段。

在第一步中，从数据库(例如蛋白质数据库，pdb)提取抗体结构。将chothia抗体编号(chothia和lesk，1987)应用于每个抗体链。成功编号的链配对形成fv区域。这通过应用约束重链的h37位置cα坐标(重链可变结构域位置37处的氨基酸残基的α碳原子)必须在轻链的l87位置cα坐标的内来完成。使用cdhit(li,w.和godzik,a.bioinformatics,22(2006)1658–1659)产生非冗余的抗体组，在99％的fv区框架上应用序列同一性截止值。

重链结构域和轻链结构域中结构上最保守的残基位置用于定义结构域位置。这些位置表示为vh和vl核心组。这些位置主要位于框架的β-链上，并形成每个结构域的核心。核心组位置如下表所示：

核心组位置用于将参照框架登记到抗体fv区结构域上。

使用例如cdhit对非冗余数据组中的vh结构域进行聚簇，在结构域中的框架位置上应用80％的序列同一性截止值。从30个最大簇的每一个中随机选择一种结构。该结构域组在vh核心组位置上比对，例如使用mammoth-mult(lupyan,d.等人,bioinf.21(2005)3255–3263)。从该比对中，提取对应于β-片层界面中的八个结构上保守的位置h36、h37、h38、h39、h89、h90、h91和h92的cα坐标。通过得到的240个坐标拟合平面。对于vl结构域，位置l35、l36、l37、l38、l85、l86、l87和l88用于拟合平面。

上述步骤允许将两个参照框架平面绘制到任何fv结构上。因此，测量vh-vl方向可以等同于测量两个平面之间的方向。为了完全这样做，绝对意义上需要至少六个参数：距离、扭转角度和四个弯曲角度。必须针对连接平面的一致定义的向量测量这些参数。该向量在下面表示为c。为了鉴定c，将参照框架平面登记到如上所述的非冗余组中的每个结构上，并且将网格放置在每个平面上。因此，每个结构具有等同的网格点，因此具有等同的vh-vl网格点对。对每个结构中的每对网格点测量euclidean距离。鉴定其间隔距离中具有最小方差的点对。连接这些点的向量定义为c。

使用向量完全定义坐标系，该向量位于每个平面中并且在对应于c的点中央。h1是平行于vh平面的第一主组分的向量，而h2平行于第二主组分。l1和l2类似地定义在vl结构域上。hl角是两个结构域之间的扭转角。hc1和lc1弯曲角度等同于一个结构域相对于另一个结构域的倾斜状变化。hc2和lc2弯曲角描述了一个结构域与另一个结构域的扭曲状变化。

为了描述vh-vl方向，使用六个量度，距离和五个角度。这些在坐标系中定义如下：

-c的长度，dc

-关于c测量的从h1到l1的扭转角hl，

-h1和c之间的弯曲角hc1，

-h2和c之间的弯曲角hc2，

-l1和c之间的弯曲角lc1，和

-l2和c之间的弯曲角lc2。

术语“vh-vl方向”根据其在本领域中的通常含义使用，如本领域技术人员将理解的(参见，例如，dunbar等人,prot.eng.des.sel.26(2013)611-620；和bujotzek,a.,等人,proteins,struct.funct.bioinf.,83(2015)681-695)。它表示vh和vl结构域相对于彼此如何定向。

因此，vh-vl方向由下式定义

-c的长度，dc，

-关于c测量的从h1到l1的扭转角hl，

-h1和c之间的弯曲角hc1，

-h2和c之间的弯曲角hc2，

-l1和c之间的弯曲角lc1，和

-l2和c之间的弯曲角lc2，

其中参照框架平面通过以下登记：i)比对与vh的八个位置h36、h37、h38、h39、h89、h90、h91和h92相对应的cα坐标并通过它们拟合平面，和ii)比对与vl的八个位置l35、l36、l37、l38、l85、l86、l87和l88相对应的cα坐标并通过它们拟合平面，iii)放置在每个平面上，由此每个结构具有等同的网格点和等同的vh-vl网格点对，和iv)测量每个结构中每对网格点的euclidean距离，由此向量c以其间隔距离的最小方差连接点对，

其中h1是平行于vh平面的第一主组分的向量，h2是平行于vh平面的第二主组分的向量，l1是平行于vl平面的第一主组分的向量，l2是平行于vl平面的第二主分量的向量，hl角是两个结构域之间的扭转角，hc1和lc1是等同于一个结构域相对于另一个结构域的倾斜状变化的弯曲角，并且hc2和lc2弯曲角等同于一个结构域与另一个结构域的扭曲状变化。

根据chothia索引确定这些位置。

选择向量c以在非冗余结构组上具有最保守的长度。距离dc是这个长度。它的平均值为标准偏差仅为

下表列出了随机森林算法鉴定的对于确定vh-vl方向的每个角度量度是重要的前10个位置和残基。

表：x代表可变l36v/l38e/l42h/l43l/l44f/l45t/l46g/l49g/l95h

(更详细的信息参见dunbar,j.等人,proteineng.des.sel.,26(2013)611-620和bujotzek,a.等人,prot.struct.funct.bioinf.83(2015)681-695，其全部内容通过引用并入本文)。

从而提供了预测vh-vl-结构域间方向的基于快速序列的预测器。根据六个绝对abangle参数描述vh-vl方向，以精确地分离vh-vl方向的不同自由度。两个序列/结构之间的偏差由氨基酸主链的羰原子的平均均方根偏差(rmsd)表示。

在本文报道的所有方面的一个实施方案中，vh/vl方向如下确定：

-从多个变体抗体序列和针对参照抗体产生fv片段，

-基于抗体fv片段的序列指纹，确定参照fv片段和多个变体抗体fv片段的每个变体抗体fv片段的vh-vl方向，

-鉴定/选择/获得/排序那些与参照抗体的vh-vl方向相比在vh-vl方向上具有最小不同的变体抗体fv片段。

在一个实施方案中，该方法包括以下步骤：

-鉴定/选择/获得/排序那些与参照抗体的vh-vl-结构域间角相比在vh-vl-结构域间角上具有最高(结构)相似性的那些变体抗体fv片段。

在一个实施方案中，vh-vl-界面残基是氨基酸残基，其侧链原子具有相对链的相邻原子，其距离小于或等于(在至少90％所有叠加的fv结构中)。

在一个实施方案中，该组vh-vl界面残基包含残基210、296、610、612、733(根据wolfguy索引编号)。

在一个实施方案中，该组vh-vl界面残基包含残基199、202、204、210、212、251、292、294、295、329、351、352、354、395、396、397、398、399、401、403、597、599、602、604、609、610、612、615、651、698、733、751、753、796、797、798(根据wolfguy索引编号)。

在一个实施方案中，该组vh-vl界面残基包含残基197、199、208、209、211、251、289、290、292、295、296、327、355、599、602、604、607、608、609、610、611、612、615、651、696、698、699、731、733、751、753、755、796、797、798、799、803(根据wolfguy索引编号)。

在一个实施方案中，该组vh-vl界面残基包含残基197、199、202、204、208、209、210、211、212、251、292、294、295、296、327、329、351、352、354、355、395、396、397、398、399、401、403、597、599、602、604、607、608、609、610、611、612、615、651、696、698、699、731、733、751、753、755、796、796、797、798、799、801、803(根据wolfguy索引编号)。

在一个实施方案中，该组vh-vl界面残基包含残基197、199、202、204、208、209、210、211、212、251、292、294、295、296、327、329、351、352、354、355、395、396、397、398、399、401、403、597、599、602、604、607、608、609、610、611、612、615、651、696、698、699、731、733、751、753、755、796、797、798、799、801、803(根据wolfguy索引编号)。

在一个实施方案中，鉴定/选择/获得/排序基于关于vh-vl方向的前80％变体抗体fv片段。

在一个实施方案中，鉴定/选择/获得/排序是关于vh-vl方向的前20％变体抗体fv片段。

在一个实施方案中，通过计算六个abanglevh-vl方向参数确定vh-vl方向。

在一个实施方案中，通过使用随机森林方法计算abanglevh-vl方向参数确定vh-vl方向。

在一个实施方案中，通过对每个abangle使用一种随机森林方法计算abanglevh-vl方向参数确定vh-vl方向。

在一个实施方案中，通过使用随机森林模型计算习惯性扭转角、四个弯曲角(每个可变结构域两个)和vh和vl的枢轴长度(hl、hc1、lc1、hc2、lc2、dc)确定vh-vl方向。

在一个实施方案中，仅用复合抗体结构数据训练随机森林模型。

在一个实施方案中，最高结构相似性是最低平均均方根偏差(rmsd)。在一个实施方案中，rmsd是针对非人或亲本抗体的氨基酸残基的所有calpha原子(或羰原子)对变体抗体的相应calpha原子测定的rmsd。

在一个实施方案中，使用模型确定vh-vl方向，该模型从在共有vh或vl框架上比对的模板结构组装，随后在共有fv框架上进行vh-vl重新定向。

在一个实施方案中，使用在完整fv(vh和vl同时)的β-片层核心上比对的模型确定vh-vl方向。

在一个实施方案中，其中抗体fv片段在共有fv框架上重新定向的模型用于确定vh-vl方向。

在一个实施方案中，使用模型确定vh-vl方向，该模型使用在共同的共有fv框架上比对的模板结构并且未以任何形式调节vh-vl方向。

在一个实施方案中，使用模型确定vh-vl方向，该模型从在共有vh或vl框架上比对的模板结构组装，随后使用基于相似性在所选择的vh-vl方向模板结构上进行vh-vl重新定向。

一旦确定了参照抗体及其变体的abangle值，就可以根据它们与参照抗体的vh-vl方向的相似性对变体进行排序。为了比较abangle空间中的相似性，我们将一组abangle参数定义为元组然后两组abangle参数之间的euclidean距离是

由于distabangle交融角(hl、hc1、lc1、hc2、lc2)与线性(dc)距离量度，它们不能被解释为角空间中的事实距离，而仅用作抽象距离量度。

过滤

根据scarab的应用，可以针对某些序列特征(例如，去除参照抗体中存在的潜在糖基化位点)或责任(liability)(例如，引入参照抗体中不存在的新的游离半胱氨酸残基)筛选突变元组，可以相应地应用过滤器。

实施例a

b细胞克隆结合物的分离和性质(bcc结合物，结合elisa)

在第3次免疫后第6天，从免疫的兔r176中收获15ml血液，分离108.6×10e6个pbmc。对于vh的ngs，4.2×10e6pbmc重悬于rlt缓冲液中，而剩余的pbmc进一步加工(巨噬细胞耗尽，富集抗原)用于通过b细胞克隆方法分离抗原特异性b细胞克隆(参见例如seeber,s.等人,plosone,9(2014)e86184)。

总之，在这个b细胞克隆方法中，在巨噬细胞/klh-结合物耗尽后沉积并培养动物r176的bleed1的504个单个b细胞，在抗原富集后沉积并培养840个单个b细胞(lrp8，低密度脂蛋白受体相关蛋白8，uniprotkb-q14114)。

在巨噬细胞耗尽后，初步筛选鉴定了279个分泌igg的b细胞克隆。在这些克隆中，4个上清液与抗原结合。在抗原富集后，可以鉴定出341个igg阳性上清液。其中55个b细胞上清液与抗原结合(见下表)。

表：通过b细胞克隆鉴定的结合物的分离和性质

ngs数据库中参照抗体变体(bcc结合物变体)的鉴定

选择通过b细胞克隆鉴定的共4个结合物用于在ngs库中鉴定vh变体；在抗原特异性富集后通过b细胞克隆分离所有克隆，均显示对抗原的特异性(ec50低于20ng/ml)，其中两个显示与鼠抗原的交叉反应性(ec50低于20ng/ml)(参见下表)。

表：选择用于ngs变体分析的b细胞克隆的性质

分析来自pbmc和来自抗原富集的b细胞的ngs库，用于鉴定vh变体，其在整个vh中与参照b细胞结合物的vh相比具有≤6个氨基酸置换(fr1至fr4，允许框架和hvr/cdr中的突变)。可以鉴定共441个不同的vh变体，其中对于4种结合物和递送变体的ngs样品具有不同的分布，如下表所示。

表：ngs样品中鉴定的相关vh

结构指导的抗体变异聚簇和排序(scarab)

如上所述，已经对鉴定的变体进行了聚簇。结果显示在下表中。注意，表示聚簇medoids的变体，即聚簇中的变体，其相对于聚簇中所有其他变体的平均dist_abangle是最小的，已经用灰色背景突出显示。通过使用距离相关函数，已经在本文报道的方法中扩展了通常已知的基于k-medoids的聚簇。这些变体可以被解释为给定变体聚簇的代表或示例。

抗体755的vh变体(40个聚簇)

抗体763的vh变体(4个聚簇)

抗体770的vh变体(10个聚簇)

抗体776的vh变体(7个聚簇)

为了最终选择用于dna合成和用亲本vk进行hek瞬时转染的ngs变体，选择具有多于1个氨基酸置换的所有“中心点”vh，其导致ab角距离≤0.5并且没有游离半胱氨酸。已经选择共31个vh用于克隆755，4个用于克隆763，10个用于克隆770，9个用于克隆776(参见下表)。如下表所示，选择的变体通过pbmc库或抗原富集的pbmc库递送。

表：用于基因合成和用亲本vk瞬时转染的ngsvh变体的最终选择。

ap：淘选细胞库后；bp：淘选前的pbmc细胞库

基于剂量反应曲线的ngs变体的结合分析

将变体vh和亲本vl质粒瞬时共转染到hek293细胞中。另外，还转染参照b细胞克隆并用作参照。纯化上清液后，如下文实验部分所述，分析所有克隆与人和鼠抗原的结合。基于ec50的分析在不同情形一式两份进行，以保证统计准确性。

图3显示人和鼠抗原结合的相关图，显示参照抗体(淘选后通过筛选鉴定的结合物)和由ngs选择的各个克隆。ngs变体和bcc参照的所有生化和突变评分数据合并在下表中。图数据显示关于结合行为和相对排序良好的相关性(参见表数据)。大多数变体(60-80％)显示与人抗原结合的ec50值，与相关对照相当，并且一些的ec50值甚至略微改善。对于与鼠抗原呈现交叉反应性的那些克隆，对于与鼠抗原结合的ec50值观察到相同的结果。在pbmcngs库中(富集前)鉴定了bcc763的变体，并且80％的变体显示出与参照相当的结合特性；对于bcc755和bcc776，从富集的b细胞库中回收了大多数具有与参照相当的行为的变体，但仍然可以从总pbmcngs库中获得一些好的结合物。从富集库的ngs库中回收bcc770的变体。可以看出，对于每种参照抗体，可以用本文报道的方法鉴定具有较低ec50值的变体抗体。

表：通过与人抗原的ec50值顺序(第一个最低，最后一个最高)，合并ngs变体和bcc参照的生化和突变评分数据。

ap：淘选细胞库后；bp：淘选前的pbmc细胞库

因此，通过该步骤，可以使用与所述分离的抗原特异性b细胞克隆相当(或甚至改善)的结合特性鉴定抗原特异性结合物。这已通过dna合成、重组表达和基于序列鉴定的变体的生化分析证明。这为ngs数据的全新应用开辟了道路。

实施例b

具有可开发性热点的b细胞克隆(bcc)结合物的ngs变体

使用本文报道的方法在ngs库中鉴定总共7种b细胞克隆结合物克隆相关的结合物；在hu-cdcp1特异性富集(富集类型如下表所示)后，通过b细胞克隆分离所有克隆，所有克隆均显示对hu-cdcp1的特异性(ec50/ic50abs(ng/ml)范围低于200ng/ml)并且所有vh在hcdr中都有半胱氨酸或n-糖基化位点。

表：选择用于ngs变体分析的b细胞克隆的性质

分析来自pbmc和来自抗原富集的b细胞的ngs库，用于鉴定与参照b细胞结合物的vh相比在整个vh(fr1至fr4)中具有≤11个氨基酸取代的vh变体。那些具有改善的可开发性特性的vh同源变体(在hcdr中不再有cys和/或n-糖基化位点点)是基因合成的，在hek细胞中与亲本轻链共转染，比较表达的抗体与bcc参照，评估其结合特性。

基于剂量反应曲线的ngs变体的结合分析

将变体vh和亲本vl质粒瞬时共转染到hek293细胞中。另外，转染七种亲本抗体并用作参照。纯化上清液后，如实施例部分所述，分析所有克隆与人cdcp1抗原的结合。

图4显示与相应的亲本克隆相比，ngs变体与人cdcp1的结合。对于每种抗体，测试了不同数量的ngs序列变体。可以鉴定每个克隆的至少一个变体，其显示与参照抗体相同范围的ec50值(用*标记)。

在下表中，显示了针对每个bcc克隆鉴定的vh变体、提供变体的ngs样品的b细胞来源、整个vh中氨基酸取代的总数和绝对ec50/ic50值。

表：鉴定的具有改善计算机可开发性性质的vh变体：提供变体的ngs样品的b细胞来源、整个vh中氨基酸取代的总数和绝对ec50/ic50值。

来自ngs库中发现的确认结合物的cdrh3序列显示出非常不同的特征，为序列分类提供了基础。一些“最佳”结合物在cdrh3区显示出强的同源性。已经发现ngs谱库可以用于找到这种良好结合物的变体。

具有足够的测序深度和优化的归一化条件的分析是这种方法的基础。最重要的是，必须在dna水平上分析复杂的序列多样性，以将具有相当的特性的序列组合在一起，其可能具有相同的系统发生起源。特别是对于兔，不仅仅是使用体细胞超突变，而且在克隆扩增期间也进行基因转换，使得很难使该分组能够鉴定克隆相关的vh。

用本文报道的方法筛选ngs序列库与上述四种bcc结合物具有相同的cdrh3序列的vh变体。在dna水平上对完整vh区的分析显示，除了完全相同的vh之外，可以通过cdrh3外的v区上的大量突变，与参照bcc不同来鉴定变体(参见下表)。序列的比对表明突变发生在整个序列的各种不同位置，并且没有集中到某个区域(数据未显示)。

表：在其vh内选择的cdrh3序列和变体的详细分析。

除了具有相同cdrh3(和vh中的突变)的序列之外，还可以筛选ngs库以鉴定具有与参照bcc结合物的cdrh3区高度同源的cdrh3区的变体。这可以通过将结合物的cdrh3与总ngs库比对并选择具有高度同源性的序列(例如肽水平上最多一个突变)来完成。下表显示了用“最佳”结合物9-11的cdrh3序列完成比对的提取物。在ngs库中发现的cdrh3序列s1-s25与这些“最佳”结合物密切相关。

表：与相同长度和高度同源性的cdr3的提取物(s1-s25)比对的鉴定的结合物9-11的肽cdr3序列。

如上所述，在ngs样品中在多于一种动物中发现了四种bcccdrh3。在先前的研究中已经表明，免疫后在动物中发现更多共享序列cdr3，表明这些序列是抗原特异性的(galson,j.d.等人,crit.rev.immunol.35(2015)463-478)。

从以上可以看出，ngs产生的数据与来自bcc的序列数据的组合可用于鉴定参照抗体的替代抗原特异性变体抗体。

可以筛选ngs数据中与，即，bcc结合物相比，具有相似或相同cdrh3但在vh的其他区域内具有更高突变率的序列，以找到具有改善性质的抗体。

如果使用表达共同轻链的转基因动物进行免疫，则仅对vh-库的分析就足够了。在其他转基因模型或野生型动物中，需要鉴定vh/vl对为属于一起并且二者以相同的方式有助于抗原特异性。为此，可以使用多种方法，范围从单细胞分选组合单细胞克隆至特定rna捕获。例如，融合pcr非常适合与umi纠错方法组合。通过物理连接来自每个单细胞的α和β(或重链和轻链)转录物来保留配对链信息。转录物的融合可以通过(多重)重叠-延伸pcr完成。

提供以下实施例和附图以帮助理解本发明，本发明的真实范围在所附权利要求中阐述。应理解，可以在不脱离本发明精神的情况下对所述步骤进行修改。

附图说明

图1参照抗体763的vh(上)和vl(下)序列及其vh结构域的六个变体。框架和cdr分类遵循wolfguy命名法。在vh变体中，关于参照的氨基酸取代以浅灰色显示。cdr编号是灰色阴影。

图2参照抗体763的vh(上)和vl(下)序列及其vh结构域的六个变体。形成vh-vl方向指纹的一部分的残基已经用灰色背景标记。与参照抗体相比，该区域中的氨基酸取代可能诱导vh-vl方向的改变。cdr编号是灰色阴影。

图3ec50(m)相关性图；所有ngs变体的人vs鼠lrp8结合。为对照、通过筛选和淘选鉴定的克隆(红色和蓝色)和由ngs鉴定的克隆(灰色)作图；a：bcc763的变体，b：bcc776的变体，c：bcc770的变体，d：bcc755的变体。

图4绝对ec50[nm]值显示所有ngs变体(白色条)与人cdcp1的结合。亲本对照以黑色显示。成功的ngs变体标记有(*)。na＝不可获得，意味着由于变体的弱的结合，不能从结合曲线得到ec50值。a：cdcp1_105的变体；b：cdcp1_223的变体；c：cdcp1_236的变体；d：cdcp1_284的变体；e：cdcp1_212的变体；f：cdcp1_088的变体；g：cdcp1_234的变体。

图5bcc和ngs工作流程的方案。

实施例

实施例1

兔的免疫

人lrp8的klh缀合物用于免疫新西兰白兔。用500μg完全弗氏佐剂乳化的免疫原免疫每只兔，在第0天通过皮内应用，并在第7、14、28、42天通过交替的肌内和皮下应用，每次500μg。此后，兔每月接受500μg的皮下免疫，并在免疫后7天取小样本血液用于测定血清滴度。在免疫的第3、第4和第5个月(免疫后5-7天)取较大的血液样本(估计总血液量的10％)，并分离外周单核细胞，将其用作b细胞克隆过程中抗原特异性b细胞的来源。

实施例2

血清滴度的测定(elisa)

将生物素化的人lrp8以pbs中0.5μg/ml固定在96孔链霉亲和素包被的平板上，100μl/孔，然后用2％croteinc的pbs溶液，200μl/孔，封闭平板。然后施加0.5％croteinc的pbs溶液中的100μl/孔系列稀释的抗血清，一式两份。用hrp缀合的驴抗兔igg抗体(jacksonimmunoresearch/dianova,目录号711-036-152；1/16000)进行检测，各自在0.5％croteinc的pbs溶液中稀释，100μl/孔。对于所有步骤，将板在37℃下孵育1小时。在所有步骤之间，将板用0.05％tween20的pbs溶液洗涤3次。通过加入100μl/孔的bmbluepod(过氧化物酶)-可溶性底物(rochediagnosticsgmbh,mannheim,germany)生成信号；加入1mhcl，100μl/孔终止。在450nm处读取吸光度，而690nm作为参照。滴度定义为产生最大信号的一半的抗血清的稀释度。

实施例3

兔外周血单个核细胞(pbmc)的分离

从免疫的野生型兔(nzw)中取血液样本。含有edta的全血用1xpbs(paa,pasching,austria)稀释两倍，然后根据制造商的说明书使用哺乳动物淋巴细胞(lympholytemammal)(cedarlanelaboratories,burlington,ontario,canada)进行密度离心。用1xpbs洗涤pbmc两次。

实施例4

巨噬细胞/单核细胞的耗尽

将pbmc接种在无菌klh包被的sa-6孔平板上以通过非特异性粘附耗尽巨噬细胞和单核细胞并除去与klh结合的细胞。每个孔最多填充4ml培养基和来自免疫兔的多至6x10e6pbmc，并使其在37℃和5％co2下结合1小时。将上清液中的细胞(外周血淋巴细胞(pbl))用于抗原淘选步骤。

实施例5

b细胞的富集

将无菌链霉亲和素包被的6孔平板(microcoat，bernried，germany)用2μg/ml生物素化klh蛋白或生物素化lrp8/cdcp1蛋白的pbs溶液在室温下包被3小时。在淘选步骤之前，将这些6孔平板用无菌pbs洗涤三次。用每4ml培养基中多至6×10e6个pbl接种包被的板，并允许其在37℃和5％co2下结合1小时。通过用1xpbs仔细洗涤孔1-2次除去非贴壁细胞。在37℃和5％co2下通过胰蛋白酶将剩余的粘附细胞分离10分钟。用el-4b5培养基终止胰蛋白酶化。将细胞保持在冰上直至免疫荧光染色。

el-4b5培养基

补充有10％fcs(hyclone，logan，ut，usa)、2mm谷氨酰胺、1％青霉素/链霉素溶液(paa，pasching，austria)、2mm丙酮酸钠、10mmhepes(panbiotech，aidenbach，germany)和0.05mmβ-巯基乙醇(gibco,paisley,scotland)的rpmi1640(panbiotech，aidenbach，germany)。

实施例6

免疫荧光染色和流式细胞术

抗igg抗体fitc缀合物(abdserotec，düsseldorf，germany)用于单细胞分选。对于表面染色，将用耗尽步骤和富集步骤预处理的b细胞(实施例4和5)与抗-igg抗体fitc缀合物在pbs(磷酸缓冲盐溶液)中孵育，在4℃下在黑暗中孵育45分钟。染色后，用冰冷的pbs洗涤细胞两次。最后，将标记的b细胞重悬于冰冷的pbs中，并立即进行facs分析。在facs分析之前加入浓度为5μg/ml的碘化丙啶(bdpharmingen,sandiego,ca,usa)以区分死细胞和活细胞。

配备有计算机和facsdiva软件(bdbiosciences,usa)的bectondickinsonfacsaria用于单细胞分选。

实施例7

b细胞培养

根据seeber等人描述的方法进行单个分选的b细胞的培养(seeber,s.等人,plosone,9(2014)e86184.)。简而言之，将单个分选的兔b细胞在含有200μl/孔el-4b5培养基的96孔板中、在37℃在孵育箱中孵育7天，所述el-4b5培养基含有pansorbin细胞(1：100,000)(calbiochem(merck),darmstadt,germany)、5％兔胸腺细胞上清液(microcoat,bernried,germany)和γ-照射的鼠el-4b5胸腺瘤细胞(5×10e5细胞/孔)。取b细胞培养上清液用于筛选，立即收获剩余的细胞，并在-80℃下在100μlrlt缓冲液(qiagen，hilden，germany)中冷冻。

实施例8

酶联免疫吸附试验(elisa)

人抗原：

将抗原、生物素化人lrp8与含有浓度为250ng/ml的抗lrp8抗体的5μl样品在总体积为25μl的0.5％bsa和0.05％tween的pbs溶液中、在384w微量滴定板(maxisorb(withstreptavidin,nunc)中孵育。在25℃孵育1.5小时后，通过用90μlpbs洗涤6次除去未结合的抗体(吹打和抽吸)。通过与pod缀合的抗兔抗体(ecl抗兔igg-pod，目录号na9340v；pod＝过氧化物酶)检测抗原-抗体复合物。加入35μlpod-底物3,3',5,5'-四甲基联苯胺(tmb；piercenet,目录号34021)20-30分钟后，在370nm处测定光密度。使用graphpadprism6.0软件，用四参数逻辑模型计算ec50值。

鼠抗原：

将抗原、生物素化鼠lrp8与含有浓度为250ng/ml的抗lrp8抗体的5μl样品在总体积为25μl的0.5％bsa和0.05％tween的pbs溶液中、在384w微量滴定板(maxisorb(withstreptavidin,nunc)中孵育。在25℃孵育1.5小时后，通过用90μlpbs洗涤6次除去未结合的抗体(吹打和抽吸)。通过与pod缀合的抗兔抗体(ecl抗兔igg-pod，目录号na9340v)检测抗原-抗体复合物。加入35μlpod-底物3,3',5,5'-四甲基联苯胺(tmb；piercenet,目录号34021)20-30分钟后，在370nm处测定光密度。使用graphpadprism6.0软件，用四参数逻辑模型计算ec50值。

实施例9

用于slic克隆的v结构域的pcr扩增

根据制造商的方案，使用nucleospin8/96rna试剂盒(macherey&nagel；目录号740709.4,740698)从b细胞裂解物(重悬于rlt缓冲液(qiagen，目录号79216)中)制备总rna。使用60μl无rnaase的水洗脱rna。根据制造商的说明使用superscriptiiifirst-strandsynthesissupermix(invitrogen,目录号18080-400)和寡dt-引物、使用6μlrna、通过逆转录酶反应产生cdna。所有步骤均在hamiltonmlstarsystem上进行。使用4μlcdna、使用accuprimesupermix(invitrogen,目录号12344-040)扩增免疫球蛋白重链和轻链可变结构域(vh和vl)，最终体积为50μl，使用引物rbhc.up和rbhc.do(用于重链)、以及rblc.up和rblc.do(用于轻链)：

rbhc.upaagcttgccaccatggagactgggctgcgctggcttc(seqidno:30)

rbhc.doccattggtgagggtgcccgag(seqidno:31)

rblc.upaagcttgccaccatggacaygagggcccccactc(seqidno:32)

rblc.docagagtrctgctgaggttgtaggtac(seqidno:33)

所有正向引物对对于(分别为vh和vl的)信号肽具有特异性，而反向引物对对于(分别为ch1和cl的)恒定区具有特异性。rbvh+rbvl的pcr条件如下：94℃热启动5分钟；35个循环：94℃，20秒；在70℃，20秒；68℃，45秒；在68℃下最终延伸7分钟。

将50μlpcr溶液中的8μl上样到48e-gel2％(invitrogen，目录号g8008-02)上。使用nucleospinextractii试剂盒(macherey&nagel；目录号740609250)根据制造商的方案纯化阳性pcr反应，并在50μl洗脱缓冲液中洗脱。所有纯化步骤在hamiltonmlstarletsystem上进行。将5μl纯化的vh和vlpcr溶液用于dna测序。

实施例10

来自pbmc和抗原富集b细胞的ngsvh-pcr

将4.2×10e6个pbmc和1.2×10e6抗原富集b细胞重悬于300μlrlt缓冲液(qiagen；目录号79216)中。根据制造商的方案，使用rneasymini或micro试剂盒(qiagen；目录号74134)从b细胞裂解物制备总rna。对于pbmc和抗原富集b细胞，分别在50μl和30μl无rnase的水中洗脱rna。根据制造商的说明书，使用superscriptiiifirst-strandsynthesissupermix(invitrogen，目录号18080-400)和寡dt-引物、使用6μlrna、通过逆转录酶反应产生cdna。

使用50-80ngcdna扩增免疫球蛋白重链可变结构域(vh)，其中在50μl的最终体积中使用accuprimesupermix(invitrogen，目录号12344-040)，使用引物rbhcfinal_fs.up和rbhc_shortch1_fs2.do：

rbhcfinal_fs.upatggagactgggctgcgctggcttc(seqidno:34)

rbhc_shortch1_fs2.dogggaagactgatggagc(seqidno:35)

正向引物对信号肽vh具有特异性，而反向引物对恒定区具有特异性。pcr条件如下：94℃热启动3分钟；22个循环：94℃，20秒；在68℃，20秒；68℃，40秒；在68℃下最终延伸5分钟。对每个细胞库样品总共进行6次pcr反应。

将一个pcr反应中的8μl上样到12e-gel2％(invitrogen，目录号g521802)上。根据制造商的方案，使用nucleospinextractii试剂盒(macherey&nagel；目录号740609)用一个柱分别针对2个b细胞文库(pbmc文库；抗原富集b细胞文库)的所有pcr反应进行纯化，在50μl洗脱缓冲液中洗脱。将5μl纯净的vhpcr溶液用于dna-miseq测序。

实施例11

用于ngs测序的模板准备

配对末端运行2x300碱基：样品的最小dna量：100ng，良好500ng。

在illumina的miseq上进行ngs测序。在ampurexp珠上纯化后，在dna1000agilentbioanalyzer芯片上评估pcr模板。使用truseqnanodna样品制备试剂盒根据制造商的方案进行文库制备。

使用qpcr技术定量最终文库。根据kapasybrfastqpcr方案制备qpcr反应，并使用rochelightcycler480运行。合并样品并与phix对比。

更详细地，通过使用illumina测序引物的配对末端illuminamiseq测序运行来分析文库。

在开始实验之前，将所有试剂在室温下解冻。将试剂小盒在水浴中解冻。将小盒倒置几次以确保试剂的混合，并且通过在工作台上击打小盒来移除所有气泡。通过将200μl1mnaoh加入800μl实验室级别水中制备1ml0.2mnaoh。将制备的溶液涡旋、离心并储存在冰上。将流动池转移至室温，并用实验室级别水仔细洗涤，使用kimtech精密擦拭纸干燥并按照说明书插入测序仪中。将5μl4nmdna文库池与新鲜稀释的0.2mnaoh混合，短暂涡旋并在台式离心机上离心。将溶液在室温下孵育5分钟，加入990μl预冷的ht1并通过短暂涡旋混合。将得到的20μm变性文库的1mmnaoh溶液储存在冰上直至进一步使用。为了获得600μl12pm文库，用240μl预冷的ht1稀释360μl20pm变性文库，倒置数次以混合，然后脉冲离心。将得到的12pm文库储存在冰上直至进一步使用。为了制备4nmphix文库，将2μl10nmphix文库对照加入3μl含有0.1％tween20的10mmtris-hcl，ph8.5中。将稀释液短暂涡旋并脉冲离心。为了使phix对照变性，将5μl新鲜稀释的0.2mnaoh加入到5μl制备的4nmphix文库中，短暂涡旋并在台式离心机上离心。将溶液在室温下孵育5分钟，加入990μl预冷的ht1并通过短暂涡旋混合。为了获得12.5pmphix文库，将375μl20pm变性phix溶液与225μl预冷的ht1混合，短暂涡旋并脉冲离心。将520μl12pm样品文库和80μl12.5pmphix组合以产生具有15％phix添加(spike-in)对照的文库。将组合的样品文库和phix对照储存在冰上直至上样到miseq试剂小盒上。

实施例12

用于鉴定克隆相关vh变体的ngs序列的生物信息学分析

来自illuminamiseq的数据由每个序列的两对且通常是重叠的读取组成。使用以下工作流程分析了所有数据：

通过flash组装配对读取(任何其他软件工具也应有效)

○flash可从http://ccb.jhu.edu/software/flash/获得

○使用flashv1.2.10，具有默认参数(defaultparameters)(没有outies，最小重叠10bp，最大重叠65bp)

○结果：没有illumina适体的重叠序列

抗体可变结构域的提取：

○将dna翻译成所有6个orf

○对于每个orf：

■通过与共有fw1序列比较搜索fw1的肽序列并计算差异。如果该值高于定义的阈值，则继续。

■同样针对fw2进行搜索，尝试连接到fw1(其间的区域是cdr1)

■同样针对fw3进行搜索，尝试连接到fw2(其间的区域是cdr2)

■同样针对fw4进行搜索，尝试连接到fw3(其间的区域是cdr3)

○通常，在6个orf中的仅1个中，可以鉴定具有上述程序的可变结构域。如果发现多个，则计算描述到共有的距离的分数并选择最佳orf。

○对于发现的可变结构域，有几个值。最重要的是，通过简单地将可变结构域序列与imgt提供的可获得种系库比对来检测最接近的种系，并报告最佳命中。通过这种方式，还报告最有可能是这些序列起源的每个序列的v/d/j种系。

○结果：表中每个序列有一行，包含有关所包含可变结构域的所有信息。

○进行的额外分析：计算与参照序列相比的dna/pep水平上每个cdr/fr的#突变。

实施例13

用亲本vl瞬时转染ngsvh变体

为了重组表达ngs变体，通过突出克隆方法(haun,r.s.等人,biotechniques13(1992)515-518；li,m.z.等人,naturemethods4(2007)251-256)将编码b细胞克隆亲本vl的pcr产物作为cdna克隆到表达载体中，在含有兔恒定区的表达盒中以接受vl区。表达载体含有表达盒，所述表达盒由包含内含子a的5'cmv启动子和3'bgh聚腺苷酸化序列组成。除表达盒外，质粒还含有puc18衍生的复制起点和β-内酰胺酶基因，该基因赋予氨苄青霉素抗性，用于在大肠杆菌中的质粒扩增。此外，表达载体含有兔κlc恒定区以接受vl区。

使用重叠引物通过pcr扩增编码κ恒定区和vl插入物的线性化表达质粒。将纯化的pcr产物与t4dna聚合酶一起孵育，产生单链突出端。通过添加dctp终止反应。在下一步中，将质粒和插入物组合，并与reca一起孵育，reca诱导位点特异性重组。将重组的质粒转化到大肠杆菌中。第二天，挑选生长的菌落，通过质粒制备、限制性分析和dna测序测试正确的重组质粒。

合成选择的ngsvh变体(geneart，regensburg，germany)并作为cdna克隆到表达载体中。表达载体含有表达盒，所述表达盒由包含内含子a的5'cmv启动子和3'bgh聚腺苷酸化序列组成。除表达盒外，质粒还含有puc18衍生的复制起点和β-内酰胺酶基因，该基因赋予氨苄青霉素抗性，用于在大肠杆菌中的质粒扩增。此外，表达载体含有兔igg恒定区，其被设计成接受vh区。

为了抗体表达，通过使用239-freetransfection试剂(novagen)、根据试剂供应商建议的步骤将500ng分离的hc和lc质粒瞬时共转染到2ml(96孔平板)的freestylehek293-f细胞(invitrogen，目录号r790-07)中。培养1周后，收获hek上清液，过滤(1.2μmsupor-pall)并用mabselectsure(50μl，gehealthcare)纯化。用1×pbs平衡柱。用2.5mmhcl，ph2.6洗脱样品，并用10×pbs中和。

实施例14

抗原(cdcp1)特异性分类的染色程序

来自巨噬细胞耗尽步骤的细胞用于进行抗原特异性分选。在第一轮中，将细胞与浓度为5μg/ml生物素化的cdcp1抗原在冰上孵育。在两个洗涤步骤后，用a647-链霉亲和素缀合物(invitrogen)检测生物素化的和细胞结合的cdcp1。平行地，加入抗iggfitc(abdserotec,düsseldorf,germany)和抗igmpe(bdpharmingen)抗体。将染色的细胞洗涤两次。最后，将pbmc重悬于冰冷的pbs中并立即进行facs分析。用于单细胞分选的细胞门控是：

实施例15

筛选hucdcp1结合物

将nuncmaxisorb链霉亲和素包被的平板(microcoat，目录号#11974998001)用25μl/孔的浓度的200ng/ml的生物素化的人cdcp1-avihis融合蛋白包被，并在4℃下过夜孵育。洗涤后(用pbst缓冲液(磷酸盐缓冲盐水tween-20)2×90μl/孔)，加入25μl抗cdcp1抗体样品并在室温下孵育1小时。洗涤后(用pbst-缓冲液3×90μl/孔)，加入以1：1,000稀释的25μl/孔山羊-抗-人igg-hrp缀合物(millipore，目录号ap502p)并在室温下在振荡器上孵育1小时。洗涤后(用pbst-缓冲液4×90μl/孔)，加入25μl/孔的tmb底物(rochediagnosticsgmbh，目录号11835033001)并孵育直至od达到1.5-2.5。通过加入25μl/孔1nhcl终止反应。在370/492nm进行测量。

实施例16

来自pbmc和抗原富集(淘选样品)b细胞的ngsvh-pcr

将4×10e6个pbmc和352个抗原富集b细胞重悬于350μlrlt缓冲液(qiagen，目录号79216)中。根据制造商的方案，使用rneasymini或micro试剂盒(qiagen，目录号74134)从b细胞裂解物制备总rna。对于pbmc和抗原富集b细胞，分别在50μl和30μl无rnase的水中洗脱rna。根据制造商的说明书，使用superscriptiiifirst-strandsynthesissupermix(invitrogen，目录号18080-400)和寡dt-引物、使用6μlrna通过逆转录酶反应来产生cdna。

使用accuprimesupermix(invitrogen,目录号12344-040)在最终体积50μl中使用50-80ngcdna扩增免疫球蛋白重链可变区(vh)，其中使用引物rbhcfinal_fs.up和rbhc_shortch1_fs2.do：

rbhcfinal_fs.upatggagactgggctgcgctggcttc(seqidno:34)

rbhc_shortch1_fs2.dogggaagactgatggagc(seqidno:35)

正向引物对信号肽vh具有特异性，而反向引物对恒定区具有特异性。pcr条件如下：94℃热启动3分钟；20和29个循环(分别对于pbmc和抗原富集样品)：94℃，20秒；68℃，20秒；68℃，40秒；68℃最终延伸5分钟。每个细胞库样品共进行6-8次pcr反应。

cdcp1：3只wt-兔(5571、5565、5556)

测序结果：兔vh序列和簇的数量

实施例17

用亲本vlhek瞬时转染ngsvh变体

为了重组表达ngs变体，通过突出克隆方法(haun,r.s.等人,biotechniques13(1992)515-518；li,m.z.等人,naturemethods4(2007)251-256)将编码b细胞克隆亲本vl的pcr产物作为cdna克隆到表达载体中。表达载体含有表达盒，所述表达盒由包含内含子a的5'cmv启动子和3'bgh聚腺苷酸化序列组成。除表达盒外，质粒还含有puc18衍生的复制起点和β-内酰胺酶基因，该基因赋予氨苄青霉素抗性，用于在大肠杆菌中的质粒扩增。此外，表达载体含有兔κlc恒定区以接受vl区。

为了抗体表达，通过使用239-freetransfection试剂(novagen)、根据试剂供应商建议的步骤将500ng分离的hc和lc质粒瞬时共转染到2ml(96孔平板)的hek293-f细胞(invitrogen，目录号r790-07)中。培养1周后，收获hek上清液，过滤(1.2μmsupor-pall)并用mabselectsure(50μl，gehealthcare)纯化。用1×pbs平衡柱。用2.5mmhcl，ph2.6洗脱样品，并用10×pbs中和。

实施例18

人cdcp1结合elisa

将nuncmaxisorb链霉亲和素包被的平板(microcoat，目录号#11974998001)用25μl/孔的浓度为200ng/ml的生物素化的人cdcp1-avihis融合蛋白包被，并在4℃下过夜孵育。洗涤后(用2×90μl/孔pbst缓冲液)，加入25μl抗cdcp1抗体样品，其以1：2系列稀释，起始为5μg/ml。将平板在室温下孵育1小时。洗涤后(用pbst-缓冲液3×90μl/孔)，加入以1:9,000稀释的25μl/孔山羊-抗-人igg-hrp缀合物(jackson,cat.no.109-036-098)和驴-抗-兔igg(gehealthcare,目录号na9340v,lot#389592)的混合物，并在室温下在振荡器上孵育1小时。洗涤后(用pbst-缓冲液4×90μl/孔)，加入25μl/孔的tmb底物(roche，目录号11835033001)并孵育直至od达到1.5-2.5。通过加入25μl/孔1nhcl终止反应。在370/492nm进行测量。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：G·乔治斯;S·克洛斯特曼;A·蒂索;F·罗斯;A·布乔茨克;C·弗热泽德克;F·舒尔茨
技术所有人：豪夫迈·罗氏有限公司
我是此专利的发明人

上一篇：一种防水透气型面料及其制备方法与流程
上一篇：一种脊柱理疗头的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
2、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
3、豆老师：1.环境纳米材料及挥发性有机化合物（VOCs） 2.CO污染物的催化氧化 3.低温等离子体 4.吸脱附等控制技术
4、赵老师：1.高分子材料改性及加工技术 2.微孔及过滤材料 3.环境友好高分子材料
5、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
如您是高校老师，可以点此联系我们加入专家库。