一种发掘特异性功能抗体的方法

文档序号:10679848阅读:806来源:国知局
一种发掘特异性功能抗体的方法
【专利摘要】本发明涉及一种发掘特异性功能抗体的方法,特别涉及一种基于免疫宿主抗体可变区序列组成与频率分析发掘特异性功能抗体的方法。与常规的高通量抗体测序方法比较,本方法可以快速准确地获取包含候选CDR3的抗体可变区全长序列,抗体基因配对成功率高且适用于检测微量样本,提升了获取特异性功能抗体的效率。
【专利说明】
-种发掘特异性功能抗体的方法
技术领域
[0001] 本发明设及生物技术领域,具体设及发掘特异性功能抗体的方法,特别设及一种 基于免疫宿主抗体可变区组成与频率分析发掘特异性功能抗体的方法。
【背景技术】
[0002] 由单一 B细胞产生的完全一致的、仅针对某一特定抗原表位的抗体,称为单克隆抗 体。自从1975年Kohler和Milstein报道利用杂交瘤技术获得抗绵羊红细胞的单克隆抗体, 越来越多的单克隆抗体已经广泛应用于检验医学诊断和生物大分子的分离等领域。单克隆 抗体W其特异性强、纯度高、均一性好等优点,提高了医学检验的效率和精度,同时也对于 生物学分子机理的研究也很大的推动作用。近年来,伴随着肿瘤免疫治疗的发展,针对免疫 检查点的单克隆抗体显示出在肿瘤免疫治疗中的巨大前景。
[0003] 除了杂交瘤技术,多种技术已经应用于单克隆抗体的生产,例如W隧菌体展示为 代表的体外展示技术;单细胞克隆技术;EB病毒介导的B细胞永生技术;蛋白质谱分析结合 DNA高通量测序技术等等。运些技术各有优缺点,例如杂交瘤技术仅限于鼠或兔等有限的种 类,后续分离单克隆杂交瘤费时冗长,工作量大;单克隆抗体产量不稳定,易于丢失。体外展 示技术也需要较长的周期并且产生的抗体与杂交瘤抗体相同后续需要进行人源化。
[0004] 近年来发展的基于高通量测序的抗体发现方法通过比较免疫前后宿主抗体基因 谱中CDR3序列的频率,掲示特定免疫状态下抗体基因谱中特异性抗体丰度的变化,挑选频 率变化最大的CDR3序列调出全长序列,作为特异性抗体的候选序列在体外配对表达进行功 能验证。该方法不限于物种,可W从抗体基因谱中在短时间内产生大量的候选配对进行功 能验证,有可能得到具有高亲和力的抗体。
[0005] 二代测序的读长、准确性、通量、性价比等特性,适用于研究抗体库组成多样性,但 是在抗体测序文库构建,高通量抗体测序W及数据分析等方面也存在一些技术难点,导致 获得的抗体基因谱信息不准确,所包含的抗体基因信息存在偏向性,难W准确界定CDR3频 率的变化,挑选出的全长基因体外配对功能验证效率低下。
[0006] 二代测序已经广泛用于研究抗体基因谱组成的多样性,但是如何避免在测序文库 构建过程中引入偏向性一直是一个难题。目前多采用RT或者RACE的方法构建高通量抗体测 序文库。RT方法根据已知抗体序列可变区的保守序列设计引物,扩增抗体可变区。由于抗体 基因具有很高的序列多样性,在实际操作中多采用多条引物或者兼并引物进行多重PCR扩 增,W最大程度覆盖抗体基因。但是多重引物扩增,样本RNA降解,数据库不完整等不可避免 地在文库构建与数据分析中引入偏向性,导致测序结果无法真实反映抗体可变区的组成与 变化。构建RACE文库的另一难点在于对于样品RNA的质量与数量要求较高。然而在实际工作 中难W获得足够的样品,尤其是临床病理样本的数量往往难W满足RACE建库的需要。

【发明内容】

[0007] 针对现有技术的不足及实际的需求,本发明提供一种发掘特异性功能抗体的方 法,所述方法能够无偏向性、全面地研究多物种抗体基因可变区的组成和分布。
[000引为达此目的,本发明采用W下技术方案:
[0009] 第一方面,本发明提供一种发掘特异性功能抗体的方法,包括如下步骤:
[0010] (1)提取所述至少一种祀抗原免疫宿主受试者的总RNA,构建高通量抗体测序文 库;
[0011] (2)将步骤(1)构建的高通量测序文库进行免疫球蛋白基因可变区的高通量测序, 获取针对所述至少一种祀抗原的抗体可变区基因谱;
[0012] (3)从抗体可变区基因谱中选择候选CDR3及对应的重链和轻链抗体核酸序列作为 候选配对序列;
[0013] (4)选取轻链和重链基因在体外配对表达,产生候选重组抗体;
[0014] 其中,从抗体可变区基因谱中选择候选CDR3包括将高通量测序的Readl和/或 Read2的结果单独分析,挑选出候选CDR3同源簇,结合拼接的Readl和Read2结果确定包含此 CDR3同源簇的抗体可变区全长基因。
[0015] 本发明中,采用Readl和/或Read2的结果W及Readl和Read2拼接后的结果分析。
[0016] 作为优选技术方案,步骤(1)所述的构建高通量抗体测序文库的方法为RACE法建 库和/或RT法建库,例如可W是单独RACE法建库、单独RT法建库或同时进行RACE法建库和RT 法建库。
[0017]优选地,所述RACE法建库包括W下步骤:
[0018] (a)获得所受对象的细胞,分离总RNA;
[0019] (b)Woligo(dT)作为引物,W步骤(a)中的总RNA作为模板,反转录合成cDNA;
[0020] (c)W步骤(b)制得的cDNA为模板,W两步PCR扩增方法或第一步PCR扩增抗体基因 后用扩增子建库方法构建高通量抗体测序文库。
[0021] 本发明,通过分别构建重链、Ka卵a链和Lambda链的RACE文库,采用11 lumina系统 对文库进行测序,对重链文库单独测序,对Kappa和Lambda链文库合并或单独测序。
[0022] 本发明中,采用优化后的两步法PCR扩增构建文库,可W将样本的RNA输入量降低 至20ng,简化了文库的构建流程,保持获取的抗体可变区基因谱的覆盖度和准确性。
[002引优选地,所述RT法建库包括W下步骤:
[0024](曰')获得由所受对象的细胞,分离总RNA;
[002引化'似oligo(dT)作为引物,W步骤(曰')中的总RNA作为模板,合成cDNA;
[0026] (c')W步骤化')制得的cDNA为模板,采用特异性引物分别扩增抗体基因,然后对 PCR扩增产物进行DNA文库构建。
[0027] 本发明中,所述RACE法建库和RT法建库中的PCR扩增的程序为:
[002引① 95°C 保溫 2min;
[00巧]②95。[3036。,化 3036。,72。[3036。;15-35个循环
[0030]③ 72°C7min;
[003。@4°C 保存。
[0032] 优选地,所述RACE法建库中的步骤(a)中所述的所受对象为哺乳动物、两栖类动 物、鱼或鸟中的任意一种或至少两种的组合。
[0033] 优选地,所述哺乳动物为人类、小鼠、灵长类、兔、山羊、绵羊或猪中的一种或至少 两种的组合。
[0034]优选地,所述RACE法建库中的步骤(a)中所述的细胞来自所受对象的外周血、淋己 器官、脾脏、骨髓或肝脏中的任意一种或至少两种的组合。
[003引优选地,所述RACE法建库中的步骤(a)中所述的细胞包括化区B细胞、浆细胞或浆 母细胞中的任意一种或至少两种的组合。
[0036] 优选地,所述RACE法建库中的步骤(C)中的两步PCR扩增中的第一轮PCR采用的引 物分为正向引物和反向引物,所述正向引物含有部分正向接头序列和如SEQ ID NO.1所示 的序列,所述反向引物含有部分反向接头序列和如SEQ ID NO.2-4之一所示的序列。
[0037] 沈Q ID N0.1:AAGCAGTGGTATCAACGCAGAGTA;
[0038] 沈Q ID N0.2:GGAAGACCGATGGGCCCTTGGTGG;
[0039] 沈Q ID N0.3:GCAGGCACACAACAGAGGCAGTTCCAG;
[0040] 沈Q ID N0.4:CACACCAGTGTGGCCTTGTTGGCTT。
[0041 ] 示例性地,所述RACE法建库中的步骤(c)中的两步PCR扩增中的第一轮PCR采用的 正向引物具体表示如下:
[0042] 部分接头序列-AAGCAGTGGTATCAACGCAGAGTA(正向引物引用自Clontech SMARTer RACE 5'/3'Kit)。
[0043] 示例性地,所述RACE法建库中的步骤(c)中的两步PCR扩增中的第一轮PCR采用的 反向引物可采用如下S种形式:
[0044] 部分接头序列-GGAAGACCGATGGGCCCTTGGTGG(重链IgG反向引物);
[0045] 部分接头序列-GCAGGCACACAACAGAGGCAGTTCCAG化appa反向引物);
[0046] 部分接头序列-CACACCAGTGTGGCCTTGTTGGCTT( lambda反向引物)。
[0047] 优选地,所述部分正向接头序列包含11 lumina正向接头引物3 '端的5-60bp,所述 部分反向接头序列包含111皿ina反向接头引物3'端的5-60bp。
[004引优选地,所述111皿ina正向接头引物的序列为SEQ ID ^.5所示,所述11111111;[]1曰反 向接头引物为SEQ ID NO.6所示;
[0049] SEQ ID NO.5:
[(K)加] AATGATACGGCGACCACCGAGATCTACACTATAGCCTACACTCTTTCCCTACACGACGCTCTTCCGATCT;
[0051] SEQ ID NO.6:
[005。 CAAGCAGAAGACGGCATACGAGATAGCTTCAGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT。
[0053] 优选地,所述RACE法建库中的步骤(c)中的两步PCR扩增中的第二轮PCR采用的引 物为常规Ilhimina建库引物。
[0054] 优选地,所述高通量测序为边合成边测序、边连接边测序、边杂交边测序、单分子 DNA测序、多聚合酶群落测序或纳米孔测序中的任意一种或至少两种的组合,优选为边合成 边测序,进一步优选为111皿ina平台测序。
[0055] 本发明中,采用Illumina Miseq 2X300系统测序,虽然抗体基因可变区序列较 长,基本达到11 lumina测序的上限,但与其它的高通量测序方法例如Roche 454方法比较, Illumina Miseq 2X300系统具有高准确性,通量高和成本低等优势,与S代测序方法比 较,虽然在读长上不具有优势,但是111皿ina系统在通量与测序成本上优势明显。
[0056]本发明中,分析方法采用两头测序再进行挑选的方法,运弥补了 Illumina测序读 长上的不足,且通过两头测序可W更加精准的得到全长序列。
[0化7] 本发明中,针对现有Illumina Miseq 2X300系统难W确保获得抗体可变区全长, 开发出一种优化的抗体可变区全长挑选方法,通过结合RACE和RT建库测序结果获得抗体可 变区全长序列,减小由于数据不完整造成的偏向性。
[0058] 优选地,所述选择候选CDR3的原则为:CDR3聚类后的高频序列、挑选免疫后或爆发 期比与免疫前或恢复期频率明显提升的CDR3序列或CDR3对应的V基因家族在免疫后或爆发 期与免疫前或恢复期有明显差异的序列中的任意一种或至少两种的组合。
[0059] 优选地,步骤(3)所述的选择候选CDR3及对应的重链和轻链抗体核酸序列作为候 选配对序列包括如下步骤:
[0060] (r)挑选候选CDR3同源簇;
[0061 ] (2 ')错定该CDR3同源簇,在抗体可变区基因谱中挑选包含此CDR3同源簇的高频抗 体重链和轻链可变区全长氨基酸序列作为第一和第二配对候选序列;
[0062] (3')确定第一和第二配对候选序列的核酸序列。
[0063] 优选地,步骤(2')所述的挑选包含此候选CDR3同源簇的高频抗体重链和轻链可变 区全长氨基酸序列包括W下步骤:从抗体可变区基因谱中选择包含所述CDR3同源簇的所有 Readl和Read2进行抗体数据库比对,获得最高频的CDR区和FR区的氨基酸序列;同时拼接 Readl和Read2的测序结果,将全部拼接序列进行抗体数据库比对,确定最高频的CDR区和FR 区的氨基酸序列;比较和合并两个来源获得的CDR和FR区氨基酸序列,获得该CDR3同源簇对 应的抗体可变区全长氨基酸序列作为候选配对序列。在Readl和Read2拼接序列中选择对应 的最高频可变区全长核巧酸序列。
[0064] 优选地,步骤(3')所选的可变区全长核巧酸序列与RT法建库获得的包含特定CDR3 同源簇的最高频抗体可变区序列进行比较,获取抗体可变区全长序列作为候选配对序列。
[0065] 本发明中,对于部分抗体可变区,由于包含较长的CDR区、FR区或较长的5'UTR区导 致拼接率很低,锁定CDR3采用依次选取方法难W获得令人置信的高频可变区全长序列,本 发明所W采用RT法同时构建文库,弥补RACE文库拼接率低的问题。
[0066] 本发明中,结合RACE和RT文库测序获取抗体全长的方法为:对同一样品平行采用 RACE和RT方法建库测序,比较两个文库中高频CDR3的一致性,在一致性达到一定标准下,锁 定CDR3,在RT文库中挑选包含该CDR3的最高频DNA序列。
[0067] 优选地,所述方法还包括对筛选得到的抗体进行鉴定。
[0068] 优选地,所述鉴定包括用至少一种祀抗原对所得抗体进行鉴定。
[0069] 优选地,所述鉴定步骤包括体外表达所得抗体的scFv或化b片段或IgG,将所得 scFvJab片段或IgG与祀抗原进行结合力测试。
[0070] 优选地,所述体外表达方法包含但不限于通过原核细胞、隧菌体展示方法或酵母 系统表达scFv或者化b片段,或者通过哺乳细胞外源基因表达化b或者IgG。
[0071] 优选地,所述测试方法包括但不限于化ISA和/或SPR。
[0072] 与现有技术相比,本发明具有如下有益效果:
[0073] (1)本发明分析方法采用两头测序拼接后再进行挑选的方法,运弥补了 Illumina 测序读长上的不足,且通过两头测序可W更加精准的得到全长序列;
[0074] (2)本发明采用优化后的两步法PCR扩增构建文库,可W将样本的RNA输入量降低 至20ng,简化了文库的构建流程,保持获取的抗体可变区基因谱的覆盖度和准确性;
[00巧](3)本发明针对现有Illumina Miseq 2X300系统难W确保获得抗体可变区全长, 开发出一种优化的抗体可变区全长挑选方法,通过结合RACE和RT建库测序结果获得抗体可 变区全长序列,减小由于数据不完整造成的偏向性;
[0076] (4)本发明的特异性抗体的发掘方法简便快捷,且成本低,且能检测微量样本,为 大量抗体的发掘奠定了基础。
【附图说明】
[0077] 图1是本发明优化的抗体发掘方法示意图;
[0078] 图2是本发明实施例1具体的实施步骤示意图;
[0079] 图3不同RNA输入量抗体基因 CDR3频率的相关性分析,其中,图3(a)RNA输入量为 600ng和20ng时重链CDR3的比较,图3(b)RNA输入量为600ng和lOOng时重链CDR3的比较,图3 (C)RNA输入量为60化g和20ng时ka卵a CDR3的比较,图3(d)为RNA输入量为60化g和10化g时 ka卵a CDR3的比较,图3 (e) RNA输入量为600ng和20ng时1 ambda CDR3的比较,图3 (f) RNA输 入量为60化g和10化g时lambda CDR3的比较;
[0080] 图4为本发明实施例2候选登革热抗体配对表达结果;
[0081] 图5为本发明实施例3候选流感抗体配对表达结果;
[0082] 图6为RT和RACE文库CDR3频率相关性的分析,其中,图6(a)为重链在RT和RACE文库 CDR3频率相关性的分析,图6 (b)为Lambda链在RT和RACE文库CDR3频率相关性的分析。
【具体实施方式】
[0083] 为更进一步阐述本发明所采取的技术手段及其效果,W下结合附图并通过具体实 施方式来进一步说明本发明的技术方案,但本发明并非局限在实施例范围内。
[0084] 实施例1适用于微量样品的改良的高通量文库构建方法
[0085] 构建文库的具体步骤如图2所示,样本制备及第一链cDNA合成:采用密度梯度离屯、 法从人或动物的外周血中分离的外周血单核细胞(PBMC)。采用化izol从PBMC中分离总RNA。 分别取20ng,lOOng和60化g RNA为模板,〇1 igo(肌)作为引物进行第一链cDNA的合成,具体 操作参考试剂盒SMARTei?吸RACE 573'Kit的说明书进行。
[0086] 优化的两步PCR方法构建抗体文库,第一轮PCR扩增,正向引物是优化后的 SMART封难浊ACE 573'Kit UPM,含有Illumina的部分接头引物,反向引物含有抗体恒定 区的序列W及11 lumina的部分接头引物。VH,VK和化分别扩增,反应体系如下:
[0087]
[008引
[0089]
[0090]
[0091]
[0092]
[0093]
[0094]
[0095]
[0096] 产物切胶纯化步骤参考QIAquick Gel Extraction Kit的说明。文库构建后,使用 Bioanalyzer Hi曲 Sensitivity DNA chip进行QC,测序平台是Illumina Miseq2X300,结 果如图3(a)-(f)所示。
[0097] 从图3(a)-(f)的结果显示,与600ng RNA输入量比较,20ngRNA输入量下重链, Ka卵a链和Lambda链CDR3的频率相关性R2值分别为0.83,0.90和0.98,显示很高的相关性。 而且图中显示高频CDR3的排名,例如抗体可变区基因谱中排名前十位的CDR3,在600ng, lOOng和20ng输入量下也显示出较高的一致性。CDR3频率相关性的比较说明,2化g RNA输入 量构建的RACE文库在抗体基因覆盖度与CDR3区偏向性方面可W满足抗体文库测序的要求。
[0098] 实施例2采用优化的抗体基因筛选方法发掘登革热单克隆抗体
[0099] 采用实施例1描述的RACE抗体文库构建方法,从登革热病人急性期和恢复期的 PBMC中分离总RNA,分别构建重链,Ka卵a链和Lambda链RACE文库。采用Illumina Miseq 2X 300系统对文库进行测序,对重链文库单独测序,对Kappa和Lambda链文库合并测序。测序结 果用软件Trimmomatic-O .30进行处理,具体参数设置如下:phred33, LEADING : 20 , TRAILING: 20,化IDINGWIND0W: 20:20,MINLEN: 200)去除质量差的数据。对数据分析做了 W 下改进。比较去除与保留Singleton序列抗体文库的数据量,发现singleton去除后数据量 变化很大,所W不能去除singleton序列。而重复序列归一的方式可W减少对服务器资源的 占用:首先找出每种序列及其重复次数,然后对每种序列进行IgBlast分析,最后把重复次 数统计进去,得到每种CDR3的频率。
[0100] 表1去除Singleton序列前后抗体文库数据量的比较
[0101]
[0104]表3登革热病人急性期与恢复期文库质量的比较
[010
[010
[0105]
[0106] 由于CDR3序列是不同抗体基因接近唯一的标示符,可W依据获得的CDR3序列的数 量评估其在抗体可变区基因谱中的丰度。根据IgBlast网站确定FR区和CDR区的序列,但是 IgBlast网站没有确定CDR3的序列,因此我们利用FR4区特征序列确定CDR3氨基酸序列,重 链FR4起始区特征序列是WG*G或*GQG,Ka卵a和Lambda链的特征序列是FG*GT。对Read 1和 Read2序列分别运行IgBlast并合并结果,根据W下之一或全部原则选择作为配对候选的 CDR3序列:1)CDR3聚类后的高频序列;2)挑选免疫后或爆发期比与免疫前或恢复期频率明 显提升的CDR3序列;3)该CDR3对应的V基因家族在免疫后或爆发期与免疫前或恢复期有明 显差异。
[0107] 登革热病人急性期与恢复期重链和轻链CDR3频率变化见表4、5和6,结果显示,与 恢复期相比,CDR3在急性期显著富集,预示其可能与特异性抗原相关。
[0108] 表4登革热病人急性期与恢复期重链CDR3频率分析
[0109]
[0110] 表5急性期与恢复期Kappa链CDR3频率分析
[0111]
[0
[0
[0
[0115] 错定候选CDR3序列,w重链CDR3序列T皿RP化RYPDV为例,将包含该CDR3同源簇的 所有Read2W及对应的Readl分别运行IgBlast获得包含的CDR区和FR区的氨基酸序列,如 CDR1,CDR2,CDR3 W及FR1,FR2,FR3和FR4。将I浊last分析结果合并至文件R12。平行地,拼接 R1和R2测序结果,用拼接后的序列运行IgBlast确定各结构域氨基酸和核巧酸序列,并得到 Contig 文件。
[0116] 基因可变区全长序列的挑选按照W下步骤:W重链CDR3-THRRP化RYPDV同源簇为 例,首先从R12文件筛选得到最高频的抗体基因可变区,它的各个结构域氨基酸序列如下, 见表7:
[0117] FR1(QITLKESGPMLVKPTQTLTLTCTFS)-CDR1(GFSLSTSGVG)-FR2 (VGWIRQPPGEALEWLAI)-CDR2(IYW孤DK)-FR3(RYSP化RS化TIS邸T SKNQVVLTMTNLDPVDTATYFC) FR4(WGQG)〇
[0118] 进一步在Contig文件中挑选对应的核巧酸序列,按照nnFR4-nnCDR3-nnFR3- nnCDR2-nnFR2-nnCDRl-nnFRl-contig的顺序依次挑选,获得对应的最高频核巧酸序列抗体 可变区全长核巧酸序列,该序列需要包含完整FR,CDR区和信号肤序列。
[0119] 表7重链CDR3 THRRPSLRYPDV同源簇对应最高频FR和CDR区组合
[0121] WKa卵a链-册YSSWPPGGT同源簇为例,在R12文件筛选得到最富集的FR和CDR区序 列组合,各区域氨基酸序列如下:
[0122] FR1(EIVMTQSPATLSVSPGERATLSCRAS)-FR2(LAWYQHKPGQAPRLLLY)-FR3 (TRAAGIPDRFSGSGSGTEFTLTIS化QS抓FAVYFC) -CDR2 (GAS) -CDR 1 (QSVSSN) -FR4 (FGQGT)见表 8。在Contig文件中挑选该组合对应的最高频核巧酸序列,按照nnFR4-nnCDR3-nnFR3- nnCDR2-nnFR2-nnCDRl-nnFRl-contig的顺序依次筛选获得对应的最高频的抗体可变区全 长DNA序列。
[0123] 表8 Ka卵a链CDR3 HQYSSWPPGGT同源簇对应最高频FR和CDR区组合 r〇i?4i
[0125] 此抗体可变区序列挑选方法具有
W下益处。在进行测序数据整理时,保留 Singleton Reads;不同高频CDR3对应的抗体基因可变区,其拼接率差异显著,如下表中重 链高频CDR3序列全长拼接率从34-91 %不等(表9)。如果直接采用拼接序列分析在某些情况 下数据损失较大,甚至有可能使CDR3频率分析产生偏向性。现有流程首先采用R1和R2序列 做CDR3组成分析,避免了有效数据损失的风险,也有利于获取准确的CDR3序列频率;现有流 程在R1和R2文件中获取FR和CDR区最高频氨基酸序列信息,在Contig序列文件中选取最高 频的抗体基因可变区核巧酸序列,可W有效保证得到可变区序列是最高频序列W及序列信 息的完整性和准确性。在R12文件中单独挑选FR和CDR区序列也验证了现有流程的准确性见 图4。
[0126] 表9抗体可变区测序拼接分析
[0127]
[01%]抗体基因配对和表达分析:通过重叠 PCR的方法构建表达框,表达框包括启动子, 可变区和抗体恒定区。将挑选的抗体重链基因和轻链基因组合配对后转染293FT细胞进行 表达,获取上清做Elisa实验,检测其与抗原的亲和力。具体实施步骤如下:将候选重链和轻 链的可变区通过搭桥PCR的方法构建表达框,表达框包括启动子,可变区和人抗体恒定区 的。将包含重链和轻链表达框的质粒配对转染293FT细胞,进行体外表达和抗体功能分析。 收集293T细胞并调整细胞密度接种48孔板至1.2 X 105/孔;37°C,5%C〇2解箱培养过夜,待细 胞密度长至60-80 %时进行转染。将0.25ug重链和0.75ug轻链质粒在室溫解育5分钟,然后 与转染试剂混匀后在室溫解育20min形成转染复合物。将转染复合物加入细胞孔,轻轻混 匀。37°C,5%C02解箱培养72小时。收集上清用Elisa活性检测。首先将anti-human IgG(Fc) 与检测抗原分别用pH 9.6碳酸包被液稀释成lOug/mL,96孔酶标板每孔包被10化L,4°C,过 夜;或者37°C,2小时;然后用4%脱脂奶粉-PBS封闭,300化/孔,37°C处理1~2小时。丢弃酶 标孔内液体,用PBST洗S遍后加入转染48小时培养上清10化1/孔,37°C处理1小时,设定培 养基和PBS对照。丢弃酶标孔内液体,用PBST洗S遍,分别加入皿P羊抗人IgG巧C),1: 2000; 与HRP羊抗人IgG,1: 5000 ; 100化/孔,37 °C处理化r。弃酶标孔内液体,用PBST洗五遍,加入 0PD显色液aOOiiL/孔,避光显色;酶标仪读取0D490波长吸收值。
[0129] 采用4条重链与5条Kappa链和4条Lambda链分别配对,Elisa结果(图4)显示kappa 链与重链的配对没有阳性结果,lambda链与重链的配对共获得5个阳性克隆。阳性率5/36。
[0130] 实施例3采用优化的抗体基因筛选方法发掘流感单克隆抗体
[0131] 采用实施例1描述的RACE抗体文库构建方法,从注射流感疫苗前和7天后的志愿者 的PBMC中分离总RNA,按照实施例2中描述的方法分别构建重链,Ka卵a链和Lambda链RACE文 库;采用Illumina Miseq 2X250系统进行高通量测序。数据的处理,FR和CDR区的确定方 法,候选CDR3氨基酸序列的挑选方法都与实施例1中描述的方法相同。
[0132] 表10流感疫苗免疫前与免疫后重链CDR3频率分析
[0133]
[0137] 表12流感疫苗免疫前与免疫后Lambda链CDR3频率分析 r〇i3si
[0139] 通过融合PCR的方法构建表达框,表达框包括启动子,可变区和抗体恒定区。将挑 选的抗体重链基因和轻链基因随机配对后转染293FT细胞进行表达,获取上清做Elisa实 验,检测其与抗原的亲和力。
[0140] 体外表达的具体方法参见登革热案例。Elisa结果显示候选Kappa链和Lambda链与 重链的配对各获得1个功能性抗体。从图5可W看出配对成功率为2/15。
[0141] 实施例4结合RACE和RT文库测序结果获取抗体可变区全长序列
[0142] 在实施例2中描述的优化的可变区全长序列挑选方法,可W部分弥补测序读长不 足。但是对于部分抗体可变区,例如包含较长的CDR、FR区或5'UTR导致拼接率很低,锁定 CDR3采用描述的依次选取方法难W获得令人置信的高频可变区全长序列,例如表9中包含4 条最高频CDR3的序列中,两条CDR3对应的拼接率仅为40%左右。
[0143] 开发出一种结合RACE和RT文库测序结果获取抗体可变区全长序列的方法。对同一 样品平行采用RACE和RT方法建库测序,比较两个文库中高频CDR3的一致性。在一致性达到 一定标准下,锁定CDR3同源簇,在RT文库中挑选包含该CDR3同源簇的最高频可变区全长DNA 序列。
[0144] 具体实施方法如下:
[0145] RT方法与实施例一中描述的RACE方法,W登革热病人急性期血液样品PBMC中分离 RNA构建重链和轻链文库;同时采用RT方法构建重链和轻链文库。
[0146] RT方法建库步骤如下:
[0147] 根据实施例一中描述的方法获取cDNA第一链,采用特异性引物分别扩增重链 (VH),Kappa链(VK)和Lambda链可变区(VL)。正向引物设计在可变区序列的保守区,反向引 物设计在恒定区,引物序列见表13,其中重链引物引用自参考文献1。
[014引采用PCR扩增体系包含VH或3.6iiM VK或VL正向引物,化M反向 引物,2.5化 AccuPrime Buffer iQnvitrogen),化L cDNA和 0.75化 AccuPrime Taq Polymerase.
[0149] PCR 程序:95它 2min;25cycles(95r 30sec,56r 30sec,72r lmin);72r 7min;4DC dPCR产物切胶纯化,操作步骤参考QIAquick Gel Extraction Kit(Qiagen)的说 明。
[0150] 高通量测序文库的构建参考MEB:N城t(?Ultra? DNA Library Prep Kit for Illumina(NEB)的说明进行D文库构建完成后,使用Bioanalyzer High Sensitivity DNA chip(Agilent)进行QC,测序平台是Illumina Miseq 2X300〇
[0151] 表13 RT文库构建所用引物列表
[01591
[0153]
[0154] 文库测序与分析按照实施例一描述的方法进行,比较RACE文库和RT文库高频CDR3 区的相关性,见图6 (a)和(b) RT和RACE文库CDR3频率相关性的分析。
[01巧]结果显示,重链和Lambda链CDR3在两个文库中的相关性R2值均为0.7左右;如图6 (a)所示,最高频的重链和轻链CDR3的一致性很好,排名位于抗体谱前十位的高频重链和轻 链CDR3也都显示出一定的一致性,说明在两个文库中,大部分高频CDR3排名不存在明显的 背离。例如图6(b)中样本11-2重链的最高频CDR3(ARETDGMDV),在RACE和RT文库中都是最高 频CDR3。我们利用RACE R12文件挑选出的CDR3-ARETDGMDV同源簇最富集的FR区和CDR区氨 基酸序列是FR1 : QVQLVQSGAEVKRPGASVKVSCKAS,FR2 :MHWVRQAPGQRLEWMGW,FR3 : KYSQKFQGRVTIT畑TSASTAYMELS化RS抓TAVYYC,CDR1:GYTFTTYA,FR4:WGQG,CDR2:INAGNGNT。 利用RT文件挑选出的CDR3-ARETDGMDV同源簇最富集的FR区和CDR区氨基酸序列也是一致 的。说明运一方法可W用于拼接高频CDR3基因可变区。
[0156] 实施例5采用优化的抗体基因筛选方法发掘HA单克隆抗体
[0157] 采用实施例1描述的RACE抗体文库构建方法,从免疫HA抗原的小鼠脾脏细胞中分 离总RNA,分别构建重链,轻链RACE文库;采用Illumina Miseq 2X250系统进行高通量测 序。数据的处理,FR和CDR区的确定方法,候选CDR3氨基酸序列的挑选方法都与实施例1中描 述的方法相同。
[0158] 通过融合PCR的方法构建表达框,表达框包括启动子,可变区和抗体恒定区。将挑 选的抗体重链基因和轻链基因组合配对后转染293FT细胞进行表达,获取上清做Elisa实 验,检测其与抗原的亲和力。
[0159] 体外表达的具体方法参见登革热案例。Elisa结果显示候选重链与轻链的配对获 得1个有亲和力性抗体。
[0160] 亲1 4/1、鼠龟巧HA后重链(DR3麻莖4V祈
[0161]
[0162]
[0163] 表15小鼠免疫HA后Kappa链CDR3频率分析

LO165」
【申请人】戸明,本发明通巧上还实施例来说明本发明的巧细万巧,但本发明并小局 限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的 技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的 添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。
【主权项】
1. 一种发掘特异性功能抗体的方法,其特征在于,包括如下步骤: (1) 提取所述至少一种靶抗原免疫宿主受试者的总RNA,构建高通量抗体测序文库; (2) 将步骤(1)构建的高通量测序文库进行免疫球蛋白基因可变区的高通量测序,获取 针对所述至少一种靶抗原的抗体可变区基因谱; (3) 从抗体可变区基因谱中选择候选CDR3及对应的重链和轻链抗体核酸序列作为候选 配对序列; (4) 选取轻链和重链基因在体外配对表达,产生候选重组抗体; 其中,从抗体可变区基因谱中选择候选CDR3包括将高通量测序的Readl和/或Read2的 结果单独分析,挑选出候选⑶R3同源簇,结合拼接的Readl和Read2结果确定包含此⑶R3同 源簇的抗体可变区全长基因。2. 根据权利要求1所述的方法,其特征在于,步骤(1)所述的构建高通量抗体测序文库 的方法为RACE法建库和/或RT法建库。3. 根据权利要求2所述的方法,其特征在于,所述RACE法建库步骤如下: (a) 获得所受对象的细胞,分离总RNA; (b) 以oligo(dT)作为引物,以步骤(a)中的总RNA作为模板,反转录合成cDNA; (c) 以步骤(b)制得的cDNA为模板,构建高通量抗体测序文库; 优选地,所述RT法建库包括以下步骤: (a ')获得由所受对象的细胞,分离总RNA; (b ')以ο 1 igo (dT)作为引物,以步骤(a ')中的总RNA作为模板,合成cDNA; (c')以步骤(b')制得的cDNA为模板,采用特异性引物分别扩增构建抗体测序文库。4. 根据权利要求2或3所述的方法,其特征在于,所述RACE法建库中的步骤(a)中所述的 所受对象为哺乳动物、两栖类动物、鱼或鸟中的任意一种或至少两种的组合; 优选地,所述哺乳动物为人类、小鼠、灵长类、兔、山羊、绵羊或猪中的一种或至少两种 的组合; 优选地,所述RACE法建库中的步骤(a)中所述的细胞来自所受对象的外周血、淋巴器 官、脾脏、骨髓或肝脏中的任意一种或至少两种的组合; 优选地,所述RACE法建库中的步骤(a)中所述的细胞包括记忆B细胞、浆细胞或浆母细 胞中的任意一种或至少两种的组合。5. 根据权利要求2-4中任一项所述的方法,其特征在于,所述RACE法建库中的步骤(c) 中的抗体文库构建方法包括普通的PCR扩增子建库方法和两步PCR建库方法; 优选地,所述普通的PCR扩增子建库方法是用第一轮PCR扩增抗体基因,然后对扩增产 物进行DNA建库; 优选地,所述两步PCR扩增中的第一轮PCR采用的引物分为正向引物和反向引物,所述 正向引物含有部分正向接头序列和如SEQ ID NO.1所示的序列,所述反向引物含有部分反 向接头序列和如SEQ ID NO.2-4之一所示的序列; 优选地,所述部分正向接头序列包含11 lumina正向接头引物3 '端的5-60bp,所述部分 反向接头序列包含Illumina反向接头引物3'端的5-60bp; 优选地,所述Illumina正向接头引物的序列为SEQ ID腸.5所示,所述11111111;[1^反向接 头引物为SEQ ID NO.6所示。6. 根据权利要求1-5中任一项所述的方法,其特征在于,所述高通量测序为边合成边测 序、边连接边测序、边杂交边测序、单分子DNA测序、多聚合酶群落测序或纳米孔测序中的任 意一种或至少两种的组合,优选为边合成边测序,进一步优选为Illumina平台测序。7. 根据权利要求1-6中任一项所述的方法,其特征在于,所述选择候选CDR3的原则为: CDR3聚类后的高频序列、挑选免疫后或爆发期比与免疫前或恢复期频率明显提升的CDR3序 列或CDR3对应的V基因家族在免疫后或爆发期与免疫前或恢复期有明显差异的序列中的任 意一种或至少两种的组合。8. 根据权利要求1-7中任一项所述的方法,其特征在于,步骤(3)所述选择候选CDR3及 对应的重链和轻链抗体核酸序列作为候选配对序列包括如下步骤: 0- )挑选候选CDR3同源簇,CDR3同源簇是指氨基酸水平同源性高的CDR3,该同源性范 围是 70%-99%; (2 ')锚定该CDR3同源簇,在抗体可变区基因谱中挑选包含此CDR3同源簇的高频抗体重 链和轻链可变区全长氨基酸序列作为第一和第二配对候选序列; (3 ')确定第一和第二配对候选序列的核酸序列; 优选地,步骤(2')所述的挑选包含此候选CDR3同源簇的高频抗体重链和轻链可变区全 长氨基酸序列包括如下步骤:从抗体可变区基因谱中选择包含所述CDR3同源簇的所有 Readl和Read2进行抗体数据库比对,获得最高频的CDR区和FR区的氨基酸序列;同时拼接 Readl和Read2的测序结果,将全部拼接序列进行抗体数据库比对,确定最高频的CDR区和FR 区的氨基酸序列;比较和合并两个来源获得的CDR和FR区氨基酸序列,获得该CDR3同源簇对 应的的抗体可变区全长氨基酸序列作为候选配对序列,在Readl和Read2拼接序列中选择对 应的最高频可变区全长核苷酸序列; 优选地,步骤(3 ')所述的可变区全长核苷酸序列与RT法建库获得的包含特定CDR3同源 簇的最高频抗体可变区序列进行比较,获取抗体可变区全长序列作为候选配对序列。9. 根据权利要求1-7中任一项所述的方法,其中,所述方法还包括对筛选得到的抗体进 行鉴定; 优选地,所述鉴定包括用至少一种靶抗原对所得抗体进行鉴定; 优选地,所述鉴定步骤包括体外表达所得抗体的scFv或Fab片段或IgG,将所得scFv、 Fab片段或IgG与靶抗原进行结合力测试; 优选地,所述体外表达方法为通过原核细胞、噬菌体展示方法或酵母系统表达scFv或 者Fab片段,或者通过哺乳细胞外源基因表达Fab或者IgG; 优选地,所述测试方法为ELI SA和/或SPR。
【文档编号】C07K16/28GK106047857SQ201610382201
【公开日】2016年10月26日
【申请日】2016年6月1日
【发明人】陈维之, 洪媛媛, 王晓红, 李世红, 孙中平
【申请人】苏州金唯智生物科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1