Tcr或bcr高通量测序的方法及利用标签序列矫正多重pcr引物偏差的方法

文档序号:463402阅读:1282来源:国知局
Tcr或bcr高通量测序的方法及利用标签序列矫正多重pcr引物偏差的方法
【专利摘要】本发明提供了一种对TCR或BCR进行高通量测序的方法,该方法根据TCR或BCR的V区基因特征设计上游引物,根据TCR或BCR的C区或J区基因特征设计下游引物,结合多重PCR技术和高通量测序,获得TCR或BCR的序列,从而分析TCR或BCR的重排信息;采用本发明提供的2个循环的多重PCR技术,相比现有多重PCR的25~30个循环,能大大降低引物扩增偏好引入的测序误差;此外,本发明还提供了一种利用DNA标签序列矫正多重PCR的引物偏差的方法,进一步降低引物扩增偏好引入的测序误差以及高通量测序固有的测序错误。
【专利说明】TCR或BCR高通量测序的方法及利用标签序列矫正多重PCR引物偏差的方法
【技术领域】
[0001]本发明属于分子生物学领域,特别是涉及一种TCR或BCR高通量测序的方法以及一种利用标签序列矫正多重PCR引物偏差的方法。
【背景技术】
[0002]T或B淋巴细胞发育成熟过程中,通过V (D) J基因组合、连接多样性,以及体细胞高频突变、基因转换和类别转换等途径形成数量庞大且种类多样的TCR或BCR受体库,免疫细胞群中TCR的多样性多达1016,BCR的多样性多达1014,传统的方法比如SSCP技术、GeneScan技术、荧光定量溶解曲线技术等,常存在覆盖率范围窄的缺点,不能满足数量繁多、种类多样的的检测。
[0003]高通量测序可以满足庞大的序列测序要求。但是,使用Roche454测序平台和Illumina的solexa或Genome Analyzer测序平台等高通量测序技术进行测序时,一般需要进行测序前样本的文库构建,由于TCR或BCR的多样性,引物的扩增偏好性以及模板丰度的差异等因素,建库时引物设计显得尤为重要;此外,现有技术建库时,常在引物的5’端连接标签序列来追踪特异的目标序列,但是标签序列使得引物序列延长,提高了引物的复杂性,多对引物同时使用时,采用普通的PCR无法满足高通量测序建库的要求,还可能会引起PCR引物的扩增误差。
[0004]因此,有必要提供一种TCR或BCR高通量测序的方法以及构建高通量测序文库时矫正PCR引物扩增偏差的 方法以及降低高通量测序固有的测序错误。

【发明内容】

[0005]鉴于此,本发明第一方面提供了一种对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法,该方法根据TCR或BCR的V区基因特征设计了上游引物,根据TCR或BCR的C区或J区基因特征设计了下游引物,再采用2个循环的多重PCR技术进行扩增,并结合高通量测序,能快速、便捷的获得较准确的TCR或BCR的序列,能更全面地反映TCR或BCR的种类,且降低了现有技术中高通量测序误差。本发明第二方面提供了一种对T淋巴细胞受体或B淋巴细胞受体全长基因进行高通量测序的方法。本发明第三方面提供了一种对T淋巴细胞受体或B淋巴细胞受体CDR3区基因进行高通量测序的方法。本发明第四方面提供了一种利用DNA标签序列以及高通量测序对T淋巴细胞受体或B淋巴细胞受体进行定量分析的方法。本发明第五方面提供了一种利用DNA标签序列矫正多重PCR的引物偏差的方法,该方法能降低测序文库构建过程中由于引物序列对模板的扩增偏好引入的误差以及降低高通量测序固有的测序错误。
[0006]第一方面,本发明提供了一种对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法,包括M种上游引物和至少一种下游引物,所述M种上游引物的设计方法为:根据T淋巴细胞受体TCR或B淋巴细胞受体BCR的可变区V区基因序列的特征,分别设计M种与所述TCR或BCR的V区基因家族上游序列互补的上游引物,其中,所述M为自然数;所述至少一种下游引物的设计方法为:根据TCR或BCR的恒定区C区的基因序列的特征,设计至少一种与TCR或BCR的C区基因序列互补的下游引物,或根据TCR或BCR的连接区J区的基因序列的特征,设计至少一种与TCR或BCR的J区基因序列互补的下游引物。
[0007]优选地,所述上游引物和下游引物分别与所述待测TCR全长或TCR的⑶R3区基因两条链的3’末端互补。
[0008]优选地,所述上游引物和下游引物分别与所述待测BCR全长或BCR的⑶R3区基因两条链的3’末端互补。
[0009]优选地,所述设计M种上游引物的过程中,为根据BCR的Vh1、Vh2、Vh3、Vh4、Vh5、Vh6和Vh7家族的leader区基因序列的特征分别设计至少一条上游引物,分别得到全长_VH1、全长_VH2、全长_VH3、全长_VH4、全长_VH5、全长-Vh6和全长_VH7的上游引物。
[0010]进一步优选地,所述全长-VhI的上游引物的碱基序列如SEQ ID NO:1~SEQ IDNO:7所示,所述全长-VH2的上游引物的碱基序列如SEQ ID N0:8所示,所述全长_VH3的上游引物的碱基序列如SEQ ID N0:9~SEQ ID NO: 14所示,所述全长_VH4的上游引物的碱基序列如SEQ ID NO: 15~SEQ ID NO: 18所示,所述全长_VH5的上游引物的碱基序列如SEQID NO: 19~SEQ ID NO: 20所示,所述全长_VH6的上游引物的碱基序列如SEQ ID NO: 21所示,所述全长_Vh7的上游引物的碱基序列SEQ ID NO:22所示。
[0011]优选地,所述设计M种上游引物的过程中,为根据BCR的Vh1、Vh2、Vh3、Vh4、Vh5、Vh6和Vh7家族的CDR3区上游的保守区FR3基因序列的特征分别设计至少一条上游引物,分别得到 CDR3-Vh1、CDR3-Vh2、CDR3-Vh3、CDR3-Vh4、CDR3-Vh5、CDR3-Vh6 和 CDR3_VH7 的上游引物。
[0012]进一步优选地,`所述⑶R3-VH1的上游引物的碱基序列如SEQ ID NO:28~SEQ IDNO: 33所示,所述⑶R3-Vh2的上游引物的碱基序列如SEQ ID NO: 34所示,所述⑶R3_VH3的上游引物的碱基序列如SEQ ID NO: 35所示,所述⑶R3_VH4的上游引物的碱基序列如SEQID N0:36所示,所述CDR3-VH5的上游引物的碱基序列如SEQ ID NO: 37所示,所述CDR3_VH6的上游引物的碱基序列如SEQ ID勵:38所示,所述^1?3-¥117的上游引物的碱基序列如SEQID NO:39 所示。
[0013]优选地,所述设计至少一种下游引物的过程中,为根据BCR膜表面免疫球蛋白mIgG、mIgA、mIgM、mIgE或mlgD的C区基因序列的特征分别设计至少一种下游引物,分别得到 mlgG、mlgA、mlgM、mlgE 或 mlgD 下游引物。
[0014]进一步优选地,所述mlgG的下游引物的序列如SEQ ID NO: 23所示,所述mlgA的下游引物的碱基序列如SEQ ID N0:24所示,所述mlgM的下游引物的碱基序列如SEQ ID NO:25所示,所述mlgE的下游引物的碱基序列如SEQ ID NO: 26所示,所述mlgD下游引物的碱基序列如SEQ ID NO:27所示。
[0015]本发明通过在TCR或BCR的可变区(variable)基因设置上游引物序列,在TCR或BCR的连接区(joining) J基因或恒定区(constant) C基因设置下游引物序列,通过多重PCR扩增出目的链的PCR产物构建高通量测序文库。本发明采用2个循环的多重PCR技术,相比采用25~30个循环,本发明提供的方法能充分发挥标签序列的功能,降低PCR引物扩增偏好引入的测序误差。
[0016]采用本发明带标签序列的引物构建高通量测序文库时,2个循环的多重PCR尤为关键,因为进行了 2个循环的扩增后,每个DNA分子已经带上独特的标签,若再进行扩增,会使得带该标签的DNA分子更换新的标签,从而无法追踪该DNA分子在样品中的初始情况;因此,设计带标签的多对引物进行多重PCR时,采用2次循环,若采用25~30个循环的多重PCR,将导致极高比例的扩增错误。
[0017]需要指明的是,本发明提供的多重PCR引物不带标签时,也可以采用25~30个循环的多重PCR构建高通量测序文库。
[0018]编码B淋巴细胞受体的基因位于不同的染色体上,其中,C基因片段编码BCR重链和轻链的恒定区(C区);轻链V基因和J基因编码轻链可变区(V区);重链V、J基因片段和D基因片段编码重链可变区(V区)。B淋巴细胞发育成熟过程中,通过V (D)J基因组合、连接多样性,以及体细胞高频突变、基因转换和类别转换等途径形成数量庞大且种类多样的BCR受体库。
[0019]当在可变区(variable)基因的leader区设置上游引物序列时,可扩增BCR全长,当在可变区(variable)基因的CDR3区上游(即FR3区)设置上游引物序列时,可扩增BCR的CDR3区。本发明对BCR的V基因7大类家族ORF (分别为FRl、CDRl、FR2、CDR2、FR3、CDR3和FR4)的同源性进行了分析,并在V基因的leader区设计了 22条BCR上游引物,在⑶R3区上游设计了 12条BCR上游引物。
[0020]本发明的提供的全长上游引物序列(全长-Vh1、全长_VH2、全长_VH3、全长_VH4、全长_Vh5、全长_Vh6和全长_Vh7的上游引物)和下游引物序列(mlgG、mlgA、mlgM、mlgE或mlgD下游引物)配对,可覆盖BCR轻重链V区的⑶R1、⑶R2和⑶R3三个高变区,三者均参与对抗原的识别,共同决定BCR的抗原特异性;本发明的提供的CDR3上游引物序列(CDR3-Vh1、CDR3-Vh2、CDR3-Vh3、CDR3_Vh4、CDR3_Vh5、CDR3_Vh6 和 CDR3_VH7 的上游引物)和下游引物序列(mlgG、mlgA、mlgM、 mlgE或mlgD下游引物)配对,可对BCR的Q)R3高变区进行测序,该区是最重要的、研究最多BCR可变区。
[0021]本发明提供的BCR高通量测序文库能获得的长度和数量丰富的BCR序列,有利于BCR序列的多态性程度分析及BCR序列的长度多态性分布分析。
[0022]优选地,所述下游引物的5’端和上游引物的5’端分别包括标签序列,所述标签序列为由6~8个核苷酸序列组成的序列条码,其中,所述序列条码之间至少有一个核苷酸不同。
[0023]优选地,本发明提供的标签序列可以给待测样品中的每个RNA分子或DNA分子都加上了一个标签序列,所述标签序列由ATCG四种基本碱基随机组合,且所述标签序列互不相同,例如,标签序列的碱基个数是八个时(本发明实施例中表示为8N标签序列),可以获得IO9个不同的标签序列组合;标签序列的碱基个数是七个时,可以获得IO8个不同的标签序列组合;标签序列的碱基个数是六个时,可以获得IO7个不同的标签序列组合,所述标签序列的碱基个数是八个,或者七个,或者六个。
[0024]优选地,本发明提供的标签序列可以给待测样品中的每个RNA分子或DNA分子都加上了一个标签序列。
[0025]由于二代测序存在固有的测序错误(sequencing errors),因此有一些碱基会被读错,对序列的判断有影响。本发明采用的带标签的多重PCR引物能降低高通量测序误差,甚至能检测出单个碱基突变。因为当带有标签序列的引物进行多个循环的PCR扩增后,每个序列都带上了不同于其它序列的标签序列,通过计算标签序列的个数就可以知道每种DNA片段在起始DNA混合物中的拷贝数,做到定量分析;此外,每个序列被PCR扩增,经过测序后,即可获得每个DNA序列的多个测序结果,通过分析每个DNA序列的多个测序结果,确定正确的碱基序列,因此可以降低高通量测序的仪器、测序方法本身的系统误差,从而提高测序的准确性。
[0026]优选地,所述通过分析每个DNA序列的多个测序结果,确定正确的碱基序列的步骤,包括:将所述DNA测序结果按照标签序列进行分类整理,获得属于同一个DNA序列的所有的DNA测序结果;比较所述属于同一个DNA序列的所有的DNA测序结果,并统计所述所有的DNA测序结果中每个位置出现相同碱基的频次;判断所述每个位置出现相同碱基的频次是否达到预定的阈值;若达到预定的阈值,则确定所述属于同一个DNA序列的所述位置的碱基,按照所述方法,即可确定所述属于同一个DNA序列的所有位置的碱基。
[0027]优选地,统计所述所有的DNA测序结果中每个位置出现相同碱基的频次后,每个位点喊基是根据该位点出现的频率最闻者的喊基而确定的。
[0028]若待测样品为RNA序列,基于同样的原理,可以确定属于同一个RNA序列的所有位
置的碱基。
[0029]特别要说明的是,本发明第三方面提供的检测B淋巴细胞受体的方法以人的BCR为样本,其仅为本发明优选的实施例,除此以外,还可以根据需要选用鼠、斑马鱼等为样本进行引物序列设计。
[0030]优选地,所述T淋巴 细胞受体(TCR)或B淋巴细胞受体(BCR)待测RNA序列为采用RNA试剂盒提取人外周血单个核细胞的获得的总RNA的序列。
[0031]第二方面,本发明提供了一种对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法,包括如下步骤:
[0032]取待测样品;
[0033]采用mlgG、mlgA、mlgM、mlgE及mlgD下游引物与所述全长-Vh1、全长_VH2、全长_VH3、全长_VH4、全长_VH5、全长-Vh6和全长-Vh7的上游引物随机组合成配对引物,然后进行多重PCR反应,扩增BCR全长;
[0034]将所得多重PCR产物进行建库后进行高通量测序,获得检测结果。
[0035]优选地,所述多重PCR反应为2个循环的多重PCR反应。
[0036]优选地,所述全长-VhI的上游引物的碱基序列如SEQ ID NO:1~SEQ ID NO: 7所示,所述全长_VH2的上游引物的碱基序列如SEQ ID N0:8所示,所述全长-VH3的上游引物的碱基序列如SEQ ID N0:9~SEQ ID NO: 14所示,所述全长_VH4的上游引物的碱基序列如SEQ ID NO: 15~SEQ ID NO: 18所示,所述全长_VH5的上游引物的碱基序列如SEQ IDNO: 19~SEQ ID NO: 20所示,所述全长_VH6的上游引物的碱基序列如SEQ ID NO: 21所示,所述全长_Vh7的上游引物的碱基序列SEQ ID NO: 22所示。
[0037]优选地,所述mlgG的下游引物的序列如SEQ ID NO: 23所示,所述mlgA的下游引物的碱基序列如SEQ ID N0:24所示,所述mlgM的下游引物的碱基序列如SEQ ID N0:25所示,所述mlgE的下游引物的碱基序列如SEQ ID NO: 26所示,所述mlgD下游引物的碱基序列如SEQ ID NO:27所示。
[0038]当所述取待测样品为DNA样品时,进行多重PCR的体系参照普通实验室采用的体系进行配置;当所述取待测样品为RNA样品时,要先进行逆转录合成cDNA,再合成第二链DNA,此时,逆转录合成cDNA的步骤相当于一个循环的多重PCR,合成第二链DNA的步骤也相当于一个循环的多重PCR。
[0039]第三方面,本发明提供了一种对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法,包括如下步骤:
[0040]取待测样品;
[0041]采用mlgG、mlgA、mlgM、mlgE 及 mlgD 下游引物与所述 CDR3_VH1、CDR3_VH2、CDR3-Vh3、CDR3-Vh4、CDR3-Vh5、CDR3-Vh6和CDR3_VH7的上游引物随机组合成配对引物,然后进行多重PCR反应,扩增BCR⑶R3区;
[0042]将所得多重PCR产物进行建库后进行高通量测序,获得检测结果。
[0043]优选地,所述多重PCR反应为2个循环的多重PCR反应。
[0044]优选地,所述CDR3-VH1的上游引物的碱基序列如SEQ ID NO: 28~SEQ ID NO: 33所示,所述⑶R3-Vh2的上游引物的碱基序列如SEQ ID NO: 34所示,所述⑶R3_VH3的上游引物的碱基序列如SEQ ID NO: 35所示,所述⑶R3-VH4的上游引物的碱基序列如SEQ ID NO: 36所示,所述⑶R3-Vh5的上游引物的碱基序列如SEQ ID NO: 37所示,所述⑶R3_VH6的上游引物的碱基序列如SEQ ID NO:38所示,所述⑶R3-VH7的上游引物的碱基序列SEQ ID NO:39所示。
[0045]优选地,所述 mlgG的下游引物的序列如SEQ ID NO: 23所示,所述mlgA的下游引物的碱基序列如SEQ ID N0:24所示,所述mlgM的下游引物的碱基序列如SEQ ID N0:25所示,所述mlgE的下游引物的碱基序列如SEQ ID NO: 26所示,所述mlgD下游引物的碱基序列如SEQ ID NO:27所示。
[0046]当所述取待测样品为DNA样品时,进行多重PCR的体系参照普通实验室采用的体系进行配置;当所述取待测样品为RNA样品时,要先进行逆转录合成cDNA,再合成第二链DNA,此时,逆转录合成cDNA的步骤相当于一个循环的多重PCR,合成第二链DNA的步骤也相当于一个循环的多重PCR。
[0047]本发明第四方面提供了一种利用DNA标签序列以及高通量测序对T淋巴细胞受体或B淋巴细胞受体进行定量分析的方法,包括:
[0048](I)提供或者制备M对TCR或BCR多重PCR引物
[0049]所述多重PCR引物的下游引物的5’端和上游引物的5’端分别包括标签序列,所述标签序列为由6~8个核苷酸序列组成的序列条码,其中,所述序列条码之间至少有一个核苷酸不同;
[0050](2 )取待测DNA样品,采用步骤(1)所述M对TCR或BCR多重PCR弓丨物进行2个循环的多重PCR,使得每条待测DNA序列带上标签序列;或
[0051 ] 取待测RNA样品,采用步骤(1)所述M对TCR或BCR多重PCR引物的上游引物和下游引物分别进行逆转录反应和cDNA第二链的合成反应,得到带上标签序列的DNA序列,其中,所述上游引物和下游引物为M条上游或下游引物的混合引物;
[0052](3)取步骤(2)得到的产物进行高通量测序;
[0053](4)生物信息学分析,对TCR或BCR进行定量分析,方法如下:
[0054]带相同标签的DNA来源于同一条DNA模板,计算同一条DNA所带标签的种类,记为R,R即为该DNA在待测样品中的条数;即可得该DNA在待测样品中的初始含量。
[0055]第五方面,本发明提供了一种利用DNA标签序列矫正多重PCR的引物偏性的方法,包括以下步骤:
[0056](I)提供或制备M对TCR或BCR多重PCR引物
[0057]所述多重PCR引物的下游引物的5’端和上游引物的5’端分别包括标签序列,所述标签序列为由6~8个核苷酸序列组成的序列条码,其中,所述序列条码之间至少有一个核苷酸不同;
[0058](2)制备多重PCR的模板
[0059]提供或制备N种已知序列的TCR或BCR DNA片段,等摩尔比混合后作为多重PCR模板,其中,N大于M ;
[0060](3)多重 PCR
[0061 ] 取步骤(2 )制备的多重PCR模板,与步骤(1)提供的多重PCR引物进行多重PCR,得到的PCR产物进行高通量测序;
[0062](4)生物信息学分析,矫正多重PCR的引物偏性,方法如下:
[0063](4a)带相同标签的DNA来源于同一条DNA模板,计算出该DNA模板经过多重PCR后测序得到的条数,记为Q,其中,第N种DNA模板经过多重PCR后测序得到的条数为Qn ;
[0064](4b)任一选取2种`以上的DNA模板的Qn,如果Qn都相同,则说明对该序列进行多重PCR的引物在扩增时没有偏性;反之,则有偏性,并判断出现偏性的具体引物对。
[0065]优选地,所述步骤(1)中,所述M对TCR或BCR多重PCR引物为⑶R3_VH1、⑶R3_VH2、CDR3-Vh3、CDR3-Vh4、CDR3_Vh5、CDR3_Vh6 和 CDR3_VH7 上游引物以及 mlgG、mlgA、mlgM、mlgE及mlgD下游引物随机组合配对而成,其中,所述⑶R3-Vh1的上游引物的碱基序列如SEQ IDN0:28~SEQ ID NO:33所示,所述CDR3_VH2的上游引物的碱基序列如SEQ ID N0:34所示,所述⑶R3-Vh3的上游引物的碱基序列如SEQ ID NO: 35所示,所述⑶R3_VH4的上游引物的碱基序列如SEQ ID NO:36所示,所述⑶R3-VH5的上游引物的碱基序列如SEQ ID NO:37所示,所述⑶R3-Vh6的上游引物的碱基序列如SEQ ID NO: 38所示,所述⑶R3_VH7的上游引物的碱基序列SEQ ID NO: 39所示,所述mlgG的下游引物的序列如SEQ ID NO: 23所示,所述mlgA的下游引物的碱基序列如SEQ ID NO: 24所示,所述mlgM的下游引物的碱基序列如SEQ ID NO: 25所示,所述mlgE的下游引物的碱基序列如SEQ ID NO: 26所示,所述mlgD下游引物的喊基序列如SEQ ID N0:27所不。
[0066]优选地,所述步骤(2)中,所述N种已知序列的TCR或BCR DNA片段的制备方法为:
[0067]采用mlgG、mlgA、mlgM、mlgE及mlgD下游引物与所述全长-Vh1、全长_VH2、全长_VH3、全长_VH4、全长_VH5、全长-Vh6和全长-Vh7的上游引物随机组合成配对引物,然后进行多重PCR反应,扩增BCR全长;
[0068]再将PCR产物通过TA克隆后插入质粒载体,将所得质粒载体进行测序并筛选阳性克隆,得到高通量基因测序的对照文库;
[0069]将所得对照文库进行序列分析并和IMGT数据库中V、D和J区基因片段的胚系参考序列进行比对,再将所得对照文库按V、D和J区基因进行归类,得到N种质粒克隆,所述N种质粒克隆包含了 N种已知序列的TCR或BCR DNA片段,即得N种已知序列的TCR或BCRDNA片段。[0070]本发明提供的一种对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法以及一种利用DNA标签序列矫正多重PCR的引物偏差的方法的有益效果为:(I)本发明提供的对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法能获得丰富的TCR或BCR重排信息;本发明提供的全长BCR多重PCR引物以及BCR的CDR3多重PCR可分别用于构建BCR全长高通量测序文库以及BCR的CDR3区高通量测序文库;(2)本发明提供的2个循环的多重PCR技术结合本发明的带标签的多重PCR引物能获得误差更小的高通量测序信息;
(3)本发明提供的对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法对每一个待测TCR或BCR序列加上DNA标签序列,可以在高通量测序中实现TCR或BCR序列的定量分析并进一步减少高通量测序误差;(4)本发明提供的利用DNA标签序列矫正多重PCR的引物偏差的方法,该方法能进一步降低高通量测序文库构建过程中由于引物序列对模板的扩增偏好引入的误差。
【专利附图】

【附图说明】
[0071]图1为本发明实施例6多重PCR所得的PCR产物的琼脂糖凝胶电泳图;
[0072]图2~图3为本发明实施例5所得序列的VDJ重组信息进行分析的结果图;
[0073]图4为本发明实施例5所得序列经过SN标签筛除重复计数的拷贝数后的分析结果。
【具体实施方式】
[0074]实施例1
[0075]本发明实施例1提供了一种B淋巴细胞受体(BCR)RNA样品的制备方法,包括如下步骤:
[0076](I)收集健康人的新鲜外周血样本各10毫升(ml);
[0077](2)采用密度梯度离心原理(Ficoll密度为1.077,PBMC平均密度为1.072),并通过反复离心洗涤,获得相对较纯的PBMC,步骤如下:
[0078]a.将步骤(1)所得血液用PBS或0.09%NaCl分别按1:1稀释;
[0079]b.向15ml离心管中加入所得稀释血液0.5倍体积的淋巴细胞分离液;
[0080]c.将步骤a所得稀释血液缓慢加入步骤b所得的淋巴细胞分离液的表面,保持分离液和血液分层,然后用swing angle离心机离心,转速600g,在下离心20min-25min,离心机加速/减速设置为4 (缓慢升降速);
[0081]d.轻柔收集淋巴细胞带,置于新的15ml离心管(每人/I支),并加PBS至5ml,操作时尽量避免吸到分离液及过多的血浆,然后在室温下,以2500rpm,离心5min,离心机加速/减速设置为9,弃上清;
[0082]e.再向15ml离心管中加入5ml PBS,混匀使细胞重悬,然后在室温下,以1800rpm,离心5min,离心机加速/减速设置为9,弃部分上清,保留Iml上清,然后混匀使细胞重悬,将细胞重悬液转移至1.5ml EP管;
[0083]f.采用Qiagen Rneasy mini kit提取步骤e所得细胞的总RNA,并用Nanodrop2000 (Thermo)测定RNA的浓度及纯度,然后保存总RNA。
[0084]实施例2[0085]本发明实施例2提供了一种采用BCR全长引物进行2个循环的多重PCR,构建BCR全长高通量测序文库,进行高通量测序的方法,包括如下步骤:
[0086](I)将实施例1所得总RNA反转录成cDNA,方法如下:
[0087](1.1)冰上配置如下体系:
[0088]
【权利要求】
1.一种对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法,其特征在于,包括M种上游引物和至少一种下游引物,所述M种上游引物的设计方法为:根据T淋巴细胞受体TCR或B淋巴细胞受体BCR的可变区V区基因序列的特征,分别设计M种与所述TCR或BCR的V区基因家族上游序列互补的上游引物,其中,所述M为自然数;所述至少一种下游引物的设计方法为:根据TCR或BCR的恒定区C区的基因序列的特征,设计至少一种与TCR或BCR的C区基因序列互补的下游引物,或根据TCR或BCR的连接区J区的基因序列的特征,设计至少一种与TCR或BCR的J区基因序列互补的下游引物。
2.如权利要求1所述的一种对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法,其特征在于,所述设计M种上游引物的过程中,为根据BCR的VH1、Vh2、Vh3、Vh4、Vh5、Vh6和Vh7家族的leader区基因序列的特征分别设计至少一条上游引物,分别得到全长_VH1、全长_VH2、全长_VH3、全长_VH4、全长_VH5、全长-Vh6和全长_VH7的上游引物。
3.如权利要求2所述的一种对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法,其特征在于, 所述全长-VhI的上游引物的碱基序列如SEQ ID NO:1~SEQ ID NO: 7所示, 所述全长_Vh2的上游引物的碱基序列如SEQ ID N0:8所示, 所述全长_Vh3的上游引物的碱基序列如SEQ ID NO:9~SEQ ID NO: 14所示, 所述全长_Vh4的上游引物的碱基序列如SEQ ID NO: 15~SEQ ID NO: 18所示, 所述全长_Vh5的上游引物的碱基序列如SEQ ID NO: 19~SEQ ID NO:20所示, 所述全长_Vh6的上游引物的碱基序列如SEQ ID NO:21所示, 所述全长_VH7的上游引物的碱基序列SEQ ID NO:22所示。
4.如权利要求1所述的一种对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法,其特征在于,所述设计M种上游引物的过程中,为根据BCR的VH1、Vh2、Vh3、Vh4、Vh5、Vh6和Vh7家族的CDR3区上游的保守区FR3基因序列的特征分别设计至少一条上游引物,分别得到 CDR3-Vh1、CDR3-Vh2、CDR3-Vh3、CDR3-Vh4、CDR3-Vh5、CDR3-Vh6 和 CDR3_VH7 的上游引物。
5.如权利要求4所述的一种对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法,其特征在于, 所述CDR3-Vh1的上游引物的碱基序列如SEQ ID NO:28~SEQ ID NO:33所示, 所述⑶R3-VH2的上游引物的碱基序列如SEQ ID NO: 34所示, 所述⑶R3-Vh3的上游引物的碱基序列如SEQ ID NO:35所示, 所述⑶R3-Vh4的上游引物的碱基序列如SEQ ID NO:36所示, 所述⑶R3-Vh5的上游引物的碱基序列如SEQ ID NO:37所示, 所述⑶R3-Vh6的上游引物的碱基序列如SEQ ID NO:38所示, 所述⑶R3-VH7的上游引物的碱基序列SEQ ID NO:39所示。
6.如权利要求1所述的一种对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法,其特征在于,所述设计至少一种下游引物的过程中,为根据BCR膜表面免疫球蛋白mIgG、mIgA、mIgM、mIgE或mlgD的C区基因序列的特征分别设计至少一种下游引物,分别得到 mlgG、mlgA、mlgM、mlgE 或 mlgD 下游引物。
7.如权利要求6所述的一种对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法,其特征在于,所述mlgG的下游引物的序列如SEQ ID NO:23所示,所述mlgA的下游引物的碱基序列如SEQ ID N0:24所示,所述mlgM的下游引物的碱基序列如SEQ ID N0:25所示,所述mlgE的下游引物的碱基序列如SEQ ID NO: 26所示,所述mlgD下游引物的碱基序列如SEQ ID NO:27所示。
8.如权利要求1所述的一种对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法,其特征在于,所述下游引物的5’端和上游引物的5’端分别包括标签序列,所述标签序列为由6~8个核苷酸序列组成的序列条码,其中,所述序列条码之间至少有一个核苷酸不同。
9.一种对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法,其特征在于,包括如下步骤: (1)取待测样品; (2)采用mlgG、mlgA、mlgM、mlgE及mlgD下游引物与所述全长-Vh1、全长_VH2、全长_VH3、全长_VH4、全长_VH5、全长-Vh6和全长-Vh7的上游引物随机组合成配对引物,然后进行多重PCR反应,扩增BCR全长;或 采用 mlgG、mlgA、mlgM、mlgE 及 mlgD 下游引物与所述 CDR3_VH1、CDR3_VH2、CDR3_VH3、CDR3-Vh4、CDR3-Vh5、CDR3_Vh6和CDR3_VH7的上游引物随机组合成配对引物,然后进行多重PCR反应,扩增BCR CDR3区; (3)将所得多重PCR产物进行建库后进行高通量测序,获得检测结果。
10.如权利要求9所述的一种对T淋巴细胞受体或B淋巴细胞受体进行高通量测序的方法,其特征在于,所述多重PCR反应为2个循环的多重PCR反应。
11.一种利用DNA标签序列以及高通量测序对T淋巴细胞受体或B淋巴细胞受体进行定量分析的方法,其特征在于,包括: (I)提供或者制备M对TCR或BCR多重PCR弓丨物 所述多重PCR引物的下游引物的5’端和上游引物的5’端分别包括标签序列,所述标签序列为由6~8个核苷酸序列组成的序列条码,其中,所述序列条码之间至少有一个核苷酸不同; (2 )取待测DNA样品,采用步骤(1)所述M对TCR或BCR多重PCR引物进行2个循环的多重PCR,使得每条待测DNA序列带上标签序列;或 取待测RNA样品,采用步骤(1)所述M对TCR或BCR多重PCR弓丨物的上游引物和下游引物分别进行逆转录反应和cDNA第二链的合成反应,得到带上标签序列的DNA序列,其中,所述上游引物和下游引物为M条上游或下游引物的混合引物; (3)取步骤(2)得到的产物进行高通量测序; (4)生物信息学分析,对TCR或BCR进行定量分析,方法如下: 带相同标签的DNA来源于同一条DNA模板,计算同一条DNA所带标签的种类,记为R,R即为该DNA在待测样品中的条数;即可得该DNA在待测样品中的初始含量。
12.一种利用DNA标签序列矫正多重PCR的引物偏差的方法,其特征在于,包括以下步骤: (I)提供或制备M对TCR或BCR多重PCR弓丨物 所述多重PCR引物的下游引物的5’端和上游引物的5’端分别包括标签序列,所述标签序列为由6~8个核苷酸序列组成的序列条码,其中,所述序列条码之间至少有一个核苷酸不同; (2)制备多重PCR的模板 提供或制备N种已知序列的TCR或BCR DNA片段,等摩尔比混合后作为多重PCR模板,其中,N大于M; (3)多重PCR 取步骤(2 )制备的多重PCR模板,与步骤(1)提供的多重PCR引物进行多重PCR,得到的PCR产物进行高通量测序; (4)生物信息学分析,矫正多重PCR的引物偏性,方法如下: (4a)带相同标签的DNA来源于同一条DNA模板,计算出该DNA模板经过多重PCR后测序得到的条数,记为Q,其中,第N种DNA模板经过多重PCR后测序得到的条数为Qn ; (4b)任一选取2种以上的DNA模板的Qn,如果Qn都相同,则说明对该序列进行多重PCR的引物在扩增时没有偏性;反之,则有偏性,并判断出现偏性的具体引物对。
13.如权利要求11所述的利用DNA标签序列矫正多重PCR的引物偏差的方法,其特征在于,所述步骤(1)中,所述
M 对 TCR 或 BCR 多重 PCR 引物为 CDR3_VH1、CDR3_VH2、CDR3_VH3、CDR3_VH4、CDR3_VH5、CDR3-Vh6和CDR3-Vh7上游引物以及mIgG、mIgA、mIgM、mIgE及mlgD下游引物随机组合配对而成,其中, 所述CDR3-Vh1的上游·引物的碱基序列如SEQ ID NO:28~SEQ ID NO:33所示, 所述⑶R3-VH2的上游引物的碱基序列如SEQ ID NO: 34所示, 所述⑶R3-Vh3的上游引物的碱基序列如SEQ ID NO:35所示, 所述⑶R3-Vh4的上游引物的碱基序列如SEQ ID NO:36所示, 所述⑶R3-Vh5的上游引物的碱基序列如SEQ ID NO:37所示, 所述⑶R3-Vh6的上游引物的碱基序列如SEQ ID NO:38所示, 所述⑶R3-VH7的上游引物的碱基序列SEQ ID NO:39所示, 所述mlgG的下游引物的序列如SEQ ID N0:23所示,所述mlgA的下游引物的碱基序列如SEQ ID NO: 24所示,所述mlgM的下游引物的碱基序列如SEQ ID NO: 25所示,所述mlgE的下游引物的碱基序列如SEQ ID N0:26所示,所述mlgD下游引物的碱基序列如SEQ IDNO:27所示。
14.如权利要求11所述的利用DNA标签序列矫正多重PCR的引物偏差的方法,其特征在于,所述步骤(2)中,所述N种已知序列的TCR或BCR DNA片段的制备方法为: 采用mlgG、mlgA、mlgM、mlgE及mlgD下游引物与所述全长-Vh1、全长_VH2、全长_VH3、全长_VH4、全长_VH5、全长-Vh6和全长-Vh7的上游引物随机组合成配对引物,然后进行多重PCR反应,扩增BCR全长; 再将PCR产物通过TA克隆后插入质粒载体,将所得质粒载体进行测序并筛选阳性克隆,得到高通量基因测序的对照文库; 将所得对照文库进行序列分析并和IMGT数据库中V、D和J区基因片段的胚系参考序列进行比对,再将所得对照文库按V、D和J区基因进行归类,得到N种质粒克隆,所述N种质粒克隆包含了 N种已知序列的TCR或BCR DNA片段,即得N种已知序列的TCR或BCR DNA片段。
【文档编号】C12N15/11GK103710454SQ201310752881
【公开日】2014年4月9日 申请日期:2013年12月31日 优先权日:2013年12月31日
【发明者】徐莹, 李周芳, 童寅, 张萌, 葛良进, 贺建奎 申请人:南方科技大学, 深圳市瀚海基因生物科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1