对多个混合dna或rna序列进行基因测序的方法及装置的制作方法

文档序号:414986阅读:481来源:国知局
专利名称:对多个混合dna或rna序列进行基因测序的方法及装置的制作方法
技术领域
本发明涉及基因检测技术领域,特别是涉及一种对多个混合的DNA或RNA序列进行基因测序的方法以及装置。
背景技术
在免疫细胞群中,T淋巴细胞受体分子(TCR,T cell rec印tor)和B淋巴细胞受体分子(BCR,B cell receptor)的多样性是以十万到百万计。组成TCR或BCR的a和旦链,不仅各自结构不同,各链的形成还经历了 V、J或V、J、D不同区域中众多基因片段的组

口 o在研究TCR和BCR的多样性时,需要对TCR和BCR的V、J或V、J、D不同区域中众多基因片段进行测序。一般来说,现有的测序技术可以适应一般的基因测序的要求。但是,对于研究TCR和BCR的多样性来说,现有的测序技术的错误率太高,以至于无法根据得到的测序结果,辨别出来的众多基因片段之间的细微区别。

发明内容
本发明主要解决的技术问题是提供一种对多个混合DNA或者RNA序列进行基因测序的方法以及装置,能够利用现有的测序技术提高基因测序的准确性,显著减少基因测序的错误率。
`
为解决上述技术问题,本发明针对不同的起始模板,分别采用了两种技术方案,对于以多个混合的DNA序列为模板进行基因测序的,采用的一个技术方案是包括将M对第一上游引物序列与第一下游引物序列和免疫细胞群中T淋巴细胞受体TCR和/或B淋巴细胞受体BCR的N个DNA序列的溶液混合,并进行两个循环的PCR反应,获得第一 PCR产物,其中,所述M和N是自然数,M大于或等于一百倍的N,所述第一上游引物序列或第一下游引物序列从5’端到3’端依次包含接头序列、标签序列以及第一上游基础引物序列或第一下游基础引物序列,每对第一上游引物序列与第一下游引物序列的标签序列使得每个DNA序列经过PCR反应后具有不同于其它DNA序列的标签序列,所述接头序列是使每个DNA序列同等地进行PCR反应的序列,所述第一上游基础引物序列与第一下游基础引物序列分别与所述DNA序列两条单链的3’末端互补;对所述第一 PCR产物进行分离纯化,获得第一 DNA产物,所述第一 DNA产物的每条单链的两端均包含所述第一上游引物序列与第一下游引物序列的互补序列,或包含所述第一上游引物序列的互补序列与第一下游引物序列;将所述获得的第一 DNA产物与第二上游引物序列和第二下游引物序列的溶液混合,并进行二十五至四十个循环的PCR反应,获得第二 PCR产物,其中,所述第二上游引物序列包含所述第一上游引物序列中的接头序列,所述第二下游引物序列包含所述第一下游引物序列中的接头序列;对所述第二 PCR产物进行分离纯化,获得第二 DNA产物;对所述第二 DNA产物进行基因测序,并分析测序结果,获得每个DNA序列的测序结果。其中,所述接头序列包括测序引物序列、测序公司标识序列以及测序公司接头序列,所述测序引物序列、测序公司标识序列以及测序公司接头序列顺序连接,所述测序引物序列连接所述第一上游引物序列或第一下游引物序列的标签序列,所述测序公司标识序列用于区别来自不同样本的多个DNA序列。其中,所述第二上游引物序列包含所述第一上游引物序列中的测序公司接头序列,所述第二下游引物序列包含所述第一下游引物序列中的测序公司接头序列。其中,所述标签序列的碱基个数是八个,或者七个,或者六个。其中,所述对第二 DNA产物进行基因测序,并分析测序结果,获得每个DNA序列的测序结果的步骤,包括对所述第二 DNA产物进行基因测序,获得DNA测序结果;将所述DNA测序结果按照标签序列进行分类整理,获得属于同一个DNA序列的所有的DNA测序结果;比较所述属于同一个DNA序列的所有的DNA测序结果,并统计所述所有的DNA测序结果中每个位置出现相同碱基的频次;判断所述每个位置出现相同碱基的频次是否达到预定的阈值;若达到预定的阈值,则确定所述属于同一个DNA序列的所述位置的碱基,按照所述方法,即可确定所述属于同一个DNA序列的所有位置的碱基。为解决上述技术问题,本发明采用的另一个技术方案是提供一种对多个混合的DNA序列进行基因测序的装置,所述装置包括第一获得模块,用于将M对第一上游引物序列与第一下游引物序列和免疫细胞群中T淋巴细胞受体和/或B淋巴细胞受体的N个DNA序列的溶液混合,并进行两个循环的PCR反应,获得第一 PCR产物,其中,所述M和N是自然数,M大于或等于一百倍的N,所述第一上游引物序列或第一下游引物序列从5’端到3’端依次包含接头序列、标签序列以及第一上游基础引物序列或第一下游基础引物序列,每对第一上游引物序列与第一下游引物序列的标签序列使得每个DNA序列经过PCR反应后具有不同于其它DNA序列的标签序列,所述接头序列是使每个DNA序列同等地进行PCR反应的序列,所述第一上游基础引物序列与第一下游基础引物序列分别与所述DNA序列两条单链的3’末端互补;第二获得模块,用于对所述第一 PCR产物进行分离纯化,获得第一 DNA产物,所述第一 DNA产物的每条单链的两端均包含所述第一上游引物序列与第一下游引物序列的互补序列,或包含所述第一上游引物序列的互补序列与第一下游引物序列;第三获得模块,用于将所述获得的第一 DNA产物与第二上游引物序列和第二下游引物序列的溶液混合,并进行二十五至四十个循环的PCR反应,获得第二 PCR产物,其中,所述第二上游引物序列包含所述第一上游引物序列中的接头序列,所述第二下游引物序列包含所述第一下游引物序列中的接头序列;第四获得模块,用于对所述第二 PCR产物进行分离纯化,获得第二DNA产物;测序结果获得模块,用于对所述第二 DNA产物进行基因测序,并分析测序结果,获得每个DNA序列的测序结果。其中,所述接头序列包括测序引物序列、测序公司标识序列以及测序公司接头序列,所述测序引物序列、测序公司标识序列以及测序公司接头序列顺序连接,所述测序引物序列连接所述第一上游引物序列或第一下游引物序列的标签序列,所述测序公司标识序列用于区别来自不同样本的多个DNA序列。其中,所述第二上游引物序列包含所述第一上游引物序列中的测序公司接头序列,所述第二下游引物序列包含所述第一下游引物序列中的测序公司接头序列。

其中,所述标签序列的碱基个数是八个,或者七个,或者六个。其中,所述测序结果获得模块包括第一获得单元,用于对所述第二 DNA产物进行基因测序,获得DNA测序结果;第二获得单元,用于将所述DNA测序结果按照标签序列进行分类整理,获得属于同一个DNA序列的所有的DNA测序结果;统计单元,用于比较所述属于同一个DNA序列的所有的DNA测序结果,并统计所述所有的DNA测序结果中每个位置出现相同碱基的频次;判断单元,用于判断所述每个位置出现相同碱基的频次是否达到预定的阈值;确定单元,用于在达到预定的阈值时,确定所述属于同一个DNA序列的所述位置的碱基,直到确定所述属于同一个DNA序列的所有位置的碱基。对于以多个混合RNA为模板,进行测序的,本发明采用的另一个技术方案是提供一种对多个混合的RNA序列进行基因测序的方法,包括将M个反转录引物序列与免疫细胞群中T淋巴细胞受体TCR和/或B淋巴细胞受体BCR的N个RNA序列的溶液混合,进行反转录反应,获得cDNA序列的产物,其中,所述M和N是自然数,M大于或等于一百倍的N,所述反转录引物序列从5’端到3’端依次包含接头序列、标签序列以及反转录基础引物序列,所述反转录基础引物序列与所述RNA序列的3’末端互补;将所述获得的cDNA序列的产物与M个前端引物序列的溶液混合反应后,再进行一个循环的PCR反应,获得第三PCR产物,其中,所述前端引物序列从5’端到3’端依次包含接头序列、标签序列以及前端基础引物序列,所述前端基础引物序列与所述cDNA序列的3’末端互补;对所述第三PCR产物进行分离纯化,获得第三DNA产物,所述第三DNA产物的每条单链的两端均包含所述反转录引物序列与前端引物序列的互补序列,或包含所述反转录引物序列的互补序列与前端引物序列;将所述获得的第三DNA产物与第三上游引物序列和第三下游引物序列的溶液混合,并进行二十五至四十个循环的PCR反应,获得第四PCR产物,其中,所述第三上游引物序列包含所述前端引物序列中的接头序列,所述第三下游弓I物序列包含所述反转录弓I物序列中的接头序列;对所述第四PCR产物进行分离纯化,获得第四DNA产物;对所述第四DNA产物进行基因测序,并分析测序结果,获得每个DNA序列的测序结果;其中,反转录引物序列与前端弓I物序列的标签序列使得每个第三DNA产物的DNA序列具有不同于其它DNA序列的标签序列,所述接头序列是使每个第三DNA产物的DNA序列同等地进行PCR反应的序列。

其中,所述第三上游引物序列或第三下游引物序列包含测序引物序列、测序公司标识序列以及测序公司结合序列,所述第三上游引物序列的测序引物序列包含前端引物序列中的接头序列,所述第三下游引物序列的测序弓I物序列包含反转录引物序列中的接头序列。本发明的有益效果是区别于现有技术的情况,本发明主要利用了一对第一上游弓I物序列与第一下游引物序列,这对引物序列除了包含基础引物序列外,还包含接头序列和标签序列,标签序列使得每个DNA序列经过PCR反应后具有不同于其它DNA序列的标签序列,经过PCR反应以及测序后,即可获得每个DNA序列的多个测序结果,通过分析每个DNA序列的多个测序结果,可以辨别每个DNA序列的每个位置的碱基是否是其它外部实验因素导致的基因突变,因而可以提高基因测序的准确性,显著减少基因测序的错误率;另外由于给每个DNA都加上了一个标签序列,通过计算标签序列可以准确测定每种DNA片段在起始DNA混合物中的拷贝数。


图1是本发明对多个混合的DNA序列进行基因测序的方法一实施方式的流程图2是本发明对多个混合的DNA序列进行基因测序的方法另一实施方式的流程图;图3是本发明对多个混合的DNA序列进行基因测序的方法中两次PCR反应的原理示意图;图4是本发明对多个混合的DNA序列进行基因测序的方法中两次PCR反应的另一原理示意图;图5是本发明对多个混合的DNA序列进行基因测序的装置一实施方式的结构示意图;图6是本发明对多个混合的RNA序列进行基因测序的方法一实施方式的流程图;图7是本发明对多个混合的RNA序列进行基因测序的方法中反转录及两次PCR反应的原理不意图;图8是本发明对多个混合的RNA序列进行基因测序的方法中反转录及两次PCR反应的另一原理不意图。
具体实施例方式下面结合附图和实施方式对本发明进行详细说明。参阅图1,图1是本发明对多个混合的DNA序列进行基因测序的方法两个实施方式的流程图,包括步骤SlOl :将M对第一上游引物序列与第一下游引物序列和免疫细胞群中TCR和/或BCR的N个DNA序列的溶液混合,并进行两个循环的PCR反应,获得第一 PCR产物,其中,M和N是自然数,M大于或等于一百倍的N,第一上游引物序列或第一下游引物序列从5’端到3’端依次包含接头序列、标签序列以及第一上游基础引物序列或第一下游基础引物序列,每对第一上游引物序列与第一下游引物序列的标签序列使得每个DNA序列经过PCR反应后具有不同于其它DNA序列的标签序列,接头序列是使每个DNA序列同等地进行PCR反应的序列,第一上游基础引物序列与第一下游基础引物序列分别与DNA序列两条单链的3’末端互补。第一上游引物序列的第一上游基础引物序列与DNA序列一条单链的3’末端互补,第一下游引物序列的第一下游基础引物序列与DNA序列另一条单链的3’末端互补,因此,第一上游基础引物序列和第一下游基础引物序列分别与DNA的两条单链结合,以便于进行PCR反应。与第一上游基础弓I物序列和第一下游基础引物序列连接的标签序列是为了给每个DNA序列带上唯一的标记,该标记使得每个DNA序列经过PCR反应后具有不同于其它DNA序列的标签序列。与标签序列连接的接头序列主要起两个作用,一是为了使每个DNA序列同等地进行PCR反应,二是在后续的进行第二次PCR反应时,第二次PCR的引物由于包含该接头序列,因此,扩增的PCR产物除了原来的DNA序列外,还包括标签序列。将M对第一上游引物序列与第一下游引物序列和免疫细胞群中TCR和/或BCR的N个DNA序列的溶液混合,并进行两个循环的PCR反应,获得第一 PCR产物。其中,M大于或等于一百倍的N,是为了保证N个DNA序列的混合溶液中每个DNA序列经过两个循环的PCR反应后,获得不同于其它DNA序列的标签序列。免疫细胞群中TCR的多样性多达1016,BCR的多样性多达1014,而实际中,免疫细胞群中TCR和BCR的基因的多样性达105,只要标签序列的组合个数至少达到107,足以让每个DNA序列获得唯一的标记。免疫细胞群中TCR和BCR的基因片段的大小在400bp左右。其中,标签序列的碱基个数是八个,或者七个,或者六个。例如,标签序列的碱基个数是八个时,可以获得IO9个不同的标签序列组合;标签序列的碱基个数是七个时,可以获得IO8个不同的标签序列组合;标签序列的碱基个数是六个时,可以获得IO7个不同的标签序列组合。其中,接头序列包括测序引物序列、测序公司标识序列以及测序公司接头序列,测序引物序列、测序公司标识序列以及测序公司接头序列顺序连接,测序引物序列连接第一上游引物序列或第一下游引物序列的标签序列,测序公司标识序列用于区别来自不同样本的多个DNA序列。为了在测序时更好的获得测序仪的所能达到的最好的效果,采用测序公司提供的接头序列是很好的选择,一般包括测序引物序列、测序公司标识序列以及测序公司接头序列,测序引物序列对获得较好的测序结果有帮助,测序公司标识序列有助于区别来自不同样本的多个DNA序列,即同一个样本的多个DNA序列采用同一个测序公司标识序列的接头序列。步骤S102 :对第一 PCR产物进行分离纯化,获得第一 DNA产物,第一 DNA产物的每条单链的两端均包含第一上游引物序列与第一下游引物序列的互补序列,或包含第一上游弓I物序列的互补序列与第一下游引物序列。

第一 PCR产物是包含第一 DNA产物的不同大小片段的混合物,经过分离纯化后,获得片段大小基本一致的第一 DNA产物的混合物,即每条单链的两端均包含第一上游引物序列与第一下游引物序列的互补序列,或包含第一上游引物序列的互补序列与第一下游引物序列。步骤S103 :将获得的第一 DNA产物与第二上游引物序列和第二下游引物序列的溶液混合,并进行二十五至四十个循环的PCR反应,获得第二 PCR产物,其中,第二上游引物序列包含第一上游引物序列中的接头序列,第二下游引物序列包含第一下游引物序列中的接头序列。第一 DNA产物是在经过两个循环的PCR反应后得到的,数量和质量都很少,无法满足后续要求,因此,要得到大量的满足要求的第一 DNA产物,需要进行第二次的PCR反应。
第二上游引物序列包含第一上游引物序列中的接头序列,第二下游引物序列包含第一下游引物序列中的接头序列,因此,通过二十五至四十个循环的PCR反应,可以获得大量的包含第一 DNA产物的DNA序列,即第二 PCR产物。其中,在步骤SlOl中,接头序列包括测序引物序列、测序公司标识序列以及测序公司接头序列时,则第二上游引物序列包含第一上游引物序列中的测序公司接头序列,第二下游弓I物序列包含第一下游引物序列中的测序公司接头序列。步骤S104 :对第二 PCR产物进行分离纯化,获得第二 DNA产物。第二 PCR产物含有其它的不同大小片段的杂质成分,经过分离纯化后,获得片段大小基本一致的第二 DNA产物的混合物,该第二 DNA产物是大量的纯化的包含第一 DNA产物的DNA序列。步骤S105 :对第二 DNA产物进行基因测序,并分析测序结果,获得每个DNA序列的测序结果。利用现有的测序技术,例如Illumina公司的测序仪,即可对第二 DNA产物进行基因测序,并分析测序结果,获得每个DNA序列的测序结果。步骤S105的具体过程,请参阅图2,包括步骤S201 :对第二 DNA产物进行基因测序,获得DNA测序结果。步骤S202 :将DNA测序结果按照标签序列进行分类整理,获得属于同一个DNA序列的所有的DNA测序结果。因为每个DNA序列都有标签序列,标签序列相同的即为同一个DNA序列。在获得所有DNA测序结果后,根据标签序列进行分类整理,即可获得属于同一个DNA序列的所有的DNA测序结果。 步骤S203 比较属于同一个DNA序列的所有的DNA测序结果,并统计所有的DNA测序结果中每个位置出现相同碱基的频次。例如,同一个DNA序列,总共有10个DNA测序结果,第5个位置有7个测序结果是A,两个测序结果是G,一个测序结果是T,则第5个位置出现A的频次是0. 7,出现G的频次是0.2,出现T的频次是0.1。步骤S204 :判断每个位置出现相同碱基的频次是否达到预定的阈值。

步骤S205 :若达到预定的阈值,则确定属于同一个DNA序列的所述位置的碱基,按照方法,即可确定属于同一个DNA序列的所有位置的碱基。如果设定的每个位置出现相同碱基的频次的预定的阈值是0. 67,根据上述例子,第5个位置出现A的频次是0. 7,因此第5个位置的碱基确定是A。依此类推,可以确定属于同一个DNA序列的所有位置的碱基。参阅图3,图3是本发明对多个混合的DNA序列进行基因测序的方法中两次PCR反应的原理示意图,如图所示,第一上游引物序列21包含接头序列213、标签序列212以及第一上游基础引物序列211,第一下游引物序列22包含接头序列223、标签序列222以及第一下游基础引物序列221。该原理包括步骤S301 :第一上游引物序列21与第一下游引物序列22和DNA序列11的溶液混合,进行两个循环的PCR反应,获得第一 DNA产物41。第一 DNA产物41的每条单链的两端均包含第一上游引物序列21与第一下游引物序列22的互补序列,或包含第一上游引物序列21的互补序列与第一下游引物序列22。步骤S302 :将第一 DNA产物41与第二上游引物序列31和第二下游引物序列32的溶液混合,进行二十五至四十个循环的PCR反应,获得第二 DNA产物42。第二上游引物序列31包含第一上游引物序列21中的接头序列213,第二下游引物序列32包含第一下游引物序列22中的接头序列223。参阅图4,图4是本发明对多个混合的DNA序列进行基因测序的方法中两次PCR反应的另一原理示意图,如图所示,第一上游引物序列61包含接头序列613、标签序列612以及第一上游基础引物序列611,接头序列613包括测序引物序列6131、测序公司标识序列6132以及测序公司接头序列6133 ;第一下游引物序列62包含接头序列623、标签序列622以及第一下游基础引物序列621,接头序列623包括测序引物序列6231、测序公司标识序列6232以及测序公司接头序列6233。该原理包括步骤S401 :第一上游引物序列61与第一下游引物序列62和DNA序列51的溶液混合,进行两个循环的PCR反应,获得第一 DNA产物81。第一 DNA产物81的每条单链的两端均包含第一上游引物序列61与第一下游引物序列62的互补序列,或包含第一上游引物序列61的互补序列与第一下游引物序列62。步骤S402 :将第一 DNA产物81与第二上游引物序列71和第二下游引物序列72的溶液混合,进行二十五至四十个循环的PCR反应,获得第二 DNA产物82。第二上游引物序列71包含第一上游引物序列61中的接头序列613中的测序公司接头序列6133,第二下游引物序列72包含第一下游引物序列62中的接头序列623中的测序公司接头序列6233。本发明主要利用了一对第一上游引物序列与第一下游引物序列,这对引物序列除了包含基础引物序列外,还包含接头序列和标签序列,标签序列使得每个DNA序列经过PCR反应后具有不同于其它DNA序列的标签序列,经过PCR反应以及测序后,即可获得每个DNA序列的多个测序结果,通过分析每个DNA序列的多个测序结果,可以辨别每个DNA序列的每个位置的碱基是否是其它外部实验因素导致的基因突变,因而可以提高基因测序的准确性,显著减少基因测序的错误率;另外通过计算标签序列可以准确测定每个DNA片段的拷贝数。参阅图5,图5是本发明对多个混合的DNA序列进行基因测序的装置一实施方式的结构示意图,该装置包括第一获`得模块101、第二获得模块102、第三获得模块103、第四获得模块104以及测序结果获得模块105。第一获得模块101用于将M对第一上游引物序列与第一下游引物序列和免疫细胞群中T淋巴细胞受体和/或B淋巴细胞受体的N个DNA序列的溶液混合,并进行两个循环的PCR反应,获得第一 PCR产物,其中,M和N是自然数,M大于或等于一百倍的N,第一上游引物序列或第一下游引物序列从5’端到3’端依次包含接头序列、标签序列以及第一上游基础引物序列或第一下游基础引物序列,每对第一上游引物序列与第一下游引物序列的标签序列使得每个DNA序列经过PCR反应后具有不同于其它DNA序列的标签序列,接头序列是使每个DNA序列同等地进行PCR反应的序列,第一上游基础引物序列与第一下游基础引物序列分别与DNA序列两条单链的3’末端互补。其中,接头序列包括测序引物序列、测序公司标识序列以及测序公司接头序列,测序引物序列、测序公司标识序列以及测序公司接头序列顺序连接,测序引物序列连接第一上游引物序列或第一下游引物序列的标签序列,测序公司标识序列用于区别来自不同样本的多个DNA序列。其中,标签序列的碱基个数是八个,或者七个,或者六个。第二获得模块102用于对第一 PCR产物进行分离纯化,获得第一 DNA产物,第一DNA产物的每条单链的两端均包含第一上游引物序列与第一下游引物序列的互补序列,或包含第一上游引物序列的互补序列与第一下游引物序列。
第三获得模块103用于将获得的第一 DNA产物与第二上游引物序列和第二下游引物序列的溶液混合,并进行二十五至四十个循环的PCR反应,获得第二 PCR产物,其中,第二上游引物序列包含第一上游引物序列中的接头序列,第二下游引物序列包含第一下游引物序列中的接头序列。其中,第二上游引物序列包含第一上游引物序列中的测序公司接头序列,第二下游引物序列包含第一下游引物序列中的测序公司接头序列。第四获得模块104用于对第二 PCR产物进行分离纯化,获得第二 DNA产物。测序结果获得模块105用于对第二 DNA产物进行基因测序,并分析测序结果,获得每个DNA序列的测序结果。其中,测序结果获得模块包括第一获得单元、第二获得单元、统计单元、判断单元以及确定单元。第一获得单元用于对第二 DNA产物进行基因测序,获得DNA测序结果;第二获得单元用于将DNA测序结果按照标签序列进行分类整理,获得属于同一个DNA序列的所有的DNA测序结果; 统计单元用于比较属于同一个DNA序列的所有的DNA测序结果,并统计所有的DNA测序结果中每个位置出现相 同碱基的频次;判断单元用于判断每个位置出现相同碱基的频次是否达到预定的阈值;确定单元用于在达到预定的阈值时,确定属于同一个DNA序列的位置的碱基,直到确定属于同一个DNA序列的所有位置的碱基。本发明主要利用了一对第一上游引物序列与第一下游引物序列,这对引物序列除了包含基础引物序列外,还包含接头序列和标签序列,标签序列使得每个DNA序列经过PCR反应后具有不同于其它DNA序列的标签序列,经过PCR反应以及测序后,即可获得每个DNA序列的多个测序结果,通过分析每个DNA序列的多个测序结果,可以辨别每个DNA序列的每个位置的碱基是否是其它外部实验因素导致的基因突变,因而可以提高基因测序的准确性,显著减少基因测序的错误率;另外通过计算标签序列可以准确测定每个DNA片段的拷贝数。参阅图6,图6是本发明对多个混合的RNA序列进行基因测序的方法一实施方式的流程图。如果在实际应用中,获得的免疫细胞群中T淋巴细胞受体TCR和/或B淋巴细胞受体BCR的模板序列是RNA序列,依然可以通过反转录的过程以及专门设计的引物序列获得最终的测序结果。本实施方法即为针对模板序列是RNA序列的情况,该方法包括步骤S501 :将M个反转录引物序列与免疫细胞群中T淋巴细胞受体TCR和/或B淋巴细胞受体BCR的N个RNA序列的溶液混合,进行反转录反应,获得cDNA序列的产物,其中,M和N是自然数,M大于或等于一百倍的N,反转录引物序列从5’端到3’端依次包含接头序列、标签序列以及反转录基础引物序列,反转录基础引物序列与RNA序列的3’末端互补。cDNA序列是与RNA序列互补的单链DNA序列。本步骤S501是反转录过程,在反转录的过程中,反转录酶也是不可缺少的。通过反转录反应,反转录引物序列的标签序列连接在cDNA序列上。M大于或等于一百倍的N,是为了保证反转录出来的每条单链cDNA序列可以获得唯一的区别于其它反转录出来的cDNA序列的标签序列。反转录引物序列从5’端到3’端依次包含接头序列、标签序列以及反转录基础引物序列,反转录基础引物序列与RNA序列的3’末端互补,因而反转录基础引物序列与RNA序列的3’末端结合后,发生反转录反应。接头序列主要起两个作用一是为了使每个DNA序列同等地进行PCR反应,二是在后续的进行第二次PCR反应时,第二次PCR的引物由于包含该接头序列,因此,扩增的PCR产物除了原来的DNA序列外,还包括标签序列。步骤S502 :将获得的cDNA序列的产物与M个前端引物序列的溶液混合反应后,再进行一个循环的PCR反应,获得第三PCR产物,其中,前端引物序列从5’端到3’端依次包含接头序列、标签序列以及前端基础弓I物序列,前端基础弓I物序列与cDNA序列的3’末端互补。步骤S501获得的cDNA序列是单链DNA序列,在步骤S502中加入前端引物序列,前端引物序列的前端基础引物序列与cDNA序列的3’末端互补,在前端引物序列和相关酶的作用下,合成一条与cDNA序列互补的两端分别包含前端引物序列和反转录引物序列互补的单链DNA序列。然后,在反转录弓I物序列和前端引物序列为引物的情况下,通过一个循环的PCR,从而可以获得完整的且两端分别包含反转录引物序列互补的序列和前端引物序列,或包含反转录引物序列和前端引物序列互补的序列的DNA双链。其中,标签序列的碱基个数是八个,或者七个,或者六个。例如,标签序列的碱基个数是八个时,可以获得IO9个不同的标签序列组合;标签序列的碱基个数是七个时,可以获得IO8个不同的标签序列组合;标签序列的碱基个数是六个时,可以获得IO7个不同的标签序列组合。 步骤S503 :对第三PCR产物进行分离纯化,获得第三DNA产物,第三DNA产物的每条单链的两端均包含反转录引物序列与前端引物序列的互补序列,或包含反转录引物序列的互补序列与前端引物序列;第三PCR产物是包含第三DNA产物的混合物,经过分离纯化后,获得片段大小基本一致的第三DNA产物的混合物,第三DNA产物是个包含多条各不相同的DNA双链序列的混合物。且第三DNA产物的每条单链的两端均包含反转录引物序列与前端引物序列的互补序列,或包含反转录弓I物序列的互补序列与前端引物序列。步骤S504 :将获得的第三DNA产物与第三上游引物序列和第三下游引物序列的溶液混合,并进行二十五至四十个循环的PCR反应,获得第四PCR产物,其中,第三上游引物序列包含前端引物序列中的接头序列,第三下游引物序列包含反转录弓I物序列中的接头序列;第三DNA产物是在经过反转录和一个循环的PCR反应后得到的,数量和质量都很少,无法满足后续要求,因此,要得到大量的满足要求的第三DNA产物,需要进行第二次的PCR反应。第三上游引物序列包含前端引物序列中的接头序列,第三下游引物序列包含反转录引物序列中的接头序列,因此,通过二十五至四十个循环的PCR反应,可以获得大量的包含第三DNA产物的DNA序列,即第四PCR产物。其中,第三上游引物序列或第三下游引物序列包含测序引物序列、测序公司标识序列以及测序公司结合序列,第三上游引物序列的测序引物序列包含前端引物序列中的接头序列,第三下游引物序列的测序弓I物序列包含反转录弓I物序列中的接头序列。步骤S505 :对第四PCR产物进行分离纯化,获得第四DNA产物;步骤S506 :对第四DNA产物进行基因测序,并分析测序结果,获得每个DNA序列的测序结果;其中,反转录引物序列与前端引物序列的标签序列使得每个第三DNA产物的DNA序列具有不同于其它DNA序列的标签序列,接头序列是使每个第三DNA产物的DNA序列同等地进行PCR反应的序列。其中,步骤S506具体包括A :对第四DNA产物进行基因测序,获得DNA测序结果。B :将DNA测序结果按照标签序列进行分类整理,获得属于同一个DNA序列的所有的DNA测序结果。C 比较属于同一个DNA序列的所有的DNA测序结果,并统计所有的DNA测序结果中每个位置出现相同碱基的频次。例如,同一个DNA序列,总共有10个DNA测序结果,第5个位置有7个测序结果是A,两个测序结果是G,一个测序结果是T,则第5个位置出现A的频次是0. 7,出现G的频次是0.2,出现T的频次是0.1。D :判断每个位置出现相同碱基的频次是否达到预定的阈值。E :若达到预定的 阈值,则确定属于同一个DNA序列的所述位置的碱基,按照方法,即可确定属于同一个DNA序列的所有位置的碱基。如果设定的每个位置出现相同碱基的频次的预定的阈值是0.67,根据上述例子,第5个位置出现A的频次是0. 7,因此第5个位置的碱基确定是A。依此类推,可以确定属于同一个DNA序列的所有位置的碱基。本发明主要利用了一对反转录引物序列与前端引物序列,这对引物序列除了包含基础引物序列外,还包含接头序列和标签序列,标签序列使得经过反转录和PCR反应获得的每个DNA序列具有不同于其它DNA序列的标签序列,经过PCR反应以及测序后,即可获得每个DNA序列的多个测序结果,通过分析每个DNA序列的多个测序结果,可以辨别每个DNA序列的每个位置的碱基是否是其它外部实验因素导致的基因突变,因而可以提高基因测序的准确性,显著减少基因测序的错误率;另外通过计算标签序列可以准确测定每个DNA片段的拷贝数。参阅图7,图7是本发明对多个混合的RNA序列进行基因测序的方法中反转录及两次PCR反应的原理示意图,如图所示,前端引物序列21’包含接头序列213’、标签序列212’以及前端基础引物序列211’,反转录引物序列22’包含接头序列223’、标签序列222’以及反转录基础引物序列221’。该原理包括步骤S701 :反转录引物序列22’和RNA序列11’的溶液混合,进行反转录反应,获得cDNA产物12,。反转录引物序列22’的反转录基础引物序列221’与RNA序列11’的3’末端结合,在反转录酶的作用下进行反转录反应,生成cDNA产物12’,从而使cDNA产物12’带上反转录引物序列22’的接头序列223’和标签序列222’。
步骤S702 :将cDNA产物12’与前端引物序列21’混合反应,再进行一个循环的PCR反应,获得第三DNA产物41’。步骤S703 :将第三DNA产物41’与第三上游引物序列31’和第三下游引物序列32 ’的溶液混合,进行二十五至四十个循环的PCR反应,获得第四DNA产物42’。第三上游引物序列31’包含前端引物序列21’的接头序列213’,第三下游引物序列32’包含反转录引物序列22’中的接头序列223’。参阅图8,图8是本发明对多个混合的RNA序列进行基因测序的方法中反转录及两次PCR反应的另一原理示意图,如图所示,前端引物序列61’包含接头序列613’、标签序列612’以及前端基础引物序列611’,反转录引物序列62’包含接头序列623’、标签序列622’以及反转录基础引物序列621’。该原理包括步骤S801 :反转录引物序列62’和RNA序列51’的溶液混合,进行反转录反应,获得cDNA产物52,。反转录引物序列62’的反转录基础引物序列621’与RNA序列51’的3’末端结合,在反转录酶的作用下进行反转录反应,生成cDNA产物52’,从而使cDNA产物52’带上反转录引物序列62’的接头序列623’和标签序列622’。步骤S802 :将 cDNA产物52’与前端引物序列61’混合反应后,再进行一个循环的PCR反应,获得第三DNA产物81’。步骤S803 :将第三DNA产物81’与第三上游引物序列71,和第三下游引物序列72’的溶液混合,进行二十五至四十个循环的PCR反应,获得第四DNA产物82’。第三上游引物序列71’包含测序引物序列711’、测序公司标识序列712’和测序公司结合序列713’,测序引物序列711’包含前端引物序列61’的接头序列613’;第三下游引物序列72’包含测序引物序列721’、测序公司标识序列722’和测序公司结合序列723’,测序引物序列721’包含反转录引物序列62’的接头序列623’。以上所述仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
权利要求
1.一种对多个混合的DNA序列进行基因测序的方法,其特征在于,包括 将M对第一上游引物序列与第一下游引物序列和免疫细胞群中T淋巴细胞受体TCR和/或B淋巴细胞受体BCR的N个DNA序列的溶液混合,并进行两个循环的PCR反应,获得第一PCR产物,其中,所述M和N是自然数,M大于或等于一百倍的N,所述第一上游引物序列或第一下游引物序列从5’端到3’端依次包含接头序列、标签序列以及第一上游基础引物序列或第一下游基础弓I物序列,每对第一上游弓I物序列与第一下游弓I物序列的标签序列使得每个DNA序列经过PCR反应后具有不同于其它DNA序列的标签序列,所述接头序列是使每个DNA序列同等地进行PCR反应的序列,所述第一上游基础引物序列与第一下游基础引物序列分别与所述DNA序列两条单链的3’末端互补; 对所述第一 PCR产物进行分离纯化,获得第一 DNA产物,所述第一 DNA产物的每条单链的两端均包含所述第一上游引物序列与第一下游引物序列的互补序列,或包含所述第一上游引物序列的互补序列与第一下游引物序列; 将所述获得的第一 DNA产物与第二上游引物序列和第二下游引物序列的溶液混合,并进行二十五至四十个循环的PCR反应,获得第二 PCR产物,其中,所述第二上游引物序列包含所述第一上游引物序列中的接头序列,所述第二下游引物序列包含所述第一下游引物序列中的接头序列; 对所述第二 PCR产物进行分离纯化,获得第二 DNA产物; 对所述第二 DNA产物进行基因测序,并分析测序结果,获得每个DNA序列的测序结果。
2.根据权利要求1所述的方法,其特征在于,所述接头序列包括测序引物序列、测序公司标识序列以及测序公司接头序列,所述测序引物序列、测序公司标识序列以及测序公司接头序列顺序连接,所述测序引物序列连接所述第一上游引物序列或第一下游引物序列的标签序列,所述测序公司标识序列用于区别来自不同样本的多个DNA序列。
3.根据权利要求2所述的方法,其特征在于,所述第二上游引物序列包含所述第一上游引物序列中的测序公司接头序列,所述第二下游引物序列包含所述第一下游引物序列中的测序公司接头序列。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述标签序列的碱基个数是八个,或者七个,或者六个。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述对第二DNA产物进行基因测序,并分析测序结果,获得每个DNA序列的测序结果的步骤,包括 对所述第二 DNA产物进行基因测序,获得DNA测序结果; 将所述DNA测序结果按照标签序列进行分类整理,获得属于同一个DNA序列的所有的DNA测序结果; 比较所述属于同一个DNA序列的所有的DNA测序结果,并统计所述所有的DNA测序结果中每个位置出现相同碱基的频次; 判断所述每个位置出现相同碱基的频次是否达到预定的阈值; 若达到预定的阈值,则确定所述属于同一个DNA序列的所述位置的碱基,按照所述方法,即可确定所述属于同一个DNA序列的所有位置的碱基。
6.一种对多个混合的DNA序列进行基因测序的装置,其特征在于,包括 第一获得模块,用于将M对第一上游引物序列与第一下游引物序列和免疫细胞群中T淋巴细胞受体和/或B淋巴细胞受体的N个DNA序列的溶液混合,并进行两个循环的PCR反应,获得第一 PCR产物,其中,所述M和N是自然数,M大于或等于一百倍的N,所述第一上游引物序列或第一下游引物序列从5’端到3’端依次包含接头序列、标签序列以及第一上游基础引物序列或第一下游基础引物序列,每对第一上游引物序列与第一下游引物序列的标签序列使得每个DNA序列经过PCR反应后具有不同于其它DNA序列的标签序列,所述接头序列是使每个DNA序列同等地进行PCR反应的序列,所述第一上游基础引物序列与第一下游基础引物序列分别与所述DNA序列两条单链的3’末端互补; 第二获得模块,用于对所述第一 PCR产物进行分离纯化,获得第一 DNA产物,所述第一DNA产物的每条单链的两端均包含所述第一上游引物序列与第一下游引物序列的互补序列,或包含所述第一上游引物序列的互补序列与第一下游引物序列; 第三获得模块,用于将所述获得的第一 DNA产物与第二上游引物序列和第二下游引物序列的溶液混合,并进行二十五至四十个循环的PCR反应,获得第二 PCR产物,其中,所述第二上游引物序列包含所述第一上游引物序列中的接头序列,所述第二下游引物序列包含所述第一下游引物序列中的接头序列; 第四获得模块,用于对所述第二 PCR产物进行分离纯化,获得第二 DNA产物; 测序结果获得模块,用于对所述第二 DNA产物进行基因测序,并分析测序结果,获得每个DNA序列的测序结果。
7.根据权利要求6所述的装置,其特征在于,所述接头序列包括测序引物序列、测序公司标识序列以及测序公司接头序列,所述测序引物序列、测序公司标识序列以及测序公司接头序列顺序连接,所述测序引物序列连接所述第一上游引物序列或第一下游引物序列的标签序列,所述测序公司标识序列用于区别来自不同样本的多个DNA序列。
8.根据权利要求7所述的装置,其特征在于,所述第二上游引物序列包含所述第一上游引物序列中的测序公司接头序列,所述第二下游引物序列包含所述第一下游引物序列中的测序公司接头序列。
9.根据权利要求6至8任一项所述的装置,其特征在于,所述标签序列的碱基个数是八个,或者七个,或者六个。
10.根据权利要求6至8任一项所述的装置,其特征在于,所述测序结果获得模块包括 第一获得单元,用于对所述第二 DNA产物进行基因测序,获得DNA测序结果; 第二获得单元,用于将所述DNA测序结果按照标签序列进行分类整理,获得属于同一个DNA序列的所有的DNA测序结果; 统计单元,用于比较所述属于同一个DNA序列的所有的DNA测序结果,并统计所述所有的DNA测序结果中每个位置出现相同碱基的频次; 判断单元,用于判断所述每个位置出现相同碱基的频次是否达到预定的阈值; 确定单元,用于在达到预定的阈值时,确定所述属于同一个DNA序列的所述位置的碱基,直到确定所述属于同一个DNA序列的所有位置的碱基。
11.一种对多个混合的RNA序列进行基因测序的方法,其特征在于,包括 将M个反转录引物序列与免疫细胞群中T淋巴细胞受体TCR和/或B淋巴细胞受体BCR的N个RNA序列的溶液混合,进行反转录反应,获得cDNA序列的产物,其中,所述M和N是自然数,M大于或等于一百倍的N,所述反转录引物序列从5’端到3’端依次包含接头序列、标签序列以及反转录基础引物序列,所述反转录基础引物序列与所述RNA序列的3’末端互补; 将所述获得的cDNA序列的产物与M个前端弓I物序列的溶液混合反应后,再进行一个循环的PCR反应,获得第三PCR产物,其中,所述前端引物序列从5’端到3’端依次包含接头序列、标签序列以及前端基础引物序列,所述前端基础引物序列与所述cDNA序列的3’末端互补; 对所述第三PCR产物进行分离纯化,获得第三DNA产物,所述第三DNA产物的每条单链的两端均包含所述反转录弓I物序列与前端引物序列的互补序列,或包含所述反转录引物序列的互补序列与前端引物序列; 将所述获得的第三DNA产物与第三上游引物序列和第三下游引物序列的溶液混合,并进行二十五至四十个循环的PCR反应,获得第四PCR产物,其中,所述第三上游引物序列包含所述前端引物序列中的接头序列,所述第三下游引物序列包含所述反转录引物序列中的接头序列; 对所述第四PCR产物进行分离纯化,获得第四DNA产物; 对所述第四DNA产物进行基因测序,并分析测序结果,获得每个DNA序列的测序结果; 其中,反转录引物序列与前端引物序列的标签序列使得每个第三DNA产物的DNA序列具有不同于其它DNA序列的标签序列,所述接头序列是使每个第三DNA产物的DNA序列同等地进行PCR反应的序列。
12.根据权利要求11所述的方法,其特征在于,所述第三上游引物序列或第三下游引物序列包含测序引物序列、测序公司标识序列以及测序公司结合序列,所述第三上游引物序列的测序弓I物序列包含前端弓I物序列中的接头序列,所述第三下游弓I物序列的测序弓I物序列包含反转录弓I物序列中的接头序列。
全文摘要
本发明公开了一种对多个混合的DNA或RNA序列进行基因测序的方法及装置,主要是在建库前给每个DNA或RNA模版序列两端加入随机标签。方法包括将含有随机标签和接头的第一上游引物与第一下游引物和DNA序列混合,进行两个PCR循环的多重PCR扩增,纯化该PCR产物,获得第一DNA产物;将第一DNA产物与含有样品索引序列和接头的第二上游引物和第二下游引物混合,进行PCR反应,获得第二PCR产物;纯化后获得第二DNA产物;对第二DNA产物进行测序,获得每个DNA序列的测序结果。本发明通过引入随机标签到每个DNA分子,能够提高测序的准确性,显著减少测序的错误率,且准确测定每种DNA的拷贝数。
文档编号C12Q1/68GK103045726SQ20121047229
公开日2013年4月17日 申请日期2012年11月20日 优先权日2012年11月20日
发明者李周芳, 贺建奎, 施国宁 申请人:南方科技大学, 深圳市瀚海基因生物科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1