单细胞全基因组扩增方法

文档序号:510930阅读:4181来源:国知局
单细胞全基因组扩增方法
【专利摘要】提供了用于扩增单细胞全基因组的方法和成分。
【专利说明】单细胞全基因组扩增方法
[0001]相关申请号
[0002]该申请请求对下列美国临时专利的优先权:#61/621,271,2012-4-6提交;#61/550, 667,2011-10-24 提交;#61/510, 539,2011-7-22 提交;#61/490, 790,2011-5-27 提交;
[0003]政府利益声明
[0004]该发明获NIH3R01HG005097-02和3R01HG005097-02S1经费支持。政府对该发明
有一定权利。
【技术领域】
[0005]本发明的实施方式通常涉及用于扩增基因组序列如单细胞全基因组扩增的方法与成分。
【背景技术】
[0006]目前使用随机引物扩增DNA与RNA的一个常见问题是引物二聚体的形成。引物使用浓度需要足够高以取得有效扩增,高浓度引物导致二聚体的形成,明显降低引物与DNA或RNA模板的结合。使用随机引物扩增DNA的其它问题包括由于位点丢失而无法扩增基因组的全部,短小扩增物的生成,以及有时无法扩增部分降解或有人工修饰的DNA。
[0007]文献中已经有关于基因组PCR扩增方法的报道,例如US7,718,403,US2003/0108870 和 US7, 402, 386.如 Genom印Iex 和 Picoplex 的 PCR 扩增方法对不同基因位点有明显的偏向(不均一性) ,导致扩增后部分位点丢失。这些方法扩增的细胞产物常常只能测序5-30%的基因组序列。多个置换扩增法(MDA)利用低温扩增,可导致嵌合物的大量形成,这些非基因组本来的序列造成明显的测序假阳性结果以及测序人工假象。虽然全基因组扩增已经有开始尝试,但一般说来这些方法低效,复杂,费用贵。因此,需要发展一种从很少DNA量,比如说单细胞,扩增全基因组的有效方法。

【发明内容】

[0008]该专利涉及一种DNA扩增方法,该扩增方法使用少量基因组DNA,或少量基因组DNA序列,来自于人或其它物种的单细胞,或一种细胞的少数几个细胞,血液或体液。该扩增方法可以用单个反应管,在PCR扩增仪上进行扩增。该方法可用于由单细胞扩增的全基因组DNA的高通量测序,并取得相当的测序深度。
[0009]该专利方法对单细胞全基因组的各不同位点进行高保真,高均一,高测序广度的扩增,扩增物用于高通量测序分析。该方法减少了测序偏向,从而能从单细胞提供出比较全面的,90 %以上,基因组DNA序列信息,在7x,IOx,或15x的测序深度时,可以测得70 %以上的基因组序列信息,并且基本没有嵌合物形成的影响。该方法避免了测序人工假象,推进了单个核苷酸多形性(SNP),基因拷贝数多形性(CNV),基因结构变化(SV)等高级基因组分析,及高通量基因测序分析。该 方法特别有用于有多个细胞群体的生物系统,如肿瘤,神经组织等。
[0010]该专利方法所用弓丨物包含一段共同序列,一段可变序列,一段固定序列。DNA变性后单链的引物与单链模板在低温结合,然后在高温下扩增,使用至少一个具有链置换性能及3’端核酸核酸外切酶活性的聚合酶。在第二个扩增循环结束时,双链DNA(dsDNA),一端有引物的序列结合,另一端有互补引物序列结合,变性产生单链DNA(ssDNA)。反应温度降低到可以使游离引物与单链扩增物的3 ’端杂交的温度,从而防止扩增物自身或相互之间杂交,再降温到适当温度完成引物的结合与下一个扩增循环。
[0011]该专利方法可用于少量或微量DNA扩增,对样品DNA的多个部位进行核型分析或高通量筛选,可用于快速建立针对染色体特定区域的带特异性的探针,微解剖,或扩增未知染色体区域或已标记的异常染色体的标记染色体,用于扩增物的快速克隆或建立DNA库。因此该方法不仅对核型分析与高通量筛选有用,对细胞遗传诊断也有价值。
[0012]该专利方法使用非常规PCR循环扩增方法从单个哺乳动物细胞扩增全基因组序列。某些DNA聚合酶能够产生典型的结果。可以增加一个扩增步骤让游离引物与扩增物上的互补序列结合,比如说3’端,从而防止扩增物自身或相互之间杂交,以至于嵌合物的形成,并提供了去除扩增物两端引物的方法。
[0013]该专利方法扩增一个或几个细胞的全基因组序列。在使用示意中,首先分离单细胞,将之在一定体积的细胞裂解液中裂解,释放基因组DNA,裂解产物可以分成2亚份到10万亚份不等。DNA分离方法可以将同源的两个基因位点分与不同的亚份中,亚份数越多,同源DNA位点分与不同亚份的可能性越高。同源DNA的两个位点分与不同亚份可以用于基因组DNA半倍体的核型分析。不同亚份中的基因组组份可以扩增得到相应部分的基因组扩增物,用于测序分析。两个或两个以上,相同的或不同细胞,的样品可以当作单细胞样品处理分析。
[0014]该专利方法扩增一个或几个细胞的全基因组序列。单细胞的遗传物质可以分成若干亚份,并分别进行扩增分析,从而实现单倍体或二倍体核型分析。该方法可用于没有参考基因组序列,或有复杂结构`变化的基因组的物种的全新基因组测序组装。该方法可采用不同来源的DNA,包括不均一组织,如肿瘤,罕见与珍贵样品,如胚胎干细胞,非分裂细胞,如神经元,等。也可以用于不同测序平台与核型分析方法。单倍体核型分析方法可参见下列文献:Levy, S.et al.The diploid genome sequence of an individualhuman.Plos Biol.5, e254 (2007) ;de Bakker, P.1.et al.A high-resolution HLA andSNP haplotype map for disease association studies in the extended humanMHC.Nat.Genet.38,1166-1172 (2006) ;Nagel,R.L.et al.The Senegal DNA haplotypeis associated with the amelioration of anemia in African-American sicklecell anemia patients.Blood77,1371-1375 (1991) ;Drysdale,C.M.et al.Complexpromoter and coding region beta2_adrenergic receptor haplotypes alterreceptor expression and predict in vivo responsiveness.Proc.Natl.Acad.Sc1.USA97,10483-10488 (2000) ;Sun,T.et al.Haplotypes in matrix metalloproteinasegene cluster on chromosome Ilq22contribute to the risk of lung cancerdevelopment and progression.Clin.Cancer Res.12,7009-7017(2008) ;Kitzman,J.0.etal.Haplotype-resoIved genome sequencing of a Gujarati Indian individual.Nat.Biotech.29,59-63(2011) ;International HapMap Consortium.1ntegrating common andrare genetic variation in diverse human populations.Nature467,52-58(2010);Xiao,M.et.Al.Direct determination of haplotypes from single DNA molecules.Nat.Methods6,199-201 (2009) ;Fan H.C.et al.ffhole-genome molecular haplotyping ofsingle cells.Nat.Biotech.29,51-57(2011).[0015]该专利方法其它相关特性与优势在以下的描述中有更明确的阐述。
【专利附图】

【附图说明】
[0016]该专利上述方法及其它相关特性与优势在下列使用示意中得到明确的阐述。
[0017]图1:单细胞DNA扩增示意图
[0018]图2:单细胞基因组测序结果,测序深度15x。
[0019]图2A:单细胞基因组测序I号染色体全部结果图。
[0020]图3:用于高通量测序的单细胞DNA扩增流程图,包括线性预扩增与指数扩增阶段。
[0021]图4:该专利方法,-多次退火环状循环扩增法(MALBAC)示意图。首先,引物与单链DNA模板结合,被具有链置换活性的聚合酶延伸,产生半扩增物。然后,产生两端有互补序列的单链完全扩增物,后者在中间温度,两端自连,从而在该步骤不能用作模板,而实现近线性扩增,避免了常见的扩增偏向。
[0022]图5A为Lorenz曲线,比较MALBAC,MDA,非扩增样品的测序广度的均一性。单细胞与非扩增样品来自于SW480细胞株。MDA方法的资料来自于Fan et al.,Nat.Biotech.29,5192011).完全均一无偏向的扩增在图中应当是一条对角线,与对角线偏离越远代表扩增偏向越严重。箭头代表没有被扩增的基因组部分(MDA55%,MALBAC15%,未扩增样品5% )。图5B为全基因组读序分布图,MALBAC与未扩增样品结果相似,MDA方法则有大量的低密度区,代表了几个百万`碱基大小的区域在扩增物中被低估或高估。
【具体实施方式】
[0023]该专利涉及到一般常规操作方法,如分子生物学技术,重组DNA技术,微生物学技术,在文献中已有很详细的描述。参见:Sambrook, Fritsch, and Maniatis, MolecularCloning:A laboratory Manual,2nd Edition (1989), Oligonucleotide synthesis(M.J.Gait, Ed., 1984) , Animal Cell Culture (R.1.Freshney, Ed., 1987) , Methods inEnzymology (Academic Press, Inc 系列,Gene Transfer Vectors for Mammalian Cells (J.M.Miller and M.P.Calos eds,1987), Handbook of Experimental Immunology(D.M.Weirand C.C.Blackwell,Eds),Current Protocols in Molecular Biology(F.M.Ausubel et aleds.,1987),Current Protocols in Immunology(J.E.Coligan et al eds.,1991),AnnualReview of Immunology, Advances in Immuno1Igy.[0024]核酸化学,生化,遗传,分子生物学的术语与符号,采用专业内标准用法。具体如Komberg and Baker, DNA Replication,2nd Edition(W.H.Freeman, NY,1992) ;Lehninger,Biochemistry,2nd Edition(Worth Publishers, NY1975) ;Strachan and Read, HumanMolecular Genetics, 2ndEdition(ffiley-Liss, NY,1999) ;Eckstein, editor, Oligonucleotides and analogs:A practical Approach(Oxford University Press, NY,1991) ;Gait,editor,Oligonucleotide synthesis:A Practical Approach(IRL Press, Oxford,1984)
坐寸ο
[0025]该发明部分基于DNA或RNA (如mRNA)扩增方法的建立,使用基因组或转录组材料或两者。这种DNA或RNA可能来自于单细胞,或同一种细胞的少数几个细胞。该方法可以用于扩增任何物种或生物体的DNA,可以在一个PCR管里的一个扩增反应。DNA也可以分成若干亚份,用移液枪或其它微量移液设备,使得每一亚份只包含部分原来的DNA,可能代表了亚细胞水平的基因组DNA,即单细胞基因组的DNA的一部分,并得到相应的扩增与分析。该方法可用于并不依赖特定DNA序列的DNA扩增,其DNA可来源于但不限于人,动物,植物,真菌,病毒等真核或原核细胞DNA。
[0026]该发明方法可用于扩增几乎整个基因组或转录组的全部基因(分别称为全基因组扩增与全转录组扩增),并不会因为丢失某些特定部位而失去扩增序列的可代表性。‘几乎整个’指包含了全基因组序列的80-99%以上的序列。这种扩增有时会对基因组不同部位的序列造成非等量扩增。
[0027]该发明方法可以在单个反应管或微孔板分两步进行。第一步产生扩增库,所用引物包含一段共同序列,一段可变序列和固定序列,以及至少一个具有链置换活性或核酸核酸外切酶活性的聚合酶。该方法包括一个退火后步骤,即使游离引物与扩增物的末端结合,从而防止扩增物自身或相互结合。这种线性扩增可以明显减少扩增偏向的问题。特定的引物设计与退火后步骤,使得基因组的扩增广度达到了最大化。扩增库的分子在第二步进行标准PCR扩增,用Taq聚合酶以及针对已知序列的引物,从而对全基因组或全转录组进行数千倍的无偏向扩增,其产物可以再进一步扩增至数百万倍以上。
[0028]该发明方法使用至少一个DNA聚合酶进行DNA扩增,引物结合到DNA模板,聚合酶从引物的3’端开始合成互补链。具体步骤可以分为模板DNA的变性,引物与模板DNA的结合,聚合酶在模板上延长引物,合成互补链。
[0029]一般来说,DNA扩增开始于dsDNA模板的高温变性,变成ssDNA,降低温度(退火),引物与ssDNA模板结合,体系中的一个或多个聚合酶在模板上延长引物,合成互补链。DNA聚合酶可能含有5’至3’的核酸核酸外切酶活性或链置换活性。
[0030]第一扩增循环后,新合成的互补链的5’端带有引物的序列。上述变性,退火,延伸步骤再被循环重复。
[0031]每一循环结束后,扩增的DNA分子的一端带有引物的序列,另一端带有引物的互补序列。反应条件适当时,游离引物可以与模板结合,从而防止扩增物自身或相互结合。
[0032]DNA模板可以是基因组DNA,微解剖染色体DNA,YAC,粘粒DNA,噬菌体DNA,PACDNA, BAC DNA ;可以来自于哺乳动物,植物,真菌,病毒,或原核DNA ;可以来自于人,牛,狗,猪,鼠,鸟,鱼,奸,植物,真菌,病毒,或细菌。
[0033]该发明方法所用引物包含一段共同(恒定)序列,一段可变序列与一段固定序列,有时也称为类简并引物。共同序列与可变序列包含基本不与自身或反应中的其它引物互补的序列。共同序列最好是已知的,可以是扩增目标序列。可变序列可以随机选择,也可以根据模板DNA来源与序列特性做相应选择。共同序列是反应中各引物共有的,10-30bp长,不包含C。可变序列3-7bp长,可 以包含任何碱基,如果是5个碱基长,则可以有4的5次方个序列组合。固定序列2-4bp长,不含互补序列,如GGG,TTT, GAA, ATG。
[0034]典型的引物可以是5’ -GT GAG TGA TGG TTG AGG TAG TGT GGAGNNNNNGGG-3'和5’ -GT GAG TGA TGG TTG AGG TAG TGTGGA GNNNNNTTT-3 ’。5N3G 与 5N3T 对也可以被下列对替代:5N3G与5N3A对;5N3C与5N3T对;5N3C与5N3A对。共同序列部分可以修饰以减少引物二聚体形成。
[0035]在反应混合液中,有变性后单链的模板与引物,引物可以是一个,也可以是多个简并引物,他们能至少与模板单链分子的某一段结合。模板可以是DNA或RNA。
[0036]在反应混合液中,有引物,模板,以及至少一种带有5’至3’的核酸核酸外切酶活性或链置换活性的DNA聚合酶。链置换活性的DNA聚合酶可以在延伸时打开双链DNA模板,包括029聚合酶,Bst 聚合酶,pyrophage3173, vent 聚合酶,deep vent 聚合酶,TOPO Taq,vent (exo_)聚合酶,deep vent (exo_)聚合酶,9。Nm聚合酶,DNA 聚合酶 Klenow 片段,MMLV反转录酶,AMV反转录酶,HIV反转录酶,T7噬菌体DNA聚合酶的变异型(无核酸外切酶活性),或者他们的任何混合物。一个或多个聚合酶含有5’至3’的核酸核酸外切酶活性,如Taq聚合酶,Bst DNA聚合酶(全长),大肠杆菌DNA聚合酶,LongAmp Taq聚合酶,OneTaq聚合酶,或者他们的任何混合物。
[0037]混合好的反应物会经过多个扩增循环。退火温度在30°C以下,延伸温度可以根据聚合酶种类在10-65 °C以上。029聚合酶在30°C以上活性最好,Bst聚合酶,pyrophage3173(exo-)在62°C以上活性最好。变性温度在90_100°C。另外有个附加的退火温度,55-600C,一般选用58°C,扩增物变性后的混合物,在这个温度,扩增物自身两端结合,暂时不作为模板,从而实现线性扩增。
[0038]扩增物可以进行处理,去除两个末端引物序列,或再进行常规PCR扩增,或直接进行高通量测序分析如果量足够的话。
[0039]DNA变性温度在90_100°C,典`型的是95°C,变性10秒到5分钟,典型的是2分钟。
[0040]退火温度在0_30°C,退火10秒到5分钟。延长温度取决于所用的DNA聚合酶,多个聚合酶存在时可以用温度梯度分别激活不同酶活性,延长时间2-7分钟,典型的是5分钟。
[0041]上述温度与时间等参数可以适当改变,一般不会明显影响扩增效果。
[0042]图3所示,对分离好的单细胞进行裂解,释放基因组DNA,并进行线性预扩增,再进行常规PCR扩增,其最终产物用于高通量测序或筛选。
[0043]根据图1,3和4所示,多重退火成环循环扩增技术(MALBAC)的单细胞基因组扩增条件最初是一个线性预扩增过程,用于扩增出可以覆盖基因组的绝大部分区域的重复片段。预扩增之后是传统的指数扩增,比如PCR,用于进一步扩增基因组。扩增物可以用于第二代测序。
[0044]根据图1,3和4所示,单细胞的核苷酸,比如染色体,是扩增混合体系中的模板。单细胞的核苷酸变性成为单链并作为扩增的模板。在适合的条件下,大量的随机引物与单链核苷酸杂交,在具有链置换活性的聚合酶作用下合成核酸单链模板的互补片段。随机引物包括一段固定碱基和一段简并碱基。扩增过程起始于核酸单链模板中的随机位点。以核酸单链为模板扩增出来的核酸片段被称为第一轮扩增物或者半扩增物。
[0045]与核酸单链模板杂交的互补序列可在合适的条件下变性为单链,可最大限度地提高可用于与引物杂交的核酸单链模板量。扩增混合体系中的核酸双链在链置换聚合酶的作用下变性成单链,增加可与引物和扩增杂交的核酸单链量。
[0046]第一轮扩增物也就是半扩增物的5’端和3’端具有互补性,使半扩增物可以形成环状结构,即为半扩增环。半扩增环的扩增效率很低,半扩增环防止进一步扩增,这是线性扩增的重要步骤。
[0047]线性第一轮扩增物,与核酸单链共同存在于扩增混合体系中。第一轮扩增物和核酸单链作为第二轮反应中的引物模板。
[0048]在适合的条件下,引物杂交在第一轮扩增物和核苷酸单链的不同位置。
[0049]在适合的条件下,链置换活性的聚合酶作用于第一轮扩增物与随机引物的结合部位,扩增出各个第一轮扩增物的互补序列。这个扩增出来的互补序列的末端具有引物的互补序列。以第一轮扩增物为模板扩增出来的产物即为第二轮扩增物或者全扩增物。同样,链置换活性的聚合酶也作用于核酸单链与随机引物的结合处,扩增出核酸单链的互补序列。以遗传核酸单链为模板扩增出的产物是第一轮扩增物。如上所述,一些第一轮扩增物会形成环状的半扩增物。
[0050]互补片段通过退火步骤与扩增混合体系中的核酸杂交,如核酸单链模板、半扩增物或者全扩增物。在适当的条件下,扩增混合体系中的核酸序列变性为单链,能够提高能与引物和扩增物杂交的核酸单链量。尽管使用了具有链置换活性的聚合酶,但扩增体系中仍然具有双链核酸,这些双链核酸同样可以变性形成单链,增加能与引物和扩增物杂交的核
酸单链量。
[0051]为了降低由全扩增物的3’端与另外一个全扩增物或其他核苷酸的5’端结合而导致形成的聚合体,第二轮扩增物的两端互补杂交成一个环状结构,使得第二轮扩增物不能形成聚合体,并不能作为扩增的模板。因此,在适合的条件下,过量的引物与第二轮扩增物的3’端杂交,扩增呈现为线性 模式并无聚合体产生。本专利利用全扩增物的5’端和3’端互补成环状来减少聚合体等的产生,并使全扩增物不能作为下一轮扩增循环的模板,同时扩增混合体系中的DNA和半扩增物可以作为下一轮扩增循环的模板。
[0052]在接下来的循环过程中,在适合的条件下,引物与第一轮扩增物以及核酸单链的各个位点杂交并扩增;然而由于第二轮扩增物或者全扩增物的3’端与引物结合或者5’端和3’端杂交形成环状结构,导致不能进行下一步扩增。随后扩增混合体系处于适合于核酸单链和半扩增物扩增出半扩增物和全扩增物的条件下,接着是适合第二轮扩增物或者全扩增物杂交成环状结构的条件。根据需要重复循环过程。
[0053]扩增DNA产物的进一步分析方法包括DNA扩增物的基因型分析。另外,扩增DNA产物可用于识别DNA扩增物的多态性,如单核苷酸多态性分析(SNP)。在实验方案中,SNP可以通过一些众所周知的方法进行检测,包括DNA测序,通过扩增一个PCR产物然后测序;寡核苷酸连接测定法(OLA)、单碱基延生法、等位基因特异性引物延伸法、错配杂交法。发现的SNP最好能证明与表型相关,包括疾病表型等。DNA扩增物可以构建DNA文库,包括非限制的基因组DNA文库、显微染色体DNA文库、BAC文库、YAC文库、PAC文库、cDNA文库、噬菌体文库和质粒文库。
[0054]词条“基因组”定义为个体、细胞以及细胞器所有的全部基因。词条“遗传DNA”定义为个体、细胞以及细胞器所携带 的全部DNA。词条“转录组”定义为单细胞的RNA。.[0055]词条“核苷”指由嘌呤或嘧啶碱与核糖或脱氧核糖共价连接的分子。核苷包括腺嘌呤核苷、鸟嘌呤核苷、胞嘧啶核苷、尿嘧啶核苷和胸腺嘧啶核苷。核苷还包括一些稀有核苷,如次黄嘌呤核苷、甲基次黄嘌呤核苷、假尿嘧啶核苷、5,6- 二氢尿嘧啶核苷、胸腺嘧啶核糖核苷、2N-甲基鸟嘌呤核苷和2’2N,N-二甲基鸟嘌呤核苷。词条“核苷酸”指有核苷和一个或者多个磷酸基团形成的分子。核苷酸包括腺嘌呤核苷酸,鸟嘌呤核苷酸,胞嘧啶核苷酸和胸腺嘧啶核苷酸。词条“多核苷酸”、“寡聚核苷酸”、“核苷酸分子”都是指核苷酸的聚合物,由脱氧核甘酸或者核糖核苷酸通过3',5'-磷酸二酯键连接而成的大分子。多核苷酸具有各种三维空间结构和多种功能。下面都是多核苷酸:一个基因或者基因片段(例如,一个探针、引物、EST或者SAGE标签)、外显子、内含子、信使RNA (mRNA)、转运RNA、核糖RNAjS糖酶cDNA、重组多核苷酸、支多核苷酸、质粒、载体、DNA序列、RNA序列、核苷酸探针和引物。一个多核苷酸分子由修饰的核苷酸组成,比如甲基化的核苷酸和核苷酸类似物。除非特别申明,本专利的多核苷酸是有双链结构和互补单链组成。一个多核苷酸是有四种核苷酸碱基组成的特殊序列,包括腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)、胞嘧啶(C);当多核苷酸是RNA时具有尿嘧啶(U)。因此,多核苷酸序列是由多核苷酸分子的碱基字母表示的。这些字母序列可记录着电脑的数据库中,可运用生物信息学软件进行分析应用,如功能基因组和同源性分析等。
[0056]词条“RNA”、“RNA分子”和“核糖核酸分子”是由核糖核苷酸组成的。词条“DNA”、“DNA分子”和“脱氧核糖核苷酸分子”是由脱氧核糖核苷酸组成的。DNA和RNA都能自然合成(例如,通过DNA复制和转录,分别合成DNA和RNA)。DNA和RNA可以以单链的形式存在(如,ssRNA和ssDNA)或者多链形式(如,dsDNA和dsRNA)。“mRNA”或者“信使RNA”是单链RNA,决定肽链的氨基酸排列序列。
[0057]在本专利中,词条“小干扰RNA” ( “siRNA”)(在文献中也可作为“短干扰RNA”)指一个能够指导或介导RNA干扰的长10~50个核苷酸(或核苷酸类似物)的RNA (或RNA类似物)。一个siRNA可以为15~30个核苷酸或核苷酸类似物之间,16~25个核苷酸或核苷酸类似物之间,18~23个核苷酸或核苷酸类似物之间,甚至为19~22个核苷酸或核苷酸类似物之间(也就是19,20, 21或22个核苷酸或核苷酸类似物)。词条“短” siRNA指一个siRNA由21个核苷酸(或核苷酸类似物)组成,如19,20,21或22个核苷酸。词条“长”siRNA指一个siRNA由24~25个左右的核苷酸能成,如23,24,25或26个核苷酸。短siRNAs可以包括具有介导RNAi能力`的少于19个核苷酸的更短siRNA,如16,17或18个核苷酸。长siRNAs可以包括具有介导RNAi能力且不会被进一步加工一如被酶切为短siRNA的、多于26个核苷酸的更长siRNA。
[0058]词条“核苷酸类似物”、“替代核苷酸”和“修饰后的核苷酸”指非标准的核苷酸,包括非自然出现的核苷酸或脱氧核苷酸。核苷酸类似物是任意位点被修饰以改变特定化学性质但仍然存在核苷酸类似物的能力而执行所需功能的核苷酸。如核苷酸可能出现衍生物的5位,如5- (2-氨基)丙基尿苷,5-溴尿核甙,5-丙炔尿苷,5-丙烯尿苷等;6位,如6-(2-氨基)丙基尿苷;腺苷酸及(或)鸟苷酸的8位,如8-丙炔尿苷,8-氯鸟嘌呤核苷,8-f Iuoroguanosine等。核苷酸类似物还包括deaza核苷酸,如7-deaza-腺苷;0_和N-修饰(如烷基化,如N6-甲基腺苷或文献中其他已知的修饰)核苷酸;或其他杂环修饰的核苷酸类似物如 Herdewi jn, Antisense Nucleic Acid Drug Dev., 2000Aug.10(4):297-310 中所描述的。
[0059]核酸类似物可能同样由核苷酸中糖分子的修饰产生。如2’ OH基团可能由H、0R、R、F、Cl、Br、1、SH、SR、NH2、NHR、NR2、C00R 或 OR 中的一个基团取代,此处的 R 可被 C1-C6 烷基、烯基、炔基、芳基等取代或不取代。其他可能的修饰还包括在美国专利Nos.5,858,988,及6,291,438中的描述的。
[0060]核苷酸的磷酸基团也可能发生修饰,如,用硫(如硫代磷酸)取代磷酸基团上的一个或更多的氧原子,或者通过其他取代作用使核苷酸发挥所需功能,如Eckstein, Antisense Nucleic Acid Drug Dev.2000Apr.10 (2):117-21 ;Rusckowskiet al.Antisense Nucleic Acid Drug Dev.20000ct.10(5):333-45 ;Stein,AntisenseNucleic Acid Drug Dev.20010ct.11(5):317-25 ;Vorobjev et al.Antisense NucleicAcid Drug Dev.2001Apr.11 (2):77-85 及美国专利 N0.5,684,143 中所述。上面所述修饰作用(如磷酸基团修饰)均会降低核苷酸类似物在体内及体外试验下的杂交效率。
[0061 ] 在本专利中,词条“分离RNA” (也就是“分离mRNA”)指在利用重组技术时将RNA分子与其他细胞物质或培养基彻底分离;或者指利用合成技术时彻底分离化学前体物质或其他化学物质。
[0062]词条“体外”是指涉及纯化试剂或提取试剂,或者细胞提取等环境下。词条“体内”是指与活细胞相关,也就是永生细胞、初代细胞、细胞系和(或)有机体内的细胞。
[0063]词条“互补”与“互补性”用于与碱基配对规则相关的核酸序列。例如,序列5’ -AGT-3’与序列5’ -ACT-3’互补。互补可以是部分的,也可以是整体的。部分互补是指当一个或更多的核酸碱基不能通过碱基配对规则匹配时的情况。整体或完全互补是指一个核酸间的每一个碱基均与另一个核酸相匹配。核酸链之间互补的程度强烈地影响核酸链杂交效率和强度。
[0064]词条“同源性”在表示核酸之间的关系指其互补程度。可能存在部分同源(也就是部分一致)与完全同源(也就是完全一致)。部分互补序列是可以至少部分抑制一个完全互补的序列与目标核酸杂交的序列,与功能性词条“高度一致”相关。对完全互补序列与目标序列杂交的抑制可以在低严谨性条件下通过杂交试验(Southern或Northern印迹检测,或液相杂交等)检测。一个高度同源序列或探针(也就是能够与目标寡聚核苷酸杂交的寡聚核苷酸)可以在低严谨条件下与完全同源序列竞争并抑制其与靶标的结合(也就是杂交)。这并不是说低严谨性条件会产生非特异性的结合;低严谨性条件需要相互结合的两个序列特异性(也就是选择性)相互作用。非特异性结合是否存在可以通过使用另一个不存在部分互补性(也就是一致性少于30% )的靶标检测;不存在非特异性结合的探针不会与非互补靶标杂交。
[0065]当词条“高度同源”被用于cDNA或基因组克隆等双链核酸时,指的是在低严谨性条件下,任意探针可以与双链核酸中的一条或两条链杂交。当词条“高度同源”被用于单核苷酸链时,指的是在低严谨条件下,任意探针可以与单链核酸序列杂交。
[0066]下面的词条用于描述两个或更多个序列间的关系:“参考序列”,“序列一致性”,“一致序列百分比”和“高度一致”。一个“参考序列”是一个用于序列比较的依据;一个参考序列可能是一个长序列的一个部分,如一个给定的序列表中一个全长cDNA的一部分或由一个完整的基因序列组成。一般 来说,一个参考序列长20个核苷酸,通常至少为25个核苷酸长,更常见的为50个核苷酸以上。因为两个多聚核苷酸可能(I)有一段序列(也就是完整多聚核苷酸序列的一个部分)在两个多聚核苷酸序列中相似,(2)可能还有一部分存在不同,2个(或更多)序列间比较的典型方式是在“比对窗口”中对比两个序列,鉴定对比一个区域中的序列一致性。“对比窗口”在此处指一个概念上的最短20个连续的核苷酸位置片段,该片段可能与参考序列的至少20个连续核苷酸匹配。比对窗口部分的多聚核苷酸与参考序列(不存在增加或缺失)相比可能存在20%或更少的增加或缺失(也就是gaps)部分。比对窗口内的序列间最佳匹配可以通过使用电脑运行Smith and Waterman局部同源算法(Smith and Waterman, (1981) Adv.Appl.Math.2:482), Needleman and Wunsch (J.Mo 1.Biol.48:443 (1970))局部同源算法,Pearson and Lipman (Proc.Natl.Acad.Sc1.USA85:2444(1988))相似性搜索方法等算法(Wisconsin遗传学软件包7.0版中的GAP,BESTFIT,FASTA,以及 TFASTA, Genetics Computer Group, 575Science Dr., Madison, ffis.)得出,或运行多种方法并选择其中的最佳匹配(也就是在比对窗口中一致性比例最高的结果)。
[0067]词条“序列一致”指两个多聚核酸序列在比对区域内是一致的(也就是形成核苷酸-核苷酸对)。词条“一致序列百分比”是通过两个序列的匹配片段与比对区域比较计算得出,测定两个序列中一致的核酸碱基(也就是A、T、C、G、U或I)位置数目,用一致的核酸数除以比较区域(也就是比对窗口 windows size)内的位置总数,所得结果再乘以100,获得序列一致性百分比。词条“高度同源”用于描述一个多聚核酸序列,该序列与另一序列一致性至少为85%,最好具有90~95%的序列一致性,更常用的情况指当在比对区为20个核苷酸以上,通常为25~50个核苷酸时,序列与参考序列相比有99%及以上的序列一致性。参考序列可能是一个长序列的一部分,如本发明权利要求的全长序列的一个片段。
[0068]词条“杂交”指的是互补核酸的配对。杂交和杂交强度(也就是核酸间相互结合的强度)受核酸间的互补程度、条件的严谨性、杂交形成的Tm值及核酸中的G:C所占比例等条件的影响。
[0069]词条“Tm”指的是核酸的溶解温度。溶解温度是双链核酸分子中有一半解链成单链分子时的温度。Tm值的计算参考方法,当核酸在IM NaCl的水溶液中时,Tm值可以通过下面的公式简单估算:Tm=81.5+0.41 (% `G+C)(参考:Anderson and Young, QuantitativeFilter Hybridization, in Nucleic Acid Hybridization (1985)等文献)。某些更加复杂的Tm值计算方法将核酸结构和序列特性同时考虑在内。
[0070]词条“严谨性”指的是在核酸杂交中的温度、离子强度及其他物质如有机溶剂是否存在等条件。
[0071]在核酸杂交中,“低严谨条件”指的是:在42°C结合或杂交,杂交溶液中含5X SSPE (43.8g/l NaCl, 6.9g/l NaH2PO4 (H2O)和 1.85g/1 EDTA,用 NaOH 调节 pH 至 7.4),
0.1% SDS, 5 XDenhardt' s 试剂(每 SOOmlSOXDenhardt' s 试剂含:5g Ficoll (Type400 ;Pharmacia),5gBSA (Fraction V ;Sigma))及 100 μ g/ml 变性鲑鱼精 DNA,继以 42 °C 下用
5.0X SSPE (含0.1 % SDS)溶液洗涤(若探针长度为500个核酸左右)。
[0072]在核酸杂交中,“中等严谨性条件”指的是:在42°C结合或杂交,杂交溶液中含5X SSPE (43.8g/l NaCl, 6.9g/l NaH2PO4 (H2O)和 1.85g/1 EDTA,用 NaOH 调节 pH 至 7.4),
0.5% SDS,5 X Denhardt 试剂及 100 μ g/ml 变性鲑鱼精 DNA,继以 42°C 下用 1.0 X SSPE (含1.0% SDS)溶液洗涤(若探针长度为500个核酸左右)。[0073]“高严谨性反应条件”指用 5XSSPE(43.8g/l NaCl,6.9g/l NaH2PO4(H2O),1.85g/I EDTA,并用 NaOHi周 ρΗ7.4) ,0.5% SDS, 5 X Denhardt; s 试剂及 100 μ g/ml 的变性鲑鱼精子DNA混合,42°C孵育杂交探针(约500nt);至探针结合上核酸后用洗脱液(0.1 X SSPE,
1.0% SDS)在42°C进行洗脱。
[0074]有很多因素会影响反应的严谨性。比如探针的长度、种类、碱基组成;目标分子的的种类、碱基组成、保存条件等;盐离子及其他成分(甲酰胺、硫酸葡聚糖、聚乙二醇的存在与否)的浓度;杂交条件等都是可能造成反应特异性不高的原因。此外,在高严谨性也可以通过提高杂交温度或在洗脱液中加入甲酰胺获得。
[0075]在一些实施方案中,首先确定细胞,继而进行单细胞或多细胞的分离。本专利中所指的细胞包括所有DNA或RNA含量被公认的的细胞。包括各种类型的癌细胞,如肝细胞、卵母细胞、胚胎、干细胞、iPS细胞、ES细胞、神经元细胞、红细胞、黑素细胞、星细胞、生殖细胞、少突细胞、肾脏细胞等。本专利中的方法成功适用用于单细胞的DNA或RNA。而多细胞则包括了从大约2-1,000, 000个细胞。
[0076]本方法中提到的核酸可以是DNA,RNA,或者DNA-RNA嵌合体。这些核酸的来源可以多种多样,比如人类样本,包括全血、血清、血浆、脑脊髓液、脸表皮细胞、乳汁、活体组织切片、精液、尿液、粪便、毛囊、唾液、汗液、免疫沉淀或物理分离的染色质等等。
[0077]本方法获得的从模板扩增得到的核酸分子可以提供诊断或预后信息。例如,从样品得到经处理的核酸分子中可以获得基因组拷贝和(或)序列信息,等位基因变异信息,癌症诊断,产前诊断,亲子鉴定,疾病诊断、检测、监测以及相应的治疗信息、序列信息等等。
[0078]本文中所指的“单细胞”意为“单细胞”。单细胞的样本来源可以是组织切片、全血或细胞培养液。来源于特定器官、组织、肿瘤等的细胞也适用于本方法。此外,原核(如细菌)或真核(如酵母)微生物种群的细胞也同样适用此法。单细胞悬浮液可由常规方法获得,例如,使用胰蛋白酶或木瓜蛋白酶对样本组织进行酶解或采用物理方法分离细胞。获得的单细胞可分别保存于不同的无菌离心管作单独处理,如96孔板,这样每个孔可以放置一个单细胞。
[0079]目前,常用的操作单细胞的方法包括荧光活化细胞分类(FACS),流式细胞术(FlowCytoMetry, FCM ;Herzenberg.,PNAS USA76:1453-55,1979),显微操作,半自动细胞采集(即来自于Stoelting公司的Quixell?cell transfer system)。单细胞可通过显微镜观察位置、形态特征或标签基因表达情况进行特征鉴定来选择获得。此外,结合梯度离心和流式细胞术也可提高细胞分离和筛选效率。
[0080]一旦确定所需的细胞,技术人员可以使用常用方法裂解该细胞,释放胞内物质,包括DNA和RNA,这些操作均在试管中进行。裂解细胞的方法包括使用加热、洗涤剂或其他化学方法,亦或是将这些方法结合使用。温和裂解细胞有利于防止核染色质的释放。例如,对含有Tween-20的细胞进行72°C孵育2min足以充分裂解细胞,但却会导致核染色质基因组降解。因此可以选择以下几种方法进行细胞裂解:65°C水浴IOmin(Esumi等,NeurosciRes., 60 (4):439-51,2008));或者将已加入 0.5 % NP-40 的 PCR buffer II (AppliedBiosystem)进行70°C孵育90sec ;或者使用蛋白酶K酶解;或者是使用异硫氰酸胍盐溶液(美国专利N0.2007/0281313)。可直接从细胞裂解液中进行基因组DNA扩增,即可直接向裂解产物中加入反应混合液。或者, 也可先将细胞裂解产物分成多管,这样每个反应管中都含有基因组DNA,再分别进行扩增。
[0081]本发明中使用的核酸既包括是天然碱基,也包括是非天然的碱基。天然核酸指的是腺嘌呤、胸腺嘧啶(RNA中为尿嘧啶)、胞嘧啶和鸟嘌呤中的一种或几种。核酸,无论是含有天然骨架还是具有类似结构,包含的典型非天然碱基包括但不限于:肌苷,黄嘌呤,次黄嘌呤,异胞嘧啶,异鸟嘌呤,5-甲基胞嘧啶,2-氨基腺嘌呤,6-甲基腺嘌呤,6-甲基鸟嘌呤,
2-丙基鸟嘌呤,2-丙基腺嘌呤,2-硫代胸腺嘧啶,2-硫代胞嘧啶,15-卤代尿嘧啶,15-卤代胞嘧啶,5-丙炔基尿嘧啶,5-丙炔基胞嘧啶,6-偶氮尿嘧啶,6-偶氮胞嘧啶,6-偶氮胸腺嘧啶,5-尿嘧啶,4-硫代尿嘧啶,8-卤代腺嘌呤或鸟嘌呤,8-氨基腺嘌呤或鸟嘌呤,8-硫代腺嘌呤或鸟嘌呤,8-硫代烷基腺嘌呤或鸟嘌呤,8-羟基腺嘌呤或鸟嘌呤,5-卤代尿嘧啶或胞嘧啶,7-甲基鸟嘌呤,7-甲基腺嘌呤,8-氮杂鸟嘌呤,8-氮杂腺嘌呤,7-脱氮鸟嘌呤,7-脱氮腺嘌呤,3-脱氮鸟嘌呤,3-脱氮腺嘌呤等及其类似物。在一定条件下,可利用在核酸序列中加入异胞嘧啶和异鸟嘌呤来降低杂交的非特异性,具体可参见美国专利N0.5,681,702。
[0082]本文中所指的“引物”,是一条天然或人工合成的寡核苷酸链。引物可以与模板核酸结合,在DNA聚合酶作用下沿3’端延伸,最终完成模板的复制。引物长度一般为3-36nt,本专利中的引物长度为17_30nt,包括正交引物、扩增引物、构建引物等。一对引物可以分别结合一条或多条目的序列。引物和探针可以是简并或准简并的序列。本发明中的引物结合邻近的靶序列。一条“引物”可视为一条短的多核苷酸链,其游离的3’-OH基团通过杂交结合靶序列或模板,然后与靶序列进行互补配对。本发明的引物包括核苷酸范围从17nt至30nto
[0083]本专利方法采用PCR法进行DNA扩增。PCR,即聚合酶链式反应(美国专利Nos.4683195,4683202, 4965188)。PCR是通过一对特异引物与目的序列互补结合,在DNA聚合酶作用下进行热循环反应(变性-退火-延伸),从而获得大量完整的目的片段,即PCR产物。两条引物分别与双链模板进行互补结合。扩增时,混合物首先进行模板变性,然后引物在退火阶段与相互补的模板序列进行结合,接着引物在DNA聚合酶作用下进行延伸反应最终形成一条新的互补链。这样的“变性-退火-延伸” 一次即为一个循环,通过多次重复这种循环来获得大量的靶序列上的目`的片段。扩增片段的长度由引物结合模板的相对位置所决定,因此是可人为控制的参数。
[0084]基于PCR反应,可通过多种方法将基因组DNA中单拷贝的目的序列扩增富集至可检测水平(如:杂交已标记的探针,生物素标记引物和抗生素-酶复合物结合检测,对引物进行32P标记dNTP如dCTP或dATP)。只要有合适的引物对,除基因组DNA外,任何寡核苷酸或多聚核苷酸也都可以作为PCR反应中的模板。特别是,通过PCR方法产生的扩增片段本身也可作为后续的PCR扩增的模板。PCR中所使用的DNA聚合酶是一种热稳定酶。在Southern和Northern实验中,引物同时也被作为杂交反应的探针。
[0085]扩增,如PCR法、连接扩增法(LCR)和扩增法。这些都是常用方法,请参考如下:美国专利 Nos.4, 683, 195 和 4, 683, 202 ;Innis et al.,PCR protocols:a guide to methodand applications”Academic Press, Incorporated(1990) (for PCR) ;ffu et al.(1989)Genomics4:560-569 (for LCR)。一般PCR过程包括以下几步:(i)引物特异结合DNA模板;(?)在DNA聚合酶作用下进行随后的扩增,涉及退火、延伸以及再变性;(iii)PCR产物大小的检测。引物应具有特异性和合适的长度,即每条引物都因根据基因位点进行特异设计与模板互补。
[0086]进行扩增反应所需的试剂和设备均为商用产品。用于扩增反应的引物最好是与目的基因序列特异互补。扩增物可直接用于测序。
[0087]扩增得到的互补或同源链可以根据碱基比例和碱基互补配对原则对其进行量化。
[0088]“逆转录PCR”或“RT-PCR”是指在逆转录酶作用下将模板mRNA转化成互补的单链DNA或cDNA,然后对DNA进行PCR扩增。
[0089]术语“PCR产物”,“PCR片段”以及“扩增物”均指在PCR反应进行“变性-退火-延伸”2个循环以上的混合物。这些术语也包括一个或多个靶序列的一个或多个片段同时扩增的情况。
[0090]术语“扩增试剂”包括dNTP、bUffer等在内的试剂以及扩增所必需的引物、核酸模板、扩增酶。扩增试剂及其他反应所需的成分均置于反应管(试管,离心管等)中进行反应。扩增方法包括普通PCR法、滚环扩增法(HCA)、超分支滚环扩增法(HRCA)和环介导等温扩增法(LAMP)。
[0091]乳化PCR(emulsion PCR, ePCR),指通过剧烈振荡或搅拌“油包水”混合物,以产生百万个微米级的水性隔室进行各自扩增。将DNA文库混合于有限稀释的乳化之前的磁珠或者直接混于乳液混合物中。这些隔室的大小以及有限稀释的磁珠和目标分子形成一个微反应器,这些微反应器平均只有一个DNA分子和磁珠(最佳稀释条件下,许多反应室只有磁珠而没有目标分子)。为了提高扩增效率,上游PCR引物(低浓度)和下游PCR引物(高浓度)均包含于以上的混合反应液中。根据水性隔室的大小在乳液PCR可产生3X IO9个各自分开的PCR反应。根据乳化状态的不同,一个乳液中的隔室的平均粒径范围可从亚微米到超过100微米。
[0092]“同一性”,“同源性”和“相似性”可互换使用,是指两个核酸分子之间的序列相似性。同一性可以通过比对每条序列目`的基因的位置来判定,若被比较序列的同一位点处含有相同的碱基或氨基酸,即为同源。序列之间同一性的程度与匹配或同一位点上序列一致数有关。非相关或非同源序列之间的同一性低于25% -40%。
[0093]“序列一致性”是有一定比例的(如:60%,65%,70%,75%或99%),即碱基在互相比较的不同序列中占有相同的比例。通过专业软件可以确定比对序列这种同一性或同源性的百分比,如BLAST。特别是BLASTN和BLASTP,软件详情可见NCBI网站。
[0094]可以多种测序方法实现对靶核酸序列的测序分析,包括但不限于通过杂交测序(SBH),通过连接测序(SBL),定量递增的荧光核苷酸添加测序(QIFNAS),逐步连接和切割,荧光共振能量转移(FRET),分子信标,TaqMan报告基因探针消化,焦磷酸测序,荧光原位测序(FISSEQ),FISSEQ 珠(美国专利 7,425,431),摇摆测序(wobble sequencing) (PCT/US05/27695),多重测序(于2008年2月6日提交的美国系列号12/027, 039 ;Porreca etal (2007)Nat.Methods4:931),聚合克隆(POLONY)测序(美国专利号6,432,360,6,485,944和 6,511,803,以及 PCT/US05/06425);纳米格栅滚环测序(nanogrid rolling circlesequencing) (R0L0NY)(于2008年5月14日提交的美国系列号12/120,Ml),等位基因特异性寡聚物连接测定法(例如寡聚物连接测定法(OLA)、使用连接的线性探针以及滚环扩增(RCA)读出的单模板分子0LA、连接的锁式探针、和/或使用连接的环形锁式探针和滚环扩增(RCA)读出的单模板分子0LA)等。例如使用多种平台(例如Roche454, IlluminaSolexa,AB-SOLiD,Helicos,Polonator平台等)在环形阵列测序上还可以使用高通量测序方法。高通量测序方法在于2009年3月M日提交的美国系列号61/162,913中进行了说明。多种基于光的测序技术是本领域已知的(Landegren et al.(1998)Genome Res.8:769-76 ;Kwok (2000) Pharmocogenomicsl:95-100 ;以及 Shi (2001) Clin.Chem.47:164-172)。
[0095]扩增后的DNA可进行测序,方法多种多样。特别是可以进行高通量测序如AppliedBiosystems公司的SOLID测序法,或是Illumina公司的GenomeAnalyzer测序平台。得到的读序数可达I万到10亿条。这里的“读序数”是指测序反应中的一条连续的核酸序列。
[0096]“鸟枪法测序”(Shotgun sequencing),适用于对大的DNA (如全基因组)进行测序。该方法首先将DNA片段化至可分别测序的小片段,然后将这些小片段的测序结果按照原序列进行重新装配,形成完整的序列。片段化DNA的方法有很多种,包括酶切法和机械打断。重叠序列可利用合适的生物信息软件进行比对分析。
[0097]扩增和测序方法在预测医学领域是有用的,包括诊断分析、预后分析和药物基因组学。而监控临床试验有助于进行预后(预测)目的,从而对个体进行预防性治疗。相应地,本发明的一个方面涉及一种诊断测定法,用于检测基因组DNA,以确定个体是否处于发生病症和(或)疾病的风险之中。此类测定可用于预后和(或)预测目的,从而对个体进行病症和疾病发作前的预防治疗。
[0098]该发明方法还提供了鉴定同源染色体单倍体结构的方法。单倍体信息对于描述和阐释基因组和基因多样性有重要作用。个体单倍体信息有助于更好地使用个性化药物。完整的个体单倍体信息同样有助于促进复杂性状的基因组关联分析(GWAS)。就此而言,遗传材料来源于个体的单细胞,或者是同一细胞型的多个细胞,将被分离成多个部分或反应混合物,这样来自于同一个体的同源染色体DNA将被分开。经以上介绍到的扩增、测序和分析方法,每一个扩增的部分都将以基因组序列,如人基因组(介绍详见International HumanGenome Sequencing Consortium, Nature431,931-945 (2004))作为参考分析单核苷酸多态性(Single nucleotide polymorphisms, SNPs)情况。该方法同样适用于其他具有参考基因组的物种。SNP分析可用于鉴定单倍体,如H.C.Fan et al.,Nat.Biotech.29,51-57 (2011)所提到的。基于序列信息和单核苷酸多态性,构建单细胞的单倍体型,例如,具有大于IOOKB的大小。另一方面,将来自同一个体的多个单细胞单倍型进行比较,以确定该个体的完整的单倍核型型。
[0099]鉴定单细胞的单倍体型方法包括从组织材料中提取DNA,收集细胞,无明显损坏和降解的单细胞和DNA分子。将提取的DNA分别加入多个组分,加入反应液,保证每个反应中只有一个基因组亚份。这样,来源于同源染色体的DNA将分别进行扩增、测序和多态性分析。继而进行细胞单倍体分析和SNPs分析。另一方面,单细胞基因组DNA单倍体核型是通过每个部分扩增得到的DNA进行比较而获得的。
[0100]当样本物种并无参考序列或某些癌症样本具有复杂结构变异时,需要采用从头基因拼接方法(de-novo)。从头基因组拼接是通过将从每个基因组亚份中获得的测序结果进行拼接和相互映射来完成。从头基因组拼接法则也可应用于当前从单细胞或多细胞提取的DNA。例如,可以将来源于同一细胞型的多个细胞进行分离并提取DNA,再分别进行扩增、测序、比较和分析测序结果,在没有参考序列的情况下进行拼接、组装,获得完整的基因组信息。[0101]本专利方法中提到的术语“生物样本”包括但不限于以下几种:组织,细胞,生物液体以及从这些样本中得到的分离物。
[0102]本专利方法中“电子设备可读介质”指任何能够读取和直接识别那些储存、保持或容纳数据或信息的电子设备。这些介质包括但不限于以下几种:存储磁盘,如软盘;硬盘;磁带;光存储,如光盘;电子存储,如RAM,ROM, EPROM, EEPROM等类似的;普通硬盘以及以上这些介质的混合使用,如磁盘/光盘存储。这些介质用于记录一个或多个表达谱信息。
[0103]上文中使用到的术语“电子仪器”可以是任何相配的计算机或仪器或者其它可用于满足条件的数据和信息存储设备。例如:独立计算系统;网络,包括局域网(LNA)、广域网(WAN)、内联网和外联网;电子设备如个人数字助手系统、手机、寻呼机等等;分布式处理系统。
[0104]上文中使用到的“记录”指的是在电子设备的显示屏上对信息进行记录和编码的过程。技术娴熟的人员更易于使用现有的方法在设备上记录信息,并将信息集合成包含一个或多个表达谱的结果。
[0105]电子仪器中的该发明方法的基因组的DNA信息可以用许多软件系统和程序来记录。例如,核苷酸的序列可以用word文件的形式来描绘,用商业化的软件来编码,如WordPerfect和Microsoft Word,或者以ASCII文件的形式描绘,并存储在DB2、Sybase、Oracle等等数据库中。各种数据处理格式(如文件档或数据库)都应当被用于获取或建立一个包含一个或多个如上方所述表达谱的媒介。
[0106]需要清楚的是,前面所述的该发明的具体方法仅仅只是原理的一部分应用的说明而已。在不偏离该发明方法的实质和界限的前提下,还需要对目前所描述的方法进行许多修改。本专利说明书所引用的参考文献、专利和公开的专利申请一概都归集在参考资料中。
[0107]下列的例子将对该发明方法进行陈述。这些例子不可诠释为限制该发明方法的范围,因为基于现有的公开发明、图片和`相关的文件,还存在这些或其它相同的方法。
`[0108]实施例1
[0109]单细胞DNA扩增
[0110]用激光解剖显微镜分离细胞。
[0111]从细胞培养皿中选择一个细胞,用激光解剖显微镜(LDM-6500,Leica)分离细胞分离后悬浮于离心管中。分离出的细胞再转移到培养皿中进行培养,并在10倍物镜下用亮视野显微镜观察细胞。然后用紫外激光切除选择的单细胞周围的膜,将其置于PCR管中。稍作离心使细胞沉于管底。将5 μ I裂解缓冲液(30mM Tris-Cl PH7.8,2mM KC1,0.2% TritionX-100,12.5 μ g/ml Qiagen Protease)加入PCR管的一侧,流入管内。然后将捕获的细胞使用以下的温度条件在PCR仪器中进行裂解:50°C 3小时,75°C 20分钟,80°C 5分钟。
[0112]线件预扩增
[0113]在线性预扩增中,使用一对类简并引物对整个基因组DNA扩增。引物为NG和NT:
[0114]NG5,-GTGAGTGATGGTTGAGGTAGTGTGGAGNNNNNGGG-3,
[0115]NT5,-GTGAGTGATGGTTGAGGTAGTGTGGAGNNNNNTTT-3,
[0116]将以下的溶液加入到PCR管中进行第一次扩增:1.5μ I ThxrmoPol Buffer (NEB),
1.5μ 1029Reaction Buffer (NEB),1.0 μ I dNTP (IOmM), 26 μ I H2O(Ambion), 0.1 μ I NG和NT 引物(50 μ Μ)。[0117]在PCR缓冲液加入到含有已裂解的单细胞的PCR管后,94°C加热3分钟以使DNA变性成单链DNA。将样品迅速置于冰上使温度达到(TC,在这个过程中引物结合到模板。0.6μ IBst大片段聚合酶和Φ29 (NEB)混合物加入PCR管。在PCR仪器中运行以下的温度和时间:
[0118]I (TC-45 秒
[0119]20°C-45 秒
[0120]30 O-60 秒
[0121]40 O-45 秒
[0122]50°C_45 秒
[0123]62°C_3 分钟
[0124]95°C-20 秒
[0125]然后将PCR管置于冰上停止反应并开始使用新的引物进行反应。
[0126]在第二次和后续的循环中,新鲜的聚合酶混合物加入到PCR管并在PCR仪器中运行以下的循环:
[0127]IO O-45 秒
[0128]20°C-45 秒
[0129]30 O-60 秒
[0130]40 O-45 秒
`[0131]50°C_45 秒
[0132]62°C_3 分钟
[0133]95°C-20 秒
[0134]58 °C-至少 20 秒
[0135]实施例1I
[0136]使用标准方法对例I的扩增子进一步扩增
[0137]使用标准PCR扩增方法对例I的扩增物进行指数扩增。在冰上操作将以下反应体系加入到PCR管中:
[0138]3.0 μ I ThermoPol Buffer (NEB)
[0139]1.0μ I dNTP(IOmM),
[0140]26 μ I H2O (Ambion)
[0141]0.1 μ I 引物(100 μ Μ) (5,-GTGAGTGATGGTTGAGGTAGTGTGGAG-3,)
[0142]1.0 μ I Deep VentR (exo_) (NEB)
[0143]采用以下标准的PCR程序扩增出1-2 μ g DNA产物。
[0144]94 O-20 秒
[0145]59°C_20 秒
[0146]72°C_3 分钟
[0147]17个循环
[0148]72°C_5 分钟
[0149]4°C -
[0150]指数扩增后,使用Qiagen柱纯化DNA并保存,并去除DNA扩增子的引物端。
[0151]以下已知的其它扩增方法也可以使用。[0152]最常见的扩增方法之一是PCR,详细描述见美国专利Nos.4683195,4683202和4800159,在此列出作为参考。PCR被认为是一种进行DNA扩增的可接受的方法,特别要注意的是该发明方法也可能用其它的扩增技术进行。这些技术一般被认为是常规技术,以下简单进行讨论。在PCR中,引物对选择性结合到核苷酸这一过程是在允许选择性结合的条件下发生的。在模板依赖性扩增中,该引物含有可以起始最初核苷酸合成的核苷酸。引物可以是单链或双链的形式,但是单链引物更佳。在一系列模板依赖性扩增中,引物用于扩增已知模板的目的基因序列。
[0153]现已公开的DNA扩增方法的目标产物都是核酸,可以是用现有扩增技术进行扩增的任何核酸或核酸的类似物。例如,该发明方法上下文中的目的核酸包括但又不仅仅局限于:基因组 DNA,cDNA, RNA, mRNA,粘粒 DNA,BAC DNA, PAC DNA, YAC DNA 和人工合成的 DNA。源于原核细胞、真核细胞或组织的基因组DNA均可作为现有公开DNA扩增方法的模板。可将分离的带有Poly A尾的mRNA反转录成(reversetranscribed,简称RT) cDNA后作为DNA扩增的模板。可以直接将cDNA作为DNA模板进行扩增。另外,起始原料为RNA样品而不是DNA样品时,RNA或mRNA可以被直接扩增。
`[0154]在PCR反应中,引物对的序列与目的基因的序列互补。如果模板中存在目的基因,引物便会与目的基因结合DNA模板:引物结合物。反应体系中加入足量的dNTP和DNA聚合酶(如Taq聚合酶)ο
[0155]DNA模板:引物结合物形成后,DNA聚合酶开始催化引物沿着目的基因序列延伸。通过控制反应体系的温度的增减使延伸后的引物从模板上脱落下来,这就是反应产物。剩余的引物再次与模板和新生成的产物结合,并重复之前的步骤。这几个步骤称为一个“循环”。一直循环到产生足够多的扩增物。
[0156]接下来要检测扩增物。可靠的方法一般用可视化的方法来检测扩增物。另外还可以通过突光标记、化学突光标记方法、同位素示踪标记或者标记核苷酸、质量标签或者电或热脉冲信号等方法间接检测扩增物。
[0157]另一种扩增方式是连接酶链式反应(Ligase Chain Reaction, LCR)。该方法公开于欧洲专利申请N0.320,308。在LCR反应中,当暴露于目的基因序列时,两对互补的探针分别结合在两条模板链上,且两结合物相互邻近。加入连接酶后,两个相邻的探针相互连接。和PCR —样,通过温度的循环,使生成的单位从模板上解离下来,并作为新的模板与多余的探针结合。美国专利N0.4,883,750,也收录了一篇与LCR相似的,利用探针与模板链结合的扩增方法。
[0158]PCT专利申请N0.PCT/US87/00880描述的Qbeta复制酶方法也是另外一种扩增方法。这种方法是向含有RNA聚合酶和模板的体系中加入与目的基因序列互补的重复序列RNA,这段重复序列将在RNA聚合作用下扩增,因此也就可以用于检测。
[0159]等温扩增技术是使用限制性核酸内切酶和连接酶来扩增带有5' -[α-硫代]三磷酸的位点的目的分子。此方法也可用于DNA扩增。例如Walker et al.描述的扩增方法。
[0160]另外一种恒温扩增方法是链置换扩增技术(Strand DisplacementAmplification, SDA),该技术包括多个链置换和合成的过程。SDA技术收录于美国专利Nos.5,712,1245,648,211 和 5,455,166。另一种相似的方法是修复链反应(Repair ChainReaction,RCR)。此方法退火时使多个引物探针与目的区段混合,然后经过链修复后保留四种碱基中的两种。其他两种碱基以生物素化的衍生物的形式加入反应体系中。相似的检测手段也可用于SDA反应。
[0161]还可以利用循环探针反应(cyclic probe reaction, CPR)来检测特定的目的基因。在CPR反应中,探针的3’端和5’端带有非特异的DNA,中间含有一段特异性的RNA序列。将探针与模板DNA结合后,利用RNase H催化反应,经消化后可以生成反应产物也就是鉴定产物。初始模板经退火与其它探针结合后开始新一轮的反应。
[0162]现已公开的核酸扩增方法还有,转录依赖的扩增系统(transcription-basedamplification system, rAS),核酸序列依赖性扩增(nucleic acid sequence basedamplification, NASBA)和 3SR。(Kwoh et al., Proc Natl Acad Sci USA,86:1173-77,1989 ;PCT W088/10315et al.,1989)。在NASBA方法中,可以通过标准的苯酚氯仿提取、加热使样本变性、裂解液处理等方法获得核酸,并用minispin柱分离DNA与RNA或用盐酸胍提取RNA。这些扩增技术一般包括以下步骤:退火使引物与模板链结合,聚合反应,RNase H消化DNA/RNA结合产物,高温解链DNA双链。不管哪种技术,都可以通过向反应体系中加入针对第二链的引物进行聚合反应而使单链DNA变为双链DNA。双链的DNA可以在聚合酶T7或SP6的作用下大量进行转录。在等温循环反应中,RNA反转录为双链DNA后再利用聚合酶T7或SP6进行转录。由此产生的产物,无论是完整产物还是有所缩短的产物,都是带有目的基因特异性的产物。
[0163]英国专利N0.GB2, 202, 328和PCT N0.PCT/US89/01025中描述的扩增技术也可用于扩增。前者在类PCR的模式和酶依赖合成中使用经过修饰的引物。这种引物加入了捕获基团(如生物素)或检测基团(如酶)。后者在反应体系中加入过量带有标记的探针,目的序列存在时,探针可以与之结合并经催化断裂。断裂后模板链不变,还可以与其他探针结合,探针断裂时发出的信号可以标识目的序列的存在。
[0164]Davey et al.,欧洲专利N0.329,822公布了一种循环扩增单链RNA (single-strand RN A, ssRNA), ssDNA 和双链 DNA (double-strand DNA, dsDNA)的方法。寡核苷酸引物先与初始模板ssRNA结合,并在逆转录酶的催化下延伸。然后手RNase H除去DNA =RNA复合物中的RNA,剩下的ssDNA作为第二模板与含有与其模板5’端同源的RNA聚合酶的启动子序列第二条引物结合,在DNA聚合酶作用进行延伸形成双链DNA分子。此双链DNA含有与引物间的原始RNA同样的序列,另外在一端还含有启动子序列。在适当的RNA聚合酶的作用下,这些启动子序列可以用于生成许多源于DNA的RNA拷贝。这些拷贝进入循环后将可加速扩增。因此这个方法的起始模板可以是DNA或RNA,因此可以通过选择适当的酶实现恒温扩增,而不必在每个循环都重新加入新的酶。
[0165]Miller et al.,PCT W089/06700公布了一种扩增方法,这种方法采用启动子/引物序列与目的单链DNA杂交,进而生成许多反转录RNA序列的产物。这一方法并不是循环式的,因此在RNA转录反应中没有新的模板生成。
[0166]其他的扩增方式还包括race and one-sided PCR(Frohman, In:PCR Protocols:A Guide To Methods And Applications, Academic Press, N.Y., 1990) ? 这个方法是将含有目的寡核苷酸链序列的两个(或多个)寡核苷酸链连接后再扩增寡核苷酸链。同样地,也可以被用于扩增 DNA(ffu et al.,Genomics4:560-569, 1989)。
[0167]实施例1II[0168]从PCR扩增物中除去引物序列
[0169]使用硫代膦酸核苷酸是一种除去扩增物中引物序列的方法,将DNA产物利用dA、dC、dT和硫代膦酸的dG进行重扩增。因为引物中不含有dC核苷酸,所以其互补序列中应该不含有dG核苷酸,用核酸核酸外切酶III从3’端消化PCR产物,然而带有硫代膦酸的核苷酸不能被消化,所以序列会被消化至带有硫代膦酸的dG。该酶混合液中还加入了Mung Bean核酸外切酶,消除核酸外切酶III消化过程中产生的5’末端。
[0170]反应缓冲液和反应条件如下:IXBufferl (New England Biolabs), 5U ExoIII 和0.5U Mung Bean exonuclease (New England Biolabs)。室温条件下孵育反应 2 分钟。然后可通过添加5ul0.5M EDTA终止反应。
[0171]从DNA产物中去除引物序列的反应步骤流程图显示如下,去除引物序列后的产品可用于高通量测序。例如,引物序列可从3’端去除。然后再从5’端去除。
[0172]实施例1V
[0173]从PCR扩增子中去除启动序列
[0174]使用半甲基化引物用于促进切除扩增子产物的启动序列。半甲基化引物于第二轮扩增中,使用MspJI限制性内切酶或具有相似属性需甲基酶识别限制性位点的其他酶的活性。半甲基化引物序列如下:
[0175]第一轮扩增引物:
[0176]GT GAG TGA TGG TTG AGG TCT TGT GGA GNNNNNGGG
[0177]GT GAG TGA TG G TTG AGG TCT TGT GGA GNNNNNTTT
[0178]第二轮扩增引物:
[0179]GT GAG TGATGG TTGAGG TmCT TGT GGA G
[0180]第二轮扩增结束后,在纯化后的DNA产物中加入enzyme MspJI (0.5U),buffer4 (New England Biolabs)和 BSA。37°C反应 4hours。然后经柱纯化终止反应。
[0181]实施例V
[0182]有用的标签
[0183]在引物或扩增物中包含可识别基团,或添加可识别基团到探针中,可方便最后对扩增物进行定性与定量。有许多不同种类的标签可供使用并达到这个目的,例如:荧光基团,生色团,放射性同位素,酶标记物,免疫抗体标记,化学发光基团,电致发光,亲和标签,等等。相关专业人员熟悉以上这些和这里没有提到其他荧光物质。
[0184]亲和标签的例子包含但不限于以下:抗体,片段化抗体,受体蛋白,激素,生物素,DNP,或任何多肽/蛋白质分子绑定一个亲和标签,可用于增殖基因的分离。
[0185]酶标记物的例子包含酶,如尿素酶,碱性磷酸酶或过氧化酶。此外,可使用比色指示底物,经人眼可见,或用分光光度法来检测特定的杂交与互补核酸样本。这些例子都是众所周知的,相关专业人员熟悉在目前已公布的信息中,并不仅限于上述例子。
[0186]在目前已知的荧光物质信息中,下面的较为常用:Alexa350,Alexa430, AMCA,B0DIPY630/650, B0DIPY650/665, BODIPY-FL, B0DIPY-R6G, BODIPY-TMR, BODIPY-TRX,Cascade Blue,Cy2,Cy3,Cy5,6_FAM,Fluorescein, HEX,6-J0E, Oregon Green488, OregonGreen500,Oregon Green514 ,Pacific Blue,REG,Rhodamine Green,Rhodamine Red,ROX,TAMRA, TET, Tetramethylrhodamine, and Texas Red。[0187]实施例VI
[0188]分离技术
[0189]扩增后,需要从扩增物中分离出不同片段大小的产物,并从扩增物,起始模版,或多余的引物,分析确定是否有发生特异性扩增。
[0190]在标准实验操作中,扩增物可以通过使用琼脂糖凝胶,琼脂糖-丙烯酰胺或聚丙烯酸胺凝胶电泳进行分离。(Sambrook et al., " Molecular Cloning, " A LaboratoryManual,2d Ed.,Cold Spring Harbor Laboratory Press,New York,13.7-13.9:1989)。凝胶电泳分离技术是众所周知的技术。
[0191]另外,利用色谱技术以达到分离效果。有很多种可用的色谱方法:吸附,隔离,离子交换和分子筛,及许多专业技术可供使用包括色谱柱,滤膜,薄层与气相色谱技术。(Freifelder, Physical Biochemstry Applications to Biochemistry and MolecularBiology, 2nd ed.Wm.Freeman and C0., New York, N.Y, 1982)。另一个替代方法是通过捕获核酸产物上的标签,如:使用包含亲和素蛋白或抗体的磁珠,分别捕获带有生物素或抗原的核酸。
[0192]微流控芯片技术包含有分离平台,如毛细管(ACLARA BioSciences Inc.)芯片(Caliper Technologies Inc.)。这些微流体分离平台只需要纳升体积的样本,而其他的分离技术则需要微升体积的样本。基因分析的一些实验流程有使用微流体设备。如:已发行的 PCT 申请 N0.W094/05414 (Northrup and White),报道使用一种 micro-PCR.TM.设备,从标本中分离并扩增核酸。美国专利Nos.5,304,487,5,296,375,and5, 856,174描述了类似的设备与方法。
[0193]在一些实例中,可能需要提供一种额外的或替代方法来分析DNA扩增物。在这些实例中,微细管阵列被考虑用于样品分析。微细管阵列电泳通常使用薄毛细管或通道,其中含有特定的分离介质。电泳样品通过毛细管分离出样品中所含的条带。微细管阵列电泳通常可提供一个快速分析样品的方法,PCR.T`M,产物分析,和酶切片段大小测定。这些毛细管的高表面体积比是考虑到在通过毛细管更高的电场时,毛细管不发生实质性的热变化,这样可以更快的分离样品。此外,结合共焦成像技术,这种方法可提高分析的灵敏度,其灵敏度可比于放射性测序方法。精密加工的微流体设备包括上述已详细讨论过的微细管阵列电泳,例如,Jacobson et al., Anal Chem,66:1107-1113,1994 ;Effenhauser et al., AnalChem,66:2949-2953,1994 ;Harrison et al., Science, 261:895-897,1993 ;Effenhauseret al., Anal Chem,65:2637-2642,1993 ;Manz et al., J.Chromatogr593:253-258,1992 ;and U.S.Pat.N0.5, 904, 824, incorporated herein by reference。通常情况下,这些方法包括在二氧化硅,硅胶或其他晶体基板或芯片的微米尺度通道中光蚀刻成像。可方便改用于该发明方法。
[0194]Tsuda 等人.(Anal Chem, 62:2149-2152, 1990)介绍了一种矩形毛细管,可替代圆柱形毛细玻璃管。这些系统的一些优势是它们高效的散热率取决于高度和宽度比,因此,需要高表面体积比和具有高灵敏度光学进样口的检测模式。这些平面分离通道可同时执行二维分离,一种是应用在分离通道,一种是应用在样本区域,可用多通道阵列探测器探测。
[0195]在许多毛细管电泳方法中,毛细管中(例如,熔融石英毛细管,通道蚀刻法,经机械加工的,或塑造成平面的基板)被填满适当的分离区域/筛选介质。通常情况下,已知的各种筛选介质都可能被用于微细管阵列分析。这类筛选介质包括,如,羟乙基纤维素,聚丙烯酰胺,琼脂糖及诸如此类的物质。通常,微细管阵列分析可用使用许多种筛选介质,如羟乙基纤维素,聚丙烯胺,葡聚糖等。选用特定的凝胶基质,缓冲液,运行条件以达到最大化分离目的。如,核酸的片段大小,所需的分辨率,起始或未变性的核酸分子。比如,运行缓冲液中可能包含变性剂,高浓度药剂以尿素变性核酸样本等等。
[0196]质谱分析提供了一种“定量”单个分子的方法,通过在真空中分子电离,蒸发,使其可以“飞”的分析手段。在电磁场的组合下,离子的运行轨迹取决于它们各自的质量(m)和电荷(z)。对于低分子量的分子来说,质谱已经是常规的一种物理一有机技术手段,用于分析与鉴定有机分子并测定原分子尚子的质量。此外,原分子尚子与其他粒子的碰撞,由所谓的碰撞诱导解离(CID)机制,使分子离子分散形成二次离子。并可以通过这种分裂模式/路径推导原分子离子详细的结构信息。质谱分析技术的其他应用在酶学方法里有进行了总结。参见 Vol.193: " Mass spectrometry" (j.a.Mccloskey, editor), 1990, Academicpress, New York。
[0197]由于质谱分析法的明显优势在于可以提供高灵敏度检测,准确的质量测量,并通过CID结合一个ms/ (ms配置和速度,以及在线数据直接传输到电脑上)可推导详细的结构信息,因此在核酸的结构分析上,使用质谱分析法有相当大的好处。相关这一领域的综述,包括(Schram, Methods Biochem Anal, 34:203-287, 1990)和(Crain, Mass SpectrometryReviews, 9:505-554, 1990)。将质谱分析法应用于核酸分析的最大障碍是很难挥发这些生物聚合物。因此,“测序”仅限于低分子量的合成寡核苷酸通过质谱分析测定原分子离子的质量,确认已知序列,或者,确认已知序列,通过CID的MS/MS配置利用形成二次离子(离子碎片),特别是,电离和挥发,快原子轰击质谱(Fab mass spectrometry)或等离子体解吸质谱(Pd mass spectrometry)。例如,应用Fab质谱方法分析被保护寡脱氧核苷酸化学合成的二聚体。(Koster et al., Biomedical Environmental Mass Spectrometry 14:111-116,1987)。
[0198]二种电离/解析技术是电喷雾/离子喷雾(ES)和基质辅助激光解析/电离(MALDI) ο ES 质谱分析是由 Fenn 等人介绍,Fenn et al., J.Phys.Chem.88 ;4451-59, 1984 ;PCT 申请号 Wo90/14148 ;相关应用总结参见 Smith et al.,Anal Chem62:882-89,1990, andArdrey, Electrospray mass spectrometry, spectroscopy europe, 4:10-18,1992.作为一个质量分析仪器,四极子是最常用的。毫微微克分子量级别的样本的分子量的测定的精确性是取决于可用于大规模计算的多个离子峰的存在。
[0199]相比之下,MALDI质谱分析法特别吸引人的是有飞行时间(TOF)装置用做质量分析仪。Hillenkamp 等人介绍了 MALD1-T0F 质谱分析法。(hillenkamp et al.,Biologicalmass spectrometry eds.Burlingame and Mccloskey, Elsevier science publishers,Amsterdam, pp.49-60,1990)。因为,在大多数情况下,这个技术不产生多个分子离子峰,这种质谱法,一般而言,与ES质谱分析法相比看起来简单。DNA在分子量多达410,000道尔顿时能去吸附和挥发(Williams et al.,Science, 246:1585-87,1989)。最近,使用这种技术的红外激光器(IR)已经用于较大的核酸的分析,如合成DNA,质粒的限制性内切酶片段,多达 2180 个核苷酸的转录 RNA 等。(Berkenkamp et al.,Science, 281:260-2,1998)。Berkenkamp还描述了使用MAL D1-T0F IR怎样从有限的纯化样品中分析DNA和RNA样本。[0200]日本专利号N0.59-131909.介绍了一种仪器,可以通过电泳,液相色谱法,或高速凝胶过滤法检测分离核酸片段。质谱检测是通过在核酸中融入通常不会存在与DNA中的离子如 S, Br, I, Ag, Au, Pt, Os, Hg 等实现。
[0201]荧光标记杂交寡核苷酸探针是众所周知的一种实验技术,也是一个灵敏的,非放射性方法,便于检测探针杂交情况。最近较成熟的检测方法是采用检测荧光能量转移的过程(FET)而不是直接检测荧光强度。FET发生在供体荧光基团和受体染料(可能也有可能不是荧光基团)之间,当一个(受体)的吸收光谱重叠另一个(供体)的发射光谱,这二种染料靠近。染料的这些属性被成为供体/受体染料对或能量转移染料对。供体染料激发的能量通过共振偶极子-感应偶极子转移,与邻近的受体相互作用。这导致供体荧光淬灭。在某些情况下,如果受体也是一个荧光基团,它们的荧光强度会增强。能量转移的效率很大程度上取决于供体与受体之间的距离,这些关系之间的方程式由Forster, Ann Phys2:55-75,1948开发。供体和受体染料的能量转移效率是50%时的距离被确定为Forster距离(Ro)。其他已知的荧光淬灭机制包括电荷转移和碰撞淬灭。
[0202]能量转移等机制是依靠两种染料在靠近时相互作用产生淬灭,这是检测或识别核苷酸序列的一种有效的方法,因为这样可以在均一反应体系中分析。均匀分析体系不同于常规的探针杂交分析 ,依靠检测单个荧光基团的荧光标记,因为多样化分析则需要额外的从游离的标签中分离出已杂交的标签。FET的几种杂交分析模式在Nonisotopic DNA探针技术中有描述。(Academic press, inc., pgs.311-352,1992) 0
[0203]匀相测定法已被Higuchi等人描述,利用能量转移或荧光淬灭的其他机制来检测核酸扩增,Higuchi et al.(BiotechnologylO:413-417,1992)。介绍的方法是通过监测绑定在双链dna上溴化乙锭的荧光强度对dna扩增进行实时检测。这种方法检测的灵敏度有限,因为溴化乙锭的绑定没有特定的目标,且同时也检测到扩增物的背景值。Lee等人(Nucleic Acids Res 21:3761-3766,1993)公开了一种 real-time 检测方法,一种双重标记的探针在目标基因PCR扩增过程中裂解。探针与下游的扩增引物杂交,所以在Taq酶5' -3'端核酸核酸外切酶的作用下,探针水解,分离出二种荧光染料,并形成一个能量转移对。探针裂解,荧光强度增加。PCT出版的《096/21144中公布了一种酶促核酸裂解反应导致荧光增强的连续荧光分析报告。荧光能量转移方法只有单一荧光标签的情况下使用,也就是说通过杂交目的基因并淬灭荧光基团。
[0204]在核酸扩增检测中(美国专利N0.5,547,861)描述了,引物或探针杂交到目的基因下游,形成杂交的扩增引物。引物在聚合酶的作用下类似于扩增引物进行延伸。延伸后的扩增物取代引物在目的基因的扩增,形成一个双链的二级扩增物,这可作为目标扩增的一个检测指标。二级扩增物可经引物包含的各种各样的标签或报告基团被检测到,引物中的限制性位点则可产生特定大小的片段化DNA,捕获基团,三股螺旋等特殊结构,和双链dna结合蛋白的识别位点等。
[0205]许多众所周知的供体/受体染料对可用在本方面方法中使用。包括但不仅限于以下这些:fluorescein isothiocyanate (FITC) /tetramethylrhodamineisothiocyanate (TALIC), FITC/texas red.tm.molecular probes, FITC/n-hydroxysuccmimidyl1-pyrenebutyrate (PYB), FITC/eosin isothiocyanate(EITC), n-hydroxysuccinimidyll-pyrenesulfonate(PYS)/FITC, FITC/rhodamine x, FITC/tetramethylrhodamine (TAMRA),及其他等等。选择一个特定的供体/受体突光染料对不是至关重要的。因为,能量转移荧光淬灭机制只有在供体的发射波长和受体的激发波长的荧光团重叠时才发生,也就是说,在两种染料中必须要有足够的光谱重叠才可发生能量转移,电荷转移或突光淬灭。p-(dimethyl aminophenylazo)benzoic acid(DABCYL)是一种非荧光物质受体染料,可以有效的淬灭相邻荧光基团的荧光,如fluoresceinor5- (21 -aminoethyl) aminonaphthalene (edans)。任何在核酸检测方法中可产生突光淬灭机制的染料对都适用于已公布的检测方法该发明方法。已知的终点检测和内部标记物检测的方法,可以通过连接核酸供体和受体染料的各自的荧光信号而在该发明方法中使用。
[0206]值得注意的是此技术可用于微阵列和/或者是基于芯片的DNA技术中,如在以下文献中提到的:Hacia 等,Nature Genet, 14:441-449,1996 和 Shoemaker 等,NatureGenetics, 14:450-456,1996。这些方法包括了准确、快速地定量分析多个基因。通过寡核苷酸标记基因或者运用固定的探针阵列,芯片技术可以被运用于通过高通量杂交的方式分选目标分子(Pease et al., Proc Natl Acad Sci USA,91:5022-5026,1994 ;Fodor et al.,Nature,364:555-556, 1993)
[0207]另外运用本技术扩增出来的产物可以用于Bistar的OIA技术。OIA运用如镜面样的硅基底。一层薄膜光学涂层以及捕获抗体吸附于此硅基底上。白光照射在薄膜上形成金色的背景色。此颜色不会改变直到光学薄膜的厚度发生改变。
[0208]当阳性样品置于此硅基底上时,配体和抗体发生结合。当配体被加入以完成质量强化时,相应地由于分子薄层的厚度发生增加,颜色会从金色变为紫色/蓝色。这个技术可以参考美国专利号:US5,541,057,特此提供参考。
[0209]加入的RNA或者DNA可以用实时定量PCR(RT-PCR)以定量(Higuchi et al.,BiotechnologylO:413-417,1992)。通过确定经过一定量扩增循环,并且出于线性区的扩增物的浓度,可以确定原混合物中目标序列的相对浓度。比如,假设此DNA的混合物是组织或细胞中提出去来的RNA转录出来的cDNA,包含目标序列的目标mRNA的相对丰度可以通过此种方式得到。目标片断的相对成比例的浓度关`系只在扩增反应的线性区域成立。
[0210]目标DNA的最终扩增物浓度,在扩增平台期曲线是由反应试剂的充足性有关,而与目标DNA的原始浓度无关。所以,通过实时定量PCR进行RNA或DNA精确相对定量的首要条件是扩增物的浓度需要在反应线性区。第二个必须满足的条件是RT-PCR反应中扩增出的特定mRNA序列的cDNA需要和一些独立的标准样品进行归一化。RT-PCR试验的目的是确定某个RNA或者DNA序列相对于样品中全部RNA或DNA的丰度。
[0211]Luminex科技可以使固定于带颜色的微球的核酸定量成为可能。生物分子反应的强度通过测量被称为报告子的第二个分子实现。报告分子通过附着于微球上以测量反映的强度。因为微球和报告分子均带上特定的颜色,数字信号处理可以实时地对这些信号进行翻译,以对每个反应进行实时定量。这些标准化的技术可见美国专利号:US5,736303和US6, 057, 107,特此提供参考
[0212]实施例VII
[0213]探测技术
[0214]扩增物必须要经过探测才能确定目标基因是否被扩增。其中一个探测可视化的方式是利用突光染料辅助的凝胶成像,比如说溴化乙唳或者Vistra Green,经过紫外光照射探测。或者如果扩增物本身自体被放射性或荧光标记了核苷酸,扩增的产物可以直接进行X光胶片曝光,或者适合的激发光谱探测。
[0215]在一种实现方式中,可视化是通过间接的方式,运用一种核酸探针。扩增物分离后,一段带标记的核酸探针与扩增物混合。探针与染料分子结合是最优的,但也可以通过放射性标记进行。在另一种实现方式中,探针与结合分子相结合,例如抗体或者生物素,或者可检测的其他配体。在另一种实现方式中,探针含有荧光染料或者标记。在另一种实现方式中,探针含有质量标记以探测扩增的分子。其他可预见的实现方式包括Taqman TM和分子信标探针。在另外一种实现方式中,固态捕获方法结合标准化的探针也可以被应用。
[0216]混入DNA扩增物的标记分子的种类由分析方法决定。当使用微管电泳,微流控电泳,高效液相色谱(HPLC),或者液相色谱(LC)分离时,混合的或插入的荧光染料被用于标记和探测扩增物。样品是通过动态探测的,标记分子经过探测器同时进行荧光定量。如果任何电泳、HPLC或者LC方法用于分离,产物可以通过紫外吸收进行探测,紫外吸收是DNA固有的性质,因此不需要额外加入标记。如果应用聚丙烯酰胺凝胶或者板凝胶电泳,核酸扩增的引物可以用荧光染料、色团染料、放射性基团标记,或者可以通过酶催化反应探测。酶反应包括酶与引物的结合,比如说,在通过凝胶分离扩增物后,通过生物素:抗生物素蛋白相互作用进行分析,又或者是通过化学反应,如鲁米诺化学发光反应。荧光信号可以被动态监测。放射性同位素或没反应检测要求首先进行凝胶分离,然后将DNA分子转移到固态支撑物。如果扩增物是通过质谱仪进行分离的,就不需要标记,因为核酸可以直接被检测。
[0217]以上提到的各种分离方法可以给予分子的两种以上不同的特性组合起来使用。比如说,有些PCR引物可以与一些配合基结合,可供进行亲和性捕获,某些引物可能没有标记。标记可以包含糖类(如和凝集素柱的结合),疏水性基团(如和反相柱结合),生物素(如和抗生蛋白链菌素柱结合),抗原(如和抗体柱结合)。样品流经亲和层析柱。流过的部分被收集,结合的部分被洗脱(通过化学切割、盐洗脱等)。这些样品进一步通过各种性质(如质量)进行分离以确定基本组分。
[0218]实施例VIII
[0219]试剂盒`
[0220]这里展示的扩增方法内的材料或者试剂可以被组合成试剂盒。现有展示的扩增试剂盒大致包含至少可供反应的酶和核苷酸及引物序列。在较好的实施方式中,试剂盒包含从DNA样品中扩增DNA的说明书。
[0221]与这里展示方法相关的试剂盒会大体包括一个或多个预先选择的引物和/或探针序列,这些序列可能特异性或非特异性地探测待扩增的基因。试剂盒更可能包含一种或多种核酸探针和/或引物集合以探测核酸。在某些实现方式,如在扩增核酸的试剂盒中,探测核酸的方法是一个标记,例如荧光色团、放射性标记、酶标记等等,这些标记与核酸引物或者序列本身。可以预见试剂盒可能含有多种引物组合以实现本展示方法各部扩增反应。也可以预见试剂盒可能含有沉淀试剂以便于后续用固态介质保存DNA样本。
[0222]这里用全基因组扩增试剂盒举例。试剂盒较好的实现方式如下:提供5’端确定,中间随机,3 ’端固定的引物,引物均匀或显著均匀地与基因组DNA杂交。试剂盒可包含第二个引物,引物与第一个引物的5’端固定序列一致。例如,试剂盒可被运用于扩增所有的基因和染色体的区域,对于特定的物种,这些基因和区域的序列可能已知或未知。试剂盒还会包含适合扩增核酸的酶,核苷酸和扩增所需要的缓冲液。
[0223]本展示方法中的试剂盒可能含有具有一种或多种配合物修饰的引物。另一方面,试剂盒含有一种或多种多核苷酸碱基序列,这些序列相互不会,或不显著会与同一个反应的其他序列相互碱基配对。试剂盒可能包含DNA聚合酶,或者是具有链置换活性的聚合酶,包括,例如下列聚合酶中的一种,或多种混合:Phi29聚合酶,Bst聚合酶,Pyrophase3173聚合酶,Vent聚合酶,Deep Vent聚合酶,TOPOTaq聚合酶,Vent exo_聚合酶,DeepVentExo-聚合酶,9’ Nm聚合酶,Klenow片断,MMLV反转录酶,AMV反转录酶,HIV反转录酶,T7phase DNA聚合酶的exo-突变体。
[0224]试剂盒对每个分别的试剂和酶,以及探针和引物可设计不同的容器。每一种生物试剂均应分装至分别合适的容器中。这些容器一般至少包含一个试管或测试小管。烧瓶、试剂瓶或者其他承装试剂的容器形式也有可能被采用。这些容器会封闭保存进行商业销售。合适的较大的容器可能会被应用于包含与测试管相匹配的注射加样辅助器具。具体操作指南可与试剂盒一并提供。
[0225]实施例1X
[0226]扩增物测丨序
[0227]应用高通量测序已发表或已被熟知的方法和流程,DNA的扩增物经过去引物序列后可以用于高通量测序。
[0228]实施例X
[0229]运用单细胞的一部分遗传物质进行全基因组扩增和测序以应用于全基因组单倍型检测
[0230]用口吸管或者其他已被熟知的方法如:激光显微切割和流式细胞仪可以将一个单细胞分离放置于一个PCR管中。PCR管随后`可通过离心将细胞离心至管底。
[0231]Iul的血样通过指尖取样的方法获得后置于200ul的红细胞裂解液中(0.1%Triton X-100,10mM EDTA in PBS)。经过5分钟室温的处理后,大部分红细胞被裂解,而白细胞或其他细胞的细胞核未被裂解。随后通过口吸管从裂解液中吸出一个单细胞放置在一个试管中。
[0232]60ul 的裂解液(30mM Tris-Cl PH7.8,2mM EDTA, 20mM KCL,0.3% Triton X-100,30mM dTT, 12.5ug/ml Qiagen Protease, 0.1ul 引物 5,_GT GAG TGA TGG TTG AGG TAG TGTGGA GNNNNNGGG-3’)加入含有单细胞的管中。以下的温度循环应用于细胞裂解中:50C3小时,70C20分钟。裂解液及温和的加热过程是用于减少DNA的双链断裂及单链上的缺口形成。这样处理过的DNA平均长度长于lOOkb。0.1uM的引物加入裂解液目的为吸附于管壁及吸液管壁,以防止过多的基因组DNA吸附于这些表面。对于组织样品,可以研磨组织,或者用激光微切割的方法分离组织的一部分,然后置于60ul的裂解液中。对于多个细胞,可以先离心富集细胞后用60ul的裂解液进行裂解。
[0233]以下的流程用于将裂解出的DNA分子分离成多个部分,使每个部分含有基因组的一部分。单细胞的裂解产物DNA分散于60ul的裂解液中,用各种方法可将裂解液分为N份。结果是两个等位基因通常被分散在不同的部分中。对于二倍体细胞,两个等位基因不被分到不同的部分的机会是1/N。在单细胞单倍型实验中,N可任意大以确保等位基因完全分离。如果多个同样的细胞能被收集到,同样的程序能被应用到不同的细胞中,以确保至少在某些细胞中等位基因得到分离。在一个方面,低黏附的PCR管和吸液管被应用于防止DNA吸附于管壁,扩增使用的引物加入裂解液中已防止基因组DNA吸附于管壁。单细胞裂解步骤完成后,运用移液枪可将分离出的DNA分于N个独立的等分部分。或者DNA可以用微流控或者其他已知的方法分于N个个体部分。分离出的DNA在4度下在微流控器件中被小心扰动。微流控器件被特意设计为具有多个出口管道(约30个管道)。随后收集每个管道里的溶液作全基因组扩增。又或者,对于多个细胞或者组织的样本,分离出的DNA可被稀释成少于一个细胞基因组DNA的量,一个人类细胞基因组DNA大约为6pg。
[0234]每个部分的DNA随后被这里展示的方法全基因组扩增。又或者,每个部分的DNA可以被各种已知的方法扩增,比如说:多重链置换扩增(Multiple DisplacementAmplification, MDA),或者应用目前市场上存在的全基因组扩增试剂盒,如Picoplex(Rubicon Genomics), Genomeplex (Sigma Aldrich), GenomiPhi(GE HealthcareLifesciences),或者类似的产品。
[0235]通过分别检测每个亚细胞组分的基因组的单碱基核苷酸多态性(SNP)可进行区域性单倍型的分析。全基因组单倍型分析可以通过对比分析多个组分的区域性单倍型获得。首先,各个亚细胞组分的基因组被分别测量和确定。这些序列与人类的参考基因进行比对,确定每个亚细胞组分的SNP情况。因为每一个亚细胞组分均只含有单细胞基因组的一小部分,每个组分的测序覆盖图将呈现模块(block)状分布,基因组的大多部分没有覆盖。统计来说,所有属于一个模块的测序读数来源于同一条染色体,所以所有的在同一模块里面发现的SNP均可被连接并归类到同一个单倍型上。单倍型连接SNP的长度决定于DNA提取后片断的长度。全基因组或全染色体单倍体分型可以通过多个细胞重复上面所述的步骤获得。在这种情况下,每个细胞得到的单倍型相互重叠,单个染色体上的SNP可以准确地得到单倍型分型。除了使用基因组测序,其他的基因组分型方法(如SNP微阵列)也可以被应用。
[0236]这里展示的一个通过从头组装每个亚细胞单倍型组分,并进行相互比较,从而进行全基因组从头组装的一个方法。对于没有`参考基因组的物种,或者基因组变异显著的情况(如癌症),基因组从头组装是必要的。进行测序以后,分别确定每一个亚细胞组分的序列。这些亚细胞组分的序列可通过常规的从头组装程序或算法获得,例如使用CLCGenomics Workbench (CLC bio), SeqManNGen(DNASTAR)或者类似算法。DNA 模块的大小通常为IOOkb左右。这些组装好的模块随后相互比对以建立组装基因组。因为这些模块的大小相似,为IOOkb左右,基因组组装的复杂度与基因组大小成正比,而传统的基因组组装复杂度与基因组大小成指数关系。
[0237]实施例XI
[0238]单细胞单倍型分型
[0239]一个从去标识化病人P2处取得的单个白细胞被口吸管分离,然后裂解于IOul的裂解液中。含有裂解液的试管置于一个热循环仪上:50C3小时,70C20分钟。加入60ul的裂解液(不含酶),共70ul的溶液经过混合后分于24个PCR管中。用在示例一中所述的方法用Deep VentR(exo-)聚合酶将24个PCR管中的DNA分别扩增。PCR产物纯化后用荧光定量PCR测试I号及2号染色体上的两个位点。表1中展示了染色体I和染色体2位点在24个PCR管中的测试结果。表中展示的数字是qPCR中的Ct值,表示位点测试阳性的结果。‘X’表示的是位点测试为阴性的结果。
[0240]表1
[0241]
【权利要求】
1.一种扩增单细胞全基因组的方法,包括: (a)在反应容器中提供单链形式的来自单细胞的基因组DNA; (b)向反应容器中加入具有共同序列、可变序列和固定序列的引物以产生反应混合物, (c)将所述反应混合物经受低温,所述引物至所述单链基因组DNA的退火在所述低温下发生, (d)向所述反应混合物中加入具有链置换活性或具有5’-3’核酸外切酶活性的至少一种DNA聚合酶,并将所述反应混合物经受发生DNA扩增的温度,以产生单链或双链DNA, (e)将所述反应混合物经受产生单链扩增物的温度; (f)可选地将所述反应混合物经受退火游离引物至所述扩增物3’端的温度; (g)重复步骤(c)至(f)以产生所述基因组DNA的扩增物,以及 (h)分析基因组DNA以分析先天性疾病或已知的表型后果,包括整个染色体水平异常、染色体易位、非整倍体、部分或全部染色体的缺失或复制、β_地中海贫血、唐氏综合征、囊性纤维化、镰状细胞病、泰-萨克斯病、脆性X综合征、脊髓性肌萎缩症、血红蛋白病、α -地中海贫血、X连锁疾病(由X染色体上的基因主导的疾病)、脊柱裂、无脑畸形、先天性心脏病、肥胖、糖尿病、癌症、胎儿性别、胎儿RHD、胎儿HLA单倍型、父源突变、或染色体非整倍体。
2.根据权利 要求1所述的方法,其中,所述引物具有以下序列:5’-GTGAGTGA TGGTTG AGG TAG TGT GGA GNNNNNGGG-3,和 5’ -GT GAG TGA TGG TTG AGG TAG TGT GGAGNNN剛ΤΤΤ-3,。
3.根据权利要求1所述的方法,其中,所述DNA聚合酶包含Φ29聚合酶或Bst聚合酶中的至少一种。
4.根据权利要求1所述的方法,其中,所述DNA聚合酶包含Φ29聚合酶和Bst聚合酶。
5.根据权利要求1所述的方法,进一步包括去除扩增物5’端和3’端的引物序列及互补引物序列的步骤。
6.根据权利要求1所述的方法,其中,所述退火发生的低温在约0°C至约10°C之间。
7.根据权利要求1所述的方法,其中,所述DNA扩增发生的温度在约30°C至约65°C之间。
8.根据权利要求1所述的方法,其中,退火所述游离引物至所述扩增物3’端的所述温度在约55°C至约60°C之间。
9.根据权利要求8所述的方法,其中,所述游离引物的退火温度在低温淬火之前进行。
10.根据权利要求1所述的方法,其中,所述可选步骤在第二和后续的热循环过程中进行。
11.一种处理至少一个细胞或多个细胞以进行DNA扩增的方法,包括从一个细胞或多个细胞获得基因组DNA以及将所述基因组DNA分离成所述基因组DNA的个体部分。
12.根据权利要求11所述的方法,其中,所述基因组DNA被分离成所述基因组DNA的多个个体部分。
13.根据权利要求12所述的方法,其中,所述基因组DNA的多个个体部分是约2个至约500个所述基因组DNA的个体部分。
14.根据权利要求11所述的方法,其中,两个同源等位基因被分离至所述基因组DNA的不同部分。
15.根据权利要求11所述的方法,其中,一个或多个染色体的两个同源等位基因被分离至所述基因组DNA的不同部分。
16.根据权利要求11所述的方法,其中,所述基因组DNA的所述个体部分被扩增,以产生所述基因组DNA的扩增部分。
17.根据权利要求16所述的方法,其中,所述基因组DNA的所述扩增部分被测序,以产生所述基因组DNA的测序部分。
18.根据权利要求17所述的方法,其中,所述基因组DNA的所述测序部分被分析,以确定所述同源等位基因的存在。
19.根据权利要求18所述的方法,其中,所述同源等位基因的存在是通过识别单碱基多态性确定的。
20.根据权利要求19所述的方法,进一步包括确定所述基因组DNA的单倍型。
21.根据权利要求1所述的方法,其中,所述单细胞是单个胎儿细胞。
22.根据权利要求1所述的方法,其中,所述单细胞是单个胎儿细胞,并且所述方法进一步包括 (h)分析所述基因组DNA以分析先天性疾病或已知的表型后果,包括整个染色体水平异常、染色体易位、非整倍体、部分或全部染色体缺失或复制、β_地中海贫血、唐氏综合征、囊性纤维化、镰状细胞病、泰-萨克斯病、脆性X综合征、脊髓性肌萎缩症、血红蛋白病、α -地中海贫血、X连锁疾病(由在X染色体上基因主导的疾病)、脊柱裂、无脑畸形、先天性心脏病、肥胖、糖尿病、癌症、胎儿 性别、胎儿RHD、胎儿HLA单倍型、父源突变、或染色体非整倍体。
23.—种扩增单细胞基因组的方法,包括: (a)在反应容器中提供单链形式的来源于所述单细胞的基因组DNA; (b)向所述反应容器中加入具有共同序列、可变序列和固定序列的引物以产生反应混合物; (c)将所述反应混合物经受低温,所述引物至所述单链基因组DNA的退火在所述低温发生; (d)向所述反应混合物中加入至少一种具有链置换活性或具有5’-3’核酸外切酶活性的DNA聚合酶,并将所述反应混合物经受发生DNA扩增的温度,以产生在3’端具有引物序列的单链基因组DNA的第一轮扩增物; (e)将所述反应混合物经受将双链核酸解旋为单链核酸的温度; (f)将所述反应混合物经受低温,引物到单链基因组DNA的退火在所述低温下发生,以及引物到第一轮扩增物的退火在所述低温下发生; (g)向所述反应混合物中加入至少一种具有链置换活性或具有5’-3’核酸外切酶活性的DNA聚合酶,或者5’游离核酸内切酶活性的聚合酶,并将所述反应混合物经受发生DNA扩增的温度,以产生在3’端具有引物序列的单链基因组DNA的第一轮扩增物,以及所述第一轮扩增物的第二轮扩增物,所述第二轮扩增物在其3’和5’端具有互补引物序列; (h)将所述反应混合物经受将双链核酸解旋为单链核酸的温度; (i)将所述反应混合物经受退火游离引物至所述第二轮扩增物3’端的温度,或退火所述第二轮扩增物的3’端至其5’端的温度,从而形成环状结构,从而使所述第二轮扩增物不能用于扩增; U)重复(f)至⑴以产生所述基因组DNA的扩增物。
24.根据权利要求23所述的方法,其中,所述引物具有以下序列:5’-GTGAG TGA TGGTTG AGG TAG TGT GGA GNNNNNGGG-3,和 5’ -GT GAG TGA TGG TTG AGG TAG TGT GGAGNNN剛TTT-3,。
25.根据权利要求23中所述的方法,其中,所述DNA聚合酶包含Φ29聚合酶或Bst聚合酶中的至少一种。
26.根据权利要求23所述的方法,其中,所述DNA聚合酶包含Φ29聚合酶和Bst聚合酶。
27.根据权利要求23所述的方法,进一步包括去除所述扩增物5’端和3’端的引物序列及互补序列的步骤。
28.根据权利要求23所述的方法,其中,所述退火发生的低温在约0°C至约10°C之间。
29.根据权利要求23所述的方法,其中,所述DNA扩增发生的温度在约30°C至约65°C之间。
30.根据权利要求23所述的方法,其中,所述游离引物至所述扩增物3’端,或所述第二轮扩增物3’至其5’端的退火从而形成环状结构的温度在约55°C至约60°C之间。
31.根据权利要求30所述的方法,其中,所述游离引物的退火温度在低温淬火之前进行。
32.根据权利要求23所述的方法,其中,所述单细胞是出生前细胞。
33.根据权利要求23所述的方法,其中,所述单细胞是癌细胞。
34.根据权利要求23所述的方法,其中,所述单细胞是循环肿瘤细胞。
35.一种扩增一个或多个细胞基因组的方法,包括: (a)在一个反应容器中提供单链形式的来源于所述一个或多个细胞的基因组DNA; (b)向所述反应容器中加入含有共同序列、可变序列和固定序列的引物以产生反应混合物; (c)将所述反应混合物经受低温,所述引物到所述单链基因组DNA的退火在所述低温下发生; (d)向所述反应混合物中加入至少一种具有链置换活性或具有5’至3’核酸外切酶活性的DNA聚合酶,并将所述反应混合物经受发生DNA扩增的温度,以产生在3’端具有引物序列的所述单链基因组DNA的第一轮扩增物; (e)将所述反应混合物经受将双链核酸解旋为单链核酸的温度; (f)将所述反应混合物经受低温,所述引物至所述单链基因组DNA的退火在所述低温下发生,以及所述引物至第一轮扩增物的退火在所述低温下发生; (g)向所述反应混合物中加入至少一种具有链置换活性或具有5’至3’核酸外切酶活性的DNA聚合酶,或5’游离核酸内切酶活性的聚合酶,并将所述反应混合物经受发生DNA扩增的温度,以产生在3’端具有引物序列的所述单链基因组DNA的第一轮扩增物,以及所述第一轮扩增物的第二轮扩增物,所述第二轮扩增物在其3’和5’端具有互补引物序列; (h)将所述反应混合物经受将双链核酸解旋为单链核酸的温度;(i)将所述反应混合物经受退火游离引物至所述第二轮扩增物3’端,或退火第二轮扩增物的3’端至其5’端的温度,从而形成环状结构,从而使所述第二轮扩增物不能用于扩增; U)重复步骤(f)至(i),以产生所述基因组DNA的扩增物。
36.根据权利要求35所述的方法,其中,所述引物具有以下序列:5’-GTGAG TGA TGGTTG AGG TAG TGT GGA GNNNNNGGG-3,和 5’ -GT GAG TGA TGG TTG AGG TAG TGT GGAGNNN剛TTT-3,。
37.根据权利要求35所述的方法,其中,所述DNA聚合酶包含Φ29聚合酶或Bst聚合酶中的至少一种。
38.根据权利要求35所述的方法,其中,所述DNA聚合酶包含Φ29聚合酶和Bst聚合酶。
39.根据权利要求35所述的方法,进一步包括去除扩增物5’端和3’端的引物序列及互补序列的步骤。
40.根据权利要求35所述的方法,其中,所述退火发生的低温在约0°C至约10°C之间。
41.根据权利要求35所述的方法,其中,所述DNA扩增发生的温度在约30°C至约65°C之间。
42.根据权利要求35所述的方法,其中,所述游离引物至所述第二轮扩增物3’端退火,或所述第二轮扩增物3’至5’端退火从而形成环状结构的温度在约55°C至约60°C之间。
43.根据权利要求42所述的方法, 其中 ,所述游离引物的退火温度在低温淬火之前进行。
44.根据权利要求35所述的方法,其中,所述单细胞是出生前细胞。
45.根据权利要求35所述的方法,其中,所述单细胞是癌细胞。
46.根据权利要求35所述的方法,其中,所述单细胞是循环肿瘤细胞。
47.一种从一个或多个细胞线性扩增单链基因组DNA的方法,包括: (a)在引物以及具有链置换活性和具有5’至3’核酸外切酶活性的或者5'游离核酸内切酶活性的DNA聚合酶存在下扩增所述单链基因组DNA,以产生所述单链基因组DNA和在3’端具有引物序列的所述单链基因组DNA的第一轮扩增物的第一混合物; (b)在引物以及具有链置换活性和具有5’至3’核酸外切酶活性的或者5'游离核酸内切酶活性的DNA聚合酶存在下扩增所述第一混合物,以产生所述单链基因组DNA、在3’端具有引物序列的所述单链基因组DNA的第一轮扩增物,以及在其3’和5’端具有互补引物序列的第二轮扩增物的第二混合物; (c)退火游离引物至所述第二轮扩增物3’端,或退火所述第二轮扩增物的3’端至其5’端,从而形成环状结构,从而使所述第二轮扩增物不能用于扩增;以及 (d)在引物和具有链置换活性或具有5’至3’核酸外切酶活性的或者5'游离核酸内切酶活性的DNA聚合酶存在下扩增所述第二混合物,以产生所述基因组DNA的扩增物。
48.根据权利要求47所述的方法,其中,所述基因组DNA来自出生前细胞。
49.根据权利要求47所述的方法,其中,所述基因组DNA来自癌细胞。
50.根据权利要求47所述的方法,其中,所述基因组DNA来自循环肿瘤细胞。
51.根据权利要求47所述的方法,其中,所述基因组DNA来自单个出生前细胞。
52.根据权利要求47所述的方法,其中,所述基因组DNA来自单个癌细胞。
53.根据权利要求47所述的方法,其中,所述基因组DNA来自单个循环肿瘤细胞。
54.一种扩增一个或多个细胞基因组的方法,包括: (a)在引物以及具有链置换活性和具有5’至3’核酸外切酶活性的或者5'游离核酸内切酶活性的至少一种DNA聚合酶存在下扩增来自所述一个或多个细胞的所述单链基因组DNA,以产生在3’端具有引物序列的所述单链基因组DNA的第一轮扩增物; (b)在引物以及具有链置换活性和具有5’至3’核酸外切酶活性的或者5'游离核酸内切酶活性的至少一种DNA聚合酶存在下扩增所述单链基因组DNA和所述第一轮扩增物,以产生在3’端具有引物序列的所述单链基因组DNA的第一轮扩增物,以及所述第一轮扩增物的第二轮扩增物,所述第二轮扩增物在其3’和5’端具有互补引物序列; (c)使所述第二轮扩增物经受退火游离引物至所述第二轮扩增物3’端,或退火所述第二轮扩增物的3’端至其5’端的温度,从而形成环状结构,从而使所述第二轮扩增物不能用于扩增;以及 (d)重复步骤(b)至(c),以产生所述基因组DNA的扩增物。
55.根据权利要求54所述的方法,其中,所述基因组DNA来自出生前细胞。
56.根据权利要求54所述的方法,其中,所述基因组DNA来自癌细胞。
57.根据权利要求54所述的方法,其中,所述基因组DNA来自循环肿瘤细胞。
58.根据权利要求54所 述的方法,其中,所述基因组DNA来自单个出生前细胞。
59.根据权利要求54所述的方法,其中,所述基因组DNA来自单个癌细胞。
60.根据权利要求54所述的方法,其中,所述基因组DNA来自单个循环肿瘤细胞。
61.一种分析个体癌细胞的方法,包括: (a)在引物以及具有链置换活性和具有5’至3’核酸外切酶活性的或者5'游离核酸内切酶活性的至少一种DNA聚合酶存在下扩增来自所述癌细胞的单链基因组DNA,以产生在3’端具有引物序列的所述单链基因组DNA的第一轮扩增物; (b)在引物以及具有链置换活性和具有5’至3’核酸外切酶活性的或者5'游离核酸内切酶活性的至少一种DNA聚合酶存在下扩增所述单链基因组DNA和所述第一轮扩增物,以产生在3’端具有引物序列的所述单链基因组DNA的第一轮扩增物,以及所述第一轮扩增物的第二轮扩增物,所述第二轮扩增物在其3’和5’端具有互补引物序列; (c)使所述第二轮扩增物经受退火游离引物至所述第二轮扩增物3’端,或退火所述第二轮扩增物的3’端至其5’端的温度,从而形成环状结构,从而使所述第二轮扩增物不能用于扩增;以及 (d)重复步骤(b)至(c),以产生所述基因组DNA的扩增物;以及 (e)分析由癌细胞扩增的基因组DNA,用于分析单核苷酸多态性(SNV),尺寸范围为1-1OObp的小插入和缺失(Indels),基因组长度范围为IOObp-1OOMbp的拷贝数多态性(CNV),范围为Ibp-1Mbp的序列的倒位和复制,范围为IObp-1OOMbp的杂合性丢失(LOH),全染色体水平异常如染色体易位、非整倍 体、部分或全部染色体的缺失或复制。
【文档编号】C12Q1/68GK103890191SQ201280037511
【公开日】2014年6月25日 申请日期:2012年5月22日 优先权日:2011年5月27日
【发明者】谢晓亮, 宗诚航, 陆思嘉 申请人:哈佛大学校长及研究员协会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1