通过测序分析进行的非侵入性胎儿遗传筛选的制作方法

文档序号:6159064阅读:463来源:国知局
通过测序分析进行的非侵入性胎儿遗传筛选的制作方法【专利摘要】本发明提供一种非侵入性技术,其用于在含有来自不同基因组来源的遗传物质的生物样本中差异检测多个靶基因的多基因型和/或突变。使用来自生物样本的多个靶序列的多重扩增进行方法,测序用于在单个核苷酸水平上检测和计算遗传突变和染色体异常。【专利说明】通过测序分析进行的非侵入性胎儿遗传筛选[0001]相关申请[0002]本专利申请要求2010年10月26日提交的US临时专利申请系列号61/406,809的权益和优先权,其整个并入此处作为参考。[0003]关于联邦资助的研究或开发的声明[0004]本发明根据美国国立卫生研究院所颁发的协议0D000251得到美国政府的支持。政府在本发明中享有一定的权利。【
技术领域
】[0005]本发明涉及从含有来自不同基因组来源的遗传物质的生物样本中的定量核酸分析领域。更具体地,本发明提供了一种非侵入性技术,用于在含有来自不同基因组来源的遗传物质的生物样本中差异检测基因型。【
背景技术
】[0006]在母源体血液中可以检测到从胎盘脱落的胎儿DNA,其介于总DNA的3%和6%之间的水平。因此,已经描述了一些基于PCR的胎儿遗传筛选(例如,性别、Rh和地中海贫血)。然而,至少两个主要原因限制了传统技术--第一,PCR分析以灵敏度换取特异性,通常使其难以识别特定的突变,和第二,非整倍体,如唐氏综合征,不能由常规PCR在异源样本中检测。[0007]避免基于PCR的分析的问题的方法之一是使用高度规模化技术通过大量DNA。这样的数字分析方法涉及到将提取的基因组物质分到离散的子样本中,从而靶序列检测为二进制(0,1)。例如,数字PCR允许扩增单个分子,随后进行定量分析。数字PCR通常需要在多孔格式中进行核酸的有限稀释,然后在孔中扩增核酸。[0008]数字PCR已应用于胎儿诊断,以便以超越常规PCR的特异性和敏感度来检测胎儿突变。然而,这样的方法经过优化用于分析生物样本中的单个靶,而且,在不询问样本中其它靶身份的情况下消耗样本。此外,数字PCR限于光学检测。因此,使用数字PCR的多重分析是不可行的,因为难以在一个给定孔中将多个靶的光信号区分开。此外,常规的数字分析不允许检测胎儿的单核苷酸多态性(SNP),所述SNP对于胎儿广泛的疾病或病理情况是有提示性的。因此,需要改进的方法用于在单核苷酸水平上的对许多不同靶基因的多基因型和/或突变的非侵入性产前筛选。【
发明内容】[0009]本发明提供了用于在含有来自至少两种不同基因组来源的遗传物质的样本中在多个不同靶区域中,精确测量基因组不稳定性的方法。本发明的方法涉及使用测序技术来数字计数异源生物样本中所含的一组被选择性扩增的靶。本发明的方法提供靶序列的数字计数,并通过序列读取比数字分析的传统方法给予更多的数据,如二进制输出数字PCR。因此,本发明的方法比常规筛选方法提供更高的检测率和改进的临床性能。[0010]本发明的方法可用于任何异源样本。本发明的方法特别用于遗传疾病的检测,以及特别用于胎儿遗传疾病的检测。此处所提供的方法可用于检测任何基因组不稳定性,如点突变或非整倍体(例如,三倍体、单倍体、复制、缺失、添加、重排、易位,或倒位)。[0011]本发明的方法优选在包含来自至少两种不同基因组来源的遗传物质的混合物的生物样本上进行。使用位于待讯问的区域两侧的引物扩增样本中的多个靶序列。[0012]然后直接测序扩增的靶序列,计数扩增子。最后,通过和参考进行比较来分析结果。例如,可以比较多个扩增的靶序列的比来检测非整倍体;或序列信息可以和参考序列或获自另一样本的序列进行比较。因此,母源序列(例如,从颊拭子获得)可以作为参考,或参考可以来自另一个体或来自共有序列。[0013]不同于数字PCR、或其它的数字分析方法,本发明方法的进行无需首先稀释生物样本或将生物样本中遗传物质的混合物分配至离散的子样本中。通过同时扩增来自含有来自不同基因组来源的遗传物质的混合物的异源生物样本的多个靶序列部分地进行本发明的方法。然后,遗传物质的扩增混合物直接测序以便数字计数扩增链(一条链一个读取)。[0014]优选,用单分子测序技术,特别是边合成边测序(sequencing-by-synthesis)技术进行本发明的方法。测序技术来数字计数靶序列的扩增链允许检测胎儿SNP,以及染色体异常从而检测广泛的胎儿疾病。[0015]可用于本发明方法的合适边合成边测序平台包括但不限于真实的单分子测序(tSMS?)技术比如HelicosInc.(Cambridge,MA)提供的HeliScope?测序仪、单分子实时(SMRT?)技术比如PacificBiosciences(California)提供的PacBioRS系统、以及大规模并行测序技术比如IlluminaInc.(SanDiego,California)提供的HiSEQ2000系统。[0016]选定靶序列的同时扩增允许操作者为每个家长定制产前筛查测试。对于可用本发明方法分析的靶序列数目没有任何限制。本发明提供了对多个靶基因的多基因型和/或突变的分析。此外,可以从有限数目的生物样本分析无限数目的靶序列,而不需要进行富集。尽管,在靶序列扩增和/或测序之前,任选富集一个或多个基因组序列群。例如,可以使用本发明的方法分析来自无论何处的2到100+个靶序列。[0017]可根据本发明的方法对各种遗传异常进行差异检测,包括一个或多个靶序列中的突变、缺失、插入、重排、复制、易位和倒位。本发明尤其用于检测SNP,以及非整倍体(包括整个染色体的复制和缺失)。[0018]包含来自不同基因组来源的遗传物质的混合物的异源生物样本的实例包括血液、血液组分(fraction)(例如,血浆)、唾液、痰、尿、精液、阴道液、汗、乳汁、乳房液、脑脊液、大便、细胞或组织活检。在一般情况下,本发明用于检测具有来自多基因组来源的核酸的样本中的核酸。在一个【具体实施方式】中,异源生物样本是来自怀孕女性的外周血,特别是来自外周血的血浆。将遗传物质构成生物样本的不同基因组来源可以来自怀孕女性和胎儿、非癌细胞或组织和癌细胞或组织,或来自供体组织和移植受体组织。因此,本发明的方法尤其用于在母源外周血中使用无细胞胎儿DNA进行的非侵入性产前筛选遗传突变,尤其用于检测胎儿SNP和染色体异常。然而,本领域技术人员认识到本发明的方法也可用于在血液、大便、痰、尿、阴道液、乳头吸出物、脑脊液等中使用无细胞核酸来筛选和癌症有关的一组靶基因。本发明的方法也可用于在供体和移植受体组织中筛选各种靶基因的多基因型和/或突变。【专利附图】【附图说明】[0019]图1是体现通过测序进行的胎儿基因分型的示意图。[0020]图2是一张描述理论平均的图,其假设针对一个突变的母源携带者以及临床相关胎儿状态之间的匹配。ε是可检测到的等位基因分数(fraction),这与纯合子胎儿中野生型和突变等位基因之间的差异相同。[0021]图3是一张描述对于给定条件理论上基于标准偏差的数目的图。[0022]图4是一张描述使用数字测序技术时来校正扩增偏倚(bias)的方法的示意图。【具体实施方式】[0023]1.概述[0024]此处描述的方法和材料将技术用于分析包含在含有来自不同基因组来源的遗传物质的混合物的生物样本中的大量靶DNA序列,并允许在单核苷酸水平检测不同靶DNA序列之间的差异。[0025]不同于在其中样本中DNA被分离成小反应体积中名义上的单个靶分子的其它数字分析方法,进行本发明的方法无需稀释或分散样本中的遗传物质。本发明的方法允许同时筛选无限数目靶基因的多基因型和/或突变,并在单核苷酸水平上为每个靶基因提供提示性的序列信息,从而提供在受试者中从有限的生物样本数目中非侵入性的、高通量筛选广泛疾病或病理情况的能力。[0026]在一个【具体实施方式】中,本发明的方法涉及分析在母源血液中混合的胎儿和母源DNA,从而从母源DNA背景中鉴定出胎儿的突变或遗传异常。通过从母源血液中扩增对应着多个靶基因的多个靶序列、以及使用测序来差异检测并计数扩增的链部分地实现了靶序列的差异检测。如此处所述的,专门用于分析含有混合的胎儿和母源DNA的生物样本中核酸的方法和材料仅仅是本发明方法如何应用的一个实例,并不意图限制本发明。在血液、大便、痰、尿、阴道液、乳头吸出物、脑脊液等中使用无细胞核酸,本发明的方法也可用于筛选和癌症相关的一组靶基因。本发明的方法也可用于筛选在供体和移植受体组织中多个靶基因的多基因型和/或突变。[0027]本发明的方法一般包括以下步骤:[0028]A.获得含有不同基因组来源的遗传物质的生物样本。生物样本可以是唾液、痰、尿、精液、阴道液、脑脊液、汗、乳汁、乳房液(如乳头吸出物)、大便、细胞或组织活检。在一个具体的实施方式中,生物样本是抽出的血液,来自不同基因组来源的循环DNA发现于血液或血浆、而非细胞中。可任选富集生物样本中来自一个或多个贡献基因组来源的DNA。例如,当生物样本是含有胎儿和母源DNA的混合物的血液或血浆时,可以通过尺寸分馏(fractionation)富集血液或血衆来选择往往小于约300bp的胎儿DNA片段。或者,往往大于约500bp的母源DNA可能被排除在外。另一种富集步骤可以是用甲醛处理血液样本,如Dhallan等人所描述的“MethodstoIncreasethePercentageofFreeFetalDNARecoveredFromtheMaternalCirculation,,,J.Am.Med.Soc.291(9):1114-1119(2004)。[0029]B.无需稀释遗传物质或将遗传物质的混合物分散至离散的反应样本中,扩增来自生物样本的多个靶序列,所述生物样本含有来自不同基因组来源的遗传物质的混合物,以便获得含有来自不同基因组来源的遗传物质的扩增混合物的样本。使用一对以上引物同时扩增单个样本或反应中的多个靶序列的方法,通常被称为多重扩增或多重PCR,已经得以描述并且是本领域普通技术人员众所周知的。优选地,设计多个引物对,使其位于多个靶序列两侧,以及多个靶序列的已知突变位点的两侧。用于进行多重可用PCR的市售试剂盒可以从各种来源获得(如,QIAGEN多重PCR试剂盒)。[0030]C.遗传物质的扩增混合物的测序。虽然任何已知的测序方法都可用于扩增样本中遗传物质的扩增混合物的测序,但是优选单分子(扩增或未扩增)测序方法。这种测序方法提供单核苷酸水平的序列信息,从而允许检测生物样本,而非其它样本中一个基因型中发生的突变及其它异常。[0031]D.针对扩增样本中每个靶序列的扩增序列的数目进行计数。通过序列读取(一个扩增链一个读取)实现计数。[0032]E.进行分析,其中比较扩增的靶序列的比来确定生物样本中不同靶序列的相对量。[0033]根据本发明的方法,通过测序的胎儿基因分型的示意图在图1中显示。从怀孕女性抽血后,血浆立即从可能来自母源的细胞材料中分离出来。然后,以相同的比率,使用各突变位点的侧翼引物,不加区别地扩增无细胞的胎儿和母源DNA的混合物。随后的扩增链测序导致靶位点的数字计数。[0034]I1.步骤说明[0035]A.生物样本的制备[0036]本发明的方法涉及非侵入性的检测。在方法的一个【具体实施方式】中,起始材料是母源血液。为了获得足够的DNA进行测试,优选抽10-20mL血液,以便得到约至少10,000个基因组当量的总DNA。这一样本大小是基于在怀孕初期以大约25个基因组当量/mL母源血浆存在的胎儿DNA估计的,胎儿DNA浓度约总血浆DNA的3.4%。然而,对于需要更低统计学显著性的遗传筛选、或者其中富集胎儿DNA的DNA样本而言,可以抽取较少的血液。[0037]应当指出的是,尽管本说明书通篇涉及胎儿DNA时,也可以分析母源血液中发现的胎儿RNA。如Ng等人在“mRNAofplacentaloriginisreadilydetectableinmaternalplasma”Proc.Nat.Acad.Sc1.100(8):4748-4753(2003)中所描述的,在母源血浆中检测到hPL(人胎盘催乳素)和hCG(人绒毛膜促性腺激素)mRNA转录物,如使用各自的实时RT-PCR分析所分析的。在本方法中,使用在胎盘中表达并存在于兴趣染色体上的mRNA编码基因。例如,DSCR4(唐氏综合征关键区域4)发现于21号染色体上,并主要表达于胎盘中。其mRNA序列见于GenBank匪.sub—005867?在这种情况下,优选使用RNA酶H减号(RNA酶H-)逆转录酶(RT)来制备cDNA进行检测。RNA酶H-RT获自多个制造商,其中SuperScript.TM.1I(Invitrogen)使用最广泛。按照如下描述,逆转录酶PCR可用于染色体DNA。[0038]i.任选从血浆中富集DNA或RNA[0039]母源血液进行处理以富集总DNA中的胎儿DNA浓度,如Li等人所描述的,上文。简言之,使用市售柱技术(RocheHighPureTemplateDNA纯化试剂盒;Roche,Basel,Switzerland)组合真空泵,从5至IOml母源血衆中提取循环DNA。提取后,通过琼脂糖凝胶(I%)电泳(Invitrogen,Basel,Switzerland)分离DNA,并且小心切下含有大小约300bp的循环DNA的凝胶组分。通过使用提取试剂盒(QIAEXII凝胶提取试剂盒;Qiagen,Basel,Switzerland)从此凝胶切块中提取DNA,并洗脱到总体积40.mu.L无菌IOmMtris盐酸pH8.0(Roche)中。[0040]可以通过已知的方法浓缩DNA,包括离心和各种酶抑制剂。DNA结合至选择性膜(如硅胶),以将其从污染物中分离。优选富集DNA中循环于血浆中片段,其长度小于1000个碱基对(“bp”),通常小于300bp。在DNA尺寸分离介质中进行这种尺寸选择,比如在电泳凝胶或色谱材料上。这样的材料描述于Huber等人“High_resolutionliquidchromatographyofDNAfragmentsonnon-porouspoly(styrene-divinylbenzene)particles”NucleicAcidsRes.1993Mar.11;21(5):1061-1066、凝胶过滤色谱、TSK凝胶,如Kato等人所述“ANewPackingforSeparationofDNARestrictionFragmentsbyHighPerformanceLiquidChromatography,,J.Biochem,1984,Vol.95,N0.183-86。[0041]此外,通过使用肽核酸(PNA)抑制某些等位基因实现富集,其中PNA结合其互补靶序列,但不扩增。[0042]血衆RNA提取描述于Enders等人“TheConcentrationofCirculatingCorticotropin-releasingHormonemRNAinMaternalPlasmaIsIncreasedinPreeclampsia”ClinicalChemistry49:727-731,2003。如所述,离心步骤后收获的血衆混合TrizolLS试剂(Invitrogen)和氯仿。混合物离心,将水层转移到新管中。向水层中加入乙醇。然后将混合物上样至RNeasy微型柱(Qiagen),按照制造商的推荐进行操作。[0043]i1.从血液中提取胎儿和/或母源细胞[0044]美国专利申请20040137470报告了一个胎儿DNA的富集过程。在此富集过程中,血液收集到9mlEDTAVacuette管(目录号NC9897284)中,0.225ml含有甲醛(4%w/v)的10%中性缓冲溶液被添加到每个管中,每管轻轻地反转。管储存在4°C下直到处理。[0045]阻碍细胞裂解或稳定细胞膜的试剂可以被加到的管中,包括但不限于甲醛和甲醛衍生物、福尔马林、戊二醛和戊二醛衍生物、交联剂、伯胺反应性交联剂、巯基反应性交联齐?、巯基加成或二硫化物还原、碳水化合物反应性交联剂、羧基反应性交联剂、光反应性交联剂、可裂解交联剂等。可以加入任何浓度的稳定细胞膜或阻碍细胞裂解的试剂。在一个优选的实施方案中,稳定细胞膜或阻碍细胞裂解的试剂以不阻碍或妨碍随后反应的浓度加入。[0046]流式细胞技术也可以用来富集胎儿细胞(Herzenberg等人,PNAS76:1453-1455(1979);Bianchi等人,PNAS87:3279-3283(1990);Bruch等人,PrenatalDiagnosisll:787-798(1991))。美国专利号5,432,054号也描述了一种使用聚乙烯制成的具有宽顶和窄毛细管底部的管用于分离胎儿成核红细胞的技术。使用变速程序的离心导致红细胞根据分子密度堆积在毛细管中。回收含有低密度红细胞的密度组分,包括胎儿的红细胞,而后的差异溶血优选地破坏母源红细胞。高渗介质中的密度梯度用于分离红细胞,现在从淋巴细胞和破裂的母源细胞中富集胎儿红细胞。使用高渗溶液缩小红细胞,从而增加了它们的密度,有利于从更密的淋巴细胞中纯化。分离胎儿细胞后,可以使用本领域标准技术纯化胎儿DNA。[0047]此外,稳定细胞膜的试剂,可被添加到母源血液中,以减少母源细胞裂解,包括但不限于醛、脲醛、苯酚甲醛、DMAE(二甲基氨基乙醇)、胆固醇、胆固醇衍生物、高浓度的镁、维生素E和维生素E衍生物、钙、葡萄糖酸钙、牛磺酸、烟酸、羟胺衍生物、bimoclomol(无对应译文)、鹿糖、奸青素、葡萄糖、阿米替林、藿烧四乙酸苯酯同分异构体A(isomerAhopanetetralphenylacetate)、藿烧四乙酸苯酯同分异构体B、胞磷胆碱、肌醇、维生素B、维生素B复合物、半琥珀酸胆固醇酯、山梨糖醇、钙、辅酶Q、泛醌、维生素K、维生素K复合物、甲基萘醌、zonegran(无对应译文)、锌、银杏叶提取物、二苯基乙内酰脲、perftoran(无对应译文)、聚乙烯吡咯烷酮、磷脂酰丝氨酸、得理多(Tegretol)、PABA、色甘酸二钠、奈多罗米钠、苯妥英、朽1檬酸锌、mexitil(无对应译文)、狄兰汀、透明质酸钠或polaxamerl88(无对应译文)。[0048]一个使用这种试剂的操作实例如下:血液储存在4°C下,直到处理。管在离心机中以IOOOrpm旋转10分钟,制动功率设定为O。第二次,管以IOOOrpm旋转10分钟。每个样本的上清(血浆)转移到新管中,并在3000rpm下旋转10分钟,制动设定为O。上清转移到新管中,并储存于_80°C下。约2毫升包含母源细胞的“血沉棕黄层”放置到单独的管中并储存于_80°C。[0049]ii1.从血浆中提取游离胎儿和/或母源DNA[0050]按照制造商的说明(QIAmpDNABloodMidi试剂盒,目录号51183),使用用于从血细胞中纯化DNA的QIAGENMidi试剂盒从血浆中分离基因组DNA。DNA洗脱到100μI蒸馏水中。QIAGENMidi试剂盒也用于从包含在“血沉棕黄层”中的母源细胞中分离DNA。[0051]最后,应当指出,在某些实施方式中,也可以使用来自唾液、痰、尿、精液、阴道液、汗、乳汁、乳房液、脑脊液、大便、细胞或组织活检的样本,如先前所述。[0052]B.靶序列的扩增[0053]本发明提供在有限量的生物样本中使用多重PCR技术同时筛选多个靶基因的多基因型和/或突变的能力。使用在单一PCR混合物中的多个引物进行多重PCR以产生特异于不同DNA序列的不同大小的扩增子。通过一次靶向多个基因,可能从一次测试运行中得到额外的信息,否则将需要若干倍的试剂以及更多的时间来进行。必须优化每个引物组的退火温度以便在单次反应中正常工作。进行多重PCR反应的方法已得以描述,且进行多重PCR反应的市售试剂盒可以购买获得(例如,见QIAGEN多重PCR试剂盒)。该市售试剂盒可以和特异性引物对联合使用,所述特异性引物对设计用于检测已知参与在受试者(尤其是胎儿)中引起疾病或病症的靶基因、基因突变和/或染色体异常。优选地,多个引物对被设计为位于多个靶序列以及多个靶序列的已知突变位点的两侧。[0054]例如,一个或多个CFTR、因子VII1、β珠蛋白、血色病、G6PD、神经纤维瘤、GAPDH、β淀粉样蛋白、和丙酮酸激酶的基因中的改变已被关联至胎儿的各种疾病或病症。此外,一些胎儿SNP与胎膜早破有关,如TNF-α(胎儿TNF2纯合子相对于TNFl纯合突变,为22%的早产风险,而不是3%的风险)、ΜΜΡ8(最低风险的单倍型(haplotype)2.6%,最高风险的单倍型11.5%)、SERPINH1(胎儿等位基因2.8%->8.2%)、MMPl(突变的胎儿携带者相对于没有突变的纯合子,1.5%->3.4%)0特异于一个或多个这些基因和/或其已知突变的引物可被设计用于本发明的方法。其它遗传异常的特异性引物,如包括在人染色体中被删除、在易位或倒位中移动的、或在染色体复制中所复制的序列的那些,可以通过靶向已知位于特异染色体或染色体区域上的基因进行设计。因此,通过本发明的方法可检测各种疾病或病症,包括非整倍体。[0055]1.引物[0056]可通过各种方法制备引物,包括但不限于克隆适当的序列,以及使用本领域中熟知的方法直接化学合成(Narang等人,MethodsEnzymol.68:90(1979);Brown等人,MethodsEnzymol.68:109(1979))。引物也可从商业来源获得,如OperonTechnologies、AmershamPharmaciaBiotech、Sigma和LifeTechnologies。引物可以具有相同的溶融温度。引物的长度可以在5’端或3’端延长或缩短以产生具有所需熔融温度的引物。而且,可以设计每引物对的退火位置从而引物对的序列和长度产生所需的熔融温度。用于确定小于25个碱基对的引物的熔融温度是的最简单公式是Wallace法则(Td=2(A+T)+4(G+C))。计算机程序也可以被用于设计引物,包括但不限于矩阵设计软件(ArrayitInc.)、用于遗传分析的寡核苷酸探针序列设计软件(OlympusOpticalC0.)、NetPrimer、和来自HitachiSoftwareEngineering的DNAsis。使用软件程序计算各引物的TM(熔融或退火温度),如来自InvitrogenCorp.的OligoDesign。[0057]任何扩增循环后,可以重新计算并提高引物的退火温度,包括但不限于循环1、2、3、4、5、循环6-10、循环10-15、循环15-20、循环20-25、循环25-30、循环30-35或循环35-40。最初的扩增循环后,5’一半的引物并入到来自各目标基因座的产品中,因此可以在各引物5’一半和3’一半的序列基础上重新计算TM。[0058]一些具体的PCR引物可用于本方法,如QIAGEN技术文献中公开的那些。该文献描述了一个操作规程,其中使用QIAmpDNABloodMini试剂盒从外周血和羊水细胞培养物中纯化DNA。为了扩增21号染色体上的淀粉样蛋白基因(NCBI基因ID473931,登陆NC.sub.—006488),引物和探针的序列如下:TABLE-US-00001SEQIDNO:1:正向引物5'-GGGAGCTGGTACAGAAATGACTTC-3';反向引物SEQIDNO:10:5/-TTGCTCATTGCGCTGACAA~3';和探针SEQIDNO:25/-(FAM)AGCCATCCTTCCCGGGCCTAGG(TAMRA)-3'。[0059]为了扩增GAPDH(GenBank基因座12pl3.31_pl3.1),引物和探针如下:正向引物SEQIDN0:3,5'-CCCCACACACATGCACTTACC-3',反向引物SEQIDNO:4,5'-CCTACTCCCAGGGCTTTGATT-3';和探针SEQIDNO:5,5/-(VIC)AAAGAGCTAGGAAGGACAGGCAACTTGGC(TAMRA)-3'。使用TaqMan系统,在各25.mu.1反应中用2.mu.1模板DNA,且各引物终浓度为300nmol/升和各双标记TaqMan探针150nmol/升,进行PCR反应。循环条件是50°C下孵育2分钟,然后95°C下10分钟,随后是60°C下I分钟和95°C下15秒的40个循环。[0060]使用上述示例性操作,核型正常和21三体核型样本中淀粉样蛋白基因和GAPDH基因的不同比在多重PCR分析中清晰可辨,正如QIAGEN产品文献中所报道。使用系列稀释的DNA模板的分析显示,在宽范围的模板浓度内并且DNA起始浓度低至IOmg/升时,仍保持明显的差异。当然,在母源血液样本中,胎儿DNA的浓度要低得多。[0061]i1.聚合酶[0062]可以使用催化弓I物延伸的任何DNA聚合酶,包括但不限于大肠杆菌DNA聚合酶、大肠杆菌DNA聚合酶I的Klenow片段、T7DNA聚合酶、T4DNA聚合酶、Taq聚合酶、PfuDNA聚合酶、VentDNA聚合酶、噬菌体29、REDTaq.TM..基因组DNA聚合酶或测序酶。优选地,使用热稳定DNA聚合酶。也可以进行“热启动”PCR,其中加入聚合酶之前反应加热至95°C持续两分钟,或者聚合酶可保持在无活性状态直到循环I中第I加热步骤。“热启动”PCR可以用来最大限度地减少非特异性扩增。可以使用任意数目的PCR循环扩增DNA,包括但不限于2、5、10、15、20、25、30、35、40、或45个循环。在一个最优选的实施方案中,进行的PCR循环的数目使得产生各目标基因座的等摩尔的数量。[0063]ii1.扩增偏倚[0064]扩增偏倚(即,和另一个相比,优选扩增一个靶序列)是一个发生在多重PCR中已知的现象。可以通过参考一个基因型相对于另一个基因型来避免一个扩增子内的扩增偏倚,来解决扩增偏倚问题。然而,当试图确定含有来自多个基因组来源的遗传物质的样本中的DNA百分比时,不同扩增子之间的比较常常是有必要的,每个扩增子经历扩增偏倚(如,两个不同靶的量,扩增前在量上是相等的,扩增后有2倍或更高的差异)。[0065]初步证据显示,对于单一扩增子而言,数字PCR比泊松(Poisson)抽样误差产生更小的扩增偏倚。本发明的方法通过用已知或相等数目的参考靶固定(spike)反应来计算多重反应中的扩增偏倚,其中参考靶可用于检测不同样本靶的相对或绝对量。参考靶具有已知的序列,其与靶基因相差一个或多个碱基取代。扩增过程中,如果一个样本靶的扩增超过另一个,通过从参考固定进行推断,固定的(spiked)参考可用于对值进行标准化来衍生出原始样本靶相对和/或绝对的拷贝数(见以下实施例2)。测序可以用来获得样本和参考靶的计数。[0066]C.扩增产物的直接测序[0067]从未分割的来自多个基因组来源的遗传物质的混合物扩增多个靶序列,需检测DNA序列和/或目标染色体的存在。混合生物样本中扩增的靶序列的检测可以方便地通过直接测序进行。[0068]如上Braslavsky等人“SequenceinformationcanbeobtainedfromsingleDNAmolecules”Proc.Nat.Acad.Sc1.100(7):3960-3964(2003)所述,DNA聚合酶可用于呈现单一DNA模板中的序列信息,因为其互补链被合成。顺序插入核苷酸;只需要时间分辨率来区分连续的并入。每个成功并入事件后,测量荧光信号,然后通过光褪色进行归零。[0069]简单地说,该技术允许通过配备全内反射照明的常规显微镜进行单分子荧光的观察,其降低了背景荧光。石英片表面进行化学处理来特异性地锚定DNA模板,同时防止游离核苷酸的非特异性结合,以及塑料流动池附着至表面以交换溶液。DNA模板寡核苷酸和荧光标记的引物杂交,并通过链霉抗生物素蛋白和生物素,以低到足以分辨单分子的表面密度,结合到表面上。加入聚合酶和一个荧光标记的核苷酸(C、G、A或T)。聚合酶催化荧光核苷酸序列特异性的掺入所有模板上的新生互补链。消除所有游离核苷酸的洗涤步骤后,成像并入的核苷酸,并记录它们的位置。在高效切割过程中除去荧光基团,留下并入的核苷酸。这个过程持续通过其它三个碱基中的每一个。多个四碱基循环导致数十亿模板上所合成的互补链在长度上超过25个碱基一只要那些单个模板中的每个大于25个碱基读取。参见Helicos,Inc.提供的产品(剑桥,MA)如HeliScope?单分子测序仪。还参见PacificBiosciences(California)提供的产品,如PacBioRSSMRT?测序仪。[0070]用于本发明平台的另一种方法是基于数以百万计的片段的大规模平行测序,其使用随机片段化的基因组DNA附着到平的、光学透明的表面上,以及固相扩增来产生具有数以百万计的簇的高密度测序流动池,各簇含每平方厘米大约1000个拷贝的模板。使用四色DNA边合成边测序技术对这些模板测序。见,Illumina,Inc.(SanDiego,Calif.)提供的产品,如HiSEQ2000系统。还参见Balasubramanian等人的US2003/0022207,其公开于2003年I月30日,题目为“Arrayedpolynucleotidesandtheiruseingenomeanalysis,,。[0071]对于将序列鉴定为属于具体的人染色体而言,只有约30bp的随机序列信息是必要的。更长的序列可以独特地鉴定更具体的靶。用于设计独特序列的算法描述于Yamada等AuPrimerStation:ahighlyspecificmultiplexgenomicPCRprimerdesignserverforthehumangenome”NucleicAcidsRes.,Jul.1,2006;34(ffebServerissue):W665-W669,说明了可用于和已知基因组序列比较来鉴定序列的软件方法。还参见Zhu等人,"Singlemoleculeprofilingofalternativepre-mRNAsplicing,"Science.2003Aug.8;301(5634):836_838,描述了用于研究mRNA的基于单分子的技术。[0072]D.数字计数[0073]使用测序分析检测混合生物样本中多个扩增的序列,允许对每一个靶序列扩增链的数目进行数字计数(一条链一个读取)。不同于以往的数字分析方法,测序允许,在含有来自不同基因组来源的遗传物质的混合物的生物样本中,在单核苷酸水平上检测和定量多个靶序列中的每个的多基因型和/或突变的存在。[0074]E.分析[0075]针对多个靶序列中的每个,数字计数样本中存在的基因型和/或突变的数目之后,然后比较靶序列的每个的基因型和/或突变的比,以确定生物样本中靶序列的相对量以及它们的各种基因型和/或突变序列。通过计数从生物样本中遗传物质的混合物扩增的靶序列的数目,可以检测由于胎儿遗传异常所导致的母源血浆DNA中任何遗传异常的过度或不足体现。例如,胎儿遗传异常包括遗传性或非遗传性突变和染色体畸变(如,易位、倒位或缺失)可以被检测到。列举出的靶序列也可被定位到来源染色体上,并可以列举出每条染色体的片段数目。通过计数定位到各染色体上的序列标签的数目,可以检测由非整倍体胎儿所导致的母源血浆DNA中任何染色体的过度或不足体现。[0076]应该指出的是,本发明的方法不需要区分胎儿与母源DNA,并具有足够大的序列计数,本发明的方法可以应用到任意小部分的胎儿DNA。然而,基于母源对胎儿的遗传贡献,来自扩增链的测序数据可以用于定量母源血液中的胎儿DNA分数(fraction)。鉴于母源血液样本中有限的胎儿DNA分数,对于一个等位基因,约80-95%的序列计数由母方提供。因此,扩增链的测序计数可用于确定一个或多个其中母方是纯合的基因座,以及用于计算在相同基因座上不同于母方的等位基因数目。等位基因的存在,而非母源所提供的那个,指示着由于父方的遗传贡献,在相同基因座上胎儿是杂合子。使用下面的公式,基于每个等位基因的计数可以定量胎儿分数:[0077]胎儿分数=2*(在母方是纯合子的基因座上其它等位基因的计数)/(母源纯合子等位基因计数+在母方是纯合子的基因座上其它等位基因的计数)。[0078]应当指出,如果在多重扩增步骤中发生引物/DNA错配,对于某些扩增子的胎儿分数可能会出现计算错误。通过分析几个不同的靶以及根据来自不同靶的共有计数定量胎儿分数,可以尽量减少这种风险。[0079]实用件[0080]本发明的方法,通过测序与性状或疾病状态相关的目标基因座(尤其是与这些性状或状态最频繁相关的那些),可用于在多个与遗传性状或遗传病相关的目标基因座上,如数十、数百或甚至数千目标基因座上,筛选个体。本发明用于分析一组具体的疾病,包括但不限于心脏病、癌症、内分泌失调、免疫疾病、神经疾病、肌骨骼疾病、眼科疾病、遗传异常、三体、单体性、颠换、易位、皮肤疾病、和家族性疾病。[0081]本发明的方法也可以被用来确认或鉴定未知序列的DNA和已知来源或序列的DNA的关系,例如,用于母子或父子测试等。[0082]本发明的方法特别用于使用母源血液中胎儿DNA的非侵入性产前筛选一组遗传突变,以及特别用于检测胎儿SNP和非整倍体(包括整个染色体复制和缺失)。然而,本领域技术人员认识到本发明的方法也可用于使用血液、大便、痰、尿、阴道液,乳头吸出物、脑脊液等中的无细胞核酸,筛选和癌症相关的一组靶基因。本发明的方法也可用于筛选供体和移植受体组织中多个靶基因的多基因型和/或突变。可由本发明方法检测的疾病和病症的非穷尽列表列于下面表I中。[0083]表1:软骨发育不全肾上腺脑白质营养不良,X连锁丙种球蛋白血症,X连锁Alagille综合征α-地中海贫血,X-连锁,智力迟缓综合征阿尔茨海默氏病阿尔茨海默氏病,早发家族性肌萎缩性脊髓侧索硬化症概述雄激素不敏感综合征Angelman综合征遗传性共济失调概述共济失调-毛细血管扩张症Becker型肌营养不良,也称为营养不良性疾病)贝克威思-威徳曼综合征β-地中海贫血生物素酶缺乏症Branchiootorenal综合征(无对应译文)[0084]BRCAl和BRCA2遗传性乳/卵巢癌乳癌CADASIL卡纳万病癌症腓骨肌萎缩遗传性神经病I型腓骨肌萎缩祌经病2型腓骨肌萎缩神经病4型腓骨肌萎缩神经病X型腓骨肌萎缩神经病科凯恩综合征结肠癌挛缩性蜘蛛指(趾)综合征,先天性颅缝早闭综合征(FGFR-相关)囊性纤维化胱氨酸病耳聋与遗传性听力损失DRPLA(丘脑底核萎缩)【权利要求】1.一种差异检测生物样本中的靶序列的方法,所述生物样本包括来自不同基因组来源的遗传物质的混合物,所述方法包括步骤:a)获得含有来自不同基因组来源的遗传物质混合物的生物样本;b)无需将遗传物质的混合物分散至离散的反应样本中,扩增来自生物样本的多个靶序列以便获得含有来自不同基因组来源的遗传物质的混合物的扩增样本;c)对扩增样本中遗传物质的混合物进行测序;d)对扩增样本中扩增的靶序列的数目进行计数;以及e)进行分析,其中比较扩增样本中扩增的靶序列的比来确定生物样本中不同靶序列的相对量。2.根据权利要求1所述的方法,其中所述生物样本是血液、血液组分、唾液、痰、尿、精液、阴道液、脑脊液、大便、细胞或组织活检。3.根据权利要求2所述的方法,其中所述生物样本是血液。4.根据权利要求3所述的方法,其中所述血液是源自怀孕女性的外周血或其组分。5.根据权利要求1所述的方法,其中所述不同基因组来源选自:a)怀孕女性和胎儿;b)非癌细胞或组织以及癌细胞或组织;以及c)供体组织和移植受体组织。6.根据权利要求1所述的方法,其中所述测序合成技术。7.根据权利要求6所述的方法,其中所述测序步骤是使用单分子测序技术进行的。8.根据权利要求6所述的方法,其中所述测序步骤是使用大规模平行测序技术进行的。9.根据权利要求5所述的方法,其中所述不同基因组来源是怀孕女性和胎儿。10.根据权利要求9所述的方法,其中所述靶序列的差异检测从母源DNA中区分出胎儿遗传异常。11.根据权利要求10所述的方法,其中所述胎儿遗传异常是非整倍体。12.根据权利要求10所述的方法,其中所述胎儿遗传异常是导致胎儿疾病的遗传突变。【文档编号】G01N33/48GK103534591SQ201180058159【公开日】2014年1月22日申请日期:2011年10月26日优先权日:2010年10月26日【发明者】S·R·夸克,W·顾,H-m·C·范申请人:利兰·斯坦福青年大学托管委员会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1