同时确定胎儿单体型及染色体非整倍性的方法及装置制造方法

文档序号:487720阅读:635来源:国知局
同时确定胎儿单体型及染色体非整倍性的方法及装置制造方法
【专利摘要】本发明提供了同时确定孕妇体液样本中胎儿单体型和染色体非整倍性的方法及装置。所说的方法包括:(1)从孕妇体液样本和胎儿父亲样本分别提取第一DNA、第二DNA和第三DNA,第一DNA为母体和胎儿DNA混合物,第二DNA为母本基因组DNA,第三DNA为父亲DNA;(2)同时或分别对至少一部分的第一DNA、第二DNA和第三DNA进行测序,对应获得第一读段、第二读段和第三读段;(3)将第一读段、第二读段和第三读段分别与参考序列比对,基于获得的比对结果,进行(a)或(b)筛选出特定多态性位点;(4)依据第一读段比对结果中的支持筛选出的特定多态性位点的读段的量,确定所述孕妇体液样本中胎儿核酸含量;(5)依据比对结果和胎儿核酸含量,同时确定胎儿单体型和胎儿染色体非整倍性。
【专利说明】 同时确定胎儿单体型及染色体非整倍性的方法及装置

【技术领域】
[0001]本发明属于生物医学领域,特别地,涉及同时确定胎儿单体型和染色体非整倍性的方法及装置。

【背景技术】
[0002]出生缺陷指的是婴儿在出生前发生的身体结构、功能或代谢异常。目前,全世界已经发现7000多种遗传或半遗传性出生缺陷疾病。根据2001美国MARCH OF DMES(MOD)基金会报告显示,排在前5位的严重遗传或半遗传性出生缺陷分别是心血管缺陷、神经管畸形、血红蛋白疾病(地中海贫血和镰状细胞性贫血)、唐氏综合征和葡萄糖-6-磷酸酶脱氢酶(G6PD)缺乏症。这5种疾病约占全部出生缺陷的25% [U.S.Department of HealthAnd Human Services, Centers for Disease Control and Prevent1n.Centers forBirth Defects Research and Prevent1n[R].Atlanta:CDC.2003 ;Hsu L YF.Prenataldiagnosis of chromosomal abnormalities through amn1centesis.1n Milunsky Aed.Genetic Disorders and the Fetus: diagnosis, prevent1n, and treatment.4thed.Baltimore: Johns Hop-kins University Press, 1998:179]。
[0003]染色体异常是最常见的导致出生缺陷的遗传因素,其发生率随着母亲年龄的增高而上升。国外的统计资料表明,在每150个新生儿中就有一个染色体异常患者。临床上较常见的常染色体非整倍体有21-三体综合征(Down综合征,DS),18-三体综合征,13-三体综合征,性染色体非整倍体有Klinefelter综合征,Turner综合征,XYY综合征,X三体综合征等。这四种常见染色体异常占所有染色体异常的65% — 80%,且占出生后染色体异常导致出生缺陷的85% — 95%。其中21-三体综合征是最常见的常染色体非整倍体病,在新生儿中发病率约为1/600-1/1000,占小儿三体型染色体病的70%-80%。根据2003年的资料测算,我国每年新出生的唐氏综合征生命周期的总经济负担超过100亿元。针对这四种常见染色体异常的研究、检测、辅助筛查、筛查和及时诊断,能够起到降低出生缺陷的发生,提高出生人口素质的作用。
[0004]随着近年来,母体外周血中发现的胎儿游离DNA[Lo YM, Corbetta N, ChamberlainPF, et al.Presence of fetal DNA inmaternal plasma and serum.Lancetl997 ;350 (9560):485 - 487] , RNA [Ferguson-Smith, M.A.Placental mRNA inmaternalplasma:prospects for fetal screen-1ng.Proc.Natl.Acad.Sc1.USA100,4360 -4362 (2003)]及胎儿细胞[Bischoff, F.Z.,Sinacori, Μ.K.,Dang, D.D.,Marquez-Do, D.,Horne,C., Lewis, D.E., &Simpson, J.L.(2002).Cell-free fetal DNA and intact fetalcells in maternal blood circulat1n:1mplicat1ns for first and second trimesternon-1nvasive prenatal diagnosis.Human reproduct1n update, 8 (6), 493 - 500.]为无创产前诊断提供新的可能。基于孕妇外周血中胎儿游离DNA及二代测序的胎儿染色体非整倍性无创基因检测技术现阶段主要定位于21、18、13三体及部分性染色体异常的产前筛查。相较于传统的血清学筛查方法,该方法检出率可达98%,其假阳性率仅为0.2%或更低。该方法在国际国内得到了普遍的认可,提供了一种新型的染色体非整倍体产前辅助筛查及诊断模式。然而由于早孕期母体外周血浆中的胎儿游离DNA含量相对偏低,可能存在检出率偏低的问题,因此目前无创产前检测非整倍体的技术主要针对16孕周之后的孕妇群体提供服务。
[0005]高灵敏度、高特异性的无创产前筛查技术能够最大限度的预防漏检、错检,减少不必要的有创性产前诊断,减轻临床诊断压力,避免不必要的流产。目前,仍缺乏一种适用于在大规模人群对特定一种或几种单基因病相关基因进行检测的技术。也缺乏在早孕期(16孕周之前)的非整倍体与单基因病的同步筛查方法。且在SNP检测或者单基因病诊断的同时,若需开展染色体非整倍体的检测,还需进一步采取别的手段进行。


【发明内容】

[0006]本发明一方面,提供一种同时确定孕妇体液样本中胎儿单体型和胎儿染色体非整倍性的方法,方法包括:⑴从孕妇体液样本和胎儿父亲样本分别提取第一 DNA、第二 DNA和第三DNA,第一 DNA为母体和胎儿DNA混合物,第二 DNA为母本基因组DNA,第三DNA为父亲DNA; (2)同时或分别对(I)中至少一部分的第一 DNA、第二 DNA和第三DNA进行测序,以分别获得第一读段、第二读段和第三读段,所述第一读段、第二读段和第三读段中包含多个多态性位点;(3)将(2)的第一读段、第二读段和第三读段分别与参考序列比对,基于获得的比对结果,进行(a)或(b):(a)筛选出在第二 DNA只有一种基因型、并且在第一 DNA有两种基因型的多态性位点,(b)筛选出在第二 DNA和第三DNA中为不同基因型的多态性位点;
(4)依据(3)中的比对结果中的第一读段中的支持(a)或(b)中筛选出的多态性位点的读段的量,确定所述孕妇体液样本中胎儿核酸含量;(5)依据(3)中的比对结果和⑷中胎儿核酸含量,同时确定胎儿单体型和胎儿染色体非整倍性。
[0007]本发明另一方面,提供一种同时确定孕妇体液样本中胎儿单体型和胎儿染色体非整倍性的装置,该装置能够完成本发明一方面的方法的全部步骤,装置包括:A.核酸提取单元,用于从孕妇体液样本和胎儿父亲样本分别提取第一 DNA、第二 DNA和第三DNA,第一DNA为母体和胎儿DNA混合物,第二 DNA为母本基因组DNA,第三DNA为父亲DNA ;B.测序单元,与A单元连接,用于同时或分别对获自(A)的至少一部分的第一 DNA、第二 DNA和第三DNA进行测序,以获得对应的第一读段、第二读段和第三读段,所述第一读段、第二读段和第三读段中包含多个多态性位点;C.比对筛选单元,与B单元连接,用于将接收自(B)单元的第一读段、第二读段和第三读段分别与参考序列比对,基于获得的比对结果,进行(Cl)或(C2) =(Cl)筛选出在第二 DNA中只有一种基因型、而在第一 DNA有两种基因型的多态性位点,(C2)筛选出在第二 DNA和第三DNA为不同基因型的多态性位点;D.胎儿核酸含量确定单元,与C单元连接,用于依据接收自C单元的比对结果中的第一读段中的支持(Cl)或(C2)中筛选出的多态性位点的读段的量,确定所述孕妇体液样本中胎儿核酸含量;
[0008]E.检测确定单元,与C单元和D单元连接,用于依据接收自C单元的比对结果和D单元的胎儿核酸含量,同时确定胎儿单体型和胎儿染色体非整倍性。
[0009]本发明的方法和/或装置适合于对产前人群进行大规模地同时对胎儿单体型及染色体非整倍性进行确定和分析,可用于胎儿单基因病和异倍体的预测或临床辅助筛查,在早孕期(16孕周之前)胎儿核酸含量低时,比如根据本发明方法中的胎儿核酸含量确定公式确定出的胎儿核酸含量不小于3%,利用本发明的方法也能准确检测出胎儿的核酸和/或染色体结构变异。本发明的方法和/装置能够在早孕期抽血孕妇外周血,通过离心实现血浆及血细胞的分离,通过微量DNA提取技术实现血浆游离DNA的提取,通过血浆DNA及其家系的DNA信息实现同时对胎儿的单体型和染色体非整倍体的检测,确定血浆DNA胎儿核酸含量确定染色体非整倍性检测所需要的最低数据量检测胎儿染色体非整倍性,通过孕妇血细胞实现对孕妇SNP检测,通过胎儿生物学父亲核酸样本确定父亲的SNP,结合家系比如祖父母的核酸序列信息,确定父母的单体型,利用父母的单体型及血浆混合核酸的测序数据确定胎儿的两条单体型分别遗传自父母的哪条单体型,是否是致病单体型等,这样能够实现利用一次实验同时对胎儿的单体型、多种单基因病和染色体非整倍性进行分析检测,能更全面的进行出生缺陷的预防。

【专利附图】

【附图说明】
[0010]本发明的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解,其中:
[0011]图1是本发明的一个【具体实施方式】中的同时确定胎儿单体型和染色体非整倍性的流程示意图;
[0012]图2是本发明的一个【具体实施方式】中的同时确定胎儿单体型和染色体非整倍体性的装置示意图。

【具体实施方式】
[0013]根据本发明的一个实施方式,提供一种同时确定孕妇体液样本中胎儿单体型和胎儿染色体非整倍性的方法,这里所说的胎儿染色体非整倍性包括胎儿整条染色体非整倍性变异和部分染色体非整倍性变异。该方法包括:
[0014]步骤一:核酸提取。
[0015]核酸提取包括:从孕妇体液样本和胎儿父亲样本分别提取第一 DNA、第二 DNA和第三DNA,第一 DNA为母体和胎儿DNA混合物,第二 DNA为母体基因组DNA,第三DNA为父亲DNA。孕妇体液样本来源于孕妇外周血和孕妇尿液的至少一种。根据本发明的一个【具体实施方式】,对孕妇外周血样本进行处理,比如离心分离孕妇血细胞和血浆,从血细胞和血浆中分别提取核酸,获得孕妇的基因组DNA和游离核酸,所说的游离核酸为母体和胎儿DNA片段混合物。
[0016]步骤二:测序。
[0017]同时或分别对步骤一中的至少一部分的第一 DNA、第二 DNA和第三DNA进行测序,以分别获得第一读段、第二读段和第三读段,所述第一读段、第二读段和第三读段中包含多个多态性位点。测序可以根据不同的测序方法,比如可选的测序平台包括但不限于CG(Complete Genomics)、Illumina/Solexa、ABI/SOLiD 和 Roche454,并根据所选用的测序平台进行相应的测序文库制备,可选择单端或双端测序。根据本发明一种【具体实施方式】,对第一、第二和第三DNA进行文库构建,结合捕获技术,利用相同的芯片或探针分别捕获第一、第二和第三DNA文库中的特定SNP位点和目标基因区域,获得各DNA —样目标区域的目标区域文库,对各目标区域文库进行测序,获得测序数据,测序数据由多个读段组成,即相应的获得来自第一、第二和第三DNA的第一、第二和第三读段。特定SNP位点包括均匀分布于染色体,比如选定的两相邻SNP在参考基因组HG19上的距离大约为1Mb,并且更佳地,这些SNP的次等位基因频率在0.3-0.5之间,这样从这些杂合性高的SNP位点中易于找到来源于胎儿自身的特定位点或序列,利用这样的位点就能估算在混合DNA中胎儿的核酸含量。对目标基因区域的捕获还可包括捕获该基因区域上下游IMb区域内的的杂合性高的SNP位点,这些区域以及位点信息有利于判断分析胎儿单体型;胎儿染色体非整倍性的分析可以利用上面捕获的特定的SNP,这些SNP位点的测序数据量的变化反映出位点所在的区域的测序数据量的变化,通过与正常样本相比,判断这些染色体区域是否存在非整倍性变异。对预检测的目标染色体,比如chr21、18、13和/或性染色体上,可以选择捕获其上的不少于200个的非重复区域,不排除全部或部分非重复区域即为选择的特定SNP位点所在的区域,用于进行拷贝数变异分析。
[0018]步骤三:比对筛诜。
[0019]将步骤二的第一读段、第二读段和第三读段分别与参考序列比对,基于获得的比对结果,进行(a)或(b):(a)筛选出在第二 DNA只有一种基因型、并且在第一 DNA有两种基因型的多态性位点,(b)筛选出在第二 DNA和第三DNA中为不同基因型的多态性位点。比对所使用的参考序列是已知序列,可以是预先获得的目标个体所属生物类别中的任意的参考模板。例如,若目标个体是人类,参考序列可选择NCBI数据库(nat1nal center forb1technology informat1n)提供的HG19。进一步地,也可以预先配置包含更多参考序列的资源库,在进行序列比对前,先依据目标个体的性别、人种、地域等因素选择或是测定组装出更接近的序列来作为参考序列,有助于获得更准确的检测分析结果。在比对过程中,根据比对参数的设置,第一、第二或第三读段中的每条或每对读段(reads或一对末端读段pair-end reads)最多允许有η个碱基错配(mismatch), η优选为I或2,若reads中有超过η个碱基发生错配,则视为该条/对reads无法比对到参考序列。具体比对时,可使用各种比对软件,例如 SOAP (Short Oligonucleotide Analysis Package) ,bwa, samtools 等,本实施方式对此不作限定,比对的进行也可以识别出各个多态性位点。进行(a)或(b)的筛选都是为了区分确定来自胎儿本身的多态性位点,利用多态性位点在第一、第二和/或第三DNA中的基因型的区别来确定来源于胎儿本身的多态性位点,根据来源于胎儿本身的多态性位点的测序数据量,数目或者比例,比如在第一读段中包含胎儿多态性位点读段所占的比例,来估算胎儿核酸含量。
[0020]步骤四:确定胎儿核酸含暈。
[0021]依据步骤三的比对结果,依据比对上的第一读段中的支持(a)或(b)中筛选出的多态性位点的读段的量,确定所述孕妇体液样本中胎儿核酸含量。基于比对结果,通过(a)筛选出的多态性位点在第一 DNA和第二 DNA中的基因型的组合有可以分为两类:(i)在第二 DNA中只有纯合基因型RR、而在第一 DNA中存在纯合基因型RR和杂合基因型Rr,或者
(ii)在第二 DNA中只有杂合基因型Rr、而在第一 DNA中存在纯合基因型RR和杂合基因型Rr,R和r表示一对等位基因。当上步(a)筛选出的多态性位点的基因型组合为(i)时,采用公式f = 2d/(c+d)来估算胎儿核酸含量;当上步(a)的多态性位点的基因型组合为(ii)时,采用公式f= (c-d)/(c+d)来估算胎儿核酸含量,其中,c为比对上的第一读段中支持等位基因R的读段数目,d为比对上的第一读段中支持等位基因r的读段数目。各个多态性位点在第二 DNA和第三DNA中都是只有一种基因型,基于比对结果,通过上步(b)筛选出的多态性位点在第二和第三分别为不同的纯合基因型,都可分别表示为RR和rr,采用公式f = g/(g+h)来估算胎儿的核酸含量,g为第一读段中支持等位基因r的读段数目,h为第一读段中支持等位基因R的读段数目。
[0022]步骤五:同时确定胎儿单体型和染色体非整倍性。
[0023]依据步骤三的比对结果和步骤四确定的胎儿核酸含量,同时确定胎儿单体型和胎儿染色体非整倍性。
[0024]其中,胎儿单体型的确定分析包括:使比对结果中包含第四读段和第五读段各自与参考序列的比对结果,所述第四读段和第五读段分别是通过对至少一部分的第四DNA和第五DNA进行测序获得的,第四DNA为胎儿祖父DNA,第五DNA为胎儿祖母DNA,接着基于该比对结果确定父母单体型,最后利用父母单体型和胎儿核酸含量确定胎儿单体型。第四、第五DNA的提取、测序以及比对可以参考第一、第二或第三DNA的提取、测序、比对来进行,第四、第五DNA,即待测样本的家系成员的核酸信息的获得可以与待测样本的处理同步,或者预先进行获得保存。依据祖父母以及父母的测序比对结果确定父母的单体型,通过以那些在祖父母中有不同基因型的多态性位点作为标记,依据遗传分离规律,可以得到父母各自的单体型。单体型倾向作为一个遗传单元遗传给子代,在这里,单体型可以看作是一组SNP的集合。接着,要确定胎儿的单体型组成,即确定胎儿两条单体型分别遗传自父母总共4条单体型的哪条,包括:利用多个在父亲单体型上为杂合、在母亲单体型上为纯合的多态性位点确定胎儿遗传到的父亲的单体型,对于某SNP位点,在父亲单体型上为Rr,即有两种基因型,在母亲单体型上为RR,即只有一种基因型,若混合有胎儿核酸的该位点数据含有支持杂合基因型Rr的读段,说明该位点的r等位碱基来源于胎儿,而且遗传上r只能来自父亲,通过这样,比如父亲的某条单体型上有超过10个以上这样的杂合SNP支持胎儿的该SNP的一个等位碱基只能来源于父亲该条单体型,就可以确定胎儿遗传了这条父亲单体型。类似地,利用多个在父亲单体型上为纯合、在母亲单体型上为杂合的多态性位点来确定胎儿遗传到的母亲的单体型,但是由于胎儿核酸样本,即母体外周血样本混有大量的母体DNA,单从以上类型SNP没法判断胎儿遗传了 R还是r所在的母亲单体型,因为该位点任何的等位碱基也都可能就只是母体的,在这里我们结合胎儿核酸含量来确定胎儿遗传到的母亲的单体型。对于多个在父亲单体型上为纯合、母亲单体型上为杂合的多态性位点,这样的位点在母体外周血样本中每个都可表示为Rr,若多数这样的多态性位点都符合R/r = (l+x% )/(1-X% ),则判定胎儿遗传了母亲等位基因R所在的单体型,若多数这样的位点都符合R/r=1,则判定胎儿遗传了母亲等位基因r所在的单体型,R和r表示一对等位基因,表示胎儿核酸含量,R/r =比对后第一读段中支持R的读段数目/比对后第一读段中支持r的读段数目。
[0025]胎儿染色体非整倍性的检测包括:依据第一读段中支持中各个多态性位点的读段数目,计算各个多态性位点的测序深度;利用全部或部分位于同一染色体的所述多态性位点的测序深度,利用所述多态性位点所在染色体的全部或部分区域的GC含量对各个所述多态性位点的测序深度进行校正,获得各个多态性位点的相对测序深度;将所述相对测序深度与正常对照样本同样位点的相对测序深度比较,二者具有显著性差异则确定所述多态性位点区域存在变异。SNP位点的测序深度即为包含该SNP位点的读段的数目,SNP位点所在区域的深度为比对上参考基因组该SNP所在区域的读段的数目与该SNP区域的大小的比值。利用GC含量对测序深度进行校正,可以预先建立或者通过预先建立好的某条染色体上的多个区域的GC含量和各个区域的测序深度的关系来进行,将计算得的测序深度代入到这个关系的关系式中获得校正的测序深度,尽量消除GC含量的影响,减少GC含量差异带来的数据量上的差异。为使以上基于统计差异的判断结果可信,较佳地,正常对照样本的个数大于30,这样多个样本的同一位点的测序深度或者相对测序深度值呈现正态分布,适于多种统计检验,差异分析结果可信。
[0026]本领域普通技术人员可以理解,上述实施方式中各种方法的全部或部分步骤可以通过程序来指令相关硬件完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘或光盘等。
[0027]根据本发明的另一个实施方式,提供一种同时确定孕妇体液样本中胎儿单体型和胎儿染色体非整倍性的装置,该装置能够执行实现本发明一个实施方式的方法的部分或所有步骤,如图2所示,该装置1000包括:A.核酸提取单元100,用于从孕妇体液样本和胎儿父亲样本分别提取第一 DNA、第二 DNA和第三DNA,第一 DNA为母体和胎儿DNA混合物,第二DNA为母本基因组DNA,第三DNA为父亲DNA ;B.测序单元200,与A单元100连接,用于同时或分别对获自A单元100的至少一部分的第一 DNA、第二 DNA和第三DNA进行测序,以获得对应的第一读段、第二读段和第三读段,所述第一读段、第二读段和第三读段中包含多个多态性位点;C.比对筛选单元300,与B单元200连接,用于将接收自B单元200的第一读段、第二读段和第三读段分别与参考序列比对,基于获得的比对结果,进行(Cl)或(C2):(Cl)筛选出在第二DNA中只有一种基因型、而在第一DNA有两种基因型的多态性位点,(C2)筛选出在第二 DNA和第三DNA为不同基因型的多态性位点;D.胎儿核酸含量确定单元400,与C单元300连接,用于依据接收自C单元300的比对结果中的第一读段中的支持(Cl)或(C2)中筛选出的多态性位点的读段的量,确定所述孕妇体液样本中胎儿核酸含量;E.检测确定单元500,与C单元300和D单元400连接,用于依据接收自C单元300的比对结果和D单元400的胎儿核酸含量,同时确定胎儿单体型和胎儿染色体非整倍性。关于本发明一个实施方式中的同时确定胎儿单体型和染色体非整倍性的方法的优点及技术特征的描述,也适用于该装置,在此不再赘述。
[0028]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。需要说明的是在本文中所使用的术语“第一”、“第二”、“第三”、“第四”或“第五”等仅用于方便描述目的,而不能理解为指示或暗示相对重要性,也不能理解为之间有先后顺序关系。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
[0029]除另有交待,以下实施例中涉及的试剂及仪器,酶、反应体系、接头序列等都是常规市售产品,比如购自Illumina公司。
[0030]实施例
[0031]图1示意一种可以在产前无创检测胎儿单基因病致病基因携带情况及非整倍体情况的方法的流程图,此处单基因病所检测内容包括遗传自父母的致病突变。该方法通过在早孕期(孕8-12周)采集孕妇外周血,通过离心实现血浆与血细胞的分离。通过微量DNA提取技术实现血浆游离DNA的提取。通过对血浆游离DNA的目标区域捕获高深度测序,实现同时无创检测胎儿单基因及非整倍体的情况。
[0032]血浆提取DNA后,进行目标区域捕获,该探针集包括有相应关键区域捕获探针,该区域包括目标单基因病致病基因关键基因区域,可用于个体区分的SNP位点区域,可用于染色体拷贝数变异检测的CNV检测位点区域。可以和DNA进行目标区域捕获。捕获到的目的DNA进行PCR富集后,按照常规测序方法进行测序,如Hiseq2000,或者Hiseq2500,Miseq等等,根据测序量的不同和样本数,可以灵活选择合适的测序平台。
[0033]具体的检测流程如下:
[0034]抽取孕妇5ml外周血,通过两步离心法,分离血浆与血细胞;
[0035]通过微量DNA提取技术提取血浆游离DNA ;
[0036]在小片段模板两端加上接头;
[0037]芯片捕获,PCR富集获目标区域,该区域包括目标单基因病致病基因关键基因区域,可用于个体区分的SNP位点区域,可用于染色体拷贝数变异检测的CNV检测位点区域;
[0038]孕妇剩余血细胞DNA及孕妇丈夫血细胞DNA,使用普通二代测序文库构建方法进行文库构建。并使用相同的目标区域捕获芯片进行目标区域捕获;
[0039]上机测序,并使用相应生物信息分析流程对数据进行分析,从而获得关于单基因及非整倍体方面的信息,具体如下:
[0040]a)血浆游离胎儿DNA含量估计:通过目标区域特异探针捕获富集可用于胎儿DNA含量测定的SNP位点。或对父母双方血液DNA样品使用相同芯片进行捕获测序,使用父母为不同纯合的位点,对血浆中胎儿游离DNA含量进行估计;或仅利用血浆样品中检出的,而母体DNA样品中没有的特异等位基因位点估计血浆中胎儿DNA含量。假设某一位点母源基因型为AA,而胎儿基因型为Aa,其中A对应的reads数为b,而a对应的reads数为a,则胎儿DNA含量为:2a/(a+b)。
[0041]b)通过父母单体型对是否获得来自父母的单基因病突变的检测:首先获得父母双方各自的两条单体型,并明确与待测单基因病突变与目标待测基因位点连锁的单倍体型,结合血浆游离DNA测序数据,判断胎儿是否遗传到双方的致病基因。选择母亲为纯合,而父亲为杂合的位点用于判断胎儿遗传到父亲的哪一个单体型。对于胎儿获得母亲单体型的判断依赖于之前胎儿DNA含量的估计,选择父亲为纯合(AA),而母亲为杂合(Aa)的位点用于母亲单体型的判断。若胎儿DNA含量为X%,则此时若胎儿遗传了来自母亲A的等位基因,则可观察到A/a= (l+x%)/(l-x%);若胎儿遗传了来自母亲的a的等位基因,则可观察奥A/a = I ;更加两个等位基因比例的变化,从而可推测胎儿得到母亲的哪一条单体型。通过对父母单体型的分别判断,最终推测胎儿遗传到了父母的哪一条单体型,并通过连锁关系确定胎儿是否遗传致病突变。
[0042]c)父母单倍体的获得:可以通过父母双方及其祖父母相同目标区域捕获测序数据分析得到。
[0043]d)染色体非整倍体的检测:通过染色体拷贝数变异检测的CNV探针覆盖区域的测序深度信息,判断探针所在区域乃至染色体是否存在非整倍体变化。
[0044]本方法的主要创新点是通过设计涵盖多种功能捕获区域的探针集,该探针集覆盖区域包括目标单基因病致病基因关键基因区域,可用于个体区分的SNP位点区域,可用于染色体拷贝数变异检测的CNV检测位点区域。从而实现同步无创检测胎儿单基因病及非整倍体。
[0045]1、核酸提取
[0046]从天津妇幼保健院获得孕妇外周血5ml,通过两步离心的方法分离血浆与血细胞。采集孕妇及其父母,孕妇丈夫及其父母外周血,并提取各自的基因组DNA。
[0047]用盐析法提取标本DNA,血浆DNA直接进行第2步的建库,血细胞所得大片段DNA进行超声打断。
[0048]2、目标区域文库构建
[0049]参照Illumina的文库构建试剂盒说明书进行目标区域文库构建,大致包括以下步骤:末端修复和纯化,末端加“A”和纯化,Adapter (接头)连接,加测序接头和磁珠纯化,PCR扩增,将血浆DNA文库及其他血液基因组DNA文库进行芯片杂交,目标区域捕获富集,参照Agilent使用说明书进行杂交洗脱,获取目的基因并PCR富集。如下,目标区域可分成三部分,不排除各部分有部分交叉或重叠的区域:1)在1-22号常染色体上,以IMb间隔选取SNP,参照dbSNP记录,选择MAF在0.3-0.5间的SNP位点,共选择2916个;2)在21,18,13,X,Y染色体上的unique区域(唯一)挑选片段。使得每条染色体散在分布200-300个片段;3)以目标基因为中心,在其上下游IMb区域内,以Ikb间隔挑选MAF(次等位碱基频率)在0.3-0.5间的SNP位点。
[0050]3、上机测序
[0051]这边采用hiseq2000PE101+8+101程序进行上机测序,即双末端测序。
[0052]4、结果分析
[0053]测序后的数据经过处理,利用生物信息分析方法中的单倍体分析方法以及拷贝数变异分析方法对结果进行分析,得到血液标本检测结果如下,根据结果推断可进一步用于无创血浆中相似变异的检测。
[0054]4.1胎儿DNA含量分析
[0055]对血浆游离DNA中胎儿DNA的含量进行计算,计算方式如下:
[0056]a)假设母亲白细胞DNA基因型为AA,胎儿基因组DNA为AT,则此时血浆中可观察到的基因型为A和T,若支持A的reads数为C,支持C的reads数为d,则此时f = 2d/(c+d)。
[0057]b)假设母亲白细胞DNA基因型为AT,胎儿基因组DNA为AA,则此时血浆中可观察到的基因型为A和T,若支持A的reads数为C,支持T的reads数为d,则此时f = (c_d) /(c+d)。若胎儿DNA含量>3%则进入后续试验分析。
[0058]4.2染色体非整倍体判断
[0059]通过对比对到某一条染色体reads深度的变化,判断相应的染色体是否存在非整倍体。基因组上的一段区域发生缺失或者重复后,会在测序深度上产生明显的变化。重复了N次的序列(本身就是基因组上重复的序列的除外)深度会变为正常2拷贝时的大约N/2倍,而杂合缺失和纯合缺失则分别变为大约1/2倍和接近0,根据这一特性,在对测序深度的信号进行GC修正后,再利用样本间的深度相关性,可以用算法将深度信号发生异常的区间识别出来,并做相应的拷贝数预测和可信度评估。比如,依据血浆DNA测序比对结果中的支持所选的SNP的读段数目,计算SNP的测序深度;利用全部或部分位于同一染色体的SNP筛选出的多态性位点的测序深度,和/或所述多态性位点所在染色体的全部或部分区域(目标区域)的GC含量对所述多态性位点的测序深度进行校正,获得所述多态性位点的相对测序深度;将所述相对测序深度与正常对照样本同样位点的相对测序深度比较,二者具有显著性差异则确定该SNP位点区域存在变异。正常对照样本同样位点的相对测序深度的确定过程可以参考待测样本进行,可以预先获得或者与待测样本同时建库测序获得。
[0060]4.3单体型分析
[0061]4.3.1致病单体型分析
[0062]通过生物信息分析,对测序信息进行分析和研究,以得到相关基因的单核苷酸变异(SNV)、少数碱基的插入和缺失(InDel)等遗传变异信息。并明确与目标待检致病突变相连锁遗传的SNP信息,即致病单体型。假设先证者分别从父母双方得到一个致病突变,假设,
[0063]a)先证者致病基因外某一位点的基因型为AA,父亲为AC,母亲为AA。则可知:先证者从父亲处获得了 A,从母亲处获得了一个A,且这两个SNP位点均与致病突变相连锁遗传。而在父亲中C与非致病allele连锁。
[0064]b)先证者致病基因外某一位点的基因型为AC,父亲为AC,母亲为AA。则可知:先证者从父亲处获得了 C,从母亲处获得了一个A,且这两个SNP位点均与致病突变相连锁遗传。而在父亲中C与非致病allele连锁。
[0065]c)先证者致病基因外某一位点的基因型为AC,父亲为AA,母亲为AC。则可知:先证者从父亲处获得了 A,从母亲处获得了一个C,且这两个SNP位点均与致病突变相连锁遗传。而在母亲中C与非致病allele连锁。
[0066]将上述推测方法应用到目标基因及两侧IM区域的SNP位点,则可获得一定范围内的单体型信息,获知在这一区域内与致病突变连锁的单体型信息。从而并可进一步推断出与非致病allele紧密连锁的SNP信息。
[0067]4.3.2胎儿单体型判断
[0068](I)判断胎儿从父亲处遗传的基因型,计算方式如下:
[0069]a)选择母亲为纯合,而父亲为杂合的位点进行父亲遗传单体型的判断。假设某一SNP位点母亲基因型为AA,父亲基因型为AC,若血浆测序数据识别SNP结果为A,C,且C的含量符合估计的胎儿浓度。则表明胎儿从处获得SNP C所在的allele (等位基因)。
[0070]b)将目标基因及其上下游IM捕获区域内所有满足a)条件的SNP用于判断胎儿从父亲处所获得的SNP信息,构成胎儿从父亲处获得的单体型信息。并根据3)中的信息,明确该单体型是否与致病突变相连锁,从而获知胎儿是否从父亲处获得致病allele。
[0071](2)判断胎儿从母亲处遗传的基因型,计算方式如下:
[0072]选择母亲为杂合,而父亲为纯合的位点进行母亲遗传单体型的判断。假设某一 SNP位点母亲基因型为AC,父亲基因型为AA,若血浆测序数据call SNP结果为A和C,若胎儿从母亲处遗传了 A等位基因,胎儿的基因型为AA,则可观察到A/C近似与(l+f)/(l-f);若胎儿遗传了 C等位基因,胎儿的基因型为AC,则可观察到A/C近似为0.5,并使用P值判断每一个位点胎儿遗传了 C等位基因或A等位基因的概率。对每一个SNP位点均分分别计算胎儿从母亲处遗传到某一条单体型的概率,并将所有SNP各点概率一同用于判断胎儿从母亲处获得的单体型信息,并根据单体型是否与致病突变相连锁,得知胎儿是否从母亲处获得致病allele
[0073]4.3.3综合⑴和⑵的结果,获得胎儿的基因型信息。
[0074]通过以上,该示例所检测的样本的胎儿单体型分析结果为,一对夫妻,丈夫携带有:GJB2c.299-300delAT杂合突变,妻子携带有GJB2c.235del C杂合突变。经过血浆测序结果分析表明,胎儿基因型为GJB2c.235delC杂合携带。
【权利要求】
1.同时确定孕妇体液样本中胎儿单体型和胎儿染色体非整倍性的方法,其特征在于,包括: (1)从孕妇体液样本和胎儿父亲样本分别提取第一DNA、第二 DNA和第三DNA,第一 DNA为母体和胎儿DNA混合物,第二 DNA为母本基因组DNA,第三DNA为父亲DNA ; (2)同时或分别对(I)中至少一部分的第一DNA、第二 DNA和第三DNA进行测序,以分别获得第一读段、第二读段和第三读段,所述第一读段、第二读段和第三读段中包含多个多态性位点; (3)将(2)的第一读段、第二读段和第三读段分别与参考序列比对,基于获得的比对结果,进行(a)或(b): (a)筛选出在第二DNA只有一种基因型、并且在第一 DNA有两种基因型的多态性位点, (b)筛选出在第二DNA和第三DNA中为不同基因型的多态性位点; (4)依据(3)中的比对结果中的第一读段中的支持(a)或(b)中筛选出的多态性位点的读段的量,确定所述孕妇体液样本中胎儿核酸含量; (5)依据(3)中的比对结果和(4)中胎儿核酸含量,同时确定胎儿单体型和胎儿染色体非整倍性。
2.权利要求1的方法,其特征在于,所述孕妇体液样本来源于孕妇外周血和孕妇尿液的至少一种。
3.权利要求1的方法,其特征在于,所述胎儿染色体非整倍性包括胎儿整条染色体非整倍性变异和胎儿部分染色体非整倍性变异。
4.权利要求1的方法,其特征在于,所述多态性位点为在群体中次等位基因频率不小于 0.3 的 SNP。
5.权利要求1的方法,其特征在于,(3)中(a)筛选出的任一多态性位点在第一DNA和第二 DNA中的基因型的组合有两种:(i)在第二 DNA中只有纯合基因型RR、而在第一 DNA中存在纯合基因型RR和杂合基因型Rr,或者(ii)在第二 DNA中只有杂合基因型Rr、而在第一DNA中存在纯合基因型RR和杂合基因型Rr,R和r表示一对等位基因。
6.权利要求5的方法,其特征在于,当(3)中(a)筛选出的多态性位点的基因型组合为⑴时,⑷中胎儿核酸含量的确定公式为f = 2d/(c+d),当(3)中(a)的多态性位点的基因型组合为(ii)时,⑷中胎儿核酸含量的确定公式为f = (c-d)/(c+d),其中, c为第一读段中支持等位基因R的读段数目,d为第一读段中支持等位基因r的读段数目。
7.权利要求1的方法,其特征在于,(3)中(b)筛选出的任一多态性位点在第二DNA和第三DNA中为不同的纯合基因型,分别为RR和rr,R和r为一对等位基因。
8.权利要求7的方法,其特征在于,(4)中胎儿的核酸含量的确定公式为f= g/(g+h),g为第一读段中支持等位基因r的读段数目,h为第一读段中支持等位基因R的读段数目。
9.权利要求1的方法,其特征在于,(5)中确定胎儿单体型包括, 使(3)中的比对结果包含第四读段和第五读段各自与参考序列的比对结果,所述第四读段和第五读段分别是通过对至少一部分的第四DNA和第五DNA进行测序获得的,第四DNA为胎儿祖父DNA,第五DNA为胎儿祖母DNA ; 利用(3)中的比对结果确定父母的单体型; 利用(4)中的胎儿核酸含量和父母的单体型,确定胎儿单体型。
10.权利要求9的方法,其特征在于,确定胎儿单体型包括,利用多个在父亲单体型上为杂合、在母亲单体型上为纯合的多态性位点确定胎儿遗传到的父亲的单体型,利用多个在父亲单体型上为纯合、在母亲单体型上为杂合的多态性位点以及(4)中的胎儿核酸含量确定胎儿遗传到的母亲的单体型。
11.权利要求10的方法,其特征在于,对于所述多个在父亲单体型上为纯合、在母亲单体型上为杂合的多态性位点,若有多个这样的多态性位点符合R/r = (l+x%)/(l-x% ),则判定胎儿遗传了母亲等位基因R所在的单体型,若有多个这样的多态性位点符合R/r = 1,则判定胎儿遗传了母亲等位基因r所在的单体型,R和r表示一对等位基因,表示胎儿核酸含量,R/r =第一读段比对结果中支持R的读段数目/第一读段比对结果中支持r的读段数目。
12.权利要求1的方法,其特征在于,(5)中确定胎儿染色体非整倍性包括, 依据第一读段比对结果中支持(2)中各个多态性位点的读段数目,计算各个多态性位点的测序深度; 利用全部或部分位于同一染色体的所述多态性位点的测序深度,和/或所述多态性位点所在染色体的全部或部分区域的GC含量对各个所述多态性位点的测序深度进行校正,获得各个多态性位点的相对测序深度; 将所述相对测序深度与正常对照样本同样位点的相对测序深度比较,二者具有显著性差异则确定所述多态性位点区域存在变异。
13.同时确定孕妇体液样本中胎儿单体型和胎儿染色体非整倍性的装置,其特征在于,包括: A.核酸提取单元,用于从孕妇体液样本和胎儿父亲样本分别提取第一DNA、第二DNA和第三DNA,第一 DNA为母体和胎儿DNA混合物,第二 DNA为母本基因组DNA,第三DNA为父亲DNA ; B.测序单元,与A单元连接,用于同时或分别对获自(A)的至少一部分的第一DNA、第二DNA和第三DNA进行测序,以获得对应的第一读段、第二读段和第三读段,所述第一读段、第二读段和第三读段中包含多个多态性位点; C.比对筛选单元,与B单元连接,用于将接收自(B)单元的第一读段、第二读段和第三读段分别与参考序列比对,基于获得的比对结果,进行(Cl)或(C2): (Cl)筛选出在第二DNA中只有一种基因型、而在第一DNA有两种基因型的多态性位点, (C2)筛选出在第二 DNA和第三DNA为不同基因型的多态性位点; D.胎儿核酸含量确定单元,与C单元连接,用于依据接收自C单元的比对结果中的第一读段中的支持(Cl)或(C2)中筛选出的多态性位点的读段的量,确定所述孕妇体液样本中胎儿核酸含量; E.检测确定单元,与C单元和D单元连接,用于依据接收自C单元的比对结果和D单元的胎儿核酸含量,同时确定胎儿单体型和胎儿染色体非整倍性。
【文档编号】C12Q1/68GK104232778SQ201410484277
【公开日】2014年12月24日 申请日期:2014年9月19日 优先权日:2014年9月19日
【发明者】袁媛, 刘涛, 王垚燊, 吴仁花, 阿叁, 杨玲, 易鑫 申请人:天津华大基因科技有限公司, 深圳华大基因医学有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1