r>[0040] (2)使用质量检测合格的基因组DNA进行目标区域捕获文库的制备。文库制备 是将1 μ g基因组DNA打断成主带为200-300bp小片段DNA,然后将打断后DNA片段进行 末端补平,在3'端加碱基"A",使得DNA片段能与3'端带有"T"碱基的特殊接头连接,经 Non-Captured PCR(未捕获前PCR)构建完成的文库,通过SMN1基因目标区域捕获探针选取 的特定基因的Exon及侧翼±30bp区域进行富集,再通过PCR扩增富集后产物,最后通过杂 交前后PCR产物QPCR检测获得序列捕获杂交效率。
[0041] (3)使用高通量测序仪对获得的样品文库进行测序。使得目标区域平均测序深度 达到200 X以上。
[0042] (4)通过生物信息分析,对测序信息进行分析和研究,以得到相关基因的单核苷酸 变异(SNV)、少数碱基的插入和缺失(InDel)等遗传变异信息。并明确与目标待检致病突 变相连锁遗传的SNP信息,即致病单体型。假设先证者分别从父母双方得到一个致病突变, 若,
[0043] 1)假设先证者致病基因外某一位点的基因型为AA,父亲为AC,母亲为AA。则可知: 先证者从父亲处获得了 A,从母亲处获得了一个A,且这两个SNP位点均与致病突变相连锁 遗传。而在父亲中C与非致病等位基因(allele)连锁;
[0044] 2)假设先证者致病基因外某一位点的基因型为AC,父亲为AC,母亲为AA。则可知: 先证者从父亲处获得了 C,从母亲处获得了一个A,且这两个SNP位点均与致病突变相连锁 遗传。而在父亲中C与非致病allele连锁;
[0045] 3)假设先证者致病基因外某一位点的基因型为AC,父亲为AA,母亲为AC。则可知: 先证者从父亲处获得了 A,从母亲处获得了一个C,且这两个SNP位点均与致病突变相连锁 遗传。而在母亲中C与非致病allele连锁;
[0046] 将上述推测方法应用到SMN1基因及两侧3M区域的SNP位点,则可获得者一范围 内的单体型信息,获知在这一区域内与致病突变连锁的单体型信息。从而并可进一步推断 出与非致病allele紧密连锁的SNP信息。
[0047] 3.孕妇血浆DNA目标区域捕获测序
[0048] 对孕妇血浆DNA进行目标区域捕获测序,并进行生物信息学SNP/indel分析。以 亲缘关系是否正确及胎儿DNA含量为质控环节,仅对质控合格的样品进行后续分析。对孕 妇的血浆游离DNA测序数据进行genotyping,并结合该家系单体型进行连锁分析,判断胎 儿是否遗传了夫妇的致病单体型。
[0049] (1)从1. 2ml孕妇血浆中抽提细胞游离DNA,并使用Qubit定量DNA进行质量检测。
[0050] (2)使用质量检测合格的基因组DNA进行目标区域捕获文库的制备。首先对DNA 片段进行末端补平,在3'端加碱基"A",使得DNA片段能与3'端带有"T"碱基的特殊接头 连接,经Non-Captured PCR构建完成的文库,通过SMN1目标区域捕获探针选取的特定基因 的Exon及侧翼±30bp区域进行富集,再通过PCR扩增富集后产物,最后通过杂交前后PCR 产物QPCR检测获得序列捕获杂交效率。
[0051] (3)使用高通量测序仪对获得的样品文库进行测序。使得目标区域平均测序深度 达到500 X以上。
[0052] 4.胎儿基因型推测
[0053] (1)通过生物信息分析,对测序信息进行分析和研究,以得到相关基因的单核苷酸 变异(SNV)、少数碱基的插入和缺失(InDel)等遗传变异信息。
[0054] (2)对血浆游离DNA中胎儿DNA的含量进行计算,计算方式如下
[0055] a)假设母亲白细胞DNA基因型为AA,胎儿基因组DNA为AT,则此时血浆中可观 察到的基因型为A和T,若支持A的reads数为c,支持C的reads数为d,则此时f = 2d/ (c+d);
[0056] b)假设母亲白细胞DNA基因型为AT,胎儿基因组DNA为AA,则此时血浆中可观察 到的基因型为A和T,若支持A的reads数为c,支持T的reads数为d,则此时f = (c-d) / (c+d) 〇
[0057] 若胎儿DNA含量>3%则认为质控合格,进入后续实验。
[0058] (3)判断胎儿从父亲处遗传的基因型,计算方式如下:
[0059] a)选择母亲为纯合,而父亲为杂合的位点进行父亲遗传单体型的判断。假设某一 SNP位点母亲基因型为AA,父亲基因型为AC,若血浆测序数据call SNP结果为A,C,且C的 含量符合估计的胎儿浓度。则表明胎儿从处获得SNP C所在的allele;
[0060] b)将SMN1捕获区域内所有满足a)条件的SNP用于判断胎儿从父亲处所获得的 SNP信息,构成胎儿从父亲处获得的单体型信息。并根据2-(4)中的信息,明确该单体型是 否与致病突变相连锁,从而获知胎儿是否从父亲处获得致病allele。
[0061] (4)判断胎儿从母亲处遗传的基因型,计算方式如下
[0062] 选择母亲为杂合,而父亲为纯合的位点进行母亲遗传单体型的判断。假设某一 SNP 位点母亲基因型为AC,父亲基因型为AA,若血浆测序数据call SNP结果为A和C,若胎儿从 母亲处遗传了 A等位基因,胎儿的基因型为AA,则可观察到A/C近似与(l+fV(l-f);若胎 儿遗传了 C等位基因,胎儿的基因型为AC,则可观察到A/C近似为0.5。对等位基因的reads 支持数构建二项分布模型分别计算出遗传 A、C的概率后得到相对概率Pa、Pc (Pa+Pc = 1) 并将所有SNP各点概率构建HMM模型用Viterbi算法(Lawrence R. Rabiner, PROCEEDINGS OF THE IEEE, Vol. 77, No. 2,1989年2月)判断胎儿从母亲处获得的单体型信息,并根据单 体型是否与致病突变相连锁,得知胎儿是否从母亲处获得致病allele。
[0063] (5)综合(3)和(4)的结果,获得胎儿的基因型信息。
[0064] 实施例
[0065] 对1例具有生育SMN1患病二胎高风险的孕妇(天津妇幼保健院)进行无创产前 基因检测。孕妇及其丈夫均为为SMN1基因7号外显子缺失突变的杂合携带者,并生育过一 个SMN1纯合突变的患者。现第二次怀孕,抽取孕妇外周血并及时分离血浆,而后通过血浆 DNA及孕妇、孕妇丈夫、先证者的基因组DNA进行捕获测序,对本胎胎儿的基因情况进行分 析。
[0066] 用盐析法提取标本DNA,大片段DNA进行超声打断,目前使用样品打断方法为 Covaris打断法,将样品DNA打碎至100-700bp范围的片段。(注:打断效果一般以所要求 制备文库Insert片段主带位置在200-250bp位置较为理想,若打断效果不理想则需要进行 重新打断。)
[0067] 用盐析法提取血浆游离DNA,使用Qubit定量后直接进行文库构建。
[0068] 1.文库制备
[0069] 1. 1末端修复和纯化
[0070]
[0071] 将配置好的mix震荡混匀后,每个反应加入25 μ L酶反应混合液。
[0072] 反应条件:20°C,30min
[0073] 使用180 μ L Ampure Beads进行产物纯化,回收的DNA溶于30yL(其中1.9yL 为损耗)的水中。
[0074] 1. 2 末端加 "A"(A-Tailing)
[0075]
[0076] 将配置好的mix震荡混匀后,每管加入6. 9 μ L酶反应混合液。
[0077] 反应条件:20°C,30min
[0078] 注:末端加"A"后不纯化
[0079] 1. 3 Adapter的连接和纯化
[0080]
[0081] 将配置好的mix震荡混匀,每个反应加入15 μ L酶反应混合液。
[0082] 反应条件:l6°C,l2_l6h (过夜)
[0083] 使用75 μ L Ampure Beads进行产物纯化,回收的DNA溶于35yL(其中2yL为损 耗)的水中。
[0084] 1. 4Non_Captured 样品 Pre-LM-PCR
[0085]
[0086] PCR 程序:
[0087] 94Γ 2min; 94°C 15s, 62 C 30s, 72°C 30s, 4c>clcs; ir〇 5min; 4°C forever
[0088] 2.芯片杂交,目标区域捕获富集
[0089] 本实验中参照NimbieGen使用说明书进行杂交洗脱,获取目的基因并PCR富集。
[0090] 3.上机测序
[0091] 本实验采用hiseq2000或hiseq2500PE101+8+101程序进行上机测序。
[0092] 4.信息分析
[0093] 测序仪获取原始短序列;
[0094] 去除测序数据中的接头和低质量数据;
[0095] 短序列定位到人类基因组数据相应的位置上;
[0096] 统计测序结果信息,短序列数量、目标区域覆盖大小、平均测序深度等;
[0097] 过滤低质量值和低覆盖度的单核苷酸;
[0098] 注释,确定突变