通过大规模平行rna测序分析母亲血浆转录组的制作方法_3

文档序号:9422025阅读:来源:国知局
7)的表达谱并且与妊娠女性相应的胎盘和母亲 血细胞比较。为这些样品的每个,使用IlluminaHiSeq2000工具进行RNA的大规模平行测 序。使用外显子组测序通过大规模平行测序对胎盘和母亲血细胞基因分型。我们检查了 NCBIdbSNPBuild135数据库中的约一百万个位于外显子中的SNP,并且对其中母亲是纯合 子(基因型AA)和胎儿是杂合子(基因型AB)的信息型SNP分类。因此,A等位基因是母 亲和胎儿之间共享的等位基因并且B等位基因是胎儿特异性的。
[0091] 针对相关组织表达水平对母亲血浆中RNA-SNP等位基因比和不同RNA转录体的总 血浆浓度绘图(胎盘/血细胞)(图7)。我们可观察到血浆中的RNA-SNP等位基因比与相 关组织表达水平正相关(SpearmanR= 0. 9731679,P= 1. 126e-09)。但是,总血浆水平与 组织表达不相关(SpearmanR= -0? 7285714,P= 0? 002927)。
[0092] 除了分析胎儿表达,该方法可也用于概述母亲表达。在该情况下,可使用母亲是 杂合子(基因型AB)和胎儿是纯合子(基因型AA)的信息型SNP。RNA-SNP等位基因比可 然后计算为母亲特异性等位基因计数除以共享等位基因的计数。在图8中,针对相关组织 表达水平(血细胞/胎盘),对RNA-SNP等位基因比和包含信息型SNP的不同基因的总血 浆水平绘图。我们可观察到母亲血浆中组织表达水平与RNA-SNP等位基因比的良好正关系 (SpearmanR= 0? 9386,P〈2. 2e_16),而不是总血衆转录体水平(SpearmanR= 0? 0574,P =0. 7431) 〇
[0093] RNA转录体,它们的RNA-SNP等位基因比和它们的血浆水平列表在图9和图10中。
[0094] 2.先兆子痫和对照妊娠病例的母亲血浆RNA-SNP等位基因比的比较
[0095] 对于两个妊娠女性对象的情况,获得平均117, 901,334个原始片段(表3A)。在 第三个三个月晚发型先兆子痫(PET)比例,5641,和其孕龄匹配的对照病例,7171之间比较 携带母亲特异性SNP等位基因的循环转录体子集的RNA-SNP等位基因比。如图11A中所显 示,这些转录体的RNA-SNP等位基因比在PET和对照病例中描绘了不同的概况。重要地, RNA-SNP等位基因比概况与血浆转录体水平的概况不同,如图11B中所显示。这提示母亲 血浆RNA-SNP等位基因比分析可用作另一度量标准,以更好区分PET病例与正常妊娠病例。 随着信息型SNP的数量增加信息转录体的数量可进一步增加,例如PET病例,5641,和另一 正常妊娠对照病例,9356之间的比较(图12A和12B)。图11和图12显示的RNA-SNP等位 基因比和血浆的水平RNA转录体分别列表在图13和图14中。
[0096] 表3A:RNA_seq读数比对结果的总结。
[0097]
[0098] a.去除高度重复的读数之后保留的读数。
[0099] b?原始读数的%。
[0100] c.对于详细分类见补充数据表2B。
[0101] d.预处理的读数的%。
[0102] 表3B:RNA-seq读数比对结果的总结
[0103]
[0104] a.过滤的读数主要是细胞核和线粒体rRNAs和tRNAs。
[0105] b.可分析的读数=总的可定位读数-过滤的读数。
[0106] c.与参考基因的外显子和内含子外部区域对齐的读数的%。
[0107] III.确定胎儿或母亲RNA贡献的方法
[0108] A?方法
[0109] 显示在图15中的方法1500用于确定来自孕育胎儿的女性对象的样品中是胎儿起 源的一部分RNA。可如上为方法300所讨论获得和制备样品。
[0110] 在步骤1501中,接收多个序列读数。在步骤1502中,序列读数与参考序列对齐。 可如上为步骤301和302所描述进行这些步骤。
[0111] 在步骤1503中,鉴定一个或多个信息型母亲基因座。每个信息型母亲基因座在胎 儿中对于第一等位基因是纯合子和在妊娠女性对象中对于相应的第一等位基因和相应的 第二等位基因是杂合子。第一等位基因因此在母亲和胎儿之间是共享的,并且第二等位基 因是母亲特异性的。可如上面为步骤303所描述鉴定信息型母亲基因座。
[0112] 在步骤1504中,如步骤304中过滤的信息型母亲基因座,并且坚定一个或多个过 滤的信息型母亲基因座。然后,在步骤1505-1511中,在个体过滤的信息型母亲基因座的水 平上操作序列读数。在步骤1505和1506中,为每个过滤的信息型母亲基因座确定第一数量 和第二数量。在步骤1505中测定第一数量,其作为与基因座对齐并且包含相应的第一等位 基因的序列读数的数量。在步骤1506中测定第二数量,其作为与基因座对齐并且包含相应 的第二等位基因的序列读数的数量。可与上面讨论的步骤305和306类似地进行步骤1505 和 1506。
[0113] 在步骤1507中,为每个信息型母亲基因座计算第一数量和第二数量的和。和可等 于与基因座对齐的序列读数的总数。在步骤1508中,用和除以第二数量计算母亲比例。母 亲比例提供与具体的包含第二(母亲特异性)等位基因的基因座对齐的所有序列读数的分 数。
[0114] 在步骤1509中,测定标量。标量表示妊娠女性对象中在过滤的信息型母亲基因座 相对于相应的第二等位基因表达的总表达水平。在一些实施方式中,妊娠女性对象中两个 等位基因的表达已知或假设是对称的情况下,标量是约二。在其他实施方式中,标量可偏离 二并且考虑不对称的基因表达。因为大部分基因座对称表达,对称性的假设是有效的。
[0115] 在步骤1510中,母亲比例乘以标量,以获得母亲贡献。母亲贡献表示,在过滤的信 息型母亲基因座处,母亲贡献的序列读数部分(或,通延伸,样品中RNA部分)。一减去母亲 贡献是胎儿贡献,或胎儿贡献的序列读数部分。在步骤1511中,为过滤的信息型母亲基因 座计算胎儿贡献。
[0116] 在步骤1512中,测定胎儿起源的样品中RNA部分。该部分是对于过滤的信息型母 亲基因座的胎儿贡献的平均数。在一些实施方式中,该平均数加权,例如通过为过滤的信息 型母亲基因座计算的和。通过计算加权的平均数,在步骤1512中测定部分可反映样品中不 同基因座或基因的相对表达水平。
[0117] 可为获得测序数据的一个过滤的信息型母亲基因座,许多这样的基因座,或所有 这样的基因座计算胎儿起源的样品中RNA部分。认识到该部分反映具体的妊娠女性对象中 在获取样品时的循环转录组。如果样品在妊娠过程的不同时间获得自对象,方法1500中鉴 定的过滤的信息型母亲基因座的一个样品与下一个样品不同,因为在这些基因座胎儿起源 的RNA的部分可能不同。样品中胎儿起源的RNA部分可也与接下来的一个对象不同,即使 当控制妊娠阶段或其他因素时,并且可在具有妊娠相关的病症的对象和健康的对象之间不 同。因此,可比较该部分与截取值,以诊断这样的病症。
[0118] 在一些实施方式中,通过使用来自一个或多个健康对象的样品进行方法1500测 定截取值。在一些实施方式中,如果该部分超过截取值或落在截取值之下任何量或某些量, 则作出诊断。比较可涉及计算差异或计算妊娠女性对象中胎儿起源的RNA部分和截取值之 间的比例。在一些实施方式中,比较涉及评估妊娠女性对象中胎儿起源的RNA部分与健康 的妊娠女性中在类似的妊娠时间看到的是否显著不同。
[0119] 可也通过检查信息型胎儿基因座测定胎儿起源的样品中RNA部分。在每个信息型 胎儿基因座处,可通过首先计算胎儿比例评估该部分,所述胎儿比例是包含第二(胎儿特 异性)等位基因的序列读数的数量除以序列读数的总数。胎儿贡献接着是胎儿比例乘以表 示胎儿中两个等位基因相对表达水平的标量。因此,可通过鉴定信息型胎儿基因座、过滤 这些基因组、计算每个过滤基因座的胎儿贡献,和使过滤基因座的胎儿贡献平均,进行方法 1500的变型。如果期望,通过方法1500测定胎儿起源的RNA部分可通过用为过滤的信息型 胎儿基因座计算的胎儿贡献平均为过滤的信息型母亲基因座计算的胎儿贡献而增加。这里 计算的平均数可被加权,以反映在不同基因座的序列读数的数量的变化,以给予母亲特异 性或胎儿特异性基因组,或以其他方式根据需要更多的权重。
[0120] B.实施例
[0121] 1.鉴定和评估母亲血浆中源自胎儿和母亲的转录体
[0122] 首先基于基因分型数据鉴定定义为具有至少一个信息型SNP的基因的信息基因。 在两个早期妊娠病例中,6, 714和6, 753个信息基因的总数可分别用于检查胎儿和母亲贡 献的相对比例(图16和17)。在两个晚期妊娠病例中,7, 788和7, 761个信息基因的总数 可分别用于检查胎儿和母亲贡献的相对比例。为了测量母亲血浆中胎儿贡献的相对比例, 我们为RNA转录体分类,其中通过母亲血浆样品中的至少一种RNA-seq读数覆盖胎儿特异 性等位基因。这样胎儿起源的转录体的相对比例早期妊娠和晚期妊娠期间分别是3. 70%和 11. 28%。使用类似的方法,使用母亲特异性SNP等位基因检查的循环中母亲贡献的相对比 例评估为在早期妊娠和晚期妊娠期间分别是76. 90%和78. 32% (图18A)。
[0123] 2.为PET和对照妊娠病例比较RNA-SNP部分胎儿和母亲贡献
[0124] 我们已经检查了对于GNAS转录体,部分胎儿和母亲贡献,其是在PET比例,5641, 和其孕龄匹配的对照病例,7171中检测。在GNAS转录体中,在病例5641中有在基因座 rs7121包括胎儿特异性SNP等位基因的信息型SNP位点;在病例7171中相同SNP位点, 有母亲特异性SNP等位基因。病例5641中该SNP位点的部分胎儿和母亲贡献分别计算为 0. 09和0. 91。另一方面,对于病例7171中相同SNP位点部分胎儿和母亲贡献分别是0. 08 和0. 92 (图19)。与对照病例7171比较,部分胎儿贡献有12. 5%增加和该转录体中部分母 亲贡献有1. 09 %的下降。有趣地,与7171比较,在病例5641中,为该转录体检测到FPKM的 21%增加。
[0125] IV.指定基因组基因座为母亲或胎儿标记物的方法
[0126] A?方法
[0127] 指定基因组基因座为母亲或胎儿标记物的方法2000显示在图20中。方法涉及分 析来自孕育胎儿的女性对象的样品。样品可以是母亲血液血浆的并且包含源自母亲和胎儿 的RNA分子的混合物。可如上面为方法300所讨论获得和制备样品。
[0128] 在步骤2001中,接收多个序列读数。在步骤2002中,序列读数与参考序列比对。 这些步骤可如上为步骤301和302所描述进行。
[0129] 在步骤2003中,鉴定一个或多个信息型基因座。每个基因座在第一实体中对于相 应的第一等位基因是纯合子和在第二实体中对于相应的第一等位基因和相应的第二等位 基因是杂合子。第一实体是妊娠女性对象或胎儿,和第二实体是妊娠女性对象和胎儿中另 一个。信息型基因座可如上面为步骤303所描述鉴定。
[0130] 在步骤2004中,如在步骤304中过滤信息型基因座,并且鉴定一个或多个过滤的 信息型基因座。在一些实施方式中,仅仅考虑过滤表示SNP的信息型基因座。在方法的一 个例子中,过滤的信息型基因座包括母亲血浆中具有"A"等位基因的至少一个序列读数和 "B"等位基因的一个序列读数的信息型SNP。
[0131] 然后在步骤2005-2008中,在个体过滤信息型基因座的水平上操作序列读数。在 步骤2005和2006中,对于每个过滤的信息型基因座测定第一数量和第二数量。第一数量 在步骤2005中测定为与基因座对齐并且包含相应的第一等位基因的序列读数的数量。第 二数量在步骤2006中测定为与基因座对齐并且包含相应的第二等位基因的序列读数的数 量。步骤2005和2006可与上面讨论的步骤305和306类似地进行。
[0132] 在步骤2007中,为每个过滤的信息型基因座计算第一数量和第二数量的比例。该 比例表示序列读数的相对丰度(和引申表示样品中的转录体)包含第一等位基因和第二等 位基因。在一些实施方式中,比例简单地计算为第一数量除以第二数量。这样的计算产生 共享等位基因的序列读数的数量作为母亲特异性或胎儿特异性等位基因的多个序列读数。 该比例,或其倒数,可视为等位基因比,和对于SNP基因组,可视为RNA-SNP等位基因比。
[0133] 在一些实施方式中,对于包括母亲特异性SNP等位基因的信息型SNP,对于每个 SNP,RNA-SNP等位基因比计算为母亲特异性等位基因:共享等位基因。另一方面,对于包 括胎儿特异性SNP等位基因的信息型SNP,RNA-SNP等位基因比可计算为胎儿特异性等位基 因:共享等位基因。不像基因表达分析,其中数据归一化是必须的,RNA-SNP等位基因比分 析不需要数据归一化并且引入较少的偏差。对于包含大于一个信息型SNP的转录体,可为 每个信息型SNP位点计算RNA-SNP等位基因比并且可计算每个转录体的平均RNA-SNP等位 基因比。
[0134] 在步骤2007中,比例可以可选地计算为第二数量除以第一数量和第二数量的和。 这里,比例提供母亲特异性或胎儿特异性等位基因的序列读数的数量为基因座的一部分所 有序列读数。根据"A"和"B"等位基因,比例可表达为
[0135] B-等位基因比=B-等位基因计数/ (A-等位基因计数+B-等位基因计数)
[0136] 理论上,对于仅仅由胎儿或母亲贡献的血浆转录体,B-等位基因比应是0. 5,假设 没有等位基因特异性表达。计算比例的其他方法对技术人员是显而易见的。
[0137] 在步骤2008中,当比例超过截取值时,过滤的信息型基因座命名为标记物。在一 些实施方式中,截取值是约0.2至约0.5。在一些实施方式中,截取值是0.4。在方法的一 个例子中,对于具有高胎儿或母亲贡献的RNA转录体,B-等位基因比截取值定义为多0. 4。 该截取值考虑RNA-seq读数的泊松分布和随机取样。在一些实施方式中,当比例超过截取 值时,认为"B"等位基因的贡献是高的。
[0138] 在具体信息型基因座的高等位基因比可指示(i)第二或"B"等位基因在杂合子个 体中比"A"等位基因更高表达(即,等位基因表达不对称),(ii)母亲血浆中所有与基因座 对齐的RNA的更大共享由杂合子个体贡献,或(i)和(ii)。如果与信息型基因座相关的基 因是病理上过表达的,那么高等位基因比可也指示妊娠相关的病症。因此,一些方法的实施 方式也包括基于过滤信息型基因座是否命名为第二实体(即,杂合子个体)的标记物,诊断 妊娠相关的病症。在进行这样的诊断时,用于和等位基因比比较的截取值可基于获得自健 康的妊娠对象的血浆样品中的转录体水平。
[0139] 在一些实施方式中,方法2000可也用于评估样品中在母亲或胎儿起源的具体过 滤信息型基因座处的RNA部分。通过在步骤2007中计算的比例乘以标量进行评估。标量 表示在基因座处相对于杂合子个体中第二等位基因的表达的总表达水平。
[0140] 为可阐释,如果方法中计数的第二("B")等位基因是胎儿特异性,那么如上计算 的B-等位基因比表示该等位基因的序列读数的数量,作为过滤的信息型基因座的一部分 或所有序列读数。包含共享("A")等位基因的序
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1