通过大规模平行rna测序分析母亲血浆转录组的制作方法_4

文档序号:9422025阅读:来源:国知局
列读数中,一些由母亲贡献和一些由胎儿 贡献。如果胎儿中相关表达的水平胎儿特异性和共享等位基因是已知的,或可以评估,那么 可测量B-等位基因比例,以获得对基因座的所有序列读数的部分胎儿贡献评估。如果"A" 和"B"等位基因在胎儿中同样表达,那么标量是约二。对基因座处序列读数的部分母亲贡 献是一减去部分胎儿贡献。当在过滤的信息型基因座的"B"等位基因是母亲特异性的时, 可进行类似的计算。
[0141] B.实施例:高胎儿和母亲贡献
[0142] 使用如上述0. 4的B-等位基因截取值,发现0. 91 %的循环转录体显示早期妊娠 (即第一和第二三个月)期间,胎儿的高贡献。在晚期妊娠(即第三三个月)期间,该百分 数增加至2. 52%。另一方面,42. 58%和50. 98%分别显示母亲在早期妊娠和晚期妊娠期间 的高贡献(图16、17和18A)。
[0143] V.基因用于诊断妊娠相关的病症的用途
[0144] A?妊娠相关的基因
[0145] 也提供了鉴定妊娠相关的基因的方法。方法包括接收多个第一序列读数和多个第 二序列读数。第一序列读数源自对获得自妊娠女性的血液血浆样品的RNA分子的测序。第 二序列读数源自对获得自非妊娠女性的血液血浆样品的RNA分子的测序。第一序列读数和 第二序列读数与参考序列比对,并且指定一组候选物基因。
[0146] 根据方法,然后,序列读数用于确定来自妊娠女性和非妊娠女性的样品中每个候 选物基因的表达水平。具体而言,对于每个候选物基因,使用第一序列读数测定对应候选 物基因的转录体的第一数量;和使用第二序列读数测定对应候选物基因的转录体的第二数 量。转录体的第一数量和转录体的第二数量可被归一化。然后计算候选物基因的转录体比 例,其中转录体比例包括转录体的第一数量除以转录体的第二数量。然后比较转录体比例 与截取值。如果转录体比例超过截取值,则鉴定候选物基因鉴定为妊娠相关的基因。
[0147] 在方法的一些实施方式中,归一化转录体的第一数量对应通过第一序列读数的总 数测量转录体的第一数量。类似地,归一化转录体的第二数量可对应通过第二序列读数的 总数测量转录体的第二数量。在其他实施方式中,归一化每个候选物基因的转录体的第一 数量对应通过所有候选物基因的第一转录体的总数测量候选物基因的转录体的第一数量。 归一化每个候选物基因的转录体的第二数量可对应通过所有候选物基因的第二转录体的 总数测量候选物基因的转录体的第二数量。
[0148] 与非妊娠女性相比,如果基因以更高的水平在妊娠女性中表达,而所有其他的相 等,那么方法一般将基因鉴定为妊娠相关的。妊娠和非妊娠女性可以是相同的个体;即,获 得自生孩子之前和之后的个体的样品可以分别是第一序列读数和第二序列读数的来源。
[0149] 我们已经显示携带胎儿特异性等位基因的循环RNA转录体的子集在分娩之后从 母亲血浆完全消失(图18B)。这些转录体认为是母亲血浆中胎儿特异性的。另一方面,一 部分母亲特异性等位基因在分娩之后也检测不到。因此,通过直接比较它们在分娩前和分 娩后母亲血浆中的存在,我们开发了妊娠期间显示上调的基因,称为妊娠相关的基因。我们 定义妊娠相关的基因为在分娩前第三个个月妊娠女性的血浆中检测到,它们的产后血浆水 平在两中情况下都下降多2倍的那些。通过使用用于数据归一化和微分基因表达分析的生 物信息学算法,我们编辑了一系列131个妊娠相关的基因(图21)。这些基因中,15个先前 报道为母亲血浆中妊娠特异性的 1'2'4'5'9'1°' 12。使用一步实时1^〇?,我们已经进一步验证 了五个新鉴定转录体的妊娠相关性,其在分娩前母亲血浆中丰富,即来自第三个三个月妊 娠女性的10个另外血浆样品中的STAT1、GBP1和HSD17B1,以及来自另一群第三个三个月 妊娠女性10个血浆样品中的KRT18和GADD45G(图22)。
[0150] 为了评估这些131个基因与妊娠的相关性,为所有的血浆样品进行分级聚类。在 来自妊娠女性(即早期妊娠和晚期妊娠)的血浆样品和与正在进行的妊娠不相关的(即非 妊娠对照和分娩后)那些之间观察到清晰的分离(图23)。
[0151] 有趣地,当在两个晚期妊娠病例的血浆样品和它们对应的胎盘和母亲血细胞之间 比较这些131个基因的表达模式时,胎盘和分娩前血浆样品之间,和母亲血细胞和产后血 浆样品之间观察到更加的相似之处(图24A)。该观察支持了大部分妊娠相关的基因优选在 胎盘而不在母亲血细胞中表达的观点。此外,这些妊娠相关的转录体在胎盘和母亲血浆中 的表达水平是正相关的(P〈〇. 05,Spearman相关性)(图24B)。
[0152] B.胎盘和母亲血液中的差别基因表达
[0153] 尽管我们能够通过直接检查分娩前和分娩后母亲血浆样品登记一组妊娠相关的 基因,但是我们也开发了胎盘和血细胞RNA-seq数据,用于比较目的。假设妊娠相关的基因 应是以高水平在胎盘中表达和以低水平在母亲血细胞中表达的那些,如之前所报道 1M5,我 们随意设置20倍差异作为基于组织的分析的最小截取值。该基于组织的分析产生总共798 个潜在的候选物基因,其中计算母亲血浆中胎儿和母亲贡献的比例。当与全转录组的相当 时(图18A),鉴定具有主要的胎儿贡献的相对高比例的基因(图25)。但是,基于血浆的策 略胜过基于组织的策略,在于能够鉴定更高的比例具有主要胎儿贡献的基因(图25)。
[0154] C.与疾病或病症相关的基因
[0155] 本文也提供了鉴定与妊娠相关的病症相关的基因的方法。方法包括接收多个第一 序列读数和多个第二序列读数。第一序列读数源自对获得自健康的妊娠女性的血液血浆样 品RNA分子的测序。第二序列读数源自对获得自遭受妊娠相关的病症,或携带遭受妊娠相 关的病症的胎儿的妊娠女性的血液血浆样品的RNA分子的测序。第一序列读数和第二序列 读数与参考序列对比,并且指定一组候选物基因。
[0156] 根据方法,序列读数然后用于确定每个候选物基因在两个妊娠女性的样品中的表 达水平。具体而言,对于每个候选物基因,使用第一序列读数测定对应候选物基因的转录体 的第一数量,和使用第二序列读数测定对应候选物基因的转录体的第二数量。转录体的第 一数量和转录体的第二数量可被归一化。然后计算候选物基因的转录体比例,其中转录体 比例包括转录体的第一数量除以转录体的第二数量。转录体比例然后与参考值比较。如果 转录体比例与参考值偏离,候选物基因鉴定为与病症相关。
[0157] 在方法的一些实施方式中,归一化转录体的第一数量对应通过第一序列读数的总 数测量转录体的第一数量。类似地,归一化转录体的第二数量可对应通过第二序列读数的 总数测量转录体的第二数量。在其他实施方式中,归一化每个候选物基因的转录体的第一 数量对应通过所有候选物基因的第一转录体的总数测量候选物基因的转录体的第一数量。 归一化每个候选物基因的转录体的第二数量可对应通过所有候选物基因的第二转录体的 总数测量候选物基因的转录体的第二数量。
[0158] 根据鉴定与妊娠相关的病症相关的基因的方法,在一些实施方式中,参考值是1。 在一些实施方式中,当转录体比例和参考值的比例超过或落在截取值之下时,转录体比例 与参考值偏离。在一些实施方式中,当转录体比例和参考值的差异超过截取值时,转录体比 例与参考值偏尚。
[0159] 如果基因的表达水平在表现和不表现病症的明显不同,而所有其他的相等,那么 方法一般将基因鉴定为与妊娠相关的病症相关的。
[0160] 通过使用与疾病相关的母亲血浆RNA,先前已经实现了胎儿病症和妊娠病理学的 诊断和监测。例如,促肾上腺皮质素释放激素(CRH)mRNA的母亲血浆水平已经显示用于无 创检测和预测先兆子痫2'3。母亲血浆中白介素1受体样l(ILlRLl)mRNA的检测已经表明 用于鉴定具有自发早产的女人8。一组生长相关的母亲血浆RNA标记物也已经被研究用于 无创评估胎儿生长和宫内生长限制4。在该研究中,我们认为可通过直接比较正常妊娠女 性和具有并发症妊娠,比如先兆子痫、宫内生长限制、早产和胎儿非整倍性女人的母亲血浆 转录组,鉴定新的疾病相关的循环RNA标记物。为了表明该方法的可行性,我们对获得自发 展了先兆子痫三个妊娠女性和七名匹配妊娠的无并发症妊娠女性的的母亲血浆样品进行 RNA-Seq。我们鉴定了在先兆子痫妊娠女性的血浆中显示明显上升的98个转录体(图26)。 新鉴定的先兆子痫相关的转录体潜在地用于预测、预言和监测疾病。
[0161] 该技术可也用于预测和监测早产。技术可也用于预测临近的胎儿死亡。技术可也 用于检测基因突变造成的疾病,只要考虑的基因在胎儿或胎盘组织中转录并且转录体在母 亲血浆中可检测。
[0162] 血浆RNA-Seq可用于其他临床情形。例如,该研究中开发的血浆RNA-Seq方法可 潜在地用于研究其中已经报道异常血浆RNA浓度的其他病理学病况,比如癌症13'14。例如, 通过比较癌症患者疗法之前和之后的血浆转录组,肿瘤相关的循环RNA标记物可鉴定用于 无创诊断应用。
[0163] VI?具体基因的等位基因表达模式
[0164] RNA-测序已经用于检查等位基因表达模式25。我们假设当RNA转录体从组织释放 进入循环时,保持给定基因的等位基因表达模式,已经可在血浆中检测到。在该研究中,我 们已经检查了两个RNA转录体,即PAPPA,妊娠特异性基因,和H19,印记的母亲表达基因的 等位基因计数26'27。
[0165] 对于PAPPA基因,我们分析了SNP,rs386088,其包含胎儿特异性SNP等位基因(图 27)。在分娩后血浆样品中缺少PAPPARNA-seq读数,指示其的确是妊娠特异性的4。重要 地,分娩前母亲血浆和胎盘RNA样品中胎儿等位基因读数计数的比例没有统计学上显著差 异(P= 0. 320,X2检验),指示母亲血浆数据反映胎盘中PAPPA的双等位基因的表达模式。
[0166] 我们最近报道了印记母亲表达的H19基因在胎盘和母亲血细胞中的DNA甲基化模 式可通过母亲血浆DNA的亚硫酸氢盐DNA测序检测28。这里,我们进一步检查了H19基因的 基因组印记状态是否可在RNA水平开发。我们首先关注H19基因,rs2839698的外显子1的 SNP位点,其包含母亲特异性等位基因,即胎儿中是AA和母亲中是AG。如图28中所显示, 在分娩后母亲血浆中检测到仅仅G-等位基因(图28)。这样的单等位基因模式是根据其与 印记对照区域中rs4930098SNP位点上未甲基化的G-等位基因的连接(图29)。在分娩前 母亲血浆中,尽管存在G-等位基因,但是也检测到胎盘贡献的A-等位基因(图28)。在三 个其他SNP位点中,即rs2839701、rs2839702和rs3741219,其携带母亲特异性等位基因, 发现了类似的等位基因模式,即分娩前母亲血浆中双等位基因和分娩后母亲血浆中单等位 基因(图28)。这些SNP位点上的母亲特异性等位基因可能为相同的母亲单体型,其未甲基 化并且所以被转录。注意,H19RNA在母亲血细胞中不表达(图28),提示血浆中的H19RNA 分子源自母亲组织/器官,而不是血细胞。报道为显示H19表达的非胎盘和非胎儿组织包 括肾上腺腺体、骨骼肌、子宫、脂细胞、肝和胰腺29。
[0167] VII.讨论
[0168] 在该工作中,我们目的是开发使用RNA-seq提供母亲血浆中转录活性的整体观点 的技术。我们先前已经显示母亲血浆中的部分胎儿DNA可通过靶向一个或数个胎儿特异性 基因座计算,因为整个胎儿基因组在母亲血浆中均匀出现3°。不像循环DNA,母亲血浆中胎 儿起源的RNA转录体的比例的测量是较不直接的,因为其被胎儿和母亲组织中的差别基因 表达复杂化并且或许它们释放进入循环。通过对母亲血浆进行RNA-seq并且检查胎儿和母 亲之间的多态差异,我们能够评估胎儿贡献的血浆转录体的比例。尽管如人们所预期,母亲 起源的转录体占血浆转录组的大多数,但是母亲血浆中在早期妊娠和晚期妊娠期间,分别 3. 70%和11. 28%的循环转录体源自胎儿。这些胎儿起源的转录体包括胎儿和母亲共同贡 献的RNA分子,以及胎儿单独贡献的那些。我们发现后者在早期妊娠和晚期妊娠期间分别 占母亲循环转录体的〇. 90%和2. 52%。这样的胎儿特异性基因在晚期妊娠期间更高的出 现可能与伴随妊娠过程胎儿和胎盘尺寸的增加相关。
[0169] 在该研究中,我们已经表明可观察到胎盘中妊娠特异性PAPPA基因的平衡的RNA 等位基因表达和在母亲血浆中印记母亲表达的H19基因的单等位基因表达。这些数据提示 母亲血浆可用作无创样品来源,用于研究等位基因表达模式。
[0170] 通过定量的比较分娩前和分娩后母亲血浆样品中的RNA转录体,我们已经编辑了 妊娠期间上调的一系列131个基因,如通过它们在产后血浆样品中减少的出现所显示。如 期望的,这些基因的描述可用于妊娠女性的血浆样品与非妊娠女性的那些区分开。分娩前 和分娩后母亲血浆样品的这样的直接比较已经使得我们以高通量方式分拣出妊娠相关的 基因,其可能不一定如之前的工作所显示以比母亲血细胞中相当更高的水平在胎盘中^ 5。 实际上,该直接血浆检查方法提供了另一途径,用于发现循环妊娠相关的RNA转录体,而不 需要胎盘组织和血细胞转录概况的先验知识。
[0171] 尽管我们已经显示RNA-seq是概述血浆转录组的可行方法,但是可进一步改善数 个技术问题。第一,对于血浆RNA-seq通过进一步优化测序方案,尤其排除血浆中高度转录 的rRNA和珠蛋白基因可增加信息产生。第二,我们仅仅集中关注参考转录体并且还未开发 个人亚型。未来的研究可包括通过增加测序读数深度检测新的转录体和差别分析剪接变体 和它们的亚型 31 33。第三,对于早期妊娠样品,我们已经省略了源自胎儿和母亲的转录体比 例分析的ASE-过滤,因为绒膜绒毛和羊水已经耗尽用于基因分型分析。然而,我们已经在 晚期妊娠中显示ASE-过滤对于母亲血浆中具有主要胎儿和母亲贡献的基因的鉴定没有明 显影响(图16和17)。
[0172] 结论,我们已经表明RNA-seq技术可用于测量母亲血浆中胎儿起源的转录体的比 例和鉴定循环妊娠相关的基因。该研究已经为更好理解母亲血浆的转录体前景铺平了道 路,因此利于鉴定涉及妊娠相关疾病的生物标记候选物。我们设想该技术可为用于妊娠相 关的或胎盘相关的疾病的分子诊断,和也为其他疾病比如癌症的分子诊断产生新的路径 34。
[0173] VIII.移植
[0174] 如上述,本文所述的方法可也用于移植。用于移植的方法可如用于胎儿分析类似 的方式进行。例如,可获得移植组织的基因型。实施方式可鉴定移植组织是杂合子,和宿主 生物体(例如,男性或女性)是纯合子的基因座。并且,实施方式可鉴定其中移植组织是纯 合子,和其中宿主生物体(例如,男性或女性)是杂合子的基因座。可计算相同的比例,并 且与截取值比较,以确定是否存在病症。
[0175] IX.计算机系统
[0176] 本文提到的任何计算机系统可使用任何适当数量的子系统。这样的子系统的例子 显示在计算机装置3000的图30中。在一些实施方式中,计算机系统包括单个计算机装置, 其中子系统可以是计算机装置的组件。在其他实施方式中,计算机系统可包括多个计算机 装置,每个是具有内部组件的子系统。
[0177] 图30中显示的子系统经系统总线3075相互连接。显示了另外的子系统比如打印 机3074、键盘3078、储存设备(一个或多个)3079、监视器3076,其与显示适配器3082连接, 和其他的子系统。与I
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1