母体血浆的无创性产前分子染色体核型分析的制作方法

文档序号:9332229阅读:823来源:国知局
母体血浆的无创性产前分子染色体核型分析的制作方法
【专利说明】母体血浆的无创性产前分子染色体核型分析
[0001] 相关申请的夺叉引用
[0002] 本申请要求2013年1月10日提交的名称为"母体血浆的无创性产前分子染色体 核型分析(NoninvasivePrenatalMolecularKaryotypingfromMaternalPlasma) ',的美 国临时专利申请号61/751,213以及2013年3月15日提交的名称为"母体血浆的无创性产 前分子染色体核型分析(NoninvasivePrenatalMolecularKaryotypingfromMaternal Plasma) "的美国专利申请号13/837, 776的优先权。每一件优先权申请均以引用的方式整 体并入本文中用于所有目的。
[0003] 本申请与Lo等人在2008年7月23日提交的名称为"利用大规模并行基因组测 序对胎儿染色体非整倍体进行诊断(DiagnosingFetalChromosomalAneuploidyUsing MassivelyParallelGenomicSequencing)"的共同拥有的美国专利申请号 12/178, 181 相 关,该专利申请的公开内容以引用的方式整体并入本文中。
【背景技术】
[0004] 胎儿DNA在母体血浆中的存在已开辟了无创性产前检查的令人兴奋的可能性[1、 2]。近来,使用大规模并行测序(MPS)对循环的胎儿DNA进行分析以实现产前检查目的已 引起了很多的关注。因此,胎儿染色体三体21、13、18和所选择的性染色体非整倍体已在母 体血浆DNA上利用MPS被检测[3-7]并且已迅速地被引入临床服务中。
[0005] 除了由于牵涉到整个染色体的拷贝数变化所导致的异常外,重要的是评估对母 体血浆进行的基于MPS的分析是否可能灵敏到足以检测出亚染色体缺失或重复。在这方 面,Peters等人报道了在妊娠期第35周所获得的母体血浆样品中检测到在染色体12上的 4. 2Mb缺失[8]。Jensen等人报道了在妊娠期第19周和第20周从两位孕妇所获得的母体 血浆样品中检测到在染色体22上的3Mb缺失[9]。除缺失区域外,Peters等人还对染色体 12上的另一个区域以及染色体14上的20个非重叠的4Mb区域进行了统计分析[8]。另一 方面,Jensen等人仅将他们的统计分析集中在染色体22上的缺失区域[9]。因此,根据由 Peters等人和Jensen等人所提供的数据,尚不清楚该种方法是否稳健到足以用于对微缺 失或微重复进行全基因组检测或实际上用于对胎儿染色体核型进行无创性测定。
[0006]Lo等人报道了可以在全基因组规模下利用母体血浆DNA测序对胎儿单核苷酸多 态性(SNP)进行基因分型[10]。具体来说,这些研究人员已证明可以利用被称为相对单倍 型剂量分析的方法来阐明胎儿从其母亲所遗传的单基因病症的SNP等位基因和突变[10]。 Fan等人确认了相对单倍型剂量分析的稳健性,并且利用这种方法检测出胎儿从其母亲所 遗传的约2. 85Mb的缺失[11]。在将这种方法用于无创性产前染色体核型分析的临床实施 中存在两个顾虑。首先,这种方法需要进行母体单倍型分析,这将会需要另外的分析步骤 [12、13]或系谱分析。其次,尚不清楚这种方法是否可以用于检测新生亚染色体缺失或重 复。

【发明内容】

[0007] 本文公开了用于检测胎儿基因组中的微扩增或微缺失的方法、系统和设备。在一 些实施方案中,所述方法包括:接收生物样品中的多个DNA片段中的每一个的序列标签;确 定所述序列标签的基因组位置;确定多个基因组区域中的每一个中DNA的密度是否异常高 或者异常低;将具有异常高密度的一组连续基因组区域鉴定为微扩增;以及将具有异常低 密度的一组连续基因组区域鉴定为微缺失。生物样品可以是以无创方式从怀有胎儿的女性 受试者获得的血液样品。
【附图说明】
[0008] 图1是示出了鉴定胎儿基因组中的微扩增或微缺失的方法的流程图。
[0009] 图2是在母体血浆基因组中所检测的拷贝数变异的Circos图。从内向外:案例01 至案例06。染色体核型模式图(ideogram)(最外面的环)是沿顺时针方向从pter向qter 取向的。每一条代表1Mb的窗口。具有在血浆中的表现增加或降低的三个或更多个连续 1Mb区段的区域分别是用绿色条和红色条来表示的。红色箭头突出显示了在这些异常区域 上的大致染色体位置。
[0010] 图3和图4示出了在母体血浆中检测到的拷贝数变异。示出了每一个案例的显示 出拷贝数变异的染色体。基因组位置示于x-轴上并且z-分数绘制于y-轴上。每一个竖 条代表1Mb区段。具有在血浆中的表现增加或降低的三个或更多个连续1Mb区段的区域分 别是用绿色条和红色条来表示。
[0011] 图5是示出了通过受微缺失/微重复影响的区域的基因组表现的变化以及母体血 浆中染色体Y序列的比例所估计的胎儿DNA百分比的表。(a)chrY法只适用于怀有男性胎 儿的那些案例。(b)对于案例05,由于母亲也携带变异,因此母体血浆中受影响区域的基因 组表现不能被用于确定胎儿DNA百分比。(c)前面的数字和后面的数字分别代表由染色体 3上的微重复和染色体4上的微缺失所估计的胎儿DNA百分比。
[0012] 图6示出了 3Mb微缺失/微重复的检测的诊断灵敏度。绘出了检测变异的诊断灵 敏度相对于胎儿DNA百分比的图。在假定对总共15000万种血浆DNA分子进行分析的情况 下,进行计算机模拟分析。
[0013] 图7是示出了在假定胎儿DNA百分比为5%的情况下,需要被测序和比对以实现不 同的诊断分辨率和诊断灵敏度的分子数目的表。在这一理论分析中,基于三个连续区段的 基因组表现在同一方向上与参考的平均值相差>3倍SD(过度表现或者表现不足)的标准, 所有案例的诊断特异性均为>99. 9%。
[0014]图8是示出了关于在实施例中所论述的样品的信息的表。
[0015]图9示出了可用于根据本发明的实施方案的系统和方法的示例性计算机系统900 的框图。
【具体实施方式】
[0016] 本发明的实施方案提供了用于确定胎儿基因组中是否存在微扩增或微缺失的方 法、系统和设备。简而言之,这一确定可以通过获得生物样品并且对所述样品中源自于多个 基因组区域中的每一个的基因组DNA的量进行定量来完成。可以适当地将每一个基因组区 域的量归一化以获得该区域的密度(即,对应的密度),并且与参考密度进行比较。对应的 密度与参考密度之间存在统计学上显著性差异则可以表明在基因组区域中或者跨越多个 基因组区域存在微扩增或微缺失。为了避免假阳性,当至少两个连续基因组区域中的每一 个存在这种统计学上显著性差异时,对微扩增或微缺失进行鉴定。
[0017] I?引言
[0018] 实施方案可以用于检测染色体的基因或区域的拷贝数的差异。由微扩增(也被 称为微重复)所造成的异常高的基因拷贝数可能会导致这些基因的过表达或病理性表达, 从而导致疾病如癌症。相反,由微缺失所造成的低基因拷贝数可能会导致表达减少或生物 (例如酶促)功能的丧失。因此,对异常拷贝数的检测可以提供胎儿在出生前或出生后可能 会面对的疾病的预警。
[0019] 生物样品可以无创方式从怀有胎儿的女性受试者获得。所述样品可以包括血液、 血浆、血清、尿液或唾液。血液含有无细胞的DNA片段,并且在怀孕的受试者中,这些片段中 的一部分是来源于胎儿。可如通过采用大规模并行测序技术对这些DNA片段进行测序,以 获得序列标签。可使用任何大规模并行测序平台,包括边合成边测序平台(例如Illumina/ Solexa)、边连接边测序平台(例如LifeTechnologySOLiD平台)、或单分子测序平台(例 如Helicos或PacificBiosciences)。每一个序列标签均含有产生所述序列标签的DNA片 段的序列的全部或一部分并且可以与参考基因组序列进行比对以确定该片段的起源的基 因组区域。
[0020] 基因组区域,也被称为"区段",可通过将参考基因组序列进行划分来限定。这些区 域对应于染色体的连续序列部分。在优选的实施方案中,每一个区域与一个染色体有关,并 且不跨越多个染色体。在一些实施方案中,这些区域具有相同的尺寸,如1Mb。基因组区域 的尺寸决定了本文所公开的方法的分辨率、以及以统计确定性鉴定微扩增和微缺失所需的 DNA片段的数目。
[0021] II.方法
[0022] 图1是通过对从怀有胎儿的女性受试者所获得的生物样品进行分析来鉴定胎儿 基因组中的微扩增或微缺失的方法100的流程图,该生物样品包括来自胎儿和来自女性受 试者的无细胞DNA。
[0023] 在步骤110中,接收生物样品中的多个DNA片段中的每一个的一个或多个序列标 签。这些序列标签可通过利用本领域已知的任何方法,例如Sanger测序或大规模并行测序 对DNA片段进行测序而获得。每一个标签均可被称为测序'读数',并且可对应于产生该标 签的DNA片段的一部分的全部。举例来说,所述标签可含有该片段的一端或该片段的内部 的序列。
[0024] 可利用任何已知方法将DNA片段从生物样品中分离出,并且准备用于测序。举例 来说,可在测序之前,例如利用聚合酶链式反应(PCR)将这些片段进行拷贝,或者可以将这 些片段连接到适合于所采用的测序技术的接头分子或'条形码'序列。还可使用这些片段 产生用于桥式扩增的克隆集群,正如在Illumina测序和类似技术中所进行的那样。准备用 于测序的这组DNA片段可被称为'测序文库'。
[0025] 在一些实施方案中,根据配对末端测序产生序列标签,其中在两个方向上从相对 端对DNA片段的拷贝进行测序。对来自两个方向的测序数据进行的比较允许对该片段的序 列,特别是该片段的末端处的序列进行验证。由配对末端测序所获得的序列标签的原始数 目提供了样品中DNA片段数目的估计值。这一数目可在100万、1000万、10000万、10亿和 100亿之间变化,这取决于样品的大小和性质。在一些实施方案中,当多个序列标签代表相 同的序列(即,在两端处相同的序列)时,可将重复的标签放弃或排除而不进行进一步分 析。
[0026] 在步骤120中,确定序列标签的基因组位置。这是通过首先利用本领域已知的标 准方法将每一个序列标签与参考序列,如重复序列未被屏蔽的人参考基因组(NCBIBuild 36.l/hgl8)进行比对来完成。在一些实施方案中,仅保留两端与同一染色体进行比对的标 签用于进一步分析。如果例如与参考序列存在太多的失配,或者如果标签不在规定的尺寸 范围内,那么也可将标签放弃。然后基于其序列,将每一个标签归属于参考序列内的基因组 区域或'区段',如上所述。
[0027] 在步骤130中,对于多个基因组区域中的每一个,由基因组区域内具有基因组位 置的序列标签确定基因组区域内DNA片段的对应量。基因组区域
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1