基本无偏差的基因组扩增的制作方法

文档序号:9731654阅读:666来源:国知局
基本无偏差的基因组扩增的制作方法
【专利说明】基本无偏差的基因组扩増
[0001] 相关申请的交叉引用
[0002] 本申请要求2013年5月30日提交的美国临时申请No.61/829193的权益,在此将其 以引用的方式整体并入。
[0003] 关于联邦赞助R&D的声明
[0004] 本研究由美国国立卫生研究院R01HG004876资助支持。政府对本发明拥有一定的 权利。
[0005] 背景
[0006] 通过全基因组扩增,单细胞中的遗传物质可通过DNA聚合酶扩增为许多克隆拷贝, 并且可通过鸟枪法测序描述其特征。已经在微生物和哺乳动物细胞中成功示范了单细胞的 基因组测序M,并应用于描绘海洋微生物基因组的多样性 7、癌症中的体细胞突变8,9以及精 子中的减数分裂重组和突变 3,1()。
[0007] 领域
[0008] 本文的实施方案通常涉及全基因组扩增。本文的一些实施方案通常涉及无偏差的 基因组扩增。
[0009] 概述
[0010] 根据一些方面,提供产生基本无偏差的单细胞的基因组扩增文库的方法。该方法 可包括在配置以用于基本无偏差的基因组扩增的纳升级反应环境中扩增单细胞的基因组, 以及构建包含基本无偏差的基因组扩增的多个扩增子的文库。在一些实施方案中,扩增单 细胞的基因组包括多链置换扩增(MDA),所述多链置换扩增包含使反应环境与(a)链置换聚 合酶和(b)多个随机的DNA多聚物相接触,并因此产生基本无偏差的单细胞的基因组扩增。 在一些实施方案中,基因组核酸的量与纳升级反应环境的体积的比率为至少约0.03百万个 碱基对/纳升。在一些实施方案中,基因组核酸的量与纳升级反应环境的体积的比率为至少 约200百万个碱基对/纳升。在一些实施方案中,配置纳升级反应环境以用于以大于1 X的覆 盖度扩增至少约90%的基因组。在一些实施方案中,纳升级反应环境包括不大于约20nL的 体积。在一些实施方案中,纳升级反应环境包括不大于约12nL的体积。在一些实施方案中, 该方法还包括在单基板上的多个纳升级反应环境中扩增多个单细胞的基因组,其中至少 95%的反应环境不包含除单细胞的基因组外的任何基因组。在一些实施方案中,至少99% 的反应环境不包含除单细胞的基因组外的任何基因组。在一些实施方案中,配置基板以用 于单移液操作,从而将单细胞的基因组分配于反应环境中。在一些实施方案中,该方法还包 括选择期望数量的反应环境;以及仅在期望数量的反应环境中扩增多个单细胞的基因组。 在一些实施方案中,该方法还包括鉴定实现期望水平的扩增的反应环境,其中从实现期望 水平的扩增的反应环境中构建文库。在一些实施方案中,该方法还包括从多个反应环境中 构建多个文库,其中多个文库的数量与多个反应环境的数量相同或不同。在一些实施方案 中,在纳升级反应环境中扩增单细胞的基因组包括在扩增-检测部分存在的情况下扩增。在 一些实施方案中,所述扩增-检测部分包含花青染料。在一些实施方案中,所述扩增-检测部 分包含SYBR?绿染料。在一些实施方案中,来自扩增-检测部分的信号鉴定了已经实现期望 水平的扩增的反应环境。在一些实施方案中,反应环境不包含除单细胞之外的任何细胞。在 一些实施方案中,所述反应环境不包含除单细胞的基因组之外的任何基因组。在一些实施 方案中,所述随机多聚物选自:五聚物、六聚物、七聚物、八聚物、九聚物以及十聚物。在一些 实施方案中,所述随机多聚物为六聚物。在一些实施方案中,基本上所有的多个扩增子是无 支链的。在一些实施方案中,该方法还包括在构建文库之前,从反应环境中移出多个扩增子 中的至少一些。在一些实施方案中,移出多个扩增子中的至少一些包括显微操作。在一些实 施方案中,所述多个扩增子包含不多于约100皮克-约10纳克的DNA。在一些实施方案中,所 述文库包括基于转座酶的文库。在一些实施方案中,所述文库包括基于Tn5转座酶的文库。 在一些实施方案中,所述文库包括随机断裂和连接文库。在一些实施方案中,所述单细胞为 一个人细胞或微生物细胞。在一些实施方案中,所述单细胞包括不可培养或基本不可培养 的细菌细胞。在一些实施方案中,MDA包括实时MDA。在一些实施方案中,对两个或更多个单 细胞的两个或更多个基因组并行实施该方法,并因此并行产生两个或更多个无偏差的扩增 文库。在一些实施方案中,该方法还包括下述中的至少一项:人肠道内不可培养的细菌的从 头组装,异质环境(如海水)中不可培养的细菌的从头组装、单神经元的拷贝数变异检出、单 癌细胞或循环肿瘤细胞的拷贝数变异检出、或者人类单体型分析。在一些实施方案中,链置 换聚合酶包括高保真聚合酶。在一些实施方案中,所述链置换聚合酶包括phi29聚合酶。 [0011]根据一些方面,提供通过多链置换扩增(MDA)产生基本无偏差的基因组扩增的方 法。该方法可包括提供纳升级反应环境中的基因组,以及使所述纳升级反应环境与(a)链置 换聚合酶以及(b)多个随机DNA多聚物相接触,并因此产生基本无偏差的基因组扩增。在一 些实施方案中,该方法还包括构建包含基本无偏差的基因组扩增的多个扩增子的文库。在 一些实施方案中,配置纳升级反应环境以用于以大于1 X的覆盖度扩增至少90%的基因组。 在一些实施方案中,基因组核酸的量与纳升级反应环境的体积的比率为至少约0.3百万个 碱基对/纳升。在一些实施方案中,基因组核酸的量与反应环境的体积的比率为至少约200 百万个碱基对/纳升。在一些实施方案中,随机多聚物选自:五聚物、六聚物、七聚物、八聚 物、九聚物以及十聚物。在一些实施方案中,所述随机多聚物包括六聚物。在一些实施方案 中,基本上所有的多个扩增子都是无支链的。在一些实施方案中,纳升级反应环境包括促进 基本无偏差的单细胞扩增的纳升级反应环境。在一些实施方案中,所述纳升级反应环境包 括不大于约20nL的体积。在一些实施方案中,所述纳升级反应环境包括不大于约12nL的体 积。在一些实施方案中,所述反应环境包含不多于一种基因组的可能性为至少99%。在一些 实施方案中,该方法还包括下述中的至少一项:人肠道中不可培养的细菌的基因组的从头 组装、异质环境中不可培养的细菌的从头组装、单神经元的拷贝数变异检出、单癌细胞或循 环肿瘤细胞的拷贝数变异检出、或者人类单体型分析。在一些实施方案中,链置换聚合酶包 括高保真聚合酶。在一些实施方案中,所述链置换聚合酶包括phi29聚合酶。
[0012]根据一些方面,提供用于基本无偏差的至少一种单细胞的基因组扩增的基板。所 述基板可包括多个上样区,其中配置每个上样区以接收液体样品。每个上样区可包含促进 基本无偏差的单细胞扩增的多个纳升级反应环境。在一些实施方案中,配置多个纳升级反 应环境以并行实施期望数量的扩增反应,其中在不同的纳升级反应环境中进行每个扩增反 应。在一些实施方案中,配置多个纳升级反应环境,以在不对所述基板进行进一步修饰的情 况下并行实施期望数量的扩增反应。在一些实施方案中,所述多个纳升级反应环境不与任 何微流体通道或纳流体通道流体连通。在一些实施方案中,每个纳升级反应环境的体积不 大于约12nL。在一些实施方案中,每个纳升级反应环境的体积不大于20nL。在一些实施方案 中,配置每个上样区,以将包含稀释的细胞的溶液经由单移液操作上样进多个纳升级反应 环境。在一些实施方案中,每个反应环境包含多种随机多聚物和链置换聚合酶。在一些实施 方案中,所述多个多聚物包括六聚物。在一些实施方案中,基板包含至少三个上样区。在一 些实施方案中,每个上样区包含至少十个纳升级反应环境。在一些实施方案中,每个上样区 包含至少一百个纳升级反应环境。在一些实施方案中,基板还包含检测器,配置检测器以检 测每个反应环境中的扩增-检测部分。在一些实施方案中,基板还包括配置以从单一反应环 境中回收扩增的核酸的纳升级移液器。在一些实施方案中,配置纳升级反应环境以使在将 包含单细胞或其部分的溶液上样至上样区之后,至少99%的反应环境包含不多于一种细胞 的基因组。在一些实施方案中,基本上每个反应环境都包含不多于一种细胞的基因组,并且 其中基本上包含基因组的每个反应环境还包含基因组的多个扩增子。在一些实施方案中, 所述多个扩增子包含基本无偏差的基因组覆盖度。在一些实施方案中,所述多个扩增子包 含不多于约100皮克-约10纳克的DNA。在一些实施方案中,链置换聚合酶包括高保真聚合 酶。在一些实施方案中,所述链置换聚合酶包括phi29聚合酶。
[0013] 附图简要说明
[0014] 图1为一系列显示根据本文的一些实施方案的基本无偏差的基因组扩增的原理 图。图1A为在根据本文的一些实施方案的基本无偏差的基因组扩增方法的背景下,显示根 据本文的一些实施方案的基板100的原理图。每个基板100可包含16个单独的上样区12,每 个上样区14包含255个纳升级反应环境,例如12nl微孔。可利用单移液栗将细胞、裂解液、变 性缓冲液、中和缓冲液以及包含扩增-检测部分的MDA预混液中的每一种添加至微孔中。然 后可以使用荧光显微镜,利用实时MDA系统来使扩增子生长可视化。随时间显示荧光渐增的 微孔为阳性扩增子。利用与显微操作系统相连的精细玻璃移液器提取扩增子。图1B为不同 放大率的单大肠杆菌(E.coli)细胞的一系列扫描电子显微镜(SEM)图像。该特定孔仅包含 一个细胞,并且观察到的大多数孔也包含不多于1个细胞。图1C为显示可用于根据本文的一 些实施方案的实时MDA的定制显微镜培养室的照片。该培养室是温度和湿度受控的,以减缓 试剂的蒸发。此外,它通过自身包含的显微操作系统而防止扩增子提取过程中的污染。还显 示了整个微孔阵列的图像,以及探入孔中的微量移液管。图1D为显示根据本文的一些实施 方案,利用DNA聚合酶I以及Ampligase将复杂的3维MDA扩增子简化为线性DNA的原理图。该 过程可显著改善标签化后的文库复杂性。
[0015] 图2为根据本文的一些实施方案,通过MIDAS产生的组装的大肠杆菌基因组图。利 用MIDAS分析三个单大肠杆菌细胞。用极少的测序投入(2-8M PElOObp读取)组装了88%-94%之间的基因组。该直方图显示该三个细胞中每一个的每个组装区域覆盖的平均深度的 l〇g2。缺口用有颜色的重叠群之间的空白表示。覆盖的深度在整个基因组中十分一致,并且 存在很少的缺口。
[0016] 图3为一系列显示根据本文的一些实施方案进行MDA和MIDAS之后,单细菌细胞以 及哺乳动物细胞基因组覆盖度的图。图3A为显示根据本文的一些实施方案,在PCT管中扩增 10小时(上部)、2小时(中部)以及在微孔中(MIDAS)扩增10小时(底部)的单大肠杆菌细胞之 间的比较的图。Log 1Q比率(y轴)代表标准化的覆盖度。随着MDA受限,偏差得到改善,其中 MIDAS方法显示出最高的统一性。图3B为显示根据本文的一些实施方案,利用传统的MDA与 MIDAS扩增的单一人细胞之间的比较的图。与通过MIDAS扩增的单神经元核(底部)相比,单 淋巴细胞的10小时MDA(上部)显示出更大的覆盖度偏差。图3C为显示根据本文的一些实施 方案扩增的单细菌细胞的覆盖度分布的图。X轴代表分成100个总的库的基因组覆盖度的 l〇g1Q<3MIDAS(30)显示紧密的覆盖度,表示该文库中有限的偏差。正常的(32)以及受限的 (34)管内MDA文库显示出大范围的覆盖度。图3D为显示根据本文的一些实施方案扩增的单 哺乳动物细胞的覆盖度分布的图。MIDAS(36)比管内MDA文库(38)显示出更紧密的覆盖度分 布。
[0017]图4为一系列显示根据本文的一些实施方案,利用MIDAS检测拷贝数变异的图。图 4A为显示根据本文的一些实施方案,用MIDAS分析的唐氏综合征单细胞的拷贝数变异的散 点图的图。X轴显示基因组位点,y轴显示(以log 2水平)估计的拷贝数。在该单细胞中可清楚 地观察到三体性21,以及一些其它更小的CNV检出。图4B为根据本文的一些实施方案,具有 三体性21"加标"的唐氏综合征单细胞中拷贝数变异的散点图。X轴显示基因组位点,y轴显 示(以l〇g 2水平)估计的拷贝数。在每个箭头处,将染色体21的2Mb的部分通过计算插入基因 组。在每个位点,检出了拷贝数变异,显示MIDAS可以准确地检测2Mb的拷贝数变异。
[0018]图5为一系列描述根据本文的一些实施方案的实时MDA的显微镜图片。利用488nm 的滤光片每小时拍摄图片。显示的是1小时(图5A)、2小时(图5B)、3小时(图5C)、4小时(图 5D)、5小时(图5E)、6小时(图5F)、7小时(图5G)以及8小时(图5H)。观察到扩增子在1小时开 始生长,并继续生长直至它们由于微孔内有限的空间而不能扩增。该饱和通常发生在5-6小 时之内。扩增子的随机分布显示细胞接种是随机的,并且相邻的孔中不存在扩增子。
[0019] 图6为一系列描述根据本文的一些实施方案的扩增子提取的显微镜图片。基因组 DNA充满微孔,并且实施MDA以使每个孔都包含MDA扩增子。图6A中的荧光显示扩增成功。扩 增之后,微量移液管降低至单孔,由箭头指出,并提取扩增子。图6B显示在不干扰邻近微孔 的内容物的情况下,成功移出扩增子,因为荧光丧失。
[0020] 图7为描述根据本文的一些实施方案,组装的基因组与定位于整个基因组的读取 之间的比较的原理图。外侧的圈显示定位于大肠杆菌的组装的重叠群。中间的圈显示定位 于大肠杆菌的未经处理的读取。内侧的圈代表读取的覆盖度。在重叠群未被组装的定位区 域中,覆盖度较低。
[0021] 图8为一系列描述根据本文的一些实施方案,利用基于传统MDA的单细胞测序检测 拷贝数变异的图。图8A为描述用传统的MDA分析的唐氏综合征单细胞中拷贝数变异的散点 图的图。X轴显示基因组位点,y轴显示(以log2水平)估计的拷贝数。在该单细胞中观察不到 三体性21,并检出了遍布整个基因组的一些其它的大的CNV。图8B为描述具有三体性21"加 标"的唐氏综合征单细胞中拷贝数变异的散点图的图。X轴显示基因组位点,y轴显示(以 log2水平)估计的拷贝数。在每个箭头处,将染色体21的2Mb部分通过计算插入基因组。在任 何位点都未检出拷贝数变异,显示基于传统的MDA的方法不能准确地检测CNV。
[0022]图9A-9B为一系列描述根据本文的一些实施方案的MIDAS扩增与MALBAC(不同的扩 增核酸的方法)的比较的图。图9A为描述MALBAC(上部)与MIDAS(底部)的一对图,其中MIDAS 与MALBAC显示出贯穿基因组的类似的无偏差覆盖度。图9B为描述,与MALBAC 92相比,MIDAS 90显示出稍好的覆盖度分布的一对图。
[0023] 图10A-10C为一系列描述根据本文的一些实施方案的MIDAS扩增与下述数据的比 较的图:之前公开的两种精细胞池的二倍体区域的管内MDA数据 43、微流体MDA1()数据和 MALBAC44数据以及用MALBAC32处理的单SW480癌细胞的二倍体区域的数据。基因组位点被合 并至预先确定的大小为~60kb的可变库,以包含类似的读取数 3(),并且绘制为针对基因组覆 盖度(用平均数进行标准化)的loglO比率(y轴)的图。对于癌细胞数据,非二倍体区域已经 被掩盖(粉色之间的白色空白),以移除通过将高度非整倍性细胞与原代二倍体细胞进行比 较而产生的偏差。图10A描述了精子池1的管内MDA结果;精子池2的管内MDA结果;以及精子 池1的微流体MDA结果。图10B描述了精子池2的微流体MDA结果;精子池1的mALBAC结果;以及 精子池2的mALBAC结果。图10C描述了 SW480癌细胞的结果(二倍体区域,MALBAC)、神经元核1 的MIDAS结果;以及神经元核2的MIDAS结果。
[0024] 详细描述
[0025]亚纳克量的核酸(例如单细胞的基因组)的扩增可用于多种应用。根据本文的一些 实施方案,提供用于基本无偏差的核酸扩增的方法和制成品。在一些实施方案中,以纳升级 的体积扩增少量的核酸,例如单细胞的基因组材料。纳升级的体积可提供高浓度反应物用 于扩增。所述扩增可包括多链置换扩增(MDA)。在一些实施方案中,在单一反应空间(如孔) 实施所述扩增,因此将移动部分最小化。在一些实施
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1