采用电子显微镜对核酸聚合物测序的制作方法

文档序号:6145058阅读:417来源:国知局
专利名称:采用电子显微镜对核酸聚合物测序的制作方法
技术领域
本发明涉及核酸测序方法。
背景技术
目前,DNA测序大多通过Sanger法和其它合成测序方法来完成。这些方法的缺点 在于成本高、阅读长度短和处理量不足。已经对电子显微镜测序进行了探索。电子显微镜测序的想法并不新。它在DNA结 构被发现仅6年后就由Richard Feynman提出。然而,尚未将其成功用以产生有意义的序 列信息。透射电子显微镜(TEM)通过将电子束穿过样品送至检测器或屏幕上而工作。样品 中的部分阻碍或反射电子束,从而到达检测器的电子图案形成图像。在多数情形中,低原子 数(Z)的原子产生极小的反差并且在电子显微镜中基本不可见。包含低Z的氢、碳、氮、氧 和磷原子的普通DNA在电子显微镜下几乎不显示出反差,并且几乎不可能在承载背景下显 现。为了使用现有电子显微技术使DNA可视化,可以用高Z原子标记碱基或使得其可由TEM 检测。最初的严肃的电子显微镜测序研究由Beer,M.和Moudrianakis,E. N. ,48 (3)PNAS 409-416(1962)进行。他们的最初研究集中于DNA的重原子标记和试图使重原子在电子显 微镜下可视化。后来的研究且可能是迄今最佳的其它研究由Whiting和Ottensmeyer进 行。据Ottensmeyer报道“开发了腺嘌呤和鸟嘌呤的重原子标记物并在模型序列上进行 了尝试,结果仅表明虽然电子显微镜和化学不再是主要障碍,但样本制备仍然是主要障碍。 标记的单链核酸聚合物在样本载体上的不可控安置造成相当不规则的碱基与碱基间距。因 此,无法从单个分子的容易且精确地进行阅读。” (Ottensmeyer, F. P. (1979) ‘‘ Molecular Structure Determination by High Resolution ElectronMicroscopy " Ann. Rev. Biophys. Bioeng. 9129 :129-144(略去内部参考文献))对个体基因组和其它序列进行快速测序的能力对于生物医学极具重要性,且如上 所述,需要改进的方法。

发明内容
本发明提供了使用电子显微镜通过直接检视来对标记的拉伸的核酸如DNA进行 测序的方法。本发明的方法、装置和组合物使得能够可控地将核酸置于基片上从而具有恒 定的碱基与碱基间距,这使得能够使用电子显微镜获取准确的核酸序列信息。本发明可以
7以多种方式实施。 根据本发明的一个方面,DNA聚合链的序列信息的获取方法可以包括提供包含 所述DNA聚合链的溶液,其中已对所述DNA聚合链进行处理从而已用具有碱基特异性或碱 基选择性的造影剂将多个DNA碱基标记;将DNA结合工具引入所述溶液并使所述DNA聚合 物的一部分与该工具结合;将所述工具从溶液中除去;将标记的DNA聚合链在空间内拉伸 从而使该标记的DNA聚合链悬挂于空气/溶剂界面与所述工具之间;将经拉伸的标记DNA 聚合链沉积于基片上;使用电子显微镜使标记的DNA聚合链成像由此确定经标记的碱基和 未经标记的碱基的位置;和将经标记的碱基和未经标记的碱基的位置与DNA聚合物的序列 进行相关。 所述方法还可包括使DNA链变性以便在用造影剂进行标记之前产生单链DNA的步 骤。变性步骤通过热变性或化学变性进行。所述方法还可以包括在所述成像步骤之前将碳 层沉积于与基片相连的DNA聚合链上方。所述方法还可以包括用不同标记对来自DNA聚合 物样品的多个链进行标记并汇集从该DNA聚合物的多个链的成像获取的数据以便获得完 整序列信息。DNA可以为大于约IOOkb的高分子量DNA。拉伸步骤可能在DNA聚合链中产生恒 定的碱基与碱基间距。碱基之间的碱基与碱基间距可以为约3人 约7 A,且特别是约5 A0 DNA聚合链可以被拉伸至至少约2 μ m的长度。可以仅对DNA聚合链的碱基的子集进行标记。碱基子集包括胸腺嘧啶和胞嘧啶。 碱基子集包括腺嘌呤和鸟嘌呤。所述工具可以为针,从而针的尖端已用与DNA聚合链结合的第一涂层功能化。针 可以由玻璃、金、钨、PMMA、聚苯乙烯、PVC或硅制成。所述涂层可以为如PMMA、聚苯乙烯、PVB 和寡核苷酸等化合物。可以采用不与核酸结合的第二涂层对针进行功能化。第二涂层可以 为辛基硫醇、己基硫醇、壬基硫醇、癸基硫醇和庚基硫醇中的至少一种。针尖的曲率半径小 于约200nm。可以使所述针以约1纳米/秒 约100米/秒的速率移进和移出溶液。具体 而言,可以使针以约1 A 约20 μ m的深度进入溶液。造影剂可以为高Z原子标记化合物。高Z原子可以为Os-bipy(Os-bipy)、乙酸汞 和二甲基硫化钼。造影剂可以为高Z原子簇标记。可以通过采用搁板拉线(shelf threading)将DNA聚合链附着于基片。DNA聚合 链可以与载体基片或成像基片相连。可以通过采用搁板拉线将DNA聚合链附着于载体基 片,其后通过采用转印(transfer printing)将该载体基片上的标记的DNA聚合链转移至 成像基片。可以通过采用间隙拉线(gapthreading)将标记的DNA聚合链附着于载体基片, 其后通过采用刷印(swip印rinting)将该载体基片上的标记的DNA聚合链转移至成像基 片。DNA聚合链可以为多个DNA聚合链,且可以作为平行的链阵列被安置于基片上。拉伸的 标记DNA聚合链可以为单链的。根据本发明的一个方面,核酸序列信息的获取方法可以包括通过电子显微镜确定 多个标记的核酸链的每一个的至少1000个毗连碱基区域内经标记的碱基和未经标记的碱 基的位置。特别地,可以确定核酸链的至少1000个毗连碱基的位置,且更特别地可以确定 核酸链的至少10,000个毗连碱基的位置。可以确定至少约20个个体链的经标记的碱基和 未经标记的碱基的位置,可以确定至少约100个多条链的位置,可以确定至少约5,000个多条链的位置,且可以确定至少约10,000个多条链的位置。可以确定来自相同样品的经不同 标记的核酸聚合链的位置。可以确定至少200个毗连碱基、至少500个毗连碱基、至少1000 个毗连碱基或至少10,000个毗连碱基的经不同标记的核酸聚合链的位置。核酸序列可以以至少1,000碱基/秒的速率获得。核酸链在伸长时可能具有约 100 μ m的长度。核酸在碱基之间的碱基至碱基间距可以为3人~约7 A,且特别是约5 KM 酸序列可以为DNA序列。根据本发明的另一个方面,一种制造品可以包含具有多个核酸聚合链的液体、工 具和具有处于该液体中的第一末端和与该工具相连的第二末端的单个核酸聚合链,其中所 述单个核酸聚合链的至少一部分悬挂于所述工具与所述液体之间的空间中。可以将所述核 酸聚合链的碱基伸长从而令碱基具有恒定的碱基与碱基间距。碱基之间的碱基与碱基间距 可以为3人 约7 A。可以将核酸聚合链伸长以使该链为线性的。根据本发明的又一个方面,一种制造品可以包含固体平面基片和位于该平面基片 上至少一个伸长核酸聚合链。所述至少一个伸长核酸聚合链在约1000个碱基对的长度上 具有恒定的碱基与碱基间距。所述制造品还包含安置于所述至少一个伸长核酸聚合物上方 的膜,从而使所述至少一个伸长核酸聚合物夹在平面基片与所述膜之间。所述膜可以由碳 或低Z元素构成。平面基片可以由如PDMS、碳、硼、锂、氢、铍、铝、氮化物、氮化氧化物及其组 合等材料构成。所述至少一个伸长核酸链的碱基与碱基间距可以为3 A 约7 A。多个伸长核酸 链可以基本彼此平行。多个伸长核酸链可以包含约IXlO6核酸链。所述至少一个伸长核 酸链可以拉伸至至少约2 μ m的长度。所述至少一个核酸聚合链可以用至少一个Z标记化 合物进行标记。Z标记化合物可以为高Z原子化合物,例如,Os-bipy、乙酸汞和二甲亚砜合 钼或簇标记。根据本发明的再一个方面,一种使用电子显微镜对核酸链的至少200个毗连碱基 进行测序的方法可以包括用至少一个Z标记化合物对多个核酸链进行标记;将来自含有 多个标记核酸链的溶液的单个标记核酸链结合至工具上;将所述单个标记核酸链在空间内 拉伸从而使该单个标记核酸链悬挂于空气/溶剂界面与所述工具的尖端之间;将经拉伸的 标记核酸链附着于基片;和使用电子显微镜使标记的核酸链成像。所述方法还可以包括在所述标记步骤之前用亚硫酸氢盐对含有多个核酸链的溶 液进行预处理以便将未甲基化的胞嘧啶碱基转化为尿嘧啶碱基。所述方法还可以包括在所 述标记步骤之前使多个核酸链变性以便产生单链核酸。变性步骤可以通过热变性或化学变 性进行。所述方法还可以包括在所述成像步骤之前将碳层沉积于与基片相连的标记核酸链 的上方。核酸可以为高分子量DNA。拉伸步骤在核酸链中产生恒定的核酸与核酸间距。核 酸与核酸间距和标记与标记间距可以为约3 A 约7 A,且特别可以为5 A。核酸链可以拉 伸至至少约25 μ m的长度。仅对核酸链的碱基子集进行标记。碱基子集可以包括胸腺嘧啶 和胞嘧啶。碱基子集可以包括腺嘌呤和鸟嘌呤。所述工具可以为针从而已将针尖用与核酸链结合的第一涂层功能化。该针可以由 如玻璃、金、钨、聚甲基丙烯酸甲酯(PMMA)、聚苯乙烯、PVC和硅等材料制成。所述涂层可以 为如PMMA、聚苯乙烯、PVB和寡核苷酸等化合物。可以采用不与核酸结合的第二涂层对针进
9行功能化。第二涂层可以为如辛基硫醇、己基硫醇、壬基硫醇、癸基硫醇和庚基硫醇等化合 物。针尖的半径可以为小于约200nm。可以使所述针以约1纳米/秒 约100米/秒 的速率移进和移出溶液。可以使针以约Onm 约20 μ m的深度进入溶液。所述至少一个标记化合物可以为高Z原子标记化合物。高Z原子可以为如 Os-bipy、乙酸汞和二甲亚砜合钼等一种或多种化合物。所述至少一个标记化合物可以为高 Z原子簇标记。附着步骤可以包括通过采用搁板拉线将至少一个标记的核酸链附着于成像基片。 附着步骤可以包括通过采用搁板拉线将至少一个标记的核酸链附着于载体基片,其后通过 采用转印将该载体基片上的至少一个标记的核酸链转移至成像基片。附着步骤可以包括通 过采用间隙拉线将至少一个标记的核酸链附着于载体基片。附着步骤可以包括通过采用间 隙拉线将至少一个标记的核酸链附着于载体基片,其后通过采用刷印将该载体基片上的至 少一个标记的核酸链转移至成像基片。根据本发明的另一个方面,将至少一个核酸链受控地安置于基片上的方法可以包 括提供含有多个核酸链的溶液;将针尖插入溶液;将针尖从含有多个核酸链的溶液中提 出,其中已用与核酸结合的第一涂层将所述针尖功能化;将核酸链在空白空间内拉伸从而 使单个核酸链悬挂于空气/溶剂界面与每个针尖之间;并将至少一个拉伸的核酸链附着于 基片。核酸为高分子量DNA。针可以由如玻璃、金、钨、PMMA、聚苯乙烯、PVC和硅等材料制成。第一涂层可以为 如PMMA、聚苯乙烯、PVB和寡核苷酸等化合物。可以采用不与核酸结合的第二涂层对针进行 功能化。第二涂层可以为如辛基硫醇、己基硫醇、壬基硫醇、癸基硫醇和庚基硫醇等化合物。针尖的曲率半径可以为小于约200nm。可以使针尖以约lnm/s 约100m/S的速率 移进和移出溶液。可以使针尖以约Onm 约20 μ m的深度进入溶液。可以将针置于单纳米 定位器驱动的载体上。可以用纳米定位器驱动的载体将多个针同时插入溶液。拉伸步骤在核酸链中产生恒定的核酸与核酸间距。核酸与核酸间距和标记与标记 间距可以为约3人 约7 A。核酸与核酸间距和标记与标记间距可以为5 A。核酸链可以拉 伸至约100 μ m的长度。将附着于基片的所述至少两个核酸链定位来基本彼此平行。附着步骤可以包括采 用搁板拉线来将至少一个核酸链附着于基片。附着步骤可以包括使用间隙拉线来将至少一 个核酸链附着于基片。基片可以为成像基片。所述附着步骤中的基片可以为载体基片。根据本发明的再一个方面,提供了一种对储存于存储器中的核酸序列进行分析的 方法,其中通过下述方式来确定序列用至少一个标记化合物对多个核酸链进行标记;将 来自含有多个标记核酸链的溶液的单个标记核酸链结合至工具上;将所述单个标记核酸链 在空间内拉伸从而使该单个标记核酸链悬挂于空气/溶剂界面与所述工具的尖端之间;将 经拉伸的标记核酸链附着于基片;和使用电子显微镜使标记的核酸链成像。核酸序列是人 类受试对象的基因组序列。所述分析可以包括对一个或多个单核苷酸多态性中的至少一个的存在或缺失、拷 贝数、变异体、得失位、重排或全基因组比较进行确定。所述存储器是选自硬盘或软盘、光学 介质、光盘(⑶)、数字视频光盘(DVD)、半导体介质和闪存的介质。
根据本发明的又一个方面,一种针可以包含远端、近端和在与所述远端和所述近 端接触的液体内延伸的轴,其中所述近端包含曲率半径小于约200nm的尖端部件,且其中 已用与核酸末端结合的化合物将尖端部件功能化。可以用不具有与核酸结合的亲和力的第 二化合物来涂覆针。可以用如PMMA、聚苯乙烯、PVB、硅烷化物、寡核苷酸、端粒和限制位点伸 出物(restriction site overhang)等化合物将尖端部件功能化。针可由如玻璃、金、钨、 PMMA、聚苯乙烯、PVC和硅等化合物构成。可将针安置于单纳米定位器驱动的载体上。考虑到以下详细描述、附图和权利要求,可以使本发明的其它特点、优点和实施方 式得到展示或显而易见。此外,可以理解,以上对本发明的概述和以下的详细描述都是示例 性的并且旨在提供进一步的说明而不限制所要求的本发明的范围。


所包含的提供对本发明的进一步理解的附图并入且构成本说明书的一部分,其对 本发明的实施方式进行图示说明,并与详细描述共同起到解释本发明的原理的作用。并未 试图以超出对于本发明及可以将其实施的各种方式的基本理解所必须的细节来展示本发 明的结构细节。图1是显示根据本发明的原理使用电子显微镜准确地对核酸进行测序的方法的 流程图。图2是显示用涂层1和涂层2功能化的针的示意图,其中涂层1能与核酸链结合 而涂层2不与核酸链结合。图3显示尖针的曲率半径的示意图。图4是显示根据本发明的原理将核酸链在空白空间内伸长的方法的示意图。图片 I显示针尖和含多个核酸链的溶液的液滴。图片II显示移进含有核酸链的溶液的液滴内并 与单个核酸链结合的针尖。图片III显示在空白空间内被伸长的核酸链。图5是显示针尖在含核酸链的溶液液滴内的最大浸入深度(图片I )和最小浸入 深度(图片II )的示意图。图6是显示针尖在含核酸链的溶液液滴内的最小浸入深度的示意图。放大图示意 性显示了与单一核酸链特异性结合的溶液液滴中的针尖,所述单一核酸链可以处在溶液中 或在空气/溶液界面处。图7是显示根据本发明的原理的搁板拉线方法的示意图。图片I显示了浸入含标 记核酸链的溶液内的尖针。图片II显示了从溶液中提离并将所附着的核酸拉伸至空白空间 内的尖针。图片III显示了开始与TEM网格接触的伸长核酸。图片IV和V显示了拉回以将核 酸从尖针的尖端释放的尖针。图8是本发明的搁板拉线方法的示意性图示。图片I显示了采用单针的搁板拉 线,而图片II显示了采用多针的搁板拉线。图9是显示经调整方向而与液滴表面正交的伸长核酸链的示意图。图10是显示伸长于空白空间中的核酸在该链被置于载体基片上时基本沿其长度 与该基片接触的示意图。图11是显示通过近端放下(set down)和随后的更多拉伸而使核酸链延长的示意 图。
图12是显示间隔较近的核酸链(如DNA链)的大平行阵列的示意图,所述阵列可 以通过依次重复受压电执行器(piezo-actuator)控制的浸入、浸出、放下、拖动、提起和平 移的针运动而形成。该图中所绘制的核酸链没有实际实践中的链那么直。图13是显示下述故障模式的示意图其中溶液表面/载体基片/针运动角度的不 正确考虑将引起载体基片与悬挂的链在针尖与基片接触之前的不受控接触,而这反过来会 通过过度拉伸而造成链的断裂。图14是显示下述故障模式的示意图其中错误校正的溶液表面/载体基片/针运 动角度会使得链无法与基片实质上接触,从而使得该链的相当大的一部分留在溶液表面与 针与基片的接触点之间的空白空间中。图15是显示根据本发明的原理的间隙拉线方法的示意图。图16是显示在将核酸沉积至载体基片上之后的根据本发明的原理的转印方法的 示意图。图17是显示在通过电子显微镜成像之前基片上被嵌入顶层的核酸链的示意图。图18是显示用于根据本发明的原理对核酸测序的系统的示意图。图19是显示用于根据本发明的原理对核酸测序的假定系统的示意图,使用本发 明的原理产生了单一锇标记的ssDNA分子的模拟图像。图20是显示替代性制备方法中固有的图像模糊性的示意图。图21是显示简单模式液滴保持器的示意图。
具体实施例方式应该理解,本发明不限于本文所述的特定方法学、方案和试剂等,因为如本领域资 深技术人员可以认识到的那样,这些都可以进行变化。还应理解,本文所用的术语仅用于描 述特定实施方式的目的,而并非旨在限制本发明的范围。还应注意,如本文和所附权利要求 书中所用,除非上下文明确另外指明,单数形式“a”、“an”和“the”包括了复数的指代物。 因此,例如,对一个分子的指代即是对一个或多个分子及其本领域技术人员已知的等价物 的指代。除非另外限定,本文使用的所有技术和科学术语具有与本发明所属领域的普通技 术人员所通常理解的相同的含义。本发明的实施方式及其各种特点和有利细节可以通过参 考非限制性实施方式而得到更全面的地说明,和/或在附图中得到图示说明和在以下描述 中得到详细说明。应该注意,附图中所示特点不一定是按比例绘制的,并且即使在本文中未 明确指出,一个实施方式的特点也可以如本领域资深技术人员所认识的那样由其它实施方 式所采用。本文所述的任何数值包括从低值至高值的以一个单位递增的所有值,条件是在任 何低值和任何高值之间具有至少两个单位的间隔。举例而言,如果据说明组分的浓度或如 尺寸、角度大小、压力和时间等过程变量值是例如1 90、特别是20 80、更特别是30 70,其意图在于将诸如15 85、22 68、43 51、30 32等值明确在本说明书中列出。对 于小于1的值而言,根据情况认为一个单位是0. 0001,0. 001,0. 01或0. 1。这些仅仅是特别 计划的实例,而在所列出的最低值与最高值之间的所有可能的数值组合都应被认为是以相 似的方式明确在本申请中得到陈述。
12
此外,以下紧接着提供了“定义”部分,其中具体定义了与本发明相关的某些术语。 对特定的方法、装置和材料进行了描述,但与本文所述的那些方法和材料相似或等价的任 何方法和材料都能用于实践或测试本发明。本文通过参考并入本文所提及的所有参考文献 的全部内容。定义A是腺嘌呤。C是胞嘧啶。G是鸟嘌呤。T是胸腺嘧啶。U是尿嘧啶。ssDNA 是单链 DNA。AFM是原子力显微镜。C⑶是电荷耦合器件。CMOS是互补金属氧化物半导体。DMSO是二甲亚砜。EDTA是乙二胺四乙酸。HAADF是高角度环形暗场。IMPREST是单个分子布局空白空间拉线。PFGE是脉冲场凝胶电泳PFGE。Os-bipy是四氧化锇2,2,- 二吡啶。PDMS是聚二甲基硅氧烷。 PLD-UHV是脉冲激光沉积-超高真空。PMMA是聚甲基丙烯酸甲酯。PMT是光电倍增管。PVB是聚乙烯醇缩丁醛。SEM是扫描电子显微镜。STEM是扫描透射电子显微镜。TE 是 Tris EDTA。TEM是透射电子显微镜。UHV是超高真空。本文所用术语“Z”是指原子核中的质子数,也称作原子数。“高Z”是指原子数较 大,然后薄膜成像,但对实际测序而言意味着高于约30、优选高于约70或更优选高于约90。本文所用术语“恒定”通常是指在拉伸的核酸链的整个长度上,拉伸的核酸链的碱 基之间的间距相对而言相同。碱基“之间”的间距通常是从中心至中心的距离,或从磷酸根 至磷酸根的距离。当可以在例如约50个碱基、约100个碱基、约1000个碱基或约10,000个 碱基的特定长度上确定核酸链的电子显微图像中标记的碱基和未经标记的碱基的顺序时, 碱基的间距是恒定的。本文所用术语“Btt连”通常是指核酸链中的碱基均处于公共边界内并且没有间断 地相连。
13
本文所用术语“连续”通常是指核酸链中的碱基以未中断的连续性或顺序彼此相接。短语“多个链”、“多个核酸链”和“多个DNA链”等是指2个链、5个链、10个链、100 个链和1000个链等等。本文所用术语“载体基片”是指伸长和/或拉伸的核酸聚合物可以与其相连的任
何基质。本文所用术语“成像基片”是指将被直接用于电子显微镜成像的基片。成像基片可 以被置于显微镜内,并且必要时可以支撑成像薄膜。成像基片可以包括多孔或微孔弗姆瓦 网(lacey formvar mesh)、其它聚合物网、带孔氮化硅薄膜和其它合适类型的网格。成像基 片通常比成像薄膜厚,但必须可支撑纤巧的成像薄膜。本文所用的成像基片可以指成像薄 膜和保持其的载体结构体,或仅指载体基片。参见描述电子显微镜的一般方法的M.Hayat, Principles and Techniques of Electron MicroscopyBiological Applications,第4片反。本文所用术语“成像薄膜”是指以下物质的薄层碳、硼、锂、氢、铍、铝或其它低Z 元素和/或其氮化物和氧化物以及它们的任何组合。该薄层的厚度为约0. 2nm 约30nm。 成像薄膜可以被支撑在成像基片或其它表面上。术语“基本平行”通常是指两条直线从不相交的几何概念。本文所用的基本平行 是指伸长的核酸聚合物在其中序列数据待确定的区域内不相交或交叉。本文所用术语“核酸”包括寡核苷酸和多核苷酸,以及源自基因组、重组或合成的 可以为单链或双链并且代表正义或反义链的DNA或RNA,或指源自天然、重组或合成的任何 DNA样或RNA样材料。本文所用术语“互补”包括在许可的盐和温度条件下通过碱基配对而成的多核苷 酸的天然氢键。例如,序列“A-G-T”与互补序列“T-C-A”结合。两个单链分子之间可以是部分互补的,其中仅核酸的某些部分结合,或者在单链 分子之间存在完全互补性是可以是完全互补的。核酸链之间的互补程度对于核酸链之间的 杂交的效率和强度具有显著影响。本文所用术语“样品”是指包含核酸的生物材料,例如来自人或动物的组织或液 体,包括但不限于血浆、血清、脊髓液、淋巴液、皮肤的外部部分、呼吸道、肠道和泌尿生殖 道、泪液、唾液、血细胞、肿瘤、器官、组织,以及来自植物、真菌、细菌、病原体和体外细胞培 养物的样品。样品可以获自任何含有核酸的物种,在系统发生学上涵盖了所有病毒、原核生 物和真核生物。样品还可以包含已使用如固相合成等本领域内的已知技术进行人工合成或 使用例如PCR进行体外合成的核酸。本文所用术语“大约”是用于描述值的范围,可应用于该范围的上限和下限。例如, 短语“约10 100”与“约10 约100”具有相同含义。而且,当指代距离时,术语“大约” 通常是指士 10%。例如,短语“约5nm”是指5nm士 10%。本文所用术语“造影剂”、“标记”或“标记化合物”通常是指其原子数(Z)和/或密 度和/或积分电子散射比成像薄膜材料和未标记的DNA更高的原子、分子、簇或材料。“造 影剂”、“标记”或“标记化合物”可以是具有与核酸链自身的碱基不同的对比度并且与该核 酸链相连的化合物。本文所用术语“簇”通常是指包含两个以上的高Z原子且与核酸链以碱基选择性
14或碱基特异性方式相连的化学结构。MM本发明广泛地涉及通过使用电子显微镜直接检视标记的拉伸核酸来确定核酸序 列的方法、装置和制造品。在一个具体实施方式
中,本发明涉及包括使用工具将单核酸链从 溶液中拉出而受控地将核酸置于基片或载体上。本发明的方法使得可以获得比现有测序技 术更高的准确率、更低的成本和更长的阅读长度。例如,本发明的测序方法使得可以使用电 子显微镜准确地确定核酸样品的至少约20个连续核酸碱基、优选至少约50个连续核酸碱 基、更优选至少约1,000个连续核酸碱基、再更优选至少约10,000个连续核酸碱基、进而更 优选至少约100,000个连续核酸碱基且再更优选至少约1,000, 000个连续核酸碱基。在此 上下文中的“连续碱基”是指所分析的DNA起始材料中的碱基的顺序。使用本发明的方法还可以比使用合成方法更快地产生序列。本发明的方法(与 高速EM组合)可以允许至少约10,000碱基/秒、优选至少约100,000碱基/秒且更优选 至少约200,000碱基/秒的成像。例如,使用TEM成像可以以约Iym2/秒的高分辨速率使 根据本发明排列的DNA链样品成像。含核酸链的1 μ m2区域可以在1秒中成像,对应于约 500,000碱基/秒的成像速率。图1是显示根据本发明的原理使用电子显微镜准确地对核酸进行测序的方法的 流程图。该图供以图示说明而非意在限制本发明。在步骤102中,从含有核酸序列的受试 对象获取含核酸样品。在步骤104中,使用本领域技术人员已知的技术将感兴趣的核酸从 样品分离。在步骤106中,采用例如高Z原子对所分离的核酸的特定碱基进行标记以产生 经高Z原子标记的核酸聚合物。在步骤108中,将核酸聚合物拉伸至空白空间内以便确保 恒定的核苷酸的碱基至碱基间距。在步骤110中,将核酸聚合物与载体附着并以非重叠图 案铺设(例如,基本相对彼此平行)。在步骤112中,通过电子显微镜将所附着的核酸聚合 物成像以便沿该聚合物确定标记的位置。通过检测器(例如,CCD或CMOS照相机或者PMT) 捕获图像并记录标记的位置,通常将其记录于计算机可读介质上。在步骤114中,采用算法 来使用间距信息以确定来自核酸聚合物的碱基序列信息。下文将对这些步骤进行更详细的 描述。核酸的制备在步骤104中,可以使用本领域公知的方法将感兴趣的核酸分离,具体方法的选 择取决于核酸的来源和性质以及相似的因素。感兴趣的核酸可以为天然存在和/或源自基 因组、不是源自合成或重组,并且可以包括双链或单链的寡核苷酸或多核苷酸。替代性地, 感兴趣的核酸链可以源自重组或合成,其可以为单链或双链。在一个具体实施方式
中,核酸 是DNA,且具体而言是大于约100千碱基的极高分子量DNA。在某些实施方式中,高分子量 DNA的长度至少为300千碱基。极高分子量的分离用方法是已知的(参见例如,Murry和 Thompson,1980, Nucleic AcidsResearch 10 :4321_4325 ;和 Kovacic,R.等,1995,23 (19) Nuc. Acids. Res. 23 (19)3999-4000)根据一种方法,将极高分子量DNA从嵌入于琼脂糖块中的真核细胞中分离以使剪 切最小化。通过PFGE将DNA与其他细胞组分分开,随后从琼脂糖中以约0. Olng/ μ 1 约 0. 5ng/μ 1 电洗脱至TE缓冲液。可以使用本领域技术人员已知的热变性或化学变性方法 将DNA从双链形式变性为单链形式。参见Barnes,W.,91PNAS 2216-2220(1994)。例如,可以通过在2分钟内将DNA样品加热至94°C来进行双链DNA的热变性。变性步骤可以在标记 之前进行,也可在将核酸拉线(threading)之前进行。理想的是,如果使用ssDNA测序则在 标记之前将dsDNA转化为ssDNA,但这不是必须的,并且可以如本领域资深技术人员所理解 的来标记dsDNA。核酸标记在步骤106中,采用如高Z原子等造影剂来标记核酸的特定碱基以便通过电子显 微镜进行高效检测。应该使核酸与电子致密原子以至少部分碱基特异性方式结合。部分碱 基特异性的造影剂或标记(即“碱基选择性”)会与4种DNA或RNA碱基的一种或多种比 其它碱基更优选地结合(例如,将A强染色,将G较弱染色,完全不将T染色)。如果造影 剂基本仅与一种碱基(例如A)或序列(例如,特定的二聚体序列)结合,则其为完全碱基 特异性的。已知有相当多的DNA标记用方法并且它们可以用于本发明中。例如,Whiting 等,474BI0CHIMICA ET BIOPHYSICA ACTA334-348(1977),Jelen 等,10GEN PHYSIOL BlOPHY 461-473(1991 和 Dale 等,14(11)BIOCHEMISTRY 2447-2457(1975)描述了碱基特异性和 / 或碱基选择性重金属染色方案,本文通过参考特意并入其全部内容。本发明不应被视为受 任何特定的核酸标记方法的限制,且如本领域技术人员所理解,许多方法已在科学文献中 得到描述。根据所用方法,可以用不同的高Z标记化合物将每种核酸碱基专有性标记,可以 用不同的高Z标记化合物来标记核酸碱基的选定子集,或可以用如Os-bipy等相同高Z标 记化合物来标记核酸碱基的选定子集(如下所述)。根据一个具体实施方式
,用不同的Z标 记化合物来专有地或优选地标记每种DNA碱基(例如,A、G、C和T)。在本发明的方法中可 以采用各种各样的高Z标记化合物,包括但不限于包含Pt、Hg、I、Rh、Au、Ir、Ag和Os等的 化合物。可以例如基于高Z标记剂的差异或高Z试剂和未经标记的碱基之间的差异来区分 不同碱基,这几乎应该是不可见的。例如,Os-bipy和碘可以基于其散射截面来区分。此外, 例如,可以将与所有A碱基结合的Au原子和与所有G碱基结合的3个Au簇区分开。由于在本发明的方法中TEM成像检测具有恒定碱基间距的各种非重叠DNA链,因 而标记的保真度不是非常重要。因此,本发明的方法的一个优点在于,可以对核酸进行化学 标记,并且对于给定的反应批次不必将每个链的所有靶标碱基都标记(例如,当使用T特异 性标记时,不必将链中的每个T均标记)。由于可以将相同链的多个图像组合来确定基本序 列(这是由于可以确定标记碱基之间的未经标记的碱基的数目),因而完全的标记准确性 不是必要的。举例而言,考虑在一批DNA中出现20次的具体基因组序列(即,在该批次中 存在共享对于该位置共有的区域的20个分子)。例如,可以将该批次调节来含有总DNA的 约20个基因组等价物。假设序列中的特定位置的碱基身份是T,即所有20个在该位置均 含T。使含有这些分子的DNA批次进行特定的反应条件,所述反应条件已知会标记90% 100%的任何给定T并且标记0% 10%的任何给定A、C或G。在成像时,在此情形下可将 该位置视为在19个分子中被标记,而一个分子中未经标记。同样,可以使一个分子中的“A” 被标记,而在19个分子中未标记。机率性处理可以以极高的准确性将对基因组中的所述位 置指认出正确的身份。在该情形中,19/20个分子中标记的位置的身份是“T”,而1/20个分 子中标记的位置的身份不是“T”。此外,通过本领域技术人员已知的机率性处理可以实现序 列的指认和联接。
本发明的另一个优点在于,可以推导出互补链的序列信息,这也为给定碱基的确 定的有效性提供了额外的统计支持,即,一个分子上的T的位置的高置信度与互补链上A的 位置的高置信度相互密切联系。因此,例如,在来自就标记化学而言仅允许对T的良好区分 的化合物/反应条件批次的序列中,可以肯定地确定所有A和T的位置。每条链上标记的 T限定了互补链上的A的位置。因此,在某些实施方式中,仅将核酸碱基的子集标记。例如,以至少部分碱基特异 性的方式将DNA的等分试样分别标记。在一种方法中,使含多个核酸分子的溶液在以下条 件下反应至少约70%、有时至少约80%且有时至少约90% 约100%的一种或多种特定 核苷酸碱基(A、T、G或C)被标记,而少于20%、优选少于10%的至少一种核苷酸碱基被标 记。例如,使溶液在以下条件下反应约90% 约100%的T和C被标记而仅很小百分比的 A和G被标记。在一个实施方式中,可以使用不同条件以Os-bipy将DNA等分试样标记以便获取 不同的碱基特异性标记密度(参见下文实施例1)。在该方法中,将感兴趣的DNA分离并分 为两个溶液,即溶液1和2,每个溶液中的浓度为约0. Olng/μ 1 约Ing/μ 1。使用不同条 件(如下文所进一步详细描述)使每个溶液与Os-bipy反应以便获取不同的碱基特异性标 记密度。此外,对选定的溶液在与Os-bipy反应之前进行预处理,例如,亚硫酸氢盐处理,如 以下和下文实施例1中所述。使溶液1在26°C与pH 8. 0的TE缓冲液(具有IOOmM Tris和IOmMEDTA)过量4倍 摩尔的四氧化锇和2,2’ - 二吡啶反应20小时,这些条件标记了约100%的T、约85%的C、 约7%的G和约0%的A。使溶液2在与溶液1相同的条件下反应,不同之处在于反应仅进 行15分钟,且仅使用过量2. 5倍摩尔的四氧化锇和2,2’- 二吡啶,这些条件标记了约90% 的T、约8%的C、约5%的G和约0%的A。如下所述,使用本发明的方法,可以将这些结果 与经较短温育时间反应获得的那些结果相比,由此确定C的碱基特异性模式,甚至于确定 互补链的G的碱基特异性模式。甚至还可以使用本发明的方法来确定T的碱基特异性模式 乃至于互补链的A的碱基特异性模式。因而,可以使用采用两种反应条件的单一标记化合 物来确定T、A、G和C的模式。还可理解,本发明允许使用Os-bipy来确定胞嘧啶甲基化的模式。在此情形中,使 用4个等分试样(溶液1、2、3和4)。将溶液1和2如上文溶液1那样处理,将溶液3和4如 上文溶液2那样处理。然而,在进行Os-bipy反应之前,首先对溶液2和4进行亚硫酸氢盐 处理以便将未甲基化的C残基转化为U。这使得可以通过对来自用亚硫酸氢盐处理过的溶 液与来自未经处理的溶液的序列的比较而确定甲基化模式。参见Jelen等,IOGen. PHYSI0. AND BI0PHYS 461-473(1991)。在与Os-bipy的反应中的不同条件下,甲基胞嘧啶和U都 具有不同于4种典范碱基的标记效率的标记效率。因此,为了推导出基因组样品的后成修 饰(印igeneticmodification)信息,可以在未用亚硫酸氢盐处理的DNA的环境中确定甲基 胞嘧啶的碱基特异性模式,或可在亚硫酸氢盐处理之后的测序环境中确定U的模式。在进 行标记反应后,通过超滤或透析除去未标记的锇以使成像过程中的外源性重原子污染最小 化,并将DNA聚合物在pH 8的TE缓冲液中稀释至约0. Ing/ μ 1。许多其它高原子的碱基特异性高原子标记方法是本领域技术人员所已知的。一 些实例如下=Beer和Moudrianakis描述了使用与铀酰粒子偶合的重氮盐化合物来进行鸟
17口票呤残基的标记(Beer, Μ.和 Moudrianakis, Ε. , Determination of Base Sequence in Nucleic Acids with the ElectronMicroscope 48 (3)PNAS,409—416(1962))。 Robert Whiting使用Pt-DMSO[二甲亚砜合钼,KPtCl3 (DMSO)]来实现适于鉴定腺嘌呤核苷酸的不 同标记(Studies of Nucleic Acid Sequences by Dark Field Electron Microscopy, 博士论文,(1975), University of Toronto, School of Graduate Studies)。Dale 及 其合作者报道了使用乙酸汞对胞嘧啶残基进行汞化(Direct covalent mercuration ofnucleotides and polynucleotides, Dale, RMK 等,14BIOCHEMISTRY,2447-2457 (1975))。 另一种DNA标记方法是首先将其以碱基特异性方式进行共价修饰从而其在经修饰的碱 基处接受重金属标记。该方法的一个实例由Seth Rose描述,他用氯乙醛修饰腺嘌呤和 胞嘧啶残基从而乙酸汞或四氧化锇能随后与这些残基结合(Rose,SD.,Mercuration of Modified NucleotidesChemical Methods Toward Nucleic Acid Sequencing by Electron Microscopy,361 B10CHIM. BIOPHYS. ACT.,231-235(1974))。在另一个实施方式中,可以在本发明的方法中采用簇标记。簇标记(cluster label)是含有多于一个重原子的化合物。簇标记可以在利用可提供足够的碱基与碱基间隔 的拉伸方法的方案中使用。为了获得不受邻近的附着的簇的空间位阻的限制的序列数据, 足够的间隔是必需的。可以将簇与寡聚物相连,然后使寡聚物与DNA通过互补碱基配对而 杂交。以这种方式,可以使用电子显微镜对互补序列进行定位。为了有效地获取完全序列 数据,可以将来自不同批次的与未知序列杂交的极短的簇标记寡聚物(三聚物和四聚物) 的成像的信息合并。具体而言,极短的簇标记寡聚物的长度可以为约5 约20个碱基。能 直接标记未经修饰的DNA(即具有天然碱基组成而没有非天然碱基的DNA,所述非天然碱 基含有可以增加簇标记的效率的官能团)的簇包括如Rosenberg等,689J. 0RGAN0METAL. CHEM. 4729-4738 (2004)所述的三锇化合物。在DNA链的簇标记中,特定的经修饰的核苷 酸具有如氨基烯丙基或巯基等官能团,这些官能团使得可以与如来自Nanoprobes Inc. (Yaphank, NY)的单马来酰亚氨基十一金等商购簇标记试剂反应。可以用以碱基特异性或 碱基选择性方式与DNA反应的连接子功能化的商购簇标记试剂包括十二烷羰基三锇、十二 烷羰基三钌和十二烷羰基四铱(三种试剂均可获自Sigma Aldrich Corp.,St. Louis, MO) 和单马来酰亚氨基i^一金(Nanoprobes,见上)。通过在溶液中拉伸的DNA上进行标记反 应,可以更有效地进行具有受到空间位阻的簇的簇标记。还可以在细管(直径为约30nm 约Iym)内进行标记,其中用已知技术将DNA在管或毛细管内在溶液中伸长(Chan,Ε.和 Goncalves,N.,14 (6) GENOME RES. 1137-1146 (2004))并与标记反应。该方法的优点是避免 具有超过一个结合位点的标记(例如,纳米金)的交联。在一个实施方式中,可以将簇标记用作造影剂,而使用已知可碱基选择性或碱 基特异性地修饰核酸聚合物的化学连接结构,可以将已知簇以碱基特异性或碱基选择性 方式与核酸聚合物相连。该簇标记方法可以称作“搭载(piggybacking)”。搭载可以以 如下方式进行,例如,可以使用乙酸汞来将胞嘧啶汞化,如Dale,R.等,14BI0CHEMISTRY 2447-2457 (1975)中所述,并且可以通过使经汞桥连的三锇簇(mu3-eta2-c2-t_Bu) 0s3(C0)9(mu-Hg)I乙酰化来用乙酸汞部分制备可与胞嘧啶连接的簇化合物,如 Rosenberg, Ε.等,100RGAN0METALLICS203-210 (1991)中所述。作为搭载的另一个实例, 已知邻菲罗啉可与四氧化锇形成复合物,该复合物可用作碱基选择性标记(Paecek,Ε.等,J. 13(3) BI0M0L. STRUCT. DYN. 537-546(1995))。5-氨基邻菲罗啉(Polysciences, Inc., Warrington PA)可经由其环外氨基与二苯基膦丙酸的琥珀酰亚胺酯(Argus Chemicals SRL,Vernio,意大利)相连。可以通过本领域技术人员已知的技术来将膦与数种簇化合物 中的任一种连接(Cheng等,127J STRUCT. ΒΙ0. 169-176 (1999)。作为搭载的再一个实例, 可以用如磺酸酯等烷基化部分来衍生簇化合物。相关合成步骤描述于Susan Ermer等, J. 0RGAN0MET. CHEM.,(1980),187,81-90中。用以对核酸聚合物进行烷基化的磺酸酯如 Yi-Zhang 等,32 (31) BIOCHEMISTRY 7954-7965(1993)中所述。本发明提供了通过确定核酸(例如,DNA)链的指定区域中的选定碱基的位置序列 来获取核酸聚合物的序列信息的方法。序列信息是指标记的碱基和未经标记的碱基的一种 或多种核酸碱基的位置是已知的,而位置序列是指至少一种碱基(例如,T)相对于其它碱 基的位置是确定的。例如,在其中T被标记的25个碱基的DNA链中,25碱基区内的位置序 列可以描述如下Τ000Τ0000ΤΤΤ00Τ00Τ000Τ00Τ其中,“0”是除T以外的碱基。因此,对T和非T的位置的检测使得可以确定T的 位置序列。从本说明书可以理解,T和/或C和/或G和/或A或其组合的位置序列可以 得到确定。本发明的方法提供了以至少70%的准确性、替代性地至少80%的准确性且通常 至少90%的准确性来确定单个核酸链中至少一种碱基的位置序列的方法。可以确定包含 至少100个 至多1,000, 000个碱基、有时200个 1,000, 000个碱基、有时1,000个 1,000,000个碱基、有时10,000个 1,000,000个碱基的区域中的位置序列。在某些实施方 式中,确定了链的至少200个、至少1000个、至少5000个、至少10,000个、至少100,000个 或至少1,000,000个碱基的区域中的位置序列。在一个实施方式中,确定了包含1000个 100,000个碱基的区域中的至少一种碱基的位置序列。所述方法的准确性可以通过对已知 序列的DNA的再测序而确定。“位置序列”是序列信息的一种类型。从本公开显而易见,通过比较各个碱基(或 碱基组合)的位置序列可以获得更完整的序列信息,包括链或基因组的区域内的所有4种 碱基的位置序列(即完整序列)。有利的是,本发明的测序方法不依赖于将修饰的核苷酸引入DNA或核酸链。尽管 该方法与经酶促引入的标记(例如,在聚合期间引入)相容且可以与其共同使用,但该方法 更常与经过分离并直接标记(使用例如上文和文献中所述的标记)的天然存在的DNA链共 同使用。此外,本方法使得可以(但不是必须)针对单链DNA而非双链分子来确定序列,由 此消除了采用其它方法可能产生的模糊性。核酸悬挂在步骤108中,将各个核酸聚合物拉伸至空白空间中以确保核酸链内的恒定的碱 基与碱基间距。根据一个实施方式,各DNA链在空间内被伸长(S卩,链的相当大部分长度未 受基片支撑或者未悬浮于溶液或缓冲液中)。然后可以将基本不含溶液或缓冲液的悬挂的 DNA转移至成像基片进行成像。该过程可以称作DNA拉线(DNA threading),下文将详细讨 论。DNA在空白空间内的悬挂导致了核酸聚合物的恒定的碱基与碱基间距。在概念上, 这类似于用两手抓住弹簧的两端并拉伸以使弹簧的每一环与相邻环因其经受相同量的力而具有相同的距离。这导致电子显微镜中可见的重原子标记以如下方式被间隔开该间距 对应于其沿核酸聚合物的实际间距并且对应于其所连接的特定碱基的间距。而且,可以基 于所述恒定间距来确定未经标记的碱基的位置。在一个具体实施方式
中,使用附着着DNA链的末端的工具将DNA悬挂。可以将该 工具浸入含多个核酸链或单个链的溶液(通常为小液滴),核酸链会优选与工具的尖端结 合,并随着将工具提拉出溶液,核酸分子就被悬挂于空间中,从而核酸链的第一末端处于溶 液中而核酸的第二末端与所述工具相连,并且末端之间的区域(“悬挂区”)被悬挂于空间 中。可以理解,DNA分子的“末端”不必受溶液中该分子的物理末端(例如,5’磷酸根和3’ 羟基)的限定。例如,140kb的分子其一端的20kb可以处于液滴中,IOOkb处于悬挂区中, 而另一端的20kb与针结合。将核酸链悬挂以使核酸聚合链的碱基伸长,从而具有恒定的碱 基的碱基与碱基间距。具体而言,碱基与碱基的间距或周期性在碱基之间为约3人 约7A, 其可从每个磷酸根的中心至中心测定。在一个实施方式中,液滴的体积可以为约0.5μ 1 约50μ 1,有时体积为约 1μ 1 约25 μ 1,有时体积为约1μ 1 约15 μ 1,有时体积为约1 μ 1 约10 μ 1,而有时体 积为约1μ 1 约5 μ 1。在一个实施方式中,可以将单个核酸聚合链悬挂于工具与液体之间的空间中。可 以使核酸聚合链的碱基伸长以便具有恒定的碱基的碱基与碱基间距。碱基与碱基间距在碱 基之间可以为约3 A 约7 Α,且特别为约5 Α。可以将核酸聚合链伸长以使链为线性。用于将DNA分子牵拉至空白空间中(例如,从液滴中牵拉出)的工具可以是各种 装置的任何一种,条件是它可用于结合单一核酸链并将其悬挂于空间中。在某些实施方式 中,该工具可以是尖针、中空针、或磁性探针所采用的具有结合核酸的亲和力的小的(即直 径小于约300nm)磁性颗粒。在一种方法中,所述工具是尖针。尖针可由如玻璃、金、钨、PMMA、聚苯乙烯、PVC、 硅或任何其它适合的可制成极尖的针的物质等材料构成。针尖可以通过本领域普通技术人 员已知的技术容易地制备,例如,使用标准拉针器(pipette puller)、微细加工(Handbook of Microlithography, Micromachining & Microfabrication, P. Rai-Choudhury, SPIE OptiaclEngineering Press,1997)、生长或模塑和浇铸。例如,玻璃针可以通过在乙醇火焰 上加热玻璃纤维(直径大约与微毛细管相同)的中部并从该纤维的任何一端进行拉伸而制 成。替代性地,可以使用标准拉针器。在一个实施方式中,如图2所示,针200具有包括直 径小于约200nm的尖端206的近端202、远端204和伸展于近端与远端之间的轴208。尖端 206的直径为小于1 μ m、至多约1 μ m或大于约1 μ m。尖端直径可以使用SEM确定。端部曲 率半径可以以几何一致性方式测定,例如,可以鉴定出尖端处的圆形区域并可插入与该曲 率匹配的假想圆,然后通过测定从该圆的圆心至圆周的距离来测定其半径。在某些情况下, 针的末端处的圆弧仅大致近似于圆的外边缘(图3)。在其它情况下,针的末端被折断而类 似于阔约20nm 约500nm的平面台面。优选直径可以为小于约300nm。可以通过涂覆优选与核酸末端结合的材料来将针尖功能化,所述材料可以包括但 不限于PMMA、聚苯乙烯、PVB、如硅烷化等化学处理、与基因组序列或限制位点伸出物互补 的寡核苷酸或多核苷酸(寡聚物可以拥有如肌苷等简并匹配碱基,从而允许更大的选择范 围)、具有对特定序列或结构的高亲和力的适体、具有对如生物素等分子的高亲和力的抗生物素链霉亲和蛋白或其它蛋白、或者任何其它适合的可特异性地与核酸末端相连的材料。 在一个具体实施方式
中,可以通过将针尖浸入约0. 5%的PMMA丙酮溶液并在丙酮饱和的空 气中干燥来用PMMA涂覆针尖。在另一个实施方式中,可以用第二涂层来涂覆针尖以限制核酸可以结合的区域, 且该第二涂层可以包括如辛基硫醇、壬基硫醇、十六烷基硫醇或其它线性烷基硫醇链等材 料。在图2中,涂层1与DNA的末端结合,而涂层2不结合或较不积极地结合。例如,在一种 方法中,可以将金针尖浸入聚苯乙烯溶液,然后使聚苯乙烯仅在极尖端处在电子束中交联。 随后,可以通过本领域技术人员已知的方法(例如,浸入丙酮或氯仿)来将未交联的聚苯乙 烯从针的其余部分除去。然后可将针浸入辛基硫醇溶液,该辛基硫醇溶液在金上而不在聚 苯乙烯上形成多个单层。DNA的末端不会与辛基硫醇区域结合。在再一个实施方式中,可以使用磁性纳米颗粒寡核苷酸来特异性地标记核酸聚合 链的末端。在该方法中,将具有磁化末端的工具浸入含有经磁性标记的核酸聚合链的溶液 中并与经纳米颗粒标记的核酸聚合链的单个分子的末端结合。随着磁化工具被拉出溶液, 核酸分子被伸长并悬挂于空间中从而核酸链的第一末端处于溶液中而核酸的第二末端与 该工具相连。核酸链被悬挂来使得核酸聚合链的碱基被伸长从而具有恒定的碱基的碱基与 碱基间距,且具体而言,该碱基与碱基间距在碱基之间为约3人 约7 A,且特别为约5入。在一个实施方式中,尖工具可以是中空针。特别地,可以采用本领域已知技术来制 造中空微型针,从而可以经由内孔(bore)泵入核酸溶液。随后,可以将该微型针与具有对 核酸末端的亲和力的载体基片接触或与更尖的聚合物涂覆固体针接触,以便直接从中空内 孔中拉线。因此,中空微型针可以充当直接拉线工具并充当精确溶液控制用通道。所述内 孔可以通过本领域已知技术制成,从而仅一条链会沿内孔程度方向进入并协助控制核酸线 (nuclear acid thread)浓度。这种使用中空针的技术与使用尖工具将DNA从溶液中拉出 相一致。使用中空针的区别在于溶液的表面和形状恰巧极小并受到中空针壁的限制。将尖针功能化后,将核酸“拉线”或附着于尖针上。在一个实施方式中,通过将功 能化尖针浸入和浸出DNA聚合物溶液来进行DNA拉线,从而如图4所示将DNA链拉出至空 白空间中。针尖可以以约Inm/小时 约10m/s的速率、特别是1 μ m/s 约10mm/s的速率 移入和移出溶液。应该理解,被拉出的DNA链保持与DNA溶液表面正交。纳米定位器、包括 压电执行器(如AFM中所用那些)可以用于以次埃级精度来控制针的位置和运动(使用 高品质反馈机制)。纳米定位器是本领域中已知的,例如美国专利第5,903,085中所述,且 可商购自Piezosystem Jena(德国)。影响有效的单链拉线的变量包括溶液温度和pH、周 围环境的湿度、溶液中的标记ssDNA浓度、针浸入和浸出溶液的速度、针在溶液中的停留时 长、针的尖锐度以及针浸入溶液时的深度和进入角度。“浸入”距离是可以控制与针相连的DNA量的变量(图5)。例如,对于浓度为约 0. Olng/μ 1 约0. 5ng/ μ 1的高分子量DNA而言,针浸入的深度可以为进入溶液约1人 约 20 μ Hi0在一个实施方式中,采用浅浸入(图6)。采用浅浸入可以将针以极短的距离(例 如,小于约Iym)量置于溶液中以便限制可供链结合的针表面积。可以将多个针和/或自 动系统用于针的拉线。另一个变量是针在溶液中停留的时间量。与尖端相连的核酸分子的数目可以通过 控制允许尖端在溶液中保持的时间量来调节。对于给定溶液而言,更长的针留置时间会导致更多的附着,而更短的时间会导致更少的附着,所述附着是分子在溶液中扩散并与针相 连所需的时间的函数。该时间范围可以从少于约Ins至数秒或数分钟变化。例如,可以将大量超尖针置于单个纳米定位器驱动的载体上并间隔紧密从而单次 浸入运动能同时拉出大量链并具有足以避免链间的干扰的间隔。并联的针或“针床”也可 以通过本领域技术人员已知的微细加工技术制成。一旦核酸附着于针上,即将针拉出溶液,由此将核酸碱基拉伸至空白空间中以确 保碱基之间的恒定间距。伸长的核酸的碱基与碱基间距应为约3人 约7 A,且特别为约 5 A。然而,不应认为碱基的间距被专门限制于该范围,因为适当的碱基间距将取决于多种 因素,诸如是否通过使用搁板而将核酸进一步拉伸(如下所述)。作用于空气-水界面与针 尖之间的力自身可以导致约5 A的碱基与碱基间距或约65pN的力。空白空间中特定伸长 链的总长度将对应于链中碱基数乘以平均碱基与碱基间距。例如,假设碱基与碱基间距为 5 A,长约10,000, 000碱基的链可以被拉伸至约5mm的长度。可以将核酸链拉伸至约20nm 的长度,有时为约IOOnm的长度,有时为约200nm的长度,有时为约1 μ m的长度。应该注意, 必须考虑到具体的核酸库中的长度分布。如此才能使不会将链从溶液中完全拉出,从而空 气-溶液界面处的弯月面力能继续在远离针尖的链末端处施加张力。对于含有长度较长的 核酸聚合物的溶液而言,相对于含有长度较短的核酸聚合物的溶液,核酸链可以被拉出至 离溶液更远的距离。可获得恒定碱基与碱基间距的足够伸长度是核酸分子的分子量的线性 函数。在具体实施方式
中,可以将核酸链拉伸并伸长至至少约2μπι的长度,更特别地是至 少约25 μ m的长度,再更特别地是至少约50 μ m的长度,进而更特别地是至少约100 μ m的 长度。由于参与核酸拉线的力不会破坏共价键,因而核酸不会在拉线过程中断裂。作用 于空气_水界面处的弯月面力强至足以瓦解二级结构,但尚未强至足以破坏共价键。如果 将拉线装置安置并编程来使得施加超出将DNA拉出溶液所需的额外力,则必须谨慎而勿使 DNA断裂。在许多实施方式中,理想的是使蒸发最小化和/或控制液滴的位置和角度。在最 简模式中,将液滴保持静止并小心地安置和配置PDMS保持器部件。在图21中,图片I显 示了液滴向网格保持器部件的靠近。图片II显示了保持于两个PDMS部件之间而使液滴会 保持拉线表面前端的液滴。即使液滴蒸发,拉线表面前端也会保持不变,而仅是滚动表面 (receding surface)前端移动(图III)。在另一种简单模式中,在拉线装置周围构建湿度 腔从而实现高湿度(例如,接近100% )状态且液滴不会蒸发。替代性地,可以通过使用光学或磁性珠将核酸链核酸链在溶液中附着于两点 而将核酸链从溶液中除去并悬挂于两点之间(Bustamante,C.等,421 (6921) NATURE 423-427(2003))。然后将该链冻干并使冰升华,从而留下悬挂的单链,其后可将该单链转移 至成像基片。在另一个实施方式中,使个体核酸链与单个磁性颗粒结合,然后将该磁性颗粒 从液滴中取出(例如,使用磁性探针)以使DNA链延伸至空间内。与成像基片的附着在步骤110中,一旦将核酸链拉线于空白空间中的针与液滴之间且核酸链不再由 溶液或缓冲液包围,则可以将该链直接置于基片(如载体基片或成像基片)上以通过电子 显微镜进行成像。一种实现上述过程的方法被称作“搁板拉线”,其中将伸长的DNA链置于
22成像基片上或在分开的步骤中置于载体基片上并转移至成像基片上,参见图7A。相关的方 法被称作“间隙拉线”,其中在分开的步骤中将DNA链悬挂穿过载体基片中的间隙并转移至 成像基片,参见图15。其后,可将链以各种各样的取向进行放置,包括两维和三维取向,条件是链在“悬 挂区”中不(或极少发生)重叠或交叉。最方便和标准的EM样品制备方法是二维的,通常使 多条链彼此平行安置。参见例如,图8。在该设置下,可以易于使样品与空白或“非样品”空 间之比最大化。一般而言,链间间距越近越好,条件是链不会相距过近而使其干扰其相邻链 的可见度和鉴定。次纳米精度的定位器可商购,且非常方便的配置是将链以相距约2nm 约IOnm的平行线放置。在另一个实施方式中,将链放射状安置。在一个实施方式中,可以将多个悬挂链以基本显性的取向放置。图12显示了通过 针706从含核酸链704 (如DNA)的溶液702的液滴中将核酸链704置于基片1202上。可以 通过依次重复受基本编程的纳米定位器控制的浸入、浸出、放下、必要时沿载体基片拖动针 尖以便将链沉积、提起和在链间的所需距离中平移的针运动而形成紧密相间的核酸链(如 DNA链)的大平行阵列。在工业高通量规模上,可以通过这种方式、特别是使用大的平行针 阵列而将上百万的链置于一个载体基片上。由于所述方法比其它方法提供的DNA链更直(更加线性),可以使用拥挤的阵列并 且可确定准确的序列。阵列可以包含约2,000,000 10,000,000个基本线性链和/或平 行链且具有长度为约1 μ m 约5mm的悬挂区和约Inm 约IOnm的间距,从而产生约1碱 基/nm2 1碱基/5nm2的密度。阵列可以具有例如大于5个、大于10个、大于100个、大于 1000个或大于10,000个DNA链。显然,本发明的方法能产生线性(直线)双链和单链核酸链。线性(linearity)可 以依据围住链(或其线性部分)的假想方框、或更方便的是依据围住链在承载基片上的二 维投影(或链自身)的假想矩形的维度来描述。链的线性部分通常长度为至少约2 μ m,更 通常长度为至少约5 μ m,进而更通常长度为至少约10 μ m、20 μ m、30 μ m、50 μ m或100 μ m。 在某些情况下,链的线性部分将接近链的整个长度。在一个实施方式中,所述矩形如下如 果绘制最小的可能假想矩形来围住链或线性部分从而所有部分均处在矩形之内,则该矩形 的长宽比为不小于100 1、或优选至少为160 1、或优选至少为200 1、更优选至少为 500 1且再更优选至少为2000 1。例如,对于长5μπι的线性部分,绘制来围住平面表 面上的线性拉伸链的方框将宽约30nm(比例1 160)或宽2. 5nm(比例1 2000)。对于 长IOym的链,边界方框可以为10ymX62. 5nm从而使比例为160 1。对于长3μπι的线 性部分,边界方框可以为4nm从而使比例为500 1。在三维中,方框的第三(深度)维度 将在宽度维度的5倍以内、优选2倍以内、且最优选与宽度大致相同。由于使用本发明的方 法安置的链是直的(通常基本沿着悬挂区的整个长度),可以将阵列中的相邻链彼此非常 紧密地放置,例如,与其它相邻链相距约2nm、相距约3nm、相距约4nm、相距约lOnm、相距约 20nm或相距约50nm。在某些实施方式中,多个相邻链相距小于50nm,优选相距小于20nm,更 优选相距小于IOnm或相距小于4nm (例如,相距2nm 50nm、相距2nm 20nm、相距2nm lOnm、相距4nm 50nm、相距4nm 20nm或相距4nm IOnm)。在一个具体实施方式
中,将 线性链放置以使其不交叉。搁板拉线
23
在一个方法中,可以采用搁板拉线来将DNA直接置于成像基片上。参见图7,图片 I V所示。成像基片可以制成成像薄膜,成像薄膜由如石墨烯单片、超薄碳膜、氧化铍或 氮化铍、水冰(需要冷冻电子技术)和其它合适的固体低Z(电子透明)固体形式。由于这 些超薄膜非常纤巧,它们被置于网格或网的顶部或由其制成,所述网格或网由TEM网格上 的标准弗姆瓦微孔膜、SiN膜(DuraSiN by Protochips, Inc.)中的微细加工孔或简单制造 的多孔网格构成。图7显示了含有多个标记的核酸链704(为清楚起见仅显示出一个)的 溶液702的液滴、针706、处于PDMS块710顶部的TEM网格708。如图7的图片I所示,将 针706浸入溶液702的液滴中。在图片II中,将针706从溶液702拉出从而将核酸链704伸 长至空白空间中。在图片III中,使伸长的核酸链704与TEM网格708接触。核酸链704从 针706释放,如图片IV V所示。在另一种搁板拉线方法中,如图8所示,将载体基片710放置来紧邻核酸聚合物溶 液702的液滴,从而使悬挂于液滴与尖针之间的核酸链向下接触载体基片。然后,通过如下 所述的“转印”将多个核酸链转移至成像基片。图8的图片I示意性显示了将核酸链704沉 积于PDMS载体基片710上的单个针,而图8的图片II示意性显示了将多个核酸链704 —次 一个地沉积于经载体膜覆盖的预制TEM网格708上的单个针706 (显示了处在其运动时间 轴路径的两个位置的针)。如图9所示,核酸链总是正交于液滴表面。对溶液表面相对于载体基片的角度和 针的运动进行控制从而使空白空间中的核酸704在被置于基片708上时沿其长度与该基片 基本接触(图10)。在核酸被“拉出”溶液后,可以将核酸伸长。图11的图片I IV显示了 通过近端放下接着进行进一步拉伸来伸长核酸。在图11中,核酸具有夸大的松弛性,以显 示通过机械力比单纯弯月面力的更大拉伸。“A”和“B”可以代表载体的截面图,例如,EM网 格中的两条(微米规模)或PDMS的两个带(微米规模)。“A”和“B,,也可代表平面基片 上的两个位置。图13和14显示出在伸长和放置DNA链时可以考虑的几个参数。在一个故障模式 中,不正确的溶液表面/载体基片/针运动角度的考虑将引起载体基片与悬挂的链在针尖 与基片接触之前的不受控接触,而这反过来会通过过度拉伸而造成链的断裂(图13,图片 II )。在另一个故障模式中,错误校正的溶液表面/载体基片/针运动角度会使得链无法与 基片实质上接触,从而使得该链的相当大的一部分仍悬挂在溶液表面与针与基片的接触点 之间的空白空间中(图14)。间隙拉线在另一个实施方式中,可以采用间隙拉线来将核酸链置于载体基片上。间隙拉线 可以以如图15中示意性图示的下述方式进行。图15显示了具有间隙1504的PDMS块1502、 跨越间隙1504的核酸链1506和成像基片——在该情形中为覆有碳膜或其它低Z膜的超平 硅网格1508。首先,将核酸液滴置于小PDMS块中的间隙旁。通常,PDMS块的长度为约3mm 且宽约3mm。通过如上所述的尖针拉线使核酸跨越该间隙。核酸跨越间隙1504。将覆有碳 膜、多孔金膜或连续碳铍膜、其它低Z膜或成像薄膜(如上所述)的超平硅网格1508放置 而与拉伸跨过间隙1504的核酸接触,从而使得核酸被转移至网格1508(也称作“刷印”)。 如本文所用,术语“刷印”是指使跨越载体结构体上的间隙的一个或多个核酸链与可以为另 一载体基片或者成像基片或成像载体薄膜的结构体接触。具有跨越间隙1504的DNA 1506的PDMS块1502还可以被翻转并通过如下所述的转印方法转移至成像载体膜(未显示)。转印如上所述,可以将DNA链置于载体基片上并随后转移至成像基片或成像薄膜。完 成上述操作的一种方式是通过“转印”。转印是本领域内已知的,且由Nakao,H.等,125J. Am. Chem. Soc. 7162-7163 (2003) 一般性描述。可以采用转移来将核酸链置于载体基片或成 像基片上,如图16所示。图16示意性展示了长3mm宽3mm的PDMS块1602、含有核酸1606 的液滴1604和针1608。将针1608浸入液滴1604内,核酸1606与针1608的尖端结合。将 针1608从液滴1604中拉出,从而将核酸链拉伸至空白空间。伸长的核酸链1610与PDMS 块1602相连。重复这一过程直到将多个核酸链置于PDMS块上(小图6)。必须格外谨慎 (以较大的链间间距)以免一个拉伸的链干扰(即接触或交叉)此前拉伸的链。以待已将 所需数目的核酸链放置于PDMS块1602上,则将PDMS块1602翻转并置于成像薄膜或其它 转移基片1612上。将PDMS块1602从膜1612除去,而DNA留在膜1612上,由此多个核酸 链被转移至膜1612。该膜可以为碳、铍或其它低Z载体,其在核酸转移时被沉积于新切割的 盐晶体或云母片上,然后置于TEM网格上以进行成像。替代性地,可将核酸链置于载体基片上并转移至另一个载体基片上以用于储存、 运输或其它目的。成像薄膜可以是成像基片,它是由但不限于碳、硼、铍、铝或其它低Z元素和/或其 氮化物和氧化物构成的薄膜或如前定义的成像薄膜。这些膜可以通过已知技术制备,例如, 沉积于切割的盐晶体或云母上。在一个具体方面,采用超薄(约1.5nm)碳膜。在另一个方 面,成像基片是覆有薄(约1. 5nm厚)支撑碳膜的超平硅TEM网格。也可将成像薄膜置于 弗姆瓦微网涂覆的TEM网格或具有规则或不规则孔或孔隙的机加工硅网格上。在一个实施方式中,可以将至少一个伸长的核酸聚合链置于平面基片上。所述至 少一个伸长核酸聚合链可具有在约1000个碱基对的长度上的恒定的碱基与碱基间距。可 将膜置于所述至少一个伸长核酸聚合物的上方从而该至少一个伸长核酸链聚合物被夹在 平面基片与膜之间。膜可以由碳或低ζ元素构成。平面基片可以由如PDMS、碳、硼、锂、氢、 铍、铝、氮化物、氮化物氧化物及其组合等材料构成。上文所述的方法不限于核酸聚合物,而是也可用于各种各样的其它长的(无支 链)高分子量分子。例如,可以将包括但不限于纳米管(例如,氮化碳、硼和氮化硼等)、氨 基酸链微管、肌动蛋白微丝、具有重复单元的其它长线性聚合物和其它聚合物的其它高分 子量聚合物拉线于合适工具上并附着于合适的基片。具体而言,所述方法可以用于在其末 端(端基)处与针或其它结合工具差异性结合的线性聚合物。在某些实施方式中,可以将 线性分子在其一端或两端修饰从而末端优选与工具结合。例如,可以使用本领域技术人员 已知的技术使聚合物末端与DNA复合,然后其可在其末端如上所述的工具优选结合。稳定化核酸可能受到电子显微镜产生的电子束的损伤。为此在某些实施方式中,一旦将 标记的核酸链置于成像基片上,则可在成像之前将该标记核酸链稳定化。例如,可以通过 蒸发、溅射或直接沉积预制膜来在样品上放置另外的碳或其它低Z原色或聚合物。可以通 过碳或铍的超快PLD-UHV来完成碳或其它低Z材料的间接蒸发。这种附加层(即,面层 (topcoat))的存在增加了下层的核酸的稳定性。图17示意性显示了具有多孔网1704的TEM网格1702、基底层1706、核酸1708和顶层1710。在一个实施方式中,通过将面层蒸发至核酸上来使核酸稳定,所述面层通过在使 沉积原子冷却的气体氛围中进行脉冲激光沉积而制备,但使压力、靶标与样品距离、脉冲长 度、脉冲频率和脉冲注量(pulse fluence)等条件优化来给出将标记的核酸聚合物嵌入的 固体均质膜。这些条件会使得沉积原子在到达基片的途中彼此之间发生最少的反应从而产 生完全将标记嵌入的更致密的膜。面层的用途在于通过可使序列数据得到确定的方式使标 记和/或DNA稳定化并避免运动或损伤。成像薄膜必须极薄,以便在TEM中得到良好的单原子图像。通过标准技术制成 的膜在暴露于实验室空气中后往往受到污染。这种污染的累积使得膜变厚,这会妨碍单 个原子和簇的成像。除了使膜变厚以外,来自空气的污染物还能导致膜在与电子束相互 作用时的结构不稳定性。必须进行严格清洁和维护以确保这种累积不会发生。对于本 文所述的所有方法而言,所有步骤都应优选在受控的无烃环境(例如,纯氮气、氩气或其 它惰性气体)下进行。一旦DNA被悬挂并置于成像基片或转移基片(如PDMS)上并从 溶液中移出,所有其它步骤最好在受控环境中继续进行,所述受控环境优选为清洁的无烃 气体,但更优选为UHVdO,托)。这可以包括在受控气氛环境下进行拉线、将DNA链放 置于UHV中的膜上,和在纳米技术、半导体制造等领域内的技术人员已知的其它清洁技术 (K Ji shnan, S. ;LaparraiO "Contamination issues in gas delivery for semi conductor processing,,Semiconductor Manufacturing,IEEE Transactions,第 10 卷,第 2 期, 1997 年 5 月,第 273-278 页;William Whyte, Clean roomTechnology !Fundamentals of Design Testing and Operation ;Dorothy Hoffman,Handbook of Vacuum Science and Technology)。来自显微镜自身的污染也是可能限制单个原子的可见性的关键因素。必须谨慎 地保持非常清洁、干燥的成像用系统。这包括具有冷阱、多重离子泵、涡轮泵、钛升华泵、 吸气泵、阶段加热器(stage heater)和加样锁(Dorothy Hoffman, Handbook of Vacuum Science and Technology)。步骤112显示了本发明的一个实施方式,其中通过电子显微镜将TEM网格上的标 记核酸成像。本发明不应被视为在此步骤限于TEM网格,而可以是本领域技术人员已知的 任何成像基片。此外,可以使用任何适合的电子显微镜来使标记的位置可视化,所述电子显 微镜优选具有合适的使用HAADF STEM的像差校正器。在步骤114中,产生并分析了核酸序列数据。根据本发明的一个实施方式,图18 显示了用于分析核酸序列的系统,其可以包含电子显微镜2202、处理器模块2204、至少一 个存储器模块2206、分析器模块2208、用户界面2210和网络接口 2212。可以将电子显微镜 2202设置来产生代表电子致密区的电信号。将分析器模块2208设置来基于由电子显微镜 2202产生的电信号分析核酸序列。所述至少一个存储器模块2206被改造来存储代表电子 显微镜和/或分析产生的核酸信号的电信号中的至少一个。将用户界面设置来使得用于能 与分析互动。在一个具体实施方式
中,所述至少一个存储器模块包含用于储存分析和用于 储存代表核酸序列的电信号的不同存储器。在另一个实施方式中,分析器2208和所述至少 一个存储器模块1806远离电子显微镜,并且通过网络与电子显微镜相连。一个或多个模块 位于同一装置(例如,计算机或处理器)中以便执行各种功能。替代性地,所述模块可以执行不同功能的不同结构部件。在一个更具体的实施方式中,如图19所示,可以从商购系统或定制系统采集数据 分析。图19中的系统可以包括电子显微镜1902 (商购或定制显微镜)、处理器检测器1904、 图像识别计算机1906、至少一个存储器模块1908、分析器模块1910、用户界面1912 (概念性 视图或屏幕)和可选的网络接口(互联网或局域网)。可以将电子显微镜设置来产生代表 核酸序列的电信号。将分析器模块1910设置来基于由电子显微镜1902产生的电信号分析 核酸序列。在某些实施方式中,存储器是选自硬盘或软盘、光学介质、光盘(CD)、数字多用光 盘(DVD)、半导体介质和闪存的介质。手动或优选地使用图像识别系统来组装最终序列信息。核酸间距信息产生自高 数据输出检测器,其可以是例如CCD检测器、CMOS或PMT。采用算法来从接收自高数据输 出CCD检测器的信息确定例如锇标记的间距,并相应地对于给定标记反应批次而言确定特 定碱基的序列。从CCD接收的信息被储存于存储器上并分析。存储器可以包括例如,如常 规硬盘或软盘等磁性介质、如光盘(CD)或数字多用光盘(DVD)等光学介质和/或如闪存 等半导体介质。序列组装用算法(计算机程序)是公知的。可以在本发明中使用或改编 使用的程序包括如DNA Naser和Cap3,这是最常见的本领域中使用的序列组装软件程序, 例如,题为“具有提高的准确性和阅读长度的DNA序列比对用方法(Method for Alignment of DNASequences with Enhanced Accuracy and Read Length),,的美国专利第 6,760,668 号和题为“序列比对重要性确定方法(Method for Determining SequenceAlignment Significance) ”的美国专利第6,988,039号中公开的那些程序,本文通过参考特地并入其 i胃内·。dnabaser. com/index, html (Heracle Software, Lihenthal, 德国)及Huang, X.和Madan, Α.,9GEN0MERES. 868-877(1999)。具体的组装参数将部分取 决于所用标记的性质。在一个实施方式中,例如,对于成像的每条链,用标记的特异性(例 如,是否所有T被标记,是否所有T和所有C被标记)对包括每个标记的碱基和每个未经标 记的碱基的相对位置的信息进行关联以便确定标记的碱基的位置序列和所存储的信息。将 对于链及其推导互补物的存储信息与对于其它链及其互补物产生的信息进行比较并鉴定 匹配。鉴定出相邻序列并组装而产生完整序列。当待测序的核酸来自此前已被测序的基因组(例如,小鼠、人、细菌、病毒)时,可 以将初始序列数据(例如,不同链内的位置序列)与已知的参照序列进行匹配以加快分析。在一方面,本发明包括对储存于存储器中的核酸序列(Α的序列、T的序列、G的序 列和C的序列)进行分析,其中所述序列通过上文所述的方法确定。在一方面,本发明包括 接收成像数据(例如,标记碱基和未经标记的碱基的位置)、位置序列(可选的是其中至少 一种碱基未确定的位置序列)或其它序列信息并处理数据以确定核酸样品的核苷酸序列。 通常,数据以电子形式接收。在一个实施方式中,核酸序列是人类受试对象的基因组序列。 在一个实施方式中,所述分析包括对一个或多个单核苷酸多态性的存在或缺失、拷贝数、变 异体、得失位、重排或全基因组序列中的至少一者的确定。图19显示了带有标记的T的单链DNA链的说明性图像,简图说明了重标记的图案 如何对应于所成像区域的碱基特异性部分序列信息。合并了用不同标记和/或反应条件对 相同基本序列的多次成像的信息使得可以进行极为准确的序列确定。由于链已被伸直,故不必跟踪核酸主链,从而没有必要用独特的重标记对每个碱
27基进行标记。图20显示了替代性制备方法所固有的模糊性。使用上文和下文具体实例中 所述的本发明的方法将不会引入同步误差(phasing error),这是因为缺少的标记仅会被 “阅读”作为空白点。可以通过生物信息学将多个标记图案合并来确定基本核酸序列。作为单分子放 置控制的结果,本发明提供了高效通量。由于以高度可预测方式安置的链不仅单独地(即 恒定的碱基与碱基间距)而且可预测地将单条链的致密阵列并行安置,图像分析将极为高 效。本发明的方法还使得拉伸力可受控制,由此导致对碱基与碱基间距的程度的优化。无须赘述,据信本领域技术人员可以使用前述说明来将本发明利用至其最完全的 范围。以下实例仅为说明性,而非以任何方式限制本公开。实施例实施例1使用本领域普通技术人员已知的技术从样品分离感兴趣的DNA。然后将感兴趣 的DNA分在4个溶液中,即溶液1、2、3和4。使每个溶液与Os-bipy以不同时长和不同的 Os-bipy浓度反应,以便获得不同的碱基特异性标记密度。使溶液1和2在26°C与pH 8. 0的TE缓冲液(具有IOOmM Tris和IOmM EDTA)中 的过量4倍摩尔的四氧化锇和2,2’-二吡啶反应20小时,这些条件标记了约100%的T、约 85 %的C、约7 %的G和约0 %的A。使溶液3和4在与溶液1和2相同的条件下反应,不同 之处在于反应仅进行15分钟,且仅使用过量2. 5倍摩尔的四氧化锇和2,2’ - 二吡啶,这些 条件标记了约90 %的T、约8 %的C、约5 %的G和约0 %的A。然而,在Os-b ipy反应之前, 首先使溶液2和4进行亚硫酸氢盐处理以将未甲基化的C残基转化为U。亚硫酸氢盐方案 是本领域技术人员已知的,而此处描述了此种方案的极简版本。将最终浓度为0. 05mM的氢 醌、33M的亚硫酸氢钠和3ng/微升的变性DNA加入离心管内,封住该管并用铝箔屏蔽光,在 55°C温育8小时,通过标准方法纯化DNA,并将DNA重悬于TE缓冲液(pH 8. 0,IOOmM Tris, IOmM EDTA)中以用于后续重原子标记。这使得可以通过对来自由亚硫酸氢钠处理的溶液的 序列与未处理的那些序列的比较来确定甲基化模式。根据参考文献Jelen等,10GENPHYS AND BI0PHYS,461。标记反应进行后,通过超滤除去未标记的锇以使成像过程中的外源性重 原子污染最小化,并将DNA聚合物在pH 8的TE缓冲液中稀释至约0. Ing/μ L·通过在乙醇火焰中加热玻璃纤维并牵拉分开来制备尖针,由此产生两个在其末端 处的曲率半径小于约200nm的尖针。然后将一根针通过浸入0. 5% PMMA丙酮溶液并在丙酮 气氛中干燥而以PMMA涂覆。然后将该针粘至保持部件上或者夹在定位器如压电执行器的 臂上(例如,可编程AFM硅悬臂)以便控制针的位置和运动。将针浸入含有感兴趣的DNA聚合物的DNA聚合物溶液随后拉出以将DNA链伸长或 从DNA聚合物溶液中“拉出,,至空白空间中。伸长的DNA聚合链应该保持与DNA聚合物溶 液的表面垂直。将DNA聚合物附着至覆有厚度为约1. 5nm 约5nm的碳薄膜的超平硅TEM网格。 硅TEM网格通过如下方式制备使用微细加工工业普通技术人员已知的技术,将碳蒸发于 硅片的一侧上,然后蚀刻背面侧并确保碳膜平整。将网格置于DNA聚合物溶液的液滴旁边,从而使悬挂于液滴与尖针之间的DNA聚 合链可以在被完全“拉出"DNA聚合物溶液之前与网格接触。仅当DNA聚合链被置于TEM网
28格上时,使伸长至空白空间中的DNA聚合物与网格接触。考虑DNA聚合物溶液相对于网格 的角度和针的运动以确保这一点。使用该拉线技术,可以将成千上万的链彼此平行置于TEM 网格上。使用移液器尖或微定位器将DNA聚合物溶液拖动离开跨越位置,从而移动液滴所 停留的碱基。然后蒸发约0.5nm 约6nm的碳以使DNA聚合物稳定。在受控环境室中进行 跨越以使蒸发和灰尘最小化。在Z反差STEM模式的带有像差校正器的商购Titan 80-300 (FEI Company, Hillsboro,0R)中或其它合适的高分辨电子显微镜中进行成像。使用来自检测器的信息以 确定锇标记的间距并相应确定感兴趣的DNA的序列。实施例2以与上文具体实施例1中相同的方式执行相同方法,不同之处在于使DNA聚合物 向下搭架跨越至PDMS片上,如图17所示。然后使PDMS与云母上的碳膜接触从而将DNA聚 合物转移至碳上。然后将PDMS片提走,留下DNA聚合物。在云母上的碳膜上的DNA聚合物 的上方蒸发约Inm 约5nm的碳。使碳膜漂浮于水上并由TEM网格拾取。然后如具体实施 例1或具体实施例2中所述对聚合物进行成像,以确定序列信息。上文给出的实例仅为说明性而非旨在作为本发明的所有可能实施方式、应用或变 形的详尽列表。因此,在不背离本发明的范围和主旨的情况下,对本发明所述方法和系统的 各种修改和变化将对本领域技术人员显而易见。尽管已经结合具体实施方式
对本发明进行 了描述,但应理解,所要求的发明不应过分地受到这些具体实施方式
的限制。事实上,对于 分子生物学、免疫学、化学、生物化学或相关领域中的技术人员显而易见的对本发明的所述 实施方式的各种改变应该包括在所附权利要求的范围之内。通过参考将上文所引用的所有参考文献和出版物的全部公开内容并入,其程度等 同于通过参考将每个参考文献和出版物单独并入。
权利要求
一种获取DNA聚合链的序列信息的方法,所述方法包括以下步骤a)提供包含所述DNA聚合链的溶液,其中已对所述DNA聚合链进行处理从而使得多个DNA碱基已用具有碱基特异性或碱基选择性的造影剂进行标记;b)将DNA结合工具引入所述溶液并使所述DNA聚合物的一部分与该工具结合;c)将所述工具从溶液中除去;d)将标记的DNA聚合链在空间内拉伸从而使该标记的DNA聚合链悬挂于空气/溶剂界面与所述工具之间;e)将经拉伸的标记DNA聚合链沉积于基片上;f)使用电子显微镜使标记的DNA聚合链成像由此确定经标记的碱基和未经标记的碱基的位置;和g)将经标记的碱基和未经标记的碱基的位置与DNA聚合物的序列进行相关。
2.如权利要求1所述的方法,其中所述经拉伸的标记DNA聚合链为单链。
3.如权利要求1所述的方法,所述方法还包括使所述DNA聚合链变性以便在用造影剂 进行标记之前产生单链核酸的步骤。
4.如权利要求3所述的方法,其中所述变性步骤是热变性。
5.如权利要求1所述的方法,所述方法还包括在所述成像步骤之前将碳层沉积于DNA 聚合链上方的步骤。
6.如权利要求1所述的方法,其中所述DNA聚合链是大于约IOOkb的高分子量DNA。
7.如权利要求1所述的方法,其中所述拉伸步骤在DNA聚合链中产生恒定的碱基与碱基间距。
8.如权利要求7所述的方法,其中所述碱基与碱基间距为约3入 约7入。
9.如权利要求8所述的方法,其中所述碱基与碱基间距为约5A。
10.如权利要求1所述的方法,其中所述处于空气/溶剂界面与工具之间的DNA聚合链 的悬挂区的长度至少为约2 μ m。
11.如权利要求1所述的方法,其中仅对所述DNA聚合链的碱基的子集进行标记。
12.如权利要求11所述的方法,其中所述碱基子集包括胸腺嘧啶和胞嘧啶。
13.如权利要求11所述的方法,其中所述碱基子集包括腺嘌呤和鸟嘌呤。
14.如权利要求1所述的方法,其中所述引入步骤中的工具是具有采用与DNA链结合的 第一涂层进行功能化的尖端的针。
15.如权利要求14所述的方法,其中所述针由选自玻璃、金、钨、PMMA、聚苯乙烯、PVC和 硅的材料构成。
16.如权利要求14所述的方法,其中所述第一涂层是选自PMMA、聚苯乙烯、PVB和寡核 苷酸的化合物。
17.如权利要求14所述的方法,其中采用不与DNA结合的第二涂层对所述针进行功能化。
18.如权利要求17所述的方法,其中所述第二涂层是选自辛基硫醇、己基硫醇、壬基硫 醇、癸基硫醇和庚基硫醇的化合物。
19.如权利要求14所述的方法,其中所述针尖的曲率半径小于约200nm。
20.如权利要求14所述的方法,其中使所述针以约1纳米/秒 约100米/秒的速率移进和移出溶液。
21.如权利要求14所述的方法,其中所述针以约1A 20 μ m的深度进入溶液。
22.如权利要求1所述的方法,其中所述造影剂包含高Z原子。
23.如权利要求22所述的方法,其中所述造影剂是Os-bipy、乙酸汞或二甲基硫化钼。
24.如权利要求1所述的方法,其中所述造影剂是高Z原子簇标记。
25.如权利要求1所述的方法,其中所述沉积步骤包括通过采用搁板拉线将标记的DNA 聚合链附着于成像基片。
26.如权利要求1所述的方法,其中所述沉积步骤包括通过采用搁板拉线将标记的DNA 聚合链附着于载体基片,其后通过采用转印将该载体基片上的标记的DNA聚合链转移至成 像基片。
27.如权利要求1所述的方法,其中所述沉积步骤包括通过采用间隙拉线将标记的DNA 聚合链附着于载体基片。
28.如权利要求1所述的方法,其中所述沉积步骤包括通过采用间隙拉线将标记的DNA 聚合链附着于载体基片,其后通过采用刷印将该载体基片上的标记的DNA聚合链转移至成 像基片。
29.如权利要求1所述的方法,其中将多个单独的DNA聚合链在空间内拉伸并沉积于基 片上然后将每个链成像。
30.如权利要求29所述的方法,其中将多个DNA聚合链作为平行的链阵列安置于基片上。
31.如权利要求1所述的方法,所述方法还包括以下步骤在步骤(a)之前,将包含来自同一个体的多个DNA聚合链的溶液分为至少两个子样,并 对所述子样进行处理从而以不同的碱基特异性或选择性来标记DNA聚合链,和在步骤(g)之后,汇集从所述成像步骤获得的多个DNA聚合链的数据以获取序列信息。
32.一种获取核酸序列信息的方法,所述方法包括通过电子显微镜确定多个标记的核 酸链中的每一个的至少1000个毗连碱基区域内经标记的碱基和未经标记的碱基的位置。
33.如权利要求32所述的方法,其中针对至少1000个毗连碱基确定位置。
34.如权利要求32所述的方法,其中针对至少10,000个毗连碱基确定位置。
35.如权利要求32所述的方法,其中确定至少20个个体链的经标记的碱基和未经标记 的碱基的位置。
36.如权利要求32所述的方法,其中确定至少100个个体链的经标记的碱基和未经标 记的碱基的位置。
37.如权利要求32所述的方法,其中确定至少1000个个体链的经标记的碱基和未经标 记的碱基的位置。
38.如权利要求32所述的方法,其中确定至少10,000个个体链的经标记的碱基和未经 标记的碱基的位置。
39.如权利要求35所述的方法,其中针对经不同标记的核酸聚合链确定核酸链的至少 200个毗连碱基的位置。
40.如权利要求35所述的方法,其中针对经不同标记的核酸聚合链确定核酸链的至少 500个毗连碱基的位置。
41.如权利要求35所述的方法,其中针对经不同标记的核酸聚合链确定核酸链的至少 10,000个毗连碱基的位置。
42.如权利要求32所述的方法,其中所述核酸链在伸长时具有至少约100μ m的长度。
43.如权利要求32所述的方法,其中所述核酸链是DNA序列。
44.如权利要求43所述的方法,其中所述DNA是单链的。
45.如权利要求32所述的方法,其中所述核酸在碱基之间的碱基与碱基间距为约3A 约7 A。
46.如权利要求45所述的方法,其中所述核酸的其中所述核酸在碱基之间的碱基与碱 基间距为约5 A。
47.一种将至少一个核酸链受控地安置于基片上的方法,所述方法包括以下步骤 提供含有多个核酸链的溶液;将针尖插入溶液;将针尖从含有多个核酸链的溶液中提出,其中已用与核酸结合的第一涂层将所述针尖 功能化;将核酸链在空白空间内拉伸从而使单个核酸链悬挂于空气/溶剂界面与每个针尖之间;将至少一个拉伸的核酸链附着于基片。
48.如权利要求47所述的方法,其中所述浸提步骤中的针由选自玻璃、金、钨、PMMA、聚 苯乙烯、PVC和硅的材料制造。
49.如权利要求47所述的方法,其中所述第一涂层是选自PMMA、聚苯乙烯、PVB和寡核 苷酸的化合物。
50.如权利要求47所述的方法,其中用不与核酸结合的第二涂层将所述针功能化。
51.如权利要求50所述的方法,其中所述第二涂层是选自辛基硫醇、己基硫醇、壬基硫 醇、癸基硫醇和庚基硫醇的化合物。
52.如权利要求47所述的方法,其中所述浸提步骤中的针尖的曲率半径小于约200nm。
53.如权利要求47所述的方法,其中使所述浸提步骤中的针尖以约1纳米/秒 约100 纳米/秒的速率移进和移出溶液。
54.如权利要求47所述的方法,其中所述浸提步骤中的针尖以约IOnm 20nm的深度 进入溶液。
55.如权利要求47所述的方法,其中将所述浸提步骤中的针置于单纳米定位器驱动的 载体上。
56.如权利要求47所述的方法,其中利用纳米定位器驱动的载体将多个针同时插入溶液。
57.如权利要求47所述的方法,其中所述核酸是高分子量DNA。
58.如权利要求47所述的方法,其中所述拉伸步骤在核酸链中产生恒定的核酸与核酸 间距。
59.如权利要求58所述的方法,其中所述碱基与碱基间距为约3A 约7人。
60.如权利要求59所述的方法,其中所述碱基与碱基间距和标记与标记间距为约5人。
61.如权利要求47所述的方法,其中将所述拉伸步骤中的核酸拉伸至约100μ m的长度。
62.如权利要求47所述的方法,其中使附着于基片的至少两个核酸链定向来彼此基本 平行。
63.如权利要求47所述的方法,其中所述附着步骤包括采用搁板拉线来将所述至少一 个核酸链附着于基片。
64.如权利要求47所述的方法,其中所述附着步骤包括采用间隙拉线来将所述至少一 个核酸链附着于基片。
65.如权利要求47所述的方法,其中所述附着步骤中的基片是成像基片。
66.如权利要求47所述的方法,其中所述附着步骤中的基片是载体基片。
67.一种制造品,所述制造品包含包含多个核酸聚合链的液体;工具;和具有处于所述液体中的第一末端和与所述工具相连的第二末端的单个核酸聚合链,其 中所述单个核酸聚合链的至少一部分悬挂于所述工具与所述液体之间的空间中。
68.如权利要求67所述的制造品,其中将所述核酸聚合链的碱基伸长从而令碱基具有 恒定的碱基与碱基间距。
69.如权利要求68所述的制造品,其中碱基之间的碱基与碱基间距为约3A 约7入。
70.如权利要求68所述的制造品,其中将核酸聚合链伸长以使其在悬挂区域中是线性的。
71.如权利要求67所述的制造品,其中在空间中伸长的核酸链部分的长度至少为约 100 μ m0
72.一种制造品,所述制造品包含平面基片;和位于所述平面基片上的至少一个伸长核酸聚合链,其中所述至少一个伸长核酸聚合链 在约1000个碱基对的长度上具有恒定的碱基与碱基间距。
73.如权利要求72所述的制造品,其中所述基片选自PDMS块、PMAA块、薄膜、超平硅 网、成像基片、载体基片和TEM网。
74.如权利要求73所述的制造品,所述超平硅网覆盖有碳膜、多孔网膜或连续碳膜。
75.如权利要求72所述的制造品,所述制造品还包含安置于所述至少一个伸长核酸聚 合物上方的膜,从而使所述至少一个伸长核酸聚合物夹在所述平面基片与所述膜之间。
76.如权利要求75所述的制造品,其中所述膜由碳、铍和低Z元素构成。
77.如权利要求72所述的制造品,其中所述至少一个伸长核酸链的碱基与碱基间距为 约3A 约7人。
78.如权利要求72所述的制造品,其中所述平面基片由选自PDMS、碳、硼、锂、铍、铝、氮 化物、氮化氧化物及其组合的材料构成。
79.如权利要求72所述的制造品,其中将所述至少一个伸长核酸链用至少一个高Z标 记化合物进行标记。
80.如权利要求79所述的制造品,其中所述高Z原子选自由锇、汞和钼。
81.如权利要求72所述的制造品,所述制造品包含多个置于基片上的伸长核酸链,其中所述核酸链彼此基本平行。
82.如权利要求81所述的制造品,所述多个伸长核酸链包约1X 106个核酸链。
83.如权利要求72所述的制造品,所述将至少一个伸长核酸链拉伸至至少约2μ m的长度。
84.—种包括对储存于存储器上的核酸序列进行分析的方法,其中所述序列通过权力 要求1所述的方法确定。
85.如权利要求84所述的方法,其中所述核酸序列是人类受试对象的基因组序列。
86.如权利要求85所述的方法,其中所述分析包括对一个或多个单核苷酸多态性中的 至少一个的存在或缺失、拷贝数、变异体、得失位、重排或全基因组比较进行确定。
87.如权利要求84所述的方法,其中所述存储器是选自硬盘或软盘、光学介质、光盘 (CD)、数字视频光盘(DVD)、半导体介质和闪存的磁性介质。
88.一种针,所述针包含 远端;近端;禾口在与所述远端和所述近端接触的液体内延伸的轴,其中所述近端包含曲率半径小于约200nm的尖端部件,且其中已用与核酸末端结合的 化合物将所述尖端部件功能化。
89.如权利要求88所述的针,所述针涂覆有不具有与核酸结合的亲和力的第二化合物。
90.如权利要求88所述的针,其中用选自PMMA、聚苯乙烯、PVB、硅烷化物和寡核苷酸的 化合物将所述尖端部件功能化。
91.如权利要求88所述的针,其中所述核酸是单链DNA。
92.如权利要求88所述的针,其中所述针由选自玻璃、金、钨、PMMA、聚苯乙烯、PVC和硅 的化合物构成。
93.如权利要求88所述的针,其中将所述针置于单纳米定位器驱动的载体上。
全文摘要
本发明涉及使用电子显微镜通过直接检视来对标记的拉伸的DNA进行测序。该方法比目前的DNA测序方法具有更高的准确性、更低的成本和更长的阅读长度。
文档编号G01N23/04GK101889074SQ200880119334
公开日2010年11月17日 申请日期2008年10月6日 优先权日2007年10月4日
发明者威廉·安德雷格, 迈克尔·安德雷格 申请人:哈尔西恩莫尔丘勒公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1