核酸相互作用分析的制作方法

文档序号:438256阅读:695来源:国知局
专利名称:核酸相互作用分析的制作方法
核酸相互作用分析技术领域一般来说,本发明涉及基因表达领域。更确切地说,本发明涉及核酸的 相互作用。特别地,本发明涉及对核酸-蛋白相互作用的情况和相互作用的 组分进行分析、检测和识别。
背景技术
染色质的相互作用是重要的基因调控方式。最近完成的人类基因组测序 提供了遗传信息的框架。然而,人类基因组的结构和信息通常表现为一维线 性关系,该一维线性关系不足以解释细胞系统的复杂性和协同性。为了理解基因组怎样作为和谐地结合的系统(orchestrated system)在活细胞的三维细胞 核中真实地作用,需要一种完全不同的视角。基因组DNA (估计伸长后为 两米长)浓縮在位于细胞核中的染色体中,仅仅几微米。已知染色体被不均 匀地组织成常染色质和异染色质,它们被染色质蛋白所包装并通过用于转录 和复制的转录因子所转达。这些活性看来是有序的。可以观察到,大的染色体环包括活性基因。此 外,还暗示了远端调控元件(如基因座控制区(LCR)、增强子、和绝缘子) 通过将特定的遗传位点重新定位至活性转录或沉默转录的区域起作用。近期 在P-球蛋白以及最近在细胞因子基因(IFN-力的研究中证明了LCRs可以直接 与位于同一个染色体的相距较远的启动子相互作用,甚至可以直接与位于不 同的染色体的启动子相互作用。染色体内和染色体间相互作用可能是发生在 重要路径的协同基因调节中的多遗传位点的普遍现象。疾病中也暗含有染色 体内-染色体间相互作用。例如,染色体易位可以导致myc转录物的调节紊 乱,所述染色体易位使位于染色体15上的c-myc/pvt-l基因座与位于染色体12上的免疫球蛋白位点并列。此外,全基因组水平的染色体间相互作用的分 析对所有相互作用的识别是必需的,并且将清楚地显示出细胞中的高水平的 基因调节。用于染色质相互作用的研究的技术大多数用于研究三维结构和染色质 相互作用的方法均存在大量的限制。可以解决此问题的技术可以简单地分 为可视化工具,如显微镜法、荧光素原位杂交(FISH)、和RNA标签和相 关蛋白的复性(RNA-TRAP);和分子生物学方法,如染色体构象捕获(3C)、 和3C后的染色质免疫沉淀法(3C-ChlP)。在许多早期研究中,显微镜法被应用于研究细胞核中染色质的空间组 织。然而,这种细胞遗传学方法仅能够提供染色体中染色质的粗略片段信息。 荧光素原位杂交(FISH)是这一方向中的重要改进,FISH通过荧光标记的 DNA或RNA探针与基因组DNA的杂交,使特定的遗传位点定位到染色体 上特定的物理位置。然而,该方案仍然是受限制的。对FISH进行改进的 RNA-TRAP是一种能够显示出远端的增强子与基因启动子在物理位置上极 为接近的方法。染色体构象捕获(3C)最初被设计成研究酵母染色体的构造(Dekker等, 2002),以及用于研究遗传成分的相互作用,所述遗传成分分散在相距较远 的范围内和/或分散在不同的染色体中。在染色体构象捕获(3C)中,用甲醛对 DNA-蛋白(染色质)结构进行体内交联,并且通过限制性内切核酸酶将染 色质消化成片段。然后,通过连接将具有DNA结合蛋白的DNA片段结合, 再通过PCR对两种疑似已知的成分的连接物进行检测。通过特定的DNA结 合蛋白或转录因子调节的染色质相互作用的检测,可以通过染色质免疫沉淀 法(3C-ChlP)被进一步增强,其中,通过抗体拉开试验(antibodypull-down) 使3C过程中导致的与蛋白交联的嵌合DNA片段浓縮。虽然每种单独的技术和一些结合被证实能够用于对一些特定的染色体内和染色体间相互作用进行识别,但是这些方法依赖于关于存在哪些的远端染色质相互作用的已有知识或推测,以及依赖于设计成用于通过PCR以每 次一个区域的方式对这种连接进行检测的引物。因而,目前用于研究染色质 相互作用的技术在识别新的染色质相互作用以及全基因组水平的大范围识 别上受到了极大的限制。虽然对染色体在空间上被组装入细胞核中的方式以及如何同时调节远 端基因的转录十分感兴趣,但目前仅能够得到零散的和间接的信息。在此方 面缺乏信息主要是由于缺乏能够有效地解决染色体相互作用的三维问题的 强有力的技术。本领域需要能够有效地解决染色体相互作用的三维问题的更有效的方 法和更强有力的技术,以克服现有技术存在的缺点及限制。发明内容本发明通过提供一种用于对核酸复合物中,特别是对核酸-蛋白质复合 物中的至少一种核酸序列或片段进行检测、识别、和/或制备的新方法而解决 了上述问题。特别地,本发明的方法提供了一种对核酸-蛋白质复合物中至 少两种核酸序列或片段进行检测、识别、和/或制备的方法。本发明还涉及一 种寡核苷酸,该寡核苷酸是由根据本发明的任意一个实施方式的方法制备得 到的。本发明还提供了一种用于识别染色质相互作用的情况的方法,所述染 色质相互作用的情况是通过相距较远的特定DNA结合蛋白和不同染色体之 间的特定DNA结合蛋白来调节的。另一方面,本发明通过提供一种分离的寡核苷酸解决了上述提及的问 题,所述寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述 第一标签和所述第二标签为核酸-蛋白质复合物的标签。特别地,本发明提供了一种分离的寡核苷酸,该分离的寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得 自第二多聚核苷酸,所述第一多聚核苷酸和所述第二多聚核苷酸得自核酸-蛋白质复合物。所述第一多聚核苷酸和所述第二多聚核苷酸可以为所述核酸 -蛋白质复合物的同一核酸区域或不同核酸区域的一部分。所述分离的寡核苷酸还可以含有至少一个限制性内切核酸酶识别位点 和/或至少一个接头。特别地,所述至少一个限制性内切核酸酶识别位点可以 包括在接头中。所述接头可以插在所述标签之间,或者所述接头可以与至少 一个标签侧翼连接(即,定位的至少一个标签的上游和/或下游)。所述至少 一种限制性内切核酸酶的识别位点可以不对称。例如,所述至少一种限制性 内切核酸酶的识别位点可以为lis型限制性内切核酸酶的识别位点或归巢限帝U性内切酶(homing restriction enzyme)的识别位点。所述至少一个第一标签可以含有所述第一多聚核苷酸的5'末端和3'末 端,所述至少一个第二标签可以含有所述第二多聚核苷酸的5'末端和3'末 端。所述分离的寡核苷酸还可以含有至少一个接头。所述接头可以插在所述 标签之间,或者所述接头可以定位在至少一个标签的上游和/或下游。所述接 头含有至少一种限制性内切核酸酶的识别位点。所述至少一种限制性内切核 酸酶的识别位点可以不对称。例如,所述至少一种限制性内切核酸酶的识别 位点可以为lis型限制性内切核酸酶的识别位点或归巢限制性内切酶的识别 位点。所述接头可以含有第一限制性识别位点和第二限制性识别位点,所述第 一限制性识别位点被能够对第一多聚核苷酸进行酶切以得到第一标签的限 制性内切核酸酶所识别,所述第二限制性识别位点被能够对第二多聚核苷酸 进行酶切以得到第二标签的限制性内切核酸酶所识别。特别地,所述接头可 以含有第一限制性识别位点和第二限制性识别位点,所述第一限制性识别位 点被能够对第一多聚核苷酸进行酶切以得到第一多聚核苷酸的3'末端的第一限制性内切核酸酶所识别,所述第二限制性识别位点被能够对第二多聚核苷酸进行酶切以得到第二多聚核苷酸的5'末端的第二限制性内切核酸酶所 识别。所述第一限制性识别位点和所述第二限制性识别位点可以被相同的或 不同的限制性内切核酸酶所识别。根据另一方面,所述第一多聚核苷酸还可以被能够识别第三识别位点的第三限制性内切核酸酶所酶切,以得到第一多聚核苷酸的5,末端;所述第二 多聚核苷酸被能够识别第四识别位点的第四限制性内切核酸酶所酶切,以得 到第二多聚核苷酸的3'末端。根据这个实施方式,至少一个第一标签通过连 接所述第一多聚核苷酸的5'末端和3'末端获得,至少一个第二标签通过连接 所述第二多聚核苷酸的5,末端和3'末端获得。所述第三限制性识别位点和第 四限制性识别位点可以被相同的或不同的限制性内切核酸酶所识别。其它的 识别位点可以包括在分别连接所述第一多聚核苷酸的5'末端和所述第二多 聚核苷酸的3'末端的衔接头中。可供选择性地,所述第三限制性识别位点和 第四限制性识别位点可以存在于载体中,该载体中插有第一多聚核苷酸-接 头-第二多聚核苷酸结构。在这种情况下,所述第三限制性识别位点与所述 第一多聚核苷酸的5'末端侧翼连接,所述第四限制性识别位点与所述第二多 聚核苷酸的3'末端侧翼连接。所述分离的寡核苷酸的核酸-蛋白质复合物可以为染色质结构的一部 分。与感兴趣的蛋白结合的核酸片段可以为含有能够与感兴趣的蛋白结合的 区域(例如,组蛋白结合位点)的任何核酸片段。所述多聚核苷酸可以为 DNA或RNA。另一个方面,本发明提供了一种寡核苷酸连环体,该寡核苷酸连环体含 有至少两个分离的寡核苷酸,每个分离的寡核苷酸含有至少一个第一标签和 至少一个第二标签,其中,所述第一标签和所述第二标签为核酸-蛋白质复 合物的标签。特别地,本发明提供了一种寡核苷酸连环体,该寡核苷酸连环体含有至少两个分离的寡核苷酸,每个分离的寡核苷酸含有至少一个第一标 签和至少一个第二标签,其中,所述第一标签为第一多聚核苷酸的标签,所 述第二标签为第二多聚核苷酸的标签,所述第一多聚核苷酸和所述第二多聚 核苷酸源自核酸-蛋白质复合物。所述连环体还可以含有至少一个接头。所 述接头可以含有至少一种限制性内切核酸酶的识别位点。此外,所述连环体 的每一个分离的寡核苷酸均可以含有至少一种限制性内切核酸酶的识别位 点。所述至少一个限制性内切核酸酶识别位点包括在所述至少一个接头中和 /或至少一个衔接头中。所述接头可以插在所述标签之间,或者所述接头可以定位在至少一个标 签的上游和/或下游。所述接头可以含有至少一种限制性内切核酸酶的识别位点。所述至少一种限制性内切核酸酶的识别位点可以为lis型限制性内切核酸酶的识别位点或归巢限制性内切酶的识别位点。所述连环体的每一个寡核 苷酸的第一标签可以含有源自所述第一多聚核苷酸的5'末端和3'末端;所述第二标签可以含有源自所述第二多聚核苷酸的5'末端和3'末端。本发明的寡核苷酸或连环体可以插入载体和/或细胞中。所述细胞可以 为细菌细胞。所述多聚核苷酸核酸-蛋白质复合物可以为染色质结构的一部分。所述 多聚核苷酸可以被定位在同一个染色体上,或者可以被定位在不同的染色体上。在另一方面,本发明提供了一种寡核苷酸文库或者含有至少一种寡核苷 酸的寡核苷酸连环体文库,所述寡核苷酸含有至少一个第一标签和至少一个 第二标签,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第 二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核苷酸-蛋白质 复合物。所述文库中的至少一种寡核苷酸可以含有至少一个接头。所述接头可以插在所述标签之间,或者所述接头可以定位在至少一个标签的上游和/或下 游。所述第一标签可以含有源自所述第一多聚核苷酸的5'末端和3'末端;所述第二标签还含有源自所述第二多聚核苷酸的5'末端和3'末端。另一方面,本发明提供了一种制备至少一种分离的寡核苷酸的方法,该方法包括(a) 提供核酸-蛋白质复合物;(b) 制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中, 所述第一标签和所述第二标签得自核酸-蛋白质复合物;和(c) 分离所述寡核苷酸。特别地,本发明提供了一种制备至少一种分离的寡核苷酸的方法,该方 法包括(a) 提供核酸-蛋白质复合物;(b) 制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中, 所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所 述第一多聚核苷酸和所述第二多聚核苷酸得自核酸-蛋白质复合物;和(c) 分离所述寡核苷酸。在一个实施方式中,本发明此方面的步骤(b)包括(i) 插入至少一个接头,该接头含有至少一个限制性内切核酸酶识别位 点,禾口(ii) 使用能够识别位于所述接头中的至少一个识别位点的至少一种限制 性内切核酸酶,对第一多聚核苷酸和第二多聚核苷酸进行酶切,以形成寡核 苷酸,该寡核苷酸含有第一标签、第二标签和位于所述标签之间的接头,所 述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸。在另一个实施方式中,本发明此方面的步骤(b)包括(i)在所述复合物的第一多聚核苷酸和第二多聚核苷酸之间插入至少一个接头,该接头含有至少一个限制性内切核酸酶识别位点;(ii) 在第一多聚核苷酸的5'末端和第二多聚核苷酸的3'末端分别加入至 少一个限制性内切核酸酶识别位点;(iii) 使用能够识别至少一个识别位点的至少一种限制性内切核酸酶,对 第一多聚核苷酸和第二多聚核苷酸进行酶切,以获得酶切片段;和(iv) 连接所述酶切片段以形成寡核苷酸,该寡核苷酸含有第一标签、第 二标签、含有每个多聚核苷酸的5'末端和3'末端的标签和插入在该标签之间 的接头,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核 苷酸,步骤(ii)中的至少一种限制性内切核酸酶的识别位点为衔接头或载体的 一部分。所述多聚核苷酸可以通过将光活化成分加入到感兴趣的核酸(例如, DNA)和/或蛋白中而从核酸-蛋白质复合物中获得,而核酸/蛋白质复合物可 以通过抗体调节的沉淀或亲和力介导的技术进行分离。这种基于亲和力的技 术的例子包括链霉亲和素/生物素、谷胱甘肽-S-转移酶/谷胱甘肽基质、麦 芽糖结合蛋白/直链淀粉基质的相互作用。另一方面,本发明提供了一种用于检测和/或识别核酸-蛋白质复合物中 的至少两种多聚核苷酸的方法,该方法包括(a) 提供核酸-蛋白质复合物;(b) 制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中, 所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所 述第一多聚核苷酸和所述第二多聚核苷酸得自核酸-蛋白质复合物;(c) 对所述寡核苷酸进行测序;和(d) 根据所述第一标签和所述第二标签的核苷酸序列对所述至少两种多 聚核苷酸进行定位,从而对所述至少两种多聚核苷酸进行检测和/或识别。在步骤(c)中进行测序之前,可以对步骤(b)中得到的寡核苷酸进行扩增。所述扩增可以通过聚合酶链式反应进行。在扩增后但在步骤(C)中的测序之 前,可以对扩增的寡核苷酸进行至少一个纯化的步骤。所述至少一个纯化的 步骤可以为凝胶电泳。在测序前,本发明的寡核苷酸可以与至少一个通过的步骤(a)-(b)获得的 另外的寡核苷酸连接。通过桑格法(Sanger method)或多重测序分析如焦磷酸(pyros叫uencing) 测序技术来进行测序。所述检测和/或识别可以用于所述多聚核苷酸的转移或易位。因此,所 述方法可以用于对核酸-蛋白质复合物如位于染色质中的核酸-蛋白质复合物 中彼此临近的多聚核苷酸和/或基因进行检测和/或识别。另外,与感兴趣的 蛋白结合的核酸片段可以为含有能够与感兴趣的蛋白结合的区域(例如,组 蛋白结合位点)的任何核酸片段。所述多聚核苷酸和以为DNA或RNA。所述寡核苷酸可以被转染至至少一种细胞中。所述转染可以通过电穿孔 来实现。所述细胞可以为细菌细胞。所述多聚核苷酸和以为DNA或RNA。另一个方面,本发明提供了一种载体,该载体包括寡核苷酸、寡核苷 酸的连环体,或者寡核苷酸或连环体的文库。


图1显示了本发明的通过成对的末端(双)标签测序进行染色质相互作用 分析(CIA-PET)的方法的概述;图2显示了本发明的另一种通过两个成对的末端(双)标签进行染色质相 互作用(CIA-diPET)的方法的概述;图3显示了对CIA-PET进行定位;CIA-PETs表示的真实的相互作用区 域跨越两个不同的基因组区域,并且多重的CIA-PETs为簇生的;图4显示了用于CIA-PET的相关限制性内切核酸酶的识别序列;每个用N或X表示的碱基可以为任何一种核苷酸(A、 C、 G或T);含有N和 X的区域表示从不同的多聚核苷酸中得到的部分;图中从顶部至底部显示的 序列为SEQIDN0:1、 SEQIDN0:2、 SEQIDNO:36、 SEQIDNO:37、 SEQ IDNO:20、 SEQIDNO:21、 SEQIDNO:5、 SEQIDNO:6、 SEQIDNO:7、 SEQ IDNO:8、 SEQIDNO:13、 SEQIDNO:22、 SEQIDNO:23、 SEQIDNO:14、 SEQ ID NO:24、 SEQ ID NO:25 (SEQ ID No:24和SEQ ID No:25重复三次);图5显示了对CIA-diPET进行定位;CIA-diPET表示的相互作用区域跨 越两个不同的基因组区域;并且多重的CIA-diPET为簇生的;由CIA-diPET 的两个PETs带来的额外信息有益于将CIA-diPET定位到基因组中;图6显示了用于CIA-diPET的相关限制性内切核酸酶的识别序列;碱基 N或X可以表示任何一种核苷酸(A、 C、 G或T),并且它们来自不同的 多聚核苷酸;数字1和2表示来自两个区域的核苷酸或表示得自一个多聚核 苷酸的末端,数字3和4表示来自两个区域的核苷酸或表示得自另一个多聚 核苷酸的末端;数字(1、 2、 3、和/或4)可以表示任何一种核苷酸(A、 C、 G或T);图中从顶部至底部显示的序列为SEQIDNO:3、 SEQIDNO:4、 SEQ ID NO:26、 SEQ ID NO:27、 SEQ ID NO:28、 SEQ ID NO:29、 SEQ ID NO:30、 SEQIDNO:31、 SEQ ID NO:32、 SEQIDNO:33、 SEQ ID NO:34、 SEQ ID NO:35 (SEQ ID No:24和SEQ ID No:25重复三次);图7显示了含有多个独特克隆位点的载体pGIS8,载体pGIS8是可以用于本发明的载体的一个例子;图8显示了不具有插入的接头的寡核苷酸如何不能够被限制性内切核酸 酶所酶切的;因而,由于该寡核苷酸过长而通过电泳被去去除;图中从顶部 至底部显示的序列为SEQIDNO:3、 SEQIDNO:4、 SEQIDNO:38、 SEQID NO:39、 SEQIDNO隱40、 SEQIDNO:41、 SEQIDNO:42、 SEQIDNO:43、 SEQ ID NO:44禾卩SEQ ID NO:45;图9显示了如果仅仅将部分插头插入至寡核苷酸中,将如何导致寡核苷 酸被错误地酶切的,因而,由于该寡核苷酸过长而将通过电泳被去除;图中 从顶部至底部显示的序列为SEQIDNO:3、 SEQIDNO:4、 SEQIDNO:46、 SEQ ID NO:47、 SEQ ID NO:48、 SEQ ID NO:49、 SEQ ID NO:50、 SEQ ID NO:51、 SEQIDNO:52和SEQIDNO:53;图10显示了错误插入的接头是如何产生一些寡核苷酸的,这些寡核苷 酸过长并且其长度发生变化,因而可以通过电泳而被去除;图中从顶部至底 部显示的序列为SEQIDNO:3、 SEQ ID NO:4、 SEQ ID NO:54、 SEQ ID NO:55、 SEQIDNO:56、 SEQ ID NO:57、 SEQIDNO:58、 SEQIDNO:59、 SEQ ID NO:60、 SEQ ID NO:61 、 SEQ ID NO:62和SEQ ID NO:63;图11显示了载体pGIS8的核苷酸序列,载体pGIS8为已标出不同的限 制性内切核酸酶的识别位点的载体实例,所述序列为序列表中的SEQ ID NO:18和SEQIDNO:19。
具体实施方式
定义限制性内切核酸酶限制性内切核酸酶为能够切割双链DNA的酶。所 述限制性内切核酸酶可以切出两个切口, 一个切口穿过双螺旋的每一个磷酸 骨架而不对碱基产生破坏。酶切了的化学键可以通过称为连接酶的其它酶而 重新形成,从而将得自不同染色体或基因的限制性酶切片段拼接在一起,其 前提是它们的末端完全互补。II型酶识别特定的核苷酸序列,并在临近或位 于它们的识别序列位点中的确定的位点对DNA进行酶切。它们生成不连续 的限制性酶切片段和不同的凝胶带形式。lis型酶切开它们的识别序列的外 部一侧。Mmel与多数lis型限制性内切核酸酶一样生成可变的末端长度 (Dunn et al, 2002 showed that Mmel can cut 18/20 or 19/21 bases away in a19rough proportion of 1 :1)。因而,在所有图中给出的序列各自代表一种使用类 膜金属内肽酶后的常用变体。成对的末端双标签(PET)中间体还具有可变的长度(g卩,在克隆至pGIS8质粒和M PET中间体后的M和G衔接头DNA序列),因为所述多聚核苷酸 可以为不同的长度。in性酶还可以为限制性内切核酸酶-修饰酶的较大的联 合体。它们切割其识别序列的外部,并且它们需要在同一个DNA分子中具 有相反取向的两个这样的序列以完成酶切。归巢内切核酸酶为罕见的双链 DNA酶,该酶能识别较大的不对称位点(12-40个碱基对)和编码序列,该编 码序列通常嵌入在内含子(DNA)和内含肽(蛋白质)中。限制性内切核酸酶可 以进行酶切以使平末端或粘性末端具有突出端。粘性末端片段不仅可以与最 初切割的片段连接,还可以与任何具有相容性的黏性或粘性末端的其它片段 连接。这样,由不同的酶生成的末端可以为相容的。因此,粘性末端还可以 指能被连接的末端。多种II型限制性内切核酸酶能够对回文DNA序列进行 酶切。如果限制性内切核酸酶具有非简并回文序列的酶切位点,则由此产生 的所有末端是相容的。"回文"序列为在一条链上阅读的序列与反方向阅读 其互补链的序列相同的一种序列。这样,对于处理核酸链以获得回文的粘性 末端来说,可能使所述核酸链的末端互补并使该核酸链自环化 (self-circularize)。上下文中"回文"的意思与其在语言学上的使用的意思是 不同的。例如,序列GTAATG不是回文DNA序列,序列GTATAC是回文 序列。能够留下黏性或粘性末端的限制性内切核酸酶的例子包括BamHI、 EcoRI和HindIII。能够留下平整的、非黏性的、或非粘性的末端的限制性内 切核酸酶的例子包括BseRl和Alul。核苷酸核苷的磷酸酯;核酸(DNA或RNA)的基本结构单位。核苷 酸型碱基对通过氢键结合的化学碱基对中的一种,所述氢键连接具有两条 链的DNA分子或RNA分子的互补链;对于DNA,所述碱基对为腺嘌呤-胸腺嘧啶、鸟嘌呤-胞嘧啶;对于RNA,所述碱基对为腺嘌呤-尿嘧啶、鸟嘌 呤-胞嘧啶。短链的核苷酸称为寡核苷酸,较长链的核苷酸称为多聚核苷酸。 核苷酸可以与另外的核苷酸结合或连接。术语核苷酸可以与术语核酸互换使 用。伸长的核酸具有5'末端和3'末端。伸长的核酸的末端区域分别称为5' 末端和3'末端。关于多聚核苷酸的5,或3,末端,应该理解的是,含有具有多 聚核苷酸的真实5,或3,末端的多聚核苷酸的任何区域、片段、或全部。连环体由末端与末端相连的至少两个核苷酸单体序列组成,并且该连 环体可以被接头或间隔物随机地隔开。对于本发明的目的,根据本发明的方 法制备了含有至少两个寡核苷酸的连环体。克隆、无性繁殖从一个有机体向另一个有机体传递核苷酸,例如基因, 和/或通过遗传工程技术复制核苷酸。文库通常包含在一种或多种质粒中的克隆的核酸序列、寡核苷酸或多 聚核苷酸的集合体。载体能够将遗传物质从一个细胞转移至另一个细胞中的噬菌体、质粒、 或其它介质。得到、得自使用分子生物学方法、基因工程技术和操作技术赋予生物 材料如核酸和蛋白某些所需要的特性。术语得到和得自可以在本发明中互换 使用。扩增使核酸的拷贝数增加。通常使用的一种方法为聚合酶链式反应 (PCR)。也可以使用本领域技术人员所公知的其它扩增方法。转染或转化用于将外源分子引入细胞的任何方法。脂质转染、磷酸钙 沉淀、逆转录病毒释放、电穿孔、生物射弹转化仅仅是能够使用的技术中的 几个实例。染色质核酸与主要是组蛋白的蛋白质的复合物,位于细胞核中容易被 碱性燃料所染色,并在细胞分裂期间浓縮形成染色体。染色质是核酸-蛋白质复合物的一个例子。染色体区域可以与同一个染色体上的或不同的染色体 上的其它区域相互作用。因此,所述相互作用情况可以为染色体间或染色体 内的相互作用情况,并可以包括有关区域的遗传物质的重排。转移遗传信息在RNA加工水平的重排以形成新的嵌合的转录物。 易位遗传信息在基因组DNA水平的重排。核酸-蛋白质复合物遗传物质与蛋白质的相互作用,例如,染色质中 发现的;或者转录因子与伸长的核酸的结合。DNA-蛋白质-DNA(DPD)是更 特殊的结构,其中,蛋白质结合在感兴趣的两个伸长的核酸(DNA)之间。可 以将伸长的核酸如DNA作为DNA的标签或识别序列。标签、标签-接头结构标签或标记是核酸的识别序列,标签或标记涉 及源自任何临近DNA区域的5,-或3,-的大部分核酸序列(末端;通常为 18-20bp),或者标签可以含有5,-和3,-大部分的核酸序列或任何临近的DNA 区域的两个末端。接头为人工合成的核酸序列。因此,标签-接头-标签结构 是一种核酸排列,其中,接头插在两个标签之间。另一个可能的排列为接头 -标签-标签-接头结构,其中,接头与标签侧翼连接(即,接头被定位在至少 一个标签的上游和/或下游)。术语标签和标记在本发明中可以互换使用。双标签短核酸片段(通常为12-60 bp)衍生自多聚核苷酸的末端的标 签或标记。可以根据美国专利20050255501和/或20050059022的方法来制备 双标记,这些专利的内容在此一并引入作为参考。测序用于确定生物多聚体中的组分(在此情况下为核酸)的规则的方 法。所用的测序技术包括桑格法(Sanger method)及其改进的变化、以及焦 磷酸测序技术或测序的"454法"。在以下说明书中,提供细节、具体的量和参数以描述本发明的实施方式。 然而,对于本领域技术人员来说,本发明可以不以这些细节的方式来实现是 显而易见的。为了不使本发明含糊不清,可以不详尽地描述一些细节。为了实施发明的方法的具体的实施方式、用于实施本发明的其它实施方 式公开的内容也可以在此使用,并在此一并引入作为参考。特别是操作方法、 试剂、试验条件、限制性酶切位点、酶、载体、引物等等。特别地,很明显 本领域技术人员知道如何改变已公开的用于其它实施方式中的技术和材料 以适用本发明的实施方式。本领域的技术人员应该理解的是在此没有具体介绍的技术可以在标准的分子生物学参考书如分子克隆中找到(Molecular Cloning: A Laboratory Manual by Sambrook and Russell, Third Edition, 2001 , published by Cold Spring Harbor Laboratory Press)。描述本发明涉及一种用于对核酸复合物中,特别是对核酸-蛋白质复合物中 至少一种核酸序列或片段进行检测、识别、和/或制备的新方法。特别地,本 发明的方法提供了一种对核酸-蛋白质复合物中至少两种核酸序列或片段进 行检测、识别、和/或制备的方法。本发明还提供了寡核苷酸和/或寡核苷酸 连环体。根据一个方面,本发明提供了一种染色质相互作用的分析(CIA)方法。 染色质相互作用的分析被设计成用于捕获关于远端控制区和染色体间的相 互作用的全程过程的新信息。该方法被设计成用于在相距较远的位置和不同 的染色体之间识别由特定的DNA结合蛋白如组蛋白介导的染色质相互作用 情况。本发明提供了以检测这样的DNA连接的CIA法的两个实施方式,艮P, CIA-PET法,该方法从两个连接的DNA片段中的每一个中得到单一的标签 标记(约20bp)以形成标签1-接头-标签2(还称作"第一标签-接头-第二标签") 成对的末端双标签(PET)结构(图1);禾卩CIA-diPET法,该方法得到两个 成对的末端双标签(PET)以在"PETl-接头-PET2"结构中表示两个相关的DNA片段,故称作diPET (图2)。可以使用多重测序技术如"454"焦磷 酸测序方法对CIA-PET和CIA-diPET的标签直接测序,或者将CIA-PET和 CIA-diPET的标签连接以用于克隆并使用常规的测序方法进行测序。因此,本发明提供了一种制备至少一种分离的寡核苷酸的方法,该方法 包括-(a) 提供核酸-蛋白质复合物;(b) 制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中, 所述第一标签和第二标签得自核酸-蛋白质复合物;和(c) 分离所述寡核苷酸。所述第一标签可以得自第一多聚核苷酸,所述第二标签可以得自第二多 聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白质复合物。 所述步骤(b)可以包括(i) 插入至少一个接头,该接头含有至少一个限制性内切核酸酶识别位 点,禾口(ii) 使用能够识别位于所述接头中的至少一个识别位点的至少一种限制 性内切核酸酶,对第一多聚核苷酸和第二多聚核苷酸进行酶切,以形成寡核 苷酸,该寡核苷酸含有第一标签、第二标签和接头,所述第一标签得自第一 多聚核苷酸,所述第二标签得自第二多聚核苷酸。特别地,所述步骤(b)可以包括(i) 在所述复合物的第一多聚核苷酸和第二多聚核苷酸之间插入至少一 个接头,该接头含有至少一个限制性内切核酸酶识别位点;(ii) 在第一多聚核苷酸的5'末端和第二多聚核苷酸的3'末端分别加入至 少一种限制性内切核酸酶的识别位点;(iii) 使用能够识别至少一个识别位点的至少一种限制性内切核酸酶,对 第一多聚核苷酸和第二多聚核苷酸进行酶切,以获得酶切片段;和(iv)连接所述酶切片段以形成寡核苷酸,该寡核苷酸含有第一标签、第 二标签、和插在所述标签之间的接头,所述第一标签得自第一多聚核苷酸, 所述第二标签得自第二多聚核苷酸,所述标签含有各个多聚核苷酸的5'末端 和3'末端。本发明还提供了一种用于检测和/或识别核酸-蛋白质复合物中的至少两种多聚核苷酸的方法,该方法包括(a) 提供核酸-蛋白质复合物;(b) 制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中, 所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所 述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白质复合物;(c) 对所述寡核苷酸进行测序;和(d) 根据所述第一标签和第二标签的核苷酸序列对所述至少两种多聚核 苷酸进行定位,从而对所述至少两种多聚核苷酸进行检测和/或识别。所述接头序列在它的两个末端(图2和4)分别携带一个II型限制性内 切核酸酶的识别位点,因而,在II型限制性内切核酸酶消化后,可以分别从 两个连接的DNA片段中分离出一个标签序列标记(约20bp),以形成标签-接 头-标签结构,其中, 一个标签表示染色体的一个DNA区域,另一个标签表 示位于同一染色体或不同的染色体上的远端区域的基因座。这种成对的末端 双标签结构称作"CIA-PET",通过连接至更长的伸长DNA中可以有效地 对其进行测序,或者通过测序对其进行直接分析。可供选择地,接头序列可以与两个标签侧翼连接,以生成接头-标签-接 头结构。在这种方法中,所述核酸-蛋白质复合物,例如天然DNA-蛋白质-DNA (DPD)复合物,可以通过合适的固定剂如甲醛、乙醛、或甲醇而被交联。然 后,可以通过超声波、水力剪切(Hydroshearing)(Hydroshear, Gene Machines)、皮下注射器针头的反复抽提、或通过限制性内切核酸酶的酶解作用将交联的DPD复合物片段化。源自不同染色体的DNA片段或相距较远的DNA片段 被DPD复合物中的DNA结合蛋白所束缚。与需要这些DNA片段是什么的 已有信息或推测以生成PCR引物的3C技术不同,束缚在DPD复合物中的 具有远端相关性的DNA片段的末端可以使用特定的接头通过连接而结合。所述接头(约20bp)含有两种II型限制性内切核酸酶的识别位点,这 些识别位点能够连接被各个DPD复合物中的蛋白质所束缚的不同DNA片段 的末端。然后,可以通过成对的末端双标签(PET)策略(US20050255501)对两 个相关的DNA片段的DNA连接位点进行标记。优选lis型限制性内切核酸 酶的识别位点。除了II型限制性内切核酸酶以外,也可以使用任何其它适合 的限制性内切核酸酶,包括III型或归巢限制性内切酶。因而,本发明一方面提供了一种用于识别相距较长距离的染色质相互作 用情况和不同的染色体之间的染色质相互作用情况的方法,所述染色质相互 作用情况由特定的DNA结合蛋白如组蛋白调节。另一方面,本发明提供了 一种分离的寡核苷酸,该寡核苷酸含有至少一个第一标签和至少一个第二标 签,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚 核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白质复合物。 所述标签与核酸-蛋白质复合物中的染色质区域相对应。然后,可以对这些 标签进行测序,以对染色质相互作用情况进行分析、识别、和/或检测(图3 和5)。所述分离的寡核苷酸还可以含有至少一个接头。所述接头可以插在所述 标签之间,或者所述接头可以定位在至少一个标签的上游和/或下游。所述接 头可以含有至少一个限制性内切核酸酶识别位点;所述至少一种限制性内切 核酸酶的识别位点可以不对称,所述至少一个限制性内切核酸酶识别位点可 以为lis型限制性内切核酸酶或归巢限制性内切酶的识别位点。可供选择地,所述至少一个第一标签可以含有源自第一多聚核苷酸的5' 末端和3'末端,所述至少一个第二标签可以含有源自第二多聚核苷酸的5' 末端和3'末端。所述分离的寡核苷酸还可以含有至少一个接头。所述接头可 以插在所述标签之间,或者所述接头可以定位在至少一个标签的上游和/或下 游。所述接头可以含有至少一个限制性内切核酸酶识别位点;所述至少一个 限制性内切核酸酶识别位点可以不对称,所述至少一个限制性内切核酸酶识 别位点可以为lis型限制性内切核酸酶或者归巢限制性内切酶的识别位点。所述接头可以含有第一限制性识别位点和第二限制性识别位点,所述第 一限制性识别位点可以被能够对第一多聚核苷酸进行酶切以得到第一标签 的限制性内切核酸酶所识别;所述第二限制性识别位点可以被能够对第二多 聚核苷酸进行酶切以得到第二标签的限制性内切核酸酶所识别(图1和4)。所述接头可以含有第一限制性识别位点和第二限制性识别位点,所述第 一限制性识别位点可以被能够对第一多聚核苷酸进行酶切以得到第一多聚 核苷酸的3'末端的限制性内切核酸酶所识别;所述第二限制性识别位点可以 被能够对第二多聚核苷酸进行酶切以得到第二多聚核苷酸的5'末端的的限 制性内切核酸酶所识别。可供选择地,所述接头可以含有第一限制性识别位 点和第二限制性识别位点,所述第一限制性识别位点可以被能够对第一多聚 核苷酸进行酶切以得到第一多聚核苷酸的5'末端的限制性内切核酸酶所识 别;所述第二限制性识别位点可以被能够对第二多聚核苷酸进行酶切以得到 第二多聚核苷酸的3'末端的的限制性内切核酸酶所识别。所述第一多聚核苷酸还可以被能够识别第三识别位点的第三限制性内 切核酸酶所酶切,以得到第一多聚核苷酸的3'末端;所述第二多聚核苷酸被 能够识别第四识别位点的第四限制性内切核酸酶所酶切,以得到第二多聚核 苷酸的5'末端;所述至少一个第一标签是通过连接所述第一多聚核苷酸的5' 末端和3'末端而获得的,所述至少一个第二标签是通过连接所述第二多聚核苷酸的5'末端和3'末端而获得的(图2和6)。所述第一和第三识别位点可 以具有相同的序列,所述第二和第四识别位点可以具有相同的序列。所述分离的寡核苷酸的核酸-蛋白质复合物可以为染色质结构的一部 分。与感兴趣的蛋白结合的核苷酸片段可以为含有能够与感兴趣的蛋白结合 的区域(例如,组蛋白结合位点)的任何核苷酸片段。所述多聚核苷酸可以 为DNA或RNA。可以将得到的CIA-PET序列定位到参考基因组序列中以确定染色质相 互作用的连节点的位置,所述染色质作用可以是远程的染色体内(位于同一 染色体)或染色体间(位于不同的染色体)作用。该信息可以用于研究细胞 核内染色体的3-维组织结构、由转录因子调节的相距较远的和跨越不同染色 体的协同基因调控、和其它后续的相关的问题(图3和5)。通过全部可用的基因组序列,能够发展全基因组方法以对所有潜在的染 色质相互作用进行识别。全基因组嵌合列阵是一种用于基因组问询的有效方 法,其中,嵌合了 20-60mer的寡核苷酸以覆盖微列阵中的整个基因组,并 且将具有生物量的DNA探针与所述列阵杂交,可以读出所有列阵单元的杂 交信号强度的图谱,以用于遗传成分的问询。所述嵌合列阵被证明能够用于 识别外显子,并且当与ChIP(ChIP-芯片)耦合时还可以用于定位转录因子的 结合位点。虽然基于列阵的方法由于具有较高的多元和平行属性而有效,但 很难想象基于杂交的检测能够对染色质相互作用的两个DNA片段的非线性 关系进行检测。根据一个实施方式的寡核苷酸的制备所述核酸-蛋白质复合物可以通过染色质免疫沉淀法(CMP)得到。 染色质免疫沉淀法(CMP)ChIP被用于富集,因而能够对结合有特定蛋白如组蛋白的遗传区域进 行识别,以及对核酸-蛋白质复合物中的接合到核酸的其它蛋白质进行识别(综述见Tavemer等,Genome Biol, 2004. 5(3): p. 210)。目的在于在它们相 互作用的位点使DNA与蛋白质交联。通过向培养基中的活细胞中添加适合 的固定剂如甲醛、乙醛、或甲醇,可以快速有效地实现交联。然后制备这些固定的细胞的粗提物,并通过超声波、水力剪切、皮下注 射器针头的反复抽提、或通过限制性内切核酸酶的酶解作用,将染色质剪切 至平均大小通常约为lkb;然后与感兴趣的DNA结合蛋白(例如,转录因 子或组蛋白)的抗体一起用于免疫沉淀反应。然后将在每一免疫沉淀反应中 富集的DNA片段解除连接并纯化,以通过多种方法对它们进行识别。使用 ChIP的优点在于,通过快速的交联染色质和其它非组蛋白蛋白质,能够在 体内"冻结"基因调控的网络,因而,在理论上及时地提出了任意点调节系 统的"真实"图谱,所述优点,例如,避免了通过异源表达产生的潜在的假 象。最近,ChIP与全基因组结合(Lieb等,Nat Genet, 2001. 28(4): p. 327-34)、 与全染色体结合(Euskirchen等,Mol Cell Biol, 2004. 24(9): p. 3804-14)、和与 CpG岛结合(Weinmann等,Genes Dev, 2002. 16(2): p. 235-44),或者在"ChlP-芯片"或"芯片的ChIP" ( "ChlP-on-chip")法中与微阵列结合,这样能 够在基因组水平对蛋白质结合位点如转录因子结合位点(TFBS)进行定位(综 述见Buck和Lieb, 2004)。虽然这种方法的有效性在小基因组如酵母基因组 中得到了证明(Lieb等,Nat Genet, 2001. 28(4): p. 327-34),但是生产用于更复 杂的生物体的全基因组微阵列的费用和复杂度仍然是限制因素。CpG岛微阵列含有较高CpG含量的人基因组片段,并且由于CpG岛通 常对应于增强子区域(Antequera and Bird, Proc Natl Acad Sci USA, 1993. 90(24): p. 11995-9),这样的微阵列显示出可能的妥协(compromise)。然而, 假定的蛋白质结合位点的定位仍然需要通过检查在列阵上观察到的富含 CpG的探针的基因组DNA的上游和下游(通常l-2kb,超声波降解的ChIP片段的大约尺寸)进行间接地推断。可供选择地,先前已经尝试了对富含ChIP的DNA片段进行克隆和测序, 但仅取得了有限的成功。其问题在于ChIP富集的标靶从相对于全基因组的 较高背景中获得的。即使100倍富集的特定标靶仍仅仅表示ChIP文库中的 一小部分克隆,使得标准的DNA测序成为一种昂贵的方案。因此,在这种 情况下,对ChIP克隆进行测序并不是一种识别富含标靶的好方法。还建议 将基因表达的连续分析(SAGE)和大规模平行表示测序技术(MPSS) (Brenner 等,Nat Biotechnol, 2000. 18(6): p. 630-4)用作检测ChIP富集的定量工具,根 本原理是与非特异的背景相比,从富含ChIP的DNA片段生成的标签的数 量较多。然后,可以将这些标签定位到基因组序列中以对感兴趣的遗传区域进行 识别(即,假定为l-2kb,表示超声波降解的片段)。虽然20bp的SAGE和 MPSS标签在大多数的情况下应该具有足够的特异性以确定特定的基因组位 置;当定位到基因组中时,仍然需要对所述标签的上游和下游大约l-2kb的 所有序列进行检测。这与CpG岛微列阵法面对的问题相同。此外,使用这 些方法的全面覆盖取决于可得到的限制性内切核酸酶的识别位点(定位酶位 点(mapping-enzyme site))的前提;如果某一基因区域缺少识别位点,则 特定的标签将错过相应的ChIP片段,因而,该区域将成为基因组中的"盲 点"。从上述的问题可以清楚地看出,促进基因组水平转录调控的分析所需要 的是能够准确快速地找到侧翼于连接蛋白质结合区域的核酸序列的方法,以 该方法作为全基因组阵列的可供选择的方法。在这一点上,本发明提供的新 方法具有多种优点(i)由本发明的一种方法得到的标签序列进行定位具有更 高的特异性,因为已知每个标签均源自被5,和3'标记所包围的连续的DNA 片段;这种信息使感兴趣的基因组区域的精确定位更容易,并不需要重复地对标准的SAGE或MPSS标签的上游和下游的l-2kb的任意一个序列进行检 测;(ii)本发明的方法不需要存在任何的定位酶位点;(iii)测序前标签的连接 意味着可以在一次序列读取中识别多个标签;(iv)该区域是基因簇中所有定 位标签的共有区域(即,重叠的),因此,对正在谈论的核酸-蛋白质复合 物中的DNA区域进行确定。 标签和双标签为了本发明的目的,所述标签为得自核酸分子的核苷酸序列或标记,并 且所述标签表示从其中能够得到该标签的多聚核苷酸。意欲被縮短或表示的 多聚核苷酸可以为RNA、 mRNA、基因组DNA、全长cDNA、或cDNA。在本发明中,存在本发明的寡核苷酸中的两个标签还可以被称为双标 签。与标签一样,双标签比其源自的或表示的初始核酸分子短。优选情况下, 所述双标签必须比初始核酸分子短的多。作为"縮短"的结果,所述双标签 可以基本含有初始核酸分子的5'末端区域(还表示为5'标签)和/或3'末端 区域(还表示为3,标签)。因此,初始核酸分子的最初位于5,标签和3,标签 之间或内部部分并不包括在双标签中。本发明的双标签保留有初始核酸分子 的多数信息特征,即,所述核酸分子的初始和终止标记。形成有5'标签和3'标签的双标签具有相同或不同的大小。优选情况下, 它们具有相同数量的核苷酸。所述双标签可以为各种大小,但需要有意义地 和有益地超过其源自的亲本序列的大小。优选的标签和双标签的大小取决于 基因组的复杂程度。相对于细菌基因组,大小约为8bp-16bp的标签是足够 的,但相对于复杂基因组如人基因组,可以考虑16-20bp (也就是,32-40bp 双标签)的标签。 一般而言,所述双标签的大小为约12-60bp。为了本发明的目的,术语5'-末端、5,-端、和5,-标签是相互等同的,并 可以互换使用。同样,术语3,-末端、3,-端、和3,-标签是相互等同的,并可 以互换使用。在意欲被縮短或表示的初始核酸分子或核酸分子中的部分中,315'-端和3'-端分别表示临近所述分子的末端的区域或部分,和与所述分子中 部相距最远的区域或部分。根据本发明的一个方面,双标签中所含的5'-标签和3'-标签为被限制性 内切核酸酶分别在临近意欲被縮短或表示的核酸分子或其部分的5'-端和3'-端位置酶切的分子区域。因此,双标签的大小可以取决于限制性内切核酸酶 或所使用的酶。相应地,本发明提供了一种分离的寡核苷酸,该寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白质复合物。所述寡核苷酸可以进一步含有插在所述标签之间 的至少一个接头。所述寡核苷酸还可以进一步含有插在标签侧翼的至少一个接头(即,至少一个接头可以定位在至少一个标签的上游和/或下游)。 接头特别地,各个接头可以含有至少一个第一限制性内切核酸酶酶切位点; 和至少一个第二临近的限制性内切核酸酶酶切位点。因此,每个接头中存在 的限制性内切核酸酶的酶切位点的数量可以为一个或多个,优选两个。所述 限制性酶切位点可以为不对称的限制性酶切位点。不对称的限制性酶切位点 的例子为归巢限制性内切酶不对称识别位点、和一部分II型(或II类)识 别位点。优选能在它的识别位点的一侧切割的II型限制性内切核酸酶。然而,任何本领域已知的位点均可以使用。能够识别核酸分子中至少一 个限制性酶切位点的限制性内切核酸酶以及可以使用哪些限制性内切核酸 酶对本领域技术人员来说是显而易见的。(例如,见,Current Protocols in Molecular Biology, Vol. 2, 1995, Ed. Ausubel, et al., Greene Publish. Assoc. & Wiley Interscience, Unit 3.1.15; New England Biolabs Catalog, 2005)。 一些可能的限制性酶切位点和相应的限制性内切核酸酶将在下文中进行描述。作为一个例子,为了制备根据本发明的双标签,可以使用能够识别限制 性酶切位点的限制性内切核酸酶。特别是IIS型酶,例如类膜金属内肽酶。 当使用类膜金属内肽酶时,该酶识别两个衔接头中每一个衔接头的内部序列,所述衔接头与意欲被縮短的核酸分子侧翼连接;而在内部切割核酸分子 以形成含有17-21个核苷酸的标签(见图1和4中表示的类膜金属内肽酶酶 切)。两个这样的标签可以通过钝化和连接的额外处理以形成含有34-38个 核苷酸的双标签。因此,通过剪接或连接相同的核酸分子的5'末端和3'末端, 可以得到所述双标签。作为一个例子,可以引入不对称的位点。能够用于本发明的目的的不对 称位点序列为i)两个归巢限制性内切酶不对称识别位点序列;或ii)能够被 II型限制性内切核酸酶识别的限制性内切核酸酶不对称切割位点序列。New England Biolabs公司销售并描述了归巢限制性内切酶,并且在New England Biolabs目录中提供了不对称位点序列的描述。这些归巢限制性内切 酶识别位点序列为18-39bp。然而,在本发明中,识别位点序列并不限制于 这些序列也不限制于这些大小。优选情况下,能够切割不对称位点序列的限 制性归巢限制性内切酶选自由I-CeuI、 PI-SceI、 PI-PspI、和I-Scel所组成的 组中。然而,上述提及的目录并不是穷举的。本领域公知的其它归巢限制性 内切酶和在下文中公开的归巢限制性内切酶也包括在本发明的范围之内。II型限制性内切核酸酶的例子包括Aarl、 AceIII、 Alol、 Bael、 Bbr71、 Bbvl、 BbvII、 Bccl、 Bce831、 BceAI、 Bcefl、 Bcgl、 BciVI、 Bfil、 Binl、 BpII、 BsaXI、 BscAI、 BseMII、 BseRI、 Bsgl、 Bsml、 BsmAI、 BsmFI、 Bsp241、 BspCNI、 BspMI、 Bsrl、 BsrDI、 BstF51、 BtgZI、 Btsl、 Cjel、 CjePI、 Ecil、 Eco311、 Eco571、 Eco57MI、 Esp31、 FaII、 Faul、 Fokl、 Gsul、 HaeIV、 Hgal、 Hin41、 Hphl、 HpyAV、 Ksp6321、 MboII、 Mlyl、 Mmel、 MnII、 Plel、 Ppil、 Psrl、 RleAI、 Sapl、 SfaNI、 SspD51、 Sthl321、 Stsl、 TaqII、 TspDTI、 TspGWI、TspRI、和TthlllII (Rebase Enzymes 网站的列表http:〃rebase.neb.com/ gi-bin/outsidelist;还可见Szybalski, W., 1985, Gene, 40:169)。然而,上述列
表并不是穷举的。本领域公知的其它II型限制性内切核酸酶和在下文中公幵 的II型限制性内切核酸酶也包括在本发明的范围之内。
限制性酶切位点和多个II型限制性内切核酸酶的切割位点的例子为(括 号内为识别位点和切割位点)BbvI(GCAGC 8/12)、 HgaI(GACGC 5/10)、 BsmFI(GGGAC 10/14)、 SfaNI(GCATC 5/9)、和Bsp I (ACCTGC 4/8)。
还可以使用人工的限制性内切核酸酶。这些内切核酸酶可以通过蛋白质 工程技术制备得到。例如,通过插入物设计了内切核酸酶FokI,从而使其在 远离位于DNA底物的两条链上的识别位点处切割一个核苷酸。见Li和 Chandmsegaran, Proc. Nat. Acad. Sciences USA 90:2764-8, 1993。这样的技术 可以用于制备具有期望的识别序列和期望的从识别位点至切割位点间的距 离的限制性内切核酸酶。
在本发明的条件下,本发明的分离的寡核苷酸可以与其它分离的寡核苷 酸结合或连接,以形成寡核苷酸连环体。为了测序的目的或克隆至适合的质 粒或载体中的目的,可以将任何数量的寡核苷酸结合在一起。
相应地,另一方面,本发明提供了一种寡核苷酸连环体,该寡核苷酸连 环体含有至少两个分离的寡核苷酸,每一个分离的寡核苷酸含有至少一个第 一标签和至少一个第二标签,其中,所述第一标签得自第一多聚核苷酸,所 述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得 自核酸-蛋白质复合物。
寡核苷酸连环体中的分离的寡核苷酸可以进一步含有至少一个接头。所 述接头可以插在所述标签之间。可供选择地,接头可以与标签侧翼连接。所 述接头可以含有至少一种限制性内切核酸酶的识别位点;该至少一种限制性 内切核酸酶的识别位点可以为lis型限制性内切酶的识别位点。在一个实施方式中,寡核苷酸连环体的第一标签可以含有得自第一多聚核苷酸的3'末端,所述第二标签还含有得自第二多聚核苷酸的5'末端。连环 体寡核苷酸的每一个分离的寡核苷酸还可以含有至少一个插在所述标签之 间的接头。在另一个实施方式中,寡核苷酸连环体的第一标签可以含有得自 第一多聚核苷酸的5'末端,所述第二标签还含有得自第二多聚核苷酸的3' 末端。在另一个实施方式中,寡核苷酸连环体的第一标签可以含有得自第一多 聚核苷酸的5'末端和3'末端,所述第二标签还含有得自第二多聚核苷酸的5' 末端和3'末端。寡核苷酸连环体的分离的寡核苷酸还可以含有至少一个插在 所述标签之间的接头。这些实施方式中每一个实施方式的接头均可以含有至少一种限制性内 切核酸酶的识别位点;该至少一种限制性内切核酸酶的识别位点可以为lis 型限制性内切核酸酶的识别位点。寡核苷酸的连环体可以插入至载体或细胞中,所述细胞可以为细菌细胞。寡核苷酸的连环体可以源自染色质结构。所述多聚核苷酸定位在同一个 染色体上,或者所述多聚核苷酸定位在不同的染色体上。这些是优选的连环体时,显然能够被连结的本发明的寡核苷酸的数量取 决于寡核苷酸的长度,并且不需要过多的试验而由本领域技术人员容易地决 定。连环体形成后,可以将多个标签克隆至用于序列分析的载体,或者可以 通过本领域技术人员所公知的技术不经过克隆而直接对双标签或连环体进 行测序。因此,双标签的连接能够允许在单个载体或克隆中以系列的方式通 过对多个双标签进行序列分析而对核酸分子如全长cDNA分子进行有效地 分析。在提及术语载体或重组载体时,还可以使用通过双标签基因序列的插入或合并而进行操作的质粒、病毒、或本领域公知的其它载体。这种载体含有 能够促进有效转录的启动子序列。所述载体代表性地含有复制起始区、启动 子、和特定的基因,该基因提供了选择转化的细胞的表型。例如,适用于本
发明的载体包括:pBlueScript (Stratagene, La JoIIa, CA); pBC, pZErO隱l (Invitrogen, Carlsbad, CA);禾卩pGEM3z (Promega, Madison, WI)或这些载体的
修饰载体;以及本领域技术人员公知的其它类似的载体。为了实现特定的目 的,对pGEM3z载体进行修饰,并将这种修饰的载体称为pGIS8(图7和11)。 在美国专利no.4,766,072,中也公开了pGEM载体,该专利引入本文作为参 考。
为了生产能够衍生出标签或双标签的亲代多聚核苷酸或核酸分子,可以 使用合适的载体作为全长文库。相应地,本发明范围内的合适的载体是那些 载体的主链不包括相同的限制性酶切位点的载体,所述限制性酶切位点包括 在在所述多聚核苷酸插入后与所述多聚核苷酸或所述双标签侧翼连接的衔 接头中。优选地,本发明提供了一种载体,其中,该载体骨架(除了在插入 多聚核苷酸时被除去的位于含有多克隆位点的填充片断(stuffer)区域外)不 含有第一限制性酶切位点和包括在所述衔接头中的第二限制行酶切位点或 其它限制性酶切位点。特别地,所述载体不含有至少II型限制性酶切位点(例 如lis型限制性酶切位点)和至少包括在所述衔接头中的第二限制性酶切位 点或其它限制性酶切位点。更优选地,所述载体骨架(除了在插入多聚核苷 酸时被除去的位于含有多克隆位点的填充片断区域外)不含有Mmel和 BamHI的酶切位点。
在填充片段外部的任何区域不含有MmeI的酶切位点的载体的例子为图 7禾口 11所示的载体pGIS8。在pGIS8中,Mmel的识别位点通过诱变而被除 去。
相应地,本发明提供了一个寡核苷酸文库,该寡核苷酸文库包括至少一种寡核苷酸,该寡核苷酸含有至少一个第一标签和至少一个第二标签,所述 第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第 一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白质复合物。本发明还提供了 一个根据本发明的寡核苷酸连环体文库。寡核苷酸文库中的至少一种寡核苷酸可以含有插在所述标签之间的至 少一个接头。可供选择地,接头可以替换性地与标签侧翼连接。所述第一标签可以含有得自第一多聚核苷酸的5'末端和3'末端,第二标签还含有得自第 二多聚核苷酸的5'末端和3'末端。所述多聚核苷酸核酸-蛋白质复合物可以为染色质结构的一部分。所述 多聚核苷酸可以定位在同一个染色体上,或者所述多核苷酸可以被定位在不 同的染色体上。根据一个方面,所述寡核苷酸被扩增。例如,通过PCR或其它已知的 扩增方法。可以根据双标签的序列的信息来制备PCR引物和探针序列。因 此,可以使用与载体内部特定区域相应的适合的PCR引物。这些区域与含 有双标签和衔接头的寡核苷酸侧翼连接。可以通过连接(自环化)反应直接 进行PCR以得到短PCR产物(例如200bp)。然后,可以使用能够识别至少第二限制性酶切位点(位于衔接头内)的 酶,对这些含有所需要的双标签的PCR产物进行酶切,以得到所需要的短 粘性双标签。可以使用作为能够识别第二限制性酶切位点或其它限制性酶切 位点的限制性内切核酸酶,例如,BamHI,并生成50bp的粘性双标签。这 种扩增步骤的优点在于双标签的生成不需要制备双标签文库的扩增物,这可 以通过不转化带有自环化的标记的质粒而避免。随后可以从载体中切出扩增 的寡核苷酸(例如,用BamHI消化),并将该扩增的寡核苷酸连接在用于 后续克隆和序列分析的长的伸长的DNA或RNA中(图1和2)。在一个特别的方面,本发明公开了cDNA文库,其中,所述寡核苷酸含有至少一个双标签,并且,其中所述双标签含有约34-38个核苷酸,并且所 述双标签是通过对从全长cDNA或它的片段的5'末端和3'末端核苷酸进行剪 接而得到的。
本发明的双标签文库是包括初始核酸分子的代表性文库。例如,当包括 核酸分子的文库是全长多聚核苷酸文库时,所述双标签文库是全长双标签代 表性文库。每一个双标签克隆具有表征特定的全长克隆的足够信息。更重要 的是,本发明的双标签含有源自核酸-蛋白质复合物的初始全长多聚核苷酸 的5,末端和3'末端。因此,所述双标签是所述多聚核苷酸代表性的结构。
因此,足以对双标签文库的双标签克隆进行测序和分析。在发现感兴趣 的双标签的情况下,例如,可以通过PCR从全长多聚核苷酸文库中选择并 制备相应的全长多聚核苷酸,或者通过逆转录聚合酶链式反应(RT-PCR)直接 从目标RNA样本中选择并制备相应的全长多聚核苷酸。
可以通过"454"测序(焦磷酸测序技术)法(Margulies等,2005)对本发 明的寡核苷酸进行测序,并将本发明的寡核苷酸连接至用于克隆以制备 CIA-PET文库的更长的伸长的DNA链中,随后使用桑格毛细管法(Sanger capillary method)进行领!l序。
因此,本发明提供了一种用于制备本发明寡核苷酸的方法、 一种从核酸 蛋白质复合物中检测和/或识别至少两种多聚核苷酸的方法、和一种制备含有 本发明的寡核苷酸和连环体的寡核苷酸的载体的方法。
因此,另一方面,本发明提供了一种制备至少一种分离的寡核苷酸的方 法,该方法包括
(a) 提供核酸-蛋白质复合物;
(b) 制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中, 所述第一标签和第二标签得自核酸-蛋白质复合物;和
(c) 分离所述寡核苷酸。特别地,本发明提供了一种制备至少一种分离的寡核苷酸的方法,该方 法包括
(a) 提供核酸-蛋白质复合物;
(b) 制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中, 所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所 述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白质复合物;和
(c) 分离所述寡核苷酸。
在一个实施方式中,本发明此方面的步骤(b)包括
(i) 插入至少一个接头,该接头含有至少一种限制性内切核酸酶的识别
位点,和
(ii) 使用能够识别位于所述接头中的至少一个识别位点的至少一种限制 性内切核酸酶,对第一多聚核苷酸和第二多聚核苷酸进行酶切,以形成寡核 苷酸,该寡核苷酸含有第一标签、第二标签和位于所述标签之间的接头,所 述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸。
在另一个实施方式中,本发明此方面的步骤(b)包括
(i) 在所述复合物的第一多聚核苷酸和第二多聚核苷酸之间插入至少一 个接头,该接头含有至少一种限制性内切核酸酶的识别位点;
(ii) 在第一多聚核苷酸的5,末端和第二多聚核苷酸的3'末端分别加入至 少一种限制性内切核酸酶的识别位点;
(iii) 使用能够识别至少一个识别位点的至少一种限制性内切核酸酶,对 第一多聚核苷酸和第二多聚核苷酸进行酶切,以获得酶切片段;和
(iv) 连接所述酶切片段以形成寡核苷酸,该寡核苷酸含有第一标签、第 二标签、和插在所述标签之间的接头,所述第一标签得自第一多聚核苷酸, 所述第二标签得自第二多聚核苷酸,所述标签含有各个多聚核苷酸的5'末端 和3'末端,步骤(ii)中的至少一个限制性内切核酸酶的识别位点为载体的一部分。所述核酸-蛋白质复合物可以通过染色质免疫沉淀方法得到。 另一方面,本发明提供了一种用于检测和/或识别核酸-蛋白质复合物中 的至少两种多聚核苷酸的方法,该方法包括(a) 提供核酸-蛋白质复合物;(b) 制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中, 所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白质复合物;(c) 对所述寡核苷酸进行测序;和(d) 根据所述第一标签和第二标签的核苷酸序列,对所述至少两种多聚 核苷酸进行定位,从而对所述至少两种多聚核苷酸进行检测和/或识别。在一个实施方式中,本发明此方面的步骤(b)包括(i) 插入至少一个接头,该接头含有至少一种限制性内切核酸酶的识别 位点,禾口(ii) 使用能够识别位于所述接头中的至少一个识别位点的至少一种限制 性内切核酸酶,对第一多聚核苷酸和第二多聚核苷酸进行酶切,以形成寡核 苷酸,该寡核苷酸含有第一标签、第二标签和位于所述标签之间的接头,所 述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸。在另一个实施方式中,本发明此方面的步骤(b)包括(i) 在所述复合物的第一多聚核苷酸和第二多聚核苷酸之间插入至少一 个接头,该接头含有至少一种限制性内切核酸酶的识别位点;(ii) 在第一多聚核苷酸的5'末端和第二多聚核苷酸的3'末端分别加入至 少一种限制性内切核酸酶的识别位点;(iii) 使用能够识别至少一个识别位点的至少一种限制性内切核酸酶,对 第一多聚核苷酸和第二多聚核苷酸进行酶切,以获得酶切片段;和(iv)连接所述酶切片段以形成寡核苷酸,该寡核苷酸含有第一标签、第 二标签、和插在所述标签之间的接头,所述第一标签得自第一多聚核苷酸, 所述第二标签得自第二多聚核苷酸,所述标签含有各个多聚核苷酸的5'末端 和3'末端,步骤(ii)中的至少一个限制性内切核酸酶的识别位点为衔接头或 载体的一部分。
在本发明中,所述核酸-蛋白质复合物可以通过染色质免疫沉淀方法获 得。所述核酸-蛋白质复合物可以通过将光活化成分加入到感兴趣的DNA和 /或蛋白质中而得到,而DNA/蛋白质复合物通过抗体介导的沉淀作用或亲和 力介导的技术进行分离。这种基于亲和力的技术的例子包括链霉亲和素/ 生物素、谷胱甘肽-S-转移酶/谷胱甘肽基质、麦芽糖结合蛋白/直链淀粉基质 的相互作用。
在步骤(c)中进行测序之前,可以对步骤(b)得到的寡核苷酸进行扩增; 所述扩增可以通过聚合酶链式反应进行。在扩增之后但在步骤(c)中的测序之 前,可以对扩增的寡核苷酸进行至少一个纯化步骤。所述至少一个纯化步骤 可以为凝胶电泳。
本发明的寡核苷酸可以与通过测序前的步骤(a)-(b)获得至少一种另外的 寡核苷酸连接以形成寡核苷酸的连环体。
通过桑格法或多重测序方法进行测序。所述多重测序方法可以为焦磷酸 测序方法。可以使用任何适合的测序方法,如由Bonetta(2006)描述的方法。 与感兴趣的蛋白结合的核酸片段可以为含有能够与感兴趣的蛋白结合的区 域(例如,组蛋白结合位点)的任何核酸片段。所述多聚核苷酸可以为DNA 或RNA。
所述多聚核苷酸可以定位在同一条染色体上,或者所述多核苷酸可以定 位在不同的染色体上。
所述检测和/或识别可以用于所述多聚核苷酸的转移或易位。所述寡核苷酸可以被转染至细胞中。所述转染的方法可以为电穿孔法。 所述细胞可以为细菌细胞。
下面将对本发明关于CIA-PET和CIA-diPET技术的这些方面的实施方 式进行详细地描述。
另一方面,本发明提供了一种载体,该载体包括本发明的寡核苷酸、寡 核苷酸连环体、或寡核苷酸的文库。
CIA-PET
在CIA-PET方法中(图1和4),通过连接,被位于DPD复合物中的 蛋白质束缚的DNA片段可以通过接头序列结合在一起。所述接头序列含有 两个MmeI位点。解交联后,所述连接的DNA将被Mmel消化,以释放出 成对的末端双标签(CIA-PET)。每一个CIA-PETs均含有两个侧翼连接的标签 (每个约20bp)的接头(图1中标记的步骤2)。因此,包含在CIA-PET 中的两个标签表示两个双标签遗传区域,该两个双标遗传签区域在线性基因 组序列中彼此远离,但它们之间相互作用并受特定的蛋白质如组蛋白蛋白质 调节。
将CIA-PETs用凝胶纯化后,将序列特异性衔接头加在CIA-PETs的两 侧,然后通过PCR进行扩增(图1中的步骤3)。可以通过多种测序方法如 "454"焦测序法和其它适合的测序方法直接对扩增的CIA-PETs进行测序, 或者将扩增的CIA-PETs连接在更长的DNA延伸物上,用于克隆以得到 CIA-PET文库,随后通过桑格毛细管法进行测序。将CIA-PET序列定位到 参照基因组序列中。染色质相互作用位点可以基于在特定的基因座中频繁出 现的CIA-PET来进行识别,染色质相互作用位点将与随机单独分布的背景 噪音分开(图3)。
CIA-diPET
在CIA-diPET方法中(图2和6),提取表示两个相关的DNA片段的每一个DNA片段的成对的末端双标签序列并只对每个序列中一个标签的序 列进行测序和比较。通过这种方式,获得的CIA-diPET含有比CIA-PET方 法中的标签更长的标签序列。因而,本领域技术人员能够理解的是,与现有 技术中的其它方法相比,本发明的CIA检测方法在定位染色质间的相互作用 中更加具有特异性。DPD复合物中的DNA片段通过接头序列被连接在一起, 所述接头序列含有MmeI位点和Gsul位点。在解交联后,通过超声波降解 法可以随机地破碎所述连接的DNA。然后,按大小分离DNA,并将DNA克隆至pGIS8载体中(图2中的步 骤2) , pGIS8载体含有位于其克隆位点紧邻的Mmel位点和Gsu位点(图 7)。在细菌细胞中转化和繁殖后,通过连续的消化、自连接、和转化对文 库克隆进行处理,以得到单一的diPET文库。单一的diPET文库中的质粒 DNA被BamHI消化以释放出diPET结构(图2中的步骤4),所述diPET 结构能够通过MS-PET测序法直接进行测序,或者进一步进行连接以进行克 隆和测序。可以将CIA-diPET序列定位到参考基因组序列中。真实的染色质 相互作用位点可以基于在特定的基因座中频繁出现的CIA-diPET来迸行识 别,真实的染色质相互作用位点将与随机单独分布的背景噪音分开(图5)。现在异对本发明进行了一般性的描述,通过参考以下实施例能够更容易 理解本发明的内容,所述实施例仅作为说明的目的,而不是为了限制本发明 的范围。在操作过程中,为了控制质量并确保接头或衔接头的正确插入,通过凝 胶电泳去除不需要的片段(图8-10)。实施例 CIA方法使用小鼠胚胎干细胞(ES)细胞中的Nanog转录因子、用于Nanog的ChIP-PET数据、和ES细胞的其它关键转录因子如Oct4和Sox2作为生物学 体系,来实施本发明。ChIP-PET数据提供了这些转录因子结合位置的线性 图谱,并使用ChIP-PET数据作验证染色质相互作用数据的参考。通过 CIA-PET和CIA-diPET两种方法来检测染色质之间的相互作用。
实施例中使用的序列如下文和序列表中所示。当显示了两条链时,上面 的一条链为有义链,下面的一条链为反义链。所有示出的序列均为5'-3'方向。 当核苷酸表示为N或n(或者图中的X或数字)时,意指在该位点上可以为 任意一种核苷酸(A、 C、 G、或T)。
M&M接头
5, GTCGGAGGCCAAGGCGGCCGTACGTCCAACT 3, (31 nt) (SEQ ID NO:l)
5' GTTGGACGTACGGCCGCCTTGGCCTCCGAC 3' (31 nt) (SEQ ID NO:2)
5'末端是磷酸化的
M&G接头
5, GTCGGAGGCCAAGGCGGCCGTACGCTGGAGT 3, (31 nt) (SEQ ID NO:3)
5, CTCCAGCGTACGGCCGCCTTGGCCTCCGACT 3, (31 nt) (SEQ ID NO:4)
5'末端是磷酸化的
Pl连接衔接头(PMR011 )
5, GGATCCCTTAATCGCCTTGCAGCACATC 3, (28 nt) (SEQ ID NO:5) 5, GATGTGCTGCAAGGCGATTAAGGGATCC丽3, (30 nt) (SEQ ID NO:6)
上面接头的5'末端是磷酸化的 下面接头的5'末端不是被磷酸化的P2连接衔接头(PMR012)5, GGATCCCCTGTGTGAAATTGTTATCCGCT 3, (29 nt)(SEQ ID N0:7)5, AGCGGATAACAATTTCACACAGGGGATCC丽3, (31 nt) (SEQ ID NO:8)上面衔接头的5'末端是磷酸化的 下面衔接头的5'末端不是磷酸化的 D1 diPETing衔接头(PMR 011)5, GGATCCCTTAATCGCCTTGCAGCACATC 3, (28 nt) (SEQ ID NO:9) 5, GATGTGCTGCAAGGCGATTAAGGGATCC丽3, (30 nt) (SEQ ID NO: 10)上面衔接头的5'末端是磷酸化的 下面衔接头的5'末端不是磷酸化的 D2 diPETing衔接头(PMR 012)5, GGATCCAATGCTCCTCCCTGTGTGAAATTGTTATCCGCT 3, (39nt) (SEQ ID NO: 11 )5, AGCGGATAACAATTTCACACAGGGAGGAGCATTGGATCC丽3,(41 nt)(SEQ ID NO: 12)上面衔接头的5'末端是磷酸化的 下面衔接头的5'末端不是磷酸化的 PMR011引物5, GATGTGCTGCAAGGCGATTAAG 3, (22 nt) (SEQ ID NO: 13)5'末端是磷酸化的 PMR012引物5, AGCGGATAACAATTTCACACAGG 3, (23 nt) (SEQ ID NO: 14)5'末端是磷酸化的RecA选择性寡聚核苷酸5, AGTCGGAGGCCAAGGCGGCCGTACGCTGGAGT 3, (SEQ ID NO: 15)(生物素化的) PGIS8载体该载体源自pGEM载体(Promega),含有用于以下限制性内切核酸酶的 多个独特的克隆位点,位点的规律为BamHI —Mmel;切割区域;Gsul —BamHI—BseRI。使用以下寡核苷酸5, AATTGGATCCGACTCGAGGATGAATTCTCCAGGATCCCTCCTC 3, (43nt) (SEQIDNO:16)5 , TCGAGAGGAGGGATCCTGGAGAATTCATCCTCGAGTCGGATCC 31 (43nt) (SEQIDNO:17)5'末端不是磷酸化的载体的其余部分不含有任何的BseRI、 BamHI、 Mmel或Gsul的位点。 pGIS8质粒是可以使用的载体的一个实例(图7)。有义链的序列为SEQ ID NO: 18,反义链的序列为SEQIDNO:19。含有限制性内切核酸酶的识别 位点(表示为SEQ ID NO: 16和17)的多克隆位点被插入到所述载体中。显 示了多个限制内切酶的识别位点的pGIS8的序列表如图11所示。本领域技 术人员可以制备并使用能够满足要求的其它载体。 M&M衔接头PET5 ,NNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGT CCAACTN NNNNNNNNNNNNNNNNN 3 , (69 nt) (SEQ ID NO:20)5 ,NNNNNNNNNNNNNNNNNNAGTTGGACGTACGGCCGCCTTGGC CTCCGACT NNNNNNNNNNNNNNNNNNN 3, (69 nt) (SEQ ID NO:21)具有衔接头序列的M&M衔接头PET5 , GATGTGCTGC AAGGCGATTAAGGGATCCNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGTCCAACTNNNNNNNNN NNNNNNNNNGGATCCCCTGTGTGAAATTGTTATCCGCT 3,(128 nt) (SEQ ID NO:22)5'AGCGGATAACAATTTCACACAGGGGATCCNNNNNNNNNNNNN NNNNNAGTTGGACGTACGGCCGCCTTGGCCTCCGACTNNNNNNNNNN NNNNNNNNNGGATCCCTTA ATCGCCTTGCAGCACATC 3, (128 nt) (SEQ ID NO:23)M&M最终PET(切除衔接头序列后)5 ,GATCCNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGG CCGTACG TCCAACTNNNKNNNNNNNNNNNNNNNNG 3, (77 nt) (SEQ ID NO:24) 5, GATCCNNNNNNNNNNNNNKNNNNNNAGTTGGACGTACGGCCGCCTT GGCCTCCGACTNNNNNNNNNNNNNNNNNNNG 3, (77 nt) (SEQ ID NO:25)超声降解后的M&G衔接头DNA序列5 ,NNNNNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGG CCGTACGC TGGAGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 3, (SEQ ID NO:26)5 ,NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACTCCAGCGTAC GGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNNNNNNN 3, (SEQ ID NO:27)(可变nt)克隆至pGIS8质粒中后的M&G衔接头DNA序列(注质粒的其它部分未给出)5 ,GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGCTGGAGTN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTC CAGGATCC 3, (140 nt) (SEQ ID NO:28)5 ,GATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACTCCAGCGTACGGCCGCCTTGGCCTCCGACTNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NGTCGGATCC 3, (140 nt) (SEQ ID NO:29) MPET中间体
5 , GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNAGTCGGAGGCCAAGGCGGCCGTACGCTGGAGTNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTCCAGGATCC 3, (132nt)(SEQ ID NO:30)
5 ,GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNACTCCAGCGTACGGCCGCCTTGG CCTCCGACTNNNNNNNKNNNNNNNNNNNNNNNNNNNGTCGGATCC 3, (132 nt) (SEQIDNO:31)
M和G diPET
5'ATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNAGTCGGAGGCCAAGGCGGCCGTACGCTGGAGTNNNNNNNNNNN NNNNNNNNNNNNNNNNNCTCCAGGATCC 3, (116 nt) (SEQ ID NO:32)
5 ,GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNACTCA GCGTACGGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNN NNNNNNNNGTCGGATC 3, (116 nt) (SEQ ID NO:33)
释放出的具有BamHI粘性末端的diPET
5 ,GATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNAGTCGGAGGCCAAGGCGGCCGTACGCTGGAGTNNNNNNNNNN NNNNNNNNNNNNN NNNNNCTCCAG 3, (111 nt) (SEQ ID NO:34)
5 ,GATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACT CCAGCGTACGGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNGTCG 3, (111 nt) (SEQ ID NO:35)
用Mmel消化前的M&M衔接头PET5 ,NNNNNNNNNNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAA GGCGGCCGTACGTCCAACTNNNNNNNNNNNNNNNNN1WNNNNNNNN NNNN 3 , (91 nt) (SEQ ID NO: 36)
5 ,NNNNNNNNNNNNNNNNNNNNNNNNNNNNTCAGCCTCCGGTTC CGCCGGCATGCAGGTTGANNNNNNNNNNNNNNNNNNNNNNNNNNNN NNN 3, (91 nt)(SEQ ID NO:37)
在插入M&G接头之前如图8所示的寡核苷酸
5'NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNKNNN NNNNNNNNNNNN 3, (53 nt) (SEQ ID NO:38)
5'NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTNNNNNNNNNN NNNNNNNNNNNNN 3, (53 nt) (SEQ ID NO:39)
插入到质粒中的如图8所示的寡核苷酸(质粒的其它部分没有给出)
5 ,GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCT CCAGGATCC 3'(M0 nt) (SEQ ID NO:40)
5 ,GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN GTCGGATCC 3, (140 nt) (SEQ ID NO:41)
插入到质粒中的如图8所示的寡核苷酸(质粒的其它部分没有给出)
5 ,GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCT CCAGGATCC 3, (140 nT)(SEQ ID NO:42)
5 ,GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGATCC 3, (140 nt) (SEQ ID NO:43)
通过电泳除去的没有插入M&G接头的如图8所示的寡核苷酸
5 ,GATCCGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNCTCCAG 3, (112 nt) (SEQ ID NO:44)
5 ,GATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNTCG 3, (112 nt) (SEQ ID NO:45)
插入M&G接头之前如图9所示的寡核苷酸
5 ,NNNNNNNNNNNNNNNNNNNNNNNTCCGACNNNNNNNNNNNN NNNNNNNNNNNNNNNNN 3, (59 nt) (SEQ ID NO:46)
5 ,NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGANNNNN NNNNN NNNNNNNNNNNNN 3, (59 nt) (SEQ ID NO:47)
在插入部分M&G接头后如图9所示的寡核苷酸
5 ,GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNTCCGACNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCT CCAGGATCC 3, (140 nt)(SEQ ID NO:48)
5 , GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGANNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN GTCGGATCC 3, (140 nt) (SEQ ID NO:49)
在被限制性内切核酸酶消化后具有插入部分M&G接头的如图9所示的
寡核苷酸(质粒的其它部分没有给出)
5 ,GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNTCC GACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNNN NNNNNNNNNNNNNNNNNNNNCTCCAGGATCC 3, (126 nt) (SEQIDNO:50)5 ,GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGANNNN NNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNGTCGGATCC 3, (126 nt) (SEQIDNO:51)
从质粒中去除后如图9所示的寡核苷酸
5 ,GATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 丽TCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNCTCCAG 3, (120 nt) (SEQ ID NO:52)
5 ,GATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGANNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCG 3, (120 nt) (SEQ ID NO:53)
具有插入在相反方向的M&G接头的如图IO所示寡核苷酸
5 ,NNNNNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGG
CCGTACGCTGGAGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 3,
(85 nt) (SEQ ID NO:54)
5 ,NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACTCCAGCGTAC
GGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNNNNNNN 3' (85
nt) (SEQ ID NO:55)
插入在质粒中的如图10所示的寡核苷酸(质粒的其它部分没有给出) 5 , GG ACTGG AGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGCTGGAGTN
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNGTCGGATCC 3, (148 nt) (SEQ ID NO:56)
5 , GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNNNNNNNNNNNNNNNACTCCAGCGTACGGCCGCCTTGGCCT
CCGACTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN丽NNNNCTC CAGTCC 3, (148 nt) (SEQ ID NO:57)
如图IO所示的中间体寡核苷酸1
5 ,GGACTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNN NNNNNNGTCGGATCC 3, (62 nt) (SEQ ID NO:58)
5 , GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNN NNNNNNCTCCAGTCC 3, (62 nt) (SEQ ID NO:59)
如图10所示的中间体寡核苷酸2
5 ,GGACTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNN 3, (62 nt) (SEQ ID NO:60)
5 ,GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNN NNNNNNCTCCAGTCC 3, (62 nt) (SEQ ID NO:61)
如图10所示的产物寡核苷酸
5 , GATCCGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 丽NNNNNNNN NNNNNNNNNNNNCTCCAG 3, (114 NT) (SEQ ID NO:62)
5 , GATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNN NNNNNNNNNNNNNNNNTCG 3, (114 nt) (SEQ ID NO:63)
实施例l使用小鼠胚胎干细胞的CIA-PET方案
CIA-PET方法(图1和4)包括五个阶段:(l)生成ChlPDNA-蛋白质-DNA 复合物;(2)制备CIA-PET; (3)扩增CIA-PET; (4)对CIA-PET进行测序;和 (5)对CIA-PET序列定位(图3)。
(1)生成ChIP DNA-蛋白质-DNA复合物
(a) 在白血病抑制因子(Chemicon)的存在下,在无饲养层培养(feeder-free) 小鼠胚胎干(ES)细胞。
(b) 收集约1-2乂108个细胞,并用甲醛(最终浓度为1%, Sigma)在室温下交联10分钟。
(C)细胞裂解和染色质的制备
cl、使细胞在裂解缓冲液中裂解(50mMHEPES、 lmMEDTA、 0.15M NaCI、 1%SDS、 1% Triton X-100、 0.1%脱氧胆酸盐,全部从Ambion购得)。
c2、通过超声波降解法使用Branson 450超声细胞破碎仪使染色质溶解 (20%的负载输出功率、30秒、5-8次)。
c3、将染色质稀释10倍,以使十二烷基磺酸钠(SDS)降低至0.1%。
c4、然后将提取物在4'C, 14,000rpm的条件下离心IO分钟。
c5、将提取物在-80'C下储存直至使用。
(d)免疫沉淀反应
dl、将2微克的单克隆抗体(F7, Santa Cruz)结合到蛋白质G琼脂糖凝
胶(Pharmacia)上。
d2、在4。C下将抗体包覆的珠子与染色质提取物一起孵育16小时。 d3、然后通过以下缓冲液清洗所述珠子(试剂购自Sigma Chemical
Company):
洗涤缓冲液1 (50mMHEPES、 lmM乙二胺四乙酸(EDTA) 、 0.15M NaCl、 0.1%SDS、 1%去通X-IOO (Triton X-100) 、 0.1 %脱氧胆酸盐),清 洗2次。
洗涤缓冲液2(50mMHEPES、 1 mM EDTA、 0.5MNaCl、 0.1%SDS、 1%. Triton X-100、 0.1 %脱氧胆酸盐),清洗1次。
洗涤缓冲液3 (20 mM Tris.HCl pH 8.0、 1 mM EDTA、 0.25 M LiCl、 0.5%
NP40、 0.5%脱氧胆酸盐),清洗1次。
洗涤缓冲液4 (20 mM Tris.HCl pH 8.0、 1 mM EDTA),清洗1次。
d4、然后在65"C下,使用洗脱缓冲液洗脱20分钟以将蛋白质-DNA复
合物从所述珠子上洗脱下来。d5、在4'C下,在PBS(Ambion)中对洗脱物透析3小时以去除SDS。 (2)制备CIA-PET
(a) 末端修复
使用Epicentre End-It试剂盒和以下化学品进行末端修复 染色质(最多5pg) 2.5P1 (10X)
末端修复缓冲液 5]il 2.5 mM脱氧核苷三磷酸(dNTP)混合物 5卩1 10mM三磷酸腺甙(ATP) 5pl 末端修复酶混合物
不含核酸酶的水 至50]jl
简单地涡旋混合,然后在室温下孵育45分钟,在70'C下加热IO分钟以 停止反应。通过加入27^1的不含核酸酶的水将浓度调节至65 ng 1。
(b) 力口尾(tailing)
DNA 20vil 10 mM脱氧三磷酸腺甙(dATP) (Roche) 0. 5pl
10XEx Taq缓冲液(Takara) 2. 5口1
Ex Taq聚合酶(Takara) 0. 5pl
不含核酸酶的水 至25P1
在PCR仪中于72。C下孵育30分钟,然后在4。C保存。最好取出离心 管,在72。C下的孵育终止时立刻进行连接。
(c) 使用M&M接头(SEQ ID NOS: 1和2)连接DNA 染色质DNA (20(Hig) 3. M疆衔接头-T末端(38ng) 3. lpl 具有聚乙二醇(PEG)的5X连接酶缓冲液(Invitrogen) 6卩1 T4连接酶(5U/]al) (Invitrogen) lpl不含核酸酶的水 12.3pl
在16°C下过夜连接,得到插入有M&M接头的寡核苷酸(SEQ ID NOS:
20和21)。
(d)使用蛋白酶K的解交联
将DNA样品分成2(^1的分装体,并在15^1浓度为20mg/ml的蛋白酶 K(Ambion)的存在下于65'C孵育过夜,以解交联。第二天,加入lpl浓度为 10mg/ml的RNA酶A以降解RNA,在37'C下降解RNA45分钟,随后进行 苯酚抽提并用乙醇沉淀DNA。重悬在20pl洗提缓冲液中,并在-2(TC下保存。 获得的浓度通常为500 ng/W。
定量DNA,并将0.5pl得到的DNA和Takara的宽范围序列梯,以及 Invitrogen的低质量序列梯和从(a)中得到的0.5pl的材料,在1%的凝胶中进 行电泳来进行质量控制。(d)中得到的材料点样量应该较少,并且在50-100bp
的标记范围内不应该显示出任何明亮的条带。 (e)Mmel酶切
10卩g腿 20口1
10XNE缓冲液4 (New England Biolabs) 20口1
10X SAM (New England Biolabs) 20pl
Mmel (2U/vil) (New England Biolabs) 20pl
不含核酸酶的水 120pl
分装在两个离心管中,并在37'C下孵育过夜。SAM应该是新制备的。
含有糖蓝(glycoblue)的苯酚氯仿和乙醇的沉淀物。
定量DNA,并使用3pl得到的DNA与Takara的宽范围序列梯,以及使 用Invitrogen的低质量序列梯和从(d)中得到的0.5^1的材料,在2%的凝胶或 PAGE凝胶中进行电泳来进行质量控制。
(f)凝胶纯化将得到的DNA与合适的序列梯(例如,20plTakam的宽范围序列梯) 负载到2%的琼脂糖凝胶的Scie-Plas中等尺寸孔(每孔60pl)中。在80V下 电泳约1.5小时,然后在365nm的紫外光下观察。具有错误插入的接头的寡 核苷酸将通过电泳被去除掉(错误插入的接头的例子,见图8-10)。根据生 产商提供的建议使用一次性的Fermentas ElutaTubes切出双标签条带并进行 电洗脱。在90V下电洗脱1-1.5小时,然后使用乙醇沉淀得到的双标签每200p洗脱液,加入3 M NaOAc pH 5. 2 (Amresco) 20]jl1 M MgCl2(Ambion) 4. 5|il糖蓝(Ambion) 2pl100%的乙醇 800vil在12(il的洗脱缓冲液(Qiagen)中重悬沉淀的双标签,并使用2-5|il双标 签溶液和低质量序列梯(Invitrogen),在4-20%的PAGE微型胶中进行电泳以 检测纯度并在视觉上进行定量。得到的正确双标签具有SEQ ID NOS: 22和 23所示的序列。(3)扩增PET(a)衔接头的连接(连接的衔接头SEQIDNOS'. 5-8)DNA (100 ng) 6pl衔接头(IO pg) 6U1IOX连接酶缓冲液(具有亚精胺) 1.5卩1T4 DNA连接酶(5U/]jl, Irwitrogen) l卩l不含核酸酶的水 0.5]al总体积为15卩1,在16"C下孵育16小时。 具有亚精胺的IOX连接酶缓冲液由以下物质组成:60mM Tris-HCl pH7. 5 (Ambion) 60mM MgCl2 (Ambion) 50mM NaCl (Ambion)
1mg/ml牛血清白蛋白(BSA) (NeW England Biolabs)
70mM p-巯基乙醇(Sigma)
ImM ATP (Irwitrogen)
20mM二硫苏糖醇(DTT) (Invitrogen)
10mM亚精胺(Sigma)
(b) PCR扩增
使用引物PMRs 11和12(分别为SEQIDNOS: 13和14)以及购自Qiagen
的Hotstartaq试剂盒进行扩增
DNA l卩l
10 X PCR缓冲液(Qiagen) lO]jl
dNTP混合物(每种10 mM) (Invitrogen) 2pl
PMR11 (0. 2pM)
PMR12 lpl (0.2卩M)
HotStarTaq DNA聚合酶(Qiagen) 0. 5jj1
不含核酸酶的水 至lOOpl
充分混合,在PCR仪上孵育
1、 95°c, 15分钟
2、 94°c, 0. 5分钟
3、 55°c, 0. 5分钟
4、 72。C, l分钟
5、 重复步骤2-4, 25个循环
6、 72°C, 10分钟使用PCR纯化试剂盒(Qiagen)进行纯化。 (4) CIA-PETs的测序可以根据454多重测序仪(454生命科学)的方案直接对CIA-PETs进 行测序。该技术描述在Margulies等(2005)和美国专利申请No. 20030068629 中。这些参考文献的全文在此一并引入作为参考。对CIA-PETs进行定位可以使用压缩的后缀阵列(Compressed Suffix Array)进行定位。穿越两个 不同的DNA片段的多个连接应该表示真实的远端控制区(图3)。实施例3: CIA-diPET方法CIA-diPET方法(图2和6)包括以下部分(l)生成ChIPDNA-蛋白质 -DNA复合物;(2)制备CIA文库;(3)制备CIA-PET文库;(4)测序;和(5) 对CIA-PET序列进行定位(图5 )。(1)生成ChIP DNA-蛋白质-DNA复合物(如上所述)(a) 在白血病抑制因子(Chemicon)的存在下,在无饲层培养小鼠胚胎干 (ES)细胞。(b) 收集约l-2xl()S个细胞,并用甲醛(最终浓度为1%, Sigma)在室温 下交联IO分钟。(c) 细胞裂解和染色质的制备cl、使细胞在裂解缓冲液中裂解(50mMHEPES、 lmMEDTA、 0.15M NaCl、 1%SDS、 1% Triton X-IOO、 0.1%脱氧胆酸盐,全部由Ambion购得)。c2、通过超声降解法使用Branson 450超声细胞破碎仪使染色质溶解 (20%的负载输出功率、30秒、5-8次)。c3、将染色质稀释10倍,以使SDS降低至0.1%。c4、然后将提取物在4'C, 14,000rpm的条件下离心IO分钟。c5、将提取物在-8(TC下储存直至使用。 (d)免疫沉淀反应
dl、将2微克的单克隆抗体(F7, Santa Cruz)结合到蛋白质G琼脂糖凝
胶(Pharmacia)上。
d2、在4'C下将抗体包覆的珠子与染色质提取物一起孵育16小时。 d3、然后通过以下缓冲液清洗所述珠子(试剂购自Sigma Chemical
Company) -
洗涤缓冲液1 (50 mM HEPES、 1 mM EDTA、 0.15 M NaCl、 0.1% SDS、 1%TritonX-100、 0.1 %脱氧胆酸盐),清洗2次。 洗涤缓冲液2(50mMHEPES、 lmMEDTA、 0.5MNaCl、 0.1%SDS、 1%. Triton X-IOO、 0.1 %脱氧胆酸盐),清洗1次。 洗漆缓冲液3 (20mMTris.HClpH8.0、 lmMEDTA、 0.25MLiCl、 0.5% NP40、 0,5%脱氧胆酸盐),清洗1次。
洗涤缓冲液4 (20 mM Tris.HCl pH 8.0、 1 mM EDTA),清洗1次。
d4、然后在65X:下,使用洗脱缓冲液洗脱20分钟以将蛋白质-DNA复
合物从所述珠子上洗脱下来。
d5、然后在4'C下,在PBS(Ambion)中对洗脱物透析3小时以去除SDS。 (2)制备CIA-diPET文库
(a)末端修复(用于制备CIA-PET),使用Epicentre End-It试剂盒进行末
端修复
染色质(最多5pg) 2.5P1
10 X末端修复缓冲液(Epicentre) 5pl
2. 5 mM dNTP混合物(Epicentre) 5pl
10mM ATP (Epicentre) 5pl
末端修复酶混合物(Epicentre) lpl停
不含核酸酶的水 31.5pl
简单地涡旋混合,并在室温下孵育45分钟,在7(TC下加热10分钟以子 止反应。通过加入27^1的不含核酸酶的水将浓度调节至65 ng/pl。
(b) 如上所述加尾以用于CIA-PET
腿 20pl 10 mM dATP (Roche) 0. 5pl
10XEx Taq缓冲液(Takara) 2. 5]jl
Ex Taq聚合酶(Takara) 0. 5口1
不含核酸酶的水 1.5pl
在PCR仪中于72。C孵育30分钟,然后于4'C下保存。最好取出离心管, 在72r下的孵育终止时马上进行连接。
(c) DNA与M&M接头的连接(SEQ ID NOS: 3和4) 染色质DNA(200ng) 3. lpl M&G衔接头-T末端(38ng) 7. 6pl 具有PEG的5X连接酶缓冲液(Invitrogen) 6pl T4连接酶(5U/V1) (Invitrogen) lpl 不含核酸酶的水 12.3pl
在16。C下过夜连接,得到插入有M&G接头的寡核苷酸(SEQIDNOS: 26
和27)。
(d) 与上述CIA-PET—样,使用蛋白酶K解交联。
将DNA样品分成20pl的分装体,并在15^1浓度为20mg/ml的蛋白酶 K(Ambion)的存在下于65匸过夜以解交联。第二天,加入浓度为10mg/ml 的RNA酶A以降解RNA (Qiagen),在37。C下降解RNA 45分钟,随后进 行苯酚抽提并用乙醇沉淀DNA。重悬在20pl洗脱缓冲液中,并在-2(TC下保 存。获得的浓度通常为500ng/Ktl。定量DNA,并将0.5^1得到的DNA和Takara的宽范围序列梯,以及 Invitrogen的低质量序列梯和从(a)中得到的0.5^1的材料,在1%的凝胶中进 行电泳来进行质量控制。(d)中得到的材料点样量应该较少,并且在50-100bp 的标记范围内不应该显示出任何明亮的条带。(e)使用NIaIII的消化Nlain在-80。C下储存(-80。C下半衰期6个月)。在使用前至于冰上。DNA (约1吗) 2pl10XNE缓冲液4 (New England Biolabs) 5]jlNIa III (New England Biolabs) lpl100 XBSA (New England Biolabs) 0. 5|il不含核酸酶的水 41.5pl 制备5管上述反应液。在37'C下孵育1小时。将含有糖蓝的苯酚氯仿和 乙醇沉淀物重悬在10^d的洗脱缓冲液中(Qiagen)。 (f)使用Epicentre End-It试剂盒对末端进行平整DNA (最多5pg) 34y:l10 X末端修复缓冲液(Epicentre) 5]jl2. 5 mM dNTP混合物(Epicentre) 5i_il10mM ATP (Epicentre) 5pl末端修复酶混合物(Epicentre) lpl室温下孵育45分钟,在70'C下加热10分钟以停止反应。 (i)克隆至具有Mmel和GsuI侧翼连接位点的pGIS8载体中(SEQ ID NOS: 18禾B 19;图7和11)。置于冰上,使用1.7ml的微离心管(使用多个离心管) 40 ng/Vl预酶切的pGIS l卩l DNA 6pl具有PEG的5X连接酶缓冲液(Irwitrogen) 2P1 T4 DNA连接酶(5U/pl) (Invitrogen) l卩l 在16。C下孵育过夜(12-16小时),得到SEQIDNOS:28和2S所示的
寡核苷酸。
设置一个载体自连的对照。
通过电穿孔技术,在每50|il感受态TOP10细胞(Invitrogen)中转染lpl 的连接产物。在lml的LB培养基中恢复每一个等份式样l小时,然后平板 培养一系列稀释度(LB琼脂糖+氨苄青霉素)用于质量控制和滴定的试样。
然后,通过将剩余的培养基在更大的琼脂糖平板(Q-tmys)上进行培养来 扩大该过程,并使用Qiagen的高速质粒大量提取试剂盒(Qiagen HiSpeed
Plasmid Maxi Kit)进行大量制备。 (3) CIA-diPET文库 (a) Mmel酶切
10卩g DNA 100pl 10XNE缓冲液4 (New England Biolabs) 20|jl 10X SAM (New England Biolabs) 20pl Mmel(2U/vi1) (New England Biolabs) 12]jl 不含核酸酶的水 48
在37。C下孵育过夜,得到SEQIDNOS: 30和31所示的寡核苷酸。SAM 应该是新制备的。将含有糖蓝的苯酚氯仿和乙醇沉淀物重悬在12|il的洗脱 缓冲液中。
定量DNA,并将1^1得到的DNA和Takara的宽范围序列梯,以及使用 Iiwitrogen的低质量序列梯和从(e)中得到的的材料,在2%的凝胶或 PAGE凝胶中进行电泳来进行质量控制。
(b)环化设置96孔培养板,每个孔均含有以下物质(MJResearch): 100 ng DNA 50^1 连接溶液1 (Takara Ligation Kit ver 2) 50]al 密封培养板,以防止蒸发。 16"C下孵育过夜。使用三个纯化柱进行PCR纯化(Qiagen),重悬在每个40^1的洗脱缓冲液 中,得到总量约为120W。(c) Gsul酶切 设置9管 环化的DNAIOX缓冲液TANGO (Fermentas) 10X SAM (New England Biolabs) GsuI(5U/]jl (Fermentas) 不含核酸酶的水在3(TC下酶切至少2小时,但并不酶切过夜 和33所示的寡核苷酸。(d) 环化设置9管,每管含有以下物质 约100 ng DNA连接溶液1 (Takara Ligation Kit雷2) 16'C下孵育过夜。进行苯酚氯仿乙醇沉淀,并重悬在12^1的洗脱缓冲液中。(e) 通过置于冰上的滚环扩增(Rolling Circle Amplication) (Templiphi试 剂盒,Amersham)的解冻溶液进行扩增。制备3-4个含有以下物质的管-2. 5 ng DNA l卩l12|il 8. 6P1 8. 6vill卩l55. 8]jl 得到如SEQ ID NOS: 3250]jlTempliphi试剂盒变性缓冲液(kit denature buffer) (Amersham) lO]jl 在95'C下加热3分钟,然后置于冰上冷却。 在反应缓冲液中加入
Templiphi kit premix(Amersham) lOpl
使用轻敲或温和地涡旋混合均匀。
在3(TC下孵育16-18小时,但不摇动。
例如,微量移液l^il材料进行检测。它应该是有粘性的。通过皮克绿 (picogreen)荧光测定法(Quant-iT DNA assay kit, Molecular Probes)对双链
DNA进行定量。
(f)BamHI酶切
100pgDNA lpl
lOX单一的BamHI缓冲液(New England Biolabs) lOpl
100X牛血清白蛋白(New England Biolabs) lpl
BamHI (20U/pl;超过2倍)(New England Bioiabs) IO卩I
不含核酸酶水 78P1
如需要消化DNA应制备更多的管;在37'C下孵育过夜,以获得SEQID NOS: 34和35所示的寡核苷酸。 (g)凝胶纯化
将得到的DNA与合适的序列梯(例如,Takara的宽范围序列梯) 一起 负载2%的琼脂糖凝胶的Scie-Plas的中等尺寸孔(每孔60pl)中。在80V下 电泳约1.5小时,然后在365nm的紫外光下观察。具有错误插入的接头的寡 核苷酸将通过电泳被去除掉(错误插入的接头的例子,见图8-10)。根据生 产商的建议使用一次性Fermentas ElutaTubes将双标签条带切出并进行电洗 脱。在90V电压下电洗脱1-1.5小时,然后以如下方式将得到的双标签进行 乙醇沉淀每200|11洗脱液加入:3 M NaOAc pH 5. 2 20]jl1 M MgCl2 4. 5]jl糖蓝 2pl100%的乙醇 800]il重悬沉淀的diPETs于12^1的洗脱缓冲液中,并使用2-5pl得到的diPETs 和低质量序列梯(Invitrogen)在4-20%的PAGE微型胶中进行电泳以检测纯度 并在视觉上进行定量。(4)CIA-diPET的测序(a)凝胶纯化的BamHI-粘结性diPETs的连接CIA-diPETs 200-1000ng 6pl10 X连接酶缓冲液(具有亚精胺) 1 plT4 DNA连接酶(5U/V1) (Invitrogen) l卩l不含核酸酶的水 2pl在16。C下孵育2小时至过夜。然后在65t下热灭活10分钟。 (b) CIA-diPET连环体的部分BamHI再消化使用Qiagen的PCR快速旋转纯化试剂盒(Qiagen PCR purification QuickSpin Kit)纯化连环体DNA。然后使用l^il的纳米微滴对DNA进行定 量(纳米微滴技术),并进行短时间的BamHI再消化连环体 20pl10X BamHI缓冲液(New England Biolabs) 3|jlBamHI (稀释至l U/pl) (New England Biolabs) 0. 2卩1100XBSA (New England Biolabs) 0. 5卩1不含核酸酶的水 6.3vd在37t:下孵育30分钟,并不再孵育更长的时间。快速加入6(il的荷载染料,在65。C加热15分钟,并且在负载于PAGE 凝胶上之前置于冰上冷却。
(c) 连环体化的CIA-diPETs的PAGE纯化
优选将全部的样本负载于4-20%的序列梯PAGE微型胶的一个孔中,在 该微型胶的两侧负载有Takara的宽范围序列梯和Invitrogen的低质量序列 梯,以检测大小。在200V下电泳约1小时。在SYBR Green I中染色15-30 分钟,在用于切割凝胶的Dark Reader透照器(transilhiminator)(Clare Chemical) 中显影。
(d) 连环体的切除
将连环体化的DNA切成3个分离部分,低(400-1000bp)、中等 (1000-2000bp)、和高(〉2000bp)。将每个切除大小片段的凝胶片段置于0.6ml 的夏普列斯超速微量离心管(microfUge)中,该离心管的底部被21G针刺 穿。将被刺穿的管置于1.7ml的夏普列斯超速微量离心管中,并在16110g, 4T下离心5分钟。因而,凝胶片段方便地破碎,并收集在1.7ml管的底部。 在每个管中加入200^1的LoTE:NH4OAc (167:33) (LoTE配方如下,NH4OAc 购自Ambion),在65'C下加热2小时进行洗脱。
LoTE缓冲液
3 mM Tris-HCl pH 7.5 (Ambion) 0. 2 mM EDTA (Ambion)
在前述的微离心过滤装置中下,在16110g, 4"C下离心10分钟,从凝胶 片段中分离出上清液(含有洗脱的连接DNA)。对每个洗脱的大小片段进 行苯酚/氯仿抽提,然后乙醇沉淀
洗脱的DNA片段 200vil 3M乙酸钠pH 5. 2 20vil 糖蓝 2.2pl100%的乙醇 800yl 在誦80。C下保存30分钟;在16110g, 4。C下离心30分钟;用75%的乙醇 冲洗1次。在6^1的LoTE缓冲液中重悬沉淀物。 (e)连接至pZErO-l载体在使用前,pZErO-l克隆载体通过使用10个单位的BamHI (New England Biolabs)在37。C下消化2pg的pZErO-l质粒DNA (Invitrogen)2小时而得到。 消化的质粒DNA进行苯酚氯仿提纯和乙醇沉淀,然后重悬于60^1浓度为 33ng/iLd的LoTE中。可以通过设置载体自连接作为对照(几乎没有菌落)并 进行琼脂糖凝胶电泳,来验证所述载体的有效性。设置以下连接体系-连环体DNA片段 6]jl BamHI/pZErO-l5X连接酶缓冲液(具有PEG) (Invitrogen) 2pl T4 DNA连接酶(5UAiL) (Invitrogen) 16'C下孵育过夜。不进行热灭活。还平行设置了自连接载体作为对照。当制备用于自连接的载体时,使用 不含核酸酶的水替代连环体DNA片段。在进行电穿孔之前,纯化各连接反应产物以去除盐用不含核酸酶的水 将体积调节至200^1,进行苯酚/氯仿提纯(pH 7.9)和在-80'C下乙醇沉淀30分 钟(使用糖蓝)。离心,使用70%的乙醇清洗沉淀物至少两次,并重悬在12^1 的LoTE中。在预冷的1.7ml夏普列斯超速微量离心管中,将1^1纯化的连接反应产 物加入到25pl的电转化细胞(例如,购自Lucigen的E. cloni;购自invitrogen 的TOPIO)中。并不上下吹打混合,而是使用吸管端轻轻地搅动。置于冰上 5分钟,然后转入到预冷的Biorad电穿孔比色皿中(0.1cm缝隙)。再在冰上放置5分钟。使用Biomd微脉冲发生器、单脉冲、程序EC1 进行电穿孔。时间常数通常为4,5-5毫秒。
在IO秒的脉冲内,加入lml室温普通的LB培养基,转入到15ml Falcon 管中,在37"C、 200rpm振荡下恢复1小时。
在含有低盐LB琼脂并添加有择示(Zeocin ) (Immudia Zeocin Agar,Invitrogen)的小型琼脂平板上涂布20-50pl(取自1 ml培养基),并在37°C 下孵育过夜。
(f) 文库质量控制
在除去自连接背景后,对克隆进行计数并检测文库的有效性。挑24-48 个克隆用于PCR筛选,该PCR筛选使用引物PMROll和PMR012。包括对 pZErO-l载体本身的对照PCR。基于PCR结果,挑1-4x96孔板的过夜培养(在 低盐LB十择示,Immedia,Invitrogen)的克隆,对质粒进行纯化和进行测序, 以检测每个插入物中双标签的平均数。
在这个阶段,所述文库可以以纯化的连接混合物的形式在-20'C下保存, 直到进行更大规模的转化、质粒提取和测序。
(g) 对测序的文库进行平板培养并挑菌落
每个平板以小于2000个的菌落密度,将转化的TOP10(Invitrogen)细菌 细胞置于22x22cm的琼脂糖平板(Q-trays, Genetix)上进行平板培养,以便于 机器挑菌。挑取的单个菌落培养在含有添加有择示的LB(见上文)的384孔平 板中,并在37'C下过夜。重复384孔平板的实验多次,然后在15%的丙三 醇(Sigma)的存在下于-80 °C下保存。
(h) 模板的制备
使用Sprintprep的固相试剂盒(Agencourt),制备从pZERO-l衍生的克隆 得到的质粒。
(i) DNA测序使用测序引物PMR011和PMR012 (分别为SEQ ID NOS: 13和14)从 两个方向对质粒进行测序。(5)对CIA-diPETs进行定位使用压縮的后缀阵列(Compressed Suffix Array)进行定位。穿越两个不同 的DNA片段的多个连接(n〉3)应该表示真实的远端控制区(图5)。在使用 含有定位到基因组的不同位点的标签的任何嵌合体表示基因组的重排之前, 多于3个PETs显示了相同延伸的DNA的重排,艮卩,间隔超过10kb分布的 或者位于不同染色体上的标签1和标签2。实施例4:使用的M和G载体pGIS8的构建.(a) 得到pGIS8载体。(b) 通过如上所述的置于冰上的滚环扩增(Templiphi试剂盒,Amersham) 的解冻溶液进行扩增。制备3-4个含有以下物质的管lng DNA (大规模制备的) lpl Templiphi试剂盒变性缓冲液 10pl 在95'C下加热3分钟,然后置于冰上暂时地冷却。 在反应缓冲液中加入Templiphi试剂盒预混合物 10卩1使用轻敲或温和地涡旋混合均匀。在3(TC下孵育16-18小时,但不摇动。对材料进行检测。它应该是有粘性的。通过皮克绿荧光测定法(Quaiit-iT kit, Molecular Probes)对双链DNA进行定量。(c) 进行限制性内切核酸酶的消化DNA 25vil Xhol (20U/卩l) (New England Biolabs) l卩lEcoRl (20U/ij1) (New England Biolabs) lpl10XEcoRl缓冲液(New England Biolabs) 5pl100XBSA (New England Biolabs) lpl不含核酸酶的水 17]il 在37"C下孵育16小时。 使用PCR纯化试剂盒(Qiagen)进行纯化。使用1%的琼脂糖凝胶检测5pl的PCR产物。(d)末端钝化制备两个含有以下物质的管-■ 22.5口110 X末端修复缓冲液(Epicentre) 5pl2. 5 mM dNTP混合物(Epicentre) 5pl10 mM ATP (Epicentre) 5卩1末端修复酶混合物 lpl不含核酸酶的水 11.5|il在室温下孵育45分钟,并在7(TC下加热10分钟停止反应。 应该理解的是,在不背离本发明的宗旨和范围的情况下,本领域的技术 人员能够进行多种修改和改进。例如,本发明的CIA法可以用于其它种类的细胞,例如,酵母细胞替代 哺乳动物细胞。同样,替代使甩ChIP法,本发明的方法可以通过使用适合 的固定剂而不需要免疫沉淀作用而进行实施。在这种变化中,所述方案为-1、 采集细胞。2、 使用甲醛在36。C下交联IO分钟。3、 使用珠子-破碎机使细胞裂解并随后进行离心,以获得上清液。4、 通过超声波裂解法、水力剪切、皮下注射器针头的反复抽提、或通过限制性内切核酸酶的酶解作用剪切DNA。5、通过SDS和去通-X (Triton-X)处理,去除不需要的蛋白质。 此后,可以按照上文所描述的方法对DNA进行进一步的处理(末端钝化,连接)。此外,在另一种变化中,可以使用滚环扩增替代PCR。在这种变化中, 去除不需要的蛋白质的程序为.-1、 DNA的末端钝化2、 DNA的加尾3、 连接4、 使用合适的商购试剂盒,如购自Amersham Biosciences的Templiphi 试剂盒,进行滚环扩增。5、 可以使用 Invitrogen/Molecular Probes' PicoGreen荧光试齐!j盒 (fluorimetry kit)对DNA进行定量。6、 使用MmeI限制性内切核酸酶消化,以获得分离的寡核苷酸。 此外,在另一个变化中,可以省略加尾步骤,可以使用合适的钝化末端接头。ReferencesAntequeraand Bird(1993), ProoM磁l Acad Sci USA,90(24): 11995-9Aus咖l (1舰)Current Pmtocols in Molecular Biology, VoL 2,1995, Ed. Ausubel,et al" Greene Publish. Assoc. & Wltey lntdrscience, Un汰3.1.15Bonetta (2006〉 Nature Methods 3(2): 141-147,Brenner al《2000》,,Nat Biotechnoi, 2000.18(6): p> 63CMBuck and Lteb (2004) G咖mics 8柳:349-60Dd<k r山mppe K, Dekker M and Kte汰ner M (2002) Science 295 (5558):1306-11,D,曰t 31(2002) Genome Research 12<1 ":1756-1765EuslUrchen al,,Ktol Cel Biol, 2004,24(9): p. 3804 14D and Chandrasegaran (1993) Proa N就Acaci, Sciences USA 90:2764-8Lieb et sl,, Nat Genet, 2001. 28(4): p. 327-34MarguHes et al, 2005 N幽re 437, 376~380 (15 Sep 2005)New England Bto咖Catalog 2005. N柳England Biolabs (lpswteh, MA)Szybsiski, W., 1985, Gene, 40:169Taverner et al" Gsnome Biol, 2004.5《3):210,US 20050255501US 20050059022US 20030068629US 4,766,072Wel師ann etal,, Genes Dev, 2002,16(2);235 44>
权利要求
1、一种分离的寡核苷酸,该分离的寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述第一标签和所述第二标签为核酸-蛋白质复合物的标签。
2、 根据权利要求1所述的分离的寡核苷酸,其中,所述第一标签为第 一多聚核苷酸的标签,所述第二标签为第二多聚核苷酸的标签,其中所述第 一多聚核苷酸和所述第二多聚核苷酸为核酸-蛋白质复合物的多聚核苷酸。
3、 根据权利要求1或2所述的分离的寡核苷酸,其中,该分离的寡核 苷酸还含有至少一个限制性内切核酸酶识别位点。
4、 根据权利要求1-3中的任意一项所述的分离的寡核苷酸,其中,该 分离的寡核苷酸还含有至少一个接头。
5、 根据权利要求4所述的分离的寡核苷酸,其中,所述接头含有至少 一个限制性内切核酸酶识别位点。
6、 根据权利要求4或5所述的分离的寡核苷酸,其中,所述至少一个 接头插在所述标签之间,或者定位在所述第一标签的上游或第二标签的下 游。
7、 根据权利要求3、 5或6所述的分离的寡核苷酸,其中,所述至少一 个限制性内切核酸酶识别位点为lis型限制性内切核酸酶的识别位点。
8、 根据权利要求3、 5或6所述的分离的寡核苷酸,其中,所述至少一 个限制性内切核酸酶识别位点为归巢限制性内切酶的识别位点。
9、 根据权利要求1-8中的任意一项所述的分离的寡核苷酸,其中,所 述至少一个第一标签含有第一多聚核苷酸的5'末端和3'末端,所述至少一个 第二标签含有第二多聚核苷酸的5,末端和3,末端,并且,所述第一多聚核苷 酸和所述第二多聚核苷酸为核酸-蛋白质复合物的多聚核苷酸。
10、 根据权利要求5或6所述的分离的寡核苷酸,其中,所述接头含有 第一限制性识别位点和第二限制性识别位点,所述第一限制性识别位点被能 够对第一多聚核苷酸进行酶切以得到第一标签的限制性内切核酸酶所识别, 所述第二限制性识别位点被能够对第二多聚核苷酸进行酶切以得到第二标 签的限制性内切核酸酶所识别,所述第一多聚核苷酸和所述第二多聚核苷酸 为核酸-蛋白质复合物的多聚核苷酸。
11、 根据权利要求5或6所述的分离的寡核苷酸,其中,所述接头含有 第一限制性识别位点和第二限制性识别位点,所述第一限制性识别位点被能 够对第一多聚核苷酸进行酶切以得到第一多聚核苷酸的3'末端的第一限制 性内切核酸酶所识别,所述第二限制性识别位点被能够对第二多聚核苷酸进 行酶切以得到第二多聚核苷酸的5'末端的第二限制性内切核酸酶所识别,所 述第一多聚核苷酸和所述第二多聚核苷酸为核酸-蛋白质复合物的多聚核苷 酸。
12、 根据权利要求5或6所述的分离的寡核苷酸,其中,所述接头含有 第一限制性识别位点和第二限制性识别位点,所述第一限制性识别位点被能 够对第一多聚核苷酸进行酶切以得到第一多聚核苷酸的5'末端的第一限制 性内切核酸酶所识别,所述第二限制性识别位点被能够对第二多聚核苷酸进 行酶切以得到第二多聚核苷酸的3'末端的第二限制性内切核酸酶所识别,所述第一多聚核苷酸和所述第二多聚核苷酸为核酸-蛋白质复合物的多聚核苷 酸。
13、 根据权利要求5、 6、或ll所述的分离的寡核苷酸,其中,所述接 头含有第一限制性识别位点和第二限制性识别位点,所述第一限制性识别位 点被能够对第一多聚核苷酸进行酶切以得到第一多聚核苷酸的3'末端的第 一限制性内切核酸酶所识别,所述第二限制性识别位点被能够对第二多聚核 苷酸进行酶切以得到第二多聚核苷酸的5'末端的第二限制性内切核酸酶所 识别;所述第一多聚核苷酸还含有第三识别位点,该第三识别位点被能够对 第一多聚核苷酸进行酶切以得到第一多聚核苷酸的5'末端的第三限制性内 切核酸酶所识别;所述第二多聚核苷酸含有第四识别位点,该第四识别位点 被能够对第二多聚核苷酸进行酶切以得到第二多聚核苷酸的3'末端的第四 限制性内切核酸酶所识别;所述第一多聚核苷酸和所述第二多聚核苷酸为核 酸-蛋白质复合物的多聚核苷酸;所述至少一个第一标签是通过连接所述第 一多聚核苷酸的5'末端和3'末端而获得的,所述至少一个第二标签是通过连 接所述第二多聚核苷酸的5'末端和3'末端而获得的。
14、 根据权利要求1-13中的任意一项所述的分离的寡核苷酸,其中, 所述核酸-蛋白质复合物为染色质结构的一部分。
15、 根据权利要求1-14中的任意一项所述的分离的寡核苷酸,其中, 所述多聚核苷酸为DNA或RNA。
16、 一种载体,该载体含有权利要求1-15中的任意一项所述的寡核苷
17、 一种寡核苷酸连环体,该寡核苷酸连环体含有至少两个分离的寡核 苷酸,每个分离的寡核苷酸含有至少一个第一标签和至少一个第二标签,其 中,所述第一标签和所述第二标签为核酸-蛋白质复合物的标签。
18、 根据权利要求17所述的寡核苷酸连环体,其中,所述第一标签为 第一多聚核苷酸的标签,所述第二标签为第二多聚核苷酸的标签,所述第一 多聚核苷酸和所述第二多聚核苷酸源自核酸-蛋白质复合物,并且,每个分 离的寡核苷酸含有至少一个限制性内切核酸酶识别位点。
19、 根据权利要求18所述的寡核苷酸连环体,其中,所述至少一个限 制性内切核酸酶识别位点包括在至少一个接头中。
20、 根据权利要求19所述的寡核苷酸连环体,其中,所述至少一个接 头插在所述标签之间,或者定位在所述第一标签的上游和/或第二标签的下 游。
21、 根据权利要求18-20中的任意一项所述的寡核苷酸连环体,其中, 所述至少一个限制性内切核酸酶识别位点为lis型限制性内切核酸酶的识别 位点。
22、 根据权利要求17-21中的任意一项所述的寡核苷酸连环体,其中, 所述第一标签含有源自所述第一多聚核苷酸的5,末端和3'末端,所述第二标 签还含有源自所述第二多聚核苷酸的5'末端和3'末端。
23、 一种寡核苷酸文库,该寡核苷酸文库包括至少一种根据权利要求 1-15中的任意一项所述的寡核苷酸。
24、 一种制备至少一种分离的寡核苷酸的方法,该方法包括-(d) 提供核酸-蛋白质复合物;(e) 制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中,所述第一标签和所述第二标签得自核苷酸-蛋白质复合物;和(f) 分离所述寡核苷酸。
25、 根据权利要求24所述的方法,其中,所述第一标签得自第一寡核 苷酸,所述第二标签得自第二寡核苷酸,所述第一寡核苷酸和所述第二寡核 苷酸得自核酸-蛋白质复合物。
26、 根据权利要求24或25所述的方法,其中,步骤(b)包括(i) 插入至少一个接头,该接头含有至少一个限制性内切核酸酶识别位 点,禾口(ii) 使用至少一种能够识别位于所述接头中的至少一个识别位点的限制 性内切核酸酶,对所述第一多聚核苷酸和第二多聚核苷酸进行酶切,以形成 寡核苷酸,该寡核苷酸含有第一标签、第二标签和所述接头,所述第一标签 得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸。
27、 根据权利要求24或25所述的方法,其中,步骤(b)包括(i) 在所述复合物的第一多聚核苷酸和第二多聚核苷酸之间插入至少一 个接头,该接头含有至少一个限制性内切核酸酶识别位点;(ii) 在第一多聚核苷酸的5'末端和第二多聚核苷酸的3'末端分别加入至 少一个限制性内切核酸酶识别位点;(iii) 使用能够识别至少一个识别位点的至少一种限制性内切核酸酶,对所述第一多聚核苷酸和第二多聚核苷酸进行酶切,以获得酶切片段;和(iv)连接所述酶切片段以形成寡核苷酸,该寡核苷酸含有第一标签、第 二标签、和插入在该标签之间的接头,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述标签含有各个多聚核苷酸的5'末端 和3'末端。
28、 根据权利要求27所述的方法,其中,步骤(ii)中的所述至少一个限 制性内切核酸酶识别位点为衔接头或载体的一部分。
29、 根据权利要求24-28中的任意一项所述的方法,其中,所述核酸-蛋白质复合物是通过染色质的免疫沉淀作用得到的。
30、 一种检测和/或识别核酸-蛋白质复合物中的至少两种多聚核苷酸的 方法,该方法包括(g) 提供核酸-蛋白质复合物;(h) 制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中, 所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所 述第一多聚核苷酸和所述第二多聚核苷酸得自核酸-蛋白质复合物;(i) 对所述寡核苷酸进行测序;和(i)根据所述第一标签和所述第二标签的核苷酸序列对所述至少两种多 聚核苷酸进行定位,从而对所述至少两种多聚核苷酸进行检测和/或识别。
31、 根据权利要求30所述的方法,其中,步骤(b)包括(i) 插入至少一个接头,该接头含有至少一个限制性酶切位点,和;(ii) 使用至少一种能够识别位于所述接头中的至少一个识别位点的限制 性内切核酸酶,对所述第一多聚核苷酸和第二多聚核苷酸进行酶切,以形成 寡核苷酸,该寡核苷酸含有第一标签、第二标签、和位于所述标签之间的接头,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸。
32、 根据权利要求30所述的方法,其中,步骤(b)包括(i) 在所述复合物的第一多聚核苷酸和第二多聚核苷酸之间插入至少一 个接头,该接头含有至少一个限制性内切核酸酶识别位点;(ii) 在第一多聚核苷酸的5'末端和第二多聚核苷酸的3'末端分别加入至 少一个限制性内切核酸酶识别位点;(iii) 使用至少一种能够识别至少一个识别位点的限制性内切核酸酶,对 所述第一多聚核苷酸和第二多聚核苷酸进行酶切,以获得酶切片段;和(iv) 连接所述酶切片段以形成寡核苷酸,该寡核苷酸含有第一标签、第 二标签、和插入在所述标签之间的接头,所述第一标签得自第一多聚核苷酸, 所述第二标签得自第二多聚核苷酸,所述标签含有各个多聚核苷酸的5'末端 禾口 3,末端。
33、 根据权利要求32所述的方法,其中,步骤(ii)中的所述至少一个限 制性内切核酸酶识别位点为衔接头或载体的一部分。
34、 根据权利要求30-33中的任意一项所述的方法,其中,所述核酸-蛋白质复合物是通过染色质的免疫沉淀作用得到的。
35、 根据权利要求30-34中的任意一项所述的方法,其中,所述寡核苷 酸与至少一种另一个寡核苷酸连接,所述另一个寡核苷酸是通过测序前的步 骤(a)-(b)得到的。
36、 根据权利要求30-35中的任意一项所述的方法,其中,所述多聚核 苷酸定位在同一个染色体上,或者所述多聚核苷酸定位在不同的染色体上。
全文摘要
本发明提供了一种分离的寡核苷酸和使用该分离的寡核苷酸对核酸-蛋白质复合物中的至少两种多聚核苷酸进行检测和/或识别的方法。所述寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述第一标签和第二标签得自核酸-蛋白质复合物。
文档编号C12Q1/68GK101410516SQ200780009183
公开日2009年4月15日 申请日期2007年3月9日 优先权日2006年3月13日
发明者莎 丽, 卫嘉玲, 阮一骏 申请人:新加坡科技研究局
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1