功能性dna元件和细胞蛋白的基因组作图的制作方法

文档序号:426366阅读:423来源:国知局
专利名称:功能性dna元件和细胞蛋白的基因组作图的制作方法
技术领域
本发明涉及蛋白质和DNA元件在基因组中的作图。
背景技术
转录调控涉及大量蛋白或蛋白复合物特异性在给定的启动子处组装以活化或抑制RNA合成。在特定的组织或细胞类型中,启动子可以被一系列特定的识别事件所活化。转录因子结合顺式作用调控序列;这些DNA结合蛋白然后招募共活化复合物,这些预活化复合物然后招募核心转录元件。此等顺次招募机制在酵母的细胞周期中于HO基因启动子上得到了证明(Cosma等人,1999)。类似地,基因也可以通过在抑制过程中用序列特异性DNA结合蛋白招募转录共抑制复合物(其间涉及修饰组蛋白的染色质重构因子)而被关闭,用DNA甲基化对特定染色质区域进行后生修饰,从而可以建立长期的分子记忆。
在理解DNA结合蛋白领域时,一个重大的进展是染色质免疫沉淀(ChIP)检测法。该技术允许对参与与特定DNA结合蛋白和其相关的蛋白复合物体内相互作用的功能性DNA元件进行作图,并且已应用于许多个案研究中。原则上,该方法适合用于高通量检测方法,其可以提供新的机会对基因调控网络进行系统水平的研究。
研究者正在试图鉴定人类基因组中的各种功能性DNA元件,无论它们是否参与细胞中的基因表达、DNA复制和染色体区域的建立。特别适合于实现该目标的方法是所谓的ChIP-on-Chip技术,该技术是一种ChIP检测法,其与在含有人类启动子的微阵列的芯片上进行的高通量检测法相偶联。
ChIP检测法已广泛用于体内定位转录因子的结合位点。参见附

图1A,简而言之,用甲醛处理培养的细胞,以诱导DNA和结合的蛋白的体内交联。破碎处理的细胞,并回收核蛋白。用超声波法将DNA随机剪切成大约0.5kb的片段。由于交联所诱导的共价连接,特定蛋白与片段化的DNA保持结合。用抗目标蛋白的特异性抗体免疫沉淀DNA-蛋白复合物。用特异于所研究的给定DNA区域的引物通过PCR分析起始材料和免疫沉淀的材料。如果免疫沉淀导致所研究的DNA片段的显著富集,则可以推断存在体内特异性相互作用。ChIP检测法用于检测转录和DNA复制因子、染色质重构因子、修饰的组蛋白、甲基化的DNA等的特异性靶标。此外,该检测法也已用于检测RNA结合蛋白和DNA元件通过正在转录的RNA的桥接所形成的特异性连接,因为已知转录和拼接在细胞中是空间和时间上偶联的。ChIP-on-Chip技术已用于解释所选DNA靶标的详细机制问题。然而,必须用PCR一次一个地对起始材料和免疫沉淀的材料进行分析,这需要基于可得的功能信息来选择靶标组。简而言之,使用测序的和标注的酵母基因组的信息,PCR扩增单个的基因内序列,并将它们点样在玻璃上,形成启动子微阵列(promoter microassay)。通过用两个末端的引物附着位点进行连接,使免疫沉淀的DNA片段连接起来,从而允许通过PCR进行信号扩增(即连接介导的PCR或LM-PCR)。通过随机引发(priming),最后用不同的荧光染料标记PCR扩增和免疫沉淀的材料。然后,将合并的PCR产物与启动子微阵列杂交,以检测哪些启动子被染色质免疫沉淀法特异性富集。
参见附图1B,ChIP-on-Chip技术在每个实验中需要108个细胞,因而不可能研究发育、肿瘤形成和干细胞,因为它们的起始材料可能是有限的。此外,基于微阵列的方法将面临特异性问题。图1A-1B给出了ChIP-on-Chip的图解说明,下面表1给出了简单比较。
发明概述本发明提供了在生物体基因组中检测多核苷酸-多肽相互作用结构域的方法,包括(a)免疫沉淀与多肽连接的多核苷酸;(b)使所述多核苷酸和所述多肽解离;(c)使多核苷酸与引物对在该引物对与该多核苷酸杂交形成第一杂交复合物的条件下接触,其中每一引物至少包含两个部分,第一部分包含能与靶多核苷酸杂交的靶特异性寡核苷酸,而第二部分包含通用引物附着位点,其中所述通用附着位点是不相同的;(d)使第一杂交复合物和连接酶在允许与多核苷酸杂交的引物对进行连接而形成连接的探针的条件下接触;(e)用通用引物扩增连接的探针,以产生扩增并标记的产物;(f)使所述扩增并标记的产物与寡核苷酸阵列接触以形成检测复合物;和(g)检测所述检测复合物,其中复合物的存在表明存在结合免疫沉淀的多肽的DNA。
本发明也提供了确定活细胞中与目的多肽结合的基因组区域的方法,包括(a)使活细胞中的DNA结合蛋白与活细胞的基因组DNA交联,从而生成含有与基因组DNA交联的DNA结合多肽的蛋白-DNA复合物;(b)生成(a)中所述蛋白-DNA复合物的DNA片段,从而生成含有与DNA结合蛋白结合的DNA片段的混合物;(c)从(b)中产生的混合物中获得与目的多肽结合的DNA片段;(d)使(c)的DNA片段与目的多肽分离;(e)使所述DNA与引物对在引物对与所述DNA杂交以形成第一杂交复合物的条件下接触,其中每一引物至少包含两个部分,第一部分含有能与靶多核苷酸杂交的靶特异性寡核苷酸,第二部分含有通用引物附着位点,这两个引物被设计成特异于靶多核苷酸的上游和下游片段,其中所述通用附着位点是不相同的;(f)使第一杂交复合物与连接酶在允许与所述多核苷酸杂交的引物对进行连接而形成连接的探针的条件下接触;(g)扩增(f)所述的连接的探针;(h)将(g)的扩增产物与包含互补于细胞的基因组DNA的序列的DNA混合,其混合条件为允许扩增产物和互补于基因组DNA的序列的区域之间发生杂交以形成第二杂交复合物;和(i)鉴定(h)的第二杂交复合物,其中所述第二杂交复合物含有细胞中与目的多肽结合的基因组区域。
本发明进一步提供了鉴定活细胞中与目的多肽结合的基因组结构域的方法,包括(a)使活细胞中的DNA结合多肽与活细胞的基因组DNA交联,从而生成含有与基因组DNA交联的DNA结合多肽的蛋白-DNA复合物;(b)生成所述蛋白-DNA复合物的DNA片段,从而生成与DNA结合多肽结合的DNA片段;(c)用特异性结合目的多肽的抗体免疫沉淀所产生的DNA片段;(d)使(c)中所鉴定的DNA片段与目的多肽分离;(e)使所述DNA与引物对在引物对与所述DNA杂交以形成第一杂交复合物的条件下接触,其中每一引物至少包含两个部分,第一部分含有能与靶多核苷酸杂交的靶特异性寡核苷酸,第二部分含有通用引物附着位点,这两个引物被设计成特异于靶多核苷酸的上游和下游片段,其中所述通用附着位点是不相同的;(f)使第一杂交复合物与连接酶在允许与所述多核苷酸杂交的引物对进行连接而形成连接的探针的条件下接触;(g)用标记有可检测的标记的通用引物扩增(f)所述的连接的探针;(h)将(g)的扩增产物与包含互补于细胞的基因组DNA的序列的DNA混合,其混合条件为允许扩增产物和互补于基因组DNA的序列的区域之间发生杂交以形成第二杂交复合物;(i)使用特异于所述标记的方法鉴定(h)的第二杂交复合物,其中所述第二杂交复合物含有细胞中与目的多肽结合的基因组区域;和(j)将(i)中测量的标记强度/数量和对照的标记强度/数量进行比较,其中如果基因组区域中标记的强度/数量高于该区域中对照的标记的强度/数量,则说明其为细胞中与目的多肽结合的基因组区域。
在下面的说明书和附图中给出了一个或多个本发明实施方案的细节。本发明的其它特点、目的和优点可以从说明书和附图以及权利要求中看出。
附图描述图1A-B显示ChIP-on-Chip技术。(A)描述了交联、片段化、染色质免疫沉淀、连接体连接、扩增和Chip分析的方法。(B)显示了ChIP-on-CHIP技术的一些困难,包括与共有重复序列杂交产生假阳性,与共有重复序列交叉杂交产生假阴性。
图2表示本发明的一般方法。显示了交联、片段化、免疫沉淀、生物素化、引物退火、固相选择、连接、扩增和芯片分析。
图3A-B显示检测结果,证明了本发明方法的特异性和敏感性。
图4显示了在LNCaP细胞中用雄激素响应性启动子进行的ChIP-DASL以及SAM分析的结果。每一凝胶合有在雄激素存在和不存在的情况下(IN+和IN-)的输入DNA(input DNA)和在雄激素存在和不存在的情况下(EN+和EN-)的富集的DNA。
图5显示用本发明的ChIP-DASL检测法从2000个人类启动子的5倍掺入(spiking)中获得的结果。
图6显示用本发明的方法鉴定雌激素受体靶基因。显示了在雌激素激动剂存在和不存在的情况下的方法。也显示了芯片数据的SAM分析。
图7显示用盖瓦检测法(tiling assay)在β球蛋白座位上对转录单元进行作图。
图8显示用盖瓦检测法在β球蛋白座位上对转录单元进行作图。显示了相对于ChIP-Chip的ChIP-DASL的灵敏性。
图9图解说明在比较性基因组杂交(Comparative GenomicHybridization)(CGH)、DNA复制和DNase I超敏性中使用本发明方法。
发明详述如此处以及权利要求中所用的,单数形式“a”、“and”和“the”也指复数,除非上下文明确指出为其它含义。因此,例如表述“a probe”包括多个这样的细胞,表述“the primer”指一个或多个引物,以及本领域普通技术人员所知的其它等价物,等等。
除非另有说明,此处所用的所有技术和科学术语与本发明所属领域普通技术人员所理解的相同。尽管任何与此处所述的方法和试剂相似或等同的那些可用于实践本发明方法和组合物,但是下面还是描述了示例性的方法和材料。
所有此处提及的出版物都以其整体引用作为参考,以描述和公开这些出版物中所述的方法,这些方法可以用于本发明中。提供上面所述和本申请中所述的出版物只是为了本申请的申请日前的公开内容。但是不应解释为本发明人不能获得比这些内容更早的公开内容。
通过鉴定DNA结合蛋白在体内行使功能的染色体座位,可以更好地理解DNA结合蛋白如何控制总体基因表达、染色体复制和细胞增殖。此处描述了受调控的DNA元件和蛋白调控子在基因组范围内作图的方法。
已经使用称作RASL的方法(用于RNA退火选择和连接)来解决一般与微阵列方法相关的特异性问题。例如,在5’可变剪接事件中,有两个竞争的5’剪接位点与共有的3’剪接位点。用三个寡聚物来靶向图示的每一剪接位点连接处的20个核苷酸外显子序列。为了区分两个竞争性的3’剪接位点,每一5’寡聚物(1或2,分别用红色和绿色标记)的独特的20核苷酸索引序列。RASL检测法包括下列步骤(1)退火,(2)固相选择,(3)连接,(4)PCR扩增,和(5)在通用索引阵列上进行检测。
本发明联合应用RNA退火选择和连接(RASL)技术和ChIP-on-Chip技术。这种联用在此称为“ChIP-DASL”。图2中给出了ChIP-DASL方法的实施方案。
本发明提供了检查蛋白质与基因组中的DNA(例如完整基因组或其部分,例如一条或多条染色体或染色体区域)结合的方法。在一方面,本发明提供了鉴定与目的蛋白结合的基因组DNA的调控区域(例如启动子或增强子区域)的方法。在另一个方面,本发明涉及组织相关的调控。在另一方面,本发明涉及发育相关的调控。在另一方面,本发明涉及特定疾病状态或障碍中的表达调控。
本发明方法也提供了确定结合蛋白是否是转录因子的能力。如上所述,与结合蛋白相互作用的多核苷酸(例如DNA)与基因组片段杂交(如在芯片上)。如果连接的探针与芯片上的基因组片段结合,并且芯片上的所述基因组已知是生物体基因组中的调控区域,则相应于所述连接的探针的多核苷酸被鉴定为调控区域,并且所述目的蛋白为转录因子。
本发明方法可以用于在真核生物整个基因组中检查和/或鉴定DNA结合蛋白。可以分析各种与DNA结合的DNA结合蛋白。例如,可以用本发明方法检查参与DNA复制或转录调控的任何蛋白质。
在另一个鉴定和分离调控区域的方法中,利用活性转录的基因的染色质通常含有乙酰化的组蛋白的事实来富集调控DNA。参见,例如,Wolffe等人,Cell 84817-819,1996。具体地,乙酰化的H3和H4在转录的基因的染色质中富集,包含调控序列的染色质选择性地与乙酰化的H3结合。因此,可以使用抗乙酰化组蛋白特别是乙酰化H3的抗体进行染色质免疫沉淀以获得富集调控DNA的序列集合。这种抗体的例子包括担不限于来自Upstate Biotechnology(Lake Placid,N.Y.)的抗乙酰化组蛋白H3的抗体。
这样的方法一般涉及使染色质片段化,然后使所述片段与特异性识别并结合乙酰化组蛋白特别是H3的抗体接触。然后可以从免疫沉淀物中收集来自免疫沉淀物的多核苷酸。在片段化染色质之前,可选地可以使乙酰化组蛋白与临近DNA交联。可以根据多种方法使组蛋白与染色质中的DNA交联。一种方法是将染色质暴露于紫外线照射(Gilmour等人,Proc.Natl.Acad.Sci.USA 814275-4279,1984)。其它方法使用化学交联剂。合适的化学交联剂包括但不限于甲醛和补骨脂素(Solomon等人,Proc.Natl.Acad.Sci.USA 826470-6474,1985;Solomon等人,Cell 53937-947,1988)。
在细胞染色质中鉴定到特定转录因子的结合位点则表明存在调控序列。这可以例如通过使用染色质免疫沉淀技术来实现。该技术涉及使用特异性抗体来免疫沉淀包含相应抗原(在这种情况下,为目的转录因子)的染色质复合物,并检查免疫沉淀物中的核苷酸序列。抗体对与抗原结合的特定多核苷酸的免疫沉淀表明抗原与多核苷酸(例如调控结构域)的相互作用(O’Neill等人,Methods in Enzymology,Vol.274,Academic Press,San Diego,1999,PP.189-197;Kuo等人,Method19425-433,1999;和Current Protocols in Molecular Biology.F.M.Ausubel等人编辑,Current Protocols,第21章,a ioint venturebetween Greene Publishing Associates,Inc.and John Wiley & Sons,Inc.,(1998增刊))。
参见图1,在一方面,本发明联合改进的染色质免疫沉淀法(ChIP)和DNA微阵列分析。多核苷酸(例如DNA)和蛋白质被交联(例如细胞用甲醛固定),通过超声收获,通过例如用特异性抗体进行免疫沉淀来富集与结合蛋白或目的蛋白交联的多核苷酸片段。在逆转交联后,将富集的多核苷酸和引物对在所述引物对和所述多核苷酸片段杂交形成第一杂交复合物的条件下接触,其中每一引物包含至少两个部分,第一部分含有能与靶多核苷酸杂交的靶特异性寡核苷酸,第二部分含有通用引物附着位点,这两个引物被设计成特异于多核苷酸片段的上游和下游片段,引物对中的一个引物含有第一通用引物附着位点,第二个引物含有第二通用引物附着位点,其中这些通用引物附着位点是不相同的。第一杂交复合物与连接酶在允许与多核苷酸片段杂交的引物对进行连接而形成连接的探针的条件下接触。用通用引物扩增所述连接的探针,以生成扩增并标记的产物。例如,可以用荧光染料和连接介导的PCR(LM-PCR)进行扩增。在另一个实施方案中,未被(例如被免疫沉淀法)富集的多核苷酸也在不同荧光团的存在下进行LM-PCR,富集和未富集的标记的产物与DNA微阵列杂交(如此处进一步描述的)。可以使用加权平均分析方法对得自多个独立实验的富集/未富集的荧光强度比例进行分析,以计算结合蛋白(例如目的多肽)与阵列中每一序列的相对结合。
在本发明方法中,用本领域已知的交联技术(例如UV光、补骨脂素和/或甲醛)交联与多核苷酸结合的蛋白。产生的混合物将包含结合蛋白质的多核苷酸和未结合蛋白质的多核苷酸。
然后处理该混合物以使混合物中的多核苷酸片段化。片段化技术在本领域是已知的,包括例如生成更小的基因组片段的剪切技术。可以用已建立的片段化染色质的方法来完成片段化,包括,例如超声波法,剪切和/或使用限制性酶。所得的片段大小不同。在一方面,使用超声波技术,可以获得大约200-400个核苷酸的片段。结果,生成了与结合蛋白交联的多核苷酸片段(例如蛋白-DNA复合物)。
通过沉淀技术可以从混合物中分离蛋白-多核苷酸复合物/片段。这样的技术包括但不限于使用针对混合物中蛋白靶标的抗体。例如,可以使用结合(特异性地)目的结合蛋白的抗体(例如多克隆、单克隆)或其抗原结合片段进行免疫沉淀。此外,可以用例如抗体表位(例如血凝素(HA))标记或标签化目的蛋白。然后处理所得的基本纯化(例如富集)并交联的蛋白-多核苷酸片段以分离结合蛋白和多核苷酸。然后所述多核苷酸片段与寡核苷酸探针在所述多核苷酸片段和所述寡核苷酸引物之间能杂交的条件下混合,所述多核苷酸探针含有与所述多核苷酸片段互补的序列。
本发明方法也可以确定结合蛋白是否是转录因子。如上所述,与结合蛋白相互作用的多核苷酸与DNA片段杂交(例如在芯片上)。如果多核苷酸与芯片上的DNA片段结合,并且芯片上的所述DNA片段已知是生物体基因组中的调控区域,则所述多核苷酸被鉴定为调控区域,并且目的蛋白是转录因子。
多个探针(此处也称为“杂交探针”)包含至少两个部分第一部分含有能与靶多核苷酸杂交的靶特异性寡核苷酸,第二部分含有“通用引物附着位点”。两个不同的杂交探针被设计成特异于靶多核苷酸的上游和下游片段。上游杂交探针将含有第一通用引物附着位点,下游杂交探针将含有第二通用引物附着位点。第一和第二通用引物附着位点是不相同的。通用引物附着位点的例子包括T7和T3通用引物附着位点。在本发明的一个方面,第一通用引物附着位点是T7引物附着位点,第二通用引物附着位点是T3引物附着位点。
未经预先扩增,这些杂交探针与通过ChIP从样品中获得的富集的多核苷酸杂交,以形成第一杂交复合物。本发明的探针和引物被设计成具有至少一个与靶多核苷酸基本互补的部分,从而可以出现所述靶多核苷酸和本发明探针或引物之间的杂交。如下所述,该互补不必是完全匹配,可以有任何数目的碱基对错配,这些错配会干扰靶多核苷酸和本发明单链杂交探针之间的杂交。因此,“基本互补”在这里表示探针和靶多核苷酸足够互补,从而可以在中等至高严紧条件下杂交。
因此,检测法通常可以在严紧条件下进行,这些严紧条件只允许在靶标存在下形成第一杂交复合物。严紧性可以通过改变热力学可变的步骤参数来控制,包括但不限于温度、甲酰胺浓度、盐浓度、离液序列高的盐浓度、pH、有机溶剂浓度、及其组合。
这些参数也可用于控制非特异性结合,如在美国专利号5,681,697中所一般性概述的。因此,可能需要在更高的严紧条件下进行某些步骤,以降低非特异性结合。
在本发明中可以使用各种杂交条件,包括高严紧条件、中等严紧条件和低严紧条件;参见例如Maniatis等人,Molecular CloningALaboratoty Manual,第二版,1989,和Short Protocols in MolecularBiology,Ausubel等人编辑,在此引用作为参考。严紧条件是序列依赖性的,并且在不同环境下会不同。较长的序列在较高的温度下特异性杂交。核酸杂交的详细教导可以在Tijssen,Techniques inBiochemistry and Molecular Biology-Hybridization with NucleicAcid Probes,“Overview of principles of hybridization and thestrategy of nucleic acid assays”(1993)中找到。一般,选择严紧条件使其比在确定的离子强度和pH下特定序列的热解链温度(Tm)低大约5-10℃。Tm是指(在确实的离子强度、pH和核酸浓度下)达到平衡时50%与靶标互补的探针与聚腺苷酸化mRNA靶序列杂交的温度(当靶序列过量存在时,在Tm,达到平衡时,50%探针被占据)。严紧条件将会是下列,其中pH7.0-8.3时盐浓度小于大约1.0M钠离子,典型地为大约0.01-1.0M钠离子浓度(或其它盐),对于短的探针(例如10-50个核苷酸),温度至少为大约30℃,对于长的探针(例如多于50个核苷酸),温度至少为大约60℃。通过加入双螺旋去稳定试剂例如甲酰胺也可以实现严紧条件。如本领域已知的,当使用非离子骨架即PNA时,杂交条件可以变化。此外,可以在靶标结合后加入交联剂,使杂交复合物的两条链交联,即共价附着。
用多种方法可以杂交互补性多核苷酸(例如DNA),所述互补性多核苷酸互补于与蛋白结合(例如结合目的蛋白)的富集的多核苷酸片段。例如,互补分子可以固定于载玻片(例如Corning MicroarrayTechnology(CMTTM)GAPSTM)或微芯片上。杂交条件通常包括,例如,高严紧条件和/或中等严紧条件(参见例如Current Protocols inMolecular Biology中的2.10.1-2.10.16页(特别是2.10.8-11)和6.3.1-6页)。探针长度、碱基组成、杂交序列之间的错配百分比、温度和离子强度之类的因素影响了杂交稳定性。因此,高或中等严紧条件可以通过经验确定,并部分依赖于待对于杂交进行评价的多核苷酸(DNA、RNA)和其它核酸的特征。一般,选择严紧条件使其比在确定的离子强度和pH下特定序列的热解链温度(Tm)低大约5-10℃。Tm是指(在确定的离子强度、pH和核酸浓度下)达到平衡时50%与靶标互补的探针与靶序列杂交的温度(当靶序列过量存在时,在Tm,达到平衡时,50%探针被占据)。严紧条件将会是下列,其中pH7.0-8.3时盐浓度小于大约1.0M钠离子,典型地为大约0.01-1.0M钠离子浓度(或其它盐),对于短的探针(例如10-约50个核苷酸),温度至少为大约30℃,对于长的探针(例如多于约50个核苷酸),温度至少为大约60℃。通过加入去稳定试剂例如甲酰胺也可获得严紧条件。对于选择性或特异性杂交,阳性信号(例如鉴定核酸)是背景杂交信号的大约2倍。为本发明的目的,中等严紧杂交条件表示杂交在大约42℃于杂交溶液中进行,所述杂交溶液含有25mM KPO4(pH7.4),5×SSC,5×Denhart’s溶液,50μg/mL变性并超声处理的鲑精DNA,50%甲酰胺,10%硫酸葡聚糖和1-15ng/mL探针,而洗涤在大约50℃于包含2×SSC和0.1%十二烷基硫酸钠的洗涤溶液中进行。高严紧杂交条件表示杂交在大约42℃于杂交溶液中进行,所述杂交溶液含有25mMKPO4(pH7.4),5×SSC,5×Denhart’s溶液,50μg/mL变性并超声处理的鲑精DNA,50%甲酰胺,10%硫酸葡聚糖和1-15ng/mL探针,而洗涤在大约65℃于包含0.2×SSC和0.1%十二烷基硫酸钠的洗涤溶液中进行。
本领域普通技术人员将了解,引物和探针的大小会变化,探针的每一部分和探针的总长度通常为5-500个核苷酸。每一部分的长度为10-100、15-50,依赖于应用和扩增技术,一般长度为10-35。因此,例如,探针的通用引发位点各自长约15-25个核苷酸,而使用得最多的是20个核苷酸。探针的接头序列长度为5-25个核苷酸,最常见为10-20个核苷酸。探针的靶特异性部分的长度一般为15-50个核苷酸,最常见的是20-40个核苷酸。
因此,本发明提供了第一杂交探针组。“探针组”在此表示用于特定的多元检测法中的多个杂交探针。在该情况下,多个表示至少两个,但可以包括多于10个,依赖于检测法、样品和测试目的。
因此,本发明提供了包含通用引发位点的杂交探针组。“通用引发位点”在此处是指能结合用于扩增的PCR引物的探针序列。每一探针组包含上游通用引发位点(UUP)和下游通用引发位点(DUP)。再次地,“上游”和“下游”不是用来指特定的5’-3’方向,而是依赖于系统的方向。一般地,在一个探针组中只使用单个UUP序列和单个DUP序列,尽管本领域普通技术人员明白,不同检测法或不同多元分析法可以使用多个通用引发序列。此外,通用引发位点一般位于杂交探针组(或连接的探针)的5’和3’末端,因为只有引发序列所包围的序列才能被扩增。
此外,在给定特定检测法和宿主基因组的情况下,通用引发序列通常应当尽可能的独特,以确保检测法的特异性。通常,通用引发序列大小为大约5-35碱基对,最典型的是大约15-20碱基对。
如本领域普通技术人员所了解的,两个引发位点的方向是不同的。也就是说,一个PCR引物会直接与第一通用引发位点杂交,而另一个PCR引物将与第二通用引发位点的互补序列杂交。换句话说,第一通用引发位点为有义方向,而第二通用引发位点为反义方向。
除了通用引发位点外,探针组中的每一杂交探针至少包含第一靶特异性序列。如本领域普通技术人员了解的,所述靶特异性序列可以采用多种形式,依赖于所用的探针。例如通过引物选择程序,可以选择特异的40-mer寡核苷酸以代表人类基因组中的给定区域(例如启动子)。通过对人类基因组数据库进行BLAST检索之后允许在基因组相关序列中存在至少4个均匀分布的错配,来证实该方法的独特性。所选序列也避免小的重复序列,具有所需范围内的Tm(例如大约55-65℃),以及包括最少的二级结构(通过ΔG计算)。平行地,合成氨基酸衍生的寡聚物,并将其点样在基质(例如Motorola 3Dcodelink slide)上,以形成基于寡聚物的阵列(例如启动子阵列)。寡聚物基本上被分裂成两半(例如,当寡聚物为40聚体时,它将分裂成两部分,提供两个20聚体)以提供靶特异性序列,所述靶特异性序列与通用引物混合,从而成为上游和下游杂交探针。
所述两个杂交探针可以用于OLA检测系统。基本的OLA方法可以以至少两种不同的方式进行;在第一个实施方案中,只有靶序列的一条链用作连接的模板;或者,可以使用两条链;后者通常称为连接链反应或LCR。一般参见美国专利号5,185,243和5,573,907;EP0320308B1;EP0336731B1;EP0439182B1;WO90/01069;WO89/12696;和WO89/09835,所有这些都被引入作为参考。下面的讨论集中于OLA,但本领域普通技术人员将理解,这也可以很容易地适用于LCR。
在这个实施方案中,杂交探针至少包含第一杂交探针和第二杂交探针。该方法基于下列事实两个探针可以被连接起来,如果它们与靶多核苷酸杂交,并且如果在两个探针的连接处存在完全互补性,但是这并不意味着在两个探针的全长上都必须存在完全互补性。
在一个实施方案中,两个杂交探针被设计成各自具有靶特异性部分。第一杂交探针被设计成与靶多核苷酸(例如多核苷酸片段)的第一靶结构域基本互补,第二杂交探针与靶多核苷酸(例如多核苷酸片段)的第二靶结构域基本互补。一般,杂交探针的每一靶特异性序列长度至少为大约5个核苷酸,典型地为15-30个核苷酸,最经常为20个核苷酸。在一个实施方案中,第一和第二靶结构域直接相邻,即它们没有间插核苷酸。在该实施方案中,至少第一杂交探针与第一靶结构域杂交,第二杂交探针与第二靶结构域杂交。如果在连接处存在完全互补性,则形成连接结构,从而这两个探针可以连接在一起以形成连接的探针。如果这种互补性不存在,则不会形成连接结构,探针不会以可察觉的程度连接在一起。这可以通过热循环来进行,以允许连接的探针从靶多核苷酸上变性脱离,以作为模板进行进一步的反应。如果加入dNTP和聚合酶,该方法也可以用三个杂交探针或被一个或多个核苷酸分隔的杂交探针来进行(这有时候称为“Genetic Bit”分析)。
在该实施方案中,两个杂交探针是不直接相邻的。在该实施方案中,它们可能被一个或多个碱基分隔。加入dNTP和聚合酶来“填充”缺口,接着进行连接反应。这允许形成连接的探针。
如本领域普通技术人员了解的,核酸类似物可以在本发明中用作引物和探针。此外,可以形成天然核酸和类似物的混合物。或者可以形成不同核酸类似物的混合物,以及天然核酸和类似物的混合物。例如可以使用肽核酸(PNA),包括肽核酸类似物。与天然核酸的高度带电的磷酸二酯骨架相反,这些骨架在中性条件下基本是非离子型的。这产生了两个优点。第一,PNA骨架显示出改善的杂交动力学。相对于完全匹配的碱基对来说,PNA对错配碱基对所产生的解链温度(Tm)变化更大。对于一个内部错配,DNA和RNA的Tm通常降低2-4℃。对于非离子型PNA骨架,降低将近7-9℃。类似地,由于它们的非离子性质,附着于这些骨架的碱基的杂交对盐浓度相对不敏感。
杂交探针或引物可以含有任何组合的脱氧核糖核苷酸和核糖核苷酸,以及任何组合的碱基,包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶、异鸟嘌呤等。在一个实施方案中,异胞嘧啶和异鸟嘌呤用于引物和探针中,因为这减少了非特异性杂交,如美国专利号5,681,702所一般性描述的。如此处所用的,术语“核苷”包括核苷酸以及核苷和核苷酸类似物,以及修饰的核苷,例如氨基修饰的核苷。此外,“核苷”包括非天然出现的类似物结构。因此,例如肽核酸的单个单位(每个含有碱基)在此被称为核苷。
连接后,取出未杂交的DNA和杂交探针。在一个方面,这通过使用能特异性保留所有生物素化的DNA包括杂交复合物的链霉抗生物素支持体来完成。例如,在一方面,在与杂交探针接触之前,样品的多核苷酸被生物素化。因此,在与杂交探针接触之前、之中或之后,通过将生物素化的多核苷酸与链霉抗生物素基质接触来固相选择生物素化的多核苷酸。
例如,在ChIP之前或之后,多核苷酸被生物素化。一旦多核苷酸-多肽复合物从不含多肽的多核苷酸中取出之后,生物素化的多核苷酸通过生物素-链霉抗生物素相互作用而结合于固体表面。
在一个方面,一旦除去未杂交的探针后,杂交体进行连接反应。然后使用能与上游和下游通用引发序列杂交的通用引物同时扩增连接的探针。然后在阵列上检测产生的扩增子(可以被直接或间接标记)。这允许检测和定量靶多核苷酸。
例如,一旦除去未杂交的探针(以及从样品中除去其它非目的核酸分子)后,连接的探针被变性,并扩增以形成扩增子,然后检测扩增子。这可以通过几种方法中的一种来完成,包括PCR扩增和滚环扩增。此外,如下所述,可以用多种方式将标记整合入扩增子中。
此处所述的方法中的多核苷酸可以用例如连接介导的聚合酶链式反应来扩增(例如参见Current Protocols in Molecular Biology,Ausubel,F.M.等人编辑,1991,其教导在此引用作为参考)。
如此处所述,从免疫沉淀物中分离的多核苷酸可以克隆以生成文库和/或被测序,所得序列用于产生数据库。临近于由该方法所检测的多核苷酸的多核苷酸也可能是调控区域。这些可以通过在生物体(染色质样品从该生物体获得)的基因组上对分离的多核苷酸进行作图来鉴定,可选地,还可以将它们输入一个或多个数据库。
如本领域普通技术人员所了解的,多核苷酸可以得自样品,包括但不限于实际上几乎任何生物体的体液(例如血液、尿液、血清、淋巴液、唾液、肛门和阴道分泌物、汗和精液),本发明方法中一般用哺乳动物样品,典型的是人类样品。样品可以包含细胞个体,包括原代细胞(包括细菌)和细胞系,包括但不限于,所有类型的肿瘤细胞(特别是黑素瘤、髓细胞性白血病、肺癌、乳腺癌、卵巢癌、结肠癌、肾癌、前列腺癌、胰腺癌和睾丸癌);心肌细胞;内皮细胞;上皮细胞;淋巴细胞(T细胞和B细胞);肥大细胞;嗜酸性粒细胞;血管内膜细胞;肝细胞;白细胞,包括单核白细胞;干细胞,例如造血干细胞、神经干细胞、皮肤干细胞、肺干细胞、肾干细胞、肝干细胞和肌细胞干细胞;破骨细胞;软骨细胞和其它结缔组织细胞;角质细胞;黑素细胞;肝细胞;肾细胞;和脂肪细胞。合适的细胞也包括已知的研究细胞,包括但不限于,Jurkat T细胞、NIH 3T3细胞、CHO、Cos、923、Hela、WI-38、Weri-1、MG-63等(参见ATCC细胞系目录,其在此明确引用作为参考。
使用已知技术从样品中制备多核苷酸。例如,可以使用已知的裂解缓冲液、超声波技术、电穿孔等对样品进行处理,以裂解包含靶多核苷酸的细胞。
靶多核苷酸包括长度至少为20个碱基的核苷酸的多聚形式。分离的多核苷酸是这样的多核苷酸,其不再与生物体(所述多核苷酸从该生物体中获得)天然基因组中与其直接相连的编码序列中的任一个(其一位于5’末端,另一位于3’末端)直接相连。因此,该术语包括,例如整合入载体中的重组DNA;整合入自主复制型质粒或病毒中的重组DNA;或者整合入原核或真核生物基因组DNA中的重组DNA,其不依赖于其它序列,以单独的分子(例如cDNA)存在;以及存在溶液中或微阵列芯片上的基因组片段。本发明的多核苷酸可以是核糖核苷酸、脱氧核糖核苷酸、或这两种核苷酸的修饰形式。该术语包括单链和双链形式的DNA。
术语多核苷酸一般指任何聚核糖核苷酸或聚脱氧核糖核苷酸,其可以是未修饰的RNA或DNA或者修饰的RNA或DNA。因此,例如,此处所用的多核苷酸尤其指单链和双链DNA,单链和双链混合区域的DNA,单链和双链RNA,单链和双链混合区域的RNA,含有DNA和RNA的杂合分子(其可以是单链的,或者,典型地为双链的,或者具有单链和双链混合区域)。
此外,多核苷酸也包括三链区域,其含有DNA或RNA或DNA和RNA。此类区域中的链可以来自同一分子或不同分子。所述区域可以包含一个或多个分子的全部,但更常见的是仅涉及所述一些分子的一个区域。一种三螺旋区域分子常常是寡核苷酸。
在一些方面,多核苷酸或寡核苷酸(例如探针、引物或引物对)包括上述含有一个或多个修饰的碱基的DNA或RNA。因此,为了稳定性或其它原因其骨架被修饰的DNA或RNA也是核酸分子。此外,含有不常见碱基例如肌苷,或修饰的碱基例如三苯甲基化的碱基(仅举这两例)的DNA或RNA也属于此处所用术语多核苷酸或寡核苷酸。
应理解,为了许多本领域已知的有用的目的,DNA和RNA已经进行了许多种修饰。多核苷酸和寡核苷酸尤其包括这样化学、酶促或代谢修饰的多核苷酸形式,以及具有病毒或细胞(包括单细胞和复合细胞)的DNA和RNA特征的化学形式。
靶多核苷酸也可以含有不同的靶结构域,它们可以是相邻的(即连续的)或分开的。例如,在OLA技术中,第一杂交特征可以和靶多核苷酸上的第一靶结构城杂交,第二杂交探针可以和第二靶结构域杂交。所述结构域可以是直接相邻的,或者它们可以被一个或多个核苷酸分开。术语“第一”和“第二”不意味着序列相对于靶多核苷酸5’-3’方向的方向。例如,假定靶多核苷酸为5’-3’方向,则第一靶结构域可以位于第二结构域的5’,也可以位于第二结构域的3’。此外,本领域普通技术人员将明白,寡核苷酸或多核苷酸阵列表面上的探针可以以任何方向连接,从而它们可以有游离的3’末端或5’末端。在一些实施方案中,探针可以在一个或多个内部位点或两个端点进行连接。
反应组分可以同时加入,或者以任何次序依次加入,典型的实施方案在下面描述。此外,该反应体系可以包括多种可以用于所述检测法的其它试剂。这样的其它试剂包括盐、缓冲剂、中性蛋白例如白蛋白、去污剂等,它们可以用于促进最优的杂交和检测,和/或减少非特异性或背景相互作用。依赖于样品制备方法和多核苷酸的纯度,也可以使用改进检测效率的试剂,例如蛋白酶抑制剂、核酸酶抑制剂、抗微生物试剂等。
此外,在大多数实施方案中,双链靶多核苷酸被变性形成单链,以允许与引物和其它探针杂交。典型的实施方案利用了热力学步骤,通常通过将反应温度提高到大约95℃,但是也可以使用pH改变和其它技术。
在一个实施方案中,扩增技术是聚合酶链式反应(PCR)。PCR已得到广泛应用和描述,其涉及使用引物延伸并结合热循环来扩增靶序列;参见美国专利号4,683,195和4,683,202,以及PCR EssentialData,J.W.Wiley & Sons,Ed.C.R.Newton,1995,它们都在此引用作为参考。
一般地,PCR可以简要描述如下。通常通过提高温度使双链杂交复合物变性,然后在过多PCR引物存在的情况下冷却,这些PCR引物就和通用引发位点(例如T7或T3引发位点)杂交。然后DNA聚合酶发挥作用,用dNTP延伸引物,合成新链以形成杂交复合物。样品接着再次加热,使杂交复合物解离,重复该过程。通过使用与第二通用引发位点杂交的互补靶链的第二PCR引物,进行快速和指数级扩增。因此PCR步骤是变性、退火和延伸。PCR的细节是已知的,包括使用热稳定的聚合酶例如Taq I聚合酶和热循环。合适的DNA聚合酶包括但不限于DNA聚合酶I的Klenow片段、SEQUENASE 1.0和SEQUENASE 2.0(U.S.Biochemical)、T5DNA聚合酶和Phi29DNA聚合酶。聚合酶可以是任何聚合酶,但一般将缺少3’外切核酸酶活性。合适的聚合酶的例子包括但不限于缺失外切核酸酶活性的DNA聚合酶I的大(Klenow)片段、Phi29DNA聚合酶、Taq DNA聚合酶等。此外,在一些实施方案中,可以使用能复制单链DNA(即没有形成双链部分的引物)的聚合酶。
将连接的探针引入含有通用引物、聚合酶和核苷酸的溶液中,起始反应。核苷酸是脱氧核苷-三磷酸(也称为脱氧核苷酸或dNTP,例如dATP、dTTP、dCTP和dGTP)。在一些实施方案中,如下所述,一个或多个核苷酸可以含有可检测的标记,其可以为一级或二级标记。此外,核苷酸可以是核苷酸类似物,取决于系统构成。类似地,引物可以含有一级或二级标记。
因此,PCR反应需要至少一个(典型地为两个)PCR引物、聚合酶和一套dNTP。如此处所述,引物可以含有标记,或者一个或多个dNTP可以含有标记。
这些实施方案也具有下列优点未连接的探针不需要除去,因为在靶标不存在时,不会发生显著的扩增。可以通过设计探针使这些优点最大化;例如,在第一个实施方案中,当存在单个杂交探针时,将通用引发位点置于探针的5’末端附近,因为这将允许在不存在连接反应的情况下只产生短的、截短的片段。
可以用多种方式标记扩增子;例如,聚合酶可以整合标记的核苷酸(dNTP),或者通用引物自身含有标记。
“标记”或“可检测的标记”表示允许检测的部分。这可以是一级标记或二级标记。因此,检测标记可以是一级标记(即可以直接检测)或二级标记(间接检测)。
在一个实施方案中,检测标记是一级标记。一级标记是可以被直接检测的标记,例如荧光团。一般,标记分成下面三类a)同位素标记,其可以为放射性同位素或重同位素;b)磁的、电的、热的标记;和c)带色或发光的染料。标记也可以包括酶(例如辣根过氧化物酶等)和磁性颗粒。常见标记包括生色团或磷光体,但一般为荧光染料。用于本发明的合适的染料包括但不限于荧光镧系元素复合物,包括铕和铽的那些、荧光素、罗丹明、四甲基罗丹明、伊红、藻红、香豆素、甲基-香豆素、量子点(quantum dot)(也称为“纳米晶体”)、芘、Malacite绿、1,2-二苯乙烯、Lucifer Yellow、Cascade BlueTM、得克萨斯红、Cy染料(Cy3、Cy5等)、alexa染料、藻红蛋白、bodipy和其它描述于Richard P.Haugland的Molecular Probes Handbook(第6版)的那些,该文献在此引用作为参考。
二级标记是被间接检测的标记;例如,二级标记可以和一级标记结合或反应以用于检测,可以作用于其它产物以生成一级标记(例如酶),或者允许将含有所述二级标记的化合物与未标记的材料分离,等等。二级标记包括但不限于结合配偶体对(例如生物素/链霉抗生物素)中的一个;可化学修饰的部分;核酸酶抑制剂;酶,例如辣根过氧化物酶;碱性磷酸酶;荧光素酶等。
二级标记通常是结合配偶体对。例如,标记可以是能结合其结合配偶体的半抗原或抗原。例如,合适的结合配偶体对包括但不限于抗原(例如蛋白质(包括肽))和抗体(包括其片段(FAbs等);蛋白质和小分子,包括生物素/链霉抗生物素;酶和底物或抑制剂;其它蛋白-蛋白相互作用对;受体-配体;以及糖和它们的结合配偶体。也可以使用核酸-核酸结合蛋白对。一般,将一对中较小的分子附着于核苷酸以整合入引物。典型的结合配偶体对包括但不限于生物素(或亚氨基-生物素)和链霉抗生物素,digeoxinin和Abs,和ProlinxTM试剂。例如,结合配偶体对可以包含生物素或亚氨基-生物素和荧光标记的链霉抗生物素。在pH4.0的缓冲液中亚氨基-生物素与链霉抗生物素解离,而生物素则需要剧烈的变性剂(例如在95℃时6M盐酸胍,pH1.5,或90%甲酰胺)。
如本领域普通技术人员所知的,可以用多种方式进行标记。通常,标记可以用两种方式中的一种进行标记整合入引物,从而扩增反应产生含有标记的扩增子,或者标记附着于dNTP,并被聚合酶整合入扩增子中。
通过将荧光标记的核苷酸包括在LM-PCR反应中或对通用引物进行荧光标记,可以对扩增的DNA进行荧光标记。
标记的扩增子DNA与含有代表基因组全部或亚类(例如一条或几条染色体)的点的DNA微阵列进行杂交。相对于非免疫沉淀的对照,微阵列每一点的荧光强度表明DNA结合蛋白(例如目的蛋白)是否与位于该特定的点上的DNA区域结合。因此,此处所述的方法允许检测整个基因组上的蛋白-DNA相互作用。
如上所述,本发明提供了可用于检测与多肽分子相互作用的多核苷酸的方法和组合物。该方法包括免疫沉淀与多肽交联的多核苷酸,以得到富集的多核苷酸;使多肽与多核苷酸解离;使探针对和所述富集的多核苷酸杂交,每一探针包含例如20聚体靶序列和通用引物;连接所述探针以形成连接的探针;用含有标记的通用引物扩增所述连接的探针;以及使微阵列(例如DNA微阵列)与扩增并标记的产物接触。扩增的产物与阵列位点相互作用(通过杂交),所述阵列位点包含与扩增并标记的产物的序列基本互补的多核苷酸序列。
阵列组成至少包含第一基质,该基质具有包含离散位点的表面。此处“阵列”或“生物芯片”表示处于阵列形式的多个多核苷酸或寡核苷酸。阵列的大小取决于阵列的组成和最终用途。核酸阵列在本领域是已知的,可以用多种方法进行分类,包括有序阵列(例如在离散的点上解析化学物质的能力)和随机阵列。有序阵列包括但不限于,用光蚀刻技术(Affymetrix GeneChipTM)、点样技术(Synteni和其它)、印迹技术(Hewlett Packard和Rosetta)制备的那些,三维“gelpad”阵列和其它本领域已知的那些。此外,液体阵列也可用于本发明方法中。
一般,阵列包含两个到多至十亿或更多不同的序列,依赖于基质的大小以及阵列的最终用途。因此,可以使用非常高密度、高密度、中等密度、低密度和非常低密度的阵列。例如,非常高密度的阵列包含大约10,000,000-2,000,000,000个核酸分子,典型地为大约100,000,000-1,000,000,000个核酸分子(所有数目都是基于cm2)。高密度的阵列包含大约100,000-10,000,000个核酸分子,典型地为大约1,000,000-5,000,000个核酸分子。中等密度的阵列包含大约10,000-100,000个核酸分子,最常见为大约20,000-50,000个核酸分子。低密度的阵列一般包含少于10,000个核酸分子,典型地为大约1,000-5,000个核酸分子。非常低密度的阵列包含小于1,000个核酸分子,典型地为大约10-1000个核酸分子,最常见的为大约100-500个核酸分子。
“基质”或“固体支持体”表示这样的材料,其可经修饰而含有适合连接或结合寡核苷酸、多核苷酸或其它有机聚合物的离散位点,并且适合于至少一种检测方法。可能的基质包括但不限于,玻璃和修饰的或官能化的玻璃、塑料(包括丙烯酸类塑料、聚苯乙烯、以及苯乙烯和其它材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨基甲酸酯、Teflon等)、多糖、尼龙或硝基纤维素、树脂、二氧化硅或基于二氧化硅的材料包括硅和修饰的硅、碳、金属、无机玻璃、光导纤维束和多种其它聚合物。一般地,基质允许光学检测,并且其本身不会明显地干扰光学检测(例如本身不发荧光)。
基质一般是扁平的(平面的),尽管本领域普通技术人员明白也可以使用其它的基质构型。例如,可以使用三维构型,例如将珠子包埋在多孔塑料块中,该塑料块允许样品接近珠子,并且使用共聚焦显微镜进行检测。类似地,珠子也可以置于管子的内表面来进行流动样品分析,以使样品体积最小化。
一般,可以用几种方式来构建阵列组分。例如,可以构建含有多个检测区域(此处有时也称为“检测孔”)的第一基质,例如微量滴定板,从而每一检测区域包含单个阵列。也就是说,检测区域与阵列区域是相同的。例如,微量滴定板的塑料材料可以在每个检测孔的底部含有多个“孔”。
在另一方面,阵列个体的数目由所用微量滴定板的大小决定。因此,96孔、384孔和1536孔微量滴定板使用含有96、384和1536个阵列个体的复合阵列,尽管本领域普通技术人员明白并不是每一微量滴定孔都必须含有一个阵列个体。应当指出的是,复合阵列可以含有相同、相似或不同的阵列个体。也就是说,在一些实施方案中,可能需要对96个不同的样品进行2000个相同的检测。或者,需要对同一样品(96孔中每一孔中的同一样品)进行192,000个实验。或者,复合阵列的每一行或列可以是相同的,以进行冗余度/质量控制。本领域普通技术人员将明白,有多种方式可以构建所述系统。此外,阵列的随机性质表明,相同的珠子群体可以加至两个不同的表面,产生基本相似但可能不完全相同的阵列。
在使用时,将扩增并标记的产物(例如标记的扩增子)暴露给阵列,所述阵列含有与杂交探针基本互补的多核苷酸/寡核苷酸。扩增并标记的产物(例如标记的扩增子)和微阵列中的多核苷酸/寡核苷酸杂交(直接或间接),从而在特定微阵列区域产生光学信号变化。
本发明已经在上面进行了描述,提供下面的具体实施例来进一步说明本发明。下面的具体实施例并不是用来限制本发明的范围。
实施例下面的步骤用于实行本发明的方法。
交联。将甲醛直接加入培养基中至终浓度为1%,并在37℃下温育10分钟,从而使蛋白质和DNA交联。(例如,向板中的10mL生长培养基加入270微升37%的甲醛)。然后抽吸培养基,并除去尽可能多的培养基。用含有蛋白酶抑制剂(1mM苯基甲基磺酰氟(PMSF)、1μg/mL抑蛋白酶肽和1μg/mL抑胃酶肽A)的冰冷的PBS洗涤细胞两次。将细胞刮入锥形试管中,并于4℃2000rpm离心4分钟。向沉淀的SDS中加入具有蛋白酶抑制剂(抑制剂1mM PMSF、1μg/mL抑蛋白酶肽和1μg/mL抑胃酶肽A)的裂解缓冲液。细胞沉淀重悬于200微升SDS裂解缓冲液中,并在冰上孵育10分钟。注意每1×106细胞使用200微升SDS裂解缓冲液;如果使用了更多的细胞,重悬的细胞沉淀应该分成200微升等份,从而每200微升等份含有大约1×106细胞。
超声处理重悬/裂解的细胞沉淀,将DNA剪切成200-1000碱基对的长度,确保使样品保持冰冷。加入8微升5M NaCl,65℃保持4小时以逆转交联。酚/氯仿抽提来回收DNA。
磷酸化。将6微升未磷酸化的寡聚物混合物与1/10体积的5MNaCl和2.5体积冰冷的乙醇混合。混合物在-20℃孵育30分钟。离心30分钟使沉淀的寡聚物成团。颗粒用70-75%乙醇洗涤,并离心5分钟。颗粒干燥,并溶解于足够体积的TE(10mM Tris-HCl,1mMEDTA,pH 8.0)或水中。
交联逆转的DNA的生物素化。洗涤酚-氯仿抽提的DNA,并溶解于TE(pH 8.0)中。对于10微升DNA,加入100纳克噬菌体1DNA,和溶于水的1μl(1μg/μl)PHOTOPROBE生物素(VectorLaboratories),终体积为20μl。在混合物上覆盖矿物油,在95℃加热10分钟。向制备物中加入0.1M Tris(pH 9.5),使终体积为80μl。向混合物中加入160μl的2-丁醇,剧烈涡旋振荡,离心使相分离。除去上部丁醇相,重复丁醇提取。通过加入下面的组分并混合来沉淀生物素化的DNA10μl 10M NH4Ac、2μl 1M MgCl2、1μl糖原和150μl-20℃乙醇。在-20℃乙醇中孵育。混合物在-20℃孵育15分钟。离心30分钟使成颗粒,用70%乙醇洗涤并离心5分钟。使颗粒干燥并重悬于TE中。
退火。在PCR管中混合下列成分足够体积的寡聚物混合物,使每种寡聚物的终浓度为200fmol/反应,生物素化的样品DNA,20μl 2×结合缓冲液(40mM Tris-HCl,pH 7.6,1M NaCl,2mM EDA,0.1%Tween-80),总体积40μl。混合物加热至95℃10分钟,然后冷却至45℃。样品保持10分钟,然后加入5μl链霉抗生物素包被的顺磁珠(Seradyne)。然后样品在45℃孵育2小时。
选择。用150μl洗涤缓冲液(20mM Tris-HCl,pH 7.6,0.1M NaCl,1mM EDTA,0.1%Tween-80)洗涤珠子两次。珠子用1×NEB TaqDNA连接酶缓冲液洗涤。
连接。加入39μl 1×NEB Taq连接酶缓冲液和1μl(40U)的NEB Taq连接酶,并在45℃孵育1小时。用洗涤缓冲液冲洗珠子两次,连接的寡核苷酸对用40μl水通过于95℃加热5分钟而洗脱。
扩增。对于每一反应,混合2.5μl 10×AmpliTaq缓冲液,1.5μl25mM MgCl2,0.5μl dNTPs,15pmole每一PCR引物,2-4μl样品和0.4μl AmpliTaq Gold(5U/μl),总体积为25μl。PCR循环条件为94℃ 10分钟,然后30个循环94℃ 30秒,54℃ 2分钟,72℃ 2分钟。
为了测试本发明方法的特异性,进行下列实验质粒掺入(spiking)如上所述,进行交联选择和交联逆转,这些方法是本领域已知的。如上所述,使寡聚物磷酸化。
寡核苷酸20种不同的寡核苷酸对,用于基因组DNA检测;16种不同的寡核苷酸对,用于掺入质粒DNA检测生物素化与上述相同,但下面三点与上述不同(i)无噬菌体λDNA,(ii)10μl PHOTOPROBE生物素,和(iii)加热30分钟。
来自293T细胞的基因组DNA和四种不同的质粒DNA混合物被分别生物素化。
3)退火与上述相同,除了下面几点(i)每一寡聚物的终浓度为400fmol/反应和(ii)用链霉抗生物素包被的试管(Boeringer-Manhein)代替链霉抗生物素包被的顺磁珠子(Seradyne)。
进行下列反应

选择与上述的一样。
连接与上述的一样,除了下列1小时退火和2小时连接。
扩增与上述相同。
用琼脂糖凝胶电泳分析制备物。数据示于图3A。
用不同倍数的掺入进行的PCR-片段掺入实验。如上所述,进行寡聚物磷酸化。寡核苷酸15种不同的寡核苷酸对,用于未掺入的基因组DNA检测;7种不同的寡核苷酸对,用于掺入和基因组DNA检测。
生物素化与上述相同,除了下列(i)无噬菌体λDNA,(ii)10μl PHOTOPROBE生物素,和(iii)加热30分钟。
进行下列反应来自293T细胞的基因组DNA和7种不同的PCRDNA片段的混合物被一起生物素化。

退火与上述相同,除了下列(i)每一寡聚物的终浓度为400fmol/反应和(ii)用链霉抗生物素包被的试管(Boeringer-Manhein)代替链霉抗生物素包被的顺磁珠子(Seradyne)。
选择与上述相同。
连接与上述相同,除了下列1小时退火,2小时连接。
扩增与上述相同。
数据示于图3B。
本发明方法在雄激素受体(AR)响应性启动子和对照上进行。表A显示了用于该实验的启动子和对照。

LNCaP细胞,即人类前列腺癌细胞系,首先用雄激素激动剂二氢睾酮(DHT)进行处理。模拟(mock)处理的和DHT处理的细胞进行标准的ChIP,以获得抗雄激素受体(AR)富集的DNA。ChIP DNA分别生物素化,并进行DASL分析。来自模拟处理的细胞的免疫沉淀的DNA用T3和Alexa标记的T7进行扩增,而来自DHT处理的细胞的DNA则用T3和Cy3标记的T7进行扩增。然后收集产物,与含有与各个启动子的靶向序列互补的探针的寡核苷酸阵列杂交。由于非雄激素响应性启动子不会被抗AR抗体免疫沉淀,因此在模拟处理和DHT处理的细胞中信号会低,其不能用于计算Cy3/Alexa比例。较高的Cy3/Alexa比例表明在由DHT处理诱导的LNCaP细胞中雄激素受体和启动子I之间的阳性相互作用。有趣的是,在其它细胞类型中,五个启动子(SC、FGF8、LCP1、NKX3A和F9)据文献报道是雄激素响应性的,但是根据图4和6所示的数据,在LNCaP细胞中它们不像是雄激素响应性的。
图4显示了在LNCaP细胞中用雄激素响应性启动子进行本发明方法并用SAM分析获得的结果。每一凝胶含有在雄激素存在和不存在的情况下(IN+和IN-)的输入DNA对以及在雄激素存在和不存在的情况下(EN+和EN-)的富集的DNA对。
图6显示了用本发明方法鉴定雌激素受体靶基因。显示了在雌激素激动剂存在和不存在的情况下的方法。也显示了芯片数据的SAM分析。
传统的基因组盖瓦(tiling)涉及在芯片上放置连续的重叠基因组序列。该策略允许在基因组中客观地定位RNA转录本。事实上,通过将总的细胞质poly(A)RNA与这样的盖瓦阵列杂交,研究者已经显示总RNA似乎与染色体21和22中的无数区域杂交,其中的许多区域甚至不对应于已知的转录单元。
用染色体11p15中的β-球蛋白区域检测盖瓦方法和本发明方法的组合。使用引物筛选程序,设计了1000个40聚体以覆盖β-球蛋白座位中的整个1Mb区域。将合成的寡核苷酸点样于Motorola 3DCodeLink slide上以形成微阵列。制备并混合每一靶标的相应的寡核苷酸对。来自该实验的数据显示于图7和8。
基于上述内容,本发明方法的突出优点显示于表1中。
表1概述对比

*每次检测的成本依赖于阵列密度和要进行的检测法对于30K启动子阵列$240,000对于10个实验室进行1000次检测 $24对于全基因组扫描 $10,000,000对于10个实验室进行1000次检测 $1,000对本发明的许多实施方案进行了描述。但是,应该明白,可以进行多种修改而不背离本发明的精神和范围。因此,其它实施方案也在下面权利要求的范围之内。
权利要求
1.一种在生物体基因组中检测多核苷酸-多肽相互作用结构域的方法,包括a)免疫沉淀与多肽结合的多核苷酸,以获得富集的多核苷酸制备物;b)使富集的制备物中的多核苷酸和多肽解离;c)使所述多核苷酸和引物对在所述引物对和所述多核苷酸杂交形成第一杂交复合物的条件下接触,其中每一引物包含至少两个部分,第一部分包含能与所述富集的制备物中的靶多核苷酸杂交的靶特异性寡核苷酸,第二部分包含通用引物附着位点,这两个引物特异于所述靶多核苷酸的上游和下游片段,其中所述通用引物附着位点是不同的;d)使所述第一杂交复合物与连接酶在允许与所述多核苷酸杂交的引物进行连接而形成连接的探针的条件下接触;e)用通用引物扩增所述连接的探针以生成扩增并标记的产物;f)使所述扩增并标记的产物与寡核苷酸阵列在允许所述连接的探针与所述阵列上的互补寡核苷酸杂交而形成检测复合物的条件下接触;和g)检测所述检测复合物,其中复合物的存在表示与免疫沉淀的多肽结合的DNA的存在。
2.权利要求1的方法,其中所述与多肽结合的多核苷酸是交联的多核苷酸-多肽复合物。
3.权利要求2的方法,其中所述多核苷酸和多肽的交联通过UV光、甲醛、补骨脂素或其任意组合来进行。
4.权利要求1的方法,其中所述通用附着位点选自T3和T7引发位点。
5.权利要求1的方法,其中所述通用引物含有可检测的标记。
6.权利要求5的方法,其中所述可检测的标记选自同位素标记;磁的、电的或热的标记;酶标记;和荧光或发光标记。
7.权利要求6的方法,其中所述同位素标记包含放射性同位素或重同位素。
8.权利要求6的方法,其中所述荧光或发光标记选自荧光镧系元素复合物、铕、铽、荧光素、罗丹明、四甲基罗丹明、伊红、藻红、香豆素、甲基-香豆素、量子点、芘、Malacite绿、1,2-二苯乙烯、Lucifer Yellow、Cascade BlueTM、得克萨斯红、Cy染料、alexa染料、藻红蛋白和bodipy。
9.一种在生物体基因组中检测多核苷酸-多肽相互作用结构域的方法,包括a)使DNA结合蛋白和所述生物体的基因组DNA交联,从而产生DNA-蛋白复合物;b)使所述DNA-蛋白复合物片段化,以产生含有DNA片段-蛋白复合物的混合物;c)从b)产生的混合物中取出DNA片段-蛋白复合物;d)分离c)中获得的DNA片段和DNA结合蛋白;e)使所述DNA和引物对在所述引物对能与所述DNA杂交形成第一杂交复合物的条件下接触,其中每一引物包含至少两个部分,第一部分含有能与所述DNA片段杂交的靶特异性寡核苷酸,第二部分含有通用引物附着位点,这两个引物被设计成特异于所述DNA片段的上游和下游片段,其中所述通用附着位点是不相同的;f)使所述第一杂交复合物与连接酶在允许与所述DNA片段杂交的引物对进行连接而形成连接的探针的条件下接触;g)使所述连接的探针与通用引物接触;h)扩增g)的连接的探针,以获得扩增的产物;i)将h)的扩增的产物和来自所述生物体的互补多核苷酸混合,混合条件为使得所述扩增的产物和所述互补多核苷酸的区域之间发生杂交以形成第二杂交复合物;和j)鉴定i)的第二杂交复合物,其中所述第二杂交复合物含有与DNA结合蛋白相互作用的基因组区域。
10.权利要求9的方法,其中所述生物体是真核细胞。
11.权利要求9的方法,其中所述生物体是原核细胞。
12.权利要求9的方法,其中所述DNA结合蛋白是转录因子。
13.权利要求9的方法,其中用甲醛、补骨脂素和/或UV光使所述细胞的DNA结合蛋白与所述生物体的基因组DNA交联。
14.权利要求9的方法,其中用限制性酶和/或超声波法使所述DNA片段化。
15.权利要求9的方法,其中用结合所述蛋白的抗体取出所述DNA片段-蛋白复合物。
16.权利要求9的方法,其中用连接介导的聚合酶链式反应来扩增h)的连接的探针。
17.权利要求9的方法,其中所述第二杂交复合物形成于DNA微阵列上。
18.权利要求9的方法,其中所述通用引物附着位点选自T3和T7引发位点。
19.权利要求9的方法,其中所述通用引物包含可检测的标记。
20.权利要求19的方法,其中所述可检测的标记选自同位素标记;磁的、电的或热的标记;酶标记;以及荧光或发光标记。
21.权利要求20的方法,其中所述同位素标记包含放射性同位素或重同位素。
22.权利要求20的方法,其中所述荧光或发光标记选自荧光镧系元素复合物、铕、铽、荧光素、罗丹明、四甲基罗丹明、伊红、藻红、香豆素、甲基-香豆素、量子点、芘、Malacite绿、1,2-二苯乙烯、Lucifer Yellow、Cascade BlueTM、得克萨斯红、Cy染料、alexa染料、藻红蛋白和bodipy。
23.一种确定活细胞中与目的多肽结合的基因组区域的方法,包括a)使活细胞中的DNA结合多肽与活细胞中的基因组DNA交联,从而生成与基因组DNA交联的DNA结合多肽;b)生成与DNA结合多肽交联的基因组DNA的DNA片段,从而生成结合DNA结合多肽的DNA片段;c)使用特异性结合目的多肽的抗体使DNA片段免疫沉淀;d)使c)中获得DNA片段与目的多肽分离;e)使所述DNA片段和引物对在所述引物对和所述DNA片段杂交形成第一杂交复合物的条件下接触,其中每一引物包含至少两个部分,第一部分含有能与所述DNA片段杂交的靶特异性寡核苷酸,第二部分含有通用引物附着位点,这两个引物备设计成特异于所述DNA片段的上游和下游片段,其中所述通用附着位点是不相同的;f)使所述第一杂交复合物与连接酶在允许与所述DNA片段杂交的引物对进行连接而形成连接的探针的条件下接触;g)用标记了可检测的标记的通用引物扩增f)的连接的探针,以获得扩增的产物;h)将g)的扩增的产物和来自所述细胞的互补多核苷酸混合,混合条件为使得在所述扩增的产物和所述互补多核苷酸的区域之间发生杂交以形成第二杂交复合物;和i)使用特异于所述标记的方法鉴定h)的第二杂交复合物,其中所述第二杂交复合物含有细胞中与目的多肽结合的基因组区域。
24.权利要求23的方法,进一步包括将i)中测量的标记强度/数量和对照的数量/强度进行比较,其中基因组区域中标记的数量/强度高于该区域中对照的标记的数量/强度,则表明为细胞中与目的多肽结合的基因组区域。
25.权利要求23的方法,其中所述细胞是真核细胞。
26.权利要求23的方法,其中所述细胞是原核细胞。
27.权利要求23的方法,其中所述DNA结合多肽是转录因子。
28.权利要求23的方法,其中使用甲醛、补骨脂素和/或UV光使所述DNA结合多肽与所述细胞的基因组DNA交联。
29.权利要求23的方法,其中使用限制性酶和/或超声波法使所述DNA片段化。
30.权利要求23的方法,其中使用连接介导的聚合酶链式反应扩增f)的连接的探针。
31.权利要求23的方法,其中所述第二杂交复合物形成于DNA微阵列上。
32.权利要求23的方法,其中所述通用引物附着位点选自T3和T7引发位点。
33.权利要求23的方法,其中所述通用引物包含可检测的标记。
34.权利要求33的方法,其中所述可检测的标记选自同位素标记;磁的、电的或热的标记;酶标记;和荧光或发光标记。
35.权利要求34的方法,其中所述同位素标记包含放射性同位素或重同位素。
36.权利要求33的方法,其中所述荧光或发光标记选自荧光镧系元素复合物、铕、铽、荧光素、罗丹明、四甲基罗丹明、伊红、藻红、香豆素、甲基-香豆素、量子点、芘、Malacite绿、1,2-二苯乙烯、Lucifer Yellow、Cascade BlueTM、得克萨斯红、Cy染料、alexa染料、藻红蛋白和bodipy。
37.一种试剂盒,包含用于免疫沉淀与多肽结合的多核苷酸以获得富集的多核苷酸制备物的手段;引物对,其中每一引物包含至少两个部分,第一部分含有能与所述富集的制备物中的靶多核苷酸杂交的靶特异性寡核苷酸,第二部分含有通用引物附着位点,这两个引物备设计成特异于所述靶多核苷酸的上游和下游片段,其中所述通用附着位点是不相同的;连接酶;通用引物;和寡核苷酸阵列。
全文摘要
本发明提供了检查蛋白质与基因组(例如完整的基因组或其部分,例如一条或多条染色体或染色体区域)中的DNA结合的方法。具体地,本发明涉及鉴定基因组DNA中结合目的蛋白的调控区域(例如蛋白或增强子区域)的方法。在一方面,本发明涉及组织相关的调控。在另一方面,本发明涉及发育相关的调控。在另一方面,本发明涉及在特定疾病状态或障碍中的表达调控。
文档编号C12N9/00GK1816636SQ200480019048
公开日2006年8月9日 申请日期2004年7月2日 优先权日2003年7月3日
发明者X-D·付, Y-S·夸昂 申请人:加利福尼亚大学董事会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1