启动子检测及分析的制作方法

文档序号:571319阅读:2695来源:国知局
专利名称:启动子检测及分析的制作方法
技术领域
本公开内容涉及用于检测细胞样品中的调节元件的方法。更具体来说,本公开内 容涉及用于同时检测多个细胞样品中的调节元件的方法及由此产生的用途。本公开内容还 提供用于检测和分析调节元件的载体。
背景技术
所有活生物体的基因均由核酸DNA及RNA编码。各基因编码蛋白,蛋白可由生物 体通过基因表达而产生。调节基因表达的系统响应多种发育和环境刺激,由此使各细胞类型表达独特且特 有的基因亚型,并视需要调节特定基因产物的剂量。剂量控制的重要性可通过以下事实来 理解小鼠中重要调节分子的靶向破坏通常会导致强烈的表型异常(Johnson,R.S.等人, Cell, 71 :577-586 (1992)),正如基因调节机制功能的遗传性或获得性缺陷广泛地促进人类疾病。已使用标准分子生物学技术通过测量核酸来分析细胞中的基因表达。这些 技术包括PCR、RNA印迹分析或其它类型的DNA探针分析,例如原位杂交。这些方法 中的每一种仅允许分析已知基因的转录和/或一次分析少数几种基因的转录(Nucl. Acids Res.19,7097-7104(1991) ;Nucl. Acids Res.18,4833—4842(1990) ;Nucl. Acids Res.18,2789-2792(1989) ;European J.Neuroscience 2,1063-1073(1990) ;Analytical Biochem. 187,364-373(1990) ;Genet. Annal Techn. Appl. 7,64-70 (1990) ;GATA 8(4), 129-133(1991) ;Pro. Natl. Acad. Sci. USA 85,1696—1700 (1988) ;Nucl.Acids Res. 19, 1954(1991) ;Proc. Natl. Acad. Sci. USA 88,1943-1947(1991) ;Nucl. Acids Res. 19, 6123-6127(1991) ;Proc. Natl. Acad. Sci. USA 85,5738-5742(1988) ;Nucl. Acids Res. 16, 10937(1988))。也已利用测量mRNA的水平来监测基因表达。由于蛋白自mRNA转录,因此可通 过测量所存在的mRNA的量来检测转录。一种常见方法称为“杂交相减(hybridization subtraction) ”,它使我们能够通过检测mRNA表达的改变来查看基因表达的改变(Nucl. Acids Res. 19,7097-7104(1991) ;Nucl.AcidsRes. 18,4833-4842(1990) ;Nucl.Acids Res. 18,2789-2792(1989) ;European J. Neuroscience 2,1063-1073(1990) ;Analytical Biochem. 187,364-373(1990) ;Genet. Annal Techn. Appl. 7,64-70 (1990) ;GATA 8(4), 129-133(1991) ;Proc. Natl. Acad. Sci. USA 85,1696-1700 (1988) ;Nucl. Acids Res. 19, 1954(1991) ;Proc. Natl. Acad. Sci. USA 88, 1943-1947(1991) ;Nucl. Acids Res. 19, 6123-6127(1991) ;Proc. Natl. Acad. Sci. USA 85,5738-5742(1988) ;Nucl. Acids Res. 16,10937(1988))。也已通过测量细胞、组织、器官系统或甚至生物体中基因产物(即,所表达的蛋 白)的水平来监测基因表达。通过测量蛋白基因产物来测量基因表达可使用已知结合待 检测的特定蛋白的抗体来实施。困难是需要产生各待检测蛋白的抗体。经由蛋白检测来测 量基因表达还可使用二维凝胶电泳来实施,其中蛋白原则上可以作为个别条带来识别及定 量,且最终简化成离散信号。为正性分析各条带,必须将各条带自膜切除并实施蛋白序列分 析(例如,埃德曼降解(Edman degradation)).然而,分离足量蛋白以获得可靠的蛋白序列 往往较为困难。另外,许多条带通常含有多种蛋白。与通过测量细胞中蛋白基因产物的量来定量基因表达有关的另一困难是蛋白表 达为基因表达的间接测量。不可能从细胞中存在的蛋白获知何时发生蛋白表达。因此,难 以确定蛋白表达是否由于细胞暴露于不同刺激而随时间有所变化。已利用测量特定活化转录因子的量来监测基因表达。细胞中的转录是由活化转录 因子来控制,该转录因子在基因的核心启动子外的位点结合DNA并激活转录。由于活化转 录因子激活转录,因此可利用检测其存在性来测量基因表达。已在原核生物、病毒和真核生 物中发现转录激活物。在分子生物学中,报告基因(通常简称为报告子)是一种基因,研究人员通常将其 附接至细胞培养物、动物或植物中的感兴趣的另一基因上。某些基因被选作报告子是因为 其赋予表达其的生物体的特征可容易地识别并测量,或者因为其是可选标记。报告基因通 常用于确定目标基因是否被细胞或生物体群体吸收或在细胞或生物体群体中表达。为将报告基因引入生物体中,研究人员将报告基因和目标基因置于拟插入至细胞 或生物体中的相同DNA构建体中。对于培养物中的细菌或真核细胞,其通常呈环状DNA分 子(称为质粒)的形式。重要的是使用在所研究细胞或生物体中非天然表达的报告基因, 这是因为报告子的表达被用作为目标基因成功吸收的标记。常用的产生视觉上可识别的特征的报告基因通常涉及荧光蛋白;例如,绿色荧光 蛋白(GFP)及荧光素酶分析。其它报告子包括(例如)半乳糖苷酶、X-gal及氯霉素乙 酰基转移酶(CAT)。许多转染及转化方法-在生物体中表达外来或经修饰基因的两种方式-仅在较小 百分比的经受该技术的群体中有效。因此,需要用于识别那些少数成功的基因吸收事件的 方法。在此方式中使用的报告基因通常在独立于所引入的目标基因的启动子的其自身启动 子控制下表达;所述报告基因可以组成性表达(“始终表达(always on)”)或在外部干预 (例如在β-半乳糖苷酶系统中引入IPTG)下诱导性表达。因此,报告基因的表达独立于 目标基因的表达,这在目标基因仅在某些特定条件下或在难以接近的组织中表达时是有利 的。在可选标记报告子例如CAT的情况下,可使转染的细菌群体在含有氯霉素的底物 上生长。仅成功吸收含有CAT基因的构建体的那些细胞存活并在这些条件下繁殖。还可使用报告基因来分析目标基因的表达,这可产生对细胞培养物或生物体几乎 没有明显或直接效应的蛋白。在这些情况下,将报告子直接附接至目标基因以产生基因融 合体。这两种基因在相同启动子控制下并转录至单个多肽链中。在这些情况下,重要的是, 尽管融合但两种蛋白均能够正确折叠成其活性构象并与其底物相互作用。在构造DNA构建
5体时,通常包括编码柔性多肽连接体区域的DNA区段,以使报告子与目标基因仅最低程度 地彼此相互干扰。可使用报告基因来分析细胞或生物体中特定启动子的活性。在此情况下没有单独 的“目标基因”;报告基因仅置于靶启动子的控制下且定量地测量报告基因产物的活性。通 常报告相对于已知诱导强烈基因表达的“共有”启动子下的活性的结果。在过去几年中,对大量基因组(真核及原核)实施测序已产生巨量数据。尽管编 码区的检测很常见,但主要挑战是给功能非编码序列尤其参与基因转录的那些作注释。由 于转录在调节诸如形态发生、细胞分化、组织特异性、激素通信及细胞应激反应等重要过程 中发挥关键作用,因此需要对转录启动子进行识别及功能表征。可以将用于检测及分析转 录启动子的方法分成两类计算方法和实验方法。用于启动子研究的计算方法纳入了许多公开的及私人的含有从研究收集的信息 的数据库,这些研究由数以百计的实验室公布且使用常规劳动强度大且耗费时间的途径实 施。真核启动子数据库(EPD)和转录调节区数据库(TRRD)分别含有1,871及703条人类 启动子。其它启动子数据库(例如TransFac及DBTSS)含有将近9,000种启动子序列。然 而,这些数据库的大多数源自在计算机芯片上实施的引物延伸分析(例如,TransFac),或 仅含有关于推定的转录起始位点的数据(例如,DBTSS)。与预期35,000个人类基因相比, 较少数量的人类启动子经实验验证,表明还有许多工作要做。已提出许多种基于计算机的启动子预测方法(Scherf等人,J. Mol. Biol. 297 (3) 599-606,2000 ;Werner, Τ. Brief Bioinform. 1 (4) :372_80,2000 ;Loots 等人,Gen. Res. 12 832-839, 2002) 0这些方法受限于缺乏可靠的标准方案来预测及识别启动子区域。启动子 的长度通常仅为数个碱基对(bp),且包埋于巨大的基因组中。因此,启动子相比于长的模式 化的编码序列更难以发现且容易混淆。用于启动子预测的典型计算机算法是基于比较未知 序列与已知元件,此策略不能识别新类型的启动子元件。因此,启动子元件的基于计算机的 检索不完全,而且通常需要实验证实。已使用基于微阵列数据的计算方法来研究全基因组转录调节(Pilpel等人,Nat. Gen. 29(2) : 153-9,2001)。这些技术能够识别给定生物体启动子中的新颖的功能基序组合, 且可提供转录网络的全局概观。然而,这些方法提供的数据同样需要实验手段加以证实。用于研究启动子区域及随后进行表征的实验方法通常遵循一种基本方案。第一, 在识别新的编码序列时,利用标准分子生物学工具(例如Sl作图、引物延伸或5’ RACE)来 界定转录起始位点。第二,克隆上游基因组区域(多达IOkb)且通过在瞬时转染系统中实 施报告子分析证实具有启动子活性。第三,实施缺失及点突变分析以界定重要的转录顺式 作用元件;可通过在瞬时转染分析中使用不同的诱导或阻抑剂来获得关于转录调节的信 息。最后,通过DNA酶I足迹法、存在或不存在突变探针及竞争剂下的电泳迁移率变动分析 (EMSA)、及EMSA超变动分析来识别参与启动子调节的转录因子。基于瞬时转染的实验方法具有几个缺点。这些方法测量报告子蛋白水平而不是 mRNA水平,mRNA是转录的直接产物;蛋白水平并不总是与mRNA水平相关。可使用的报告子 分析的数量非常有限(例如氯霉素乙酰基转移酶、半乳糖苷酶、荧光素酶、绿色荧光蛋 白(GFP)、葡糖醛酸糖苷酶),而且使用相同的报告子来比较各种不同启动子意味着这 些启动子必须单独进行测试且因此这些分析劳动强度大且耗费时间。由于对于所研究的各
6启动子所涉及的许多步骤(即转染、诱导、收获、报告子检测)均单独实施,且通常重复实施 两次或三次,所以同时处理20个以上构建体非常具有挑战性。对于所实施的每一步骤,第 一样品与最后一个样品间的时间差可能相当大;因此各样品的例如培育时间、细胞及试剂 质量彼此可能有所不同,由此引入更多实验变异。需要大量材料和试剂。另外,为对一系列 启动子进行相互比较,需要包括第二报告基子盒作为内部对照。在一些情况下,检测此对照 可能与第一报告子一样耗费时间且劳动强度大,且具有实验误差。此内部对照的表达还可 能与目标启动子所驱动的基因表达竞争而影响分析结果。一些分析(例如荧光素酶及GFP 分析)需要昂贵的测试设备。Kim等人报导用于分离及识别人类基因组中的启动子的实验方法(Kim等人, Genome Research 15 :830_839,2005)。然而,使用抗体来识别可能与主动转录有关的区域 及需要结合RNAP及TFIID 二者的启动子标准可能导致排除一些仅显示部分结合的启动子。Khambata-Ford等人报导通过使用基于反转录病毒质粒文库的功能报告子分 析来识别人类基因组中的启动子区域的实验方法(Khambata-Ford等人,Gen. Res. 13 1765-1774,2003)。然而,除了可能通过随机整合反转录病毒载体而毁灭性地破坏靶标细胞 基因组外,此分析依赖于荧光报告子GFP进行检测且经由荧光激活细胞分选术(FACS)来筛 选细胞。Trinklein等人报导通过使用人类基因组的序列草案及cDNA文库来识别人类转 录启动子及对其进行功能分析的实验方法(Trinklein等人,Gen. Res. 13 =308-312,2003)。 然而,他们利用基于荧光素酶的转染分析来进一步分析及识别启动子序列。基因组测序已产生大量需要注释的数据。可利用计算方法来检测推定的转录启动 子区域,但其并非100%有效且必须通过实验加以证实。遗憾的是,目前可用以研究启动子 的实验程序非常耗费时间,费力,且不易应用于大量启动子。因此,需要用于转录研究的新 颖技术。发明_既述通过提供纳入独特的非编码DNA序列的新颖的报告系统来克服上文所述方法的 以上缺点。本公开内容的目的是提供一种新颖的报告系统,其具有特异性、廉价且可提供高 效的启动子检测手段。本公开内容提供用于检测及分析DNA启动子序列的方法。在优选实施方式中, 本公开内容提供用于检测DNA调节序列的方法,其包括a)将启动子序列候选物插入至载 体中,其中所述载体包含TAG序列且其中将所述启动子序列候选物插入一位置以驱动所 述TAG序列转录;b)将含有所述插入的启动子序列候选物的所述载体插入至克隆宿主细 胞中;c)使含有不同启动子序列候选物的克隆宿主细胞生长至相同光密度,将其集中并提 取其中的所述载体,进行纯化并插入至报告细胞系中;d)自所述报告细胞系提取mRNA,其 中所述mRNA直接进行标记或用作cDNA或探针合成的模板;及e)用阵列对所述经标记的 mRNA、cDNA或探针进行分析,其中所述阵列包含与所述TAG序列相同或互补的序列。优选 地,所述经标记的mRNA、cDNA或探针与所述阵列杂交且所述mRNA、cDNA或探针的标记具有 可检测反应。在另一实施方式中,本公开内容提供用于检测及分析DNA启动子序列候选物的方 法,其中将DNA启动子序列候选物整合于载体中,所述载体包含TAG序列、一个或多个多克
7隆位点、一种或多种DNA重组序列、阴性选择标记、可用于检测mRNA序列的核苷酸序列(例 如T7启动子序列及MA区段)、翻译终止密码子、RNA稳定化片段(例如来自α -珠蛋白基 因的RNA稳定化片段)及转录终止信号(例如多腺苷酸化信号),且其中所述DNA启动子序 列候选物所处的位置应使其能够驱动所述TAG序列转录。在另一实施方式中,本公开内容 提供用于检测及分析DNA启动子序列的方法,其中将DNA启动子序列候选物整合于载体中, 所述载体包含TAG序列、一个或多个多克隆位点、attPl及attP2序列二者、阴性选择标记 (其中所述阴性选择标记是ccdB基因)、T7启动子序列、MA区段、翻译终止密码子、α -珠 蛋白RNA稳定化片段及多腺苷酸化信号,且其中所述DNA启动子序列候选物驱动所述TAG 序列转录。在另一实施方式中,本公开内容提供用于检测及分析DNA启动子序列的方法,其 中将DNA启动子序列候选物整合于载体中,其中所述载体包含TAG序列、一个或多个多克隆 位点、attPl及attP2序列二者、阴性选择标记、T7启动子序列、MA序列(其中所述MA序 列由约25% A、25% T、25% G及25% C构成)、翻译终止密码子、RNA稳定化片段及转录终 止信号,且其中所述DNA启动子序列候选物驱动所述TAG序列转录。优选地,所述载体是质 粒。优选地,所述RNA稳定化片段是来自α-珠蛋白基因。优选地,所述转录终止信号是多 腺苷酸化信号。在另一实施方式中,本公开内容提供用于检测及分析DNA启动子序列的方法,其 中将DNA启动子序列候选物整合于载体中,其中所述载体包含TAG序列、一个或多个多克隆 位点、一种或多种DNA重组序列、阴性选择标记、T7启动子序列、MA序列(其中所述MA序列 由约25% A,25% T、25% G及25% C构成)、翻译终止密码子(其中所述翻译终止在三框架 中(the translation stop is in three frames))、RNA稳定化片段及转录终止信号,且其 中所述DNA启动子序列候选物所处的位置应使其能够驱动所述TAG序列转录。优选地,所 述载体是质粒。优选地,所述RNA稳定化片段是来自α-珠蛋白基因。优选地,所述转录终 止信号是多腺苷酸化信号。优选地,所述DNA重组序列是attPl及attP2。在另一实施方式中,本公开内容提供用于检测及分析DNA启动子序列的方法,其 包括(a)将DNA启动子序列候选物整合于TAG-载体中,其中所述DNA启动子序列候选物 所处的位置应使其能够驱动所述TAG序列转录,其中所述TAG-载体包含用于插入DNA启 动子序列候选物的多克隆位点(MCS) ;DNA重组序列,例如attPl及attP2,其间可插入DNA 启动子序列候选物;使含有启动子序列插入片段的克隆的回收率最大化的阴性选择标记, 例如ccdB ;用于实现RNA合成的核苷酸序列,优选为T7启动子序列;独特的报告TAG ;可用 于自RNA合成探针的特异性MA区段,其中所述MA区段由约25% A、25% T、25% G及25% C构成;三框架翻译终止密码子;RNA稳定化片段,优选来自血红蛋白或α -珠蛋白基因; 及转录终止信号,例如多腺苷酸化信号;(b)将含有所述启动子序列候选物插入片段的所 述TAG-载体克隆至宿主(优选为大肠杆菌(Escherichia coli))中,并将所述克隆排列 至96-孔板中并生长至约相同细胞密度;(c)集中所得克隆,并对其中的载体进行纯化;(d) 将经纯化的载体混合物转染至目标细胞系中;及(e)提取RNA,进行标记并通过与排列于 膜或玻璃支撑体、或珠粒上的DNATAG序列杂交予以定量。适宜珠粒组合物包括用于肽、核 酸和有机部分合成的组合物,包括但不限于塑料、陶瓷、玻璃、聚苯乙烯、甲基苯乙烯、丙烯 酸系聚合物、顺磁性材料、氧化钍溶胶(thoria sol)、碳石墨、二氧化钛、胶乳或交联葡聚糖
8(例如琼脂糖)、纤维素、尼龙、交联微胶粒及特富龙,所有均可使用(参见微球体检测导则 (Microsphere Detection Guide),BangsLaboratories,Fishers Ind.)。优选地,所述载体 是质粒。优选地,所述mRNA、cDNA或探针的标记具有可检测反应。在本公开内容的另一实施方式中提供一种方法,其中所研究的各DNA启动子序列 候选物(例如,计算机预测的DNA启动子序列候选物、来自核苷酸序列集合(例如基因组 文库)的DNA片段、特定DNA启动子的缺失突变体或定点突变体、组织特异性启动子、人工 启动子等)驱动独特的mRNA转录,所述mRNA由包埋于荧光素酶编码序列的5’端的短寡核 苷酸TAG组成,其中集中等摩尔量的各种所研究启动子并转染至细胞系中,且其中通过与 阵列格式的TAG寡核苷酸杂交来定量mRNA水平。在另一实施方式中,报告子是短寡核苷酸 TAG。在另一实施方式中,所述TAG序列的长度为约16个碱基对至约200个碱基对,更优选 地约20个碱基对至约175个碱基对,更优选地约25个碱基对至约150个碱基对,更优选地 约30个碱基对至约125个碱基对,更优选地约45个碱基对至约100个碱基对,更优选地约 50个碱基对至约75个碱基对,更优选地约65个碱基对,且最优选地60个碱基对。在另一 实施方式中,所有TAG序列设计得具有约相同解链温度;此特征允许通过在相同温度及离 子强度条件下杂交来公正地定量各种mRNA。在另一实施方式中,所述方法能够检测及定量 mRNA的水平,而不是报告子蛋白的水平,且不受在常规报告子分析中可能干扰性的翻译及 翻译后事件的影响。在本公开内容的另一实施方式中,使含有TAG载体(优选为质粒)的 各克隆生长至约相同细胞密度,并将含有每一 DNA启动子序列候选物的这些克隆培养物的 经纯化载体(优选为质粒)混合,将所得混合物转染至单一细胞群体中,以为各种启动子创 造竞争环境以募集转录因子。在另一实施方式中,将自具有约相同细胞密度且含有约等摩 尔量的所有DNA启动子序列的克隆细胞培养物纯化的载体(优选为质粒)混合,并用于转 染单一细胞群体,且避免了对于内部对照的需要。可通过数种方式来获得等摩尔量的携带 各种用以转染报告细胞系的候选启动子-TAG组合的载体。在另一实施方式中,可通过以下 方式来获得等摩尔量的载体1)制备载体文库;2)排列载体文库(例如,96孔板);3)自各 克隆取相等部分并将其全部集中;4)使所有克隆一起生长,假定生长速度相同而且每个细 胞产生等量载体;5)提取转化剂(例如,载体、质粒或病毒);及6)将载体(或质粒或感染 病毒)转染至报告细胞系中。或者,可通过以下方式来获得等摩尔量的载体1)制备载体文 库;2)排列载体文库(例如,96孔板);3)使各克隆单独生长(例如,在细菌的情况下于深 孔板中);4)自各克隆取相等部分并将其全部集中;5)提取转化剂(例如,载体、质粒或病 毒);及6)将载体(或质粒或感染病毒)转染至报告细胞系中。或者,可通过以下方式来 获得等摩尔量的载体1)制备载体文库;2)排列载体文库(例如,96孔板);3)使各克隆单 独生长(例如,在细菌的情况下于深孔板中);4)提取转化剂(例如,载体、质粒或病毒)并 进行定量;5)自各克隆(例如,载体、质粒或病毒)取相等部分并将其全部集中;及6)将载 体(或质粒或感染病毒)转染至报告细胞系中。或者,可通过以下方式来获得等摩尔量的 载体1)制备载体文库;2)取各克隆的一部分并将其全部集中;3)使所有克隆一起生长, 且假定生长速度相同而且每个细胞产生等量载体;4)提取转化剂(例如,载体、或质粒或病 毒);5)将载体(或质粒或感染病毒)转染至报告细胞系中并确定目标TAG(例如,高表达 水平);及6)找出载体文库中含有目标TAG的克隆(例如,菌落杂交)。在另一实施方式中,本公开内容提供用于检测及分析DNA启动子序列的方法,其包括(a)将DNA启动子序列候选物整合于载体(优选为质粒)中,其中所述质粒包含TAG 序列、一个或多个多克隆位点、至少一种DNA重组序列(优选为attPl或attP2)、阴性选择 标记(优选为ccdB)、用于实现RNA合成的核苷酸序列(例如T7启动子序列)、MA区段、翻 译终止密码子、RNA稳定化片段(优选地来自血红蛋白或α-珠蛋白基因)及转录终止信 号(例如多腺苷酸化信号),且其中所述DNA启动子序列候选物所处的位置应使其能够驱动 所述TAG序列转录;(b)将含有启动子序列候选物插入片段的载体克隆至宿主(优选为大 肠杆菌)中,并将克隆排列至96-孔板中并生长至相同细胞密度;(c)集中所得克隆,并对 其中的载体进行纯化;(d)将经纯化的载体混合物转染至目标细胞系中,其中避免了使用 内部对照;及(e)提取RNA,进行标记并通过与排列于膜或玻璃支撑体上的DNA TAG序列杂 交予以定量。优选地,所述载体是质粒。优选地,所述mRNA、cDNA或探针的标记具有可检测 反应。在另一实施方式中,本公开内容提供用于检测及分析DNA启动子序列的方法,其 包括将DNA启动子序列候选物整合于载体(优选为质粒)中,其中所述载体包含TAG序 列、一个或多个多克隆位点、至少一种DNA重组序列(优选为attPl或attP2)、阴性选择标 记(例如ccdB)、用于实现RNA合成的核苷酸序列(优选为T7启动子序列)、MA区段、翻译 终止密码子、RNA稳定化片段(优选为血红蛋白或α-珠蛋白基因)及转录终止信号(优 选为多腺苷酸化信号),且其中所述DNA启动子序列候选物所处的位置应使其能够驱动所 述TAG序列转录。在另一实施方式中,本公开内容提供用于检测及分析DNA启动子序列的方法,其 包括(a)将DNA启动子序列候选物整合于载体中,其中所述载体包含TAG序列、一个或多 个多克隆位点、至少一种DNA重组序列、阴性选择标记、用于实现RNA合成的核苷酸序列、MA 区段、翻译终止密码子、RNA稳定化片段及转录终止信号,且其中所述DNA启动子序列候选 物所处的位置应使其能够驱动所述TAG序列转录;(b)将含有启动子序列候选物插入片段 的载体克隆至宿主(优选为大肠杆菌)中,并将克隆排列至96-孔板中并生长至相同细胞 密度;(c)集中所得克隆,并对其中的载体进行纯化;(d)将经纯化的载体混合物转染至目 标细胞系中;及(e)提取RNA,进行标记并通过与排列于膜或玻璃支撑体上的DNA TAG序列 杂交予以定量。优选地,所述载体是质粒。优选地,所述DNA重组序列是attPl或attP2。 优选地,所述用于实现RNA合成的核苷酸序列是T7启动子序列。优选地,所述转录终止信 号是多腺苷酸化信号。优选地,所述RNA稳定化片段是来自血红蛋白或α-珠蛋白基因。优 选地,所述mRNA、cDNA或探针的标记具有可检测反应。在另一实施方式中,本公开内容提供用于检测及分析DNA启动子序列的方法,其 包括(a)将DNA启动子序列候选物整合于载体中,其中所述载体包含TAG序列、一个或多 个多克隆位点、至少一种DNA重组序列、阴性选择标记、用于实现RNA合成的核苷酸序列、MA 区段、翻译终止密码子、RNA稳定化片段及转录终止信号,且其中所述DNA启动子序列候选 物所处的位置应使其能够驱动所述TAG序列转录;(b)将含有启动子序列候选物插入片段 的载体克隆至宿主(优选为大肠杆菌)中,并将克隆排列至96-孔板中并生长至相同细胞 密度;(c)集中所得克隆,并对其中的载体进行纯化;(d)将经纯化的载体混合物转染至目 标细胞系中,且其中在用自具有相同细胞密度的克隆细胞群体纯化的载体转染细胞时避免 了使用内部对照;及(e)提取RNA,进行标记并通过与排列于膜或玻璃支撑体上的DNATAG
10序列杂交予以定量。优选地,所述载体是质粒。优选地,所述DNA重组序列是attPl或attP2。 优选地,所述用于实现RNA合成的核苷酸序列是T7启动子序列。优选地,所述RNA稳定化片 段是来自血红蛋白或α-珠蛋白基因。优选地,所述转录终止信号是多腺苷酸化信号。优 选地,所述mRNA、cDNA或探针的标记具有可检测反应。在本公开内容的另一实施方式中,本公开内容提供用于检测及分析核苷酸序列集 合(例如基因组文库)中的DNA启动子核苷酸序列的方法,其包括(a)将启动子序列候选 物与TAG-载体混合,其中所述TAG-载体包含用于插入启动子序列候选物的多克隆位点 (MCS);至少一种DNA重组序列,例如attPl或attP2 ;使含有启动子序列插入片段的克隆的 回收率最大化的阴性选择标记,例如,ccdB基因;实现RNA合成的T7启动子序列;独特的 约60个碱基对的报告TAG ;可用于自RNA合成探针的特异性MA区段,其中所述MA区段由 约25% A,25% T、25% G及25% C构成;三框架翻译终止密码子;RNA稳定化片段,例如, α-珠蛋白或血红蛋白;及转录终止信号,优选为多腺苷酸化信号;(b)将含有所述启动子 序列候选物插入片段的所述TAG-载体克隆至宿主(优选为大肠杆菌)中,并将所述克隆排 列至96-孔板中并生长至相同细胞密度;(c)集中所得克隆,并对其中的载体进行纯化;(d) 将经纯化的载体混合物转染至目标细胞系中;及(e)提取RNA,进行标记并通过与排列于膜 或玻璃支撑体上的DNA TAG序列杂交予以定量。优选地,所述TAG-载体是TAG-质粒。优 选地,所述mRNA、cDNA或探针的标记具有可检测反应。在本公开内容的另一实施方式中,本公开内容提供用于检测及分析核苷酸序列集 合(例如基因组文库)中的DNA启动子核苷酸序列的方法,其包括(a)将启动子序列候选 物与TAG-载体混合,其中所述TAG-载体包含用于插入启动子序列候选物的多克隆位点 (MCS);至少一种DNA重组序列;阴性选择标记;用于实现RNA合成的核苷酸序列;独特的 约60个碱基对的报告TAG ;可用于自RNA合成探针的特异性MA区段,其中所述MA区段由 约25% A、25% T、25% G及25% C构成;三框架翻译终止密码子;RNA稳定化片段;及转录 终止信号;(b)将含有所述启动子序列候选物插入片段的所述TAG-载体克隆至宿主(优选 为大肠杆菌)中,并将所述克隆排列至96-孔板中并生长至相同细胞密度;(c)集中所得克 隆,并对其中的载体进行纯化;(d)将经纯化的载体转染至目标细胞系中,且不使用内部对 照;及(e)提取RNA,进行标记并通过与排列于膜或玻璃支撑体上的DNA TAG序列杂交予以 定量。优选地,所述载体是质粒。优选地,所述DNA重组序列是attPl或attP2。优选地,所 述阴性选择标记是ccdB。优选地,实现RNA合成的核苷酸序列是T7启动子序列。优选地, 所述RNA稳定化片段是来自α-珠蛋白基因。优选地,所述转录终止信号是多腺苷酸化信 号。优选地,所述mRNA、cDNA或探针的标记具有可检测反应。在本公开内容的另一实施方式中,本公开内容提供用于检测及分析核苷酸序列集 合(例如基因组文库)中的DNA启动子核苷酸序列的方法,其包括(a)将启动子序列候选 物与TAG-载体混合,其中所述TAG-载体包含用于插入启动子序列候选物的多克隆位点 (MCS);至少一种DNA重组序列;阴性选择标记;用于实现RNA合成的核苷酸序列;独特的约 60个碱基对的报告TAG ;可用于自RNA合成探针的特异性MA区段,其中所述MA区段由约 25% A、25% T、25% G及25% C构成;三框架翻译终止密码子;RNA稳定化片段;及转录终止 信号;(b)将含有所述启动子序列候选物插入片段的所述TAG-载体克隆至宿主(优选为大 肠杆菌)中,并将所述克隆排列至96-孔板中并生长至相同细胞密度;(c)集中所得的含有约等量载体的克隆,并对其中的载体进行纯化;(d)将经纯化的载体转染至目标细胞系中, 且其中不使用内部对照;及(e)提取RNA,进行标记并通过与排列于膜或玻璃支撑体上的 DNA TAG序列杂交予以定量。优选地,所述TAG-载体是TAG-质粒。优选地,所述DNA重组 序列是attPl或attP2。优选地,所述阴性选择标记是ccdB。优选地,实现RNA合成的核苷 酸序列是T7启动子序列。优选地,所述RNA稳定化片段是来自α-珠蛋白基因。优选地, 所述转录终止信号是多腺苷酸化信号。优选地,所述mRNA、cDNA或探针的标记具有可检测 反应。在另一实施方式中,本公开内容提供用于分析及检测多个样品中的多个DNA启 动子核苷酸序列的方法,其包括(a)将DNA启动子序列候选物与TAG载体混合,其中所述 DNA启动子序列候选物选自(例如)计算机预测的启动子序列候选物、来自核苷酸序列集 合(例如基因组文库)的DNA片段、特定启动子的缺失突变体或定点突变体、组织特异性启 动子、人工启动子等,其中所述TAG-载体包含用于插入DNA启动子序列候选物的多克隆位 点、DNA重组序列、阴性选择标记、用于实现RNA合成的核苷酸序列、独特的约60个碱基对 的报告TAG、可用于自RNA合成探针的特异性MA区段(其中所述MA区段由约25% A,25% T、25%G及25%C构成)、三框架翻译终止密码子、RNA稳定化片段及转录终止信号;(b)将 含有所述启动子序列候选物插入片段的所述TAG-载体克隆至宿主(优选为大肠杆菌)中, 并将所述克隆排列至96-孔板中并生长至相同细胞密度;(c)集中所得克隆,并对其中的载 体进行纯化;(d)将经纯化的质粒混合物转染至目标细胞系中;及(e)提取RNA,进行标记 并通过与排列于膜或玻璃支撑体上的DNATAG序列杂交予以定量。优选地,所述TAG-载体 是TAG-质粒。优选地,所述DNA重组序列是attPl或attP2。优选地,所述阴性选择标记 是ccdB。优选地,实现RNA合成的核苷酸序列是T7启动子序列。优选地,所述RNA稳定化 片段是来自α-珠蛋白基因。优选地,所述转录终止信号是多腺苷酸化信号。优选地,所述 mRNA、cDNA或探针的标记具有可检测反应。在另一实施方式中,本公开内容提供检测及分析多个样品中的多个DNA启动子核 苷酸序列的方法,其包括(a)将DNA启动子序列候选物与TAG载体混合,其中所述启动子 序列候选物选自(例如)计算机预测的启动子序列候选物、来自核苷酸序列集合(例如基 因组文库)的DNA片段、特定启动子的缺失突变体或定点突变体、组织特异性启动子、人工 启动子等,其中所述TAG-载体包含用于插入启动子序列候选物的多克隆位点、DNA重组序 列、阴性选择标记、用于实现RNA合成的核苷酸序列、独特的约60个碱基对的报告TAG、可用 于自RNA合成探针的特异性MA区段(其中所述MA区段由约25 % A、25 % T、25 % G及25 % C 构成)、三框架翻译终止密码子、RNA稳定化片段及转录终止信号;(b)将含有所述启动子序 列候选物插入片段的所述TAG-载体克隆至宿主(优选为大肠杆菌)中,并将所述克隆排列 至96-孔板中并生长至相同细胞密度;(c)所得克隆含有约等量的载体并集中,并对其中的 载体进行纯化;(d)将约等量的经纯化载体转染至目标细胞系中;及(e)提取RNA,进行标 记并通过与排列于膜或玻璃支撑体上的DNA TAG序列杂交予以定量。优选地,所述TAG-载 体是TAG-质粒。优选地,所述DNA重组序列是attPl或attP2。优选地,所述阴性选择标记 是ccdB。优选地,实现RNA合成的核苷酸序列是T7启动子序列。优选地,所述RNA稳定化 片段是来自α-珠蛋白基因。优选地,所述转录终止信号是多腺苷酸化信号。优选地,所述 mRNA、cDNA或探针的标记具有可检测反应。
在另一实施方式中,本公开内容提供检测及分析多个样品中的多个DNA启动子核 苷酸序列的方法,其包括(a)将DNA启动子序列候选物与TAG载体混合,其中所述启动子 序列候选物选自(例如)计算机预测的启动子序列候选物、来自核苷酸序列集合(例如基 因组文库)的DNA片段、特定启动子的缺失突变体或定点突变体、组织特异性启动子、人工 启动子等,其中所述TAG-载体包含用于插入启动子序列候选物的多克隆位点、DNA重组序 列、阴性选择标记、用于实现RNA合成的核苷酸序列、独特的约60个碱基对的报告TAG、可用 于自RNA合成探针的特异性MA区段(其中所述MA区段由约25%A、25% T、25%G及25% C构成)、三框架翻译终止密码子、RNA稳定化片段及转录终止信号;(b)将含有所述DNA启 动子序列候选物插入片段的所述TAG-载体克隆至宿主(优选为大肠杆菌)中,并将所述 克隆排列至96-孔板中并生长至相同细胞密度;(c)集中所得克隆,并对其中的载体进行纯 化;(d)将约等量的经纯化载体转染至目标细胞系中,且其中避免使用内部对照;及(e)提 取RNA,进行标记并通过与排列于膜或玻璃支撑体上的DNA TAG序列杂交予以定量。优选 地,所述TAG-载体是TAG-质粒。优选地,所述DNA重组序列是attPl或attP2。优选地,所 述阴性选择标记是ccdB。优选地,实现RNA合成的核苷酸序列是T7启动子序列。优选地, 所述RNA稳定化片段是来自α-珠蛋白基因。优选地,所述转录终止信号是多腺苷酸化信 号。优选地,所述mRNA、cDNA或探针的标记具有可检测反应。本公开内容提供一种载体。在一优选实施方式中,本公开内容提供一种载体,其 中插入DNA启动子序列候选物,所述载体包含TAG序列、一个或多个多克隆位点、至少一种 DNA重组序列、阴性选择标记、RNA聚合酶启动子序列、MA区段、翻译终止密码子、RNA稳定 化片段及转录终止信号,且其中所述DNA启动子序列候选物所处的位置应使其能够驱动所 述TAG序列转录。优选地,所述载体是质粒。在另一实施方式中,本公开内容提供一种质粒载体,其包含用于插入推定的启动 子序列的区域,其中MCS位于所述推定的启动子序列的5’端及3’端;一种或多种DNA重组 序列;T7序列;TAG序列;荧光素酶基因序列;MA序列;及翻译终止序列。优选地,所述MA序 列是MA5或MA4。优选地,所述MA序列位于TAG序列的3,端。优选地,所述荧光素酶基因 序列是部分荧光素酶基因序列或完整荧光素酶基因序列。优选地,所述翻译终止序列是至 少一个读码框、更优选地至少两个读码框、且最优选地三个读码框中的翻译终止序列。优选 地,所述DNA重组序列是attPl及attP2。在另一实施方式中,本公开内容提供一种质粒载体,其中插入DNA启动子序列,所 述质粒载体包含TAG序列、一个或多个多克隆位点、attPl及attP2序列之一或二者、阴性 选择标记、RNA聚合酶启动子序列、MA区段、翻译终止密码子、RNA稳定化片段及转录终止信 号,且其中所述DNA启动子序列所处的位置应使其能够驱动所述TAG序列转录。优选地,所 述载体是质粒。优选地,所述TAG序列是约16个碱基对至约200个碱基对,更优选地,所述 TAG序列的载体是约60个碱基对。优选地,所述TAG序列位于所述插入的启动子序列的3’ 端及转录终止信号的5’端。优选地,所述DNA启动子序列是增强子。优选地,所述翻译终 止密码子是三框架(three frame)翻译终止密码子。优选地,所述RNA稳定化片段是来自 α-珠蛋白基因。优选地,所述转录终止信号是多腺苷酸化信号。优选地,所述RNA聚合酶 启动子序列是Τ7启动子序列。在另一实施方式中,本公开内容提供一种载体。本公开内容提供用于检测及分析
13启动子核苷酸序列的核苷酸序列,其包含T7启动子、TAG序列、MA序列及多腺苷酸化信号。 在本公开内容的另一实施方式中,所述启动子序列候选物选自由计算机预测模型提供的启 动子序列候选物、来自核苷酸序列集合(例如基因组文库)的DNA片段、特定启动子的缺失 突变体或定点突变体、组织特异性启动子、人工启动子等。在另一实施方式中,所述TAG序 列是由随机核苷酸构成的DNA序列。在另一实施方式中,所述TAG序列的长度短,优选地约 16个碱基对至约200个碱基对,更优选地约20个碱基对至约150个碱基对,更优选地约30 个碱基对至约120个碱基对,更优选地约40个碱基对至约100个碱基对,更优选地约50个 碱基对至约75个碱基对,且最优选地约60个碱基对。在多个TAG序列中,各TAG序列具有 大致同等量的核苷酸A、T、G及C,由此各TAG序列具有彼此大致相同的解链温度。相同解 链温度允许通过在相同温度及离子强度条件下杂交来公正地定量各种mRNA。在另一实施方 式中,所述特异性MA区段可用于自RNA合成探针,且所述MA区段由约25% A、25% T、25% G及25% C构成。在另一实施方式中,本公开内容提供一种方法,其中使用核苷酸序列来检测及分 析启动子核苷酸序列,其包含T7启动子序列、TAG序列、MA序列及多腺苷酸化信号。DNA 启动子序列候选物可选自由计算机预测模型提供的启动子序列候选物、来自核苷酸序列集 合(例如基因组文库)的DNA片段、特定启动子的缺失突变体或定点突变体、组织特异性启 动子、人工启动子等。在优选实施方式中,所述TAG序列是由短的随机核苷酸构成的DNA序 列,优选地约16个碱基对至约200个碱基对,更优选地约20个碱基对至约150个碱基对, 更优选地约30个碱基对至约120个碱基对,更优选地约40个碱基对至约100个碱基对,更 优选地约50个碱基对至约75个碱基对,且最优选地约60个碱基对。在另一实施方式中,本公开内容提供一种克隆载体,其包含TAG序列;转录终止信 号,优选为多腺苷酸化信号;用于实现RNA合成的核苷酸序列,优选为T7启动子序列;及MA 序列,其中用于实现RNA合成的所述核苷酸序列(优选为T7启动子序列)及所述MA序列 位于反义DNA链上。在本公开内容的另一实施方式中,提供一种克隆载体,其中所述克隆载 体由以下构成DNA启动子序列候选物;TAG序列;转录终止信号,优选为多腺苷酸化信号; 用于实现RNA合成的核苷酸序列,优选为T7启动子序列;及MA序列,其中所述DNA启动子 序列候选物、所述TAG序列及所述转录终止信号(优选为多腺苷酸化信号)位于正义DNA 链上。在本公开内容的另一实施方式中,提供一种克隆载体,其中所述克隆载体由以下 构成(is comprised of) TAG序列;转录终止信号,优选为多腺苷酸化信号;用于实现RNA 合成的核苷酸序列,优选为T7启动子序列;及MA序列,其中所述DNA启动子序列候选物位 于所述TAG序列的5’端,且其中所述TAG序列位于所述转录终止信号(优选为多腺苷酸化 信号)的5’端。在本公开内容的另一实施方式中,提供一种克隆载体,其中所述克隆载体 由以下构成TAG序列;转录终止信号,优选为多腺苷酸化信号;用于实现RNA合成的核苷 酸序列,优选为T7启动子序列;及MA序列,且所述TAG序列位于所述DNA启动子序列候选 物的3’端且所述转录终止信号(优选为多腺苷酸化信号)位于所述TAG序列的3’端。在本公开内容的另一实施方式中,提供一种克隆载体,其中所述克隆载体由以下 构成TAG序列;转录终止信号,优选为多腺苷酸化信号;用于实现RNA合成的核苷酸序列, 优选为T7启动子序列;及MA序列,其中所述DNA启动子序列可操作地连接至所述TAG序
14列。在本公开内容的另一实施方式中,提供一种克隆载体,其中所述克隆载体包含DNA启 动子序列候选物;TAG序列;转录终止信号,优选为多腺苷酸化信号;用于实现RNA合成的 核苷酸序列,优选为T7启动子序列;及MA序列,且所述TAG序列可操作地连接至所述转录 终止信号(优选为多腺苷酸化信号)。在本公开内容的另一实施方式中,提供一种克隆载体,其中所述克隆载体由以下 构成TAG序列;转录终止信号,优选为多腺苷酸化信号;用于实现RNA合成的核苷酸序列, 优选为T7启动子序列;及MA序列,其中所述DNA启动子序列位于所述TAG序列的5’端,所 述TAG序列位于所述转录终止信号(优选为多腺苷酸化信号)的5’端,转录终止信号位于 DNA启动子序列候选物的3’端,且所述DNA启动子序列候选物可操作地连接至所述TAG序 列且TAG序列可操作地连接至所述转录终止信号。在本公开内容的另一实施方式中,提供一种克隆载体,其中所述克隆载体由以下 构成一对MCS ;TAG序列;转录终止信号,优选为多腺苷酸化信号;用于实现RNA合成的核 苷酸序列,优选为T7启动子序列;及MA序列,一个MCS位于所述DNA启动子序列候选物的 5’端且一个MCS位于所述DNA启动子序列候选物的3’端。本公开内容提供用于启动子检测及分析的基于阵列的方法。所述方法提供转录产 物,所述转录产物在其合成时被加以标签,以使一种特定转录物仅由一种类型的TAG标记, 且一种TAG仅标记一种类型的转录物。所有启动子序列候选物均在一个反应小瓶中同时进 行分析。转录输出在常规阵列上进行分析,而且可以利用不需要昂贵设备的程序来检测。所 述方法可满足减少劳动力、成本的要求,且提供了自基因组文库检测启动子区域的优点和 其它相关优点。参考详细描述及例示性实施例可明了本公开内容的所述及其它实施方式,这些详 细描述及例示性实施例旨在例示本公开内容的非限制性实施方式。本文所揭示的所有参考 文献的全文均以引用方式并入本文中,如同各参考文献分别并入一般。术语表除非另有定义,否则本文所用的所有技术及科学术语都具有与本公开内容所属领 域的技术人员所通常了解的含义相同的含义。通常,本文所用的命名及下文所述细胞培养、 分子遗传学、及核酸化学及杂交中的实验室程序已为所属领域的技术人员所熟知且常用。 使用标准技术来实施重组核酸方法、聚核苷酸合成、及微生物培养及转化(例如,电穿孔、 脂转染)。通常,按照制造商说明书实施酶促反应及纯化步骤。技术及程序通常按照此项技 术中的常规方法及本文件全文中提供的各种一般参考文献实施(通常参见Sambrook等人, Molecular Cloning :A Laboratory Manual,第2版(1989)ColdSpring Harbor Laboratory Press, Cold Spring Harbor,N. Y.,其以引用方式并入本文中)。单位、前缀和符号可以SI接 受的形式表示。除非另有说明,否则分别地,核酸是以5'至3'方向从左到右书写;氨基酸 序列是以氨基至羧基方向从左到右书写。数字范围包括界定范围的数字在内并包括所界定 范围内的每一个整数。氨基酸在本文中可通过其通常已知的三字母符号或通过IUPAC-IUB 生物化学命名委员会推荐的单字母符号来提及。同样,核苷酸可通过其通常接受的单字母 代码来提及。除非另外提供,否则本文所用的软件、电学及电子学术语与电及电子学术语的 新 IEEE 标准词典(The New IEEEStandard Dictionary of Electrical and Electronics Terms)(第5版增补版,1993)中所定义的相同。如本公开内容通篇所使用,除非另有说明,
15否则以下术语应理解为具有以下含义且通过参考作为整体的说明书更全面地定义术语“扩增”是指使用至少一种核酸序列作为模板构建核酸序列的多个拷贝或与 核酸序列互补的多个拷贝。扩增系统包括(例如)聚合酶链反应(PCR)系统、连接酶链反应 (LCR)系统、基于核酸序列的扩增(NASBA,Canteen,Mississauga,Ontario)、Q-β复制酶系 统、基于转录的扩增系统(TAS)及链置换扩增(SDA)。参见,例如,Diagnostic Molecular Microbiology Principles andApp 1 ications, D. H. Persing 等人编辑,American Society for Microbiology, Washington, D. C. (1993)。扩增产物称为扩增子。术语“阵列”是指含有核酸样品的阵列。阵列可以是“宏阵列(macroarray) ”或“微 阵列(microarray) ”。术语“微阵列”是指含有核酸样品的阵列,还称为显微DNA ‘斑点’,其 结合至诸如显微镜载玻片、塑料或硅晶片等固体基质上。因为各样品所占据物理面积的直 径通常为50-200μπι,所以代表多个样品的核酸样品可以结合至固体基质,包括(例如)完 全基因组、基因组文库、自计算预测模型合成的DNA样品、或所研究启动子的缺失突变体。 固体基质可包括膜或珠粒。宏阵列可以是(例如)市面有售(Clontech)或手动合成的阵 列。珠粒可以由用于肽、核酸和有机部分合成的材料制成,包括但不限于塑料、陶瓷、玻璃、 聚苯乙烯、甲基苯乙烯、丙烯酸系聚合物、顺磁性材料、氧化钍溶胶、碳石墨、二氧化钛、胶乳 或交联葡聚糖(例如琼脂糖)、纤维素、尼龙、交联微胶粒及特富龙,所有均可使用(参见微 球体检测导则,BangsLaboratories, Fishers Ind.)。就一些目标实验条件来说,微阵列允 许同时监测给定样品的基因。可以通过将核酸样品机械沉积至固体基质上来制作微阵列。 或者,可以手动沉积核酸样品。术语“DNA微阵列”可应用于几种不同的技术形式,各技术形 式所应用的核酸类型及应用方法不同。术语“分析标记”或“报告基因”是指可检测或‘跟踪’的基因。报告基因的表达可 以RNA水平或蛋白水平测量。可在实验分析方案中检测基因产物,例如标记酶、抗原、氨基 酸序列标记、细胞表型标记、核酸序列标记及其类似物。“报告基因”(或“报告子”)是一种 基因,研究人员可将其附接至细胞培养物、细菌、动物或植物中的另一目标基因上。一些报 告子是可选标记,或者赋予表达其的生物体以特征以使所述生物体容易被识别及测量。为 将报告基因引入生物体中,研究人员将报告基因与目标基因置于待插入至细胞或生物体中 的相同DNA构建体中。对于培养物中的细菌或真核细胞,此通常呈质粒形式。常用的报告 基因可包括荧光蛋白、荧光素酶、β-半乳糖苷酶、及可选标记,例如氯霉素、及ccdB。术语“cDNA”是指自成熟的mRNA模板合成的DNA。cDNA最常见地使用反转录酶自 成熟的mRNA合成。所述酶作用于单一 mRNA链上,基于RNA碱基对(A、U、G、C)与其DNA补 体(Τ、A、C、G)成对而产生其互补DNA。有数种已知的产生cDNA以(例如)获得内含子已 经剪接的真核cDNA的方法a)真核细胞将DNA (来自基因)转录成RNA (前mRNA) ;b)所述 细胞通过剪接出内含子并添加多腺苷酸尾及5’甲基-鸟嘌呤帽来加工前mRNA链;c)自细 胞提取此成熟mRNA链混合物;d)使多-T寡核苷酸引物杂交至成熟mRNA模板的多腺苷酸 尾上。(反转录酶需要此双链区段作为引物来开始其运转。);e)添加反转录酶与三磷酸 脱氧核苷酸(A、T、G、C) ;f)所述反转录酶扫描成熟的mRNA并合成补充mRNA模板的DNA序 列。此 DNA 链是互补 DNA。(也可参见 Current Protocols in Molecular Biology, John Wiley & Sons)。术语“克隆宿主细胞”是指含有克隆载体的宿主细胞。
术语“克隆载体”是指在宿主细胞中具有自主复制能力的DNA分子,例如质粒、粘 粒、或噬菌体、或病毒,例如反转录病毒、腺病毒相关病毒、慢病毒、杆状病毒及腺病毒。克隆 载体通常含有一个或少数几个限制性内切核酸酶识别位点,在所述位点上可以可确定方式 插入外来DNA序列而不损失载体的基本生物功能,以及适宜用于识别及选择经克隆载体转 化的细胞的可选标记基因。可选标记基因可包括提供四环素抗性、氨苄西林抗性或其它可 观察到的特征的基因,例如ccdB基因。术语“可检测标记”涵盖可选标记及分析标记二者。术语“可选标记”是指多种基 因产物,可通过这些基因产物选择或筛选用表达构建体转化的细胞,包括药物抗性标记、用 于荧光激活细胞分选术的抗原标记、黏着标记(例如允许选择性黏着的黏着配体的受体) 及其类似物。当以合成方式制备或改变核酸时,可利用核酸欲表达于其中的预期宿主的已 知密码子偏好。术语“可检测反应”是指可在分析中检测到的任何信号或反应,所述分析可在有或 无检测试剂下实施。可检测反应包括(但不限于)放射性衰变及能量(例如,荧光、紫外 线、红外线、可见光)发射、吸收、偏振、荧光、磷光、透射、反射或共振转移。可检测反应还包 括色谱迁移率、浊度、电泳迁移率、质谱、紫外光谱、红外光谱、核磁共振谱及X射线衍射。或 者,可检测反应可以是测量生物物质的一种或多种性质的分析的结果,例如熔点、密度、传 导性(conductivity)、表面声波、催化活性或元素组成。“检测试剂”是产生指示存在或不 存在目标物质的可检测反应的任何分子。检测试剂包括多种分子中的任一种,例如抗体、核 酸序列及酶。检测试剂可包含标记以有助于检测。术语“DNA重组序列”是指可将DNA片段有效地转移跨过多个系统及转移至多个载 体中的核酸序列。侧接重组位点的任一 DNA片段均可转移至具有对应位点的任何载体中。 方向及读码框以一定效率(通常为99%)得以保持,有效地避免了对于实施初始入门克隆 (entry clone)后实施二次测序或亚克隆的需要。DNA片段的转移利用基于λ噬菌体的位 点特异性重组而不是限制性内切核酸酶及连接酶来将目标基因插入至表达载体中。可使用 DNA重组序列(例如,attL、attR、attB及attP)及酶混合物(例如,LR及BP克隆酶)来调 介λ重组反应。将基因转移至目的载体中是通过两个步骤来完成1)将目标基因克隆至 入门载体(entry vector)中;及2)在体外将含有目标基因的入门克隆与合适的表达载体 (目的载体)及酶混合物混合。att位点(attR xattL attB χ attP)间的位点特异性重组 产生表达克隆及副产物。所述表达克隆含有重组至目的载体骨架中的目标基因。在大肠杆 菌中转化及选择后,表达克隆已准备就绪待用于在合适宿主中表达。所述基于λ的系统还 称为Gateway 克隆系统(Invitrogen 公司,Carlsbad,CA)。术语“电穿孔”是指由外部施加电场引起的细胞质膜的导电性及渗透性的显著增 加。其用作向细胞中引入一些物质的方式,例如向细胞中加载一段编码DNA、分子探针或药 物。当横跨质膜的电压超过其介电强度时形成孔。如果所施加电场的强度和/或暴露于电 场的持续时间选择适当,在较短时间后由电脉冲形成的孔会重新封闭,期间细胞外化合物 有机会进入细胞中。然而,活细胞过多暴露于电场可能导致细胞死亡。利用电穿孔仪实施 电穿孔,电穿孔仪是产生电流并将其输送通过细胞溶液(通常为细菌)的设备。将溶液吸 取至玻璃或塑料小池中,所述小池的侧面上具有两个Al电极。例如,实施细菌电穿孔时, 通常使用约50 μ 1的悬浮液。在电穿孔之前,将其与待转化的质粒混合。将混合物吸取至小池中,设定电穿孔仪的电压(通常使用2,400伏特),并将小池插入至电穿孔仪中并施加 电流。在电穿孔后立即向细菌(在小池中或在微量离心管中)中添加Iml液体培养基,并 将所述管在细菌的最适宜温度下培育1小时或更长时间,随后将其散布于琼脂板上(参见 Ausubel,Current Protocols in Molecular Biology,Wiley)。术语“等摩尔”是指在一升溶液中具有相等的摩尔浓度。术语“表达系统”是指包括蛋白编码区的基因序列,所述蛋白编码区可操作地连接 至表达蛋白编码区所需要的所有基因信号。传统上,表达系统包括调节元件(例如启动子 或增强子)以增强蛋白编码区的转录和/或翻译、或控制表达。所述调节元件可以位于蛋白 编码区的上游或下游,或者可以位于中断所述蛋白编码区的内含子(非编码部分)处。或 者,蛋白编码区序列本身也可以具有调节能力。术语“表达载体”是指包含在宿主细胞中表达的基因的DNA分子。通常,基因表达 处于某些调节元件的控制下,所述调节元件包括启动子、组织特异性调节元件及增强子。可 以说所述基因“可操作地连接至”调节元件。术语“功能剪接受体”是指任一个别功能剪接受体或功能剪接受体共有序列,其允 许本公开内容构建体加以处理,由此包括于任一成熟的生物活性mRNA中,条件是其在活性 染色体基因座中是完整的,且作为染色体基因座的前信使RNA的邻接部分进行转录。术语“归巢(homing)内切核酸酶”是指具有大的不对称识别位点(12_40个碱基 对)及通常包埋于内含子或内含肽中的编码序列的双链DNA酶。剪接出前体RNA中的内含 子,同时剪接出前体蛋白中的内含肽。使用与限制性内切核酸酶类似的公约对归巢内切核 酸酶进行命名,其中内含子编码的内切核酸酶含有前缀“I-”且内含肽内切核酸酶含有前缀 “PI-”。归巢内切核酸酶识别位点非常少。例如,在每一 7xl01(l个碱基对的随机序列中18个 碱基对的识别序列仅出现一次。此相当于在20个哺乳动物级基因组中仅有一个位点。然 而,与标准限制性内切核酸酶不同,归巢内切核酸酶在其识别序列内允许一定的序列简并 性。因此,其所观察到的序列特异性通常在10-12个碱基对范围内。归巢内切核酸酶不具 有如限制酶那样严格界定的识别序列。换句话说,单碱基变化不会彻底破坏剪切,但会以可 变的程度降低其效率。通常并不了解所需碱基的准确范围。术语“宿主细胞”涵盖含有载体且优选地支持所述载体的复制和/或表达的任何 细胞。宿主细胞可以是原核细胞(例如大肠杆菌)或真核细胞(例如酵母、昆虫、两栖动物 或哺乳动物细胞)。本文所用的此术语意指任何细胞,其可以在培养物中或在活体内作为单 细胞生物体的一部分、多细胞生物体的一部分、或为融合或工程细胞培养物。术语“杂交”是指将互补的单链核酸组合成单一分子的过程。核苷酸在正常条件下 会结合其补体,因此两条完全互补的链很容易彼此结合(或‘退火’)。然而,由于核苷酸的 分子几何结构不同,两条链间的单一不一致将会造成其间的结合在能量方面更为不利。通 过定量两条链的退火速率来测量碱基不相容性的效应可提供关于退火的两条链间的碱基 序列相似性的信息。术语“内部核糖体进入位点”(IRES)是指允许下游编码区或开放读码框与细胞质 多聚核糖体附接以在不存在任何内部启动子下开始其翻译的元件。包括IRES以开始翻译 可选标记蛋白编码序列。可以使用的适宜IRES的实例包括免疫球蛋白重链结合蛋白(BiP) 的哺乳动物IRES。其它适宜的IRES来自小核糖核酸病毒(picomavirus)。例如,所述IRES包括来自脑心肌炎病毒(优选地核苷酸数量为163-746)、脊髓灰质炎病毒(优选地核苷酸 数量为28-640)及口蹄疫病毒(优选地核苷酸数量为369-804)的IRES。因此,IRES位于 小核糖核酸病毒的长5'非翻译区中,其可自其长病毒环境移至无关基因以产生多顺反子 的 mRNA。术语“分离的”是指诸如核酸或蛋白等物质,其具有以下性质⑴实质上或基本 上不含在其天然存在环境中发现的通常伴随其或与其相互作用的组份。所述分离的物质任 选地包含不与所述物质在其天然环境中一起发现的物质;或(2)如果所述物质存在于其天 然环境中,则已通过故意的人类干预将所述物质以合成方式(非天然地)改变成组合物,和 /或置于对于在所述环境中发现的物质来说非天然的细胞(例如,基因组或亚细胞器)中的 位置中。可在物质的天然状态中或自其天然状态移出对所述物质实施改变以获得合成的物 质。例如,如果借助在天然存在的核酸所源于的细胞内实施人类干预使天然存在的核酸改 变,或者其自己经改变的DNA转录,则所述天然存在的核酸会变成分离的核酸。参见,例如, Compounds and Methods for SiteDirected Mutagenesis in Eukaryotic Cells,Kmiec,美 国专利第5,565,350号;In Vivo Homologous Sequence Targeting in Eukaryotic Cells, Zarling等人,PCT/US93/03868。同样,如果通过非天然存在的方式将天然存在的核酸(例 如,启动子)引入对于所述核酸来说非天然的基因组基因座中,所述天然存在的核酸会变 成分离的核酸。本文所定义的“分离的”核酸也可以称为“异源”核酸。涉及将核酸插入至细胞中时,术语“插入”或“弓丨入”是指“转染”或“转化”或“转 导”,且包括提及将核酸纳入于真核或原核细胞中,其中所述核酸可纳入于细胞基因组(例 如,染色体、质粒、质体或线粒体DNA)中,转化成自主复制子或瞬时表达(例如,转染的 mRNA)ο术语“标记”或“经标记的”是指通过例如将放射性标记的三磷酸核苷或放射性同 位素纳入于可检测或测量的核酸中来纳入可检测标记或分子。各种标记核酸的方法已为 所属领域的技术人员所了解(参见Short Protocols inMolecular Biology,第5版,John Wiley & Sons,2002),而且可以使用。核酸标记的实例包括(但不限于)以下放射性同位 素(例如,32P标记的NTP及dNTP ;35S标记的NTP及dNTP ;3H ; 14C ;125I)、荧光团及荧光标记 (例如,FITC ;罗丹明;镧系元素磷光质;青色素(Cy3,Cy5);荧光素;香豆素、SYBR Green); 及地高辛-11-dUTP。 术语“MA区段”还称为“MA序列”,是指在TAG质粒及其衍生物中位于TAG的下游 及转录终止信号的上游的核苷酸序列。自单一实验中所研究的各种启动子合成的所有mRNA 均含有相同的MA序列,互补引物可与其退火并开始合成第一条cDNA链以制备杂交探针。MA 序列的长度通常为20-30个核苷酸,但可以更长,只要MA序列不含有诸如发夹环等任何二 级结构,所述二级结构会阻碍有效的cDNA合成。MA序列由约50% GC构成,因此解链温度介 于约70°C至约75°C范围内。在所有公布的核苷酸数据库中MA序列较独特,因此仅TAG-转 录物可用作cDNA合成的模板。MA序列不含有任何在其它地方用于TAG质粒中以实施克隆 的限制位点。其不能作为(或不含有)转录启动子或转录终止信号。术语“混合”是指组合、接合、合并、联合、融合或连接至少两个不同的核苷酸序列, 使其变成一个片段。术语“多克隆位点”也称为“MCS”或“多位点接头(polylinker)”,是指含有许多
19(通常大于20个)由限制酶或其它内切核酸酶(例如归巢内切核酸酶)识别的位点的短的 DNA区段。术语“核酸”是指呈单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物,且除 非另有限制,否则其涵盖具有天然核苷酸的基本性质(即以与天然存在的核苷酸(例如,肽 核酸)类似的方式与单链核酸杂交)的已知类似物。术语“核苷酸”是指由杂环碱基、糖及一个或多个磷酸基团组成的化学化合物。在 最常见的核苷酸中,碱基是嘌呤或嘧啶的衍生物,且糖是戊糖脱氧核糖或核糖。核苷酸是核 酸的单体,三个或更多个核苷酸键合在一起可形成核酸。核苷酸是RNA、DNA及数种辅因子 CoA、FAD、DMN、NAD及NADP的结构单元。嘌呤包括腺嘌呤(A)及鸟嘌呤(G);嘧啶包括胞嘧 啶(C)、胸腺嘧啶(T)及尿嘧啶(U)0应用于细胞群体的术语“寡克隆”、“多克隆”表示一种细胞群体,其中所述群体内 的一些细胞与所述群体的其余细胞在遗传学上不一致。相反地,术语“单克隆”或“单克隆 细胞群体”表示所述群体内的所有细胞在遗传学上一致。在本公开内容上下文中,细胞群体 的“遗传一致性”的差异是由向不同基因组插入位点随机整合反转录病毒而引起。术语“可操作地连接”是指启动子与第二序列间的功能连接,其中所述启动子序列 开始并调介对应于第二序列的DNA序列的转录。通常,可操作地连接意指所连接的核酸序 列是邻接的,而且在需要连接两个蛋白编码区的情况下是邻接的且在相同读码框中。术语“光密度”是指光学元件在给定波长下每一单位距离的吸光度。通常,在600nm 波长下测量细菌培养物。术语“聚合酶链反应”或“PCR”是指阐述于美国专利第4,683,195号中的程序,所 述专利的揭示内容以引用方式并入本文中。术语“聚核苷酸”是指脱氧核糖聚核苷酸、核糖聚核苷酸或其具有天然核糖核苷酸 的基本性质的类似物,所述基本性质是指其在严格杂交条件下与和天然存在的核苷酸实质 上相同的核苷酸序列杂交和/或能够翻译成与天然存在的核苷酸相同的氨基酸。聚核苷酸 可以是天然或异源结构或调节基因的全长或子序列。除非另有说明,否则此术语包括提及 指定序列以及其互补序列。因此,按照“聚核苷酸”在本文中的预期含义,出于稳定性或其 它原因骨架经修饰的DNA或RNA是“聚核苷酸”。而且,按照本文所用的术语,包含稀有碱基 (例如肌苷)或修饰碱基(例如三苯甲基化碱基)(这里仅举两个例子)的DNA或RNA是聚 核苷酸。应了解,已对DNA及RNA实施多种修饰以达到所属领域的技术人员所习知的许多 有用目的。本文所使用的术语聚核苷酸涵盖聚核苷酸的所述以化学方式、酶促方式或代谢 方式经修饰的形式、以及具有病毒及细胞(尤其包括简单细胞及复杂细胞)的DNA及RNA 特征的化学形式。术语“多肽”、“肽”及“蛋白”在本文中可互换使用,其是指氨基酸残基的聚合物。 这些术语适用于其中一个或多个氨基酸残基是对应天然存在氨基酸的人造化学类似物的 氨基酸聚合物,也适用于天然存在的氨基酸聚合物。天然存在氨基酸的这些类似物的基本 性质是,当纳入于蛋白中时,所述蛋白特异性地对由相同但全部由天然存在氨基酸组成的 蛋白诱发的抗体具有反应性。术语“多肽”、“肽”及“蛋白”还包括修饰,包括(但不限于) 糖基化、脂质附接、硫酸盐化、谷氨酸残基的Y-羧基化、羟基化及ADP-核糖基化。应了解, 众所周知且如上文所述,多肽并非完全为线性。例如,多肽可因泛素化而具有支链,且其通常可因翻译后事件(包括天然处理事件及由人工操作引起的非天然发生事件)而为环状, 可具有或无支链。环状、具支链及具支链环状多肽可通过非翻译天然过程以及通过完全人 工合成方法来合成。术语“引物”是指一种核酸,当与DNA链杂交时其能够在适宜聚合剂存在下开始延 伸产物的合成。优选地,引物足够长以独特地与DNA链的特定区域杂交。引物还可用于RNA 以例如合成第一条cDNA链。术语“启动子”是指位于转录起点的上游、下游或远端且参与RNA聚合酶及其它蛋 白的识别及结合以开始转录的DNA区域。例如,T7、T3及Sp6是RNA聚合酶启动子序列。 在RNA合成中,启动子是划分哪种基因应该用于产生信使RNA且甚至于控制细胞产生何种 蛋白的一种手段。启动子是重要元件,其可与其它调节区(增强子、沉默子、边界元件/绝 缘子)协力起作用来指导给定基因的转录水平。术语“启动子序列候选物”是指含有推定的启动子序列的核苷酸序列。启动子序 列候选物可以由计算机预测模型、来自核苷酸序列集合(例如基因组文库)的DNA片段、特 定启动子的缺失突变体或定点突变体、组织特异性启动子、人工启动子等提供。术语“无启动子(promoterless) ”是指包含于载体、反转录病毒、腺病毒、腺病毒相 关病毒或反转录病毒原病毒中的在载体内不直接地或明显地处于启动子控制下的蛋白编 码序列,其呈RNA或DNA形式。载体、质粒、病毒或其它可含有启动子,但所述启动子不能经 定位或构造而直接地或明显地调节无启动子蛋白编码序列的表达。术语“蛋白编码序列”是指编码多肽基因的核苷酸序列,其可用以区分表达多肽基 因的细胞与不表达多肽基因的细胞。蛋白编码序列包括通常作为可选标记提及者。蛋白编 码序列的实例包括编码细胞表面抗原的序列及编码酶的序列。蛋白编码序列的代表性列示 包括胸苷激酶、β-半乳糖苷酶、色氨酸合成酶、新霉素(neomycin)磷酸转移酶、组氨醇脱 氢酶、荧光素酶、氯霉素乙酰基转移酶、二氢叶酸还原酶(DHFR);次黄嘌呤-鸟嘌呤磷酸核 糖基转移酶(HGPRT)、CD4、CD8及潮霉素(hygromycin)磷酸转移酶(HYGRO)。术语“重组体”是指通过引入异源核酸或源自经如此修饰的细胞的而被修饰的细 胞或载体。因此,例如,重组细胞所表达的基因与天然(非重组)形式细胞中发现的基因具 有不同形式,或者由于故意的人类干预而导致所表达的天然基因以另外的方式异常表达、 表达不足或根本不表达。本文所用的术语“重组体”不涵盖通过天然存在的事件(例如,自 发突变、天然转化转导/转座)、例如在没有故意的人类干预下发生的事件引起的细胞或载 体的改变。术语“重组表达盒”是指以重组方式或以合成方式产生的核酸构建体,其含有一系 列特定的允许特定核酸在宿主细胞中转录的核酸元件。可以将重组表达盒纳入于质粒、染 色体、线粒体DNA、病毒或核酸片段中。通常,表达载体的重组表达盒部分包括待转录的核 酸、启动子及转录终止信号(例如多腺苷酸化信号)连同其它序列。术语“重组宿主”是指含有克隆载体或表达载体的任一原核或真核细胞。此术语 还包括实施基因工程以在宿主细胞的染色体或基因组中含有克隆基因或目标基因的原核 或真核细胞。术语“调节序列”(也称为调节区或调节元件)是指启动子、增强子或诸如转录因 子等调节蛋白优先结合的其它DNA区段。其控制基因的表达且因此控制蛋白的表达。
21
术语“报告细胞系”是指含有报告子或分析标记的原核或真核细胞。术语“限制酶切消化”是指用以制备用于分析或其它处理的DNA的程序。其还称 为DNA片段化,其使用限制酶将DNA链选择性地裂解成较短的区段。术语“限制酶”(或限制性内切核酸酶)是指剪切双链DNA的酶。所述酶产生两种 剪切,一种通过双螺旋的每一磷酸骨架且不破坏碱基。限制酶在生物化学上分为四类,称为 I型、II型、III型及IV型。在I型及III型系统中,甲基酶及限制酶活性均通过单一的较 大的酶复合物来实施。尽管这些酶识别特定的DNA序列,但实际裂解位点与这些识别位点 间的距离可能变化,且可能相距数百个碱基。其正常功能均需要ATP。在II型系统中,限制 酶不依赖于其甲基酶,且裂解发生在识别序列内或接近识别序列的非常具体的位点处。按 照II型酶的识别位点进一步对其进行分类。大多数II型酶剪切回文DNA序列,而IIa型 酶识别非回文序列且在识别位点之外裂解。IIb型酶在识别序列之外的两个位点处剪切序 列两次。在IV型系统中,限制酶仅靶向甲基化的DNA。术语“限制位点”或“限制识别位点”是指由限制酶识别作为剪切DNA分子的位点 的特定核苷酸序列。所述位点通常(但不一定)回文(因为限制酶通常以同二聚体形式结 合),而且一种特定酶可在位于其识别位点内或附近某处的两个核苷酸之间实施剪切。术语“反转录”或“反转录聚合酶链反应”(RT-PCR)是指对核糖核酸(RNA)分子的 界定的一段进行扩增。首先将RNA链反转录成其DNA补体或互补DNA,随后利用聚合酶链反 应来扩增所得的DNA。术语“可选标记”是指引入至细胞(尤其为细菌或培养物中的细胞)中以赋予细 胞适用于人工选择的特性的基因。他们是在实验室微生物学、分子生物学及基因工程中用 以指示打算将外来DNA引入至细胞中的转染或其它程序是否成功的一类报告基因。例如, 基因功能分析通常需要形成含有呈稳定整合形式的所研究基因的细胞。在一些情况下,少 数细胞可稳定整合DNA,因此使用显性可选标记以允许分离稳定的转染子。可选标记可包 括抗生素(氨苄西林)及‘自杀’基因(例如ccdB)。阳性选择标记可以使用腺苷脱氨 酶(胸苷、次黄嘌呤、9-β-D-呋喃木糖基腺嘌呤、2’ -脱氧助间型霉素)、氨基糖苷磷酸转 移酶(新霉素、G418、庆大霉素、卡那霉素)、博来霉素(博来霉素、腐草霉素、硫酸博来霉 素(zeocin))、胞嘧啶脱氨酶(N-(膦酰基乙酰基)-L-天冬氨酸、肌苷、胞嘧啶);二氢叶酸 还原酶(氨甲喋呤、氨基喋呤);组氨醇脱氢酶(组氨醇);潮霉素-B-磷酸转移酶(潮霉 素-B) ;B票呤霉素-N-乙酰基转移酶(嘌呤霉素);胸苷激酶(次黄嘌呤、氨基喋呤、胸苷、甘 氨酸);及黄嘌呤-鸟嘌呤磷酸核糖基转移酶(黄嘌呤、次黄嘌呤、胸苷、氨基喋呤、霉酚酸、 L-谷氨酰胺)。阴性可选标记可以使用胞嘧啶脱氨酶(5-氟胞嘧啶);白喉毒素;ccdB及 HSV-TK。术语“选择性杂交”是指在严格杂交条件下核酸序列与特定核酸靶标序列的杂交, 此杂交比核酸序列与非靶标核酸序列的杂交强度高且强度差值可检测(例如,比背景至少 高2倍),实质上排除了非靶标核酸。选择性杂交序列通常彼此具有约至少80%的序列一 致性,优选90%的序列一致性,且最优选100%的序列一致性(即,互补)。术语“正义”是用于比较核酸分子与其它核酸分子的极性的一般概念。通常,如果 DNA序列与翻译成蛋白的信使RNA拷贝的序列相同,则所述DNA序列称为“正义”。相反链 上的序列与正义序列互补,且因此称为“反义”序列。
术语“TAG”是指由随机核苷酸构成的DNA序列,其中各位置具有四种脱氧核苷酸 (A、C、T及G)中的任一种的概率相等。其它碱基,诸如肌苷、尿嘧啶、5-甲基胞嘧啶、8-氮鸟 嘌呤、2,6_ 二氨基嘌呤、5-溴尿嘧啶及其它衍生物,可以其核苷酸形式纳入于序列中。TAG 序列的长度短,优选地约16bp至约200bp,更优选地约20bp至约150bp,更优选地约30bp 至约120bp,更优选地约40bp至约lOObp,更优选地约50bp至约75bp,且最优选地约60bp。 各序列优选地足够不同或独特以避免当寡核苷酸以单链形式存在时有时彼此退火。另外, 所述序列不应自我互补,以避免在扩增期间形成引物_ 二聚体。在多个TAG序列中,各TAG 序列具有大致同等量的核苷酸A、T、G及C,由此各TAG序列具有彼此大致相同的解链温度。 相同解链温度允许通过在相同温度及离子强度条件下杂交来公正地定量各含有不同TAG 序列的各种mRNA。在多个TAG序列中,各个TAG序列的核苷酸序列相对于多个序列中的各 个TAG而言是独特的。术语“转录终止信号”是指标明基因组DNA上基因或操纵子的转录终点的一段基 因序列。已知在原核生物中存在两种转录终止信号1)内在转录终止信号,这种情况下在 初生转录物内形成发夹结构,以破坏mRNA-DNA-RNA聚合酶三元复合物;及2) Rho依赖性转 录终止信号,其需要Rho因子(一种RNA解旋酶蛋白复合物)来破坏初生的mRNA-DNA-RNA 聚合酶三元复合物。在真核生物中,转录终止信号由蛋白因子识别,所述因子以共转录方式 裂解多腺苷酸化信号(polyadenlyationsignal)(即,“多腺苷酸化信号(poly-A signal)" 或“多腺苷酸尾”)处的初生RNA以阻止RNA聚合酶进一步延长转录物。随后在此位点添加 多腺苷酸尾以稳定mRNA并使其能够输出到细胞核外面。终止序列不同于终止密码子,所述 终止密码子在mRNA中出现而且是翻译的终止信号,其还可称为无义密码子。术语“翻译终止序列”是指编码翻译终止密码子的序列。在一些实施方式中,翻译 终止序列可位于一个、两个或三个读码框中。术语“转染”是指将外来DNA引入至真核细胞或原核细胞中。转染通常涉及打开 细胞中的瞬时孔以允许细胞外分子进入,所述细胞外分子通常为超螺旋质粒DNA,还可以 是siRNA以及其它。有多种转染细胞的方法。一种方法使用磷酸钙。将含有磷酸根离子 的HEPES缓冲盐水溶液与含有待转染DNA的氯化钙溶液混合。当混合所述两种溶液时,会 形成微细的磷酸钙沉淀,待转染DNA结合至其表面上。随后将沉淀悬浮液添加至待转染的 细胞中。细胞吸收沉淀及DNA。或者,可以使用MgCl2或RbCl。其它转染方法包括电穿孔、 热激、专利转染剂、树枝状聚合物(dendrimer)以及使用脂质体。脂质体是小的膜结合体, 其与细胞膜融合而将DNA释放至细胞中。对于真核细胞,通常利用基于脂质-阳离子的转 染。其它转染方法包括使用基因枪和病毒。为达到稳定转染可将另一基因共转染,所述另 一基因给予细胞一些选择优势,例如对某一毒素的抗性。如果随后将毒素(共转染基因赋 予对其的抗性)添加至细胞培养物中,则仅基因组中插入外来基因的细胞能够增殖,而其 它细胞将死亡。在施加此选择压力一段时间后,仅具有稳定转染的细胞保留下来且可进一 步实施培养。常用于稳定转染的试剂是遗传霉素(Geneticin),也称为G418,其是能够被新 霉素抗性基因的产物中和的毒素(参见Bacchetti及Graham. Transfer of the gene for thymidine kinase to thymidinekinase-deficient human cells by purified herpes simplex viral DNA. 1977. Proc. Natl. Acad. Sci. USA 74(4) :1590_94)。常规瞬时转染分析 可纳入内部对照,例如pRL-SV40 (Promega公司),且可与任一实验报告载体组合使用来共转染哺乳动物细胞。术语“转化”是指由引入、吸收及表达外来遗传物质(DNA或RNA)而造成的细胞 的遗传改变。在细菌中,转化是指由吸收及表达DNA而引起的遗传改变,且“感受态”是 指能够吸收DNA的状态。感受态细胞可通过实验室程序产生,其中利用通常非天然存在 的条件将细胞被动地弄得可透过DNA,因此经处理可接受外来DNA的细胞称为“感受态细 胞”。所述程序相当容易而且简单,且可用于对细菌实施基因工程改造。所述程序可包括 在二价阳离子(例如CaCl2)存在下冷却细胞,此为使细胞壁变得可透过质粒DNA作准备。 将细胞与DNA —起培育,并随后短暂热激(例如,在42°C下30-120秒),以使DNA进入细 胞。此方法对于环状质粒DNA非常起作用。电穿孔是使DNA进入细胞的另一种方式,且 涉及用100-200V的电场短暂电击细胞。质粒DNA经由细胞膜中由电击产生的孔进入细 胞;天然膜修复机制随后使这些孔封闭。可通过以下方法来转化酵母例如,高效转化(参 见 Gietz, R. D.及 R. A. Woods. 2002 Transformation of Yeast by the Liac/SSCarrier DNA/PEG Method. Methods in Enzymology 350:87-96);双杂交系统方案(参见 Gietz, R. D. , B. Triggs-Raine, Α. Robbins, K. C. Graham 及 R. A. Woods. 1997 Identification of proteins that interact with a protein of interest !Applications of the yeast two-hybrid system. Mol Cell Biochem 172 :67_79);及快速转化方案(参见 Gietz, R. D. R R. A. Woods. 2002 Transformation of Yeastby the Liac/SS Carrier DNA/PEG Method. Methods in Enzymology 350 :87_96)。术语“载体”是指在宿主细胞的转染中使用的核酸且其中可插入聚核苷酸。载体 通常是复制子。表达载体能够使其中所插入的核酸转录。一些常见载体包括质粒、粘粒、病 毒、噬菌体、重组表达盒及转座子。术语“载体”还可以指有助于将基因自一个位置转移至 另一位置的元件。载体可包括表达载体和克隆载体。使用下列术语来描述两种或更多种核酸或聚核苷酸之间的序列关系(a) “参考序 列”,(b) “比较窗口”,(c) “序列一致性”,(d) “序列一致性百分比”和(e) “实质上一致”。 术语“参考序列”是指用作序列比较的基准的序列。参考序列可以是指定序列的亚型或整 体;例如,作为全长cDNA或基因序列的一个区段或完整的cDNA或基因序列。术语“比较窗口,,是指聚核苷酸序列的邻接且指定区段,其中可将所述聚核苷酸序 列与参考序列进行比较,且其中比较窗口内的所述聚核苷酸序列部分与参考序列(不包含 添加或缺失)相比可以包含添加或缺失(即,空位)以对两个序列进行最佳比对。通常,比 较窗口的长度为至少20个邻接核苷酸,并且任选地可以为30个、40个、50个、100个邻接核 苷酸或更长。所属领域的技术人员应了解,为避免由于在聚核苷酸序列中包含空位而引起 的与参考序列的高度相似性,通常引入空位罚分并将其从匹配数目中减去。所有TAG应与在同一分析中使用的其它TAG没有同源性。视制备探针的方法而 定,TAG与已知核酸序列的同源性可以接受。例如,如果探针是通过用例如多腺苷酸聚合酶 直接标记 mRNA 来制备(参见,例如,Aviv 及 Leder,Proc Natl Acad Sci U S A. 1972 年 6月;69 (6) 1408-12),则含有TAG的mRNA、内源mRNA及可能地tRNA、及rRNA也可以进行 标记。由所述后面的RNA实施杂交可能干扰探针的检测。所述TAG应与转录成RNA(包括 mRNA、tRNA、rRNA等)的任一已知序列不具有同源性。如果探针是通过标记第一条cDNA链 来制备,则有两种可能性1)如果寡(dT)用作引物,则对自mRNA合成的所有第一条cDNA
24链进行标记,包括含有TAG的mRNA及内源mRNA。所述后面的cDNA可能干扰探针的检测, 因此TAG应与转录成RNA的任一已知序列不具有同源性;及2)如果寡(dT) +锚定物用作引 物“B”(其中所述锚定物是对应于mRNA的3’端的一段较短的核苷酸序列,随后紧接多腺苷 酸),则仅对自以与TAG构建体所用转录终止信号相同或相似的转录终止信号结束的mRNA 合成的cDNA进行标记。因此,如果由寡(dT)-锚定引物识别一种特定的内源mRNA,所述特 定的mRNA会干扰探针的检测,所以TAG应与所述特定的mRNA不具有同源性。如果探针是 通过PCR来制备,则除上文所述的关于第一条cDNA链的合成的同源性考虑外,还有两种考 虑。第一,使用对应于位于TAG的5’端的为所有TAG-mRNA所共有的区域的引物㈧对第 一条cDNA链实施线性扩增。当载体(质粒或病毒DNA)(探针可自其制备)被移除且用于 第一条cDNA链合成的引物B也被移除时,此情况可能出现。因此,如果第一条cDNA链是使 用寡(dT)作为引物来合成,则TAG不能与转录成mRNA且与引物A具有序列一致性的任一 已知序列具有同源性,而且如果第一条cDNA链是使用寡(dT)-锚定物作为引物来合成,则 TAG不能与转录成mRNA且与3’端(与TAG-mRNA —样)及引物A具有序列一致性的任一已 知序列具有同源性。第二,使用引物(A)及基于寡(dT)的引物对第一条cDNA链实施指数 扩增。在这种情况下,反义链可以用作探针,而且使用正义链寡核苷酸来印刷分析膜,由此 所述载体不必如上所述被移除。因此,有时,我们可以使用含有在数据库其它地方发现的序 列的TAG。不管使用何种方法来合成探针,特定TAG应与同时用于同一分析中的任一其它 TAG及在探针合成期间将被标记的任一 DNA或RNA分子不具有序列同源性。用于比较的序列比对方法已为所属领域的技术人员所熟知。用于比较的最佳序 列比对可通过以下方法来实施局部同源性算法,Smith及Waterman,Adv. App 1. Math. 2 482(1981);同源性比对算法,Needleman 及 Wunsch,J. Mol. Biol. 48 443(1970);检索相 似性方法,Pearson 及 Lipman,Proc. Natl. Acad. Sci. 85 2444(1988);这些算法的计算 机化手段,包括(但不限于)PC/基因程序中的CLUSTAL,Intelligenetics, Mountain View, Calif. ;Wisconsin 基因软件包中的 GAP、BESTFIT、BLAST、FASTA 及 TFASTA, GeneticsComputer Group (GCG) ,575 Science Dr. , Madison, Wis. , USA ;CLUSTAL 禾呈序由 Higgins 及 Sharp,Gene 73 :237_244 (1988) ;Higgins 及 Sharp,CABI0S5 151-153 (1989); Corpet φ 人,Nucleic Acids Research 16 10881-90(1988) ;Huang 等人,Computer Applications in the Biosciences 8:155-65(1992);及 Pearson 等人,Methods in Molecular Biology 24 :307_331 (1994)详细描述。可用于数据库相似性检索的BLAST家 族程序包括BLASTN,对核苷酸查询序列与核苷酸数据库序列的相似性进行检索;BLASTX, 对核苷酸查询序列与蛋白数据库序列的相似性进行检索;BLASTP,对蛋白查询序列与蛋 白数据库序列的相似性进行检索;TBLASTN,对蛋白查询序列与核苷酸数据库序列的相似 性进行检索;及TBLASTX,对核苷酸查询序列与核苷酸数据库序列的相似性进行检索。参 见,Current Protocols in Molecular Biology,第 19 章,Ausubel 等人编辑,Greene Publishing and Wiley-Interscience,纽约(1995)。除非另有说明,否则本文所提供的序列一致性/相似性数值是指使用BLAST 2. O程序套件使用缺省参数所获得的数值。Altschul等人,NucleicAcids Res. 25 3389-3402(1997)。进行BLAST分析的软件可通过例如国家生物技术信息中心(http:// www.hcbi.nlm.nih.gov/)公开获得。所述算法首先涉及通过识别查询序列中的代码长度
25缩写W来识别高分值序列对(HSP),当代码与一个数据库序列中具有相同长度的代码进 行比对时,它将与某一正阈值分值T相匹配或满足其条件。T指的是相邻代码分值阈值 (Altschul等人,见上文)。这些初始相邻重复代码将作为引子,以启动发现含有它们的更 长HSP的检索。随后将重复代码沿每一序列的两个方向延伸,尽量能够使累积比对分值增 加。对于核苷酸序列,使用参数M(—对匹配残基奖励分值;始终大于0)及N(错配残基罚 分;始终小于0)来计算累积分值。对于氨基酸序列,使用评分矩阵来计算累积分值。在以 下情况下停止各方向上的重复代码延伸累积比对分值自其最大达成值降低数量X ;由于 一个或多个负分值残基比对积累而导致累积分值变成零或小于零;或任一序列到达端点。 BLAST算法的参数W、T及X决定比对的灵敏度及速度。BLASTN程序(用于核苷酸序列)使 用的缺省值为代码长度(W)为11,期望值(E)为10,截止值为100,M = 5,N = -4,以及两 条链的一个比较值。对于氨基酸序列,BLASTP程序使用的缺省值为代码长度(W)为3,期 望值(E)为 10,及 BL0SUM62 评分矩阵(参见 Henikoff & Henikoff (1989) Proc. Natl. Acad. Sci.USA 89 10915)。 除计算序列一致性百分比外,BLAST算法也对两个序列之间的相似性进行统计学 分析(参见,例如,Karlin 及 Altschul,Proc. Natl. Acad. Sci. USA90 :5873_5787 (1993))。 BLAST算法提供的一种相似性度量标准是最小和概率(P (N)),其表示两个核苷酸或氨基酸 序列之间偶然发生匹配的概率。BLAST检索假定蛋白可作为随机序列来建模。然而,许多 实际的蛋白包含非随机序列区域,其可能是均聚体段、短周期重复或富集一种或多种氨基 酸的区域。所述低复杂度区域可在不相关蛋白间进行比对,即使其它蛋白区域完全不同。 可使用多种低复杂度过滤程序来减少所述低复杂度比对。例如,SEG(Wooten及Federhen, Comput. Chem. , 17 149-163(1993))及 XNU (Claverie 及 States, Comput. Chem. ,17 191-201(1993))低复杂度过滤程序可单独或组合使用。当涉及两个核酸或多肽序列时,本 文所用的“序列一致性”或“一致性”是指在指定的比较窗口内进行最大对应性比对时这两 个序列中相同的残基。应认识到,当序列一致性百分比用于蛋白时,不一致的残基位置经常 由于保守氨基酸取代而有所不同,其中氨基酸残基由具有相似化学性质(例如电荷或疏水 性)的其它氨基酸残基所取代,因此不会改变分子的功能特性。当序列在保守取代上存在 差别时,可向上调节序列一致性百分比以校正取代的保守性质。因所述保守取代而不同的 序列被称为具有“序列相似性”或“相似性”。进行这种调整的手段已为所属领域的技术人 员所熟知。通常,这涉及将保守取代作为部分而非完全错配来进行评分,由此使序列一致性 百分比增加。这样,例如,当相同氨基酸的分值为1而非保守取代的分值为O时,保守取代 的分值在O和1之间。例如,根据Meyers和Miller的算法(Computer Applic. Biol. Sci., 4 11-17 (1988))计算保守取代的分值,例如,在程序 PC/GENE (Intelligenetics,Mountain View, Calif.,USA)中完成计算。 本文所用的“序列一致性百分比,,意指通过在比较窗口内比较两个最佳比对序列 而确定的数值,其中比较窗口内的聚核苷酸序列部分与参考序列(其不包含添加和缺失) 相比可以包含添加和缺失(即,空位)以对两个序列进行最佳比对。通过下列步骤来计算 百分比测定两个序列中相同核酸碱基或氨基酸残基出现的位置数量以得到匹配位置的数 量,将匹配位置的数量除以比较窗口中位置的总数,并且将所得结果乘以100,便可得到序 列一致性百分比。术语聚核苷酸序列的“实质上一致”意指使用利用标准参数描述的比对程序之一进行比较,聚核苷酸包含的序列与参考序列相比具有至少70 %的序列一致性,优 选为至少80%,更优选为至少90%且最优选为至少95%。所属领域的技术人员应认识到, 通过计及密码简并、氨基酸相似性、读码框定位及其类似问题,这些数值可以适当地调整以 确定由两个核苷酸序列编码的对应蛋白的一致性。就此而言,氨基酸序列的实质上一致通 常表示序列一致性至少为60%,或优选为至少70%、80%、90%,且最优选为至少95%。核 苷酸序列实质上一致的另一标志是两种分子在严格条件下互相杂交。然而,如果在严格条 件下互不杂交的核酸编码的多肽实质上一致,则这些核酸仍然实质上一致。当(例如)核 酸的拷贝是利用遗传密码所允许的最大密码简并产生时,可能出现此种情况。两个核酸序 列实质上一致的一个标志是,由第一个核酸所编码的多肽可与由第二个核酸所编码的多肽 发生免疫学交叉反应。当涉及肽时,术语“实质上一致”表示肽包含在指定的比较窗口内 与参考序列具有至少70%的序列一致性、优选为80%、更优选为85%、最优选为与参考序 列具有至少90%或95%的序列一致性的序列。任选地,使用Needleman及Wunsch,J. Mol. Biol. 48 =443(1970)的同源比对算法来进行最佳比对。两个肽序列实质上一致的一个标志 是,一个肽可与所产生的对抗第二个肽的抗体发生免疫学反应。因此,例如,当两个肽的差 别仅在于保守取代时,则一个肽与第二个肽实质上一致。除了不一致的残基位置可能因保 守氨基酸改变而有所不同外,“实质上相似”的肽均如上所述具有相同序列。提取RNA的方法已为所属领域的技术人员所熟知,且阐述于(例如)J. Sambrook 等 人,"Molecular Cloning :A Laboratory Manual,,(Cold SpringHarbor Laboratory Press, Cold Spring Harbor, N. Y. , 1989),第 1 卷,第 7 章,"Extraction, Purification, and Analysis of Messenger RNA from EukaryoticCells”,此文献以引用方式并入本文 中。也熟知其它分离及提取方法,例如F. Ausubel等人,“Current Protocols in Molecular Biology, John Wiley & Sons。通常,在诸如氯化胍或硫氰酸胍等离液剂存在下实施分离, 但是或者可以使用其他洗涤剂及提取剂。通常,通过在具有结合mRNA分子的多腺苷酸化 3'-部分的能力的寡(dT)-纤维素或其它色谱介质上实施色谱自总提取RNA分离mRNA。 或者,但不优选,可使用总RNA。然而,通常优选分离多腺苷酸化RNA。所述方法利用几个基本步骤来达成其目标。第一,设计DNA TAG文库。DNA TAG序 列由随机核苷酸构成。在长度为约60bp的一个实施方式中,各DNA TAG序列在多个TAG序 列中是独特的,即,特定TAG与同时用于同一分析中的任何其它TAG不具有序列同源性,而 且不管使用何种方法来合成探针,特定TAG与在探针合成期间将被标记的任何DNA或RNA 分子也不具有序列同源性。所述TAG序列具有相似的物理性质,因此可使用多个TAG序列在 相似条件下进行杂交。第二,构建PTAG-基本质粒。第三,将TAG序列插入至pTAG-基本质 粒中。第四,制备启动子阵列膜。第五,将启动子序列候选物插入至PTAG质粒中。第六,将 含有启动子序列候选物插入片段的PTAG质粒转染至宿主细胞中,并提取RNA。随后对RNA 或源自所提取的RNA的所得cDNA进行标记,与启动子阵列膜杂交,并实施分析。因此,本公 开内容揭示用于启动子检测及分析的基于阵列的方法。所述方法提供转录产物,所述转录 产物在其合成时被加以标签,以使一种特定转录物仅由一种类型的TAG标记,且一种TAG仅 标记一种类型的转录物。所有启动子序列候选物均在一个反应小瓶中同时进行分析。在常 规阵列上分析转录输出。附图简单说明


图1.基于阵列的启动子检测及分析的流程2.手动(左侧)或使用自动装置(右侧)使用反向链TAG寡核苷酸集合来点 渍 BrightStar-Plus 膜。图3A及3B.在单一 HEK 293细胞群体中对42种启动子的活性进行比较分析。将 42种启动子-TAG质粒与8种无启动子TAG-报告质粒以等摩尔量混合,并转染至相同的细 胞群体中。转染后14小时提取总RNA。使用线性扩增方法来标记RNA,并将生物素标记的 探针杂交于TAG-点渍膜上(图3A)。通过化学发光展现杂交,并通过光密度测定法进行定 量(图3B)。通过手动以对角线成对形式点渍各寡核苷酸来制备宏阵列膜。图4A及4B.在单一细胞群体中比较92种启动子的转录活性。将92种启动子-TAG 质粒与8种无启动子TAG-报告质粒以等摩尔量混合,并转染至相同的细胞群体中。转染后 14小时提取总RNA。使用线性扩增方法来标记RNA,并将生物素标记的探针杂交于TAG-点 渍膜上(图4A)。通过化学发光展现杂交,并通过光密度测定法进行定量(普通棒(plain bars))(图4B)。自先前已公布的工作获得各质粒构建体获得的相对荧光素酶活性,并在底 部(空心棒)显示(图4B)。图底部的数字是表1中所述启动子的标号。使用各种OM启动子 (#59-73)、防卫素(defensin)启动子(#74-85)及Coleman (Coleman,S.等人,Experimental analysis of the annotation ofpromoters in the public database. Hum. Mol. Genet., 2002. 11(16) 1817-1821)所研究的其它启动子获得的荧光素酶数据是在不同实验条 件下产生,彼此之间不应进行比较。通过使用University of Idaho Environmental BiotechnologyInstitute (Moscow, ID)白勺itP车歹U丰/l丰勾白勺 Biorobotics MicroGrid WM 自云力 点渍装置(Genomic Solutions,Ann Arbor,MI) 一式四份点渍各寡核苷酸来制备宏阵列膜。图5A及5B.使用一系列35种启动子-TAG质粒来验证所述启动子检测方法。通 过使放射性TAG-cDNA探针与点渍有互补TAG链的膜杂交来获得放射自显影图(图5A)。由 放射自显影图左侧的数字及条形图(图5B)底部的数字来标识斑点。所述条形图概述各个 斑点相对于使用CMV启动子所获得的信号(=100)的强度。图6。构建pTAG报告质粒的流程图。图7。pTAG基本载体的质粒图。表1。实施例中所使用的100种启动子序列的名单。描述各种启动子的符号、长 度、及Refseq或GenBank登录号。也指明与其相关的TAG识别号。实施方式本公开内容提供用于检测及分析DNA启动子序列的方法。图1提供概括的流程 图。本公开内容提供含有可能的DNA启动子序列候选物的载体文库的构建,所述DNA启动 子序列候选物可能存在于(例如)核苷酸序列集合(例如基因组文库)中、由计算机预测 的启动子区域中、或所研究启动子的缺失突变体中等。产生的各克隆可能驱动由非常确定 的约60-bp长的DNATAG(由随机核苷酸构成)构成的独特报告基因的转录。通过集中等 摩尔量的载体并将其转染至目标细胞系中来分析各个构建体的转录特性。提取RNA、合成 cDNA并直接或间接进行标记,并通过与排列于膜、玻璃或珠粒支撑体上的DNA TAG杂交予 以定量(概括的示意图参见图1)。适宜珠粒组合物可包括用于肽、核酸和有机部分合成的 组合物,包括但不限于塑料、陶瓷、玻璃、聚苯乙烯、甲基苯乙烯、丙烯酸系聚合物、顺磁性材 料、氧化钍溶胶、碳石墨、二氧化钛、胶乳或交联葡聚糖(例如琼脂糖)、纤维素、尼龙、交联微胶粒及特富龙,所有均可使用(参见微球体检测导则(Microsphere Detection Guide), Bangs Laboratories, Fishers Ind.)。现将更详细地描述本公开内容的设计、操作及应用。1.设计将由推定的DNA启动子序列转录的DNA TAG的文库。所述TAG DNA序列是由随机核苷酸构成的DNA序列,其中各位置具有四种脱氧核 苷酸(A、C、T及G)中的任一种的概率相等。诸如肌苷、尿嘧啶、5-甲基胞嘧啶、8-氮鸟嘌 呤、2,6_ 二氨基嘌呤、5-溴尿嘧啶及其它衍生物等其它碱基可以其核苷酸形式纳入于寡核 苷酸中。TAG序列的长度较短,优选地为约16bp至约200bp,尽管可使用较短或较长的长度, 但通常为约60bp。在多个TAG序列中,各TAG序列具有大致同等量的核苷酸A、T、G及C,由 此各TAG序列具有与其他TAG序列大致相同的解链温度。相同解链温度允许通过在相同温 度及离子强度条件下杂交来公正地定量各种mRNA。在多个TAG序列中,各个TAG序列的核 苷酸序列在多个TAG中是独特的。不管使用何种方法来合成探针,各TAG与同时用于同一 分析中的任一其它TAG及在探针合成期间将被标记的任一 DNA或RNA分子不具有序列同源 性。具有60bp长的随机核苷酸的TAG序列能够产生大量独特的非常不可能在自然界中发 现的TAG。另外,较长的TAG(例如,60bp)允许使用足够高以阻止与部分同源序列的非特异 性杂交的杂交温度(例如,70°C )。在多个TAG中将GC含量及因此解链温度标准化以确保 所有TAG探针使用相同的杂交条件。为使交叉杂交最小化且获得最高特异性,选择的所有 寡核苷酸应具有不长于六个(6)碱基的最小长度的序列一致性。不允许存在具有多于四个 ⑷相同核苷酸序列段的低复杂度序列,由此避免在序列相似性检索中造成困难。产生TAG 序列后,确认序列自身中不存在同源性。在一些实施方式中,可针对寄存于公开数据库(例 如GenBank、EMBL, DDBJ及PDB)中的序列使用NCBI BLASTN来检查TAG序列,以助于确定 是否存在无意结合。通常通过标准化学技术(包括自动化合成)来合成呈单链形式的寡核 苷酸。已描述许多用于合成含有随机碱基的寡核苷酸的方法。例如,可通过在自动化程序 期间在线混合或使用预混合的亚磷酰胺前体来获得随机位置(参见,Ausbel等人,Current Protocols in Molecular Biology,GreenPublishing,N. Y.,1995)。随后将寡核苷酸去保 护,并且可通过以下方法进行纯化用乙醇沉淀、使用尺寸排阻或反相管柱的色谱、变性聚 丙烯酰胺凝胶电泳、高压液相色谱(HPLC)或其它适宜方法。2.构建TAG-质粒自pTAG-基本获得TAG质粒(图7)。此质粒纳入一对SfiI位点,其产生两种不同 的3个核苷酸长的适宜用于定向插入TAG寡核苷酸的不对称粘性末端。所述质粒还纳入编 码荧火虫荧光素酶(Iuc+)的经修饰cDNA。所述1650bp cDNA是使用限制酶NcoI及XbaI 自市售的pGL3切下。野生型编码区已经修饰,以除去基因调节蛋白识别的共有序列,由此 帮助确保此报告基因不受假的宿主转录信号影响。所述质粒还纳入97bp长的α-珠蛋白 3’ UTR0 α -珠蛋白mRNA的高水平稳定性(半衰期为24小时至60小时)归因于其3’ UTR 中富含C的顺式元件,蛋白复合物与其结合而使mRNA稳定。此蛋白复合物自小鼠至人类 高度保守,而且在广谱组织及细胞系中发现。此序列足以提高荧光素酶mRNA的稳定性,半 衰期为7小时。所述质粒还纳入SV40多腺苷酸化信号以有效地多腺苷酸化荧光素酶转录 物,由此使稳态mRNA水平提高直至五倍。所述质粒还纳入来自pUC19的高拷贝数的复制起 点,但是或者可含有低拷贝数的复制起点,例如PBR322 ColEl ori/rop (每个染色体15-20
29个拷贝)、PACYC177 pl5A ori (每个染色体10-12个拷贝)或CopyControl系统(每个染 色体1、10-50个拷贝)。另外,所述质粒还纳入用于选择大肠杆菌中的pTAG衍生物的氨苄 西林及卡那霉素抗性基因、用于通过重组使用Gateway系统插入启动子序列的λ attPl及 attP2位点、及用于通过DNA连接插入启动子序列候选物的MCS。MCS存在于两种结构不同 但功能等效的侧接ccdB基因的拷贝中,此构造允许使用ccdB基因作为通过重组或通过连 接纳入启动子序列的质粒的选择标记。所述CcdB蛋白靶向DNA促旋酶并抑制其催化反应。 吸收含有ccdB基因的未反应载体的细胞将不会生长。所述质粒还纳入短的合成的多腺苷 酸化信号,所述信号基于兔珠蛋白基因的高效多腺苷酸化信号。将其置于MCS的上游 可终止可能开始于载体骨架内的假转录。3.将DNA TAG插入至pTAG-基本载体中通常,TAG是通过退火互补的63bp寡核苷酸[(+) IjI=(N)60 =ATA ;(-)链= (N)60: GTG]来获得,并随后将其连接至SfiI消化的pTAG-基本,尽管可使用不同长度的寡核苷酸, 但是优选地约16bp至约200bp,更优选地约20bp至约150bp,更优选地约30bp至约120bp, 更优选地约40bp至约IOObp,更优选地约50bp至约75bp,且最优选地约60bp。将连接反应 物电穿孔至宿主菌株(例如大肠杆菌DB3. 1)中,所述菌株含有使其能够抵抗ccdB的促旋 酶突变(gyrA462)。由于由两种SfiI位点产生的粘性末端不相容,因此产生非常低背景的 自成圆形的PTAG-基本载体或具有多个串联TAG的载体。通过DNA测序来确认在各种质粒 中存在TAG。TAG的高通量产生遵循类似的方法。在两块96-孔板(分别合成(+)链及(-) 链)上合成63bp寡核苷酸。在96-孔板中使(+)链与(-)链退火,并与经SfiI消化、凝胶 纯化的PTAG基本连接。使用96-孔电穿孔板将连接混合物电穿孔至电感受态的大肠杆菌 DB3. 1宿主细胞中。将细菌菌落接种至96-深孔板中,并将培养物在37°C下使用微量滴定 板培育箱振荡器在250rpm下培育18-24小时。手动或经由自动操作(例如使用BioRobot 3000(Qiagen, Valencia, CA))对质粒DNA实施纯化,并经由DNA测序(96-孔格式)确认 TAG的存在。4.制备启动子阵列膜使用尼龙膜来制备寡核苷酸阵列。在96-孔板格式中合成㈠链TAG寡核苷酸, 并以ΙΟΟμ g/ml的浓度再悬浮于缓冲液(例如TE,pH 7. 5)中。剪切(2cm χ 4cm)尼龙膜 (例如 Nytran SuPerCharge (Whatman PLC, Middlesex, UK))以放入 5. Oml 的玻璃杂交管。 手动一式两份将寡核苷酸点渍于膜(0.2μ1/斑点)上,或者使用阵列自动点渍装置,例如 Biorobotics MicroGrid(Genomic Solutions, Ann Arbor, MI) 胃TOSIP车歹[J。
后,使用Stratalinker 1800在120mJ/sec下将膜紫外交联两次,随后在70°C下烘烤1-2 小时。将所印刷的膜密封于石蜡膜中,并在-20°C下储存。通过使10%的膜与生物素标记 的(+)链寡核苷酸TAG杂交来验证膜的质量。使用末端转移酶及生物素-16-ddUTP来标记 TAG寡核苷酸的3’端。将所有TAG以等摩尔量混合在一起。遵循制造商建议将TAG混合 物(IOOpmol)在1. Onmol生物素-16-ddUTP及50U末端转移酶存在下进行培育。在37°C 下培育15分钟后,用LiCl沉淀末端标记的TAG探针,离心并再悬浮于ddH20中。通过将标 记反应物的系列稀释物及标准物点渍于尼龙膜上来检测标记效率。遵循制造商建议使用例 如偶联碱性磷酸酶的抗生蛋白链菌素通过化学发光来实施检测。通过光密度测定法实施定 量。验证生物素标记的探针的质量后,通过使用标准程序使所述探针杂交于膜上,通过化学
30发光进行检测并通过光密度测定法测量各斑点的强度来评价阵列的质量。当观察到强度及 斑点大小的变化小于5%时,所述膜可以接受。5.构建启动子-TAG质粒使用两种方法将启动子序列候选物插入至TAG质粒中。第一,使用内切核酸酶(例 如限制酶)自现有质粒提取启动子序列候选物,并插入至PTAG质粒中介于位于多克隆位点 中的位点间。通过DNA连接使用标准方案(参见Crowe等人,Improved cloning efficiency of polymerase chain reaction (PCR) products after proteinase K digestion. Nucleic Acids Res. 1991 年 1 月 11 日;19(1) 184 ;Ausubel, F. M.等人,Short Protocols in Molecular Biology)来组装启动子序列及pTAG质粒。或者,使用携带attBl及attB2延 伸的引物及使用哺乳动物基因组DNA或其它质粒作为模板通过PCR来扩增启动子序列。使 用Gateway 重组系统将pcr产物插入至ptag质粒中。启动子序列候选物可以由计算机 预测模型、来自核苷酸序列集合(例如基因组文库)的DNA片段、特定启动子的缺失突变 体或定点突变体、组织特异性启动子、人工启动子等提供。将含有具有启动子插入片段的 PTAG质粒的克隆在LB培养基中于50 μ g/ml氨苄西林或25 μ g/ml卡那霉素存在下进行培 育。在细胞生长期间的多个时间点,取各培养物的分液,通过光谱光度测量在600nm下测量 细胞密度,并集中等体积的培养物。使用碱性裂解方法提取质粒DNA,并使用阴离子交换树 脂进行纯化。为确认所有质粒以等摩尔浓度存在于混合物中,实施以下操作。通过限制酶 切消化使DNA混合物中的所有质粒线性化,并分离在琼脂糖凝胶(0.7% )上。用溴化乙锭 将大小介于5-15kb范围内的所得DNA片段染色,并通过光密度测定法使用凝胶成像系统 (geldocumentation system)进行定量。通过定量质粒限制酶切消化的系列稀释物来确认 分析的线性。6.转染及RNA提取将含有等摩尔量的启动子质粒的经纯化质粒DNA混合物转染至HL60、U937及293 细胞系中。每次转染时,洗涤IxlO7个存活的U937细胞,并再悬浮于0.4ml RPMI培养基 中。添加质粒DNA(20 μ g),并将细胞/DNA悬浮液通过倒置而轻轻混合。在25°C下培育5 分钟后,使用BTX ECM-600电穿孔仪在以下设置下对细胞进行电穿孔500V电容及电阻, 950yF电容,186欧姆电阻,200V充电电压。电击(electrochoc)后,将细胞转移至IOcm直 径的组织培养皿中,所述培养皿含有IOml补充有10% FBS的RPMI培养基。在37°C下培育 2-5小时后,通过在IOkrpm下离心30秒来收获细胞。通过添加300 μ 1 Trizol试剂来裂解 细胞沉淀,并按照制造商方案(Invitrogen,Carlsbad, CA)提取总RNA(也可参见Current Protocols in Molecular Biology, John Wiley & Sons)。使用异丙醇使 RNA 沉淀,再悬浮 于不含RNA酶的TE (pH 7. 5)中,并通过测量260nm及280nm下的吸光度(比率约等于2)来 定量。通过琼脂糖凝胶电泳及溴化乙锭染色来确认RNA的完整性。28S及18S rRNA以离散 的个别条带表示,其具有2 1的强度比。具有可见降解程度的RNA样品不再进行进一步 处理。平行地,将等摩尔的无启动子的TAG质粒混合物转染,并使用所述阵列分析mRNA的 表达。此对照检测在TAG中可能存在的隐藏的启动子活性。丢弃产生高于背景的信号的无 启动子TAG质粒。7.标记、杂交及检测自总RNA合成放射性cDNA探针。使用Trizol(Invitrogen)纯化总RNA,并通过0D260读数来测定RNA的浓度。将1_5微克总RNA与MA5-寡 (5‘-TAGTCACTTCGATCGCTGAGG-3‘) ([SEQ ID NO. 1])及核苷酸 dATP、dTTP、dGTG及 32P_dCTP 混合。将反应物在80°C下培育3分钟并随后冷却至42°C。随后添加IOX反转录缓冲液 (NEB)、RNA酶抑制剂及M-MuLV反转录酶(NEB)。混合反应物并在42°C下培育60分钟,随 后在90°C下变性10分钟。使用Ultrahyb-oligo杂交缓冲液(Ambion公司)使放射性探针与膜在60°C下杂 交过夜。在60°C下将膜用2X SSC/1% SDS洗涤两次并用1XSSC/1% SDS洗涤两次后,使 用(例如)Kodak Biomax Light Film(CarestreamHealth 公司,New Haven, CT)通过放射 自显影法检测结合的探针。使用计算机软件(例如,Kodak ID图像分析软件(Carestream Health公司,New Haven, CT))来定量各斑点的密度。在一替代实施方式中,自总RNA合成经生物素标记的cDNA探针。使用SuperArray Bioscience公司研发的AmpoLabeling-LPR方法来合成探针。此方法通过扩增cDNA来提高 cDNA阵列的灵敏度,所述cDNA通过反转录通过多达30轮线性聚合酶复制(LPR)而获得。 将来自荧光素酶mRNA的5’端的长300个核苷酸的区域(涵盖60个核苷酸的TAG)在生物 素标记的dUTP存在下反转录并扩增。使总RNA与和MA4区段互补的引物退火,在热循环仪 中在70°C下3分钟,冷却至37°C,并在37°C下培育10分钟。使用MMLV反转录酶在RNasin 核糖核酸酶抑制剂存在下将退火产物反转录。在灭活反转录酶并在85°C下实施RNA水解 后,通过 LPR 使用位于 TAG 上游的引物 5,-GGCTCGGCCTCTGAGCTAAT-3,([SEQ ID NO. 2])在 生物素-16-dUTP及热稳定性DNA依赖性DNA聚合酶存在下使用以下程序来扩增cDNA 在 85°C下5分钟;随后在85°C下1分钟、在50°C下1分钟、在72°C下1分钟的30个循环;随 后在72°C下5分钟。随后通过以下程序来检测探针的生物素纳入情况制备探针合成反应 的系列稀释物,将1 μ 1分液点渍于HyBond尼龙膜上,并使用ECL化学发光检测试剂盒检测 探针。在1000倍稀释或更高倍数稀释时可检测到的探针用于杂交。使用Ultrahyb-oligo杂交缓冲液(Ambion公司)在60°C下使生物素化探针与膜 杂交过夜。在60°C下将膜用2xSSC,SDS洗涤两次并用lxSSC,SDS洗涤两次后,使 用抗生蛋白链菌素-碱性磷酸酶偶联物并遵循制造商方案(CDP-Star Universal检测试剂 盒,Sigma)通过化学发光来检测结合的探针。使用Kodak图像工作站440获取1小时的图 像(图3A、图4A及图5A)。使用Kodak ID图像分析软件来定量各斑点的密度。图3A及3B 及图4A及4B中提供的数据表明a)没有启动子序列(表1中的#10、19、26、28、30、35、39 及47)的所有“空白”报告子-TAG质粒均得到非常低强度的信号,此结果表明质粒骨架无内 在启动子活性;b)对于一系列防卫素启动子(#74-85),表达最高的mRNA水平的克隆(#79) 同样也表达最高的荧光素酶水平。图5A及5B中提供的数据表明a)与预期一样,病毒CMV 启动子似乎最强,此结果详细记载于科学文献中(美国专利第5,168,062号及第5,385,839 号;Cayer 等人,J Immunol Methods. 2007 年 4 月 30 日;322 (1-2) 118-27 ;Sakurai 等人, Gene Ther. 2005 年 10 月;12(19) 1424-33 ;Fabre 等人.J Gene Med. 2006 年 5 月;8 (5) 636-45。);b)GAPDH(甘油醛-3-磷酸脱氢酶)启动子能够驱动非常高的表达水平,此与 其它研究人员的观察一致(Hirano T 等人,Biosci Biotechnol Biochem. 1999 ;63 (7) 1223-7 ;Punt PJ 等人,Gene. 1990 ;93(1) 101-9 ;Nagashima T 等人,Biosci Biotechnol Biochem. 1994 ;58 (7) 1292-6) ;c)铁蛋白轻链启动子比铁蛋白重链启动子强约40%,此结
32果支持Cairo等人在大鼠肝脏中所得到的发现(Biochem J. 1991 ;275(第3部分)813_6); d)启动子0M3(TAG61)及Def6 (TAG77)在其各自组(0M及防卫素启动子)中产生最强的 杂交信号,此结果与先前测定的荧光素酶活性相关联(Ma等人,Nucleic Acids Res. 1999 ; 27(23) :4649-57 ;Ma 等人,J Biol Chem. 1998 年 4 月 10 日;273 (15) :8727_40.)。总的来 说,这些数据验证了本公开内容与其它方法的可比性。提供下列实例以进行举例说明而并非加以限制。
实施例实施例1。构建lOOpTAG-报告质粒构建100种特征在于以下的pTAG-质粒多克隆位点(MCS)、attP序列、ccdB基 因、T7启动子、独特的60bp长的报告TAG、特定MA4区段、3-框架翻译终止密码子、血红 蛋白RNA稳定化片段及多腺苷酸化信号。在6个步骤中实施构建(图6)。第一,在质粒 pGL4 (Promega,Madison, WI)的Sfil位点间插入部分MCS。删除来自原来pGL4质粒的所有 克隆位点,并用EcoRI、KpnI、SacI、NheI、XhoI、BgIII位点、及随后两组由CG 二核苷酸隔开 的Sfil/Bgll位点代替。所述两组SfiI位点允许定向插入TAG序列。介于SfiI位点间的 二核苷酸CG产生独特的限制位点(Smal/Xmal),显示可用于促进使用SfiI的质粒消化,此 通过插入约170bp长的间隔区片段来将两个SfiI位点分开,或者通过相继用SmaI及随后 SfiI消化质粒。在第二步骤中,在pGL4-12的XhoI与BglII位点间插入第二部分MCS。所得质粒 (pGL-1256)在现有的 MCS 后含有 Bglll、Apal、NruI, Kpnl、XhoISacI、Bglll、NheI, EcoRV 及MluI位点。因此,pGL-1256在ApaI及NruI位点周围含有两种结构不同但功能等效的 MCS,此特征可用于在TAG-质粒中克隆启动子序列候选物。在第三步骤中,将编码荧光素酶报告子的序列(NcoI-XbaI片段)用80-mer寡核 苷酸代替,所述寡核苷酸含有特定的25bp长的序列(MA4)、三框架翻译终止密码子及源自 人类α珠蛋白基因的RNA稳定化序列。ΜΑ4有助于自mRNA合成TAG特异性探针。在第四步骤中,使用EcoRV及MluI消化所得的质粒1256MA4,此允许插入含有噬菌 体T7 RNA聚合酶启动子序列的寡核苷酸。T7启动子的存在使得能够通过体外转录来合成 生物素化的RNA探针,此方法使分析的灵敏度提高至少一个数量级。在第五步骤中,通过PCR使用质粒pD0NR-201作为模板(Invitrogen公司, Carlsbad, CA)使用以下引物来扩增Gateway 序列attP-ccdB-氯霉素抗性基因正义-t cgggccccaaataatgattttattttgactgatag[SEQ ID NO. 3]-atgggcccaaataatgatttta ttttgactgatagtgacctgttc [SEQ ID NO. 4]。将 PCR 产物插入至质粒 1256MA4T7 的 ApaI 位 点,产生质粒1256MA4T7att。最后,使用BglI消化质粒1256MA4T7att,并将60bp长的双链寡核苷酸(TAG)定向 插入至所述质粒中。总共产生100种报告质粒---PTAG-报告子1至100。使用这些质粒产 生了 92种启动子-TAG质粒。其余8种pTAG-报告质粒用作空白。使用这100种pTAG-报告质粒使用常规方法(限制酶切消化及连接)或 GATEWAY 技术使用attB修饰的PCR产物将推定的启动子克隆至MCS。实施例2。宏阵列膜的手动及自动装置产生
第一,比较以下三种尼龙膜的印刷短寡核苷酸的能力=BrightStar-Plus (Ambion 公 司,Austin, TX)、Tropilon-Plus(Applied Biosystems, FosterCity, CA)及 Nytran Supercharge (Whatman PLC, Middlesex, UK)。将 63bp 长的与存在于 TAG-报告质粒上的 TAG互补的寡核苷酸手动点渍于膜上,并与生物素末端标记的正义TAG寡核苷酸杂交。选择 BrightStar-Plus (Ambion公司,Austin,TX)用于随后的实验中,这是因为此膜在以下方面 产生最佳结果低背景、信号斑点清晰度、及BrightStar-Plus膜的粗糙表面比其它两种膜 的光滑表面产生较强的信号且不会增加背景的观察结果。剪切尼龙膜(2x4cm)以放入5mL 的玻璃杂交管及8-孔杂交板(SuperArray公司,Frederick,MD)。然后,使点渍于膜上的寡核苷酸的量最优化。通过将冻干的产物在TEpH 7. 5中 重构至100 μ M来制备所有反向链TAG寡核苷酸的储备溶液。实施20X、60X、180X、540X及 1620X的系列稀释。使用2yL自动移液器,手动将稀释的寡核苷酸(0.2μ1) —式两份点 渍于膜上。在使膜与生物素末端标记的正义链TAG寡核苷酸探针杂交后,通过化学发光使 用 Southern-Star 试剂盒(Applied Biosystems, Foster City, CA)实施信号检测。20 倍 稀释物产生较强且无瑕疵的信号斑点,因此选择20倍稀释。使用 University of Idaho Environmental Biotechnology Institute (Moscow, ID)的微阵列机构的Biorobotics MicroGrid阵列自动点渍装置(GenomicSolutions, Ann Arbor,MI)来印刷经相同稀释的寡核苷酸(η = 100)(图2)。各寡核苷酸以四个 重复的斑点印刷。将两种类型的膜在室温下空气干燥lOmin,并随后使用Stratalinker 1800 (Stratagene)在120mJ/sec下紫外交联两次,随后在70°C下烘烤2小时。随后将所 印刷的膜密封于石蜡膜中,并在4°C下储存。膜的大小设计得可放入手头的小容器中,例如 2mL的微量离心管及8-孔板。实施例3。将92种人类及病毒启动子序列克隆至TAG-报告质粒中使用Gateway 系统将92种人类及病毒启动子序列(表1)克隆至tag-报告质 粒中。其包括12种防卫素启动子及15种抑瘤素(Onc0Statin)M启动子、57种来自EPD及 染色体21 二者的基因组DNA片段(已通过实验方法研究启动子活性)、及8种熟知的启动 子(SV40、CMV、野生型及突变体 RSV、GAPDH、HSP、FerL 及 FerH)。第一,通过PCR使用人类染色体DNA或质粒作为模板且使用携带attB序列延伸的 引物来扩增启动子序列。通过体外重组使用BP克隆酶(Invitrogen,Carlsbad,CA)将PCR 产物插入至PTAG-报告质粒中代替ccdB及氯霉素抗性基因。利用热激程序将重组质粒引 入大肠杆菌ToplO中,并进行扩增。以约1 200的频率获得无启动子插入片段的重组克 隆。为确定正确的克隆,制备各克隆的质粒DNA并通过琼脂糖凝胶电泳分别进行分析。通 过分光光度法来定量质粒DNA。最后,以等摩尔量集中,最终浓度为0.4yg DNA/μ L0涉及筛选推定的启动子的质粒文库时,将大肠杆菌克隆排列于96-孔板中。集中 细菌(不是其质粒DNA)并在相同烧瓶中进行扩增。在一个准备过程中对其质粒DNA进行 纯化,随后转染至相同的细胞群体中。实施例4。使用92种启动子-TAG质粒测试所述启动子检测方法使用92种启动子-TAG及8种空白报告子-TAG质粒实施所述方法。使用 Lipofectamine 2000 (Invitrogen, Carlsbad, CA)将不同量(4,16,64 μ g)的所述质粒的等 摩尔混合物转染至HEK 293细胞中。在37°C下培养14小时及25小时后,收获细胞。提取总RNA并使用基于TRIzol的方法(Invitrogen,Carlsbad, CA)进行纯化。自总RNA合成 生物素标记的cDNA探针。使用AmpoLabeling LPR方法(SuperArray Bioscience公司, Frederick,MD)合成探针。通过扩增cDNA来提高cDNA阵列的灵敏度,所述cDNA通过反转 录通过多达30轮线性聚合酶复制(LPR)而获得。将长300个核苷酸的区域(涵盖60个核 苷酸的TAG)在生物素标记的dUTP存在下反转录并扩增。使2. 5 μ g总RNA与和MA4区段 互补的引物退火,在热循环仪中在70°C下3分钟,冷却至37°C,并在37°C下培育10分钟。 使用MMLV反转录酶来反转录退火产物并在85°C下水解RNA,通过LPR使用位于TAG上游的 引物 5,-GGCTCGGCCTCTGAGCTAAT-3,[SEQ ID NO. 2]在生物素 16dUTP 及热稳定性 DNA 依赖 性DNA聚合酶存在下使用以下程序来扩增cDNA 在85°C下5分钟;随后在85°C下1分钟、 在50°C下1分钟、在72°C下1分钟的30个循环;随后在72°C下5分钟。随后通过以下程序 来检测探针的生物素纳入情况制备探针合成的系列稀释物,将1 μ 1分液点渍于HyBond尼 龙膜(AmershanuLittle Chalfont, UK)上,并使用ECL化学发光检测试剂盒检测探针。在 1000倍稀释或更高倍数稀释时可检测到的探针用于杂交。使用Ultrahyb-oligo杂交缓冲液(Ambion公司)在60°C下使生物素化探针与膜 杂交过夜。在60°C下将膜用2xSSC,SDS洗涤两次并用lxSSC,SDS洗涤两次后,使 用抗生蛋白链菌素-碱性磷酸酶偶联物并遵循制造商方案(CDP-Star Universal检测试剂 盒,Sigma)通过化学发光来检测结合的探针。使用Kodak图像工作站440获取1小时的图 像(图4A)。使用KodaklD图像分析软件来定量四个重复斑点中各斑点的密度。结果表明 a)没有启动子序列(表1中的#10、19、26、28、30、35、39及47)的所有“空白”报告子-TAG 质粒均得到非常低强度的信号,此结果表明质粒骨架无内在启动子活性;b)对于一系列防 卫素启动子(#74-85),表达最高的mRNA水平的克隆(#79)同样也表达最高的荧光素酶水 平。实施例5。使用35种启动子-TAG质粒测试所述启动子检测方法使用一系列35种启动子-TAG质粒来测试所述方法。通过电穿孔将20 μ g所述质 粒的等摩尔混合物转染至U937细胞中。在37°C下培养7小时后,收获细胞。提取总RNA并 使用基于TRIzol的方法(Invitrogen,Carlsbad,CA)进行纯化,并通过分光光度法(260nm 下的吸光度)进行定量。如下合成放射性cDNA探针。将存于6. 3 μ L H2O中的1微克总RNA与0. 7 μ L的 100 μ M ΜΑ5-寡核苷酸(5‘-TAGTCACTTCGATCGCTGAGG-3‘) ([SEQ ID NO. 1])、1· 1 μ L 5mM 的 各dATP/dTTP/dGTG及1. 9 μ L的32P dCTP混合。将反应混合物加热至80°C,保持3分钟,并 随后冷却至420C。随后添加1. 5 μ L IOx反转录缓冲液(New England Biolabs) ,0. 75 μ L RNA酶抑制剂及M-MuLV反转录酶(New England Biolabs),并在42°C下实施反应60分钟。 随后在90°C下使探针变性10分钟。使用Ultrahyb-oligo杂交缓冲液(Ambion公司)在60°C下使放射性探针与膜杂 交过夜。在60°C下将膜用2x SSC,1% SDS洗涤两次并用Ix SSC,1 % SDS洗涤两次后,使 用Kodak Biomax Light film通过放射自显影法检测结合的探针。使用Kodak ID图像分 析软件来定量各斑点的密度(图5A及5B),其中通过使放射性TAG-cDNA探针与点渍有互补 TAG链的膜杂交来获得放射自显影图。相对于使用CMV启动子所获得的信号来比较各个斑 点的强度。与预期一样,病毒CMV启动子似乎最强,此结果详细记载于科学文献中(美国专
35利第 5,168,062 号及第 5,385,839 号;Cayer 等人,J ImmunolMethods. 2007 年 4 月 30 日; 322(1-2) :118-27 ;Sakurai 等人,Gene Ther. 2005 年 10 月;12(19) 1424-33 ;Fabre 等人, J Gene Med. 2006年5月;8 (5) =636-45.) 0 GAPDH (甘油醛-3-磷酸脱氢酶)启动子能够驱 动非常高的表达水平,此与其它研究人员的观察一致(Hirano T等人,BioSCi Biotechnol Biochem. 1999 ;63 (7) 1223-7 ;Punt PJ 等人,Gene. 1990 ;93(1) 101-9 ;Nagashima T 等 人,Biosci Biotechnol Biochem. 1994 ;58 (7) 1292-6)。而且,铁蛋白轻链启动子比铁 蛋白重链启动子强约40%,此结果支持Cairo等人在大鼠肝脏中所得到的发现(Biochem J. 1991 ;275(第 3 部分 813-6)。启动子 0M3 (TAG61)及 Def6 (TAG 77)在其各自组(OM 及 防卫素启动子)中产生最强的杂交信号,此结果与先前测定的荧光素酶活性相关联(Ma等 人,Nucleic AcidsRes. 1999 ;27 (23) 4649-57 ;Ma 等人,J Biol Chem. 1998 年 4 月 10 日; 273(15) :8727-40.)。总的来说,这些数据验证本公开内容与其它方法的可比性。表权利要求
一种检测DNA调节序列的方法,包括a)将启动子序列候选物插入至载体中,其中所述载体包含TAG序列且其中将所述启动子序列候选物插入一位置以驱动所述TAG序列转录;b)将含有所述插入的启动子序列候选物的所述载体插入至克隆宿主细胞中;c)使含有不同启动子序列候选物的克隆宿主细胞生长至相同光密度并集中,提取其中的所述载体、纯化并插入至报告细胞系中;d)自所述报告细胞系提取mRNA,其中所述mRNA直接进行标记或用作cDNA或探针合成的模板;及e)用阵列对所述经标记的mRNA、cDNA或探针进行分析,其中所述阵列包含与所述TAG序列相同或互补的序列。
2.根据权利要求1所述的方法,其中所述载体是质粒。
3.根据权利要求1所述的方法,其中所述TAG序列为约16个碱基对至约200个碱基对。
4.根据权利要求1所述的方法,其中步骤(a)还包括将多个启动子序列候选物插入至 多个载体中,其中每个载体包含独特的TAG序列。
5.根据权利要求1所述的方法,其中所述克隆宿主细胞位于单个反应小瓶中,其中对 来自所述克隆宿主细胞内的载体进行纯化,并将约等量的经纯化载体转移至报告细胞系 中。
6.根据权利要求1所述的方法,其中所述克隆宿主细胞位于单独的反应小瓶中,其中 对来自各单独的反应小瓶中的所述克隆宿主细胞的DNA进行纯化,其中将来自各克隆宿主 细胞的经纯化DNA以等摩尔量集中并将其中的载体插入至报告细胞系中。
7.根据权利要求1所述的方法,其中所述cDNA或探针含有标记。
8.根据权利要求1所述的方法,其中对所述mRNA直接进行标记。
9.根据权利要求1所述的方法,其中用阵列对所述mRNA进行分析,其中所述阵列包含 与所述TAG序列互补的序列,其中所述互补序列是反义链。
10.根据权利要求1所述的方法,其中用阵列对所述cDNA进行分析,其中所述阵列包含 与所述TAG序列的cDNA互补的序列,且其中所述互补序列是正义链。
11.根据权利要求1所述的方法,其中所述经标记的mRNA、cDNA或探针与所述阵列杂 交且所述mRNA、cDNA或探针的标记具有可检测反应。
12.根据权利要求1所述的方法,其中插入所述DNA启动子序列候选物的所述载体包含 TAG序列、一个或多个多克隆位点、一种或多种DNA重组序列、阴性选择标记、RNA聚合酶启 动子序列、MA区段、翻译终止密码子、RNA稳定化片段及转录终止信号,其中所述DNA启动子 序列候选物所处的位置应使其能够驱动所述TAG序列转录。
13.根据权利要求12所述的方法,其中所述RNA稳定化片段来自α-珠蛋白基因。
14.根据权利要求12所述的方法,其中所述转录终止信号是多腺苷酸化信号。
15.根据权利要求12所述的方法,其中所述RNA聚合酶启动子序列是Τ7启动子序列。
16.根据权利要求12所述的方法,其中所述DNA重组序列选自attPl及attP2。
17.根据权利要求12所述的方法,其中所述TAG序列位于所述启动子序列的3’端及转 录终止位点的5’端。
18.—种载体,其中插入DNA启动子序列候选物,所述载体包含TAG序列、一个或多个多 克隆位点、至少一种DNA重组序列、阴性选择标记、RNA聚合酶启动子序列、MA区段、翻译终 止密码子、RNA稳定化片段及转录终止信号,且其中所述DNA启动子序列候选物所处的位置应使其能够驱动所述TAG序列转录。
19.根据权利要求18所述的载体,其中所述载体是质粒。
20.根据权利要求18所述的载体,其中所述TAG序列为约16个碱基对至约200个碱基对。
21.根据权利要求18所述的载体,其中所述TAG序列位于所述插入的启动子序列的3’ 端及转录终止信号的5’端。
22.根据权利要求18所述的载体,其中所述RNA稳定化片段来自α-珠蛋白基因。
23.根据权利要求18所述的载体,其中所述转录终止信号是多腺苷酸化信号。
24.根据权利要求18所述的载体,其中所述RNA聚合酶是Τ7启动子序列。
25.根据权利要求18所述的载体,其中所述DNA重组序列选自attPl及attP2。
全文摘要
本公开内容公开了用于启动子检测及分析的基于阵列的方法。在一个反应小瓶中使用包含TAG序列的载体同时分析启动子序列候选物,其中转录产物在其合成时被加以标签,以使一种特定转录物仅由一种类型的标签标记,且一种标签仅标记一种类型的转录物。在常规阵列上分析转录输出。
文档编号C12P21/02GK101918578SQ200880123310
公开日2010年12月15日 申请日期2008年10月26日 优先权日2007年10月27日
发明者X·丹欣内, 马永生 申请人:Od260公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1