新的β-肌动蛋白和RPS21启动子及其应用的制作方法

文档序号:1182876阅读:209来源:国知局
专利名称:新的β-肌动蛋白和RPS21启动子及其应用的制作方法
技术领域
本发明涉及调节基因元件,如启动子及其应用,例如,在表达蛋白中的应用。更特 别地,本发明涉及β-肌动蛋白和核糖体蛋白S21基因的启动子。
背景技术
每种真核基因含有驱动该基因转录的调节元件。该调节元件包括典型地直接位于 该基因编码区上游的启动子。作为转录机制的一部分,启动子通过提供转录因子的结合位 点来调节转录。启动子通常被用于在细胞培养中和体内表达蛋白质。很多启动子是已知的 并被用于各种表达系统中表达蛋白质。启动子的例子包括巨细胞病毒(CMV)立即早期启动 子、劳氏肉瘤病毒基因组大基因组长末端重复(RSV)、猿病毒40(SV40)启动子、干扰素基因 启动子、金属硫因启动子、和胸腺嘧啶激酶启动子及其它,如Fernandez等人(1999)在Gene ExpressionSystem, Academic Press中所描述的。然而,在本领仍需要提供一种可以产生 高表达水平和/或在长时间内维持表达的启动子。肌动蛋白是一种结构蛋白,其通常在从原核到真核,包括人的所有物种中表 达。先前描述了人和鸡的β-肌动蛋白启动子。一般而言,β-肌动蛋白启动子表现出比 广泛被应用的CMV启动子更普遍的活性(Xu等(2001)Gene 272:149-156)。仅仅当其被连 接到CMV增强子序列时,鸡的β-肌动蛋白启动子比病毒CMV和SV40启动子具有更高的 活性(Xu 等,supra)。核糖体蛋白S21(rpS21)与核糖体40S亚单位有关。人的rpS21基因的启动子已 被鉴别(GenBank 接收号No. AJ250907)。与大多数核糖体启动子基因相似,其缺少传统 的转录元件,如 TATA 盒和 CAAT 序歹Ij (Smirnova 等(2000) Bioorg. Khim. 26 (5) :392_396)。

发明内容
本发明提供了一种新的肌动蛋白启动子,其与前述公知的肌动蛋白启动 子相比具有低水平的序列同源性(如,人或鸡)。本发明还提供了新的rpS21启动子,其与 前述公知的rpS21启动子相比具有低水平的序列同源性(如,人或小鼠)。本发明部分基于对中国仓鼠卵巢细胞(CHO)系来源的β-肌动蛋白和rpS21启动 子的发现和分离。本发明进一步部分基于仓鼠肌动蛋白启动子比CMV启动子具有显著 的高活性的观察。本发明进一步部分基于当被用于表达一定基因时,rpS21启动子至少具 有与仓鼠肌动蛋白启动子相同的活性的观察。本发明提供了这些启动子的核酸序列,并包括具有启动子活性的各种核酸序列的变种。在一些实施例中,本发明的肌动蛋白 启动子来源于啮齿类,如仓鼠、大鼠和小鼠。典型地rpS21启动子来源于仓鼠。本发明进一步提供了含有可操作地连接到异源核酸上的本发明的肌动蛋白 或rpS21启动子的载体。在某些实施例中,本发明的载体包括可操作地连接到异源核酸上 的启动子,该异源核酸编码异源表达产物,如治疗蛋白质或其片段。在示例性实施例中,表 达产物是酸性鞘磷脂酶(ASM)、α-葡萄糖苷酶(GAA)、或组织血浆酶原激活剂(tPA)。本发明还提供了用本发明的载体转染的宿主细胞。在描述性实施例中,宿主细胞 是哺乳动物细胞,如CHO、HEK和BHK。本发明还提供了用于产生蛋白质的方法。产生蛋白质的方法包括,例如,培养转染 细胞,该细胞用含有可操作地连接到编码蛋白质的异源核酸上的本发明的β-肌动蛋白启 动子和/或rpS21启动子的载体转染的细胞,以及回收蛋白质。在一些实施例中,异源表达 产物是分泌蛋白,其从培养基中被回收。在描述性实施例中,蛋白质是六511、6六六、或1 八。本发明还涉及1. 一种选自SEQ ID NOs :1、2、3的核苷酸序列的分离的啮齿动物β -肌动蛋白启 动子或其具有启动子活性的变种。2. 一种SEQ ID NO=I中列出的分离的仓鼠β _肌动蛋白启动子核苷酸序列,或其 具有启动子活性的变种。3. 一种SEQ ID NO :2中列出的分离的大鼠β -肌动蛋白启动子核苷酸序列,或其 具有启动子活性的变种。4. 一种SEQ ID NO :3中列出的分离的小鼠β -肌动蛋白启动子核苷酸序列,或其 具有启动子活性的变种。5. 一个包括SEQ ID NO 1中列出的核苷酸序列的分离的核酸,或其具有启动子活 性的变种。6. 一个包括SEQ ID NO 2中列出的核苷酸序列的分离的核酸,或其具有启动子活 性的变种。7. 一个载体,其包括SEQ ID NO 1中的启动子,或其具有启动子活性的变种。8. 一个载体,其包括SEQ ID NO 2中的启动子,或其具有启动子活性的变种。9. 一个载体,其包括SEQ ID NO 3中的启动子,或其具有启动子活性的变种。10.根据权利要求7-9的任何一项所述的载体,其中启动子被可操作地连接到异 源核酸上。11.根据权利要求10所述的载体,其中异源核酸编码治疗性蛋白。12.根据权利要求11所述的载体,其中治疗性蛋白选自酸性鞘磷脂酶、α -葡萄糖 苷酶或组织血浆酶原激活剂。13.用权利要求7-12的任何一项的所述的载体转染的宿主细胞。14.根据权利要求13的宿主细胞,其中细胞是CHO细胞。15. 一种生产蛋白质的方法,其包括(a)培养用含有仓鼠肌动蛋白启动子或其变种的载体转染的细胞,该启动子 或其变种被可操作地连接到编码该蛋白质的核酸上,和;(b)回收蛋白质。
16.根据权利要求15所述的方法,其中蛋白质是抗体。17.根据权利要求16所述的方法,其中抗体结合TGF-β族成员。18.根据权利要求15所述的方法,其中蛋白质是治疗性蛋白。19.根据权利要求18所述的方法,其中治疗性蛋白选自酸性鞘磷脂酶、α-葡萄糖 苷酶或组织血浆酶原激活剂。20.含有权利要求1-6的任何一项所述的启动子的转基因动物。 根据权利要求20所述的转基因动物,其中动物是哺乳动物。 具有SEQ ID NO :39的核苷酸序列的分离的rpS21启动子,或其具有启动子活21.22.
性的变种。 上。脂酶。
23.含有SEQID NO :39的核苷酸序列或其具有启动子活性的变种的载体。
24.根据权利要求23所述的载体,其中核苷酸序列被可操作地连接到异源核酸
25.根据权利要求24所述的载体,其中异源核酸编码治疗性蛋白。
26.根据权利要求25所述的载体,其中治疗性蛋白是α-葡萄糖苷酶或酸性鞘磷
27.用权利要求23-26的任何一项所述的载体转染的宿主细胞。
28.根据权利要求27所述的宿主细胞,其中细胞是CHO细胞。
29.—种生产蛋白的方法,其包括
(a)培养用含有仓鼠rpS21启动子或其变种的载体转染的细胞,该启动子或其变 种被可操作地连接到该编码蛋白质的核酸上,和; 回收蛋白质。
根据权利要求29所述的方法,其中蛋白是抗体。 根据权利要求29所述的方法,其中蛋白是治疗性蛋白。 根据权利要求31所述的方法,其中治疗性蛋白是α -葡萄糖苷酶或酸性鞘磷
一种含有权利要求22所述的启动子的转基因动物。 根据权利要求33所述的转基因动物,其中动物是哺乳动物。 一种分离的β “肌动蛋白启动子,其核苷酸序列作为ATCC参考号ΡΤΑ-5309 被保藏,其分类命名为含有克隆到噬菌粒载体PBluescript II KS+的β-肌动蛋白启 动子的仓鼠基因组克隆pBlueP-肌动蛋白/Avr(Hamster genomic clone containing β -actin promoter cloned in phagemid vector pBlueScript II KS+:pBlueβ-actin/ Avr),保藏单位为美国典型培养物保藏中心(American Type Culture Collection,ATCC), 保藏日为2003年7月3日。 36. 一种分离的rpS21启动子,其核苷酸序列作为ATCC参考号被保藏。(b)
30.
31.
32.脂酶。
33.
34.
35.


图IA显示了仓鼠β-肌动蛋白启动子部分核苷酸序列(SEQ ID Ν0:1)与大鼠 β-肌动蛋白启动子(SEQ ID NO :2)的比对,显示出SEQ IDNO :1中的核苷酸487-893与SEQ ID NO :2中的核苷酸1-417具有79%的同一性。大鼠β-肌动蛋白启动子(SEQ ID NO 2)
5与仓鼠β-肌动蛋白启动子(SEQ ID NO 1)的全长相比具有67%的同一性。图IB显示了仓鼠β-肌动蛋白启动子部分核苷酸序列(SEQ ID Ν0:1)与大鼠 β -肌动蛋白启动子(SEQ ID NO 2)的比对,显示出SEQ IDNO 1中的核苷酸1047-3006与 SEQ ID NO 2中的核苷酸546-2493具有83%的同一性。图2Α显示了仓鼠β-肌动蛋白启动子部分核苷酸序列(SEQ ID Ν0:1)与小鼠 β-肌动蛋白启动子(SEQ ID NO 3)的比对,显示出SEQ IDNO 1中的核苷酸33-487与SEQ ID NO :3中的核苷酸1-449具有84%的同一性。小鼠β-肌动蛋白启动子(SEQ ID NO 3) 与仓鼠β-肌动蛋白启动子(SEQ ID NO 1)的全长相比具有80%的同一性。图2Β显示了仓鼠β-肌动蛋白启动子部分核苷酸序列(SEQ ID Ν0:1)与小鼠 β-肌动蛋白启动子(SEQ ID NO 3)的比对,显示出SEQ IDNO :1中的核苷酸996-3006与 SEQ ID NO :1中的核苷酸921-2953具有83%的同一性。图3显示了仓鼠β-肌动蛋白启动子部分核苷酸序列(SEQ ID Ν0:1)与仓鼠 β-肌动蛋白基因(GenBank 接收号No.U20114 ;SEQ ID NO 4)的比对,显示出SEQ ID NO :1中的核苷酸1775-3006与SEQ ID NO :4中的核苷酸1-1232具有98%的同一性。仓 鼠β-肌动蛋白基因序列与仓鼠β-肌动蛋白启动子序列(SEQ ID NO 1)的全长相比具有 40%的同一性。图4显示了仓鼠β-肌动蛋白启动子部分核苷酸序列(SEQ ID Ν0:1)与在先已知 的人β-肌动蛋白启动子(GenBank 接收号No. gi28337 ;SEQ ID NO 5)的比对,显示出 SEQ ID NO 1中的核苷酸113-148与SEQ ID NO 5中的核苷酸38-73具有94%的同一性, SEQ ID NO :1中的核苷酸362-433与SEQ ID NO :5中的核苷酸303-374具有83%的同一 性,SEQ ID NO 1中的核苷酸1728-1764与SEQ ID NO 5中的核苷酸1791-1830具有90% 的同一性,SEQ ID NO 1中的核苷酸1797-1966与SEQ ID NO 5中的核苷酸1840-2007具 有91%的同一性。仓鼠β-肌动蛋白启动子序列(SEQ ID NO 5)与人β-肌动蛋白启动 子(SEQ IDNO=I)的全长相比具有10%的同一性。图5显示了仓鼠β-肌动蛋白启动子核苷酸序列(SEQ ID Ν0:1)与先前已知的鸡 β-肌动蛋白启动子(GenBank 接收号No. gi217043 ;SEQ ID NO 6)的比对,显示出SEQ ID NO 1中的核苷酸1878-1919与SEQ ID NO 6中的核苷酸186-227具有83%的同一性。 鸡的β-肌动蛋白启动子序列(SEQ ID NO 6)与仓鼠β-肌动蛋白启动子(SEQ IDNO 1) 的全长相比具有的同一性。图6Α描述了 CHO-Kl细胞中的半乳糖结合蛋白、铁蛋白和β -肌动蛋白的RNA斑 点印迹。mRNAs分别分离自放射菌素D处理后0、4、8、10和15小时后的细胞。图6B描述了半乳糖结合蛋白、铁蛋白和β-肌动蛋白的相对mRNA表达水平。 mRNAs分别分离自放射菌素D处理后的CHO-Kl细胞10、4、8、10和15小时后的细胞。图7A描述了在CHO-Kl细胞中的瞬时转染分析检测下列启动子的相对启动子强 度CMV、人EF-1、仓鼠GAPDH、仓鼠rpS21_和仓鼠β-肌动蛋白。在pDsRED_l质粒中启动 子分别被克隆到红色荧光蛋白(RFP)基因的上游。用FACS检测荧光。图7B描述了在CHO-Kl细胞中的稳定转染分析检测中下列启动子的相对启动子强 度CMV、人EF-1、仓鼠GAPDH、仓鼠rpS21_和仓鼠β-肌动蛋白。在pDsRED-Ι质粒中分别 将启动子被克隆到红色荧光蛋白(RFP)基因的上游。用FACS检测平均荧光。
图8A描述了在来源于三个被含有可操作地连接到CMV启动子或仓鼠0 -肌动蛋 白启动子上的ASM cDNA的载体转染的CH0-DXB11细胞池的培养基中酸性鞘磷脂酶(ASM) 蛋白的表达。用分析ASM酶活性的分析方法分析ASM的表达。图8B描述了在来源于三个被含有可操作地连接到CMV启动子或仓鼠0 -肌动蛋 白启动子上的GAA cDNA的载体转染的CH0-DXB11细胞池的培养基中a-葡萄糖苷酶(GAA) 蛋白的表达。用分析a-葡萄糖苷酶(GAA)蛋白酶活性的分析方法分析GAA的表达。图9描述了在来源于被含有可操作地连接到仓鼠肌动蛋白启动子上的tPA cDNA的载体转染的CH0-DXB11细胞池的培养基中tPA蛋白的表达。用ELISA方法分析tPA 的表达。
具体实施例方式为了更容易地理解本发明,首先对术语进行定义。另外的定义在贯穿说明书的详 细说明中列出。术语“启动子”指调节元件,其指导与其可操作地连接的核酸的转录。启动子可以 调节可操作地连接到其上的核酸的转录速率和效率。启动子还可以被可操作地连接到其它 的调节元件上,其可增强(“增强子”)或抑制(“抑制子”)启动子依赖的的核酸转录。术 语“可操作地连接”指处于与其它核酸有功能关系的位置的核酸。启动子通常位于核酸转 录起始点的5’端(S卩,上游)。然而,启动子可以包括转录起始点的3’端(S卩,下游)。启 动子还可以包括可操作地连接的核酸的转录起始点的5’和3’端。术语“启动子活性”指启动子启动与其可操作连接的核酸转录的能力。可以应用 本领域公知的或实施例中描述的方法检测启动子活性。例如,可以通过测量被转录的mRNA 的量测量启动子的活性,例如,RNA印迹或聚合酶链反应(PCR)。可供选择地,可以通过测 量被翻译的蛋白产物的量测量启动子的活性,例如,蛋白印迹、ELISA、如Bradford分析 (Bradford(1976) Anal. Biochem. ,72 248)的色比色分析和各种活性分析,包括报告基因 分析和其他本领域公知的或实施例中描述的方法。术语“载体”指可以携带其他核酸的病毒或非病毒、原核或真核、脱氧核糖核酸、核 糖核酸或核酸类似物。载体可携带核酸进入被称为“宿主细胞”的细胞,从而使核酸的全部 或部分被转录或表达。可供选择地,载体可被用于体外转录分析中。载体通常来源于不同病 毒、细菌或哺乳动物基因元件的组合物装配而成。载体含有各种包括编码选择性标记(如, 抗生素抗性基因)、有助于其在细菌中增殖的序列、或仅在某些细胞类型中表达的一个或多 个转录单位的编码和非编码序列。例如,哺乳动物表达载体通常即含有有助于载体在细菌 中增殖的原核序列,又含有仅在真核细胞中表达的一个或多个真核转录单位。本领域技术 人员应该理解载体的设计取决于如所选择的被转染的宿主细胞、所需的蛋白质表达水平等 因素。载体包括例如,质粒、噬菌粒和病毒载体。对于已具有启动子的载体,可以使用本 领域熟知的标准重组DNA技术对载体进行修饰,从而用任何SEQ ID NOs :1、2、3或39或其变 种列出的启动子序列取代已存在的启动子序列,。一般而言,合适的载体或者可以选自商售 的那些,也可以应用本领域熟知的标准重组DNA技术构建。(见,如Molecular Cloning :A Laboratory Manual :2n edition,Sambrook etal. , 1989,Cold Spring Harbor LaboratoryPress.)术语“转化”和“转染”指向细胞内导入核酸。可以使用本领域熟知的方法或此处 描述的方法将核酸导入植物或动物细胞,或原核或真核细胞。术语“分离的”指使用不是自然发生的方式,从其他核酸序列中分离的脱氧核糖核 酸、核糖核酸、或多聚核苷酸的核酸类似物。分离的核酸包括使用本领域的标准技术部分或 全部化学地或重组地合成和/或纯化的核酸。涉及启动子的术语“变种”指如果变种具有启动子活性,则与启动子序列全长或其 互补链全长基本上具有同一性的核苷酸序列。只要其长度至少有1250个核苷酸β -肌动蛋白启动子的变种可以与SEQ ID NOs 1、2或3的核苷酸序列同样长、或短。只要其具启动子活性rpS21启动子的变种可以与SEQ ID NOs :39的核苷酸序列同样长、或短。β-肌动蛋白启动子的变种可以是自然发生的,如 从除人和鸡以外的物种分离的自然发生的肌动蛋白,或人工生成的肌动蛋白启 动子。当被最优比对时,在SEQ ID NO 1序列的核苷酸1-3007的全长上,SEQ ID NO 1列 出的仓鼠β -肌动蛋白启动子与其变种之间的同一性至少为45 %、50 %、55 %、60 %、65 %、 70%、75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、或 99%。相似地, 在SEQID NO 2列出的序列的核苷酸1-2493的全长上,SEQ ID NO 2的大鼠β -肌动蛋白 启动子与其变种之间的同一性至少为60%,65%,70%,75%,80%,85%,90%,92%,93%, 94%、95%、96%、97%、98%、或 99%。SEQ ID NO :3 序列的核苷酸 1-2953 的全长上,SEQ ID NO :3的小鼠3_肌动蛋白启动子与其变种之间的同一性至少为55%、60%、65%、70%、 75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、或99%。相似地,在 SEQ ID NO 39列出的序列的核苷酸1-1958的全长上,SEQ ID NO 39的仓鼠rpS21启动子与其变种 之间在最优比对时的同一性,至少为40%,50%,55%,60%,65%,70%,80%,90%,91%, 92%、93%、94%、95%、96%、97%、98%、或 99%。β _肌动蛋白启动子的变种可以,例如,包括其他物种中的β _肌动蛋白启动子的 同源物(orthologs),其他物种包括啮齿动物和其他哺乳动物,但除外人和鸡β -肌动蛋白 启动子及其已知的变种。本发明的启动子的变种还可以在其他啮齿动物中被发现,如豚鼠、 花白旱獭、麝鼠、沙鼠、松鼠、花栗鼠、土拨鼠、海狸、豪猪和野鼠。术语“变种”进一步包括具有启动子活性的任何一个或多个本发明启动子的片段。 β-肌动蛋白启动子的变种具有至少1250核苷酸的长度。例如,可通过5’端切断SEQ ID NO :1中列出的的仓鼠β -肌动蛋白启动子的而衍生出本发明的β -肌动蛋白启动子。在一 些实施方案中,β-肌动蛋白启动子的变种包括SEQ ID NO :1的核苷酸50-3000、100-3000、 150-3000、200-3000、250-3000、500-3000、1000-3000、或 1500-3000 的序列。在另一些实施 例中,可通过5’端切断SEQ ID NO :2中序列而衍生出β -肌动蛋白启动子,例如包括SEQ ID NO 2 的核苷酸 50-2490、100-2490、150-2490、200-2490、250-2490、500-2490、或 1000-2490 的序列。还可通过5’端切断SEQ ID NO :3中序列而衍生出β -肌动蛋白启动子,其包括例 如,SEQ ID NO :3 的核苷酸 50-2950、100-2950,150-2950,200-2950,250-2950,500-2950, 1000-2950或1500-2950的序列。例如,可以通过切断SEQ ID NO 7中较长的仓鼠启动子 核苷酸序列的5’端而衍生出仓鼠β-肌动蛋白启动子的长片段。此种变种包括,如,核苷 酸 50-3668、100-3668、150-3668、200-3668、250-3668、500-3668 或 600-3668 的序列。
可以通过5,和/或3,端的切断SEQ ID NO :39的序列来衍生rpS21启动子的变种。 此变种包括,例如,核苷酸 50-1958、100-1958、150-1958、200-1958、250-1958、500-1958、 1000-1958、1-1900、1-1850、1-1800、1-1750、1-1700、1-1600 或 1-1500 的序列。在某些实施方案中,本发明的肌动蛋白启动子包括来自于SEQID NOs :1、2或3 的至少 1250、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2500 或 3000 个核苷酸的相邻的分支。此SEQ ID NOs :1、2和3的相邻分支还可以包括一个突变(插入 或缺失),前提是突变序列保留了至少原始序列的一些功能以及在低、中等或高度严格的条 件下可以分别与SEQ ID NOs :1、2或3杂交的能力。可以通过5’切断SEQ ID NOs :1、2、3 或7或上述其变种的任何序列的而衍生出0-肌动蛋白启动子的相邻分支。在其他实施方案中,本发明的rpS21启动子包括来自SEQ ID NO 39的至少500、 600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1850 或 1900 个核 苷酸的相邻分支。本发明的肌动蛋白启动子的变种进一步包括可以和SEQ IDNOs :1、2或3中所 示的肌动蛋白启动子或其互补序列全长杂交的核苷酸序列,两者具有最多0、1、2、3、4、 5、10、15、20、25、30、35、40、45%的碱基对错配。本发明的rpS21启动子序列包括可与SEQID NOs :39中所示的全长rpS21启动子序列或其互补序列杂交的核苷酸序列,两者具有最多0、 1、2、3、4、5、10、15、20、30、40、45、50、55、60%的碱基对错配。可使用本领域公知的或此处描 述的技术测定碱基对的错配率。在此处用于修饰核酸的术语“异源的”是指除可操作地连接 到自然发生的基因组的启动子核酸以外的核酸。例如,术语“异源的”指当此核酸被可操作 地连接到仓鼠肌动蛋白启动子时,除仓鼠肌动蛋白基因以外的任何核酸。同样地, 当此核酸被可操作地连接到大鼠肌动蛋白启动子时,术语“异源的”指除大鼠肌 动蛋白基因以外的任何核酸。相似地,当此核酸被可操作地连接到小鼠肌动蛋白启动 子时,术语“异源的”指任何核酸。类似地,当此核酸被可操作地连接到仓鼠rpS21启动子 时,此术语可以指除仓鼠rpS21基因以外的任何核酸。术语“转基因”指含有基因操作细胞的任何动物,其中本发明的启动子不再被可操 作地连接如天然发生的基因组中的相同的核酸上。术语“转基因”包括,例如,含有具有整 合到动物染色体中的本发明的启动子或其变种的细胞的动物。术语“转基因”还包括含有 在染色体外具有由本发明的启动子或其变种组成的复制的DNA序列的细胞的动物。转基因 动物可以是如啮齿动物或人的哺乳动物。本发明部分基于新的肌动蛋白和rpS21基因的启动子的发现和分离。特别 地,本发明的特征为包括但不局限于仓鼠、大鼠和小鼠的啮齿动物肌动蛋白启动子,以 及仓鼠rpS21启动子。如实施例中所描述的,本发明是基于发现和证实本发明的肌动 蛋白启动子具有高于CMV的启动子活性的基础上。本发明进一步基于当用于表达某些基因 时,仓鼠rpS21启动子的活性至少与仓鼠肌动蛋白启动子的活性相同的发现的基础上。本发明提供了包括仓鼠、大鼠和小鼠的啮齿动物肌动蛋白启动子的核苷酸序 列,以及其应用方法。本发明进一步提供了鉴别和分离本发明的启动子变种的方法,包括具 有启动子活性的启动子的同源物或片段。另外,本发明提供了用于仓鼠rpS21启动子的核 苷酸序列及其使用方法。在导致本发明的实验中,仓鼠肌动蛋白启动子的基因克隆被称为基因表达的系列分析技术或 “SAGE”(Valculesco et al. (1995) Science,270 :484_487 和 Valculesco et al. (1987)Cell,88 =243-251)鉴定为活性启动子在识别后从CHO细胞中分离出来。SAGE 技术可被用于整个基因组的转录图谱中。使用SAGE技术,β-肌动蛋白启动子被鉴定为是 CHO细胞中最具活性的启动子之一。因此从CHO细胞中克隆β-肌动蛋白启动子。可应用 相似的方法从CHO细胞中克隆仓鼠rpS21启动子。该方法可被用于其他基因组的转录图谱 以确认在其他基因组中相应的β-肌动蛋白启动子或rpS21启动子的活性。可使用本领 域公知的标准技术或此处描述的技术克隆这些启动子。可以通过将其与一个或多个SEQID NOs :1、2、3或39列出的启动子序列杂交的方法鉴别本发明的启动子的变种。同源性每降低 1%,双链核酸的熔点(Tm)就降低1-1. 5°C是公知的(见,如Bormer et al. (1973) J. Mol. Biol. ,81 :123)。因此,例如可以将公认的核苷酸序列与SEQ ID NOs :1、2、3或39或其变种 序列杂交,并将此杂化物的熔点和SEQ ID NOs :1、2、3或39或其变种序列与其互补序列的 杂化物的熔点相比较,从而鉴定物种间的同源性。然后可以计算待测杂化物的碱基对错配 数。因此,待测杂化物的熔点与含有任何SEQ ID NOs :1、2、3或39的公认同源物的杂化物 的熔点的差别越小,表明公认的核苷酸序列与本发明的启动子序列之间的同源性越大。例 如,在其他啮齿动物如,豚鼠、花白旱獭、麝鼠、沙鼠、松鼠、花栗鼠、土拨鼠、海狸、豪猪和野 鼠中的变种可以表现为与本发明的启动子及其变种具有更高的同源性。已知多种因子影响核酸双链的杂交效率。其包括,例如,核酸序列的长度,盐浓度 和序列的G/C含量。例如,为了杂交DNA的长片段,Howley et al. (1997) J. Biol. Chem., 254 :4876,确定了使50% DNA与互补链杂交的熔点为Tm = 81. 5+16. 61ogM+41(% G+% C) -500/L-0. 62F,其中,M是单价阳离子的摩尔浓度;(%G+%C)是序列中G和C核苷酸各自的份额,L是杂合DNA的长度;
F是甲酰胺的摩尔浓度。本领域技术人员可以如 Ausubel et al. (1995) Current Protocols inMolecular Biology,John Wiley & Sons,的第2、4和6部分列举的通过最少的实验来选择恰当的杂交 条件。另夕卜,严格的杂交条件在 Sambrooket al. (1989)Molecular Cloning :A Laboratory Manual, 2nd ed.,Cold SpringHarbor Press,第 7、9 禾口 11 章中描述。低严格的杂交条件的非限制性的例子如下。含有DNA的滤纸在40°C下,在含有 35% 甲酰胺、5XSSC、50mMTris-HCl(pH7. 5)、5mM EDTA、0. 1% PVP、0. 1% Ficoli U% BSA, 和500ug/ml变性的鲑鱼精子DNA的溶液中预处理6小时。杂交在具有以下变动的相同的 溶液中进行0. 02% PVP,0. 02% Ficoli 、0. 2% BSAUOOug/ml 变性的鲑鱼精子 DNA、10% (wt/vol)硫酸葡聚糖以及使用5-20X 10632P-标记的探针。滤纸在40°C下,在杂交混合液 中孵育 18-20 小时,然后在 55°C 的含 2XSSC、25mM Tris-HCl (pH7. 4)、5mM EDTA 禾Π 0. 1% SDS 的溶液中洗脱1.5小时。用新鲜溶液替换洗脱液并在60°C下继续赋育1.5小时。吸干滤 纸,使其暴露于射线自显仪。也可以使用本领域公知的其他的低严格条件(如,种间杂交所 用的)。一个高度严格的杂交条件的非限制性的示例如下所述。含有DNA的滤纸的预杂交 在含有6X SSC、50mM Tris-HCl (ρΗ7· 5)、ImM EDTA.O. 02%PVP,0. 02% Ficoll ,0. 02% BSA
10和500ug/ml变性的鲑鱼精子DNA的缓冲液中,在65°C处理8小时至过夜。滤纸在65°C下, 含有100ug/ml变性的鲑鱼精子DNA和5-20X 106cpm的32P_标记的探针的杂交液中杂交48 小时。在37°C下,含有2X SSC、0. 01% PVP.0. 01% Ficoll 和0. 01% BSA的溶液中洗脱滤 纸1小时,之后在50°C,0. 1XSSC溶液中洗脱45分钟。一个中度严格的杂交条件的非限制性的例子包括在5X SSC.0. 5% SDSU. OmM EDTA,pH8. 0的溶液中预洗脱;在50%甲酰胺、6XSSC的溶液中42°C进行杂交;在0. 5X SSC、 0. 1% SDS的条件下,60°C进行洗脱。还可以通过公认变种的核苷酸序列和SEQID NOs :1、2、3或39中的序列或其互补 链间同一性的百分比鉴定本发明启动子的变种。同一性百分比可以通过,例如,可见观测或 本领域公知的或实施例中描述的各种计算机程序来确定。例如,可以通过使用Devereux等 (1984)Nucl. Acids. Res. , 12 387中描述的并从威斯康星州大学的基因计算机组(UWGCG) 中可获得的GAP计算机程序比较序列信息来确定两核苷酸序列的同一性百分比。还可以通 过使用如 Tatusove et al. (1999)FEMS Microbiol. Lett.,174 :247 中描述的 BLAST 程 序(www.ncbi.nlm.nih.gov/BLAST)比对两核苷酸序列以确定同一性百分比。例如,使用 BLAST 程序进行核苷酸序列比对时,默认参数设定如下匹配回报为2,不匹配惩罚为-2, 开口间隙和延伸间隙惩罚分别为5和2,间隙Xdropoff为50,预期值为10,字大小为11,过 滤器关闭。通过序列同一性鉴别的本发明的启动子包括,例如,SEQ ID NOs 2和3序列分别 列出的大鼠和小鼠肌动蛋白启动子的序列,显示出与SEQ ID N01列出的仓鼠肌动 蛋白启动子序列的1-3007核苷酸相比具有67%和80%的同一性。应用此处描述的和本领 域熟知的多种技术可以很容易地鉴别其他变种。可以通过所描述的方法确定仓鼠肌动蛋白启动子(SEQ ID N01)与已知的 肌动蛋白启动子间的同一性百分比。例如,当用默认参数的BLAST 序列比对对SEQ
ID N01与人肌动蛋白启动子(SEQ ID N05)进行对比时,显示出在SEQ ID N01的全长 上仅有大约10%的同一性。相似地,当SEQ ID N01与鸡肌动蛋白启动子(SEQ ID N06) 对比时,显示出在SEQ ID N01的全长上仅有大约的同一性。由于同源性的水平如此 低,因此不认为人和鸡的肌动蛋白启动子是SEQ ID N01列出的仓鼠肌动蛋白启动 子的变种。而且,SEQ ID N01的3’部分显示出与仓鼠肌动蛋白基因序列的5’部分( Genbank 接收号No。U20114 ;SEQ ID NO 4)具有显著的同源性。特别地,如图3所示,SEQ ID NO 4的前1232个核苷酸显示出与SEQ ID N01的3,部分具有98%的同一性。此同一 性位于仓鼠肌动蛋白基因的第一内含子区内。整体上看,在SEQ ID N01的全长上,SEQ ID NO 4仅显示出40%的同源性。而且,SEQ ID NO 4或其片段并不具有启动子活性。应用具有默认参数的BLAST 序列比对发现在先前知道的人rpS21启动子( Genbank 接收号No AJ250907的核苷酸1-2344)与SEQ ID N039的仓鼠rpS21启动子的 核苷酸1-1958之间没有同一性。在SEQ ID N039的仓鼠rpS21启动子和跨越小鼠rpS21基 因的小鼠基因组DNA( Genbank 接收号No NT_039212)之间有很低的同一性。在小鼠的 序列中有两个具同源性的区域。第一个是SEQ ID NO 39的核苷酸1775-1945 (172个核苷 酸中有137个相匹配)。第二个是SEQ ID NO 39的核苷酸580-851 (274个核苷酸中有208 个相匹配)。这两个具同一性的区域在仓鼠序列(SEQ ID NO 39)中被923个核苷酸分开,在小鼠基因组序列(NT_039212)中被1745个核苷酸分开。在一些实施方案中,具有启动子活性的分离的启动子或其变种包括SEQ ID NO 39 中的核苷酸1775-1945和/或SEQ ID NO 39中的核苷酸580-851的核苷酸序列。可选择 的,此启动子或变种进一步包括从SEQ ID NO 39的全部或如核苷酸852-1774所示的部分 序列。SEQ ID NOs :1、2、3或39所示的核苷酸序列或其变种可用作探针以用于筛选基因 组库的,以便分离与一个或多个SEQ ID NOs :1、2、3或39所示序列或其变种的基因组序列。根据本发明的启动子或其变种被可操作地连接到被其所表达的异源核酸上。启动 子既可单独使用,也可以与其他调节元件,如增强子和抑制子联合使用。可供选择地,此启 动子可被整合到宿主细胞或动物的基因组上,从而在宿主细胞中表达内源性基因。根据本 发明的启动子可被用在表达异源核酸的载体中。在某些实施方案中,异源核酸编码治疗性 蛋白。治疗性蛋白的例子包括,但不局限于α-葡萄糖苷酶、酸性鞘磷脂酶、胰岛素、组织血 浆酶原激活剂、促甲状腺素α注射液刺激的激素(thyrogen stimulating hormon)、红细 胞生成素、葡糖脑苷脂酶、α -半乳糖苷酶和各种抗体。抗体的例子包括但不局限于结合如 TGF-β _1、2和3TGF-β族成员的抗体。本发明进一步提供了含有具有启动子活性的本发明的启动子或其变种的载体。在 一些实施方案中,本发明的载体包括位于启动子下游的合适的限制性酶切位点,其可用于 插入异源的核酸。该限制性酶切位点可以包括用于一种限制性酶的一个限制性位点或其可 包括用于多种限制性酶的多个限制性位点,从而有助于插入多个不同异源的核酸。本发明 的载体还可以包括异源核酸插入点下游的一个多腺苷序列。含有本发明启动子的载体还可 以含有用于细菌复制的原核DNA元件和用于载体在细菌细胞中生长和选择的抗生素选择 标记,以及一个控制转录过程的另外的DNA元件,如终止信号。载体可以进一步包含指导蛋 白质向细胞外分泌的DNA序列。在某些实施方案中,含有本发明的启动子序列的载体是双顺反子载体。设计成双 顺反子载体可以使两个核酸被转录而生成一个转录产物。此转录产物通常含有翻译成一个 蛋白的第一部分和翻译成另一个蛋白的第二部分。一个蛋白可以是兴趣蛋白,如治疗蛋白, 另一个蛋白可以被用作可供选择的标记。双顺反子载体通常含有一个启动子和一个内部 的核糖体进入位点或位于两个核酸间的IRES。这使得两个核酸转录为一个双顺反mRNA。在 这种方式下,可将载体构建成含有本发明的肌动蛋白启动子或其变种和在两个异源核 酸间的IRES。含有本发明的β -肌动蛋白启动子或其变种的双顺反子载体可被用于表达连 接报告基因的治疗蛋白,例如,酸性鞘磷脂酶或α-葡萄糖苷酶。本发明进一步提供了鉴定具有启动子活性的本发明的肌动蛋白和rpS21启动 子的变种的方法。例如,将本发明的启动子或其变种插入合适载体的报告基因的上游,并且 报告基因的表达,择确定启动子活性的鉴定。例如,为鉴定本发明的具有启动子活性的启 动子变种,则将此变种克隆到报告基因的上游。报告基因可以编码能催化产生视觉可辨别 信号的反应的酶。此种信号基因的例子包括半乳糖苷酶和荧光素酶。其他信号基因 的例子包括碱性磷酸酶、胭脂碱合成酶、章鱼碱合成酶、β “葡萄糖醛酸苷酶、氯霉素乙酰基 转移酶(chloremphenicol acetyltransferase)。在下列实施例中,编码海葵(Discosoma striata)红色荧光蛋白(RFP)的报告基因被用于检测启动子活性。然而,本领域技术人员可以使用任何适当的报告基因和分析技术检测启动子活性。可以在体外表达系统或细胞内 (如体内)分析启动子启动的报告基因的表达。本发明进一步提供了被含有可操作地连接到异源基因的启动子的本发明的载体 转染的宿主细胞。此宿主细胞可以是原核细胞或真核细胞。宿主细胞可以是培养的,也可以 是动物中的细胞。培养的宿主细胞的例子包括,但不局限于Hela细胞、CH0细胞、NSO、HEK 细胞、BHK细胞、NIH-3T3、MDCK细胞和COS细胞。如实施例中所述的,培养中的宿主细胞可 以悬浮或在微载体中生长。可以使用许多恰当的方法将本发明的核酸导入宿主细胞。含有本发明启动子序列 的载体可以被导入原核或真核细胞。可以将核酸导入真核细胞的技术的例子包括,例如,磷 酸钙沉淀、DEAE-右旋糖苷转染、电穿孔、脂质体介导的转染、应用病毒载体的转导等。可以用许多恰当的表达系统来生成使用本发明的启动子的蛋白质。一个此种表 达系统应用了二氢叶酸还原酶(DHFR)基因,该基因被导入含有可操作地连接到异源核酸 的本发明启动子或其变种的载体。可供选择地,如果使用DFHR缺陷细胞作表达,可将表达 DHFR的表达载体共同转染到宿主细胞。当增加甲氨蝶呤(MTX),一种主要的酶DHFR的竞争 性抑制剂的浓度被施加到转染细胞时,仅仅具DHFR较高表达水平的细胞存活。进一步增加 MTX水平时,仅仅那些DHFR基因的拷贝数增幅的细胞存活。在这种方式下,通过增加含启 动子的载体的拷贝数,可以增加异源核酸的表达,从而提高蛋白质产量。第二个表达系统使 用了谷氨酸合成酶(GS)基因,该基因被导入含有被可操作地连接到异源核酸的本发明的 启动子或其变种的载体中。使用另外GS的竞争性抑制剂,如,硫代甲硫氨酸(methionine sulphoximine) (MSX),以增加载体的拷贝数,实现增加的蛋白质产量。任何恰当的原核或真核表达系统可被用来表达应用本发明的启动子蛋白质。表达 系统的例子包括,但不局限于,植物、杆状病毒、酵母、细菌、果蝇、哺乳动物或无细胞(cell free)表达系统。例如,在Ausubel (1995),supra中提供了将表达载体导入哺乳动物、细菌、 酵母、昆虫和植物细胞的标准方法。在某些实施方案中,本发明的启动子及其变种被用于基因治疗的方法中。例如,本 发明的启动子及其变种被克隆到病毒或非病毒基因治疗载体中,使其被可操纵的连接到兴 趣基因上。当载体被运送到目的物,如人类病人时,启动子启动编码治疗蛋白的基因表达。以下实施例提供了本发明的说明性实施方案。本领域的普通技术人员将意识到在 不改变本发明的主旨和范围时,可进行多种修饰和改动。这些修饰和改动仍包括在本发明 的范围内。这些实施例不以任何方式限制本发明。实施例以下描述了实施例中所用的物质和方法A. CH0-K1细胞的培养CH0-K1 M Ifi JA American Type Culture Collection(Manassas, VA) (ATCC No. CRL-9618)获得。在 250ml 含有 15g/L DE-52 微载体(Whatman,Kent,UK)、和 10%供体 小牛血清(DCS) (Invitrogen)的925细胞培养基中旋转培养细胞。细胞在37°C下,使用 20-40% 02和5% C02、并在大约60rpm下晃动6天。细胞在血清存在下生长后,每天用不含 血清的925培养基更换80% (v/v)培养基。细胞在不含血清的培养基中生长11天后从细 胞中提取RNA。为了确定mRNA的半衰期,将7mg/L的放射菌素D加入不含血清相中。
B. RNA的提取和分析使用Promega (Madison, WI)的 RNAgents 试剂盒从 CH0-K1 细胞中分离 RNA。 用RNA印记法分析基因表达。为进行RNA印记分析,应用NorthernMax -Gly试剂盒 (Ambion, Ausein,TX)在变性的glycoxal/二甲基亚砜凝胶上电泳分离5ug RNA。而后将 RNA转到尼龙膜上(Schleiche & Schuell,Dassel,德国)。用通过PCR扩增的下述基因 探针杂交斑点半乳糖结合蛋白(Genbank 接收号No. M96676,核苷酸14-383) ; β-肌 动蛋白(Genbank 接收号 No. U20114,核苷酸 238-381) ;EF-I ( Genbank 接收号 No. D00522,核苷酸 7-192) ;rpS21( Genbank 接收号 No. X79059,核苷酸 68-340);铁蛋白 (Genbank 接收号No. M99692,核苷酸182-303)或商业上可购得的甘油醛-3-磷酸脱氢 酶(GAPDH)片段(Ambion,Austin, TX)。使用随机引物将每种PCR产物放射标记。用于扩 增每种基因的PCR引物在表一中列出。表1
基因引物序列SEQ ID NO β-肌动蛋白正向GCTCTTTCTTCGCCGCTCC8β-肌动蛋白反向ACCACCCTCCAGCCTTCCC9EF-I正向GAACGCAGGTGTTGTGAAAA10EF-I反向CTCGGCAGCCTCCTTCT11rpS21正向GTGGACCTGTACGTGC12rpS21反向TTCTCACTTTTATTTATGAC13铁蛋白正向CGCCAGAACTACCACCAGGAC14铁蛋白反向TTCAGAGCCACATCATCCCG15半乳糖结合蛋白正向TGGTCGCAAGCAACCTGAATC16半乳糖结合蛋白反向TTGAAGTCACCGTCTGCCGC17 C. CHO-Kl细胞的转染为了瞬时转染,CHO-Kl细胞被铺在含10%胎牛血清(FBS) (Invitrogen)的925培 养基的6孔培养平板中。在用Lipofectamine (Invitrogen)进行转染之前,细胞生长至 50-75%融合度。pDsRED-Ι质粒(Clontech, Palo Alto, CA)与编码用于鉴别转染细胞的 细胞表面⑶20标记的pSV40-⑶20质粒共同转染。pDsRED-Ι质粒编码海葵红色荧光蛋白 (RFP),可通过FASC检测其表达。根据厂家的说明书进行转染。简言之,细胞与脂质体-DNA 复合物在不含血清的Opti-MEM 培养基(Invitrogen)中孵育16小时。用含10% FBS的 925培养基替换该培养基,转染48小时后收集细胞。D.荧光活化细胞祧诜分析为进行FACS分析,用胰蛋白酶处理IXlO6个细胞,并用含2 % FBS的冷PBS冲 洗。随后用FITC标记的抗CD20抗体(Pharmingen,SanDiego, CA)在冰上孵育细胞30 分钟。然后用含2% FBS的冷PBS冲洗,并用Iml冷的PBS/2% FBS将细胞悬浮。使用 FACSCalibur (BDBiosciences, San Diego, CA)进行 FACS 分析。评估所有的 CD20 阳性物 的红色荧光蛋白的平均荧光强度,以分析启动子强度。E. ASM 分析将由编码酸性鞘磷脂酶(ASM)的载体转染的细胞的培养物在37°C下,与在250mM 的醋酸钠中,浓度为12. 5mM的合成底物2-(N-六癸酰基氨基)-4_硝基苯基磷酰基氯(Calbiochem, San Diego,CA)、pH5. 5、0,含有 1M 醋酸锌、0. 25mg/ml 的牛血清白蛋白(BSA) 和0. 15%的吐温20中孵育。通过加入含50%乙醇的0.2M的甘氨酸-氢氧化钠终止反应。 通过使用比色仪测量415nm下的光密度,测量所产生的2- (N-六癸酰基氨基)~4~硝基酚盐 的量来测定ASM的活性。F. GAA 分析将被编码a -葡萄糖苷酶(GAA)的载体转染的细胞培养基在37°C下,与在50mM的 醋酸钠中浓度为40mM的合成底物p-硝基苯基-D-a-吡喃葡萄糖酯(Sigma,St Louis,M0), pH4. 3,并含有0. 1 %的胎牛血清(BSA)中孵育。通过加入0. 3M的甘氨酸,pH10. 6终止反 应。通过使用比色仪测量400nm的光密度,测量所产生的p-硝基苯基的量来测定GAA的 活性或量。实验例1 :CH0-K1细胞中13 -肌动蛋白启动子的鉴别应用基因表达的系列分析(SAGE)分析在不含血清的完全覆盖旋转培养 (perfused spinner culture)上生长的CH0-K1细胞的完整的转录图谱。SAGE的第一步包括使用标准技术从分离的CH0-K1细胞mRNA中合成双链DNA。随 后用限制性内切酶Nlalll,又称锚定酶切断该cDNA,预期至少一次可切出最多的转录产 物。通过结合到链霉亲和素的磁珠而将每一个被切断的cDNA的3’部分分离。然后将cDNA 分成两部分,通过将其限制性位点锚定连接到含有II型限制性内切酶位点(例如,Fokl)的 连接物上。II型限制性内切酶在离其不对称的识别位点最多20个碱基对的指定位置切断。 II型酶典型地被称为标记酶。用标记酶切段连接物产物可以使连接物与短的cDNA片段被 释放出来。锚定和标记酶的联合使用可产生对于一个基因是唯一的10个碱基对的标记。应用这种方法,每个基因的标记序列可以用3’最多的Nlalll位点及其后的独特 的10bp的序列代表。在标记不能别指定到已知基因的例子中,可以使用SAGE标记和常用 是 M13 正向引物(GTTTTCCCAGTCACGAC, SEQ ID NO 18)对 SAGE 库的 cDNA 进行 PCR 扩增。 随后将PCR产物克隆到pCR2. 1载体(Irwitrogen),并用标准的技术测序。基因的鉴定是以 PCR产物的序列与GenB^mk (www. ncbi. nlm. nih. gov/genbank)中已知序列的同源性为 基础的。使核酸序列与小鼠和/或大鼠的相对物进行BLAST 比对(WWW. ncbi. nlm. nih. gov/blast)以确定标记来源的序列。在分析鉴定出来的16个最丰富标记中,(表2), 除一个标记外,其余的标记基因都被鉴定出来。在这15个被鉴定出来的基因中,5个是线粒 体来源,3个是核重复元件。在每个细胞中,这些基因有多重拷贝发生,可能是其在SAGE的 输出中丰富的原因。这些序列不能进行下一步的评估。表权利要求
一种选自SEQ ID NOs1、2、3的核苷酸序列的分离的啮齿动物β 肌动蛋白启动子或其具有启动子活性的变种。
2.—种SEQ ID NO :1中列出的分离的仓鼠β -肌动蛋白启动子核苷酸序列,或其具有 启动子活性的变种。
3.—种SEQ ID NO :2中列出的分离的大鼠β -肌动蛋白启动子核苷酸序列,或其具有 启动子活性的变种。
4.一种SEQ ID NO :3中列出的分离的小鼠β -肌动蛋白启动子核苷酸序列,或其具有 启动子活性的变种。
5.一个包括SEQ ID NO :1中列出的核苷酸序列的分离的核酸,或其具有启动子活性的 变种。
6.一个包括SEQ ID NO :2中列出的核苷酸序列的分离的核酸,或其具有启动子活性的 变种。
7.一个载体,其包括SEQ ID NO 1中的启动子,或其具有启动子活性的变种。
8.一个载体,其包括SEQ ID NO :2中的启动子,或其具有启动子活性的变种。
9.一个载体,其包括SEQ ID NO :3中的启动子,或其具有启动子活性的变种。
10.根据权利要求7-9的任何一项所述的载体,其中启动子被可操作地连接到异源核酸上。
全文摘要
本发明涉及新的β-肌动蛋白和核糖体蛋白S21(rpS21)启动子的分离及应用。特别地,本发明的特征为包括仓鼠、大鼠和小鼠的啮齿动物β-肌动蛋白启动子和仓鼠rpS21启动子的序列。
文档编号A61K48/00GK101942443SQ201010145628
公开日2011年1月12日 申请日期2004年6月24日 优先权日2003年6月24日
发明者S·D·埃斯蒂斯, W·张 申请人:建新公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1