基因启动子的制作方法

文档序号:412387阅读:771来源:国知局
专利名称:基因启动子的制作方法
技术领域
本发明涉及获得用于基因表达的启动子的方法以及新的基因启动子,尤其是来自真菌的启动子。
背景技术
启动子区对驱动和调节基因表达而言是必需的。这些DNA序列的延伸通常发现在基因开放阅读框架的上游。启动子中的关键遗传元件包含增强子位点、沉默子位点、上游活化子序列、转录因子结合位点和RNA聚合酶结合位点(例如,Lewin,B.,Genes V,牛津大学出版社,1994)。这些元件对指定生物体的外部环境作出应答从而根据生长条件调节基因表达。
强启动子对于高效基因表达是必需的。迄今为止所描述的最好的丝状真菌启动子包含里氏木霉纤维二糖水解酶1(cbh1)启动子(llmén,M.等人,1996,Mol.Gen.Genet.251,451-460)和Aspergillus niger var.awamori葡糖淀粉酶A启动子(Ward,M等人,1990.Bio/Technology8435-440)。然而,这两种启动子可由合适的碳源(例如,分别为纤维素和淀粉)诱导并可由葡萄糖(即,由代谢物阻遏调节)所抑制。迄今为止,还没有关于在效力上可与cbh1和glaA相比的天然的构成型或者对碳代谢物阻遏不敏感的启动子的描述。
所描述的启动子分离策略包含(i)利用启动子探针载体,其中基因组DNA片段随机地克隆在一报告基因的前面,所述报告基因只在克隆的片段具有启动子活性时才表达(例如,Neve等人,1979.Nature277324-325);(ii)从基因文库利用基于基因特异性探针(例如,Vanhanen,S.等人,1989.Curr.Genet.15181-186)或者从氨基酸顺序推导出的核酸序列的杂交分离基因及其启动子;(iii)用诱导型和非诱导型cDNA探针对基因文库进行差异杂交(例如,Teeri等人,1983.Bio/Technology 1696-699)。
本发明运用称作蛋白质组显示技术的新策略用于基因启动子的分离。这不同于诸如上面列举的基于核酸的策略。蛋白质组分析一般涉及在样品中根据它们的等电点和分子量分离蛋白(2-向凝胶电泳,2-DE)。然后对凝胶染色观察蛋白斑点并可印迹到适当的膜上用于进一步的处理。2-DE技术能够在复杂混合物中分离数百种蛋白(O′Farrell,P.H.,等,1975.J.Biol.Chem.2504007-4021)并检测在给定培养条件下(例如,根据碳源)生长的生物体内高水平表达的蛋白。蛋白质组显示的蛋白斑点强度的不同反映它们的表达水平。因此,检测到强表达的蛋白显示启动编码具体蛋白基因的强启动子的存在。可以切下强表达的蛋白斑点并通过质谱进行分析(Verrils,N.M.,等,2000.Electrophoresis 213810-3822)。为了从尤其强表达的基因(蛋白)分离启动子,获得的氨基酸顺序可用来设计染色体步移PCR的寡核苷酸引物(Morris,D.等人,1995.Appl.Environ.Microbiol.612262-2269)。蛋白鉴定包括将获得的肽和/或氨基酸顺序与例如万维网上(WWW.)的有效数据库进行比较。然而,强表达蛋白的鉴定对于分离启动其表达的启动子不是必需的。
hex1基因编码真菌沃鲁宁体的一六边形(HEX1)蛋白并且对于丝状真菌而言是特异性的(Tenney,K等人,2000.Fungal.Genet.Biol.31205-217)。通过2-向凝胶电泳,HEX1蛋白被鉴定为从里氏木霉培养物中制备的细胞壁提取物中的一种主要蛋白,所述里氏木霉培养物生长在纤维二糖-乳糖-大豆提取物培养基上或者以葡萄糖作为碳源(Lim等,2001.Proteomics 1899-910)。因此,基于蛋白质组显示的hex1基因启动子的鉴定和分离提供了利用未必受到碳代谢物阻遏影响的启动子用于启动子分离和基因表达的新策略。
本发明的发明者目前已经设计了获得或检测基因新启动子的方法。
发明概述在第一方面,本发明提供了从生物体检测或获得基因启动子的方法,所述方法包括(a)在期望的条件下获得一种或者多种由生物体产生的蛋白;(b)获得蛋白的氨基酸序列数据;(c)基于获得的蛋白氨基酸序列制备一种或者多种寡核苷酸;(d)用一种或者多种寡核苷酸处理生物体的基因组或染色体DNA以获得编码蛋白及其调节区的基因组或染色体DNA;以及(e)对获得的基因组或染色体DNA测序以检测或获得编码蛋白的基因的启动子。
优选地,生物体为诸如细菌、酵母、真菌或丝状真菌的微生物。然而应该理解生物体可以为获得自诸如包含人的动物以及植物的高等生物体的任意细胞类型。
优选地通过在期望的条件下分离由生物体产生的蛋白进行步骤(a)从而提供蛋白质组显示。
当从例如微生物获得启动子时,需要在可以诱导一种或者多种蛋白表达的条件下培养生物体。这种诱导可以是诸如碳源的养分的供应或诸如加热、pH、养分不足等的环境条件。培养后,由微生物产生的蛋白可以通过诸如双向聚丙烯酰胺凝胶电泳(2-D PAGE)的任意合适的方法进行分离。可以分离目的蛋白并通过已知的测序方法从蛋白的肽片段获得氨基酸序列数据。一旦已经确定了肽信息,可以制备可与编码蛋白的基因的互补DNA序列杂交的寡核苷酸探针。为了获得编码基因的DNA及其启动子(调节区),用寡核苷酸利用例如基因组步移PCR处理来自生物体的基因组或染色体DNA。一旦获得了编码基因的DNA,可以进行DNA的测序以提供关于基因启动子和终止子区的信息。
获得新基因的标准方法就是使用cDNA作为遗传物质的来源。同样通过本领域目前常用的标准方法使用cDNA,就不能获得基因启动子,因为cDNA不包含调节信息或序列。相反,如果通过本发明的方法使用基因组或染色体DNA可以获得更多信息以及包含启动子的有用序列。
第二方面,本发明提供了根据本发明的第一个方面的方法获得的一分离的启动子。
本发明的方法已经用于获得可以促进真菌细胞中转录的一新真菌启动子(作为称作hex1的基因的一部分)。因此,本发明的启动子可用于表达真菌中的异源基因或其它核酸序列。
因此,本发明的第三方面提供了来自丝状真菌的一分离的hex1启动子。
优选地,启动子源于选自Ophiostoma、木霉、曲霉、青霉、Topylocladium、镰刀菌、金孢霉菌、Magnaporthe、脉孢菌、麦角菌、小球壳菌、Collectotrichum、黑粉菌、Podospora以及毛霉的真菌种。
在第四方面,本发明提供了一分离的真菌启动子,所述启动子具有基本上如图2所示的核酸序列(SEQ ID NO1),和/或优选地在严格条件下与图2的序列(SEQ ID NO1)杂交的序列。
应该认识到即使HEX1蛋白可能显示出相当量的同源性,也根本不能保证启动子区共有显著的同源性。因此,HEX1蛋白的比对可用作从其它微生物来源获得类似的或功能等效启动子的起点。
在一优选的方式中,分离的启动子包括真菌hex1基因启动子的DNA序列,其中DNA序列选自图2(SEQ ID NO1)列出的序列或图2(SEQ ID NO1)的部分序列,其足以控制目的基因的表达;或具有优选地在严格条件下将与图2序列(SEQ ID NO1)杂交并且其能够控制目的基因表达的序列的核苷酸分子。
在一种方式中,在高度严格的杂交条件下核苷酸分子与图2的序列(SEQ ID NO1)杂交。
优选地,真菌启动子序列可以启动真菌细胞中异源基因的表达。来自里氏木霉的hex1基因的全序列显示在图3(SEQ ID NO2;SEQ IDNO3)中。
本发明还特征描述了一分离的核酸,所述具有在严格条件下与图2(SEQ ID NO1)杂交或与图2的序列(SEQ ID NO1)具有至少70%(至少80、90、95或99%)同一性的序列。图2中显示的启动子序列(SEQ ID NO1)当可操作性的连接到开放阅读框架时能够启动真菌细胞中的转录。图2的启动子序列(SEQ ID NO1)为如图3(SEQ IDNO2;SEQ ID NO3)所示的hex1基因开放阅读框架上游的启动子部分。
第五方面,本发明提供了一载体或转化的细胞,其包括一分离的核酸形成根据本发明的方法获得的启动子。载体包含核酸载体,诸如表达质粒或病毒载体。
本发明的启动子序列可以被导入多种表达载体中用于在包含真菌细胞的细胞中表达外源蛋白。这样的外源蛋白包含水解酶诸如植酸酶、纤维素霉、木聚糖酶、β-葡聚糖酶、淀粉酶、脂肪酶和蛋白酶以及治疗/药用上重要的分子,诸如抗体、人生长因子、组织纤溶酶原激活物或任何其它具有商业价值的多肽。更具体地说,新启动子序列和可以与其操作性连接的开放阅读框架可以整合到基因组中产生表达上述列举的酶和治疗因子的转基因细胞。将核酸转入细胞的方法不管是用于瞬时或稳定的表达都是分子生物学领域所公知的。
在第六方面,本发明提供了一重组DNA构建体包括本发明的第二、第三或第四方面的可操作性连接到目的基因的启动子。
优选地,目的基因选自为了特定特征的合适来源。合适的来源可以为具有某些代谢或功能活性的目的微生物,所述代谢或功能活性可用于商业或有用的用途。
第七方面,本发明提供了包括本发明第六方面的构建体的表达系统。
表达系统为本领域所公知并包含诸如微生物的细胞,所述微生物包含能够在启动子的控制下表达基因的构建体。
第八方面,本发明提供了根据本发明启动子在控制基因表达中的应用。
在整个说明书中,除非上下文需要否则术语“包括”,或诸如“包括”或“包括”的分词或者动名词形式的改变应该理解为暗示包含一所述的元件,整体或分步或元件组、整体或分步,然而并非排除任意其它元件、整体或分步或元件组、整体或分步。
已经包括在本发明说明书中的文献、作用、材料、装置、物品等等只为本发明提供背景的目的。不能允许的是,任何或者所有这些物质形成部分现有技术的基础或者是与本发明有关领域中的常识,因为它在本申请的每一权利要求的优先权日以前的澳大利亚存在。
为了更清楚的理解本发明,将参考下列附图和实施例描述优选的形式。


图1显示了采用hex1启动子的基因表达盒。利用质粒pUC19作为在大肠杆菌中复制的载体构建盒中的DNA片段。A.具有连接或者融合到信号序列的目的基因的基本表达载体。B.利用荧光dsRed1-E5作为报告基因试验hex1基因启动子效力的表达载体。C.具有连接或者融合到转化标记上的基因的表达载体。突出特征包含由P代表的hex1基因启动子,分泌信号序列,SS,溶解蛋白的Kex2-类切割位点,RQ,选择性标记基因,M(例如,荧光或抗生素),以及由T表示的hex1基因终止子。限制性内切酶位点的位置显示为X。
图2显示了根据本发明从里氏木霉分离的hex1启动子的核苷酸序列。(SEQ ID NO1)图3显示了里氏木霉hex1基因序列的“公开”形式(GCG,WisconsinPackage Version 8.1)。粗体和画线部分强调的是针对mRNA翻译的核糖体结合位点重要的可能Kozak序列(Kozak,M.1987.Nucleic AcidsRes 158125-8148)。较短的内含子序列显示为小写字体。两个共有序列(code hop)引物(hex1fwd和hex1rev)的位置用箭头表示。(SEQID NO2为DNA序列,SEQ ID NO3为氨基酸序列)。
图4显示了表示在hex1启动子控制下异源基因表达的Northern印迹。Northern印迹用DsRed1-E5 DNA进行探测。A,非转化体;T,包含里氏木霉hex1启动子控制下的DsRed1-E5基因的转化体。培养物在含有纤维二糖、乳糖和大豆水解物的培养基(CLS)中生长54小时。
图5显示了在不同培养基中hex1表达的Northern印迹。用hex1探测Northern印迹。A,非转化体。T1和T24,包含在hex1启动子控制下的DsRed1-E5基因的转化体。在CLS或葡萄糖(GLU)培养基中培养物生长54小时。
实施本发明的方式定义根据在高度严格条件下能够杂交或与本发明使用的核酸分子具有高度同源性的等价序列,“在高度严格条件下的杂交”可与本领域公知的术语“严格杂交条件”的含义一样;例如参见Sambrook的“分子克隆实验指南”第二版,CSH Press Cold Spring Harbor,1989;“核酸杂交(Nucleic Acid Hybridisation),A Practical Approach”,Hames和Higgins编辑,IRL Press,Oxford,1985;二者都在此处引入作为参考。根据可用于本发明应用中的核酸分子和多肽,核酸分子和多肽优选与在这里公开或描述的序列和其在这里公开或描述的片段(包含以下描述的子序列)具有至少约84到85%或更大的同源性或同一性,诸如至少约85%或约86%或约87%或约88%或约89%的同源性或同一性,例如至少约90%的同源性或同一性或更大,诸如至少约91%,或约92%,或约93%,或约94%的同一性或同源性,更优选地至少约95%到99%的同源或同一性或更大,诸如至少约95%的同源性或同一性或更大,至少约96%,或约97%,或约98%,或约99%,乃至约100%的同一性或同源性,或从约84到约100%或从约90到约99或约100%或从约95到约99或约100%的同一性或同源性。
可利用Myers和Miller的“比对”程序(“Optimal Alignments inLinear Space”CABIOS 4,11-17,1988,此处引入作为参考)确定核苷酸序列的同源性。另外地或其它地,例如根据核苷酸或氨基酸序列,术语“同源性”或“同一性”可显示两个序列之间同源性的定量测定。百分比序列同源性可计算为(N.sub.ref-N.sub.dif)*100/N.sub.ref,其中N.sub.dif为比对时两个序列中非相同残基的总数并且其中N.sub.ref为在序列之一残基的数目。因此,例如DNA序列AGTCAGTC将与序列AATCAATC具有75%的序列相似性(N.sub.ref=8;N.sub.dif=2)。
另外或其它地,序列的“同源性”或“同一性”可指具有相同核苷酸或氨基酸的位置的数目除以较短的两个序列中的核苷酸或氨基酸的数目,其中两个序列的比对可以根据Wilbur和Lipman算法(Wilbur和Lipman,1983 PNAS USA 80726,此处引入作为参考)进行确定。例如,利用20个核苷酸的窗口尺寸,4个核苷酸的字码长度,和4的缺口处罚,以及包含比对的序列数据的计算机辅助的分析和说明可利用市售程序(California)方便地进行。当RNA序列被认为是与DNA序列相似或具有一定程度的序列同一性或同源性时,DNA序列中的胸苷(T)被认为是相当于RNA序列中的尿嘧啶(U)。本发明范围内的RNA序列可来源于DNA序列,DNA序列中的胸苷(T)可以被认为相当于RNA序列中的尿嘧啶(U)。
另外或者其它地,氨基酸序列的相似性或同一性或同源性可以利用BlastP程序(Altschul等,Nucl.Acids Res.25,3389-3402,此处引入作为参考)进行确定。下列参考文献(每个都在此处引入作为参考)还提供了用于比较两种蛋白的氨基酸残基的相对同一性或同源性的算法,另外或者其它地这些参考文献中的教导可被用于确定百分比同源性或同一性Needleman S B以及Wunsch C D,“适用于寻找两种蛋白的氨基酸序列中类似性的一般方法”J.Mol.Biol.48444-453(1970);Smith T F和Waterman M S,“生物序列的比较(Comparison of Bio-sequences)Advances in Applied Mathematics 2482-489(1981);Smith T,Waterman M S以及Sadler J R,“核酸序列功能域的统计鉴定,NucleicAcids Res,112205-2220(1983);Feng D F和Dolittle R F,“进化序列比对作为校准系统发生树的先决条件(Progressive sequence alignmentas a prerequisite to correct phylogenetic trees)”J.of Mol.Evol.,25351-360(1987);Higgins D G和Sharp P M,″在微机上快速灵敏的多序列比对(Fast and sensitive multiple sequence alignment on a microcomputer,)″CABIOS,5151-153(1989);Thompson J D,Higgins D G和Gibson T J,″ClusterW通过序列权重、位点特异性缺口罚分以及重量矩阵选择提高进化多序列比对所灵敏度(ClusterWimproving the sensitivity ofprogressive multiple sequence alignment through sequence weighing,positions-specific gap penalties and weight matrix choice,)Nucleic AcidRes.,224673-480(1994);以及Devereux J,Haeberlie P和Smithies O,“A comprehensive set of sequence analysis program for the VAX,,”Nucl.Acids Res.,12387-395(1984)。
公开的核酸序列或其部分或片段,包括至少约12个核苷酸长度,例如至少约15,约18,约21,约24或约27个核苷酸长度,诸如至少约30,约33,约36,约39或约42个核苷酸长度的子序列,例如,一至少约12个核苷酸长度诸如约12到约30,约12到约50或约12到约60,或约12到约75或约12到约100或者更多氨基酸长度的核酸分子可作为探针或引物用于杂交。本发明进一步包括微生物,包含和/或表达这种核酸分子的载体或质粒。同样地,一核酸分子可编码一抗原决定簇或一抗原决定簇区或多肽,其功能等效于由序列表达的多肽,这种核酸分子可在体外或者体内表达,或用于扩增或检测限定的基因或者其同源物以及这种载体在新组合物中的应用。
当然,用于杂交的核酸可通过结合或连接放射性的或其它可检测的标记方便地进行标记。这种标记为本领域技术人员所公知。所述核酸分子的标记可受传统方法的影响。在启动子控制下的启动子或基因的存在或表达可通过利用特异性杂交于任一相应核酸序列的引物对以及通过根据标准方法实施聚合酶链式反应(PCR)进行监控。探针或引物的特异性杂交优选地发生在严格杂交条件下。探针或引物可为限定的核酸分子中特异性的至少8个,优选地至少10,更优选地至少12,13,14,或15,诸如至少20,至少23或25,例如至少27或30个核苷酸的一段序列。至于PCR或杂交引物或探针及其最适长度参考Kajimura等的GATA 7(4)71-79(1990),此处引入作为参考。
而且,在本发明启动子控制下的核酸分子的表达可用于产生抗体用来检测样品中或样本中蛋白(或其抗原)的存在或者缺失;或者,表达的多肽可用于检测样品或样本中蛋白的抗体的存在或者缺失。因此,核酸分子及其表达产物具有诊断用途。
“多肽”是指任意链长的氨基酸,不管其长度或者翻译后的修饰(糖基化作用或者磷酸化作用)。
“基本上同一的”是指显示出与参考氨基酸或者核酸序列具有至少50%,优选地85%,更优选地90%以及最优选地95%同源性的多肽或者核酸。对于多肽而言,比较序列的长度通常为至少16个氨基酸,优选地至少20个氨基酸,更优选地至少25个氨基酸,最优选地35个氨基酸。对于核酸而言,比较序列的长度通常为至少50个核苷酸,优选地至少60个核苷酸,更优选地至少75个核苷酸以及最优选地110个核苷酸。
通常利用序列分析软件(Sequence Analysis Software Package of theGenetics Computer Group,University of Wisconsin BiotechnologyCenter,1710 University Avenue,Madison,Wis.53705)测定序列同一性。这种软件通过将同源性的程度分配到各种置换、删除、取代及其它修改中对比类似序列。保守取代一般包含在下列基团内的取代甘氨酸、丙氨酸;缬氨酸、异亮氨酸、亮氨酸;天冬氨酸、谷氨酸、天门冬酰胺、谷氨酰胺;丝氨酸、苏氨酸;赖氨酸、精氨酸;以及苯丙氨酸、酪氨酸。
“基本上纯的多肽”是指已经与天然伴生组分分离的任意多肽。一般地,当其按重量计算至少60%不含蛋白以及与其天然连接的天然存在有机分子时,多肽基本上就是纯的。优选地,制备物按重量计算至少为75%,更优选地至少为90%,以及最优选地至少为99%。基本上纯的多肽可以例如通过从天然来源(诸如细胞)提取;通过表达编码多肽的重组核酸;或者通过化学合成蛋白获得。纯度可以通过任意诸如描述在柱层析、聚丙烯酰胺凝胶电泳或者通过HPLC分析中合适的方法进行测定。
当蛋白分离自天然状态伴生的那些杂质时蛋白基本上不含天伴生组分。因此,化学合成或者在不同于天然来源细胞的细胞系统中产生的蛋白将基本上不含其天然伴生组分。因此,基本纯的多肽包含那些来源于真核生物但在大肠杆菌或者其它原核生物中合成的多肽。
“基本上纯的DNA”是指在本发明的DNA所来源的生物体天然存在基因组中不含侧翼基因的DNA。因此术语包含例如,整合到载体中;整合到自主复制质粒或者病毒中;或者整合到原核生物或者真核生物的基因组DNA中;或者作为独立于其它序列的分离分子(由PCR或者限制性核酸内切酶酶切产生的cDNA或者基因组或者cDNA片段)的重组DNA。它还包含作为编码其它多肽序列的部分杂交基因的重组DNA。
“转化的细胞”是指通过重组DNA技术向其中(或者向其祖细胞)导入在本发明的启动子控制下编码一给定多肽的DNA分子的细胞。
“表达定位”是指DNA分子定位在一限定启动子的DNA序列的相邻位置,所述启动子指导序列的转录和翻译(即,促进多肽,一重组蛋白质或者一RNA分子的产生)。
“报告基因”是指其表达可被分析的基因;这种基因包括但不限于β-葡糖醛酸酶(GUS),荧光素酶,氯霉素乙酰转移酶(CAT)以及β-半乳糖苷酶。
“启动子”是指足以指导转录的最小序列。本发明还包括足以提供细胞类型特异性,组织特异性可控制的或者可由外部信号或者因子诱导的启动子依赖的基因表达的那些启动子元件;这种元件可能位于天然基因的5′或者3′区。
“可操作性的连接”是指基因以及调节序列以使当合适的分子(转录激活蛋白)结合到调节序列时基因表达的方式连接。
“植物细胞”是指任意由半透膜限定并且包含质粒的自体繁殖细胞。如果期望进一步的繁殖这种细胞还需要细胞壁。如果没有限制,这里应用的植物细胞包含藻类、蓝细菌、种子悬浮培养物、胚、分生组织区、愈伤组织、叶子、根、枝条、配子体、孢子体、花粉以及小孢子。
“转基因”是指通过操作插入细胞内变成生物体基因组一部分的任意DNA的片断,所述生物体从所述细胞发育而来。这种转基因可以包含部分或者完全与转基因生物体异源(即,外来)的基因,或者可以表示与生物体的内源基因同源的基因。
“转基因的”是指包括通过操作插入细胞内变成生物体基因组一部分的DNA序列的任意细胞,所述生物体从所述细胞发育而来。本发明使用的转基因生物一般为转基因真菌,并且DNA(转基因)通过操作插入核内或者质粒基因组内。
“保守区”是指在两个或多个hex1家族成员之间表现出至少30%、优选50%、以及最优选70%氨基酸序列同一性的六个或者以上临近氨基酸的序列。
“可检测地标记”是指标记以及鉴定分子、寡核苷酸探针或者引物、基因或者其片段或者cDNA分子存在的任意手段。可检测地标记分子的方法是本领域技术人员所公知的并且包括但不限于放射性标记(用诸如32P或者35S的同位素)以及非放射性标记(诸如化学发光标记或者荧光标记)。
“biolistic转化”是指利用速度驱动的微粒诸如钨或者金颗粒将外源分子导入细胞的任意方法。这种速度-驱动的方法来源于压力脉冲包含但不限于,氦驱动、气动以及火药驱动技术。Biolistic转化可应用于多种细胞类型以及完整组织的转化或者转染,所述细胞和组织包含但不限于胞内细胞器(叶绿体以及线粒体)、细菌、酵母、真菌、藻类、花粉、动物组织、植物组织(叶子、幼苗、胚胎、表皮、花、分生组织以及根)、花粉以及培养的细胞。
“纯化的抗体”是指抗体按重量计算至少60%不含天然与其伴生的蛋白以及天然存在的有机分子。优选地,制备物按重量计算至少为75%,更优选地至少90%,以及最优选地至少99%为抗体。纯化的抗体可以通过例如采用重组产生蛋白或者保守基序肽以及标准技术的亲和层析获得。
“特异性结合”是指抗体识别并结合一蛋白但是其基本上不识别并结合天然包含rps蛋白的样品中,生物样品中的其它分子。
材料和方法从里氏木霉分离hex1启动子通过2-向凝胶电泳(Lim等,2001,Proteomics 1899-910),HEX1蛋白被鉴定为从里氏木霉培养物中制备的细胞壁提取物中的一种强表达蛋白,所述里氏木霉培养物生长在纤维二糖-乳糖-大豆提取物培养基上或者以葡萄糖作为碳源。利用染色体步移PCR法(Morris等,1985.Appl.Environ.Microbiol.612262-2269)从里氏木霉的基因组DNA分离真菌hex1基因启动子。最初,两个共有序列(code hop)引物(hex1fwd.pr5′-ACA TCT TCC AAA ATG GGN TAY TAY GA-3’和hex1rev.pr5′-ACG GGG CCG CAC ATN GTY TGN AC-3′)基于翻译来自HEX1肽序列的比对的保守氨基酸序列的核苷酸进行设计(Lim等人,2001.Proteomics 1899-910;Jedd和Chua,2000.Nature CellBiology 2226-231)。采用下列条件进行PCR扩增[1x] 94℃,10分钟[5x]94℃,30s;40℃,30s ;72℃,30s[35x]94℃,30s;50℃,30s;72℃,30s。一个单位地热激活Amplitaq Gold聚合酶(Perkin和Elmer,USA)用于50μl的PCR反应物中,所述PCR反应物包含下列成分的两种引物各100ng,3mM MgCl2,12.5mM dNTP’s和约10ng的靶真菌基因组DNA。
利用如上所述的两种共有序列引物获得约600bp的PCR产物,并利用澳大利亚Macquarie大学的ABI 377测序设备进行测序。根据600bp的hex1序列设计新的5′-和3′-染色体步移引物并用于PCR反应获得重叠的hex1基因片段。设计其它引物并用于获得上游和下游DNA片段直到扩增并测序所有的hex1基因编码区以及充分的启动子和终止子区的DNA片段。如Morris等,1985 Appl.Appl.Environ.Microbiol.612262-2269所述首先制备里氏木霉的基因组DNA连接体文库,在利用具有合适接头引物的正向或者反向染色体步移引物的组合进行基因组步移PCR反应之前进行。采用的PCR条件如下[1X]94℃,10分钟[40X]94℃,30s;60-65℃,30s;72℃,4-5分钟。如上所述的PCR成分也用于染色体步移PCR反应中。
HEX1蛋白序列在丝状真菌中高度保守,能够用来利用类似于用于木霉描述的方法从其它丝状真菌(诸如这里列举的)分离hex1基因启动子。
从这个操作实施例应该认识到其它基因的启动子可以利用本发明的方法进行检测。利用设计用于获得里氏木霉hex1基因的引物,本发明的发明者已经确定来自Ophiostoma floccosum的hex1基因具有约747bp的共有序列DNA区。获得了O.floccosum的基因组DNA,就有可能从这种生物体分离Hex1启动子。
构建基因表达和产物分泌的质粒可构建质粒从而在hex1启动子控制下表达任意所选择的基因或者核酸。为了在分离的hex1启动子控制下克隆特定目的基因,应该添加多克隆位点。载体也包含在表达宿主中起作用的适当的选择标记。还包括足够的hex1侧翼DNA片段,如果合适的话可以促进其整合在同源基因组位点。可结合特异性限制性位点以便在分离线性表示DNA片段并转化到真菌宿主之前首先进行pUC19载体部分的切除。还将包含用于蛋白分泌的合适信号。分泌信号可能与目标基因产物同源或者异源。这种信号可以获得自例如编码Ophiostoma蛋白酶和脂肪酶以及里氏木霉cbh1或者获得自任意高水平分泌或者产生真菌蛋白的基因。表达盒可具有通过信号肽酶正确裂解信号肽从而产生分泌在培养基以外的目标蛋白的序列。转化后,筛选产生的转化体分离产生最高产率目标基因产物的转化体并进行详细分析。应该知道这种筛选是本领域技术人员公知的例行测试。
在hex1启动子的控制下表达异源DsRed1-E5蛋白将克隆的hex1启动子连接到编码DsRed1-E5(Clontech)的基因上。这就提供了在hex1启动子控制下表达的异源蛋白的例子,并可应用于例如在不同的生长培养基(例如,葡萄糖、乳糖、纤维素)中进一步试验hex1启动子的功能。DsRed1-E5为一红色荧光蛋白DsRed1的突变体(Terskikh等,2000.Science 2901585-1588),其荧光强度增强并在其成熟后导致蛋白的荧光从绿色变为红色。转化体显示出的荧光的水平或强度将提供DsRed1-E5蛋白分泌量的良好显示。在SDS-PAGE凝胶上进一步分析培养物上清液。通过利用DsRed1-E5作为报告蛋白也可以使在不同启动子之间进行比较成为可能。最终,希望表达在宿主中的目标基因可以如图1所示表达为与DsRed1-E5的融合蛋白。
图1显示了采用hex1启动子的基因表达盒。利用质粒pUC19作为在大肠杆菌中复制的载体构建盒中的DNA片段。A.具有连接或者融合到信号顺序上的目的基因的基本表达载体。B.利用荧光dsRed1-E5作为报告基因试验hex1基因启动子效力的表达载体。C.具有连接或者融合到转化标记上的目的基因的表达载体。强调的特征包含由P代表的hex1基因启动子,分泌信号序列,SS,蛋白水解的Kex2-类切割位点,RQ,选择性标记基因,M(例如,荧光或抗生素),以及由T表示的hex1基因终止子。限制酶位点的位置显示为X。
hex1基因及其启动子的特征鉴定利用染色体步移PCR从里氏木霉分离具有5’和3’侧翼区的hex1基因序列显示在图3中。在全部六种可能开放阅读框架中4376bp核苷酸序列的氨基酸翻译显示对应于2479位点的HEX1起始甲硫氨酸(ATG)并终止于3262位点处终止密码子(TAA)的784bp的开放阅读框架。一短的内含子序列存在于2503和2612位点之间很好的对应于预测的共有拼接序列(例如,Ballance,D.J.,1986.Yeast 2229-236)。启动子区的详细分析显示ATG的上游没有明显的‘TATA’类盒。同样,没有检测到类似原核的核糖体结合位点序列(5’-AGGAGGACAGCUAUG-3)。然而,紧接着上游并包含起始ATG的可能的核醣体结合位点符合真核生物起始位点的共有序列,也称作Kozak序列(5′-A/GCCACCAUGG-3′)。
图3显示里氏木霉hex1基因序列的“公开”形式(GCG,WisconsinPackage Version 8.1)。粗体和画线部分强调的是对于指导mRNA翻译的核糖体结合位点重要的可能Kozak序列(Kozak,M.1987.NucleicAcids Res 158125-8148)。较短的内含子序列显示为小写字体。两个共有序列(code hop)引物(hex1fwd和hex1rev)的位置用箭头表示。
hex1基因终止子区(3263到4376)的分析显示几个通过形成回环、中止RNA聚合酶II进一步转录促进转录终止的理想的反向重复(回文序列)序列(例如,Lewin,B.,Genes V,牛津大学出版社,1994)。一个实例为序列-CCCCATG-(位于3368到3374)具有在3726到3720位点处发现的-GGGGTAC-的完全回文序列(图3)。
已经进行了来自很多生物体的HEX1肽序列的比对,显示在它们之间的很多保守的氨基酸。蛋白水平的同源性使通过染色体步移PCR从很多丝状真菌分离hex1启动子成为可能。
详细的肽分析显示来自里氏木霉的HEX1具有225氨基酸的长度,具有期望的25207分子量以及7.09的等电点。在来自里氏木霉的HEX1和其它提交给基因文库的其它HEX1之间发现高水平的氨基酸同源性。
图2显示了从里氏木霉分离的HEX1蛋白启动子的核苷酸序列。
从Ophiostoma floccosum分离hex1基因共有序列DNA片段在PCR扩增反应中利用Hot Star Tag DNA聚合酶(QIAGEN,德国)利用两个共有序列(code hop)引物(hex1fwd.pr5’-ACA TCT TCCAAA ATG GGN TAY TAY GA-3’以及hex1rev.pr5’-ACG GGG CCGCAC ATN GTY TGN AC-3’)从Ophiostoma floccosum(J3301菌株)扩增747bp长的DNA片段。采用的PCR条件为[1x]95℃,15分钟[5x]95℃,30s;40℃,30s;72℃,30s[35x]95℃,30s;50℃,30s;72℃,30s。50μl的PCR反应物包含0.25单位的聚合酶以及100ng的每一引物,1.5mM的MgCl2,12.5mM的dNTPs以及约10ng的靶O.floccosum基因组DNA。用凝胶(QIAGEN,Germany)纯化747bp的DNA片段并利用澳大利亚Macquarie大学的ABI 377测序设备进行测序。
总RNA的分离以及mRNA的Northern分析Trizol方法(Invitrogen,USA)用来从生长在基本培养基(Gene.61155-164)的培养物取出的菌丝体提取总RNA,所述培养基添加了2%的葡萄糖以及1%的纤维二糖,1%的乳糖以及3%的大豆水解产物作为碳源。用乙二醛以及二甲亚砜使总RNA变性并如Sambrook等,1989.分子克隆实验指南,第二版Cold Spring Harbor,Laboratories Press,NY描述的进行电泳。电泳后,利用Biorad真空印迹装置(BioRad,USA)根据厂商的说明书将RNA转移到Hybond阳电荷膜(Roche,德国)上。
通过利用PCR DIG标记混合物(Roche,德国)的PCR产生DNA杂交探针。扩增240bp DsRed1-E5 DNA探针的引物为dsredprobe.fwdpr5’-CCA CCG AGC GCC TGT ACC-3’以及dsredprobe.revpr5’-CTACAG GAA CAG GTG GTG-3’。用引物hexprobe2.fwdpr5’-CCT CAAGCA CGG CGT CGC C-3’和hexprobe2.revpr5’-CCT TCA TCT CAACAG CGA GC-3’产生615bp的hex1 DNA探针。PCR的条件如下[1x]94℃,10分钟[35x]94℃,30s;50℃ 30s;72℃ 30s[1x]72℃,5分钟。1单位热激活的Amplitaq Gold聚合酶(Perkin和Elmer,USA)用于包含下列组分的50μl PCR反应物中~10ng的靶DNA,100ng的每种引物,3mM的MgCl2,1x DIG标记的dNTP’s。根据厂商提供的说明书利用核酸的DIG荧光检测试剂盒(Roche,德国)检测基因特异性mRNAs。在55℃的温度下用两种基因DNA探针进行过夜杂交检测DsRed1-E5的信使RNA并在60℃检测hex1。
总结总体来说,目前缺少可用于表达目标同源以及异源基因产物的高效真菌基因启动子。用于重组体表达的基因启动子大致可以分成两类,诱导型以及组成型的。在最强的诱导型启动子中,由碳代谢物阻遏调节的为Aspergillus niger var.awamori葡糖淀粉酶A启动子(glaA)(Ward,M.等人,1990.Bio/Technology 8435-440)和里氏木霉纤维二糖水解酶1(cbh1)启动子(Ilmén,M.等人,1996,Mol.Gen.Genet.251,451-460)。贯穿真菌种采用的组成型启动子为A.nidulans甘油醛-3-磷酸脱氢酶gpdA(Punt等,1991.J Biotechnol 1719-34)。迄今为止,还没有关于在效力上可与cbh1和glaA相比的天然构成型或者对碳代谢物阻遏不敏感的启动子的描述。
本发明的发明者已经显示2-D蛋白质组显示可用于鉴定诸如里氏木霉hex1启动子的启动子,所述启动子在诸如调解代谢物阻遏的葡萄糖培养基上的特定环境下具有很强的功能。hex1基因启动子也在促进cbh1(参见显示在葡萄糖以及CLS上hex1表达的图4以及图5)诱导的条件下发挥功能。正如hex1启动子在异源基因表达的应用中所述,本发明的发明者已经证明来自海葵的DsRed-51基因在hex1启动子控制下的表达(参见图5)。总之,hex1启动子提供了用于基因表达的多种选择并且促进了真菌表达系统的适应性。根据本发明用于启动子分离的2-D策略可被用于任意的真菌(或者任何其它生物体)以及适合于产生特定目标基因产物的任意培养条件。
本领域技术人员应该认识到只要不背离如上广泛描述的本发明的精神或者范围,如具体实施方案所述可以对本发明进行多种改变和/或修改。因此本发明的实施方案在各个方面被认为是说明性而非限制性的。
序列表<110>麦考里大学(Macquarie University)<120>基因启动子(Gene Promoters)<130>SCT042990-47<160>3<170>PatentIn version 3.1<210>1<211>2481<212>DNA<213>里氏木霉(Trichoderma reesei)<400>1gctaagactg catgtgcatc acgaaaagtg ggcgcttgat agtcctcctc cagccggcat 60tggcgaagca ggatagacga tggacaagat gcagcatcag ctcggacgga gccctccctc120cctgatgata agccaaaaca ctcttccggt ggcgccatgc aagtacggcg catgttgctc180gcagagccaa gtgcagtacc agcagagctg gatcattacc ctacgacttg gaagctgctc240gattggcacg gcttgacatg gtcccaaccc ctcaggctgg atgtatttgt gcctcgcacg300ctcatcagcg ccctgtccca atggcaatga gtctagattt ggcagcagcg atgtattatc360gaacggccag gctcactagg ccaggaacca gtcccgccac agactaccga ctgagagcga420gaaatagaga gaggggagaa aggccacagt tgttattacc catggaaatg gctcgtagct480gaccacaaca atgatgagga gactgatgat tacgatgtac agtacatacg tattaccact540gccacgagta catacgcacg gggtattaca gctgctgtac caccaggtac ggtcgtgctc600gacgctcatt accggtttga tactactggc actagctgca gaggagccat gaacatcaat660
cgcccagcct gactggtcaa tcaacggccg attcaggggg gacgcaaggg aagcagggaa 720gcaaggaggc tggggagctc ttggtcgccc tttggggtcc catccgctta ccgctgggtt 780gcagcatcat gtccgaggag tccactggcg actggagacc cgagtacgcc tgagacgcag 840cctcgagaga ccagtggccg agacgcctgc tgaggccgct gagcttgcag gggagttgga 900tgaggttggc tgagtgtggg gacgatggcg gagacgagag gccaggatac gacagcacta 960ggccggttgt gacgagaata aacaacaaca tggcgagtcc cgggggcagg tcgacatgga1020gggccgatag gcttaccctc cttggcgagg caacacagcg agcacgccta ggaccgccag1080cccggccccc gacctcaaaa gcccatcgag cgtcgtctgc ttccgatctg gttttcctct1140cctccagtta tcacagtctc cccgccagaa acaaaggaac aaaagaaaga aaagactctc1200agaggtatcc aatccctctc tcttttctct ctctcttcga cttttgtttc aggaacaaaa1260gcttgaggat ccttcttgtc ttcctttcgt gatcttacgg aaggttgtat gagaagattc1320tctcgcgcca gcgcaagccg tcaacctgga ctttgaagcc cgagttcccg tgccctttag1380tatcttcccg tccacttaca aggacaacga agcagcacgc cctcagaccc aaatcagcgt1440tcacgaggag gttcaactca ccctccctca acacaagcca gccggacggg agggtcaaca1500ctcttctttc ccgcaacacg ccgactcagc tcctcctcgc ggcgaacacc gctttgaaga1560agaggtccgt atcacgcgtg aggaagaacg tcaccgccgt cccggttccc gccagtctga1620acgcttcgtg aaggaagagt tcaagtaagt tgatatttca tttttccctg ctattcatat1680tgtctcctgg ctgtggctcc cgcctctcgt ctcctcgcca gaccgctctc accgagtgag1740ggcagctggg ggaaaagggg ggagaaaggg atggccaaag gggtgaggag agacgggagg1800gagagctggg gaggggtgat gagaacgcac gcagcaatta ccggcgtggc tggcgaaagc1860ggtgctgaaa ttacccttcg tattgccctt cttcccacac agctcttttg ccgcggcttc1920tagaacgcgt caattgatag tggggagggc aagcctgggc acggggaggg cggcggagct1980
cactatgggg agctgacagc cggggtggga gttcagctag gattcccagc catgccaatt 2040tatcccggct cagggggtcc ggggggccca ccaatgttgg cccagagacc aaggaagctc 2100acgcacaggc acaaaaggga atctctccag ctaacctcga gtacttttag atccatccca 2160cctcctcctc gcgactacac tgagactcaa gtccaagtcg acacttctcg ccgctacacc 2220aaccccattg acgctgctga gcgtgagtat cgggaacgta tccgtcctca ccacccagag 2280agctccaccg gcctcgaact agttgttcgc cgtcctcgtc actccgacaa gtctcaccac 2340caccaccacc acaagtcctc cgacttcacc gttgtcgacg agcacacttc tgttgcccgt 2400cccaagttcc gtgaggagat caagatcacc gaggaaatcc gcgagtctac tccgcaagtc 2460cccgaacaat ccgccaagat g2481<210>2<211>4376<212>DNA<213>里氏木霉(Trichoderma reesi)<400>2gctaagactg catgtgcatc acgaaaagtg ggcgcttgat agtcctcctc cagccggcat 60tggcgaagca ggatagacga tggacaagat gcagcatcag ctcggacgga gccctccctc120cctgatgata agccaaaaca ctcttccggt ggcgccatgc aagtacggcg catgttgctc180gcagagccaa gtgcagtacc agcagagctg gatcattacc ctacgacttg gaagctgctc240gattggcacg gcttgacatg gtcccaaccc ctcaggctgg atgtatttgt gcctcgcacg300ctcatcagcg ccctgtccca atggcaatga gtctagattt ggcagcagcg atgtattatc360gaacggccag gctcactagg ccaggaacca gtcccgccac agactaccga ctgagagcga420gaaatagaga gaggggagaa aggccacagt tgttattacc catggaaatg gctcgtagct480
gaccacaaca atgatgagga gactgatgat tacgatgtac agtacatacg tattaccact 540gccacgagta catacgcacg gggtattaca gctgctgtac caccaggtac ggtcgtgctc 600gacgctcatt accggtttga tactactggc actagctgca gaggagccat gaacatcaat 660cgcccagcct gactggtcaa tcaacggccg attcaggggg gacgcaaggg aagcagggaa 720gcaaggaggc tggggagctc ttggtcgccc tttggggtcc catccgctta ccgctgggtt 780gcagcatcat gtccgaggag tccactggcg actggagacc cgagtacgcc tgagacgcag 840cctcgagaga ccagtggccg agacgcctgc tgaggccgct gagcrtgcag gggagttgga 900tgaggttggc tgagtgtggg gacgatggcg gagacgagag gccaggatac gacagcacta 960ggccggttgt gacgagaata aacaacaaca tggcgagtcc cgggggcagg tcgacatgga1020gggccgatag gcttaccctc cttggcgagg caacacagcg agcacgccta ggaccgccag1080cccggccccc gacctcaaaa gcccatcgag cgtcgtctgc ttccgatctg gttttcctct1140cctccagtta tcacagtctc cccgccagaa acaaaggaac aaaagaaaga aaagactctc1200agaggtatcc aatccctctc tcttttctct ctctcttcga cttttgtttc aggaacaaaa1260gcttgaggat ccttcttgtc ttcctttcgt gatcttacgg aaggttgtat gagaagattc1320tctcgcgcca gcgcaagccg tcaacctgga ctttgaagcc cgagttcccg tgccctttag1380tatcttcccg tccacttaca aggacaacga agcagcacgc cctcagaccc aaatcagcgt1440tcacgaggag gttcaactca ccctccctca acacaagcca gccggacggg agggtcaaca1500ctcttctttc ccgcaacacg ccgactcagc tcctcctcgc ggcgaacacc gctttgaaga1560agaggtccgt atcacgcgtg aggaagaacg tcaccgccgt cccggttccc gccagtctga1620acgcttcgtg aaggaagagt tcaagtaagt tgatatttca tttttccctg ctattcatat1680tgtctcctgg ctgtggctcc cgcctctcgt ctcctcgcca gaccgctctc accgagtgag1740ggcagctggg ggaaaagggg ggagaaaggg atggccaaag gggtgaggag agacgggagg1800
gagagctggg gaggggtgat gagaacgcac gcagcaatta ccggcgtggc tggcgaaagc1860ggtgctgaaa ttacccttcg tattgccctt cttcccacac agctcttttg ccgcggcttc1920tagaacgcgt caattgatag tggggagggc aagcctgggc acggggaggg cggcggagct1980cactatgggg agctgacagc cggggtggga gttcagctag gattcccagc catgccaatt2040tatcccggct cagggggtcc ggggggccca ccaatgttgg cccagagacc aaggaagctc2100acgcacaggc acaaaaggga atctctccag ctaacctcga gtacttttag atccatccca2160cctcctcctc gcgactacac tgagactcaa gtccaagtcg acacttctcg ccgctacacc2220aaccccattg acgctgctga gcgtgagtat cgggaacgta tccgtcctca ccacccagag2280agctccaccg gcctcgaact agttgttcgc cgtcctcgtc actccgacaa gtctcaccac2340caccaccacc acaagtcctc cgacttcacc gttgtcgacg agcacacttc tgttgcccgt2400cccaagttcc gtgaggagat caagatcacc gaggaaatcc gcgagtctac tccgcaagtc2460cccgaacaat ccgccaagat gggttactac gacgacgagg gtaagctata ctaacgttct2520tttgtctctc tccctcccgc tcttctcctc cattccctcc ctgtctggcc agacgcgtgc2580aagcatacgc taacgcgtgt cgccggcagg ctcttaccac tccctcaagc acggcgtcgc2640caagacgatc gacaagctgc tccctcatca ccaccaccat caccaccaca gtgatcacca2700ccaccacagt gaccatcatg accataataa cactacgatc acagagcacg ttgaagttga2760tgttgtccgc cacgatgcta atcactcgcg acgcgcagct cccgccactg agtcgcagcc2820tcagactgtg tccatcccct gccaccacat ccgcctgggt gacttcctga tgctccaggg2880ccgaccatgc caggtcatcc gcatctcgac ctcgtccgcc actggccagt accgctacct2940tggtgttgac ctcttcacca agcagctgca cgaggagtcc tccttcatct ccaaccctgc3000ccccagcgtt gttgtccaga ccatgctcgg ccccgtcttc aagcagtacc gcgtcctcga3060catggctgac ggctacgtca ccgccatgac cgagaccggc gacgtcaagc agggcctcaa3120
ggtcattgac cagtccaacc tgtggtctcg tctgcagcag gctttcgagt ccggccgcgg3180cagcgtccgt gtcctggtcc tcaacgacgg cggccatgag ctcgctgttg agatgaaggt3240cgtccacggc tcrcgcctgt aaacaatcct crcgatgaca tctttcgtgt ctaaggggga3300gggtttattg tccatccatc ctatggatat tccaggctcg gatcaagcct gaataatgtg3360aaaaataccc catgggcttg gagtgatacg tggaacggtt tgtcattttt ttggatcggg3420ctgggatgta ttttggtcat gaggcagagt gcccagtaga taggatctac ctatgtgcag3480cactgtaatt taagatggat tttgcataac ttttttcttt gtgccgccct ttgtgacatg3540cagtgatgat gcatcgtgat gcatcgtgtt gtcatggctg taaatcgtcc tccctgcgca3600gatcacaagc agtacacgtt gcctcttgac gcgtcgtcgt gttagactac ctgcctacct3660acccaatgtc tgcgtgttga catcaaggta cccgtcgcca gcgcaccggt catgggatac3720atggggaaac cccacaagat tgcagcagcc acgatattat acgatgcccg acatgtgaga3780gtcgatggtc ctcttttttc ccttgctcca aaccccactt gtcgcatctg taacgagaga3840ctgacgttgt cttgatatga agcaagcatc gattcagaga cgaggaagca accagtactg3900tgctaacatg gcaacaaata cgagaccaag tggtagatat attacagagc acatataggc3960atgtaagcaa tgaggaccgg gcagataggg gaattgctgg agataacatg taggtagcgc4020gacaaaagaa ccggtgggat ctggatatag ccgacgaatg atgtgatact aaacttgaag4080gagggggggg gaggggagag gggggatgag ggcgggggag atgaaaggcc ggataagcag4140aggaccagca gacggtccat gttttgttgc ggtagcaaac aacacaacca cgatgttgat4200gtgctccaac gactggtttt gataaggtga ttgtttgttt gccttgagat acgtcggctc4260ttacagctgt tggcgtgtat atcttgacat catacataag gactcccccc cttgttgaat4320tgcttttcag cgaaaagacg tacgtagtac tagtaggara taacacgtag ctaggg4376<210>3
<211>224<212>PRT<213>里氏木霉(Trichoderma reesi)<400>3Met Gly Tyr Tyr Asp Asp Glu Gly Ser Tyr His Ser Leu Lys His Gly1 5 10 15Val Ala Lys Thr Ile Asp Lys Leu Leu Pro His His His His His His20 25 30His His Ser Asp His His His His Ser Asp His His Asp His Asn Asn35 40 45Thr Thr Ile Thr Glu His Val Glu Val Asp Val Val Arg His Asp Ala50 55 60Agn His Ser Arg Arg Ala Ala Pro Ala Thr Glu Ser Gln Pro Gln Thr65 70 75 80Val Ser Ile Pro Cys His His Ile Arg Leu Gly Asp phe Leu Met Leu85 90 95Gln Gly Arg Pro Cys Gln Val Ile Arg Ile Ser Thr Ser Ser Ala Thr100 105 110Gly Gln Tyr Arg Tyr Leu Gly Val Asp Leu Phe Thr Lys Gln Leu His115 120 125Glu Glu Ser Ser Phe Ile Ser Asn Pro Ala Pro Ser Val Val Val Gln130 135 140Thr Met Leu Gly Pro Val Phe Lys Gln Tyr Arg Val Leu Asp Met Ala145 150 155 160Asp Gly Tyr Val Thr Ala Met Thr Glu Thr Gly Asp Val Lys Gln Gly165 170 175Leu Lys Val Ile Asp Gln Ser Asn Leu Trp Ser Arg Leu Gln Gln Ala180 185 190
Phe Glu Ser Gly Arg Gly Ser Val Arg Val Leu Val Leu Asn Asp Gly195 200 205Gly His Glu Leu Ala Val Glu Met Lys Val Val His Gly Ser Arg Leu210 215 220
权利要求
1.从生物体检测或获得基因启动子的方法,所述方法包括(a)在期望的条件下获得一种或者多种由生物体产生的蛋白;(b)获得蛋白的氨基酸序列数据;(c)基于获得的蛋白氨基酸序列制备一种或者多种寡核苷酸;(d)用一种或者多种寡核苷酸处理来自生物体的基因组或染色体DNA以获得编码蛋白及其调节区的基因组或染色体DNA;以及(e)对获得的基因组或染色体DNA测序以检测或获得编码蛋白的基因的启动子。
2.根据权利要求1的方法,其中生物体为微生物、植物或者动物。
3.根据权利要求2的方法,其中微生物选自细菌,酵母以及真菌。
4.根据权利要求3的方法,其中微生物为丝状真菌。
5.根据权利要求1到4任一项的方法,其中步骤(a)是在期望的条件通过分离由生物体产生的蛋白进行的,所述期望的条件诱导一种或者多种提供蛋白质组显示的蛋白的表达。
6.根据权利要求5的方法,其中期望的条件包含提供养分或者基质或者环境条件。
7.根据权利要求1到6任一项的方法,其中步骤(c)通过基因组步移PCR进行。
8.根据权利要求1到7任一项的方法获得的分离的启动子。
9.权利要求8的启动子,其是能够促进基因在真菌细胞中转录的真菌启动子。
10.来自丝状真菌的一分离的hex1启动子。
11.权利要求10的hex1启动子,来源于选自Ophiostoma、木霉、曲霉、青霉、Topylocladium、镰刀菌、金孢霉菌、Magnaporthe、脉孢菌、麦角菌、小球壳菌、Collectotrichum、黑粉菌、Podospora以及毛霉的真菌种。
12.权利要求11的hex1启动子,来源于里氏木霉。
13.权利要求12的hex1启动子,具有基本上如图2所示的核苷酸序列(SEQ ID NO1),在严格条件下与图2所示序列(SEQ ID NO1)杂交的序列,或者图2所示序列(SEQ ID NO1)的功能部分,当所述部分在一种真菌内时能够控制基因的表达。
14.权利要求13的hex1启动子,具有基本上如图2所示的核苷酸序列(SEQ ID NO1)。
15.权利要求13的hex1启动子,为在高度严格的杂交条件下与图2的序列(SEQ ID NO1)杂交的核苷酸分子。
16.一载体或者转化的细胞,包含权利要求10到15任一项的分离的hex1启动子。
17.权利要求16的载体,选自核酸载体、质粒以及病毒载体。
18.一重组DNA构建体,包含可操作性连接到一基因的权利要求10到15任一项的分离的hex1启动子。
19.根据权利要求18的DNA构建体,其中基因编码一外源蛋白。
20.根据权利要求19的DNA构建体,其中外源蛋白选自水解酶以及治疗学/药物上的重要分子。
21.根据权利要求20的DNA构建体,其中水解酶选自植酸酶、纤维素霉、木聚糖酶、β-葡聚糖酶、淀粉酶、脂肪酶和蛋白酶,
22.根据权利要求20的DNA构建体,其中治疗学/药物上的重要分子选自蛋白、抗体、生长因子、生长抑制剂和组织激活剂。
23.一表达系统,包含权利要求19到22任一项的DNA构建体。
全文摘要
本发明涉及利用蛋白质组方法从生物体获得启动子的方法、来自真菌的分离的启动子以及分离的启动子的应用。
文档编号C12N5/10GK1615362SQ02827080
公开日2005年5月11日 申请日期2002年12月13日 优先权日2001年12月13日
发明者海伦娜·内瓦莱宁, 小瓦伦蒂诺·塞托阿·泰奥, 纳塔利·库拉奇, 彼得·莱昂纳德·贝里奎斯特 申请人:麦考里大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1