启动子改造与遗传控制的制作方法

文档序号:438225阅读:666来源:国知局

专利名称::启动子改造与遗传控制的制作方法
技术领域
:本发明提供了包含启动子的载体或者表达盒,其中每个启动子均包含一种核酸,所述核酸的序列相对于野生型启动子的核酸序列被随机突变,且其中所述启动子的调节被修饰。本发明还提供了包含所述载体的文库和细胞。本发明描述了利用本发明的载体、文库或细胞优化调节基因表达、蛋白质表达或者优化基因或蛋白质输送的方法。
背景技术
:定向进化已经广泛用于蛋白质工程中以对蛋白质(性质如抗体结合亲和性、酶调节以及增加的或不同的底物特异性)以及其他生物序列进行有益修饰。近年来,这种策略也已经扩展到启动子。在原核细胞和真核细胞系统中,已经构建了随机突变体文库,其涉及的启动子驱动的基因表达强度的跨度广泛。可调节的启动子在基础和应用生物学研究中已经是关键工具,例如在关键基因的功能性基因组研究中、经改造而产生毒性蛋白质或者代谢物的菌株的开发中,以及在基因治疗和农业研究中。根据应用类型,可调节的启动子需要非常特异性的调节性质,目前可利用的天然启动子或者通过合理方法定制的那些启动子不能满足这些性质。迄今为止,还缺乏一种有效调节启动子以提供最佳表达条件的令人满意的方法。例如,对于应用酵母作为生物催化剂的工业生产过程而言,理想的可调节的启动子必须是i)被严格调节的,ii)诱导不昂贵的,iii)在诱导后高水平表达,及iv)易于操纵。可用于在酿酒酵母(Sacc/zwomj^Mcerev/w'ae)中诱导基因表达的系统无一符合所有这些需求。其中大多数是漏洞的(leaky),不便于使用,禾n/或需要昂贵的、有毒的或者难以提供的诱导剂,如强力霉素、半乳糖、铜离子、热,或者甚至光。发明概述在一个实施方案中,本发明提供了包含可调节的启动子的载体或者表达盒,其中每个启动子均包含一种核酸,所述核酸的序列相对于野生型启动子的核酸序列被随机突变,且由于突变而改变了对所述启动子的调节。在一个实施方案中,改变的调节反映在感兴趣的基因表达水平、感兴趣的基因表达条件或者这些方面的组合。在一个实施方案中,本发明提供了一种分离的核酸,其包含相应于或同源于SEQIDNo:1、2、3、4、5、6、7、8、9或10的突变的Z147W启动子。在另一个实施方案中,本发明提供了一种包含突变的ZX47W启动子的分离的核酸,其中所述启动子在SEQIDNo:ll的如下一或多个位置的至少一个核酸中具有突变第1-56、66-139、148-232、245-283、290-293、301-302、310、322-326、334-347、357-371、380-450或者458-551位。在另一个实施方案中,本发明提供了一种包含突变的Z^7W启动子的分离的核酸,其中所述突变的启动子具有包含如下置换的序列(a)在SEQIDNO:ll的序列的核苷酸位置4、15、19、36、53、56、60、66、74、75、78、86、99、132、136、176、201、205、207、216、226、228、269、277、281、285、299、303、310、327、331、332、375、376、3卯、428、434、467、477、480、508、511或者这些位置的组合,以C置换T:;(b)在SEQIDNO:ll的序列的核苷酸位置7、18、26、40、122、135、149、153、162、164、165、171、172、187、196、211、233、234、237、241、260、274、280、308、313、322、337、343、344、346、366、368、381、384、386、396、397、402、404、422、427、429、432、445、470、490、492位或者这些位置的组合,以G置换A;(c)在SEQIDNO:ll的序列的核苷酸位置21以A置换C;(d)在SEQIDNO:ll的序列的核苷酸位置237、338、469、514、518以C置换A;(e)在SEQIDNO:ll的序列的核苷酸位置28、296、307、373、392、528或者这些位置的组合以T置换C;(f)在SEQIDNO:ll的序列的核苷酸位置22、63、39、439或者这些位置的组合以A置换G;(g)在SEQIDNO:l1的序列的核苷酸位置198以G置换T;或者这些置换的任意组合。在一个实施方案中,本发明提供了一种优化基因表达的方法,其中所述基因在可调节的启动子的控制下,所述方法包括a.将多个细胞与表达载体文库接触,每个载体均包含至少一个感兴趣的基因和与其可操纵地连接的可调节的启动子,其中每个启动子均包含一种核酸,其序列相对于所述文库中的另一启动子核酸的序列被,且由此所述感兴趣的基因在调节基因表达的条件下的表达水平中的相对变化是所述启动子序列中的突变所致;b.检测在所述调节基因表达的条件下培养的(a)中所述细胞的基因表达水平;c.从所述多个细胞中鉴别在所述条件下表达水平被优化的细胞。在另一个实施方案中,本发明提供了一种调节基因表达的方法,所述方法包括a.将多个细胞与表达载体文库接触,每个载体均包含至少一个感兴趣的基因和与其可操纵地连接的可调节的启动子,(i)其中每个启动子均包含一种核酸,其序列相对于所述文库中的另一启动子核酸的序列被随机突变,且(ii)由此所述感兴趣的基因的基因表达水平、所述感兴趣的基因的表达条件或其组合中的变化在可调节条件下作为所述突变的结果(function)而发生;b.检测在(i)中获得的所述多个细胞在野生型基因亚最佳表达的条件下的基因表达水平;c.从所述多个细胞中鉴别这样的细胞,所述细胞在野生型基因亚最佳表达的条件下从所述载体中获得更高表达水平;及d.在所述条件下培养在(c)中鉴别的所述细胞。根据本发明的这些方面以及在一个实施方案中,所述表达载体文库中的每个载体提供了感兴趣基因的一致的表达水平,所述一致的表达水平在另一个实施方案中通过至少两种不同方法加以核实。在一个实施方案中,所述方法在单细胞水平核实表达水平;在另一个实施方案中,所述方法可包括荧光激活的细胞分选分析、荧光显微镜检,或者这些方法的组合。在另一个实施方案中,所述方法进一步包括鉴别所述细胞中的启动子。在另一个实施方案中,本发明提供了一种优化调节蛋白质输送至对象的方法,所述方法包括给予对象一种包含本发明鉴别的启动子的载体,所述启动子与编码感兴趣的所述蛋白质的基因可操纵地连接。在另一个实施方案中,本发明提供了通过本发明的方法鉴别的具有感兴趣基因的希望的表达水平的细胞。在一个实施方案中,感兴趣的基因在亚最佳诱导野生型基因表达的条件下表达。在另一个实施方案中,本发明提供了一种优化调节蛋白质输送至对象的方法,所述方法包括给予对象通过本发明方法鉴别的一种具有优化调节的蛋白质表达的细胞。在一个实施方案中,所述蛋白质在亚最佳诱导野生型蛋白质表达的条件下表达。在另一个实施方案中,本发明提供了一种在亚最佳诱导野生型基因表达的条件下优化调节感兴趣的蛋白质产生的方法,所述方法包括在亚最佳诱导野生型基因表达的条件下培养本发明的细胞。在一个实施方案中,所述细胞是真核细胞,而在另一个实施方案中,所述细胞是原核细胞。附图简述图1示出了Z)^W启动子突变体文库的构建,以及对氧耗竭的应答更敏感的突变体的选择。a)将ZX47W基因上游的552bp片段克隆在报道基因yECitrine的上游,产生质粒p416-Z)^V-yECitrine。通过重组克隆将天然ZX47W启动子的易错PCR产物在酵母株BY4741中表达。b)A4V/启动子突变体文库和具有野生型ZX4A7启动子的同基因(isogenic)参考菌株的荧光直方图。在摇瓶中进行需氧培养,充分抑制所述启动子。为了极端厌氧生活(fastidiousanaerobiosis),将培养物移至具有螺旋盖的培养瓶中,用氮气鼓泡。通过将培养物移至具有螺旋盖的培养瓶中获得微需氧(microaerobic)条件。尽管大多数文库克隆具有比野生型启动子低的荧光强度,但是通过FACS分离极小部分高强度荧光克隆而分离了具有改良功能的启动子,如图的最右侧示出。图2示出两种选择的Z147W启动子突变体与野生型DAW启动子在不同氧化条件下的性能对比,这是通过yECitrine报道基因蛋白质和mRNA及生长曲线而测量。分别携带位于yECitrine报道基因上游的天然A47V/启动子或者两种选择的ZX47W启动子突变体之一的三个酵母株在需氧和微需氧这两种条件下培养。诱导动力学通过A)报道基因荧光和B滩过RT-PCR确定报道基因mRNA转录物而监测。C)示出所有三种酵母株的生长曲线。将报道基因荧光和mRNA转录水平根据其中组成型TEF1启动子驱动报道基因表达的同基因参考株进行归一化。图3A-B示出天然A47W启动子与十个选择的ZX47V/启动子突变体的多序列排列对比。突变体启动子l一6代表在用质粒再转化后仍示出比野生型Z)JW启动子高1.8-2.9倍的微需氧生活(microaerobiosis)诱导的突变体。下划线的序列相应于根据Cohenwa/.(;Vwc/e/cJc/A29:799-808,2001)所述推测的天然A47W启动子中的转录因子结合位点。图4示出选择的ZMA7启动子突变体和野生型A47W启动子在不同发酵条件下在分别用氮气鼓泡培养物(极端厌氧生活)或者切断氧供应(微需氧生活)之后的性能。上图示出在极端厌氧生活和微需氧生活期间yECitrine报道基因的荧光,下图示出这三个酵母株在每种条件下在除去氧供应直至8小时的生长曲线。报道基因荧光水平根据参考株进行归一化。发明详述在一个实施方案中,本发明提供了包含启动子的载体或者表达盒,其中每个启动子均包含一种核酸,所述核酸的序列相对于野生型启动子的核酸序列被随机突变,且其中所述启动子的调节被修饰。在一个实施方案中,本发明提供了包含所述载体的细胞。在一个实施方案中,所述载体是文库的一部分。在一个实施方案中,所述启动子与至少一个感兴趣的基因可操纵地连接。在一个实施方案中,所述启动子来自真核细胞。在另一个实施方案中,包含所述载体的细胞是真核细胞。在一个实施方案中,需要定制设计的可调节的启动子的一个例子是酿酒酵母的DAW启动子。所述ZX4A^启动子在需氧条件下是失活的,但是在厌氧条件下是高度活性的。这种启动子的调节机制是复杂的,包括至少四种已知的转录因子的作用,这些转录因子随之应答由于氧耗竭导致的降低的血红素浓度。极端厌氧生活为有效诱导ZX47W启动子所需,通过用氮气鼓泡培养物以耗竭氧气而实现。鉴于在大规模之下质量传递动力学低得多,因此这一步骤在工业化相关条件下是耗吋的或者不能执行。更可行且便利的诱导方法包括简便地消除或者降低通气,这需要在ZX47W启动子中导入调节性变化。如本文所证实,酿酒酵母的氧调节的ZX4A^启动子的衍生物通过易错PCR被突变,并被克隆进质粒中报道基因的上游。分离到在低氧条件下具有3倍最大表达水平的高生产力的突变体,这是略微出乎意料的发现,因为这一系统中基因表达的调节是复杂的,包括多个转录因子、阻遏物等的参与。因此,不会意料到随机突变导致多水平调节控制的启动子的更高水平表达。再者,启动子突变改变了诱导表达的条件。如本文所证实,突变的可调节的启动子在厌氧条件或者微需氧条件下比野生型启动子驱动更强的基因表达。非常引人注目的是,根据本发明的方法,在微需氧条件下最低诱导的启动子在微需氧条件下可观地驱动表达。因此,在一些实施方案中,在促进调节因子与启动子的结合类型或强度、发生诱导的条件严格性、启动子性能或者这些方面的组合,本发明的技术调节启动子序列。在一个实施方案中,本发明提供了本发明的表达载体文库,每个载体均包含至少一个感兴趣的基因和与其可操纵地连接的可调节的启动子,其中每个启动子均包含一种核酸,所述核酸的序列相对于所述表达载体文库中的另一启动子核酸序列被随机突变。在一个实施方案中,所述突变导致启动子的调节改变。在一个实施方案中,所述启动子来自真核细胞。在另一个实施方案中,包含所述载体的细胞是真核细胞。在一个实施方案中,术语"启动子"是指一个DNA序列,在一个实施方案中,其位于编码序列的立即上游且对于基因的基本的和/或经调节的转录起重要作用。在一个实施方案中,启动子中仅几个核苷酸对于其功能是绝对必需的。在一个实施方案中,本发明的启动子与感兴趣的基因可操纵地连接,而在另一个实施方案中,其与感兴趣的基因非可操纵地连接。在一个实施方案中,所述启动子是内源性启动子的突变体,其与感兴趣的基因在适当条件下的表达通常相关联。在一个实施方案中,这种启动子被随机突变,且包含本发明的文库。在另一个实施方案中,对这些突变体的启动子强度(导致感兴趣的基因的表达水平)进行评价。在一个实施方案中,所述表达通过至少两种手段确认,在另一个实施方案中,所述表达在如本文所举例的群体和单细胞水平评定,或者通过本领域技术人员能获知的任何这种方法进行评定。在另一个实施方案中,所述启动子是可调节的启动子;在一个实施方案中,可调节的启动子是指其下游的基因的表达作为存在或者提供刺激从特定启动子进行表达的特定条件的功能而发生。在一些实施方案中,这类条件导致直接启动表达;或者在其它实施方案中,除去了表达的障碍。在一些实施方案中,这类条件导致表达的停止或降低。在一个实施方案中,这类条件可以是操作培养条件的反映,例如培养中的氧的水平,例如在一些实施方案中是微需氧条件或者在另一个实施方案中是厌氧条件。在另一个实施方案中,这类条件可包括本领域技术人员将获知的特定温度、营养素、营养素缺乏、金属的存在,或者其它刺激或环境因素。在一个实施方案中,可调节的启动子可以由半乳糖(例如UDP-半乳糖差向异构酶(GALIO)、半乳糖激酶(GALl))、葡萄糖(例如醇脱氢酶II(ADH2)),或者磷酸盐(例如酸性磷酸酶(PH05))调节。在另一个实施方案中,可调节的启动子可以通过如本领域技术人员所已知的热休克(热休克启动子)或者化合物如IPTG或四环素或者其它物质激活。应理解任何可调节的启动子及这种调节的条件涵盖在本发明的载体、核酸和方法中,代表本发明的一个实施方案。在一个实施方案中,可调节的启动子可以是G」丄/、G」Z^、(X4ZJ、GJ丄4、(24丄5、GvlL6、(24丄7、G"/1LS、a4丄9、O4ZJ0、M£73、A伍725、四环素,或者C77尸/启动子。在一个实施方案中,本发明提供了一种分离的核酸,其包含相应于或者同源于SEQIDNo:1、2、3、4、5、6、7、8、9或]0的突变的D^W启动子。在一个实施方案中,本发明提供了一种分离的核酸,其包含相应于或者同源于SEQIDNo:1、2、3、4、5或6的突变的IX47W启动子。在一个实施方案中,本发明提供了一种分离的核酸,其包含相应于或者同源于SEQIDNo:1或2的突变的D」7W启动子。在另一个实施方案中,本发明提供了一种包含突变的A4A7启动子的分离的核酸,其中所述启动子在SEQIDNo:11的一或多个如下位置的至少一个核酸中具有突变第1-56、66-139、148-232、245-283、290-293、301-302、310、322-326、334-347、357-371、380-450;或者458-551位。根据本发明的这一方面及在一个实施方案中,所述突变位于如下位置4、7、15、18、19、21、22、26、28、36、40、53、56、60、63、66、74、75、78、86、99、122、132、135、136、149、153、162、164、165、171、172、176、187、196、198、201、205、207、211、216、226、228、233、234、237、241、260、269、274、277、280、281、285、296、299、303、307、308、310、313、322、327、331、332、337、338、343、344、346、366、368、373、375、376、381、384、386、390、391、392、396、397、402、404、422、427、428、429、432、434、439、445、467、469、470、477、480、490、492、508、511、514、518、528,或者在这些位置的组合。在一个实施方案中,这些位置的突变可以是除了野生型核苷酸之外的任何核苷酸,在另一个实施方案中,在每个位置的突变是下文描述的特定核苷酸。在另一个实施方案中,本发明提供了一种包含突变的D/iA7启动子的分离的核酸,其中所述突变的启动子具有包含如下置换的序列(a)在SEQIDNO:ll的序列的核苷酸位置4、15、19、36、53、56、60、66、74、75、78、86、99、132、136、176、20]、205、207、216、226、228、269、277、281、285、299、303、310、327、331、332、375、376、390、428、434、467、477、480、508、511或者这些位置的组合以C置换T;(b)在SEQIDNO:ll的序列的核苷酸位置7、18、26、40、122、135、149、153、162、64、165、171、172、187、196、211、233、234、237、241、260、274、280、308、313、322、337、343、344、346、366、368、381、384、386、396、397、402、404、422、427、429、432、445、470、490、492或者这些位置的组合以G置换A;(c)在SEQIDNO:l1的序列的核苷酸位置21以A置换C;(d)在SEQIDNO:ll的序列的核苷酸位置237、338、469、514、518以C置换A;(e)在SEQIDNO:ll的序列的核苷酸位置28、296、307、373、392、528或这些位置的组合以T置换C;(f)在SEQIDNO:ll的序列的核苷酸位置22、63、391、439或者这些位置的组合以A置换G;(g)在SEQIDNO:ll的序列的核苷酸位置198以G置换T;或者这些置换的任何组合。应理解除了上述那些突变之外的核苷酸位置的突变也被认为是本发明的一部分。在一个实施方案中,与如本文所述突变的启动子的一部分在结构和功能上类似的启动子的一部分中的突变也被认为是本发明的一部分。在另一个实施方案中,本发明包括与A4A7启动子类似的启动子中的突变。在一个实施方案中,类似的启动子或其一部分衍生自酿酒酵母序列;在另一个实施方案中,其衍生自其它糖酵母属(&cc/w/'om少c^)物种;在另一个实施方案中,其衍生自酵母科(^cc/^函jcetoce^,.在另一个实施方案中,其衍生自糖霉菌(^cc/2。,'o"^cetofe^;在另一个实施方案中,其衍生自酵母菌目(&cc/^頻;;ce/^;在另一个实施方案中,其衍生自^Cc/旭ra"^CO//^;在另一个实施方案中,其衍生自子囊菌门G^"y;coto);在另一个实施方案中,其衍生自真菌物种。在另一个实施方案中,与A47W启动子类似的启动子示出与Z)^V/启动子相似的氧依赖性。本领域技术人员利用本领域常规的方法可以确定启动子的氧依赖性。类似的启动子或者启动子区域的确定可以由本领域技术人员利用本领域已知的工具如序列对比进行。在一个实施方案中,与ZX47W类似的启动子是ZX47V2、A4A^5、A47W、77i/、7772、或者77iW。在另一个实施方案中,与DJ7V/类似的启动子是Crc7、CTC7、^VS7、05X56、、MQX、MCIY2、MQXW户C2、^aY7/MO"或者/QA7启动子。在一个实施方案中,突变可以在启动子的相应于厌氧应答元件结合位点的那部分,在一个实施方案中是AR1或AR2,而在另一个实施方案中,突变可以在Mot3或Roxl结合位点。在一些实施方案中,本发明的组合物包含具有如本文所描述的任一或多个突变或者任何实施方案的iX4W启动子或者ZX47V7启动子同系物的核酸、载体或者文库。在一些实施方案中,本发明的组合物由包含如本文所述任一或多个突变或者任何实施方案的ZX4A7启动子或者Z)^W启动子同系物的核酸、载体或者文库组成。在一些实施方案中,本发明的组合物基本上由包含如本文所述任一或多个突变或者任何实施方案的ZX4A7启动子或者A4;W启动子同系物的核酸、载体或者文库组成。在一些实施方案中,本发明的核酸、载体或文库基本上由与单个启动子可操纵地连接的感兴趣的基因组成,在一个实施方案中,所述启动子是Z^47W启动子,在另一个实施方案中,所述启动子是Z)^W启动子同系物。如本文所用,术语"同源性"当用于描述任何核酸序列吋是指候选序列中的与相应天然核酸序列的核苷酸相同的核苷酸的百分比。在一个实施方案中,术语"同源性"、"同系物"或"同源的"在任何情况中均是指所述序列与指定序列在一个实施方案中具有至少70%相应性。在另一个实施方案中,所述核酸序列与指定序列具有至少72%相应性。在另一个实施方案中,所述核酸序列与指定序列具有至少75%相应性。在另一个实施方案中,所述核酸序列与指定序列具有至少77%相应性。在另一个实施方案中,所述核酸序列与指定序列具有至少80%相应性。在另一个实施方案中,所述核酸序列与指定序列具有至少82%相应性。在另一个实施方案中,所述核酸序列与指定序列具有至少85%相应性。在另一个实施方案中,所述核酸序列与指定序列具有至少87%相应性。在另一个实施方案中,所述核酸序列与指定序列具有至少90%相应性。在另一个实施方案中,所述核酸序列与指定序列具有至少92%相应性。在另一个实施方案中,所述核酸序列与指定序列具有至少95%或更高相应性。在另一个实施方案中,所述核酸序列与指定序列具有95%—100%相应性。相似地,与特定序列的相应性包括与该序列的直接相应性以及同源性。同源性可以通过序列排列对比的计算机算法确定,通过本领域熟知的方法确定。例如,核酸序列同源性的计算机算法分析可包括利用软件包,例如BLAST、DOMAIN、BEAUTY(BLASTEnhancedAlignmentUtility)、GENPEPT和TREMBL软件包。确定同源性的另一种方法是通过确定候选序列杂交而进行,这种方法为本领域技术人员所熟知(见例如,"NucleicAcidHybridization"Hames,B.D.,andHigginsS.J.,Eds.(1985);Sambrooketal.,1989,MolecularCloning,ALaboratoryManual,(Volumes1-3)ColdSpringHarborPress,N.Y.;andAusubeletal.,1989,CurrentProtocolsinMolecularBiology,GreenPublishingAssociatesandWileyInterscience,N.Y)。例如,杂交方法可以在中等或严格条件下进行,与编码天然caspase肽的DNA的互补序列杂交。杂交条件例如是在42。C于包含10-20%甲酰胺、5XSSC(150mMNaCl、15mM拧檬酸三钠)、50mM磷酸钠(pH7.6)、5XDenhardt's溶液、10%硫酸葡聚糖和20昭/ml变性的剪切的鲑精DNA的溶液中保温过夜。在一个实施方案中,本发明所述的文库从包含基因组DNA、cDNA的核酸片段或者扩增的核酸中构建。在一个实施方案中,所述启动子和/或,在另一个实施方案中,感兴趣的基因,或者在另一个实施方案中,在所述启动子的控制下感兴趣的基因,衍生自一或两个或者更多个基因组,在另一个实施方案中,其可以是经充分鉴定的基因组。本发明中使用的核酸可以通过本领域熟知的任何合成或者重组方法产生。对核酸可以进行进一步修饰以通过本领域已知的技术改变生物物理学或者生物学性质。例如,所述核酸可以被修饰为增加其对抗核酸酶的稳定性(例如"末端加帽"),或者修饰其亲脂性、溶解性或者与互补序列的结合亲和性。这些核酸可包含所述载体、表达盒、启动子序列、感兴趣的基因,或者其任何组合。本发明的DNA也可以是通过本领域已知方法化学合成的。例如,通过本领域已知的方法可以从四个核苷酸中全部或部分化学合成所述DNA。这类方法包括Caruthers(1985)所述那些方法。DNA也可以通过制备重叠的双链寡核苷酸、填充缺口并将末端连接在一起而合成(见Sambrooketal.(1989)和Gloveretal.(1995)所述)。表达蛋白质的功能类似物的DNA可以通过定向诱变从野生型DNA中制备(见例如,Zolleretal.(1982);Zoller(1983)和Zoller(1984);McPherson(199)所述)。获得的DNA可以通过本领域已知的方法扩增。一种合适的方法是聚合酶链反应(PCR),如Saikietal.(1988),Mullisetal"U.S.Pat.No.4,683,195及Sambrooketal.(1989)所述。在一个实施方案中,选择的基因组是经充分鉴定的基因组。在一个实施方案中,所述基因组是真核生物(即原生生物、双鞭毛海虫、海藻、植物、真菌、霉菌、无脊椎动物、脊椎动物等)的致密(compact)基因组,例如如下的真核生物拟南芥C4ra6Wo戸/sAa/!'awz)、冈比亚按蛟04wop/e/esgaw^ae)、秀丽隐杆线虫(Cae"o;'/w6c//toe/egara)、珍王马鱼(£>a"/ow/o)、黑腹果蝇(Z)/'aso//2/7awe/c7"ogaste厂)、红歸东方純(7bA7/wgw厂"6'-^^)、小球隐子包子虫(0>^>/0;07'/^//"7"parvz/w)、美别'l维虫(r厂;^awasow(3crwz//)、酿酒酵母及粟酒裂殖酵母CSc/z/m^cc/wrawy;cMpow6e)。在另一个实施方案中,所述基因组是小鼠、大鼠、猿或者人的基因组。在另一个实施方案中,所述基因组是原核生物(即细菌、真细菌、藻青菌等)的致密基因组,例如如下的原核生物v^c/zaeog/o^SJw/g/tfo、y4《w^xaeo/z'ciw、^ewpyn/附;e/"m-jc、枯草芽孢杆菌(5ac/〃MSsw&7&)、百日咳博德特氏菌060^^£//0;^^^^)rOW、伯氏疏螺方定4本(5or///(76wgdo^/^/)、沙、目艮衣原j本(C/7/am;^/a^arc/70wa/^J、埃希氏大肠杆菌(Esc/7en'c/7/aco//)A72、流感嗜血杆菌(7/aemo;/H7z^/"y^ewzae(h/,、幽门螺杆菌(/^/&0^"";^/on')、嗜热自养甲烷杆菌(Afe//z<3W06flC/en.WW/ze/7MO(3Mto&0//z/CMW)、詹氏甲'烷球菌(Afe^7(3wococcw乂awwosc/n7)、月巿炎支原体(辟cop/asma、j疏月莫炎奈瑟氏球菌(7Vez'Me〃'amew'wg/^&)、铜绿假单胞菌(尸5ewdowowosaen/g/"OM)、尸^rococcwsAcW&osW、集胞藻属(分wec/7o。加、J尸CC(5S03、772e厂"7o//os'顧vo/c謹'聽或者喜温海洋在另一个实施方案中,所述启动子文库可衍生自来自如下生物体的序列胸膜肺炎放线杆菌(」c""oZ)(3c/〃mp/ew,'op"eM"w/7/(3e)、/ie/'op;v厂"m;e厂m'x、木艮癌农杆菌(爿g'-o^3Cto'/w"fwme^bc/era)、冈比亚按蚊C4"op/e/esgflmZj/ae」、力《z〃y^xaeo/Zcw51、J以阵Jf、v4/'c/7eg/o6"s>/g/<sfo、炭疽芽孢杆菌(5ac/〃wam/zrac/s)、蜡状芽孢杆菌(^flc///^)、丑ac〃/ws/7a/。(iwra/w、枯草芽抱杆菌、多形拟杆菌(Bacero/des^zeto/ofao"".c,'o"」、食菌蛭']l瓜]if(Bc/e〃ov/Zn'oZwc&n'ovo,'ws」、长7又歧木干菌(Si/do6ac/e;'/ww/o"gww)、支气,費炎t専德特菌(So,'ofe/e〃a6rawc/^e/^/c",、百日咳博德特氏菌、伯氏疏螺旋1本、5ra办7'/2/zo6/z/wy'apow/cw/w、马尔4也布鲁木千菌(J5rwce〃a7e//tera/s」、猪'布氏木干菌-(5rwce〃as"/sJ、5厂wc/weraa/3/nWco/fl、马来丝虫CS,'wg/a,"a/qyO、秀丽隐杆线虫、Qzw》j/oZac^"Ca/WctowZ/oc/7m(3朋/(3y7o/'油wws、新月柄杆菌(Caw/o6ac妙c/"^ce"/z^)、沙目艮衣原{本(C7j/amj(i/(3mwr/darwm)、沙、目艮衣原〈本(C/i/薩;^/a加c/zo/加/5)、豚鼠嗜性衣原体(C/7/細3^—〃<a)、肺炎衣原体(C7z/麵j^'(3/we画o"/aeJ、C77/o'-oZ)/訓Ze7/<iM7M、C7z厂omo6ac&广/wmvz'o/acewm、丙鹏丁醇梭菌(C7oWn'(i/MWaceto6M一c訓)、产气荚膜梭菌(C7o幼'W画"—'/"gms)、破伤风梭菌(C7oMn,d/ww/eto"/)、白喉棒*千菌(Co/>77e6ac/en.wm)、Cb,e6acfer/廳fc/era、谷氨酸棒杆菌(Co厂jwe6a"e/'/wmg/wto/w/cwm)、伯内'持考克斯体(Cox/e〃aZwrwef"J>、斑马鱼、Z)ec/7/0TOm0"asarowa"'cfl、耐辐身寸球菌(Z)ez'"ococcwsracZ/c^waraJ、黑月复果虫虽、禽艾美王求虫(五/,"e/'/afe"e〃flJ、堆形艾美球虫(£/wen'aacww/z'"aJ、溶组织内阿米巴CE"tomoeZa/2&to/j^/ca少、粪月汤球菌(五"&rococcz^y^eca/^)、埃希氏大肠杆菌、具才亥梭杆菌(Fksobacfen.ww"wc/ea^mJ、Geo6ac&r5"w^/Te(iMce/w、G7oeo6acter油/acez"、T/aemop/n7/sc/wc;-,'、流感卩耆血木干菌、卩耆盐杆菌属(//a/oZ^cto-Zw/wJ、7/e//coZacw/wpa/Zcw、幽门lb累3千菌、丄acto6ac/〃w7'oA附o""、植物字L木千菌(丄actoZac/〃z"//(3rtto厂z"w)、乳球菌(丄(3"ococcws/acfeJ、问号钩端螺旋体(丄e/to^/ra/"e/'rogaraJ■sCT-ovfl/'/"/、无害李斯特菌(丄/s/e厂/a!'""ocwa)、单核细胞增多性李斯特菌("s/e,'/a,"owqytogewes」、A/eyor/^o6/Mw、嗜热自养甲烷杆菌、扬氏产甲烷球菌/waze/Goe/、鸟分支杆菌(AfycoZ^c,e"'扁av/ww)、牛分支杆菌(A^co6ac&r/w/"6ov&)、麻风分支丰干菌(A^co6a"en'wm/ep厂ae)、会吉核分支杆菌0^yco6a"m.ww7励e7'CM/0^)、鸡毒支原体(Afyco//osmaga〃&ep"c謂)/株、生殖支原体(Afycqp/asmagem'to/Z謂)、穿通支原体(A^co;/aswapew&ra"s)、肺炎支原体、肺支原体(綺co/7/osma/w/wow.s)、7Vfl"o"rc/7aewm、脑膜炎奈瑟氏球菌、iV"TOSomowasewropaea、^ZVostoc、(9ce朋o6fl"7/wszTzeym^'s、Om'ow_ye〃ovw//2_yto//aswa、O厂少z/os/a/—"zK禾舀(Ojzos加'va)、多杀巴斯德菌(尸。他脏〃a腦/toc油J、发冷光杆菌(尸/zoto由油s/ww.w&scem1)、尸/^〃w/a、恶性症原虫(尸/asmod/wwy^/c&a/'ww)、间日症原虫(尸/aswoWwwv/vax」、约氏症原虫(尸/awo&ww;/oe/z》、龈紫单月包菌CPo/7/2jv7-o附o"asg/"gz'v。fo」、/Voc/i/orococcwsma7'/wws、铜绿假单胞菌、恶臭假单胞菌CP^i^omowaspw^fa)、丁香假单胞菌^厂/"g"e)、尸;;to^cm/謂aeTO//n7謂、尸,ococciw"Z_yW、火球菌属(尸;vrococcws/wr/cw—、尸jrococc"5/20厂汰as/7//、co"o"7、普氏立克次体(Wd:e咖'a/ro丽ze鄉、立氏立克次体(&'c&to/a厂/cA:e加/i(;、酉良酒酵母、肠道沙门氏菌(Sa/wo"e〃aew/en'ca)、鼠伤寒沙门氏菌(Sa/附owe〃aj^p/w'wwn'ww)、枯氏肉孢子虫CS"a/'coc;^c,,;)、曼森血吸虫CSc/7/加層7a画ra麵y、裂殖酵母)、苜蓿中华根瘤菌CS/"o^/2oZ)/MWme///o0、金黄色葡萄球菌(5to;/^/ococct^aw'ew5)、表皮葡萄球菌(;S鄉/^/。cocciwep/cfe厂/7"'必、无乳链球菌(jSV厂取ococ""aga/acf/ae)、无乳链球菌(&厂印tococcwsaga/ac〃oeJ、变形链球菌(》eptococczww幽ra)、肺炎链球菌^S"'e/tococcz"戶ewwo"/oe9、化胺链球菌(5"//-酬0(%)<^"、5Vr,麵少cesove/'""."to、天蓝色链霍菌CS,reptow少cescoe/z.co/o7'J、5"m^Z)/oZn^to&o^377、集胞藻(^ywec/wqyW/s^-」、7bA7/MgwrwZes、re加ocfow/7wv/加7/s、小泰勒虫(77ze//en.a/a7'vaJ、r/jerwoawfleroZjac^"fe"gco"ge"w's、卩耆酸热原体(77zmwo//asw2aoc/(io;7/2//z/AwJ、77ze/"",/w"aw/ea"/wm、772e厂wc^jv7ec/zococ(^we/owga/t^、^e厂附c^og(3wa厂/f/wa、歐、弓形虫(7bxop/oswflgowfiZ/J*、齿始密螺方虔〈本(7Ve/owema<sfew"co/aJ、苍白密螺方鬼体(7>e/o"ewaja〃/fif麵J、7>0//7£7-,(3w—p/e/、布鲁斯维虫(7)jp(3WwomaZv'wce/少、克鲁斯锥虫(7Vy/a/7cwomacrwzO、尿素分解尿素支原体(Z7厂ea尸/oy附aMMfl/;/"cwwJ、霍舌L弧菌(^7Zw'oc/;o/erae)、畐U溶血弧菌(P76n'o;3(3/'a/7aewo/;;"cM)、仓'H方弓瓜菌G/o^z'"aZ)revz)^/;^、黑腹果蝇的沃尔巴克体属内共生体(『o/^c/2/aewctosyw6/ow」、琥珀酸弓瓜菌(fro/fw^/aswcc/"ogewes」、Jf(a7^/20mowasaxowqpo^fcj:v.CzYn.、野油菜黄单胞菌C^awf/zowowoscaw/eW〃.^pv.Cawpesfn's、苛养木杆菌C^/e//fl/as"&'osaj或者鼠疫耳P尔森氏菌在另一个实施方案中,核酸片段衍生自病毒基因组,例如T7噬菌体、HIV、马动脉炎病毒、乳酸脱氢酶提升病毒(lactatedehydrogenase-elevatingvirus)、lelystad病毒、猪繁殖与呼吸综合征病毒、猴出血热病毒、,肾炎病毒、火鸡星状病毒、人星状病毒1、2或8型、貂星状病毒1型、绵羊星状病毒1型、禽类传染性支气管炎病毒、牛冠状病毒、人冠状病毒、鼠肝炎病毒、猪流行性腹泻病毒、SARS冠状病毒、传染性胃肠炎病毒、蜜蜂急性麻痹病毒、蚜虫致死性麻痹病毒、黑蜂王细胞病毒(blackqueencellvims)、蟋蟀麻痹病毒、果蝇C病毒、himetobiP病毒、蜜蜂克什米尔病毒、plautia、stali肠病毒、rhopalosiphutnpadi病毒、杉^拉(taura)综合征病毒、triatoma病毒、allchunna病毒、apoi病毒、细胞融合剂病毒(cellfusingagentvirus)、鹿蜱病毒、登革热病毒1、2、3或4型、日本脑炎病毒、KamitiRiver病毒、kunjin病毒、langat病毒、跳跃病病毒、modoc病毒、蒙大拿鼠耳蝙蝠白质脑炎病毒、墨累山谷脑炎病毒、鄂木斯克出血热病毒、powassan病毒、RioBravo病毒、Tamana蝙蝠病毒、蜱传脑炎病毒、西尼罗河病毒、黄热病毒、yokose病毒、丙型肝炎病毒、边界病病毒、牛病毒性腹泻病毒I或2、经典猪瘟病毒、长颈鹿瘟病毒、驯鹿瘟病毒、GB病毒C、庚型肝炎病毒、GB型肝炎病毒、噬菌体Ml1、噬菌体Qbeta、噬菌体SP、肠细菌噬菌体MXI、肠细菌NL95、噬菌体AP205、肠细菌噬菌体fr、肠细菌噬菌体GA、肠细菌噬菌体KU1、肠细菌噬菌体M12、肠细菌噬菌体MS2、假单胞菌噬菌体PP7、豌豆耳突花叶病毒-1、大麦黄矮病毒、大麦黄矮病毒GAV、大麦黄矮病毒-MAW、大麦黄矮病毒-PAS、大麦黄矮病毒-PAV、菜豆巻叶病毒、大豆矮縮病毒、甜菜褪绿病毒、甜菜轻型黄化病毒、甜菜西方黄化病毒、禾谷黄矮病毒-RPS、禾谷黄矮病毒-RPV、南瓜蚵传黄化病毒、马铃薯巻叶病毒、芜菁黄化病毒、甘蔗黄叶病毒、A型马鼻炎病毒、口蹄疫病毒、脑心肌炎病毒、theilovims、牛肠道病毒、人肠道病毒A、B、C、D或E、脊髓灰质炎病毒、猪肠道病毒A或B、未分类肠道病毒、B型马鼻炎病毒、甲型肝炎病毒、aichi病毒、人肠道孤病毒(humanparechovirus)1、2或3、Ijungan病毒、马鼻病毒3、人鼻病毒A和B、猪捷申病毒1、2-7、8、9、10或11、禽类脑脊髓炎病毒、kakago病毒、猴小RNA病毒1、奥拉病毒、bartnah森林病毒、chikungunya病毒、东方马脑炎病毒、igboora病毒、mayaro病毒、ockelbo病毒、奥尼翁尼翁病(onyong-nyong)病毒、Hoss河病毒、sagiyama病毒、salmonpancreasedisease病毒、塞姆利基森林病毒、新培斯病毒、sindbus-like病毒、睡眠病病毒(sleepingdiseasevirus)、委内瑞拉马脑炎病毒、西方马脑脊髓炎病毒、风疹病毒、葡萄斑点病毒、玉米雷亚多非纳病毒、燕麦蓝矮病毒、佛手瓜花叶宪菁黄花卩十病毒组(chayotemosaictymovirus)、茄子花叶病毒、糖芥潜病毒、kennedya黄花叶病毒、芒柄花黄花叶病毒、酸桨斑驳病毒、芜菁黄花叶病毒或者猩猩木花叶病毒。在另一个实施方案中,所述基因组是人基因组,或者来自小鼠属(Mus)或大鼠属(Rattus)。在另一个实施方案中,所述基因组是猿基因组。在另一个实施方案中,本发明的核酸、载体或者文库可以导入上文列出的任何生物体或者本领域技术人员已知的那些生物体中,在一个实施方案中,其可以使得特定基因在特定生物体中在特定条件下如所期望地表达,在一个实施方案中,所述条件涉及可利用的氧的水平。关于病毒和/或细菌和/或其它来源如动物或人的序列信息易于得自可公开获得的来源,例如国家生物技术信息中心(NationalCenterforBiotechnologicalInformation),EntrezGenomes(NCBI)、SangreCenter、InstituteforGenomicResearch(TIGR)、NationalCenterforGenomeResources等数据库。在一个实施方案中,当核酸片段来自生物体的混合物时,所述生物体通常不是在自然界一起发现的。根据本发明的这一实施方案,组合衍生自通常不是在自然界一起发现的不同生物体的核酸片段可增强并控制使用这种核酸片段产生的文库的多样性。应理解本发明的表达盒或者表达文库中使用的核酸片段是使用本领域已知的方法产生的,例如选自机械剪切、用核酸酶消化及用限制性核酸内切酶消化的方法。这种方法的组合也可用于产生基因组片段,其包含启动子和/或感兴趣的基因,本发明的表达盒和/或文库也包含在其中,和/或用于本发明的方法中。在一个实施方案中,使用聚合酶链反应(PCR)及随机寡核苷酸引物产生一或两个或多个基因组的核酸片段的拷贝。在另一个实施方案中,所述表达盒或基因组通过本领域已知的任何方法随机突变,例如通过本领域已知且在本文例证的化学诱变或者易错PCR进行。可调节的酿酒酵母BY4741A47W启动子的衍生物通过易错PCR被突变,克隆进报道质粒中yECitrine基因的上游,并基于葡萄糖YPD培养基中荧光信号筛选酿酒酵母菌株BY4741。形成突变体的功能性启动子文库,其中通过流式细胞计量术测量可重复的均匀的荧光分布(图1)。在另一个实施方案中,使用PCR诱导随机突变的方法是本领域已知的,在例如Dieffenbach(ed)andDveksler(ed)(In:PCRPrimer:ALaboratoryManual,ColdSpringHarbourLaboratories,NY,1995)中描述。在另一个实施方案中,利用可商购的用于诱变PCR中的试剂盒,例如DiversifyPCR随机诱变试剂盒(Clontech)或者GeneMorph随机诱变试剂盒(Stratagene)。在一个实施方案中,在存在至少大约200mM锰或其盐的条件下进行PCR反应。这种浓度的锰离子或者锰盐诱导约2个突变/1000个碱基对(bp)扩增的核酸至大约10个突变/1000bp(Leungetal.,Technique1,11-15,1989)。在另一个实施方案中,PCR在浓度升高或增加的或者高浓度的dGTP下进行,例如在大约150mM至大约200mM浓度下进行。这种高浓度的dGTP导致核苷酸以大约1—3个核苷酸/1000bp扩增的核酸的比率错误掺入PCR产物中(Shahanietal.,BioTechniques23,304-306,1997)。在另一个实施方案中,所述表达盒和/或文库的核酸通过插入能使所述核酸突变的宿主细胞中而被突变。这类宿主细胞缺少一或多种酶,例如一或多种重组或DNA修复酶,由此使突变的比率比非突变细胞增加大约5,000—10,000倍。在一个实施方案中,用于突变核酸的菌株具有修饰或者失活的错配修复途径的成分的等位基因。这种等位基因的例子包括muff、imitM、mutD、muff、mutA、mutC或者mutS。具有修t布或者失活的错配修复途径的成分的等位基因的细菌细胞为本领域所已知,例如XLlRed、XL-mutS和XL-mutS-Kad细菌细胞(Stratagene)。在另一个实施方案中,所述核酸片段可以通过修复聚合酶PolI克隆进在细菌细胞中优先复制的核酸载体中。可以使用在导入的核酸载体中诱导高水平突变的PolI变体菌株,在一个实施方案中配合并入本文作参考的Fabretetal(In:NuclAcidRes,28,1-52000)所述的方法。在另一个实施方案中,诱变的文库可以使用转座子构建。在一个实施方案中,可以使用mariner转座子。Mariner转座在体外有效发生,不需要细胞辅因子且示出极小的插入位点特异性,仅需要耙序列中的二核苷酸TA(甚至这种微小的位点特异性可以易于通过使用不同的体外反应条件而被改变)。在另一个实施方案中,可以使用Tn7转座子。转座子作为编码转座酶的DNA序列天然存在,转座酶识别并切割在转座酶基因两侧的DNA。转座酶的识别位点或者结合位点是指反向重复序列。由此,可转座的元件当被激活时产生一种酶,所述的酶促进所述元件自身从DNA的一个位置切离并将切离的DNA插入另一个位置。在一些实施方案中,选择的转座子呈现在所谓"热点"的位点特异性插入。在另一个实施方案中,转座子可以是Tn551、Minos、Hermes或者piggyback。在另一个实施方案中,转座子可以是AT-2(基于tyl的转座子,PerkinElmer;Devineetal.(1997)GenomeRes.7:551-563)、GPS-1(NewEnglandBiolabs)、GPS-2(NewEnglandBiolabs)、EZ::tn(基于Tn5的转座子,EpicenterTechnologies)、SIF(基于Tn7的转座子,Bieryetal.(2000)NuclAcidRes28:1067-1077),或者Mu(Fi親ymes,Haapaetal.(1999)NuclAcidRes13:2777-2784)。应理解任何转座子均可用于本发明的方法中。在一个实施方案中,转座子与其天然的同源转座酶一起应用,或者在另一个实施方案中使用修饰的和/或改良的转座酶。在另一个实施方案中,转座子可包含编码异源多肽的核酸序列。这一序列可以在转座子整合时与转座子一起整合进细胞的基因组中。在一个实施方案中,当转座子基于再次移动而切离时,所述异源多肽可以与所述转座子一起切离。在一个实施方案中,所述异源多肽是一种可检测的标记,例如绿色荧光蛋白(GFP)或者其突变体、类似物。GFP已经分离自PacificNorthwesttK母0,o固v/"on.a)、海肾(7ew7/aremybrmW及尸/wW/(i/Mwg尸eg"n.ww.(Wardetal.,1982,Photochem.Photobiol.,35:803-808;Levineetal"1982,Comp.Biochem.Physiol.,72B:77-85)。也参见Matz,etal"1999(文章同上)关于最近从珊瑚(Anthoza)物种中分离的荧光蛋白(登记号AF168419、AF168420、AF168421、AF168422、AF168423和AF168424)的描述,所述文献内容均并入本发明的方法中。具有可用的激发和发射光谱的多种水母相关GFP已经通过修饰Aequoreavictoria中天然发生的GFP的氨基酸序列而被改造(Prasheretal.,1992,Gene,111:229-233;Heimetal.,1994,Pro"Natl.Acad.Sci.U.S.A.,91:12501-12504;PCT/US95/14692)。在另一个实施方案中,体外转座可以在基因组DNA克隆进载体中时进行,所述载体例如是粘粒、噬菌体、质粒、YAC(酵母人工染色体)或者BAC(细菌人工染色体)载体。相似的高强度诱变可以使用克隆进等位基因置换载体中的基因组DNA在非天然相容的生物体中进行(见例如美国专利No.6,207,384)。在一个实施方案中,分离感兴趣的细胞的染色体DNA,并使用Himarl转座酶进行诱变,在另一个实施方案中,使用编码标记基因例如卡那霉素或者氯霉素抗性基因的人工小转座子进行诱变。转座子的插入在插入位点的任一端产生短的单链缺口。在一个实施方案中,利用已知吸收(takeup)单链DNA的细菌菌株,根据本发明的这一方面,这些缺口需要修复(使用DNA聚合酶和DNA连接酶),以产生为重组进入染色体中所需的侧翼DNA序列。在另一个实施方案中,通过利用放射构建诱变的表达盒和/或文库。当通过放射产生突变时,在一个实施方案中可利用紫外线(UV),或者在另一个实施方案中可利用电离辐射。进行遗传突变的合适短波UV波长为200nm—300nm,在一个实施方案中优选是254nm。这一波长的UV射线原则上导致核酸序列中的胍嘧啶和胞嘧啶转变为腺嘌呤和胸苷。由于所有细胞均具有修复大多数UV诱导的突变的DNA修复机制,因此可以加入如咖啡因及其它抑制剂以中断修复过程,并使得有效突变的数目达到最大值。可以利用波长为300nm—400nm的长波UV进行突变,在另一个实施方案中长波UV突变可以与DNA相互作用的各种激活物如补骨脂素染料联合应用。在另一个实施方案中,也可以利用化学物质进行诱变。在其它实施方案中,这些化学诱变剂可包括影响非复制的DNA的化合物如HN02和NH2OH,以及影响复制的DNA的物质如已经示出导致移码突变的吖啶染料。使用放射物质或者化学物质产生突变的方法为本领域所熟知,本发明的方法可以利用所述任何方法(见例如ThomasD.BrockinBiotechnology:ATextbookofIndustrialMicrobiology,SecondEdition(1989)SinauerAssociates,Inc.,Sunderland,MA.,或者Deshpande,MukundV.,Appl.Biochem.Biotechnol.36,227(1992)。在一个实施方案中,通过本领域熟知且描述的方法将诱变的DNA转化进细菌中或者其它感兴趣的细胞中(见例如,"MethodsinEnzymology"Vol.1-317,AcademicPress,CurrentProtocolsinMolecularBiology,AusubelF.M.etal.(eds.)GreenePublishingAssociates,(1989)及MolecularCloning:ALaboratoryManual,2ndEdition,Sambrooketal.ColdSpringHarborLaboratoryPress,(1989)所述,或者其它标准实验室指导所述)。通过例如铺板于含有适当抗生素的培养基上选择通过同源重组获得转座子插入的细胞。在另一个实施方案中,使用荧光激活的细胞分选方法选择细胞。在一个实施方案中,对来自各个转座子突变体或者各个诱变的细胞的消化的DNA进行Southern印迹分析以核实转座子插入。在另一个实施方案中,可以利用序列分析、PCR和/或杂交方法确定通过例如转座子插入或者易错PCR等进行的诱变。使用流式细胞计量术筛选获得的诱变的文库鉴别了在不同条件下具有不同的报道基因表达水平的细胞,这些细胞是在启动子中导入突变的结果。应理解其它的启动子及与这类启动子中经调节的表达相关的突变可以通过本发明的方法鉴别。本发明的鉴别方法以及由此获得的菌株被认为是本发明的一部分。应理解可以使用在启动子序列中产生随机突变的任何方法以产生本发明的表达盒、文库和/或载体,且认为这是本发明的一个实施方案。也应理解可以组合这种方法,且包括本发明其它实施方案。在一个实施方案中,所述的表达盒和/或载体包含与期望表达的基因可操纵地连接的核酸片段或cDNA或衍生自其中的扩增的DNA。用于调节在不同启动子文库的控制下的基因表达的构建体也可包含盒,这便于在定性和定量水平筛选表达。因此,在一个实施方案中,考虑的是适于筛选所述文库的表达形式。在一个实施方案中,术语"载体"是指一种核酸构建体,其进一步包括复制起点,且可以是一种穿梭载体,既可以在原核细胞中增殖也可以在真核细胞中增殖,或者所述载体可以构建为便于其在选择的生物体基因组内整合。在其它实施方案中,所述载体可以是例如质粒、bacmid、噬菌粒、粘粒、噬菌体、病毒或者人工染色体。在一个实施方案中,术语"表达盒"或者"盒"是指核酸,其包含启动子序列及与其可操纵地连接的基因,其中所述启动子可以被突变以便为特定应用而优化调节所述感兴趣基因的表达。在一个实施方案中,所述盒可以在任何位置,例如其可以连接在表达载体内,或者所述盒可以被改造以可以整合进感兴趣细胞的染色体中。在另一个实施方案中,本发明的盒和/或载体进一步包含编码标记多肽的异源核酸序列的插入。所述标记多肽可包含例如yECitrine、绿色荧光蛋白(GFP)、DS-Red(红色荧光蛋白)、分泌型碱性磷酸酶(SEAP)、p-半乳糖苷酶、荧光素酶,或者本领域技术人员已知的任何其它报道基因蛋白。在一个实施方案中,术语"优化"是指希望的改变,在一个实施方案中是基因表达的改变,在另一个实施方案中是蛋白质表达的改变。在一个实施方案中,优化的基因表达是优化调节基因表达。在另一个实施方案中,优化的基因表达是增加基因表达。根据本发明的这一方面及在一个实施方案中,预期与野生型相比基因表达增加2—1000倍。在另一个实施方案中,预期基因表达增加2—500倍,在另一个实施方案中,基因表达增加2—100倍,在另一个实施方案中,基因表达增加2—50倍,在另一个实施方案中,基因表达增加2—20倍,在另一个实施方案中,基因表达增加2—10倍,在另一个实施方案中,基因表达增加3—5倍。在另一个实施方案中,优化的基因表达可以是在特定环境条件下基因表达增加。在另一个实施方案中,优化的基因表达可以包括基因表达降低,在一个实施方案中,可以是仅在特定环境条件下基因表达降低。在一个实施方案中,术语"基因"是指能表达为特定蛋白质的核酸片段,包括在编码序列之前(5'非编码序列)和之后(3'非编码序列)的调节序列。"天然基因"是指天然发现的具有其自身调节序列的基因。"嵌合基因"是指任何非天然基因,其包含非天然一起发现的调节序列和编码序列。因此,嵌合基因可包含衍生自不同来源的调节序列和编码序列,或者调节序列和编码序列衍生自相同来源,但是以与其天然发现不同的形式排列。"内源基因"是指天然位于生物体内的天然基因。"外源基因"是指在宿主生物体中非正常发现的基因,但是通过基因转移导入宿主生物体中。外源基因可包含插入非天然生物体中的天然基因,或者包含嵌合基因。"转基因"是已经通过转化方法导入基因组中的基因。调节感兴趣的基因的表达可以使用本发明的盒、载体和/或文库,并通过本领域技术人员已知的任何方式实现。在一个实施方案中,这种表达可以在遗传工程细菌、真核细胞如酵母和/或哺乳动物细胞中实现,这些细胞被认为是本发明的一部分。在一个实施方案中,向原核细胞或真核细胞中导入构建体,由此可以选择细胞中的同源重组事件。本领域技术人员可易于设计这种包括阳性和阴性选择基因的构建体,以有效地选择经历用所述构建体同源重组的转染的细胞。本领域已知许多将盒和/或载体导入细胞中的技术,例如但非限于直接DNA吸收技术,及病毒、质粒、线性DNA或者脂质体介导的转导,受体介导的吸收及应用磷酸钙介导和DEAE-葡聚糖介导的导入方法的magnetoporation方法,电穿孔或者脂质体介导的转染方法(进一步详述见例如"MethodsinEnzymology"Vol.1-317,AcademicPress,CurrentProtocolsinMolecularBiology,AusubelF.M.etal.(eds.)GreenePublishingAssociates,(1989)andinMolecularCloning:ALaboratoryManual,2ndEdition,Sambrooketal.ColdSpringHarborLaboratoryPress,(1989)或者其它标准实验室指导所述)。也可以使用核酸包被的粒子轰击方法。应理解任何这些方法均可用于将希望的序列导入细胞中,由此产生的细胞被认为是本发明的一部分,且可用于实践本发明的方法。在一个实施方案中,所述载体或者基因构建体适于体外显示表达的肽。优选的体外显示形式包括核糖体显示、mRNA显示或者共价显示。在另一个实施方案中,所述盒、载体或者基因构建体适于在细胞宿主中表达肽。为此优选的细胞宿主能支持外源或附加的(episomal)DNA的表达,例如可以是细菌细胞、酵母细胞、昆虫细胞、哺乳动物细胞、植物细胞等。在另一个实施方案中,所述载体或基因构建体适于在多细胞生物体中表达肽,可包括具有致密基因组和/或短细胞周期的多细胞生物体,以便于快速高通量筛选,所述生物体例如是植物(例如拟南芥或者烟草(M'co"m'ato&cc"m)),或者动物如秀丽隐杆线虫、斑马鱼、黑腹果蝇、红鳍东方飩或小鼠属或大鼠属。在另一个实施方案中,所述载体或基因构建体适于在原核细胞中表达。在另一个实施方案中,所述载体或基因构建体适于在任何真核细胞中表达。编码治疗性蛋白质的构建体在一个实施方案中,本发明的构建体包含编码治疗性蛋白质的感兴趣的基因。在一个实施方案中,术语"构建体"是指如本文所述的盒、载体或者载体文库。在一个实施方案中,术语"治疗性"是指当一个分子提供给需要其的对象时提供有益作用。在一些情况中,所述分子在对象中不存在或者这种分子不足的情况中代之起作用时,称为治疗性的。在一个实施方案中,所述治疗性蛋白质是在对象中不存在的蛋白质,如必需蛋白质的内源性无效(null)或者错义突变。在其它实施方案中,所述内源蛋白质被突变,并产生一种非功能性蛋白质,通过提供所述功能性蛋白质而补偿。在其它实施方案中,异源蛋白质的表达对低的内源水平呈加合作用,导致特定蛋白质的表达累积性增强。在其它实施方案中,所述分子刺激信号级联,所述级联提供细胞或宿主发挥功能的关键元件的表达或者分泌或者其它方面。在一个实施方案中,所述治疗性蛋白质可包含酶、酶辅因子、细胞毒性蛋白质、抗体、通道蛋白、转运蛋白、生长因子、激素或者细胞因子。在一个实施方案中,术语"抗体或者抗体片段"是指完整的抗体分子以及其功能片段,如能结合表位的Fab、F(ab')2和Fv。在一个实施方案中,Fab片段是指含有抗体分子的单价抗原结合片段的片段,其可以通过用木瓜蛋白酶消化完整抗体产生完整轻链及重链的一部分而产生。在一个实施方案中,Fab'片段是指抗体分子的一部分,其可以通过用胃蛋白酶处理完整抗体及随后还原产生完整轻链和重链的一部分而获得。每个抗体分子可以获得两个Fab'片段。在一个实施方案中,(Fab')2是指抗体的一个片段,其可以通过用胃蛋白酶处理完整抗体且随后不经还原而获得。在另一个实施方案中,F(ab')2是两个Fab'片段通过两个二硫键连接在一起的二聚体。在一个实施方案中,Fv是指经遗传改造的片段,其含有表达为两个链的轻链可变区和重链可变区。在一个实施方案中,所述抗体片段可以是单链抗体(SCA),这是一种经遗传改造的分子,含有轻链可变区和重链可变区,通过合适的多肽接头连接成为经遗传融合的单链分子。产生这些片段的方法为本领域所已知(见例如并入作参考的HarlowandLane,Antibodies:ALaboratoryManual,ColdSpringHarborLaboratory,NewYork,1988所述)。在一个实施方案中,抗体识别表位;在另一个实施方案中,表位是指抗原上由抗体的抗体决定簇结合的抗原决定簇。在其它实施方案中,表位决定簇可以是由分子如氨基酸或者碳水化合物侧链的化学活性的表面基团组成,在其它实施方案中,其可以具有特异的三维结构特征,和/或在其它实施方案中具有特异的电荷特征。在一个实施方案中,被识别的表位来自病原体,或者在另一个实施方案中来自病原性细胞,或者在另一个实施方案中来自异常表达的蛋白质,这在另一个实施方案中是指表达的位置、数量或者这些组合。本发明的抗体片段可以通过对抗体进行蛋白水解或者通过编码所述片段的DNA在大肠杆菌或哺乳动物细胞(例如中国仓鼠卵巢细胞培养物或者其它蛋白质表达系统)中表达而制备。在其它实施方案中,抗体片段可以通过常规方法对完整抗体进行胃蛋白酶或者木瓜蛋白酶消化而获得。例如,抗体片段可以通过用胃蛋白酶对抗体进行酶解提供称作F(ab')2的5S片段而产生。可以使用硫醇还原剂及任选得自二硫键裂解的巯基的封闭基团对这一片段进一步裂解,产生3.5SFab'单价片段。或者,使用胃蛋白酶进行酶解直接产生两个单价Fab'片段和一个Fc片段。这些方法例如由Goldenberg的美国专利No.4,036,945和4,331,647及其中的参考文献所描述,所述专利以其全部内容并入本文作参考。也见Porter,R.R.,Biochem.J.,73:119-126,1959所述。也可以使用裂解抗体的其它方法,如分离重链以形成单价轻链—重链片段、进一步裂解片段、或者其它酶学、化学或者遗传技术,只要所述片段结合由完整的抗体识别的抗原即可。Fv片段包含VH与VL链的结合。这种结合可以是非共价的,如Inbaretal"Proc.Nat'lAcad.Sci.USA69:2659-62,1972所述。或者,可变链可以通过分子间二硫键连接或者通过化合物如戊二醛交联而连接。优选地,所述Fv片段包含通过肽接头连接的VH和VL链。这些单链抗原结合蛋白(sFv)是通过构建包含编码通过寡核苷酸连接的VH和VL结构域的DNA序列的结构基因而制备。所述结构基因插入表达载体中,随后导入宿主细胞如大肠杆菌中。所述重组宿主细胞合成一个单多肽链,具有连接两个V结构域的接头肽。产生sFvs的方法例如由WhitlowandFilpula,Methods,2:97-105,1991;Birdetal"Science242:423-426,1988;Packetal"Bio/Technology11:1271-77,1993及Ladner等的美国专利No.4,946,778所述,所述文献以其全部内容并入本文作参考。抗体片段的另一种形式是编码单一互补决定区(CDR)的肽。CDR肽(最小识别单位)可以通过构建编码感兴趣的抗体的CDR的基因而获得。这种基因例如通过使用聚合酶链反应从产生抗体的细胞的RNA中合成可变区而制备。见例如LarrickandFry,Methods,2:106-10,1991所述。在一个实施方案中,所述抗体是杀肿瘤的(tumoricidal),并因此在某些癌症中是治疗性的。本领域已知具有杀肿瘤活性的抗体,其任何应用均可代表本发明的一个实施方案,所述抗体包括IMC-C225、EMD72000、OvaRexMabB43.13、抗祌经节苷脂G(D2)抗体chl4.18、C017-1A、trastuzumab、rhuMAbVEGF、sc-321、AF349、BAF349、AF743、BAF743、MAB743、AB1875、抗-Flt-4AB3127、FLT41-A、rituximab、2C3、CAMPATH1H、2G7、AlphaIR-3、ABX-EGF、MDX-447、抗-p75IL-2R、抗-p64IL-2R、和2A11。在另一个实施方案中,治疗性蛋白质可包含酶,例如参与糖原贮存或分解的酶。在一个实施方案中,所述酶参与代谢途径。在另一个实施方案中,本发明提供了对化合物产生的优化调节,这是对感兴趣的基因的表达进行调节的作用结果。在一个实施方案中,所述化合物是一种蛋白质,或者在另一个实施方案中是脂质,或者在另一个实施方案中是碳水化合物,或者在另一个实施方案中是矿物质,或者在另一个实施方案中是维生素,或者在另一个实施方案中是其产生可被感兴趣的基因产物影响、其表达可被调节的任何化合物。在另一个实施方案中,所述载体包含可以将启动子和感兴趣的基因稳定整合进载体所导入的细胞的基因组中的序列。根据本发明的这一方面及在一个实施方案中,整合的系统的应用避免了与在应用基于质粒的系统时出现的内源基因过表达相关的不稳定性。然而,在本发明的另一个实施方案中,也涉及使用本发明的构建体的基于质粒的系统。在一个实施方案中,使用本发明的构建体评估生长产量和番茄红素的产生。在一个实施方案中,评估了编码磷酸烯醇丙酮酸羧化酶(一种关键的回补代谢(anaplerotic)酶)的j^c基因的调节。代谢途径的动力学控制通常是分散的(distributed)且依赖于所述途径中一些基因的表达水平。启动子输送实验可以量化这种控制。由于优化调节的蛋白质表达可以是多个基因产物的作用结果,因此在一个实施方案中,本发明提供了文库及其使用方法,其中一个以上的感兴趣的基因在可调节启动子的控制下。在另一个实施方案中,可以使用本发明的构建体对其它感兴趣基因进行操纵,例如将本发明所述载体导入细胞中,所述细胞中所述感兴趣的基因靶向的参与指定途径的特定基因被遗传破坏。在另一个实施方案中,所述载体被导入细胞中,所述细胞经遗传改造为过表达所述感兴趣的基因靶向的指定途径中的特定基因。在一个实施方案中,表达的时间选择在观测到的表型方面起作用,且可以作为本发明的载体、核酸和/或文库的功能而被调节。例如,在本发明的一个实施方案中,所研究的代谢途径参与类胡萝卜素的产生。在一个实施方案中,这种利用本发明的文库或载体或者根据本发明的方法的产生,可包括类胡萝卜素转移进异源生物体中,导致对表达的优化调节,表明了对感兴趣的化合物的产生进行优化调节的一种方式。在一个实施方案中,所述感兴趣的化合物的产生是对感兴趣的基因产物的产生进行优化调节的结果。例如,类胡萝卜素调节可以通过本发明的文库和方法,通过优化调节基因产物例如参与希望的产物如类胡萝卜素的加工的酶而优化。在一个实施方案中,为了产生感兴趣的化合物以及评估其最大产量,可以将来自一个生物体的基因在另一个生物体中表达,这种技术为本领域技术人员所已知。例如,来自Mre^wra和Haem^ococc"sp/wv/afc的基因将一起在大肠杆菌中起作用(Kajiwaraetal.PlantMol.Biol.29:343-352(1995))。/^6/co/a基因将在/.^/2aem/cfes中起作用(Hunteretal.J.Bact.176:3692-3697(1994))。在本发明的另一个实施方案中,本发明的文库或者载体可以在细菌中表达。在一个实施方案中,所述细菌可属于醋酸杆菌属(Aeto^c妙)、埃希氏菌属、沙门氏菌属、志贺氏菌属、欧文氏菌属)、红球菌属(T/ae/77atococcMS)、红杆菌属(//7o&k^er)、粘球菌属(Mjaococcw)、棒杆菌属、假单胞菌属、户戸d瘤胃球菌属C^ww/"ococcw)、分支杆菌属、芽孢杆菌属。在另一个实施方案中,所述细菌可以是甲基营养菌(w"/;j;/o^/7/z),或者在另一个实施方案中,所述嗜甲烷菌(wefZza/7oZropA)例如是甲基单5包菌CWef/7_y/owow<aw」、A/er/^/oZjac/e/'、甲基球菌(A/e/2/^/ococciw」、甲基窦菌CMef/7少/cw/"船」、A/e^y/oqyc"s、Afe/Zzy/ow/cra^/ww、甲烷单胞菌、嗜甲基菌(A^^y/c^/n7船)、甲基芽孢杆菌(Me^y/oZ)a"7/M^及甲基杆菌在一个实施方案中,术语"甲基营养菌"是指能氧化不含碳-碳键的有机化合物的生物体。在所述甲基营养菌能氧化甲垸(CH4)的情况中,所述甲基营养菌也可以是嗜甲烷菌。在一个实施方案中,所述甲基营养菌使用甲醇和/或甲烷作为其主要的碳源。在一个实施方案中,甲基营养菌和/或嗜甲烷菌是Cl代谢菌。在一个实施方案中,术语"C1代谢菌"是指具有使用单一碳底物作为其能量和生物量唯一来源的能力的细菌。在一个实施方案中,术语"C1碳底物"是指没有碳-碳键的任何含碳的分子。非限制性的例子是甲烷、甲醇、甲醛、甲酸、甲酸盐、甲基化的胺(例如一甲基胺、二甲基胺和三甲基胺)、甲基化的硫醇和二氧化碳。在另一个实施方案中,所述Cl碳底物选自甲醇和/或甲烷。在另一个实施方案中,术语"嗜甲烷菌"或"嗜甲烷细菌"是指能利用甲垸作为其主要碳源和能量来源的原核生物。甲烷完全氧化为二氧化碳是通过好氧降解途径发生的。用于本发明中的嗜甲垸菌的典型例子包括(但非限于)Methylomonas、Methylobacter、Methylococcus及Methylosinus属。在一个实施方案中,嗜甲垸细菌利用甲烷和/或甲醇作为其主要碳源。在一个实施方案中,术语"高速生长的嗜甲垸细菌菌株"是指能将甲垸禾口/或甲醇作为唯一碳源和能量来源而生长且具有功能性Embden-Meyerhof碳流动途径,导致高生长速度和每克代谢的Cl底物的高细胞量产量(US6,689,601,在此并入本文作参考)。本文描述的特定的"高速生长的嗜甲垸菌株"是指"Methylomonas16a"、"16a"或者"Methyomonassp.16a",这些名称可以互换应用,是指本发明中使用的Methylomonas菌株。转化Cl代谢细菌的技术可以与用于其它细菌的一般方法学类似,这些技术为本领域技术人员所熟知。电穿孔已经成功用于转化如下菌株MethylobacteriumextorquensAMI(Toyama,H.,etal"FEMSMicrobiol.Lett.,166:17(1998))、MethylophilusmethylotrophusAS1(Kim,C.S.,andT.K.Wood,Appl.Microbiol.Biotechnol.,48:105108(1997))及Methylobacillussp.strain12S(Yoshida,T.,etal"Biotechnol.Lett.,23:787791(2001))。依赖于供体与受体细胞的直接接触的细菌接合也可以用于将基因转移进Cl代谢细菌中。细菌接合过程可包括将"供体"与"受体"细胞混合在一起,彼此紧密接触。通过在供体与受体细菌之间形成细胞质连接而发生结合,由此新合成的供体DNA直接转移进受体细胞中。接合中的受体通过横向转移接受来自供体细菌的DNA。接合转移中的供体可具有接合质粒、接合转座子或者可移动质粒。在一些情况中,接合仅需要供体和受体。当被转移的质粒是自身可传递的质粒时发生接合,所述质粒既是接合的也是可移动的T(即携带tra基因和编码Mob蛋白的基因)。通常地,所述过程包括如下步骤l)双链质粒DNA在oriT中的特定位点被切开;2)单链的DNA通过孔或纤毛结构释放至受体;3)DNArelaxase酶在oriT切割双链DNA并与释放的5'末端结合(形成中间结构relaxosome);4)随后,在oriT装配辅助蛋白质的复合物,以促进DNA转移过程。"三亲株的"接合也可以是将供体质粒转移至受体所需要的。在这种类型的接合中,供体细胞、受体细胞和"辅助"质粒参与其中。供体细胞携带可移动质粒或者接合转座子。可移动载体含有or汀(一种编码切口酶(nickase)的基因),且具有编码Mob蛋白的基因;然而,所述Mob蛋白自身不足以完成基因组的转移。因此,可移动质粒不能促进其自身转移,除非由辅助质粒(位于供体内或者位于"辅助"细胞内)提供合适的接合系统。所述接合质粒是交配对(matingpair)的形成及DNA转移所需的,因为所述质粒编码参与孔或纤毛形成的转移蛋白(Tra)。包含CI代谢细菌的成功接合的例子包括在此并入作参考的如下研究成果Stolyaretal.(Mikrobiologiya,64(5):686691(1995))、Motoyama,H.etal.(Appl.Micro,Biotech.,42(1):6772(1994))、Lloyd:J.S.etal.(ArchivesofMicrobiology,171(6):364370(1999))、Odom,J.M.etal.(US09/941947,对应WO02/18617)、US10/997308和US10/997844。在一个实施方案中,术语"途径"是指代谢途径,其中多个蛋白质可发挥调节作用,例如不同的酶,其活性通过例如切割或者氢化或者去氢化等调节特定产物的形成或者在另一个实施方案中调节产物的前体为不需要的形式等。在另一个实施方案中,术语"途径"是指具有一些相关功能的蛋白质,由此当需要全面应答时,两者的协同作用产生希望的结果。例如,感兴趣的基因可以是细胞因子,其中在给予给定的疫苗时,其被调节的表达在具有给定的HLA类型的宿主细胞中提供,以产生最大程度的免疫刺激及应答。在另一个实施方案中,被调节的抗原性蛋白质或肽的表达是产生希望的免疫应答所需的。例如在一个实施方案中,低水平的蛋白质/肽表达是免疫刺激所需的,而在另一个实施方案中,高水平的肽/蛋白质表达是免疫耐受所述蛋白质、肽的来源或者相关肽或蛋白质所需的。在一些实施方案中,这种情形中特定细胞因子的表达也可以是所需的,其可以使应答发生偏向(bias),例如偏向自身免疫应答不太强的人。在一个实施方案中,在自身免疫疾病中,高水平的表达与IL-4表达同时发生是所需的,以例如耐受对给定抗原的免疫应答。在另一个实施方案中,特定自身免疫肽或蛋白质的高水平表达可以与抗体的表达同时发生,阻断二级信号传递至应答的T细胞,从而耐受应答的T细胞。这些是其中多产物表达是所希望的情形的例子,其中调节表达水平和/或表达时间的能力具有特殊应用。应理解使用本发明的文库或者通过本发明的方法确定的被调节的表达的任何可能的应用,被认为是本发明的一个实施方案。在另一个实施方案中,所述治疗性蛋白质包括转运蛋白,例如离子转运蛋白如CFTR,或者葡萄糖转运蛋白,或者由于其缺陷或者不适当表达而导致多种疾病的其它转运蛋白。在另一个实施方案中,所述治疗性蛋白质包括肿瘤抑制剂,或者促凋亡化合物,其改变癌症相关事件的进展。在另一个实施方案中,本发明的治疗性化合物可包含免疫调节蛋白质。在一个实施方案中,所述免疫调节蛋白质包括细胞因子、趋化因子、补体或成分,如白细胞介素l一15,干扰素a、P、或y、肿瘤坏死因子、粒细胞-巨噬细胞集落刺激因子(GM-CSF)、巨噬细胞集落刺激因子(M-CSF)、粒细胞集落刺激因子(G-CSF)、趋化因子如中性粒细胞激活蛋白(NAP)、巨噬细胞趋化剂及激活因子(MCAF)、RANTES、巨噬细胞炎症肽MIP-la和MIP-lb,或者补体成分。在另一个实施方案中,本发明的治疗性化合物可包括生长因子或者组织促进因子。在一个实施方案中,所述治疗性化合物是骨形态发生蛋白,或者OP-KOP-2、BMP-5、BMP-6、BMP-2、BMP-3、BMP-4、BMP-9、DPP、Vg-l、60A或者Vgr-l。在另一个实施方案中,所述治疗性化合物促进祌经再生或者修复,可包括NGF或者其它生长因子。在另一个实施方案中,所述治疗分子可以是天然或者非天然的胰岛素、淀粉酶、蛋白酶、脂肪酶、激酶、磷酸酶、糖基转移酶、胰蛋白酶原、糜蛋白酶原、羧肽酶、激素、核糖核酸酶、脱氧核糖核酸酶、三酰甘油脂肪酶、磷脂酶A2、弹性蛋白酶、淀粉酶,、凝血因子、UDP葡糖醛酸基转移酶、鸟氨酸氨甲酰基转移酶、细胞色素p450酶、腺苷脱氨酶、血清胸腺因子、胸腺体液因子、胸腺生成素(thymopoietin)、生长激素、生长调节素、共刺激因子、抗体、集落刺激因子、红细胞生成素、表皮生长因子、肝红细胞生成因子(hepatopoietin)、肝细胞生长因子、白细胞介素、干扰素、负生长因子(negativegrowthfactors)、成纤维细胞生长因子、a家族转化生长因子、卩家族转化生长因子、胃泌素、分泌素、縮胆囊素、生长激素抑制素、5-羟色胺、P物质、转录因子,或者这些物质的组合。在另一个实施方案中,本发明提供了包含本发明表达载体文库的多个细胞。在一个实施方案中,每个细胞均包含所述文库的一个载体,其被稳定整合进细胞的基因组中。在一个实施方案中,所述细胞不内源表达感兴趣的基因或者已经被改造为不内源表达感兴趣的基因。在另一个实施方案中,所述基因是报道基因。在一个实施方案中,所述报道基因编码荧光蛋白。在一个实施方案中,所述荧光蛋白是yECitrine或者黄色荧光蛋白。在一个实施方案中,所述荧光蛋白是水母绿色荧光蛋白或者其突变体或变体。在另一个实施方案中,报道基因赋予药物抗性。在一个实施方案中,报道基因赋予抗生素抗性,例如氨苄青霉素、卡那霉素、四环素或者其它抗生素抗性,这将为本领域技术人员所获知。在另一个实施方案中,抗生素抗性基因可包括赋予新霉素(neo)、杀稻瘟菌素(blasticidin)、壮观霉素、红霉素、phleomycin、Tn917、庆大霉素和博来霉素抗性的那些基因。新霉素抗性基因的一个例子是编码新霉素磷酸转移酶11的转座子Tn5的新霉素抗性基因,其赋予多种抗生素抗性,包括G418和卡那霉素抗性。在另一个实施方案中,所述报道基因是氯霉素乙酰转移酶基因(cat),赋予氯霉素抗性。在一个实施方案中,突变体启动子的性能通过将报道基因的mRNA、蛋白质或者其组合的表达水平与包含野生型启动子的报道基因的mRNA、蛋白质或其组合的表达水平进行对比而评估。在另一个实施方案中,将在野生型和突变体启动子控制下的报道基因表达水平与在组成型启动子控制下的报道基因表达水平进行对比。这种对比在图2中例证。在另一个实施方案中,所用的选择系统可包括分别用于tk-、hgprt-或者aprt-细胞中的单纯疱疹病毒胸苷激酶(Wigleretal.,Cell,11:223(1977))、次黄嘌呤-鸟嘌呤磷酸核糖转移酶(Szybalskaetal.,Proc.Natl.Acad.Sci.USA,48:202(1992))及腺嘌呤磷酸核糖转移酶(Lowyetal.,Cell,22:817(1980))。在另一个实施方案中,可以通过包括如下基因而利用抗代谢物抗性dhfr,赋予氨甲蝶呤抗性(Wigleretal.,Natl.Acad.Sci.USA,77:357(1980);O'hareetal"Proc.Natl.Acad.Sci.USA,78:1527(1981));gpt,赋予霉酚酸抗性(Mulliganetal"Pro"Natl,Acad.Sci.USA,78:2072(1981));neo,赋予氨基糖苷G418抗性(ClinicalPharmacy,12:488-505;WUetal"Biotherapy,3:87-95(1991);丁ostoshev,Ann.Rev.Pharmacol.Toxicol"32:573-596(1993);Mulligan,Science,260:926-932(1993);及Morganetal.,Arm.Rev.Biochem.,62:191-217(1993);Tibtech11(5):155-215(May1993));或者hygro,赋予潮霉素抗性(Santerreetal.,Gene,30:147(1984))。在另一个实施方案中,所述载体可包含两或多个感兴趣的基因。本发明的另一方面提供了数据库,其包含计算机可读形式的本发明文库的核酸片段的核苷酸序列。这些序列可用于本发明一些方法的实际设计中,以优化调节蛋白质产生。在一个实施方案中,可调节的启动子中的突变导致可调节的启动子的调节作用改变。在另一个实施方案中,可调节的启动子中的突变导致所述可调节的启动子下游的基因表达得以最佳调节,在一个实施方案中,所述调节可以是在诱导野生型启动子中表达的条件下增加基因表达,及在不诱导从野生型启动子中表达的条件下基因表达无变化。在另一个实施方案中,由于启动子突变导致的基因表达的改变可包括氧敏感性、温度、pH、营养素需求、药物敏感性、化合物敏感性等参数的改变,其通过启动子诱导基因表达。在一个实施方案中,启动子突变可增加基因表达所需的上述参数的量;而在另一个实施方案中,可降低所述的量。在另一个实施方案中,表达的最佳调节可包括通过启动子诱导基因表达的组织特性或发育特性中的改变。在另一个实施方案中,表达的最佳调节可包括基因表达的时间或空间依赖性启动子调节中的改变。在一个实施方案中,启动子突变可增加蛋白质在优选条件下的表达。根据本发明的这一方面及在一个实施方案中,可调节的启动子的突变导致基因在微需氧条件下高水平表达。在另一个实施方案中,突变导致基因在厌氧条件下高水平表达。在一个实施方案中,微需氧条件是其中存在低水平氧的条件。在另一个实施方案中,微需氧条件通过防止氧进入培养基中而实现,而存在的氧在保温期间被细胞消耗。在一个实施方案中,厌氧条件是其中没有氧的条件。在另一个实施方案中,厌氧条件通过用氮气鼓泡培养基而实现。这两种生长条件在图2和4中例证。在一个实施方案中,每个启动子中的突变导致不同强度的启动子,在一个实施方案中强度可以变化io—iooo倍。在一个实施方案中,优化调节感兴趣的化合物的产生的方法可利用构建体,其中感兴趣的基因在获得的最高水平表达;或者在另一个实施方案中,可以使用具有低于最大产量的构建体,其产生最佳表达;在另一个实施方案中,参与产生的其它基因的表达被调节。这种调节可包括过表达或者低表达,或者在另一个实施方案中是抑制表达。在一个实施方案中,本发明提供了一种优化基因表达的方法,其中所述基因在可调节的启动子的控制下,所述方法包括a)将多个细胞与表达载体文库接触,每个载体均包含至少一个感兴趣的基因和与其可操纵地连接的可调节的启动子,其中每个启动子均包含一种核酸,该核酸的序列相对于所述文库中的另一启动子核酸的序列而言被随机突变,并且由此所述感兴趣的基因在调节基因表达的条件下的表达水平的相对改变是所述启动子序列中的突变所致;b)检测在所述调节基因表达的条件下培养的(a)中的细胞的基因表达水平;C)从所述多个细胞中鉴别在所述条件下表达水平被优化的细胞。在另一个实施方案中,本发明提供了一种调节基因表达的方法,所述方法包括a)将多个细胞与表达载体文库接触,每个载体均包含至少一个感兴趣的基因和与其可操纵地连接的可调节的启动子,i.其中每个启动子均包含一种核酸,该核酸的序列相对于所述文库中的另一启动子核酸的序列而言而被随机突变,ii.在可调节的条件下所述感兴趣的基因的表达水平、所述感兴趣的基因的表达条件或者这些方面的组合中的改变作为所述突变的结果而出现;b)检测在a)中获得的所述多个细胞在野生型基因亚最佳表达的条件下的基因表达水平;c)从所述多个细胞中鉴别这样的细胞,在所述细胞中在野生型基因亚最佳表达的条件下从所述载体中获得更高表达水平;d)在所述条件下培养在c)中鉴别的细胞。在一个实施方案中,所述方法可利用本发明的载体,包括如本文所述的任何实施方案或者其任意组合,所述载体在其它实施方案中包含可将所述启动子和感兴趣的基因稳定整合进细胞的基因组中的序列,并确定细胞中优化调节的产生。在另一个实施方案中,所述文库中的每个载体均提供了一致的感兴趣基因的表达水平,在另一个实施方案中,通过至少两种不同方法核实所述的表达水平。在一个实施方案中,本发明的方法使用荧光分光光度计检测蛋白质表达水平。在另一个实施方案中,所述方法使用定量RT-PCR检测报道基因的mRNA表达水平。在另一个实施方案中,所述方法在单细胞水平核实表达水平,在另一个实施方案中,可通过荧光激活细胞分选分析、荧光显微镜检测或者组合这些方法进行检测。在另一个实施方案中,检测表达中的相关改变是使用定量聚合酶链反应进行。在另一个实施方案中,检测在至少一种感兴趣的基因编码酶的情况下表达中的相关改变通过确定酶活性而进行。所述方法的实施方案例如在图2中提供,其中使用荧光激活细胞分选分析测量报道基因表达,并使用定量RT-PCR测量报道基因转录水平。在一个实施方案中,增加的基因表达可以与在野生型启动子控制下的表达对比而评估,在另一个实施方案中,可以与在组成型启动子控制下的表达对比而评估。在一个实施方案中,包含突变的启动子的细胞当大量生长吋可具有增加的感兴趣基因的表达。图4例证了这一实施方案。与图2例证的在微需氧条件中生长的野生型相比蛋白质表达水平增加的A4iW启动子突变体,与在微需氧和厌氧条件下大量生长的野生型相比蛋白质表达水平也增加。在另一个实施方案中,评估优化调节的感兴趣的化合物的产生,其中所述化合物的产生是一个感兴趣的基因或者两或多个感兴趣的基因的表达被调节所致。在一个实施方案中,根据本发明的这一方面,所述方法可以与确定感兴趣的基因的优化的基因表达相似的方式进行。在一个实施方案中,当评估化合物的产生的优化调节时,本发明的方法包括具有编码感兴趣的蛋白质的两或多个基因的载体,包括编码蛋白质的相关基因。在一个实施方案中,所述两或多个基因编码参与代谢途径的蛋白质,或者如上所述,所述两或多个基因对特定途径起协同作用从而相关。在一个实施方案中,这种基因可以是过表达的。在另一个实施方案中,本发明提供了通过本发明的方法鉴别的具有感兴趣基因的希望的表达水平的细胞。在另一个实施方案中,根据本发明方法的细胞不内源表达感兴趣的基因或者已经改造为不内源表达感兴趣的基因。在另一个实施方案中,所述载体包含可以将所述启动子和感兴趣的基因稳定整合进细胞基因组中的序列。在另一个实施方案中,所述方法包括鉴别细胞内的所述启动子。根据本发明的这一方面及在一个实施方案中,所述启动子通过序列分析鉴别。在另一个实施方案中,本发明提供了一种优化调节蛋白质输送至对象的方法,所述方法包括给予对象一种包含本发明鉴别的启动子的载体。在另一个实施方案中,本发明提供了一种优化调节蛋白质输送至对象的方法,所述方法包括给予所述对象通过本发明的方法鉴别的具有优化的蛋白质调节的细胞。在一个实施方案中,均质表达的确定通过使用量化表达的两种单独的方法实现。在一个实施方案中,本发明的文库和方法组成了功能性基因组和代谢改造的完整平台。在另一个实施方案中,本发明提供了一种优化调节蛋白质输送至对象的方法,所述方法包括给予对象包含通过本发明的方法鉴别的启动子的载体。如本文所述及在一个实施方案中,本发明提供了一种使用本发明的文库确定化合物产生的优化调节的方法。一旦确定了这种优化调节的产生,则可给予对象赋予优化调节产生的构建体。在一个实施方案中,这种产生的优化调节可以在一个细胞或者在多个细胞中实现,在另一个实施方案中,所述细胞可以给予对象。在一个实施方案中,所述构建体可以给予对象。在一个实施方案中,递送给对象所述细胞或构建体可以是细胞或者基因治疗的手段,如本领域技术人员所已知。在一个实施方案中,本发明的具有优化调节的表达的细胞或者与用于优化调节表达的载体接触的细胞不内源表达感兴趣的基因或者已经被改造为不内源表达感兴趣的基因。在一个实施方案中,这种细胞可以被改造为表达或者过表达第二种感兴趣的基因,或者在另一个实施方案中表达或者过表达感兴趣的第一种基因的变体或突变体,或者在另一个实施方案中可以在本发明鉴别的启动子的控制下表达感兴趣的基因,提供感兴趣的基因的希望的表达水平。在另一个实施方案中,这种细胞可以是原核细胞或者真核细胞,且可以在培养中扩增。在一个实施方案中,这种细胞可以离体扩增,然后再植入宿主中,其中所述细胞在植入之前在培养中被修饰。在一个实施方案中,所述细胞可以是干细胞,或者在另一个实施方案中是祖细胞,或者在另一个实施方案中是分化的细胞。在一个实施方案中,能植入对象中的细胞可以进一步改造为包含促进所述细胞转移至希望位置的蛋白质。这种蛋白质由本领域技术人员所识别,且可包含能特异性输送至感兴趣位置的特定粘附分子、整联蛋白等。在另一个实施方案中,特异性输送至一个位置可以通过输送手段实现,例如定向注射至感兴趣的位置,或者例如通过特定配制剂给予希望的位置,例如通过气雾剂形式输送至肺部、或者以栓剂形式输送至特定粘膜位置、或者以局部配制品形式给予皮肤等。在一个实施方案中,感兴趣的基因是报道基因,其在一个实施方案中是荧光或者发光蛋白。在一个实施方案中,本发明的方法进一步包括在鉴别的细胞中鉴别启动子。在一个实施方案中,本发明提供了通过本发明的一或多种方法鉴别的细胞,其在亚最佳诱导野生型基因表达的条件下优化调节感兴趣的蛋白质的表达。在一个实施方案中,本发明提供了一种在亚最佳诱导野生型基因表达的条件下优化调节感兴趣蛋白质产生的方法,所述方法包括使本发明的细胞在亚最佳诱导野生型基因表达的条件下生长。在一个实施方案中,所述细胞是真核细胞;在另一个实施方案中,所述细胞是原核细胞。在另一个实施方案中,本发明提供了一种在亚最佳诱导野生型基因表达的条件下优化调节蛋白质输送至对象的方法,所述方法包括给予所述对象本发明的细胞,所述细胞在亚最佳诱导野生型基因表达的条件下表达优化调节的所述蛋白质。在一个实施方案中,所述细胞是干细胞。应理解给予本发明的构建体或者细胞的输送手段和/或实现本发明的方法均被认为是本发明的一部分。下文举例但非限制性地提供了实施/执行本发明的材料、方法和实施例。实施例材料与实验方法微総雜棘絲/f力微将A4A7启动子(ZX4iW编码序列上游-551至-1的区域)通过使用酿酒酵母BY4741的基因组DNA作为模板并使用引物GTTAAAAATTGTTGAGCTCAATTC(SEQIDNO:12)和CGAGTTCTAGATACTTGGGGTATATATTTAGTATG(SEQIDNO:13)进行PCR扩增。所得长度为563bp的PCR产物用Sacl和Xbal切割,并克隆进Sacl/Xbal限制载体p416-TEF-yECitrine中,从而用ZX4A7启动子置换yECitrine上游的7EF/启动子。所得质粒称作p416陽DAN陽yECitrine。质粒p416-TEF-yECitrine通过克隆yECitrine的编码序列而获得,yECitrine是黄色荧光蛋白的一种酵母密码子优化形式(Sheff&Thorny皿f21,661-670(2004)),位于7E^V启动子下游)。将在本研究中用作报道基因蛋白的yECitrine编码序列通过PCR从得自EUROSCARF的质粒pKT140中扩增,使用引物CGAGTTCTAGAAAAATGTCTAAAGGTGAAGAATTATTC(SEQIDNO:14)和TAGCGATCGATTTATTTGTACAATTCATCCATACC(SEQIDNO:15)。将所得PCR产物用Clal禾口Xbal切割,并与Clal/Xbal限制的得自ATCC的载体p416-TEF(Mumbergetal.156,119-22(995))连接。本研究中使用的酿酒酵母株BY4741(MATa,his3Al,leu2A0,metl5A0,ura3A0)得自德国法兰克福EUROSCARF。将其在YPD培养基(IOg酵母提取物/L,20g的BactoPeptone/L和20g葡萄糖/L)中培养。对于酵母转化,使用Frozen-EZ酵母转化II(ZYMORESEARCH)。为了选择并生长具有URA3作为选择标记的质粒的转化体,使用酵母合成完全(YSC)培养基,其含有6.7gYeastNitrogenBase/L(Difco)、20g葡萄糖/L及适当的核苷酸与氨基酸的混合物(CSM-URA,Qbiogene),在此称作YSCUra-。培养基中补加了1.5%琼脂作为固体培养基。酵母细胞在30'C在200rpm摇动的Erlenmeyer培养瓶中常规培养。为了通过FACS分选单一细胞(Z)^W启动子突变)进入微滴定平板中,平板的每个孔中均含有补加了10mg/L麦角固醇、420mg/LTween80(Nelms,J.etal.,^;p/£"v/,'owM/cra6zo/58,2592-2598(1992))的200pLYSCUra-。实验室规模的微需氧条件通过将培养物倒入具有螺旋盖的培养瓶中直至顶部并在3(TC搅拌保温而实现。厌氧培养通过将培养物用高纯度(99.8%)氮气鼓泡2分钟而获得。用于微需氧或厌氧培养法的培养基也补加了10mg/L麦角固醇和420mg/LTween80。将用于常规转化方法的大肠杆菌DH5a(Invitrogen)在37'C在LB培养基及如果需要和100pg/mL氨苄青霉素中培养。细胞密度在6000nm通过分光光度法监测。所有PCR试剂和限制酶均购自NewEnglandBiolabs(IpswichMA)。其它所有化合物均购自Sigma-Aldrich(StLouisMO)。在存在208-氧代-2,-脱氧鸟苷(8-氧代-dGTP)和6-(2-脱氧-(3-D-核糖呋喃糖基)-3,4-二氢-8H-嘧啶-[4,5-c][1,2]噁嗪-7-酮(dPTP)(Zaccolo.&GherardiJMo/A'o/285,775-783(1999))的条件下进行核苷酸类似物诱变。使用质粒p416-DAN-yECitrine作为模板并使用引物ACT(SEQIDNo:16)和ACGCCAAGCGCGCAATTAACCCTCACTAAAGGGAACAAAAGCTGGAGC(SEQIDNo:17),进行10、20和30次扩增循环。PCR产物使用GeneCleanSpin试剂盒(Qbiogene,MorganIrvineCA)纯化。通过重组克隆(Raymondetal..6/。ec/zm々腦26,134-138,140-131(1999))将诱变的PCR产物的混合物与已经用Sacl/Xbai切割的p416-TEF-yECitrine—起转化进酵母中。微繼术、蔬微册量鄉鄉分透术使用从在摇瓶(20mL培养基于250mLErlenmeyer培养瓶中)中生长期间的对数生长阶段收获的细胞进行比荧光测量术。yECitrine的荧光在于荧光试管中稀释的培养物(OD600为0.1—0.3)中测量,使用荧光分光计(HITACHIF-2500),激发波长为502nm,发射波长为532nm。比荧光是指荧光水平与在相同试管中测量的OD600的比率。对于流式细胞计量术和FACS,将指数生长阶段的细胞(OD1.0-1.5)在600g离心2分钟,再悬浮于无菌蒸馏水中并置于冰上直至进行测量。流式细胞计量术在Becton-DickinsonFACScan器械上使用CellQuest软件进行。使用BectonDickinsonFACSAria高速细胞分选仪及Diva软件将单个细胞分选进微滴定平板中。由于成熟的yECitrine形成需要氧,因此将取自微需氧或者厌氧培养的所有样品在摇瓶中在3(TC保温45分钟,之后测量荧光。m4定量使用RiboPureTM-酵母试剂盒(AMBION)包括DNAse处理提取总酵母RNA。RNA浓度通过在260nm的吸光度进行量化。yECitrinemRNA的量化使用iSciptOne-StepRT-PCR试剂盒及SYBRGreen和iCycler热循环仪(Bio-Rad)进行。每个RT-PCR反应使用100ng总酵母RNA。在RT-PCR中使用引物ATGGCTGACAAACAAAAGAATG(SEQIDNo:18)禾口CAGATTGATAGGATAAGTAATG(SEQIDNo:19)。使用iCycler软件(Bio-RadLaboratories,HerculesCA)对数据进行分析。发摩用于发酵实验中的合成培养基含有100g/L蔗糖、24g/L谷氨酸钠、10g/LNZ胺、10g/L硫酸铵、6.4g/L磷酸二氢铵、3g/L氯化钾、1.5g/L硫酸镁、0.2g/L氯化钙、0.2g/L肌醇、lg/L亮氨酸、1g/L组氨酸、1g/L甲硫氨酸、8mg/LD-泛酸、8mg/L吡哆醇、8mg/L硫胺、8mg/L烟酸、46吗/L生物素、0.03g/L硫酸锌、0.03g/L硫酸锰、5mg/L氧化钠钼(sodiummolybdenumoxide)、8mg/L硫酸铜、12.5mg/L硫酸铁。发酵实验在3CTC在32LBIOSTAT-E发酵仪(Braun,Germany)中进行,工作体积为2L。通过加入4MH2S04或者4MKOH使培养物pH值保持在pH5.0。以600rpm搅拌培养物,并以1wm喷射空气直至根据微需氧条件要求切断通气,或者代之以喷射(lwm)氮气5分钟以获得厌氧条件。通过加入聚乙二醇2000(60%w/v)以防止泡沬产生。利用能经受压热器作用的氧电极(Ingold,Switzerland)监测溶解氧。利用r-Biopharm试剂盒(Darmstadt,Germany)进行蔗糖分析。使用如下引物对启动子进行测序ATTGGGACAACACCAGTGAATAATTCTTCACCTTTAGACATTTTTCT(SEQIDNo:16)和ACGAGC(SEQIDNo:17)。实施例1:1X4A7启动子的突变使用易错PCR技术(Zaccolo&Gherardi/M>/B/o/285,775-783(1999))突变启动子起点立即上游的Z^47W启动子的551bp区域(图1A)。在进行PCR之后,估计平均突变比率为每551个核苷酸有11.2个突变。将突变体启动子文库克隆在酿酒酵母中表达经优化的yECitrine荧光报道基因蛋白的上游(Sheff&Thorn21,661-670(2004))。使用重组克隆方法获得酵母株BY4741的大约12,000个转化体。实施例2:在iX4A7和突变体文库中荧光报道基因蛋白的产生在不同的氧可利用度条件下生长的突变体文库与对照菌株(未突变的D^V/启动子)的荧光直方图示于图1B。使用摇瓶培养提供需氧条件,极端厌氧生活通过用纯氮气鼓泡培养物而获得。为了获得微需氧条件,将培养物生长于密闭不透气的培养瓶中。由于剩余的溶解氧在细胞生长期间被消耗,因此这些条件急剧降低在细胞生长期间氧的可利用度,但是未完全耗尽。未突变的A4iW启动子的完全诱导仅在极端厌氧生活下获得。在极端厌氧生活在突变体文库的荧光直方图(图1B)示出其中大约20%的突变体在一定程度上被诱导,表示基本的DAW特征在文库成员中的广泛保守性。微需氧条件下培养的细胞的荧光直方图看起来与未诱导的需氧条件培养的细胞相似,但是有两个分布统计学不同(f检验,983d.o.f.,/〈10'9),表明甚至在微需氧条件下的部分诱导。实施例3:荧光相关的细胞分选对所述启动子突变体文库进行多次荧光相关的细胞分选法(FACS)。第一次分选,设计为除去不再被氧所抑制的所有启动子突先生长,通过FACS使用图1B示出的截断值分选细胞以消除示出高荧光的突变体(即在需氧条件下启动子激活)。以此方式分离的亚文库含有原始文库中87%的克隆。第二次分选,对亚文库的细胞进行微需氧条件培养4小时。尽管事实是所述亚文库中绝大部分克隆与野生型A4M启动子相比在极端厌氧生活下荧光较低,我们仍筛选了处于荧光分布最高端的突变体,如图1B所示。这种严格的截断值消除了99.98%的所述文库成员。实施例4:选择的克隆在单克隆培养中的鉴定从剩余的0.02%文库中分离10个克隆,并在单克隆培养中鉴定。在再转化之前,10个克隆中有9个克隆与野生型ZX4A^启动子相比示出荧光诱导提高1.4至3.5倍。在质粒的再转化后,在微需氧条件下IO个克隆中有6个克隆示出与野生型D」iW启动子相比荧光提高1.8至2.9倍(数据未示出)。剩余的4个克隆示出与野生型启动子统计学相似的诱导水平(数据未示出)。实施例5:选择的克隆的鉴定一诱导动力学我们通过荧光测量方法和定量RT-PCR测量了两个突变克隆的诱导动力学(图2)。在从需氧条件过渡到微需氧培养条件之后,在5个小时中,yECitrinemRNA转录物和yECitrine蛋白质的水平(通过荧光测量)均增加。两个突变体中的转录水平示出在3小时后的显著增加,及在5小时后达到饱和,为未诱导水平的至少25倍(突变体1)至38倍(突变体2)。然而,很可能实际的增加倍数也许更高,因为我们的估计未诱导的mRNA浓度接近RT-PCR方案的基础噪音水平。为了更好地对比,我们将所有数据均根据用组成型参考启动子(r五f7启动子(Huet,J.etal.£mk/4,3539-3547(1985))获得的水平归一化。在5小时后突变体启动子的诱导相应于由r£^7启动子驱动的转录水平的大约30-40%(图2B)。另一方面,野生型ZX4A^培养物中yECitrinemRNA转录水平直至诱导后4小时也不增加,在5小时后仅为突变菌株水平的10%。蛋白质水平与mRNA水平十分接近,在诱导5小时后两种突变体中荧光诱导为3.8-和4.5-倍,相应于7Ef7启动子驱动的表达水平的大约15%(图2A)。在野生型样品中观测到的mRNA略微增加仅仅是在蛋白质水平(增加1.9倍至5%T五f7启动子强度)。荧光吋间谱相对于mRNA吋间谱的延迟很可能是由于yECitrine的氧依赖性成熟所致。实施例6:选择的克隆的鉴定一序列分析对十个分离的突变体进行序列分析(表l)揭示了在启动子的已知转录因子结合位点中的一些突变(图3)。然而,在已知的转录因子结合位点外及TATA盒外也有一些突变(图3)。在已知的转录因子结合位点中无明显的突变浓度,表示其它转录因子参与从这一启动子的氧依赖性基因表达。表l:野生型DAN1启动子及使用易错PCR产生的十个分离的突变体的序列<table>tableseeoriginaldocumentpage58</column></row><table><table>tableseeoriginaldocumentpage59</column></row><table><table>tableseeoriginaldocumentpage60</column></row><table><table>tableseeoriginaldocumentpage61</column></row><table>序列中高亮处表示与野生型序列相比的突变处。实施例7:选择的克隆的鉴定一分批酵母发酵使用两种不同的氧耗竭条件在分批的2L酵母发酵中检测分离的克隆的性能(图4)。在一种氧耗竭条件中,将浊度为A6QQ=2的培养物用氮气鼓泡,获得极端厌氧生活。在第二种氧耗竭条件中,对较高密度的分批培养物(初始A6QQ=8)进行微需氧条件培养(通过切断通气而获得)。具有突变的启动子与具有野生型A4iW启动子的细胞在测试的两种条件下相比均产生较高水平且更迅速的报道基因表达。在用氮气鼓泡或者切断供氧之后,溶解氧浓度立即降低至不可检测的水平(数据未示出)。低密度的微需氧发酵不导致可检测的诱导作用(数据未示出)。在低密度发酵中,溶解氧耗竭所需的时间明显较长,提示这些培养物中的溶解氧浓度在8个小时结束时仍然太高以致于不能实现诱导。上述实施例提供了在体内特定条件下优化调节启动子对其调节物的应答以控制基因表达的大体框架。尽管被调节的基因表达的生物学是复杂的,通过与多个转录因子相互作用及血红素生物合成和降解的代谢和调节途径的复杂网络发生,但在启动子水平的序列改变可用于以用户特定的方式改造基因调节性质。使用酿酒酵母的氧调节的Z147W启动子,证实了启动子改造组合合适的选择策略可以用于优化启动子的调节性质。优化启动子对其调节物的应答的策略可普遍适用于许多其它启动子和调节物,并可延伸适用于其它生物体。因此,本发明提供了改良现有的启动子及产生新的启动子的一种有价值的手段。可能的应用包括需要特定的细胞、组织和药物依赖性启动子的工业化过程和生物医学研究。权利要求1.一种分离的核酸,其包含相应于或者同源于SEQIDNo1、2、3、4、5、6、7、8、9或10的突变的DAN1启动子。2.—种分离的核酸,其包含相应于或者同源于SEQIDNo:〗、2、3、4、5或6的突变的ZX47W启动子。3.—种分离的核酸,其包含相应于或者同源于SEQIDNo:]或2的突变的Z^iW启动子。4.一种载体,其包含权利要求1的分离的核酸。5.—种包含突变的ZX47W启动子的分离的核酸,其中所述启动子包含在SEQIDNo:11的一或多个如下位置的至少一个核酸中的突变a)1-56b)66-139c)148-232d)245-283e)290-293f)301-302g)310h)322-326i)334-347j)357-371k)380-450或1)458-551。6.权利要求5的核酸,其中所述突变位于如下位置或者这些位置的组合4、7、15、18、19、21、22、26、28、36、40、53、56、60、63、66、74、75、78、86、99、122、132、135、136、149、153、162、164、165、171、172、176、187、196、198、201、205、207、211、216、226、228、233、234、237、241、260、269、274、277、280、281、285、296、299、303、307、308、310、313、322、327、331、332、337、338、343、344、346、366、368、373、375、376、381、384、386、390、391、392、396、397、402、404、422、427、428、429、432、434、439、445、467、469、470、477、480、490、492、508、51、514、518、528。7.—种包含权利要求5的分离的核酸的载体。8.—种包含突变的ZX^V7启动子的分离的核酸,其中所述突变的启动子具有包含如下置换或者这些置换的组合的序列a)在SEQIDNO:11的序列的核苷酸位置4、15、19、36、53、56、60、66、74、75、78、86、99、132、136、176、201、205、207、216、226、228、269、277、281、285、299、303、310、327、331、332、375、376、390、428、434、467、477、480、508或511,用C置换T;b)在SEQIDNO:11的序列的核苷酸位置7、18、26、40、122、135、149、153、162、164、165、171、172、187、196、211、233、234、237、241、260、274、280、308、313、322、337、343、344、346、366、368、381、384、386、396、397、402、404、422、427、429、432、445、470、490或492,用G置换A;c)在SEQIDNO:11的序列的核苷酸位置21,用A置换C;d)在SEQIDNO:11的序列的核苷酸位置237、338、469、514、518,用C置换A;e)在SEQIDNO:11的序列的核苷酸位置28、296、307、373、392或者528,用T置换C;f)在SEQIDNO:11的序列的核苷酸位置22、63、391或者439,用A置换G;g)在SEQIDNO:11的序列的核苷酸位置198,用G置换T。9.一种包含权利要求8的分离的核酸的载体。10.表达载体文库,其包含权利要求4、7、9的载体或者"组11.一种确定优化的基因表达的方法,其中所述基因在可调节的启动子的控制下,所述方法包括a)将多个细胞与表达载体文库接触,每个载体均包含至少一个感兴趣的基因和与其可操纵地连接的可调节的启动子,其中每个启动子均包含一种核酸,该核酸的序列相对于所述文库中的另一启动子核酸的序列而言被随机突变,由此所述感兴趣的基因在调节基因表达的条件下的表达水平中的相对变化是所述启动子序列中的突变所致;b)检测在所述调节基因表达的条件下培养的(a)中细胞的基因表达水平;c)从所述多个细胞中鉴别在所述条件下表达水平被优化的细胞。12.权利要求ll的方法,其中所述基因是报道基因。13.权利要求12的方法,其中所述报道基因编码荧光或发光蛋白。14.权利要求ll的方法,其中所述检测是利用荧光分光光度计进行。15.权利要求11的方法,其中所述检测是利用定量聚合酶链反应进行。16.权利要求ll的方法,其中所述细胞是真核细胞。17.权利要求16的方法,其中所述细胞是酵母细胞。18.权利要求16的方法,其中所述细胞是哺乳动物细胞。19.权利要求ll的方法,其中所述文库中每种载体提供所述感兴趣的基因的一致的表达水平。20.权利要求19的方法,其中所述一致的表达水平通过至少两种不同方法核实。21.权利要求20的方法,其中所述至少两种方法之一在单细胞水平核实表达。22.权利要求20的方法,其中所述方法包括荧光激活细胞分选分析、荧光显微镜检,或者这些方法的组合。23.权利要求ll的方法,其进一步包括与得自野生型细胞的表达水平进行对比的步骤。24.权利要求11的方法,其进一步包括鉴别所述细胞内的启动子。25.—种优化调节感兴趣的蛋白质输送至对象中的方法,所述方法包括给予所述对象包含在权利要求24中鉴别的启动子的载体,所述启动子与编码所述感兴趣的蛋白质的基因可操纵地连接。26.—种细胞,其具有通过权利要求11的方法鉴别的对感兴趣的可调节基因的表达的优化调节。27.权利要求26的细胞,其中所述细胞是真核细胞。28.权利要求27的细胞,其中所述细胞被给予对象。29.权利要求27的细胞,其中所述细胞是干细胞。30.—种优化调节蛋白质输送至对象的方法,所述方法包括给予所述对象权利要求26的细胞,其中所述细胞表达所述蛋白质的优化调节。31.—种调节基因表达的方法,所述方法包括a)将多个细胞与表达载体文库接触,每种载体均包含至少一个感兴趣的基因和与其可操纵地连接的可调节的启动子,i)其中每个启动子均包含一种核酸,该核酸的序列相对于所述文库的另一启动子核酸的序列而言被随机突变,ii)由此所述感兴趣的基因的基因表达水平、所述感兴趣的基因的表达条件或其组合中的变化在可调节条件下作为所述突变的结果而发生;b)检测在(i)中获得的所述多个细胞在野生型基因亚最佳表达的条件下的基因表达水平;c)从所述多个细胞中鉴别这样的细胞,所述细胞在野生型基因亚最佳表达的条件下从所述载体获得更高表达水平;及d)在所述条件下培养在(C)中鉴别的所述细胞。32.权利要求31的方法,其中所述基因是报道基因。33.权利要求32的方法,其中所述报道基因编码荧光或发光蛋白。34.权利要求31的方法,其中所述文库中的每个载体提供所述感兴趣基因的一致的表达水平。35.权利要求34的方法,其中所述一致的表达水平通过至少两种不同方法核实。36.权利要求35的方法,其中所述至少两种不同的方法之一是在单细胞水平核实表达。37.通过权利要求31的方法的步骤(d)获得的细胞。38.—种优化蛋白质产生的方法,所述方法包括培养权利要求37的所述细胞。39.权利要求38的方法,其中所述细胞是真核细胞。40.权利要求38的方法,其中所述细胞是原核细胞。41.权利要求38的方法,其中给予对象所述蛋白质或所述细胞。42.权利要求41的方法,其中所述细胞是干细胞。全文摘要本发明涉及表达载体及包含所述表达载体的细胞,其中每个载体均包含至少一种感兴趣的基因及与其可操纵地连接的启动子,其中每个启动子均包含一种核酸,其序列与野生型启动子相比被随机突变。本发明还描述了利用本发明的载体或细胞优化基因表达、蛋白质表达的调节或者优化基因或蛋白质输送的方法。文档编号C12P21/06GK101395282SQ200780007753公开日2009年3月25日申请日期2007年1月3日优先权日2006年1月3日发明者C·费希尔,E·耐沃伊特,G·斯特凡诺普洛斯,H·S·阿尔佩尔申请人:麻省理工学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1